Optimización de Metadatos de Video: La Estrategia de DPG Media Usando Amazon Bedrock y Amazon Transcribe con IA

Elena Digital López

DPG Media, un influyente grupo mediático en la región del Benelux, ha dado un importante salto hacia la modernización de su gestión de datos al integrar inteligencia artificial en sus operaciones. La empresa se enfrenta al desafío de manejar un extenso y en constante crecimiento catálogo de contenido audiovisual en su plataforma VTM GO, que ofrece más de 500 días de contenido ininterrumpido. Para abordar esta tarea, han decidido incorporar tecnologías avanzadas de Amazon, como Bedrock y Transcribe, en sus flujos de publicación de video, con el objetivo de optimizar la generación y gestión de metadatos.

El incremento de la biblioteca de videos de DPG Media ha puesto de manifiesto la necesidad de gestionar eficientemente los metadatos, que incluyen información sobre actores, géneros, resúmenes de episodios y el estado anímico de los programas. La exactitud en estos datos mejora tanto las descripciones en las guías de televisión como las recomendaciones de contenido y la experiencia de exploración para los consumidores.

El camino hacia la automatización presentó diversos retos, como la diversidad de idiomas, la variabilidad en el volumen de contenido y la frecuencia de lanzamientos, que complican la estandarización de metadatos. Otro desafío notable fue la consolidación confiable de datos a lo largo de diferentes temporadas de un show.

Para superar estos obstáculos, DPG Media ha adoptado un enfoque centrado en el procesamiento de audio, descartando el análisis de datos de video debido a su elevado costo y tiempo de procesamiento. Se diseñó un sistema de dos fases: primero, la generación de transcripciones de pistas de audio a través de modelos de reconocimiento de voz; y segundo, la extracción y producción de metadatos detallados mediante modelos de lenguaje extensivo (LLMs).

En la fase inicial del proyecto, DPG Media analizó diversas estrategias de transcripción, decantándose finalmente por Amazon Transcribe, una solución que ofrece transcripciones de audio precisas y soporta actualizaciones automáticas de modelos y funciones de diarización de locutores. Para la generación de metadatos, eligieron Amazon Bedrock con el modelo Anthropic Claude 3 Sonnet, debido a su eficacia en lengua holandesa y su capacidad de razonamiento.

La implementación de esta innovadora solución ha permitido a DPG Media ahorrar tiempo significativo en la generación de metadatos, optimizando múltiples aspectos desde la producción de subtítulos hasta la creación de resúmenes detallados de series completas. Aunque el sistema automatiza la generación de metadatos, se ha decidido conservar una validación humana para asegurar la calidad final antes de presentarlos a los clientes. Este enfoque no solo mejora la experiencia del usuario al ofrecer recomendaciones más precisas, sino que también reafirma el compromiso de DPG Media en la integración de las capacidades humanas con tecnología avanzada.

Esta iniciativa representa un avance hacia la modernización continua y la mejora de la experiencia del consumidor en una industria en constante cambio. DPG Media sigue explorando nuevas oportunidades para experimentar con modelos adicionales y mejorar sus sistemas a la par que la tecnología avanza, buscando alinear la oferta de contenido con los hábitos de consumo contemporáneos y las innovaciones tecnológicas.

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

¡Apúntate a nuestro newsletter!


– patrocinadores –

Noticias destacadas

– patrocinadores –

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!

Scroll al inicio