Las organizaciones enfrentan desafíos al transformar grabaciones de reuniones en documentos estructurados. Producir materiales a partir de estas grabaciones requiere un gran esfuerzo manual, lo que afecta la productividad y escalabilidad. Este problema es común en la gestión de múltiples grabaciones de presentaciones, conferencias y contenido educativo.
Para abordar esta problemática, se ha desarrollado una solución automatizada y sin servidor. Utilizando Amazon Bedrock Data Automation, es posible transformar grabaciones de seminarios web en minutas completas. Esta tecnología permite transcribir diálogos, detectar cambios de diapositivas y refinar las transcripciones mediante modelos avanzados de Amazon Bedrock, todo orquestado por funciones de AWS Lambda y AWS Step Functions.
Amazon Bedrock emplea inteligencia artificial generativa para convertir datos multimedia en formatos estructurados personalizables, como resúmenes de escenas en videos y la identificación de contenido explícito. También permite extraer segmentos de audio y diversos planos de videos.
El flujo de trabajo de esta solución se inicia al subir un video a Amazon Simple Storage Service (S3). Esto desencadena una notificación de evento a través de Amazon EventBridge, comenzando el procesamiento del video. Amazon Bedrock Data Automation inicia la transformación, identificando cambios y sincronizando contenido hablado con imágenes visuales. Posteriormente, se generan capturas de pantalla de las diapositivas y se refinan las transcripciones, corrigiendo errores y eliminando disfluencias.
Finalmente, se crean las minutas usando la biblioteca Python-PPTX, combinando transcripciones refinadas con las imágenes generadas. Los materiales resultantes se almacenan en Amazon S3, listos para su distribución. Esta solución no solo reduce el esfuerzo manual, sino que también facilita la escalabilidad en organizaciones de diferentes tamaños y sectores.