Las empresas de diversos sectores, como salud, finanzas, manufactura y servicios legales, enfrentan crecientes desafíos en el procesamiento de grandes volúmenes de datos multimodales. Estos datos incluyen texto, imágenes, gráficos y formatos técnicos complejos. A medida que las organizaciones generan contenido multimodal a un ritmo acelerado, los métodos tradicionales no logran gestionar las complejidades de dominios especializados. La terminología técnica y los formatos específicos de la industria crean cuellos de botella operativos, lo que resulta en una extracción de datos ineficiente y una pérdida de información valiosa. Esto obstaculiza tanto la productividad como la toma de decisiones.
Un ejemplo claro se encuentra en la industria del petróleo y gas, donde las operaciones de perforación generan una gran cantidad de datos técnicos complejos. Documentos como informes de culminación de pozos, registros de perforación y diagramas de litología son cruciales para las decisiones operativas y la planificación estratégica. Para abordar estos desafíos, se ha desarrollado una solución avanzada utilizando Amazon Bedrock y las capacidades de inteligencia artificial de Infosys Topaz™, especialmente para este sector. Esta solución maneja datos multimodales, procesando texto, diagramas y datos numéricos, manteniendo el contexto y las relaciones entre diferentes elementos.
Construida sobre servicios de AWS, esta solución incluye Amazon Bedrock Nova Pro y Amazon OpenSearch Serverless, garantizando escalabilidad y costo-efectividad. Un sistema de indexación en tiempo real permite que los documentos nuevos se incorporen tan pronto como estén disponibles, asegurando que la información esté siempre actualizada sin comprometer el rendimiento.
La exploración inicial llevó a la creación de emparejamientos multicanal, facilitando un entendimiento detallado del contenido visual y textual. Se empleó una estrategia de chunking jerárquico que preserva la estructura del documento, lo que facilita el almacenamiento y recuperación de información específica sin perder el contexto.
El enfoque final combinó búsqueda híbrida y chunking optimizado, mejorando la precisión en la búsqueda de documentos y optimizando el tiempo de respuesta a menos de dos segundos, alcanzando un 92% de precisión en recuperación de información. Esto ha resultado en una alta satisfacción entre ingenieros de campo y geólogos.
La implementación de esta solución avanzada ha maximizado la eficiencia operativa en la industria del petróleo y gas, reduciendo costos de procesamiento manual hasta en un 50% y disminuyendo en un 60% el tiempo de búsqueda de información técnica. Este caso ilustra el potencial transformador de las tecnologías avanzadas y el aprendizaje automático en sectores con complejidades técnicas, abriendo horizontes para integrar datos de sensores en tiempo real, mejorar visualización y análisis predictivo.