La gestión de documentos en grandes volúmenes ha sido tradicionalmente un desafío para múltiples sectores, que requieren procesar información precisa derivada de textos extensos y a menudo complejos. A pesar de los progresos en automatización, la intervención humana sigue siendo vital para asegurar la calidad y precisión de los datos en situaciones específicas.
En marzo de 2025, Amazon Web Services (AWS) lanzó Amazon Bedrock Data Automation, un innovador recurso que facilita a los desarrolladores la extracción de información valiosa de contenido multimodal no estructurado, como documentos, imágenes, videos y audio. Esta herramienta busca optimizar los procesos de gestión documental mediante la automatización de tareas como la extracción, transformación y generación de insights, lo cual disminuye significativamente el tiempo dedicado a la preparación de datos y la gestión de modelos.
Amazon Bedrock Data Automation es capaz de realizar operaciones complejas con documentos, incluyendo segmentación, clasificación, extracción y validación de datos. Gracias a las puntuaciones de confianza incorporadas, se pueden explicar los resultados y mitigar posibles errores. No obstante, la intervención humana sigue siendo indispensable en ciertos escenarios. La integración con Amazon SageMaker AI proporciona una solución completa, donde bucles de revisión humana se aseguran de que la precisión se mantenga sin afectar la eficiencia.
Esta integración busca validar las predicciones de la inteligencia artificial en situaciones de baja confianza, gestionar excepciones, asegurar el cumplimiento normativo, y ofrecer retroalimentación continua para mejorar el rendimiento de los modelos con el tiempo.
La propuesta de Amazon se centra en la importancia de las puntuaciones de confianza, que ayudan a decidir cuándo es vital involucrar revisiones humanas. Estas puntuaciones indican el nivel de certeza de la automatización sobre la precisión de los datos extraídos, lo que permite a las empresas enfocarse en sus objetivos comerciales en lugar de en complejos mecanismos de puntuación.
Para implementar estas estrategias, AWS desarrolló una arquitectura sin servidores que permite procesar documentos de varias páginas con revisión humana, cubriendo todo el flujo de trabajo desde la carga inicial de documentos hasta la validación final de los datos extraídos.
Este proceso requiere que las organizaciones dispongan de diversos recursos de AWS, como Amazon S3, Amazon EventBridge y funciones de AWS Lambda, orquestando la interacción entre las diferentes herramientas y garantizando un flujo de trabajo eficaz.
El objetivo de AWS es ofrecer una solución flexible y personalizable según las necesidades específicas de cada negocio, fomentando así la optimización en la administración de documentos y el incremento de la precisión en la extracción de datos. Amazon Bedrock Data Automation junto con SageMaker AI representa un avance significativo en la forma de abordar el procesamiento de documentos no estructurados, desde la gestión de documentos hasta la inteligencia artificial.