El desarrollo de tecnología para chatbots habilitados para voz ha dado un paso más allá con la implementación de nuevas herramientas en Amazon Lex. Este servicio, parte integral del ecosistema de Amazon Web Services, ha introducido las puntuaciones de confianza de transcripción, una característica diseñada para mejorar significativamente la precisión en la captura de datos específicos durante las interacciones de voz con usuarios, tales como números de cuenta o códigos de confirmación.
Estas puntuaciones funcionan como indicadores del nivel de confianza que tiene Amazon Lex sobre la exactitud de la conversión de voz a texto, al evaluar cada valor de slot hablado. A diferencia de las puntuaciones dirigidas al reconocimiento de intención o entidad, las puntuaciones de confianza de transcripción se centran exclusivamente en verificar la conversión de audio a texto. Esto permite a los desarrolladores ajustar las interacciones según el nivel de confianza alcanzado, ya sea confirmando la información directamente, solicitando repeticiones del usuario o incluso redirigiendo la conversación hacia un agente humano en situaciones de baja confianza.
Entre las estrategias propuestas para maximizar la eficacia de estas puntuaciones se encuentra la confirmación progresiva, que recomienda cómo proceder según los niveles de confianza: aceptar inputs con puntuaciones superiores a 0.9, y considerar la necesidad de confirmaciones o repeticiones para puntuaciones más bajas. Además, se sugiere adaptar las re-preguntas en función de la confianza percibida y desarrollar una lógica de ramificación para amparar múltiples intentos de baja confianza.
Este avance promete no solo mejorar la precisión en la captura de información, sino también enriquecer la experiencia del usuario, facilitando interacciones más eficientes y fluidas. Con la integración de Amazon Lex y Amazon Connect, el sistema puede ajustar dinámicamente los procesos de validación en función de la confianza en la transcripción, mostrando ejemplos claros de cómo un agente virtual responde a diferentes niveles de confianza en las transcripciones, mejorando notablemente la experiencia del usuario.
Para implementar estas capacidades, los usuarios deben contar con una cuenta de AWS y los permisos necesarios para gestionar los recursos involucrados. La configuración del bot de Amazon Lex y el flujo de Amazon Connect se puede realizar a través de la Visual Conversation Builder, que ofrece una forma intuitiva de personalizar las conversaciones.
A pesar de sus múltiples ventajas, esta tecnología enfrenta ciertas limitaciones: actualmente, las puntuaciones de confianza de transcripción solo están disponibles para entradas de audio en inglés de 8 kHz y no se generan para audios provenientes de la ventana de prueba de Amazon Lex V2. No obstante, la implementación de esta característica es un paso importante hacia la mejora continua de la experiencia del cliente, permitiendo un diálogo más natural y preciso durante toda la interacción con el sistema.