El reciente desarrollo de un prototipo de traducción de voz en tiempo real está generando una verdadera revolución en el soporte al cliente multilingüe de empresas globales. Este avance tecnológico, fruto de la colaboración entre Amazon Web Services (AWS) y DXC Technology, introduce un modelo de traducción de voz a voz (V2V) que promete cambiar radicalmente la manera en que los centros de contacto manejan las interacciones con clientes que hablan distintos idiomas.
La iniciativa cobró vida en respuesta a un reto que enfrentaba DXC Technology en el tercer trimestre de 2024. Sus centros de contacto globales tenían la necesidad de atender a una clientela multilingüe sin incurrir en los altos costos que supone contratar agentes especializados en idiomas menos comunes. En ese contexto, y tras evaluar diversas alternativas que presentaban limitaciones en comunicación e infraestructura, ambas empresas decidieron organizar un hackathon. Este evento se concentró en establecer los requisitos críticos para conseguir una traducción en tiempo real, definir métricas de latencia y precisión, y trazar una estrategia de implementación progresiva.
El impacto de este prototipo en el ámbito de los negocios ha sido notable. Ha permitido maximizar el talento técnico, posibilitando la contratación y asignación de agentes de acuerdo a su expertise técnico. Además, ha eliminado barreras geográficas y lingüísticas tanto en la contratación como en la prestación de soporte. Con un modelo de traducción basado en el uso, se ha logrado reducir costos al eliminar las primas por manejo de múltiples idiomas y los gastos de formación especializada.
El sistema, que se sustenta en tecnologías avanzadas de reconocimiento de voz y traducción automática de AWS, utiliza Amazon Connect para facilitar la traducción en tiempo real de conversaciones entre agentes y clientes. La voz del cliente se convierte en texto mediante Amazon Transcribe, se traduce por Amazon Translate y se transforma nuevamente en audio gracias a Amazon Polly. Este proceso bidireccional asegura que tanto agente como cliente se comuniquen en su lengua nativa, manteniendo una continuidad en la conversación.
No obstante, los desarrolladores han enfrentado ciertos desafíos. Aunque el sistema ha sido optimizado para reducir al mínimo los tiempos de procesamiento de audio, la experiencia del usuario aún no es completamente equiparable a una charla en el mismo idioma. Esto se debe a los momentos de silencio que ocurren mientras se procesan las traducciones. Para mitigar esta limitación, se están investigando complementos de streaming de audio que podrían simular una interacción más natural y continua.
Conforme las empresas buscan perfeccionar su comunicación multilingüe en los centros de contacto, el prototipo V2V de Amazon Connect se presenta como una opción personalizable que puede servir de base para futuras innovaciones en la comunicación. Gracias a esta tecnología, las empresas no solo pueden romper las barreras del idioma, sino también mejorar su flexibilidad operativa y la experiencia del cliente en un mercado cada vez más globalizado.