Nico Finelli, miembro fundador de Vellum, ha ofrecido valiosas perspectivas sobre el estado actual de la inteligencia artificial en el ámbito de la producción. Con un enfoque en la construcción de agentes de IA que aporten verdadero valor, Finelli, quien ha trabajado con machine learning y modelos de lenguaje, actualmente asesora a empresas sobre cómo pasar de la experimentación a la implementación efectiva de estas tecnologías.
Una encuesta reciente realizada entre más de 1,200 desarrolladores de IA reveló que solo el 25% está utilizando sus iniciativas en producción. A pesar del revuelo en torno a la IA generativa, muchas organizaciones aún enfrentan grandes desafíos durante la fase de prueba. Entre los principales obstáculos se encuentra el fenómeno de las «alucinaciones» en los modelos de IA, problema que el 57% de los encuestados considera el mayor desafío.
Finelli destaca que la evaluación es crucial para el éxito de un sistema de IA. Muchos equipos, al enfrentar alucinaciones, dependen de pruebas manuales y la retroalimentación de usuarios, lo que indica una falta de procesos robustos para garantizar una adecuada implementación. La ausencia de tuberías de pruebas automatizadas complica la resolución de estos problemas, ya que las aplicaciones suelen ser muy específicas.
Las empresas que logran llevar su IA a producción mantienen un enfoque disciplinado desde el principio. Prefieren desarrollar casos de uso claros y fomentar el feedback constante entre desarrolladores y expertos, permitiendo iteraciones rápidas. Según Finelli, entre el 65-70% de los clientes de Vellum tienen IA en producción gracias a su capacidad de ajuste y evaluación continua.
En resumen, el éxito en la implementación de agentes de IA no solo reside en la tecnología misma, sino en la estructura y enfoque del proceso de desarrollo. Una evaluación efectiva es clave para convertir la IA de un simple concepto a una herramienta útil y duradera en el entorno empresarial.