Forjando IA Especializada sin Perder Inteligencia: Innovación de Nova Forge en Marcha

Elena Digital López

Los modelos de lenguaje grandes han mostrado ser sumamente útiles en tareas generales, sin embargo, enfrentan desafíos al abordar trabajos más especializados que demandan una comprensión profunda de datos internos y terminología específica de cada sector. Para adaptar estos modelos a contextos empresariales particulares, se emplea un proceso llamado fine-tuning supervisado (SFT). Este ajuste puede realizarse mediante dos enfoques: el ajuste de parámetros eficientes (PEFT), que permite una actualización más rápida y económica del modelo, y el SFT de rango completo, que actualiza todos los parámetros, proporcionando un conocimiento más profundo del dominio.

Sin embargo, el SFT de rango completo puede sufrir de un problema conocido como «olvido catastrófico», ya que al aprender patrones específicos, el modelo puede perder capacidades generales, como el razonamiento y el seguimiento de instrucciones. Esto plantea una disyuntiva entre la especialización y la inteligencia general, limitando el modelo para diversos usos empresariales.

Amazon ha propuesto una solución innovadora con Nova Forge. Este servicio permite a los usuarios desarrollar sus propios modelos utilizando Nova, combinando sus datos con los proporcionados por Amazon Nova, y asegurando sus modelos personalizados en AWS. Un grupo de expertos en ciencia aplicada de AWS China llevó a cabo una evaluación sobre Nova Forge empleando una tarea compleja de clasificación de la Voz del Cliente (VOC), comparándola con modelos de código abierto.

La prueba incluyó más de 16,000 muestras de comentarios de clientes y una jerarquía de etiquetas en cuatro niveles con 1,420 categorías. El enfoque de mezcla de datos de Nova Forge mostró dos ventajas clave: un aumento del 17% en el puntaje F1 en tareas específicas del dominio y la conservación de capacidades generales, manteniendo puntuaciones en Massive Multitask Language Understanding (MMLU) casi intactas y habilidades de seguimiento de instrucciones tras el ajuste.

Clasificar comentarios de clientes es un desafío diario en las grandes empresas de comercio electrónico. Para ser eficientes, estas compañías requieren un modelo de lenguaje que clasifique automáticamente los comentarios con precisión y que, al mismo tiempo, pueda generar respuestas, analizar datos y redactar documentación según diversas directrices específicas.

El método de evaluación empleado consideró un marco dual que mide el rendimiento en dos dimensiones. Usando un conjunto real de datos de VOC, se comprobó que los modelos ajustados mejoraban significativamente en el F1-score mientras preservaban sus capacidades generales, evidenciando la eficacia de la mezcla de datos de Nova para mitigar el «olvido catastrófico».

Estos resultados sugieren que al emplear una mezcla de datos durante el ajuste, se pueden desarrollar modelos que mantengan un alto rendimiento en tareas especializadas sin perder habilidades generales. En resumen, Nova Forge demuestra que es posible construir modelos de inteligencia artificial especializada sin sacrificar la inteligencia general, optimizando así el desarrollo y la implementación de soluciones de IA en entornos empresariales.

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

¡Apúntate a nuestro newsletter!


– patrocinadores –

Noticias destacadas

– patrocinadores –

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!

Scroll al inicio
×