Mejora de la Eficiencia en el Entrenamiento de FM en Amazon SageMaker con Ajuste Fino de Spectrum

Elena Digital López

La optimización de aplicaciones de inteligencia artificial generativa ha dado un paso significativo con la introducción de un nuevo enfoque destinado a mejorar la eficiencia en el ajuste fino de modelos base. Este avance, conocido como Spectrum, se centra en identificar las capas más informativas dentro de un modelo, permitiendo así un entrenamiento más eficiente al ajustar solo una parte del mismo.

La técnica Spectrum se diferencia de otras, como Quantized LoRA (QLoRA), al permitir optimizar el uso de recursos y reducir tiempos de entrenamiento sin comprometer la calidad. En el contexto del entrenamiento en Amazon SageMaker AI, se ha mostrado que, aunque QLoRA es más eficiente en términos de recursos, Spectrum ofrece un rendimiento superior.

El método de ajuste fino con Spectrum implica evaluar las matrices de peso a través de las capas de un modelo base, calculando la Relación Señal/Ruido (SNR) capa por capa. En lugar de ajustar todas las capas por igual, Spectrum selecciona un subconjunto basado en su SNR, congelando el resto del modelo. Esto se realiza con las últimas GPU que permiten entrenamientos en FP16, BF16 o FP8.

Basado en la Teoría de Matrices Aleatorias y la distribución de Marchenko-Pastur, Spectrum puede distinguir eficazmente entre señal y ruido, enfocándose solo en el porcentaje más informativo de las capas. En un escenario práctico, el uso de Spectrum junto con trabajos de entrenamiento en Amazon SageMaker ha sido ejemplificado con el modelo Qwen3-8B.

Este método implica varios pasos clave: descargar el modelo deseado, realizar un análisis para determinar el SNR de cada capa y configurar un archivo que especifique las capas que deben ser ajustadas. Para iniciar el proceso es necesario contar con una cuenta de AWS y los permisos adecuados para ejecutar los recursos necesarios.

Los análisis realizados generarán archivos que detallan el SNR de las capas y las que deben permanecer activas durante el entrenamiento. Con estos datos, se puede configurar el modelo para maximizar el ajuste fino en las capas más críticas, reduciendo así los requisitos de recursos y tiempo.

En resumen, Spectrum ofrece una forma innovadora de mejorar el ajuste fino de modelos base en inteligencia artificial, optimizando la eficiencia y manteniendo un alto nivel de precisión. Este avance proporciona nuevas posibilidades para la optimización de modelos de IA, enfocando los esfuerzos donde más se requiere, y representando un paso adelante en la tecnología de entrenamiento de modelos.

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

¡Apúntate a nuestro newsletter!


– patrocinadores –

Noticias destacadas

– patrocinadores –

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!

Scroll al inicio
×