La AWS AI League, organizada por Amazon Web Services (AWS), ha tomado un nuevo rumbo al adentrarse en la región de la Asociación de Naciones del Sureste Asiático (ASEAN). Este evento reunió a estudiantes de Singapur, Indonesia, Malasia, Tailandia, Vietnam y Filipinas, ofreciendo una plataforma para explorar el mundo de la inteligencia artificial generativa mediante un desafío basado en juegos centrados en la adaptación de modelos de lenguaje de gran tamaño (LLMs).
El campeonato se inauguró con una serie de tutoriales impartidos por el equipo de AWS y la comunidad Gen-C, enfocada en el aprendizaje de inteligencia artificial generativa. Los participantes tuvieron acceso a herramientas innovadoras como Amazon SageMaker JumpStart y PartyRock, que son fundamentales para la adaptación de modelos y la creación de datos sintéticos de manera accesible. Estas herramientas permitieron a los competidores gestionar el proceso de ajuste de los LLM en un entorno de nube y ofrecieron un espacio interactivo para personalizar el conjunto de datos necesario en la adaptación de un modelo Llama 3.2 3B Instruct.
El enfoque principal del reto era superar un modelo de referencia más grande a través de un cuestionario, lo que impulsó a los participantes a explorar tres áreas cruciales: modelos base, inteligencia artificial responsable e ingeniería de prompts. Tras una fase preliminar con ranking abierto de los modelos más eficientes, los mejores avanzaron a la Gran Final Regional en Singapur.
Blix D. Foryasen, quien se coronó campeón de la AWS AI League, compartió sus experiencias y desafíos durante la competencia. Destacó que el éxito no solo radicó en la precisión técnica, sino también en la colaboración y adaptabilidad ante los diferentes retos presentados. Aunque comenzó tarde en la competencia, Foryasen construyó un conjunto de datos robusto y ajustó los hiperparámetros de manera selectiva, tomando como referencia técnicas y estudios previos sobre adaptación de LLMs.
Uno de los momentos clave de su experiencia fue el uso de PartyRock para generar datos sintéticos, ajustando parámetros para asegurar diversidad y calidad. Subrayó la importancia de priorizar la calidad frente a la cantidad en los datos, recalibrando continuamente los hiperparámetros para evitar un rendimiento subóptimo. Además, Foryasen colaboró con otros participantes incorporando estrategias avanzadas de ajuste como LoRA, mejorando así su modelo según las exigencias de la competencia.
La Gran Final representó no solo la culminación del esfuerzo individual, sino también un espacio de intercambio de conocimientos y estrategias entre campeones nacionales, enfatizando la relevancia de la comunidad en el aprendizaje y la innovación tecnológica.