En 2024, Japón marcó un hito en la innovación tecnológica al lanzar el programa Generative AI Accelerator Challenge (GENIAC), una iniciativa nacional diseñada para impulsar la inteligencia artificial generativa. Este esfuerzo, liderado por el Ministerio de Economía, Comercio e Industria, ofrece a las empresas herramientas esenciales como financiación, asesoramiento, y recursos computacionales avanzados. Amazon Web Services (AWS) fue el aliado estratégico seleccionado para la segunda fase del programa, proporcionando la estructura de nube necesaria y apoyo técnico a 12 organizaciones participantes.
La inversión en hardware fue sustancial, con más de 1,000 aceleradores disponibles para fomentar la innovación. Sin embargo, la experiencia demostró que el éxito no depende solo de la tecnología avanzada, sino también de un sistema confiable capaz de manejar los desafíos del entrenamiento distribuido.
Durante esta fase, 12 clientes lograron implementar 127 instancias de Amazon EC2 P5 y 24 instancias de Amazon EC2 Trn1 en un solo día. En los seis meses posteriores, se entrenaron modelos de gran escala, destacándose proyectos como Stockmark-2-100B-Instruct-beta y Llama 3.1 Shisa V2 405B.
Uno de los aprendizajes más significativos fue la necesidad de contar con equipos multidisciplinarios para desarrollar proyectos de aprendizaje automático a gran escala. AWS conformó un equipo virtual que integró a expertos de diversas áreas, facilitando el intercambio de información y soporte efectivo. La comunicación también fue clave, con canales en Slack para coordinar el programa y documentos de seguimiento detallados para clarificar los requisitos técnicos.
Para simplificar la implementación de proyectos, AWS creó arquitecturas de referencia, evitando que cada equipo tuviera que configurar clústers desde cero. Estas soluciones, como AWS ParallelCluster y SageMaker HyperPod, permitieron desplegar entornos sin fricciones.
El programa GENIAC evidenció que entrenar modelos fundamentales a gran escala es, en su esencia, un reto organizativo. Gracias a una estructura de soporte bien definida y un enfoque colaborativo, los participantes consiguieron ejecutar grandes cargas de trabajo en la nube con éxito. Al final de esta fase, se organizó un evento técnico en Tokio para preparar a desarrolladores para futuras etapas, reforzando el compromiso de AWS con la evolución de la inteligencia artificial generativa a nivel global.