En el contexto del evento re:Invent 2024, se ha anunciado una importante colaboración entre NVIDIA y Amazon, orientada a acelerar los trabajos de inferencia de inteligencia artificial mediante nuevas capacidades de computación avanzada y ofertas de software a través de Amazon SageMaker. Esta alianza refuerza la relación continua entre las dos compañías, que ahora centrará sus esfuerzos en optimizar el soporte para instancias de GPU especialmente diseñadas para la inferencia y su integración con tecnologías de NVIDIA.
Durante este evento, se presentaron tres desarrollos significativos que amplían las capacidades de inferencia de IA. El primero es la disponibilidad de los microservicios NVIDIA NIM en AWS Marketplace para despliegues de SageMaker Inference. Esto facilitará el acceso de los clientes a modelos de IA generativa avanzados. En segundo lugar, el modelo NVIDIA Nemotron-4, conocido por su capacidad multilingüe y sus habilidades en pruebas de razonamiento, ahora se encuentra disponible en Amazon SageMaker JumpStart, ampliando así el acceso a modelos preentrenados de calidad superior. Finalmente, las instancias P5e y G6e optimizadas para inferencia ahora son accesibles en Amazon SageMaker, equipadas con tarjetas gráficas NVIDIA H200 Tensor Core y L40S para manejar cargas de trabajo exigentes de IA.
Estos avances permiten a las organizaciones desplegar modelos de IA generativa de manera más rápida y escalar sus aplicaciones con mayor eficacia gracias a los microservicios de NVIDIA NIM. Además, la integración del modelo de lenguaje grande, NVIDIA Nemotron-4, en SageMaker JumpStart simplifica su aplicación para un amplio espectro de clientes.
En cuanto al hardware, las nuevas instancias P5e y G6e, dotadas de GPUs de NVIDIA, ofrecen mejoras significativas respecto a las generaciones anteriores, facilitando tanto el despliegue como el entrenamiento de modelos de aprendizaje automático más complejos.
Este anuncio representa un avance significativo en la accesibilidad y eficiencia para empresas que buscan aprovechar las capacidades avanzadas de inferencia de IA, permitiendo su implementación en proyectos de diversos sectores industriales. Las mejoras anunciadas impulsan la innovación y optimizan los procesos de toma de decisiones mediante una infraestructura flexible y optimizada para manejar complejas cargas de trabajo y una variedad de casos de uso a nivel empresarial.