General
03/12/2024

Nuevas Capacidades de NVIDIA en Amazon SageMaker Aceleran Cargas de Trabajo de Inferencia de IA

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

En el contexto del evento re:Invent 2024, se ha anunciado una importante colaboración entre NVIDIA y Amazon, orientada a acelerar los trabajos de inferencia de inteligencia artificial mediante nuevas capacidades de computación avanzada y ofertas de software a través de Amazon SageMaker. Esta alianza refuerza la relación continua entre las dos compañías, que ahora centrará sus esfuerzos en optimizar el soporte para instancias de GPU especialmente diseñadas para la inferencia y su integración con tecnologías de NVIDIA.

Durante este evento, se presentaron tres desarrollos significativos que amplían las capacidades de inferencia de IA. El primero es la disponibilidad de los microservicios NVIDIA NIM en AWS Marketplace para despliegues de SageMaker Inference. Esto facilitará el acceso de los clientes a modelos de IA generativa avanzados. En segundo lugar, el modelo NVIDIA Nemotron-4, conocido por su capacidad multilingüe y sus habilidades en pruebas de razonamiento, ahora se encuentra disponible en Amazon SageMaker JumpStart, ampliando así el acceso a modelos preentrenados de calidad superior. Finalmente, las instancias P5e y G6e optimizadas para inferencia ahora son accesibles en Amazon SageMaker, equipadas con tarjetas gráficas NVIDIA H200 Tensor Core y L40S para manejar cargas de trabajo exigentes de IA.

Estos avances permiten a las organizaciones desplegar modelos de IA generativa de manera más rápida y escalar sus aplicaciones con mayor eficacia gracias a los microservicios de NVIDIA NIM. Además, la integración del modelo de lenguaje grande, NVIDIA Nemotron-4, en SageMaker JumpStart simplifica su aplicación para un amplio espectro de clientes.

En cuanto al hardware, las nuevas instancias P5e y G6e, dotadas de GPUs de NVIDIA, ofrecen mejoras significativas respecto a las generaciones anteriores, facilitando tanto el despliegue como el entrenamiento de modelos de aprendizaje automático más complejos.

Este anuncio representa un avance significativo en la accesibilidad y eficiencia para empresas que buscan aprovechar las capacidades avanzadas de inferencia de IA, permitiendo su implementación en proyectos de diversos sectores industriales. Las mejoras anunciadas impulsan la innovación y optimizan los procesos de toma de decisiones mediante una infraestructura flexible y optimizada para manejar complejas cargas de trabajo y una variedad de casos de uso a nivel empresarial.

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

¡Apúntate a nuestro newsletter!

– patrocinadores –

Noticias destacadas

Guía para Configurar el Despliegue de Modelos Cruzados en Cuentas Usando la Importación de Modelos Personalizados de Amazon Bedrock

– patrocinadores –

Nuevas Capacidades de NVIDIA en Amazon SageMaker Aceleran Cargas de Trabajo de Inferencia de IA

Suscríbete al boletín SysAdmin

¡Apúntate a nuestro newsletter!

Noticias destacadas

Guía para Configurar el Despliegue de Modelos Cruzados en Cuentas Usando la Importación de Modelos Personalizados de Amazon Bedrock

Optimización de Conversión en Marketplaces de Ecommerce: El Impacto del Contenido PXM de Pattern Impulsado por IA

Acelerando el Proceso de Revisión para Desarrolladores de Complementos de Microsoft Edge

GitHub eliminó más de 31.000 proyectos en 2024 por avisos de DMCA

Google lanza Gemini Code Assist gratuito para desarrolladores

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!

Noticias relacionadas

Guía para Configurar el Despliegue de Modelos Cruzados en Cuentas Usando la Importación de Modelos Personalizados de Amazon Bedrock

GNU C Library 2.41: nuevas funciones C23 y optimización para Intel, AMD y Arm

Optimización de Conversión en Marketplaces de Ecommerce: El Impacto del Contenido PXM de Pattern Impulsado por IA

Acelerando el Proceso de Revisión para Desarrolladores de Complementos de Microsoft Edge

GitHub eliminó más de 31.000 proyectos en 2024 por avisos de DMCA

Google lanza Gemini Code Assist gratuito para desarrolladores

La Tecnología BIM: Una Revolución en los Procesos de Licitación

Transformación De Residuos En Energía Con Innovación Profesional En España

Nuevas Capacidades de NVIDIA en Amazon SageMaker Aceleran Cargas de Trabajo de Inferencia de IA

Suscríbete al boletín SysAdmin

¡Apúntate a nuestro newsletter!

Noticias destacadas

¡SUSCRÍBETE AL BOLETÍNDE LOS SYSADMINS!

Noticias relacionadas

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!