Implementación de Modelos de IA a Gran Escala con Amazon SageMaker y P6e-GB200 UltraServers

Elena Digital López

Amazon ha lanzado su innovador sistema SageMaker HyperPod, una herramienta diseñada para revolucionar el ámbito de la inteligencia artificial al permitir a las organizaciones explotar al máximo el potencial de las GPUs NVIDIA Blackwell en un único sistema. Este avance se propone liderar una nueva era de innovación, garantizando un rendimiento extraordinario con 360 petaflops en cálculos de punto flotante denso (FP8) y 1.4 exaflops en cálculos de punto flotante disperso (FP4).

Los recientemente introducidos P6e-GB200 UltraServers, sustentados por la arquitectura NVIDIA GB200 NVL72, se presentan como la solución líder para el desarrollo y despliegue de modelos de inteligencia artificial de tamaño exponencial. Gracias a la integración de estos servidores con el entorno distribuidor de SageMaker HyperPod, las organizaciones pueden escalar sus modelos, minimizar tiempos de inactividad y facilitar la transición del entrenamiento al despliegue en gran escala.

Estos avanzados servidores conectan 36 CPUs NVIDIA Grace con 72 GPUs Blackwell bajo un dominio NVLink único, garantizando recursos de computación sin precedentes. Esta arquitectura permite un acceso optimizado a 72 GPUs Blackwell, mejorando notablemente el rendimiento y la eficiencia durante el entrenamiento de modelos.

Además, el sistema sobresale en su capacidad de red, proporcionando hasta 130 TBps de ancho de banda NVLink de baja latencia, lo que mejora la comunicación en tareas de inteligencia artificial extensas. Los UltraServers también ofrecen un almacenamiento de hasta 405 TB de NVMe SSD local, optimizando el entrenamiento al permitir acceso y almacenaje de datos a gran velocidad.

La combinación de SageMaker HyperPod y los P6e-GB200 UltraServers marca un hito en el entrenamiento y despliegue eficiente de los modelos de inteligencia artificial más avanzados. Este desarrollo es especialmente ventajoso para organizaciones con múltiples proyectos, asegurando la máxima utilización de la infraestructura y reduciendo los costos operativos.

Los usuarios interesados pueden acceder a las capacidades de UltraServer mediante planes flexibles de entrenamiento disponibles en la zona de AWS en Dallas. Esto facilita el acceso a las potentes herramientas de Amazon, promoviendo el avance de la inteligencia artificial en diversos sectores. Las organizaciones pueden registrarse en la consola de SageMaker para comenzar a aprovechar esta tecnología de vanguardia y potenciar sus proyectos de inteligencia artificial.

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

¡Apúntate a nuestro newsletter!


– patrocinadores –

Noticias destacadas

– patrocinadores –

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!

Scroll al inicio
×