Hoy se ha anunciado el lanzamiento de Pixtral 12B, un modelo de lenguaje visual altamente avanzado desarrollado por Mistral AI, que ya está disponible para los clientes a través de Amazon SageMaker JumpStart. Este innovador modelo es capaz de abordar tanto tareas de texto como multimodales y promete un rendimiento excepcional en diversas aplicaciones del mundo real, como el entendimiento de gráficos y figuras, la respuesta a preguntas sobre documentos, el razonamiento multimodal y el seguimiento de instrucciones.
El modelo Pixtral 12B es único por su capacidad de procesar imágenes en su resolución y relación de aspecto naturales, sin comprometer el rendimiento en tareas textuales. Su arquitectura innovadora consta de un codificador de visión con 400 millones de parámetros y un decodificador transformador multimodal con 12 mil millones de parámetros, lo que le permite realizar inferencias rápidas y precisas. Esto lo convierte en una herramienta poderosa para empresas y startups que buscan desarrollar aplicaciones multimodales complejas.
Disponible bajo la licencia comercial Apache 2.0, Pixtral 12B ofrece a las empresas una opción robusta para sus necesidades tecnológicas. Su integración con SageMaker JumpStart facilita el acceso y despliegue de modelos de aprendizaje automático en un entorno seguro, lo que permite personalizaciones profundas para abordar casos de uso específicos. SageMaker JumpStart, parte del portfolio de AWS, permite a los desarrolladores acceder a modelos preentrenados de alto rendimiento y desplegarlos en instancias dedicadas de inferencia, incluidas aquellas potenciadas por AWS Trainium e Inferentia.
Aunque el ajuste fino del Pixtral 12B aún no está disponible, los usuarios pueden aprovechar sus capacidades para realizar tareas como el reconocimiento óptico de caracteres (OCR), análisis de gráficos y conversión de imágenes a código, todo mediante interfaces de usuario intuitivas o el SDK de Python de SageMaker. Con el lanzamiento de Pixtral 12B, Mistral AI refuerza su posición en el desarrollo de modelos de lenguaje visual, mientras que Amazon SageMaker JumpStart sigue facilitando el acceso a las más avanzadas arquitecturas de modelos.
Este anuncio marca un paso significativo hacia la integración de modelos multimodales en procesos empresariales, allanando el camino para futuras innovaciones en el campo de la inteligencia artificial. La disponibilidad de Pixtral 12B en esta plataforma supone una evolución importante en cómo las organizaciones pueden implementar y beneficiarse de las capacidades avanzadas de los modelos de lenguaje visual.