Amazon ha anunciado una nueva funcionalidad en su servicio Amazon Bedrock, que permite ahora la importación de modelos personalizados Qwen, incluyendo variantes avanzadas como Qwen2, Qwen2_VL y Qwen2_5_VL. Esto significa que los usuarios pueden importar y desplegar estos modelos en un entorno completamente gestionado y sin servidor, liberándolos de tener que administrar la infraestructura subyacente.
La integración de los nuevos modelos Qwen 2 y 2.5 supone un avance notable en las capacidades de inteligencia artificial disponibles en la infraestructura de AWS. Esta familia de modelos abarca desde modelos de lenguaje general, que oscilan entre 0.5B y 72B parámetros, hasta versiones especializadas como Qwen 2.5-Coder, diseñado para generación de código, y Qwen 2.5-VL, que incluye procesamiento de imágenes y vídeos.
La funcionalidad de importación de modelos personalizada de Amazon Bedrock utiliza una API unificada y sin servidor que permite integrar instantáneamente modelos personalizados sobre la base de modelos existentes. Esta capacidad acelera el desarrollo de aplicaciones de IA generativa. Actualmente, la función está disponible en diversas regiones, incluyendo Estados Unidos y Europa.
Un uso destacado de Qwen 2.5 es como asistente de programación. La variante Qwen 2.5-Coder ha demostrado ser tan eficaz como otros modelos propietarios, soportando más de 90 lenguajes de programación y destacando en generación y depuración de código.
Además, la variante Qwen 2.5-VL es capaz de integrar comprensión visual y lingüística, permitiendo que el modelo identifique y describa objetos en imágenes, analice gráficos y extraiga texto.
Para utilizar estos modelos a través de Amazon Bedrock, los interesados deben contar con una cuenta activa de AWS, un bucket de Amazon S3 para almacenar archivos de modelos y permisos adecuados para crear trabajos de importación.
En términos de costos, Amazon Bedrock no cobra por la importación de modelos, pero aplica tarifas por la inferencia, calculadas en bloques de cinco minutos, dependiendo del tamaño del modelo, tiempo de actividad, región y especificaciones del hardware.
Para evitar cargos no deseados tras realizar experimentos, se recomienda eliminar los modelos importados y, de ser necesario, también los archivos del bucket de S3. La integración de Amazon Bedrock con modelos avanzados como Qwen 2.5 proporciona a las organizaciones una infraestructura optimizada para aplicaciones de inteligencia artificial, permitiéndoles centrarse en el desarrollo en lugar de la gestión de infraestructura.