Desarrollo De Flujo De Trabajo Agente Con OpenAI GPT OSS En Amazon SageMaker AI Y Amazon Bedrock AgentCore

Elena Digital López

OpenAI ha anunciado la introducción de dos innovadores modelos de lenguaje de código abierto, gpt-oss-120b y gpt-oss-20b, que prometen revolucionar la manera en que se implementan y gestionan los flujos de trabajo en inteligencia artificial. Con un impresionante número de parámetros, 117 mil millones para el primero y 21 mil millones para el segundo, estos modelos son reconocidos como líderes en su categoría, destacando en tareas de razonamiento gracias a su diseño basado en la Mezcla de Expertos (MoE) y una amplia ventana de contexto de 128K.

A través de la plataforma Amazon SageMaker AI, los usuarios ahora tienen la capacidad de personalizar y perfeccionar estos modelos con facilidad. La flexibilidad proporcionada por SageMaker Inference permite la integración de código propio sin la necesidad de administrar clústeres, facilitando así su implementación.

Aunque los grandes modelos de lenguaje son muy efectivos en la comprensión del lenguaje y la generación de contenido, crear aplicaciones autónomas del mundo real sigue siendo un desafío debido a la complejidad de gestionar flujos de trabajo dinámicos, capacidades de llamada a herramientas y gestión del contexto. Las arquitecturas de múltiples agentes surgen como una solución para simplificar estos procesos al descomponer sistemas complejos en componentes especializados, aunque presentan nuevos retos en términos de coordinación y orquestación.

Un reciente post detalla cómo desplegar el modelo gpt-oss-20b en los endpoints gestionados por SageMaker, presentando un asistente analizador de acciones como ejemplo práctico. Esta solución se implementa utilizando LangGraph, un marco especializado que gestiona el estado y los flujos de trabajo coordinados. Posteriormente, los agentes serán desplegados en Amazon Bedrock AgentCore, una capa de orquestación que abstrae la infraestructura para operar de forma segura agentes de IA a gran escala.

La solución se centra en un analizador de acciones que incluye componentes clave como el modelo GPT OSS 20B en un endpoint de SageMaker mediante vLLM; LangGraph para la orquestación multiagente; y Amazon Bedrock AgentCore para el despliegue de agentes. Esta arquitectura permite que un usuario realice consultas que son gestionadas por agentes especializados en la evaluación de acciones.

Además, los usuarios reciben guías sobre cómo configurar sus entornos, gestionar permisos y realizar despliegues de manera eficiente, destacando la importancia de herramientas como vLLM y Amazon Elastic Container Registry. Estas innovaciones prometen reducir el tiempo de análisis y aumentar la productividad automatizando tareas rutinarias, permitiendo a los analistas centrarse en enfoques más complejos y estratégicos en el ámbito empresarial.

Se anima a explorar los ejemplos de código disponibles y a experimentar con distintos flujos de trabajo de agentes, resaltando el potencial de los modelos de código abierto en la optimización de procesos organizacionales.

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

¡Apúntate a nuestro newsletter!


– patrocinadores –

Noticias destacadas

– patrocinadores –

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!

Scroll al inicio
×