Arquitectura de Hub y Radio en Multitenencia con AWS Transit Gateway: Casos de Uso de IA Generativa a Gran Escala, Parte 1

Elena Digital López

La inteligencia artificial generativa está revolucionando la forma en que las empresas innovan y resuelven problemas. A medida que estas tecnologías pasan de la experimentación a la implementación a gran escala, las empresas están integrándolas en sus procesos centrales, abarcando diversos departamentos y proveedores de software. Sin embargo, esta adopción masiva trae consigo desafíos significativos, en particular en la gestión efectiva y escalabilidad de dichas tecnologías.

Un obstáculo principal es la necesidad de crear soluciones que puedan manejar diversas preocupaciones comunes como la multi-tenencia, la autenticación, la autorización y la seguridad de la red. Para los proveedores de software como servicio (SaaS) y las empresas con estrictos requisitos de cumplimiento, una arquitectura de múltiples cuentas es clave. Esta estructura no solo mejora la organización y seguridad en el entorno de AWS, sino que también facilita la gestión de estas preocupaciones comunes con el crecimiento de las implementaciones de inteligencia artificial generativa.

En un esfuerzo por abordar estas cuestiones, se ha presentado una serie de dos partes que detalla un patrón arquitectónico de «hub y spoke» (centro y radios) para construir una infraestructura multi-tenant y multi-cuenta. La primera parte describe un hub centralizado para los servicios de inteligencia artificial generativa, complementado por «spokes» específicos para cada cliente, utilizando AWS Transit Gateway para la interoperabilidad entre cuentas. Este hub actúa como la entrada para las solicitudes de los usuarios, centralizando funciones esenciales como autenticación y enrutamiento.

La segunda parte explorará una variación que utiliza AWS PrivateLink para compartir de manera segura el acceso centralizado con distintos equipos de la organización o socios externos. Ambas publicaciones se enfocan en centralizar la autenticación, autorización y acceso a modelos, asegurando una red segura entre múltiples cuentas para facilitar la integración y expansión de los usos de inteligencia artificial generativa.

La solución se apoya en una arquitectura de hub y spoke que proporciona un sistema seguro y escalable para gestionar implementaciones a través de múltiples cuentas. La cuenta del hub ofrece servicios comunes a los clientes y actúa como el punto de entrada, mientras que las cuentas spoke albergan recursos específicos de cada cliente. Esta orientación permite un flujo centralizado de solicitudes manteniendo separación entre inquilinos.

Entre las decisiones de diseño, destaca el uso de funciones Lambda para validar tokens y manejar la lógica de enrutamiento desde la cuenta del hub. Esto facilita la centralización de la gestión y monitorización, y permite adaptar la arquitectura a las necesidades específicas y futuras extensiones de cada organización.

El incremento en la adopción de arquitecturas multi-tenant y las capacidades avanzadas de AWS permiten a las organizaciones crear soluciones robustas, maximizando el potencial de la inteligencia artificial generativa y abordando los desafíos de seguridad y escalabilidad de su implementación.

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

¡Apúntate a nuestro newsletter!


– patrocinadores –

Noticias destacadas

– patrocinadores –

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!

Scroll al inicio
×