Indexa contenidos del sitio web usando el conector Amazon Q Web Crawler para Amazon Q BusinessEl conector Amazon Q Web Crawler presenta una solución innovadora para indexar contenido de sitios web, optimizando la capacidad de búsqueda y análisis de datos en Amazon Q Business.

Elena Digital López

Amazon ha lanzado un nuevo servicio denominado Amazon Q Business, diseñado para que las empresas puedan crear aplicaciones de chat interactivas utilizando sus propios datos. Este servicio administrado es capaz de generar respuestas basadas en estos datos o mediante un modelo de lenguaje extenso (LLM). Un aspecto crucial del servicio es que los datos del usuario no se usan para entrenamiento; las respuestas se generan exclusivamente con la información disponible para los usuarios.

La información empresarial a menudo está dispersa en múltiples fuentes, como documentos en Amazon Simple Storage Service (Amazon S3), motores de bases de datos y sitios web. Para abordar esta dispersión, Amazon ha propuesto la creación de una aplicación de Amazon Q Business que permite la indexación de contenido web utilizando el conector Amazon Q Web Crawler.

En los ejemplos presentados, se hicieron pruebas con dos fuentes de datos: una guía de incorporación de empleados de una empresa ficticia que requería autenticación básica, y la documentación oficial de Amazon Q Business. Se demostraron configuraciones avanzadas, permitiendo que el Web Crawler indexe solamente páginas y enlaces relevantes, evitando la indexación de otros servicios de AWS.

El conector Amazon Q Web Crawler tiene la capacidad de rastrear sitios web que utilicen HTTPS y de indexar su contenido, lo que habilita la creación de experiencias de inteligencia artificial generativa. El conector emplea el paquete Selenium Web Crawler junto con un controlador Chromium y se actualiza automáticamente sin necesidad de intervención del usuario. Además de rastrear e indexar el contenido de páginas web y adjuntos, permite configurar atributos personalizados para mejorar los resultados de búsqueda según la relevancia de los documentos.

Para configurar las fuentes de datos, se pueden utilizar URLs o sitemaps, definir el acceso seguro para sitios web protegidos y especificar qué y cómo se sincronizan los datos con Amazon Q Business. El proceso implica la creación y configuración de una aplicación, así como la gestión de fuentes de datos y usuarios a través del Identity Center de IAM.

Este innovador servicio abre un abanico de posibilidades para que las empresas utilicen inteligencia artificial generativa, facilitando la integración y acceso a información distribuida en diversas plataformas digitales.

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

¡Apúntate a nuestro newsletter!


– patrocinadores –

Noticias destacadas

– patrocinadores –

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!

Scroll al inicio