Las bases de datos grafos han revolucionado la gestión de datos complejos e interconectados dentro de las organizaciones, pero el uso de lenguajes de consulta especializados como Gremlin sigue siendo un desafío. A diferencia de las bases de datos relacionales, las grafos carecen de un esquema centralizado, lo cual exige una experiencia técnica avanzada para manejar consultas de manera efectiva.
Para superar este obstáculo, se ha introducido un innovador sistema que transforma consultas en lenguaje natural a Gremlin, utilizando modelos de Amazon Bedrock como Amazon Nova Pro. Este enfoque hace posible que analistas de negocio y científicos de datos, incluso sin formación técnica profunda, puedan interactuar con estas bases de datos de manera eficiente.
El proceso se desarrolla en tres etapas principales. Primero, se debe entender y extraer el conocimiento del gráfico, incluidas las etiquetas y las conexiones entre vértices, junto a un conocimiento del dominio específico brindado por modelos de lenguaje. Esto proporciona el contexto necesario para cada aplicación particular.
La segunda fase consiste en estructurar el gráfico de manera que simule el proceso de convertir texto a SQL, facilitando la comprensión del modelo sobre las estructuras gráficas. Aquí, las consultas en lenguaje natural se enriquecen y planifican.
Finalmente, se generan y ejecutan consultas Gremlin. Un modelo de lenguaje produce una consulta inicial que se ejecuta en un motor Gremlin, y en caso de errores, se refina iterativamente. Este proceso asegura que las consultas se ajusten a la estructura de la base de datos y sean precisas.
Un sistema de evaluación basado en modelos de lenguaje ha sido implementado para medir la calidad de las consultas generadas. A través de pruebas con 120 preguntas, el framework demostró su capacidad de distinguir entre consultas correctas e incorrectas, alcanzando una precisión del 74.17%.
Además, los resultados mostraron que Amazon Nova Pro supera a otros modelos de referencia en términos de velocidad y costos, generando consultas más rápido y a menor costo por token. Con mejoras en curso para optimizar la evaluación de resultados y el manejo de consultas complejas, estas innovaciones prometen una mayor fiabilidad, facilitando el uso de bases de datos grafos en diversas aplicaciones empresariales.