En el ámbito de la inteligencia artificial, la implementación de sistemas autónomos se enfrenta a un desafío significativo: el comportamiento no determinista de los agentes, que a menudo carece de un rastro causal claro. Este problema surge no del modelo ni de la solicitud inicial, sino del estado que el agente interpreta y modifica. Los agentes realizan flujos de trabajo de múltiples pasos, invocan herramientas externas y actualizan continuamente objetos compartidos. Sin mecanismos de aislamiento de instantáneas y lecturas que tengan en cuenta la versión de los datos, la percepción del mundo por parte del agente puede cambiar durante su ejecución.
Las inconsistencias, lecturas obsoletas, escrituras parciales y actualizaciones intercaladas pueden combinarse para generar decisiones irreproducibles. El fallo radica en los sistemas de almacenamiento de objetos, diseñados para artefactos estáticos y no para procesos autónomos concurrentes. Este vacío es lo que Tigris busca abordar, implementando «instantáneas de cubos completos» y el concepto de «forking» de cubos, capacidades ausentes en los almacenes de objetos tradicionales como S3.
A medida que los equipos escalan agentes paralelos, enfrentan conflictos de escritura, contaminación entre ejecuciones y estados irreproducibles. Aunque estos problemas se manifiestan como fracasos en los flujos de trabajo, la raíz es la falta de semánticas de versión de datos. El almacenamiento de objetos se ha convertido en la opción predeterminada para el estado de los agentes, especialmente con datos no estructurados y en rápida evolución, pero carece de lecturas consistentes, orden causal y aislamiento por agente. Esto puede llevar a situaciones donde dos agentes sobrescriben el trabajo del otro.
Tigris adopta un enfoque diferente, reestructurando las semánticas de datos para sistemas autónomos mediante la inmutabilidad como decisión arquitectónica clave. Cada escritura produce una nueva versión inmutable y en vez de mutaciones destructivas, las eliminaciones crean «tumbas». El sistema mantiene un registro global y ordenado de los cambios de estado, permitiendo un rastreo preciso, lecturas deterministas y vistas históricas reproducibles.
La implementación de «bucket forking» ofrece flujos de trabajo similares a Git para datos no estructurados. Un fork se crea rápidamente, hereda una instantánea exacta del cubo padre y proporciona un espacio de escritura aislado para agentes o flujos, permitiendo divergencias seguras sin afectar los datos originales. Esto posibilita la experimentación segura en nuevos comportamientos de agentes y estrategias de resumen o transformación de datos.
Con el aumento de los sistemas autónomos en los flujos de trabajo de producción, se vuelve crucial asegurar garantías en la capa de datos. Los equipos requieren mecanismos como forking, instantáneas y estado versionado para prevenir que errores en el estado compartido produzcan resultados inconsistentes. La gestión de datos en estos sistemas debe evolucionar al igual que el código, asegurando el mismo nivel de control y semántica.
La introducción de almacenamiento inmutable, instantáneas y el forking de cubos es un paso crítico en la búsqueda de bases de datos adecuadas para sistemas autónomos. Aunque muchos equipos no vean de inmediato esta necesidad, lo harán a medida que sus agentes comiencen a comportarse de manera impredecible. vía: AI Accelerator Institute