Un equipo de investigación ha logrado avances significativos en la creación de enzimas utilizando inteligencia artificial generativa, específicamente a través de modelos de lenguaje de proteínas (pLMs), los cuales amplían la diversidad natural de estas biomoléculas de alto valor. Esta estrategia no solo diversifica la oferta de enzimas disponibles, sino que también busca mejorar su estabilidad, especificidad y efectividad en células humanas, un aspecto esencial para la biotecnología y la medicina.
La empresa Metagenomi se encuentra a la vanguardia en el desarrollo de terapias curativas que utilizan enzimas de edición genética CRISPR. Su enfoque involucra una extensa base de datos de enzimas naturales, MGXdb, que les permite identificar candidatos prometedores y entrenar modelos de lenguaje de proteínas. Estos modelos son capaces de generar variantes adicionales de ciertas clases de enzimas, las cuales son luego filtradas utilizando flujos de trabajo de modelos múltiples para predecir características clave, facilitando así campañas de ingeniería de proteínas.
Recientemente, el equipo de Metagenomi compartió métodos innovadores que permiten reducir los costos asociados a la generación de proteínas utilizando el modelo Progen2 en instancias AWS Inferentia. Han logrado una disminución de hasta el 56% en los costos de generación de variantes en comparación con otras tecnologías basadas en GPU. Este avance, desarrollado en colaboración con Tennex y el equipo de AWS Neuron, permite generar enzimas a gran escala, un aspecto clave para diversificar clases de enzimas de alto valor.
Las instancias EC2 Inf2 han facilitado la escalabilidad masiva de inferencias mediante AWS Batch, un servicio que permite ejecutar de manera eficiente cientos de miles de trabajos computacionales. Esta infraestructura optimiza el tiempo de generación y reduce los costos, lo cual es crucial para la investigación y desarrollo en biotecnología.
En las pruebas realizadas, se compararon diferentes métodos de generación, concluyendo que las modificaciones implementadas no comprometían la precisión de los modelos. Esto se logró mediante la generación de miles de secuencias de proteínas, demostrando que las instancias Spot de EC2 Inf2 son significativamente más económicas.
Con el objetivo de generar millones de proteínas, Metagenomi ha aprovechado su acceso a una amplia base de datos metagenómica y ha adaptado su modelo para maximizar la eficiencia y efectividad en la creación de enzimas. Este proyecto no solo representa un avance en el diseño de proteínas, sino también un hito en la reducción de costos en biotecnología, lo que podría abrir nuevas oportunidades en diversos sectores, desde la farmacéutica hasta la agricultura.