Operar un servidor de seguimiento de MLflow autogestionado supone una carga administrativa considerable, que incluye tareas de mantenimiento y escalabilidad de recursos. A medida que los equipos amplían sus experimentos de aprendizaje automático, gestionar eficientemente los recursos durante picos de utilización e inactividad se vuelve un desafío. Las organizaciones que ejecutan MLflow en Amazon EC2 o en servidores locales pueden optimizar costos y recursos al utilizar Amazon SageMaker AI con MLflow sin servidor.
La nueva guía publicada ofrece un camino claro para migrar un servidor MLflow autogestionado a una aplicación sin servidor en SageMaker AI. Esta solución ajusta automáticamente los recursos según la demanda y elimina las tareas de gestión sin coste adicional. La guía incluye instrucciones sobre cómo utilizar la herramienta MLflow Export Import para transferir experimentos, ejecuciones y modelos, junto con indicaciones para validar el éxito de la migración.
Además, aunque la guía se centra en migrar servidores autogestionados a SageMaker con MLflow, la herramienta MLflow Export Import tiene una utilidad más amplia. Se puede utilizar para migrar servidores administrados en SageMaker a la nueva capacidad sin servidor y facilita actualizaciones de versión y rutinas de respaldo para recuperación ante desastres.
La migración se desarrolla en tres fases: exportación de artefactos MLflow a un almacenamiento intermedio, configuración de una aplicación MLflow y la importación de los artefactos. El proceso puede ejecutarse desde una instancia de EC2, un ordenador personal o un cuaderno de SageMaker, siempre que mantenga la conectividad con el servidor de origen y de destino.
Es crucial verificar la compatibilidad de la versión de MLflow antes de iniciar, asegurando que las versiones sean soportadas tanto en el servidor original como en el nuevo entorno en SageMaker. Se recomienda disponer de la última versión de MLflow compatible con Amazon SageMaker.
Tras crear una nueva aplicación MLflow en SageMaker, el siguiente paso implica instalar MLflow y el plugin de SageMaker en el entorno de ejecución para establecer la conexión. Luego, la instalación de la herramienta MLflow Export Import es esencial para exportar e importar los recursos necesarios al nuevo entorno.
Finalmente, es fundamental validar que todos los recursos de MLflow se han transferido correctamente, asegurándose de que los experimentos y los artefactos de modelo sean accesibles. En migraciones a gran escala, se aconseja dividir el proceso en lotes más pequeños.
Es importante recordar que un servidor de seguimiento administrado por SageMaker incurre en costos hasta que se detiene o elimina. Se sugiere detenerlos cuando no están en uso para evitar gastos innecesarios.
Migrar a una aplicación MLflow sin servidor en Amazon SageMaker AI reduce la sobrecarga operativa del mantenimiento de infraestructura de MLflow, integrando de manera fluida con los servicios de AI/ML de SageMaker. Se invita a aquellos interesados en realizar su propia migración a seguir la guía detallada y consultar la documentación para obtener más información.