Un nuevo enfoque en la creación de guiones gráficos animados está utilizando la inteligencia artificial para lograr una notable consistencia visual entre los personajes. Esta innovadora técnica, que se basa en la ingeniería de imagen y el desarrollo de personajes, permite a los creadores afinar modelos de IA, como el modelo Amazon Nova Canvas, para gestionar de manera precisa las apariciones y expresiones de los personajes en diferentes escenas.
FuzzyPixel, una división de Amazon Web Services (AWS), ha ejecutado un proyecto utilizando el corto animado «Picchu», donde preparan datos de entrenamiento mediante la extracción de fotogramas clave. Con el afine del modelo, se logra mantener la coherencia visual de los personajes principales, Mayu y su madre, lo que facilita la generación rápida de conceptos de guiones gráficos para futuras secuelas.
El proceso automatizado comienza con la carga de un video en un bucket de Amazon Simple Storage Service (S3). A través de varias etapas, se disminuye la resolución de los fotogramas y se seleccionan aquellos que muestran a los personajes, generando también subtítulos utilizando el modelo Amazon Nova. Posteriormente, los creadores pueden trabajar en un entorno de notebook en Amazon SageMaker AI para iniciar el entrenamiento del modelo.
La extracción de personajes implica tomar fotogramas de video a intervalos fijos y realizar detección de etiquetas y rostros para identificarlos. Este método se complementa con un algoritmo de deduplicación que asegura la diversidad del conjunto de datos al eliminar imágenes similares, evitando así un sobreajuste del modelo.
Una vez recopiladas suficientes imágenes etiquetadas, se verifica la calidad de los datos mediante un proceso de human-in-the-loop, garantizando que solo se utilice información precisa para el entrenamiento del modelo. Resultados positivos en pruebas preliminares indican que, con los ajustes adecuados de los hiperparámetros, se puede alcanzar una mejora significativa en la consistencia visual.
Una vez afinado, el modelo está listo para su despliegue. Esto se puede hacer desde la consola de Amazon Bedrock o utilizando el SDK de Python para personalizar la integración. Los creadores pueden probar el modelo para generar nuevas imágenes, manteniendo la coherencia estilística y de calidad en la narrativa de sus historias.
Con esta metodología innovadora, se espera no solo acelerar la producción de guiones gráficos, sino también elevar la calidad del contenido visual, permitiendo a los equipos creativos enfocarse más en la narrativa y menos en la consistencia técnica.