Los transformadores de oraciones han emergido como herramientas indispensables en la inteligencia artificial, especialmente en el procesamiento del lenguaje natural (NLP). Estas sofisticadas entidades del aprendizaje profundo convierten frases en vectores de longitud fija que capturan su significado semántico, facilitando una variedad de tareas como la clasificación de textos, la agrupación y la búsqueda semántica.
Una reciente investigación en el ámbito del comercio electrónico ha destacado el uso innovador de transformadores de oraciones por parte de Amazon para mejorar la clasificación de productos dentro de su vasto catálogo. El estudio contrapone dos transformadores: el modelo público Paraphrase-MiniLM-L6-v2 y el modelo M5_ASIN_SMALL_V2.0 de Amazon, una versión basada en BERT y ajustada con datos internos. La premisa inicial era que el modelo de Amazon superaría a su contraparte público gracias a su entrenamiento con datos específicos del catálogo.
El experimento reafirmó esta premisa a través de la afinación de ambos transformadores con un conjunto de datos de productos de Amazon de 2020. Este conjunto, accesible públicamente, abarca diversos campos como el nombre del producto, la categoría y las especificaciones. A partir de esta afinación, se evaluó la capacidad de los modelos para clasificar productos con un clasificador XGBoost.
El éxito de la mejora radica en un proceso de preprocesamiento meticuloso, que normaliza textos, define categorías principales y selecciona campos relevantes para mejorar la clasificación. En el estudio, el modelo Paraphrase-MiniLM-L6-v2 afinado logró mejorar su precisión del 78% inicial a un notable 94%. El modelo M5_ASIN_SMALL_V2.0, por su parte, exhibió una precisión inicial comparable al primer modelo, pero tras la afinación, alcanzó un impresionante 98% de exactitud.
Estos resultados destacan la importancia de afinar transformadores de oraciones con datos específicos, como los de Amazon, para mejorar significativamente la clasificación de productos. Así, los transformadores ajustados con precisión no solo optimizan las capacidades de clasificación, sino que también expanden las posibilidades de aplicar inteligencia artificial avanzada en el comercio electrónico.