El algoritmo de X deja ver sus tripas: Grok, embeddings y alcance bajo sospecha

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

X ha vuelto a hacer algo poco habitual en una gran red social: publicar una parte relevante del código que mueve su feed “Para ti”. La actualización del repositorio de xAI en GitHub, fechada el 15 de mayo de 2026, ha reactivado el debate sobre cómo se decide qué publicaciones llegan a miles de usuarios y cuáles desaparecen sin apenas recorrido.

La publicación no abre toda la caja negra, pero sí deja ver una arquitectura mucho más apoyada en inteligencia artificial que en reglas tradicionales. El sistema, conocido como Phoenix, combina contenido de cuentas seguidas con publicaciones descubiertas fuera de la red directa del usuario y las ordena mediante un modelo basado en la arquitectura de Grok. La promesa pública de X es que el feed sea más transparente. La lectura técnica, sin embargo, es más incómoda: la visibilidad en la plataforma depende cada vez más de señales difíciles de observar desde fuera.

La documentación oficial del repositorio describe un sistema de dos fases. Primero recupera candidatos entre millones de publicaciones. Después los ordena con un transformer que predice probabilidades de interacción: favoritos, respuestas, republicaciones, clics, tiempo de permanencia, follows, bloqueos, silencios, reportes y señales de desinterés. Esa combinación se transforma después en una puntuación final que decide qué aparece en el feed.

El usuario ya no es solo una cuenta: es un vector

Uno de los puntos que más debate ha generado es el papel de los embeddings. En términos sencillos, un embedding es una representación matemática de un usuario, una publicación o un autor. No es una etiqueta visible, ni un marcador manual, sino un conjunto de números que resume patrones de comportamiento: con qué contenidos interactúa una persona, qué ignora, qué autores bloquea, qué temas consume y qué tipo de publicaciones suelen retener su atención.

El README de Phoenix explica que el sistema usa una arquitectura de dos torres: una para codificar al usuario y otra para codificar los candidatos. El resultado es una búsqueda por similitud que permite encontrar contenidos que encajan con el historial de interacción. En la práctica, esto confirma una idea que muchos creadores ya intuían: la plataforma no evalúa cada post desde cero, sino dentro de una memoria estadística del comportamiento previo.

Un análisis viral publicado en X va más allá y sostiene que cada cuenta acumula una “huella” interna que puede mejorar o deteriorarse con el tiempo. Según esa interpretación, señales como “no me interesa”, bloqueos, silencios, reportes o scroll rápido pueden contaminar el perfil algorítmico de una cuenta durante semanas. No es una confirmación oficial de X en esos términos, pero encaja con la lógica general de los sistemas de recomendación modernos: el historial pesa, y no siempre se borra cuando el creador cambia de estrategia.

La consecuencia es clara para quienes publican contenido profesional, informativo o de marca. No basta con que una publicación sea buena de forma aislada. El sistema también mira el historial del autor y la reacción acumulada de la audiencia. Una mala racha de bajo interés puede dificultar la recuperación, porque el algoritmo aprende que esa cuenta genera menos valor para determinados usuarios.

Los primeros minutos pesan más de lo que parece

Otro elemento relevante es la edad del contenido. En el código aparece una constante llamada POST_AGE_MAX_MINUTES = 4800, equivalente a 80 horas. El sistema agrupa la antigüedad de las publicaciones en ventanas de una hora y asigna un bucket de desbordamiento cuando superan ese límite. Esto no significa que todo post muera exactamente a las 80 horas, pero sí muestra que la frescura es una variable explícita dentro del modelo.

Para los creadores, la lectura práctica es evidente: X no se comporta como YouTube, donde un contenido puede resucitar meses después por búsquedas o recomendaciones evergreen. En X, el tiempo pesa mucho. Las primeras horas son decisivas y los primeros minutos pueden marcar si una publicación recibe suficiente interacción para entrar en circuitos de distribución más amplios.

El análisis compartido por Javi López insiste en que los primeros 30 minutos son determinantes y que, sin una respuesta inicial suficiente, muchas publicaciones ni siquiera entrarían en una evaluación profunda. Esa afirmación concreta debe leerse como interpretación del código y del comportamiento observado, no como una regla oficial publicada por X. Aun así, coincide con la experiencia de muchos usuarios: cuando un post arranca mal, suele ser difícil levantarlo después.

Aquí entra una diferencia importante entre métricas visibles e invisibles. Los likes importan, pero no son la única señal. La documentación del repositorio incluye el dwell, es decir, el tiempo de permanencia o atención, dentro de las acciones que Phoenix puede predecir. Un post que consigue que la gente se detenga, lea, abra una imagen o vea un vídeo puede enviar una señal más rica que un simple favorito rápido.

Esto explica por qué ciertos formatos funcionan mejor de lo que aparentan. Los textos largos bien estructurados, los vídeos que retienen, las imágenes con información útil o los hilos breves con valor real pueden superar en distribución a publicaciones que generan muchos likes superficiales pero poca permanencia.

Lo que se ve y lo que X no ha publicado

La parte más delicada del repositorio está en lo que no aparece. X ha publicado una arquitectura, componentes, filtros, documentación y una versión mini de Phoenix. Pero no todos los pesos, prompts, reglas internas o configuraciones de producción están expuestos. El propio README indica que el modelo liberado es una versión más pequeña y congelada, mientras que Phoenix en producción usa un modelo más grande y entrenado de forma continua con datos en tiempo real.

Esto limita mucho cualquier conclusión tajante. El código permite entender la filosofía del sistema, pero no permite reconstruir con precisión cómo se ordena cada feed real en cada momento. Los pesos concretos de cada señal, las reglas de seguridad, los ajustes de experimentación, los sistemas de moderación y las configuraciones internas pueden cambiar la salida final de forma sustancial.

También hay que tener cuidado con la palabra “shadowban”. El código y la documentación sí muestran filtros de visibilidad, deduplicación, edad, cuentas bloqueadas o silenciadas, contenido eliminado, spam, violencia o gore. También aparecen señales negativas como bloqueos, silencios, reportes o “not interested”. Pero afirmar que existe un shadowban universal, automático y medible para cualquier cuenta exige más pruebas que una lectura parcial del repositorio.

Lo que sí queda claro es que X utiliza un sistema de distribución por capas. Primero selecciona candidatos. Luego enriquece información. Después filtra, puntúa y reordena. Finalmente aplica validaciones posteriores antes de servir el feed. En cada etapa una publicación puede perder opciones, no por una única sanción visible, sino por acumulación de señales pequeñas.

Para creadores, medios y marcas, esto obliga a cambiar algunas rutinas. Publicar cinco veces seguidas puede competir contra uno mismo si el sistema intenta diversificar autores. Responder todo el día a cuentas grandes puede generar visibilidad en conversaciones concretas, pero no necesariamente ayuda a la amplificación fuera de red. Repetir contenidos puede chocar con filtros de duplicados. Y generar textos o imágenes con aspecto de contenido automático de baja calidad puede convertirse en una señal negativa si los clasificadores lo detectan.

El algoritmo de X no premia solo la actividad. Premia la probabilidad de reacción útil. Y esa reacción ya no se mide únicamente en clics o favoritos, sino en un conjunto amplio de señales positivas y negativas.

La transparencia parcial de X tiene valor porque permite a investigadores, creadores y anunciantes entender mejor la lógica del sistema. Pero también confirma que la opacidad no ha desaparecido. El esqueleto está en GitHub; los ajustes finos siguen dentro de X. Esa diferencia importa mucho. En redes sociales, una pequeña variación en un peso o en una regla de seguridad puede cambiar la vida de miles de cuentas.

La conclusión más sensata no es buscar una receta mágica para “ganar al algoritmo”, sino entender sus incentivos. X quiere contenido reciente, que retenga atención, que genere interacción positiva y que no provoque señales de rechazo. Quiere variedad de autores, menos duplicados y menos contenido de baja calidad. Y, sobre todo, quiere que Grok y Phoenix aprendan de cada gesto del usuario.

Para quien publica en X, eso deja una recomendación sencilla: pensar menos en trucos y más en señales. Publicar cuando la audiencia está despierta, cuidar el arranque, evitar el spam, no abusar de hilos interminables, escribir originales con valor real y medir si la gente se queda o pasa de largo. El algoritmo no es neutral, pero tampoco es completamente invisible. Esta vez, al menos, ha dejado algunas pistas.

Preguntas frecuentes

¿X ha publicado todo su algoritmo?
No. Ha publicado el repositorio del sistema de recomendación del feed “Para ti”, con componentes importantes y una versión mini de Phoenix, pero no todos los pesos, reglas internas, prompts o configuraciones de producción.

¿Qué es Phoenix dentro de X?
Phoenix es el sistema de recomendación basado en transformer que recupera y ordena publicaciones según probabilidades de interacción, usando historial del usuario, embeddings y señales de contenido.

¿Los likes son la métrica más importante en X?
No necesariamente. El sistema también tiene en cuenta señales como respuestas, reposts, clics, follows, tiempo de permanencia, bloqueos, silencios, reportes o “no me interesa”.

¿La ubicación del usuario afecta al alcance?
El código publicado no permite afirmar que la ubicación del autor penalice directamente una publicación. Lo que sí puede afectar es publicar fuera del horario activo de la audiencia o usar un idioma que no encaje con el público al que se quiere llegar.

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.