El impacto de la IA en el tráfico recibido por las webs de todo el mundo sigue generando un aluvión de estudios (y dolores de cabeza) al respecto. El último de ellos es un investigación llevada a cabo por Profound, una consultora especializada en optimización de IA, sobre la forma en que ChatGPT genera tráfico de referencia.
Según un análisis publicado por Josh Blyskal, su responsable de AEO (Artificial Engine Optimization), el tráfico procedente de ChatGPT ha caído un 52% desde el pasado 21 de julio. Según sus conclusiones, el motivo no parece ser ningún tipo de fallo técnico, sino un cambio en la forma en la que la herramienta de OpenAI elige cómo y a quién citar en sus respuestas.
Se trata de una pérdida de la mitad del tráfico: no hace falta que te explique las implicaciones que un cambio así puede tener para las marcas, que ahora se enfrentan a un nuevo desafío. La IA favorece a quienes dan respuestas.
La caída en el tráfico referido a las webs desde ChatGPT coincide con un notable aumento en las citas a sitios como Reddit (+87%) y Wikipedia (+62%) en las respuestas de la IA. En palabras del autor:
“El descenso del tráfico referido comenzó justo cuando los patrones de citas cambiaron drásticamente. Las citas en Reddit aumentaron un 87% a partir del 23 de julio, alcanzando más del 10% del total de citas de ChatGPT. Wikipedia alcanzó simultáneamente máximos históricos, con un aumento del 62% desde su mínimo de julio, hasta alcanzar casi el 13% de cuota de citas ayer.
Los tres dominios principales (Wikipedia, Reddit y TechRadar, un portal centrado en tecnología y electrónica) en conjunto han crecido un 53%, controlando ahora el 22% del total de citas. Esto significa que una de cada cinco citas de ChatGPT se dirige a solo tres sitios. Al mismo tiempo, los sitios web de marca están viendo menos oportunidades de citación: millones de referencias potenciales están siendo absorbidas por estas plataformas dominantes. Esto no se debe a un cambio de GPT-5, ya que la consolidación comenzó semanas antes del lanzamiento del modelo”.
Para Blyskal, esto demuestra que OpenAI está experimentando con su sistema RAG (Retrieval-Augmented Generation) para priorizar las fuentes que ofrecen las respuestas que encajan con lo que consideran de alta calidad y utilidad para los usuarios. Pero… ¿qué es eso del RAG?
Un modelo de lenguaje tradicional se entrena con una gran cantidad de datos, pero su conocimiento es estático; está “congelado” en el momento en que terminó su entrenamiento. Si le preguntas sobre una noticia reciente, no la conocerá. Además, a veces puede “alucinar” e inventar información si no tiene datos suficientes.
En el caso del RAG el enfoque combina modelos generativos (como GPT) con un sistema de búsqueda o recuperación de documentos. Cuando el usuario hace una pregunta, el sistema busca en una base de datos o en la web los documentos más relevantes. Así, ChatGPT no inventa la respuesta de cero, sino que la redacta usando esos documentos recuperados como apoyo y puede enlazar o referenciar las fuentes (“según Wikipedia” o “en Reddit se discute que…”).
Y ahora viene la parte en la que los argumentos del autor, al margen de los datos, pueden volverse más discutibles:
“Reddit y Wikipedia no ganan por ser especiales. Ganan por defecto porque son los únicos que ofrecen respuestas directas. Cuando alguien pregunta “¿cuál es el mejor CRM para startups?” y la página de una marca dice “Solicitar una demostración”, mientras que Reddit tiene un hilo que compara 10 opciones, se cita a Reddit”.
Esto es cierto, pero también es cierto que hay miles de webs de todo el mundo que generan contenido de calidad que va más allá del “solicite una demostración”. Contenido bien estructurado, útil para los usuarios y trabajado desde los parámetros clásicos del SEO. Entonces, ¿qué hacen Wikipedia o Reddit diferente al resto de los mortales?
Desde luego, sabemos que OpenAI ha utilizado en el pasado a ambas plataformas para entrenar a sus modelos, lo que indica cierta preferencia frente a otras opciones. Además, en 2024 OpenAI y Reddit anunciaron una colaboración que permite a OpenAI acceder a la API de datos de Reddit. Este acuerdo proporciona a OpenAI contenido estructurado y en tiempo real de Reddit, buscando mejorar la capacidad de sus modelos de lenguaje, como ChatGPT, para comprender y generar respuestas basadas en conversaciones reales.
Vale, esto ya es bastante indicativo. Pero, ¿qué otras cosas pueden jugar a su favor?
Está claro que ambas tienen puntos fuertes, cada una en su estilo: Wikipedia ofrece explicaciones completas, neutrales y bien estructuradas, mientras que Reddit se centra en discusiones en las que los usuarios comparan opciones, comparten experiencias reales y destacan ventajas y desventajas.
Otro factor es la cobertura y actualización. Wikipedia logra mantenerse relativamente al día gracias a su comunidad global, y Reddit ofrece frescura al incluir conversaciones sobre temas muy recientes, como la última actualización de un software o las opiniones sobre un nuevo producto. Además, ambas plataformas utilizan un lenguaje natural, el mismo que emplean los usuarios al hacer preguntas, mientras que a veces los medios y las webs de marca podemos utilizar un lenguaje más formal.
Y bueno, la estructura también juega un papel clave. Wikipedia organiza la información de manera jerárquica y con referencias, lo que facilita que el modelo la entienda y la cite. Reddit, por su parte, ordena las respuestas mediante votos, lo que puede ayudar a identificar qué comentarios tienen mayor relevancia o consenso.
Ya por último, está la percepción de imparcialidad: Wikipedia es reconocida por su tono neutral, y aunque Reddit claramente no lo es, su pluralidad (teórica) de opiniones lo convierte en una fuente útil para mostrar distintos puntos de vista.
Para el autor del estudio, el mensaje es claro: si quieres ser citado por ChatGPT (y, por extensión, visible en el nuevo ecosistema de la IA), tienes que convertirte en una fuente de información útil. En lugar de centrarse en textos optimizados para la conversión y las palabras clave, las marcas deben empezar a crear contenido que resuelva problemas reales de sus clientes.
Algunos ejemplos de este tipo de contenido son:
En realidad el análisis de Profound también resalta una realidad bastante evidente en los nuevos tiempos de la IA: la inestabilidad. Al igual que una core update de Google puede suponer un destrozo (o un éxito) para una web, un ajuste manual en la ponderación de las citas por parte de OpenAI provocó una caída del 52% en el tráfico en menos de un mes. El tráfico que proviene de las herramientas de IA es volátil y está sujeto a los experimentos de las empresas tecnológicas.
El futuro del SEO y del marketing de contenidos ya no depende solo de Google, sino de la dirección que tomen empresas como OpenAI. Puede que las marcas y los profesionales del marketing que se adapten a esta nueva realidad, priorizando la utilidad y las respuestas, sean los que ganen visibilidad y confianza en la era de la inteligencia artificial.
O puede que no, todo dependerá de Sam Altman y su equipo.
Imagen: Flux Schnell
Your email address will not be published. Required fields are marked *
Δ