Hace unas semanas escribí sobre cómo Google estaba empezando a considerar como «consejo experto» lo que, en realidad, no es más que gente opinando en internet. Me refería a Reddit, una plataforma con una valoración absurdamente inflada en bolsa porque resulta que se ha convertido progresivamente en una de las fuentes favoritas tanto para Google como para todos los modelos de inteligencia artificial . Ahora empezamos a ver las consecuencias previsibles de esa decisión.
La señal de alarma ha llegado desde algunos de los propios moderadores de Reddit. En comunidades relacionadas con temas especialmente sensibles, como la salud, los suplementos o los tratamientos hormonales, están denunciando un aumento significativo de intentos de manipulación por parte de empresas interesadas en influir en las conversaciones. No hablamos del spam tradicional, ese que todos sabemos identificar a simple vista, sino de algo bastante más sofisticado: cuentas aparentemente legítimas, conversaciones diseñadas para parecer espontáneas y recomendaciones de productos o servicios integradas de manera aparentemente natural en los debates.
¿La razón? Muy sencilla: Reddit ya no es simplemente Reddit. Durante años, aparecer en los primeros resultados de Google justificó la creación de una gigantesca industria dedicada a manipular algoritmos de búsqueda. El SEO acabó convirtiendo buena parte de la web en una inmensa colección de páginas escritas para máquinas más que para personas. Google intentó combatir ese problema buscando señales más auténticas, más humanas y más difíciles de falsificar. Y encontró Reddit.
Pero al hacerlo, ha creado exactamente el mismo incentivo que intentaba evitar: si las respuestas generadas por Google utilizan Reddit como fuente, si ChatGPT, Claude, Gemini o cualquier otro sistema conversacional consideran las conversaciones de Reddit una señal relevante, y si millones de usuarios empiezan a tomar decisiones basándose en respuestas construidas parcialmente a partir de esos contenidos, entonces influir en Reddit pasa a tener un valor económico enorme. Y cuando algo adquiere valor económico, alguien encuentra la manera de manipularlo.
La paradoja es fascinante. Google recurrió a Reddit porque la web se había llenado de contenido optimizado para Google. Pero al convertir Reddit en una fuente privilegiada para sus sistemas de inteligencia artificial, ha puesto en marcha el nacimiento de una nueva industria dedicada a optimizar Reddit para Google y para la inteligencia artificial. La diferencia es que ahora ya no se manipulan páginas web. Se manipulan conversaciones. Y si tienes responsabilidades corporativas relacionadas con ese área, lo sabrás ya, porque ya te lo estará ofreciendo tu agencia de toda la vida.
Además, el problema es mucho más complejo de detectar. Una página creada para posicionar una palabra clave suele dejar rastros evidentes, pero una conversación aparentemente auténtica entre usuarios resulta mucho más difícil de distinguir de una interacción genuina. Los modelos de lenguaje tampoco ayudan demasiado: son extraordinariamente buenos encontrando patrones, pero mucho menos eficaces distinguiendo entre experiencia real y teatro cuidadosamente diseñado para parecer experiencia real. Y a medida que más y más personas empiezan a utilizarlos para encontrar lo que necesitan, los niveles de manipulación de sus respuestas mediante técnicas cada vez más depuradas van creciendo.
Todo esto debería llevarnos a replantearnos algunas ideas sobre la supuesta autenticidad de las comunidades online. Reddit sigue siendo uno de los espacios más interesantes de internet precisamente porque alberga conversaciones reales, experiencias personales y conocimiento práctico acumulado durante años. Pero cuanto más importante se vuelve una fuente directa para buscadores e inteligencias artificiales, más atractiva resulta para quienes quieren influir en esas mismas herramientas.
Es una dinámica que hemos visto repetirse una y otra vez. Cada vez que una plataforma se convierte en un intermediario relevante para la atención, la visibilidad o la influencia, aparece una industria dedicada a explotar sus mecanismos. Ocurrió con los buscadores. Ocurrió con las redes sociales. Ocurrió con los sistemas de recomendación. Y está ocurriendo ahora con las fuentes utilizadas por la inteligencia artificial generativa.
La cuestión, por tanto, no es si Reddit contiene información valiosa. Por supuesto que puede contenerla, aunque mezclada con muchas otras cosas. La cuestión es cuánto tiempo seguirá siendo razonable asumir que las opiniones que encontramos allí reflejan de manera espontánea la experiencia colectiva de una comunidad. La decadencia de Reddit es algo que se podía predecir desde hace mucho tiempo.
Porque el problema de Reddit no es Reddit. El problema son los incentivos. Cuando una conversación aparentemente humana puede terminar influyendo en las respuestas que reciben cientos de millones de personas, esos incentivos son enormes. Tan enormes que resulta ingenuo pensar que no van a ser explotados de forma sistemática.
Google creyó haber encontrado una vía de escape frente a una web contaminada por un SEO que ella misma había creado. Lo que quizá no anticipó es que, con sus elecciones, estaba creando las condiciones perfectas para industrializar algo mucho más valioso: la autenticidad.
This article is also available in English on my Medium page, «Google’s Reddit problem is really an incentives problem«


«Los modelos de lenguaje tampoco ayudan demasiado: son extraordinariamente buenos encontrando patrones, pero mucho menos eficaces distinguiendo entre experiencia real y teatro cuidadosamente diseñado para parecer experiencia real.»
«Porque el problema de … no es … » (Edans).
Hoy me has construido tú mismo el comentario. Solo necesito señalar como modelos de lenguaje, los de tipo IH… escribir IH en los puntos suspensivos y, como no, mudar el «no» por un tremendo «SI».
Me preocupa mas que Bruselas esté apunto de reconfigurar por ley el algoritmo de búsqueda de las grandes plataformas para priorizar la información los medios oficiales. De acuerdo que puede e3star mediatizada la información de Google, pero de lo que no tengo la menor duda es que lo está la Información de Tej levisión Española.
Lo que Europa está ocultando: el nuevo algoritmo de YouTube que cambiará todo
https://www.youtube.com/watch?v=seHCJZdug1s
Todo está mediatizado solo
…solo que nadie se queja del mediatizado medio que coincide con sus sesgos,
Quizá a ti te parece que Telemadrid esta menos mediatizada.
Algunos nos quejamos de todos y pensamos que las televisiones públicas deben desaparecer, que hace muchos años que el hedor es insoportable. Si no tenemos claro a estas alturas que es un incentivo perverso en sí mismo…
Claro… y lo dejamos todo en manos de las privadas, que por supuesto, no tienen sesgo alguno… madredeDioxs…
De Urdaci y Gonzalez Ferrari no nos acordamos, eh? XDDD
Todas tienen sesgo, pero que el Gobierno use medios públicos e indecentes cantidades de dinero de nuestros impuestos para atacar a sus adversarios y promocionarse a si mismo de manera cada vez más grosera y vergonzosa no tiene defensa alguna. Ya no hay nada que lo justifique. Nada. Y esto está salido de madre con todos. Porque sí, yo me acuerdo de todos
O quieres que cuando entren PP y VOX puedan hacer lo mismo o más que este gobierno con esos medios?
(es respuesta a yomismo) Ojala vox y el PP hicieran lo mismo que este gobierno con esos medios y no lo que hacen habitualmente.
Estaría genial ver en telemadrid, en tvg o en cualquier television autonomica con gobierno pepero telediarios menos sectarios que los que se emiten ya no en esas autonomicas sino en la privada antena 3, tertulias con políticos y periodistas de izquierdas como vemos en rtve con políticos y periodistas de derechas y que en programas de humor de esas cadenas contaran un monton de chistes sobre Alberto Quiron o M. Rajoy como en esa tan demonizada por la derecha la revuelta se hacen chistes sobre Abalos y Koldo.
Sí, Matt, sí, la televisión pública es un dechado de imparcialidad, sin que el gobierno la esté colonizando desde hace años y sin episodios vergonzosos como el congreso paralizado en el día de la DANA… excepto precisamente para poder seguir colonizándola
Una de las pocas cosas buenas que hicimos en Navarra es no crear una televisión pública.
Existe un canalillo privado parcialmente subvencionado y ya, eso es todo.
Hay a quien también le parecerá esto malo, pero lo curioso es que este sistema ha sobrevivido a gobiernos de todo signo, de derecha a izquierda incluso a gobiernos nazionalistas.
Y gracias a eso nos hemos ahorrado un buen dinero y nunca nadie se ha quejado de influencia política en dicho canal.
Así que sí, estoy a favor de que no haya televisiones públicas que suponen un gasto inasumible.
¿Quien ha dicho que TeleMadrid no sea una television oficial cuya información no deseen que se priorice en la búsqueda de las grandes plataformas?
Eso me preocupa lo mismo que si priorizan Telepedro o las autonómicas. Siempre han dado sesgada la información estos medios, pero Bruselas desea que se priorice frente a la información sesgada o no, que den los youtubers
¿Y Wikipedia? ¿cuánto tiempo tardarán en considerarla una mina? ¿Podrá la comunidad mantener limpia la wiki?
Nací en un distrito pobre en Panamá – Los Libertadores – en panamá el analfabetismo aún ruje y para el paro de la segunda guerra mundial solamente en Norte America existían 5 millones de analfabetos – esto es de arrastre – tengo 42 años – y mi abuela vivía con analfabetos – y mi mama aprendió lectura y escribir pero eso no es suficiente – la educación – la memoria – y los recursos son de otros – pero estos grupos de conversación online tienen varios fines – y claro la IA tienen sus agendas – igual como en todo negocio – yo prefiero leer y educarme y entender que hay cosas que leí y no eran buenas y cosas que leí y eran buenas – pero no pensare jamás que la IA y las comunidades online son para explotarnos – eso es tonto de mi parte – es mi opinión.
OT:
Hackers Expose Age-Verification Software Powering Surveillance Web
Si todo lo que tica Google se acaba convirtiendo en mierda, tal vez haya que asumir definitivamente que Google es una mierda, y que lo que ofrece no puede ser otra cosa que mierda, aunque sea gratis.
Y lo mismo diría de las RRSS.
No tengo muy claro cómo solucionarlo, pero esta es la realidad.
Al igual que en mi comentario anterior sobre las televisiones públicas, tal vez lo mejor sea no tenerlas o, mejor aún, cortar de raíz su sustento: prohibir la recopilación de datos personales y, por supuesto, su comercialización.
Y para las IA, prohibir la recopilación de información sin pagar por ella a sus responsables. Porque no, sr Dans, las IA no aprenden, sólo recopilan, reordenan y escupen de nuevo. Previo pago.