En plena discusión sobre el origen de los datos empleados para entrenar algoritmos generativos y los acuerdos económicos que permiten que una compañía dedicada al desarrollo de esos algoritmos pueda utilizar los datos generados por una página web, llega Google y da con la perfecta cuadratura del círculo: vincula el uso de los datos con la indexación, de manera que si decides bloquear al bot de inteligencia artificial del gigante de las búsquedas, estarás en la práctica cometiendo un SEOcidio, es decir, impidiendo también la entrada al bot que te indexa, con lo que perderás visibilidad y tráfico. Básicamente, no te encontrará nadie.

El movimiento llega en un momento en el que la gran mayoría de las compañías de desarrollo de algoritmos generativos están optando por llegar a acuerdos más o menos exclusivos con grandes repositorios de datos, sobre todo de aquellos con cierto marchamo de calidad y sometidos a actualización constante. Agencias de prensa, periódicos, páginas participativas y, básicamente, todo aquel que genera datos con cierta regularidad están cerrando sus páginas a los crawlers dedicados a recopilarlos… salvo Google. A Google le llega con mirarte con mala cara, decir eso de «no nos haremos daño, ¿no?» y conminarte a que le dejes utilizar los datos de tu página si no quieres que ésta se hunda en los bajos fondos del buscador, allí donde nadie la va a encontrar.

Google es la mayor fuente de tráfico de muchísimas páginas. Mucho de ese tráfico se corresponde simplemente con usuarios con muy poca cultura internet que confunden la caja de búsqueda con la barra del navegador y teclean directamente en ella, pero aún así, nadie que valore su tráfico se arriesga a entrar en trifulcas con quien tiene la llave de su visibilidad en la web. Según los editores, la herramienta que rastrea los sitios web para producir sus respuestas de inteligencia artificial es la misma que realiza el seguimiento de las páginas web para incluirlas en los resultados de búsqueda, por lo que bloquear la inteligencia artificial obstaculiza la capacidad de ser descubierto de una página.

Resulta curioso que Google haya optado por una estrategia tan enormemente agresiva precisamente en el momento en que se discute su naturaleza de competidor monopolístico, cuando acaba de perder ese primer juicio y se dispone a afrontar otro más. Ese comportamiento de vinculación o apalancamiento de un producto utilizando el éxito de otro es precisamente algo que las autoridades antimonopolio suelen encuadrar como completamente anticompetitivo, básicamente lo que llamaríamos «un caso de libro». Pero sobre todo, es una forma de demostrar a los jueces que ese tipo de comportamientos están en la naturaleza de la compañía, y que los ve como algo completamente normal.

Obviamente, lo que está haciendo Google es obtener un beneficio derivado de su condición de líder absoluto en la búsqueda para intentar cristalizar gracias a ello un liderazgo en el desarrollo de algoritmos generativos. Ya veremos cómo evoluciona este tema, pero por lo de ahora, una cosa está clara: pocos van a arriesgarse a negar al bot de inteligencia artificial de Google el acceso a sus datos, si el precio a pagar por ello es caer en el ostracismo digital.

This article is also available in English in my Medium page, «Google and the nature of the beast«