La ilusión de la soberanía digital: los datos como nueva forma de colonialismo tecnológico

IMAGE: A dark, geometric maze featuring subtle tech company logos like Meta, Apple, Google, and Reddit, symbolizing the open internet being trapped inside corporate walls

El concepto de soberanía digital, la idea de que una región o un país puede controlar sus propios datos, su infraestructura y sus plataformas, empieza a resquebrajarse cada vez más. En un entorno donde los datos ya valen más que los territorios, el verdadero poder ya no se ejerce mediante fronteras, sino mediante APIs, modelos de lenguaje y acuerdos de licencia.

Lo que se perfila no es un mundo de estados soberanos, sino un mapa de dependencias invisibles donde unos pocos actores tecnológicos pretenden decidir cómo se genera, circula y monetiza la información.

El caso de Reddit contra Perplexity AI lo resume con precisión. En octubre de 2025, Reddit presentó una demanda acusando a varias empresas de usar su contenido para entrenar modelos de inteligencia artificial a gran escala sin autorización. Y lo que parecía una simple disputa legal sobre licencias es, en realidad, una guerra por el control del conocimiento. Mike Masnick, fundador de Techdirt, lo definió claramente: «la demanda de Reddit no es una defensa de los usuarios ni de los creadores, sino un ataque directo a la arquitectura abierta que ha hecho posible todo lo que conocemos como Internet».

Porque lo esencial aquí, desde mi punto de vista, es entender que ninguna de estas compañías «posee» esos datos que reclama como suyos. Reddit vive del contenido que producen gratuitamente sus usuarios: comentarios, debates, publicaciones y conocimiento compartido. Esos datos no le pertenecen, no son propiedad de Reddit, sino de las personas que los generaron. En el mismo sentido, Google no «posee» los datos que indexa, y Meta, por mucho que lo pretenda, no «posee» las fotos, mensajes o pensamientos que sus usuarios publican. La web se construyó sobre una premisa sencilla y poderosa: los datos son de quienes los crean, y su valor nace del intercambio abierto, no de su encierro tras muros corporativos amparados por términos de servicio absurdos que nadie se lee jamás.

Por eso resulta tan absurdo y tan peligroso este nuevo celo de las plataformas por privatizar el acceso a unos datos que, en realidad, no les pertenecen. Pretenden convertirse en intermediarios obligatorios del conocimiento, cobrando a terceros por el uso de información que fue libremente compartida por individuos o comunidades. Lo que antes era un ecosistema de colaboración se transforma en un modelo de extracción y peaje. Masnick lo resume así: si permitimos que compañías como Reddit impongan tarifas por acceder a datos públicos, estaremos destruyendo el Internet abierto y reemplazándolo por un sistema de jardines vallados, donde cada plataforma decide quién puede mirar, quién puede construir y a qué precio. Y todo ello sobre unos datos que no son suyos, que simplemente se han apropiado porque los produjimos en su plataforma. El salón de mi casa puede ser una plataforma para buenas conversaciones con mis amigos, pero no pretendo que sus ideas me pertenezcan, ni tomar decisiones sobre quiénes pueden acceder a ellas.

El caso Reddit-Perplexity es solo la punta visible de un problema mucho más amplio: la transformación de los datos en instrumento de poder. Vivimos «una nueva fiebre del oro«, donde las empresas extraen información como antaño se extraía petróleo o carbón. Solo que, en este caso, ni siquiera son ellas las que la producen: los usuarios generan los datos, las plataformas los almacenan y se los apropian, y ahora pretenden vender su acceso como si hubieran sido ellos los que han creado algo propio. Pretender que los datos que están en Facebook o en Instagram pertenecen a Meta es una aberración absurda, como lo es el que los datos creados por usuarios en hilos de Reddit pertenezcan a Reddit o los contenidos en las páginas de resultados de Google pertenezcan a Google. Perdona, pero almacenar o indexar no te da derecho a poseer lo que no has generado.

El problema no es el scraping ni la inteligencia artificial: el problema es el secuestro del bien común. Cuando una empresa dice «estos datos son míos», en realidad está diciendo «estos datos no son tuyos, págame a mí por acceder a ellos», y en esa apropiación se borra la esencia misma de internet como bien público. Los datos no son minas que se explotan, sino caminos que se comparten. Son conocimiento, y el conocimiento, por definición, se multiplica cuanto más circula.

Incluso los gobiernos que intentan proteger sus ecosistemas digitales caen en la trampa de la retórica. El CEO de Ericsson advertía recientemente que Europa regula más que nunca, pero innova menos, y corre el riesgo de quedarse atrapada entre la ética y la irrelevancia, convertida en un museo. Pero regular el flujo de datos no sirve de nada si dejamos que su propiedad siga concentrada en manos de los intermediarios que se los apropian, y que incluso toman decisiones conscientes para bloquearlos e impedir que otros puedan acceder a ellos. La soberanía digital no se ejerce mediante normas, sino mediante infraestructura, interoperabilidad y una cultura de apertura real.

Wired lo ha descrito como la evolución del «capitalismo de plataforma» hacia el «capitalismo de modelos», donde el recurso estratégico ya no es el usuario, sino el conjunto de datos que genera y su capacidad para entrenar sistemas cerrados. Si aceptamos que los datos, que nacen del esfuerzo colectivo, pueden ser privatizados por quienes gestionan las plataformas, habremos institucionalizado la mayor apropiación de valor de la historia.

La soberanía digital, en este contexto, no se define por la ubicación de los servidores ni por los logos de los reguladores, sino por la capacidad real de los ciudadanos para decidir cómo se produce y se comparte el conocimiento. Cuando esa capacidad desaparece, lo demás, desde la ética, la gobernanza o el discurso político, es puro teatro.

El litigio entre Reddit y Perplexity no es una anécdota judicial: es un síntoma cultural. Internet nació abierta y colaborativa, pero está mutando en una red de intereses que confunden propiedad con control y comunidad con producto. Ninguna de estas empresas «posee», en realidad, los datos que intenta monopolizar. Son nuestros. Y deberíamos recordárselo cada vez que alguien intente cobrarnos por mirar lo que, en realidad, siempre nos ha pertenecido.

You can read this article in English on my Medium page, «Your data is not yours: how Big Tech is trying to steal the internet«

#001
Xaquín - 25 octubre 2025 - 15:31
Cuando la primera plana de un periódico en papel (o portada de revista) cae en la acera, esté lloviendo o no, deja de pertenecer, lo que en ella se ve, a la cabecera de ese periódico… pagaran lo que pagaran por ella… Y yo puedo fotografiar esa portada (o una parte de ella) y esa imagen me pertenece a mí… y si la cuelgo en internet , modificada o no, la estoy tirando en una acera virtual, para que la pueda tomar cualquier usuario de internet… porque así son las calles virtuales!!!
Esta ley de la propiedad intelectual que no se quiere asumir, vale también para un ejemplar del último Planeta, que acabe tirado en la calle (y sí, va con segundas muy cargadito de prejuicios)… aunque los grandes propietarios de las ideas humanas lo impidan con su lobbysmo.
Y sí, esto solo vale para la imagen virtual (conjunto de bits) de una imagen analógica (real o fijada en la primera plana de un periódico… o en la pared de un museo). El resto me la suda…
#002
Idealista - 25 octubre 2025 - 18:32
Perfecto. Entonces siguiendo el argumento de que los datos no son de las plataformas sino de los usuarios o creadores, nosotros deberíamos poder decidir qué se hace con ellos y cómo se usan. Y esas empresas, Perplexity, OpenAi o todas las demás no están pidiendo permiso a nadie (o muy poco) para usar esos datos, entrenar sus modelos y vendernos servicios de pago basados en el uso de esos datos.
Quiero decir, Perplexity se queja de un principio muy parecido al que luego ejerce.
#003
Buzzword - 25 octubre 2025 - 18:44
Dices literalmente
» Esos datos no le pertenecen, no son propiedad de X, sino de las personas que los generaron»
¿De verdad?
Te pongo un ejemplo sencillo… Los comentarios que hago en este blog ¿son mios? Si no los puedo editar, si no los puedo borrar… poco dueño me puedo creer.
Si eso pasa en este blog, que frente a gigantes como google o facebook, sin ánimo de ofender eres un «mindundi»,.. que sucede con lo que subo a esas plataformas….
Esas plataformas podríamos decir que te dan la oportunidad en algún lado de modificar o borrar, otra cosa es que yo me lo crea.
¿puedo editar o no mostrar por ejemplo lo que un troll inserta?
«La web se construyó sobre una premisa sencilla y poderosa: los datos son de quienes los crean, y su valor nace del intercambio abierto, no de su encierro tras muros corporativos amparados por términos de servicio absurdos que nadie se lee jamás.»
PS: Consejos vendo que para mi no tengo
- Enrique Dans - 25 octubre 2025 - 19:19
  ¡PUES PRECISAMENTE!! ¡Me estás dando la razón! ¿Acaso me ves cerrándolos, quedándomelos o impidiendo a alguien leerlos? Lo de poderlos editar o borrar es relativo: no puedes porque no tengo una herramienta adecuada para permitirlo y porque se podría liar un carajal importante si cambias lo que dijiste en un comentario al principio de una discusión cuando ésta ya está avanzada, pero es una puñetera limitación técnica (aparte de que puedes editar o borrar un comentario simplemente pidiéndomelo a mí). Pero en modo alguno pretendo que los comentarios de este blog me pertenezcan: no los cierro a nadie, no los uso para nada más que para ayudarme a formar mi opinión, y no vendo a nadie el acceso a ellos. ¿Es mucho pedir que las malditas big tech hagan lo mismo?
  Los comentarios que pones «en internet» son «de internet», y pretender privatizarlos es un sindiós…
  - Buzzword - 25 octubre 2025 - 22:03
    Al final, el medio no solo transmite el mensaje… lo moldea, lo retuerce, lo convierte en algo que ya no podemos separar de su forma. Y en ese juego, a veces olvidamos que no todo puede ser enviado sin perder su esencia. Pero es lo que hay… en eso te doy la razón.
    Lo único que realmente poseemos son los silencios. Hay quienes, pobres de entendimiento, confunden la ausencia de respuesta con una deuda pendiente y son esclavos de sus palabras… y como no conocen la libertad de callar, de no conceder espacio al ruido… claro y preciso. Esa falta de comprensión cognitiva, ven pero no saben mirar, el verdadero sentido siempre está entre líneas. Otras sin embargo hay que iluminar esa ceguera con evidencias con la mano abierta. Dificil pero sería un avance poder enviar rmn ocasiones un rotundo silencio.
  - Lua - 26 octubre 2025 - 09:21
    Me perdonaras, pero la afirmación de Buzz, es correcta. Una vez le hemos dado a “ENVIAR”, el comentario ya no nos pertenece. Ni aquí, ni en ningún lado. Porque ya no tenemos “poder” sobre él.
    No habría dificultad técnica para el caso de una rectificación. Hay cientos de plugins en los que puedes definir un tiempo de editado, generalmente los cinco primeros minutos. Si has hecho un cambio en ese tiempo, aparece la etiqueta “editado en fecha/hora”. Pasado ese límite, el comentario se queda como esta. Que tu tengas a bien, que cuando te lo pidamos, hagas cambios (e incluso en ocasiones, sin que te lo pidamos, porque a mi me lo has hecho a veces), es una deferencia tuya hacia nosotros que se agradece. Pero bastante te damos polculo como para encima estar todo el día dándote la murga con la edición XDDD (incluso con algún plugin, puedes nombrar a usuarios de tu confianza, para que moderen los trolleos)
    Y aunque estemos de acuerdo, que tu no comercias con nuestros datos (que tampoco te damos tantos), lo que no puedes evitar, a menos que no pongas el blog en modo privado y con registro previo de usuarios, es que buscadores y scrappers de IA, se chupen todo lo que decimos aquí a diario. Involuntariamente, eres un eslabón mas de la cadena :P
    Así, que los usuarios tenemos dos opciones: escribir y apechugar con las consecuencias, o ponernos lurkers…
    - Buzzword - 26 octubre 2025 - 10:26
      Bastante interesante el enlace. Con el tema que nos ocupa (privacidad e IA) creo que pasa que igual que hay capacidades dispersas hay sensibilidades dispersas. Lo que les molesta a unos les encanta a otros.. El ser humano es «asín»
      Como dice la famosa frase «que la realidad no estropee un buen titular». En este caso el título se corresponde con el fondo. En si mismo demuestra un punto de vista muy dudoso en un manifiesto sesgo. Leamoslo :
      «… los datos como nueva forma de colonialismo tecnológico… »
      Es decir, hay una crítica a que alguien, que sea una Big Tech te haga un scraping de los datos. Y se pone como ejemplo a Reddit que vendió su database( a google), y se critica(con justicia a mi parecer) a los bucaneros de perpelexity por hacer scrapping… ¿Es malo si lo hace una big tech y si lo hacen una IA abierta?
      ¿Es malo usar datos que se han publicado?
      ¿Y poner publi es malo?
      ¿O monetizar p.ej. videos?
      ¿Que es si no eluedir la crítica a ciertas marcas y ensalzar a otras?
      Actos que vemos continuamente…
      Y más dudas razonables, que por brevedad omito.
      Es obvio que, la sensibilidad va por barrios,
      – alguien se ofende por hablar de política en este blog
      – pero no nos tenemos que ofender por apologías al fascismo
      – alguien se siente insultado por ser ninguneado por no ponerte a su nivel.
      – Por ejemplo: El que alguien scrapee este blog, en si no me molesta,
      de hecho google indexa las webs con la excusa que es para su buscador hace años. El indexado es otro fin muy similar al de las IA. Tener un gran dataset sin pagar. La única diferencia es que uno parece más útil que el otro.
      Y en cuanto a no poder eliminar comentarios… creo que es obvio que no se va a poner. Por la razón que sea. No entro en esos motivos, que igual hasta puedo entender. (resumido el ajo y agua no haber escrito)
      Pero claro luego si mi sensibilidad me obliga a tomar contramedidas a lo que considero un ataque, y puede ser responder dentro del tono de no insulto. Pero claro, hay efectos colaterales, que cuando alguien consulte «EL BLOG» y vea un montón de réplicas al «TROLL», pues la verdad si yo fuera el OWNER me parecería basura, sobrevenida, pero basura sintétizada, que expresa algo como los LIKES en una RRSS una sensibilidad, pero eso sicon más cariño. En evolución humana, es «adptación al medio». Evidentemente no dice nada en mi favor la contramedida, y dado que no cunde más efecto que evidenciarlo, pues ceso en ella.
      - Lua - 26 octubre 2025 - 11:34
        La medida mas efectiva es el sabido ”Don’t feed the TROLL”
        Basta con dejarle ahí solo con sus chorradas, aunque en ocasiones se antoja difícil no caer en sus provocaciones.
        Quizás, alguna medida adicional, sería el empleo de otro plugin, de los de ”Like/Dislike” en cada comentario. Provocaría la vergüenza ajena (o no, que los Trolls están inmunizados), y quizás, solo quizás, se darían cuenta de lo muy molestos que son y del inmenso ridículo que hacen en ocasiones, como ya hemos visto estas líneas últimamente. Además serviría de “termómetro” de calidad de comentarios.
#009
Benji - 25 octubre 2025 - 18:58
Se pondrá las botas el que cree un símil de Reddit/Mediumn pero que pague a los usuarios una parte de lo que los entrenamientos de IA le paguen a ellos por los contenidos.
Y para que demuestren que lo escribieron ellos, se deberá escribir en la misma plataforma todo de una forma cerrada que no permita copiar+pegar so pena de que lo lo que se copia+pega pase a ser gratuito porque no se puede demostrar su origen.
Me faltan contactos con la que hablar de ideas, haha
#010
Gorki - 25 octubre 2025 - 19:10
Cuando, (por ejemplo), escribes en Reddit, cedes tus derechos sobre unos datos a Reddit , con la esperanza que los publique, (salvo que ellos no quieran y los «censure»). Desde ese momento Reddit , (que además no te cobra por el servicio), hará lo que crea oportuno para monetizar el servicio, como puede se ser:
Publicidad dirigida. Crean perfiles psicológicos y de consumo basados en tu comportamiento para mostrarte anuncios personalizados, lo que aumenta la efectividad de las campañas.
Análisis de mercado y desarrollo de producto. Detectar tendencias o intereses comunes a partir de grandes volúmenes de datos de usuarios.
Recomendaciones personalizadas. Indicar contenidos, personas o grupos basados en tus intereses y conexiones.
Venta o intercambio con terceros- Compartir ciertos datos con anunciantes, desarrolladores o empresas asociadas, en ocasiones incluso fuera de la red social donde se generaron.
.
Mantener que los datos que introdujiste, (por ejemplo), en Reddit son tuyos, es no ser consciente de la realidad. Como indica acertadamente Buzzword, ni los puedes borrar, ni modificar,…. ni monetizar, algo que si puede hacer el lugar donde los introduces.
- JM - 25 octubre 2025 - 20:19
  Estás haciendo lo que hace la mayoría de la gente, que es confundir los derechos de comercialización, que se ha auto-otorgado Reddit (se supone que no iba a ser una plataforma comercial) con los derechos de autor que son siempre del autor.
  De todas formas esto de las condiciones de uso de las plataformas es muy gracioso, porque pueden poner que donaras los órganos de tu primogénito pero si no es legal no deja de ser papel mojado.
  - Gorki - 25 octubre 2025 - 21:39
    ¿Con los derechos de autor?
    Según creo, los derechos de autor protegen textos originales de tipo literario, científico o artístico, como libros, artículos, guiones, y obras de teatro y sus traducciones y adaptaciones y obras como composiciones musicales, obras audiovisuales, fotografías, programas de ordenador y diseños arquitectónicos, siempre que sean creaciones originales.
    Lo que has escrito en Reddit no pertenece a ninguna categoría de las indicadas y además no lo llevaste a la SGAE para que certifique tu autoría, difícilmente podrías demostrar que es tuyo y que escribiste no es copia de otro sitio.
#013
Matt - 25 octubre 2025 - 20:51
Vale, pues comos los datos son míos me niego a que Perplexity, OpenAI y compañia los utilizen para entrenar sus modelos.
- Gorki - 26 octubre 2025 - 00:27
  ¡¡¡ Si Señor !!!. Eres autor de tus datos digitales, que la SGAE defienda tus derechos
#015
Lua - 26 octubre 2025 - 08:58
Acabo de leer un buen artículo relacionado…:
– Mientras uno pueda vender datos personales siempre va a haber la tentación de recolectar más de los necesarios y de venderlos al mejor postor. Otra cuestión que siento que la ley no reconoce suficientemente es la responsabilidad moral que supone convertir algo en datos. Se habla mucho de recolección de datos, como si fueran algo que está allá afuera, como setas en el bosque. Pero cuando se recolectan es que se transforma algo que no era un dato y esa decisión es moralmente significativa, porque los datos personales son muy sensibles, muy difíciles de proteger, y hay mucha gente que los quiere para abusar de ellos; por ejemplo, criminales, gobiernos adversarios, y por supuesto agencias de marketing, campañas políticas.
– Lo que la gente no tiene en cuenta es que los datos personales tienen una fecha de caducidad bastante corta, o suelen tenerla: la gente cambia de gustos, se enferma, se cura, cambia de casa, de trabajo, y eso quiere decir que los datos más valiosos y más importantes de proteger son los que generas ahora.
«No es coincidencia que esta pérdida de democracia se dé al mismo tiempo que el auge de la tecnología digital»
- Lua - 26 octubre 2025 - 10:45
  Os dejo otro:
  Pedro Mujica, ingeniero computacional: “El capitalismo ha fracasado, ahora vivimos en el tecnofeudalismo: las grandes corporaciones nos tratan como vasallos digitales”
  - Greg - 26 octubre 2025 - 12:40
    Me lo quitaste del teclado Lua ☺️
    - Lua - 26 octubre 2025 - 13:46
      Lo importante no es quien lo escriba, si no quien se digne a leerlo… XDD
#019
Javier bilbao - 26 octubre 2025 - 10:41
Si la plataforma es de ellos y yo comparto allí, entiendo que puedan pensar que los datos ya son suyos. Si no nos gusta NO tienes porque usarlas, no es obligatorio.
Si voy al salon de tu, tu pones las reglas. Lo veo bien.
#020
Abel - 26 octubre 2025 - 11:03
No lo entiendo.
Internet es abierta, colaborativa y pública. Lo que está en internet “pertenece a internet”…
PERO
Queremos soberanía digital, son nuestros datos y deberíamos tener derecho a decidir cómo se comparten esos datos…
¿No es contradictorio?
P. D.: creo que el concepto de soberanía murió hace muchos años. Ningún país o región podría vivir por sí misma, salvo quizá China ahora mismo.
#021
Alqvimista - 26 octubre 2025 - 11:50
¿Pero esto no ha pasado toda la vida? Esta es una discusión vieja y, creía, ya superada.
Desde que se vendió el primer Foro o el primer Blog hace décadas quedó claro que quien monetizaría ese contenido no sería quien lo creó sino quien lo alojó en su plataforma.
No es que esté completamente de acuerdo, pero siempre ha sido así, y preocuparnos/escandalizarnos ahora me recuerda al Capitán Louis Renault exclamando “¡Estoy sorprendido! Me sorprende descubrir que en este local se juega.”
#022
Dedo-en-la-llaga - 26 octubre 2025 - 21:31
¿Ya nadie se acuerda?
https://www.xataka.com/servicios/redes-sociales-nos-dejaron-trabajar-gratis-para-ellas-ahora-nos-quieren-cobrar-hacerlo