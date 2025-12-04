Mientras muchos gobiernos se obsesionan con tener «su propio modelo de inteligencia artificial«, la mayoría de las empresas siguen creyendo que basta con tomar un modelo en inglés, traducir su output y dar por resuelto el problema.

Esa ilusión de universalidad está empezando a romperse por todas partes. Arabia Saudí sueña con convertirse en exportador de tokens del mismo modo que exporta petróleo, como explicaba recientemente The Economist, y no es casual: en un mundo en el que la inteligencia artificial depende de enormes infraestructuras eléctricas, la geopolítica del cómputo se parece cada vez más a la vieja geopolítica de la energía. La electricidad barata y abundante es el nuevo petróleo, y los centros de datos, las nuevas refinerías. Pero incluso si uno dispone de esa infraestructura, falta algo más profundo: la cultura.

La cuestión no es ya si cada país necesita «su propio modelo», sino si puede permitirse no tenerlo cuando lo que está en juego es su capacidad de expresarse en su propia lengua sin pagar un sobrecoste por ello. Muchos modelos están entrenados con corpus abrumadoramente anglófonos, lo que implica un sesgo técnico y cultural que se traduce en mayores costes de procesamiento, peor rendimiento y resultados desfasados para quienes no viven dentro del marco mental de Silicon Valley.

Como comentaba en un artículo reciente para Fast Company, titulado «Can your AI adapt to multiple cultures?», las empresas estadounidenses que intentan desembarcar en Asia, Oriente Medio o África descubren que sus modelos «globales» no entienden realmente esos mercados: no hablan su lengua, y no me refiero a la gramática, sino al contexto. Un estudio muestra que los idiomas morfológicamente complejos pueden requerir entre tres y cinco veces más tokens que el inglés para expresar el mismo contenido, lo que dispara los costes y empeora la experiencia. Otro informe señala que 1,500 millones de personas que hablan lenguas escasamente representadas quedan automáticamente relegadas a un margen de peor rendimiento y mayor coste computacional. Traducir no es suficiente: traducir es, en realidad, someterse.

Por eso surgen modelos como Saba, de la francesa Mistral AI, que se atreve a cuestionar el dogma del «cuanto más grande, mejor». Saba es pequeño para los estándares actuales, pero está afinado para árabe y para lenguas del sur de Asia, y según la propia compañía supera a modelos cinco veces mayores en las tareas locales para las que fue diseñado. Su peor rendimiento en inglés no es un fallo: es una declaración de intenciones. Los modelos con identidad lingüística propia están destinados a proliferar, porque el contexto pesa más que el tamaño. Igual que nadie pretende que un traductor automático capture el significado de un poema sin conocer su cultura, tampoco deberíamos exigir a un modelo anglófono que entienda la India, el Golfo o el sudeste asiático con un simple fine-tuning cosmético.

El problema es que esta brecha no afecta solo a empresas o gobiernos lejanos: nos afecta a todos. Cada vez que un ciudadano, una administración pública o una compañía utiliza un modelo extranjero anglófono para resolver un problema local, está externalizando no solo su factura tecnológica, que crecerá a medida que los idiomas minoritarios sigan atrapados en sistemas de codificación ineficientes, sino también parte de su soberanía cultural. ¿Qué ocurre cuando la manera en que una sociedad se define a sí misma depende de cómo un modelo extranjero decide tokenizar sus palabras, priorizar sus sentidos o interpretar sus referencias? ¿Qué pasa cuando cada frase en gallego, catalán, euskera o español cuesta más que su equivalente en inglés? Lo que empieza siendo un detalle técnico termina convirtiéndose en un vector de dependencia.

A eso se añade un dilema político que muchos gobiernos no se atreven a formular: si la inteligencia artificial es la infraestructura cognitiva del futuro, ¿puede un país realmente renunciar a tener una mínima autonomía sobre ella? El Reino Unido, como recuerda The Economist, parece haber optado por una estrategia de no competir: deja que Estados Unidos y China se peleen por la cima mientras se concentra en regular y atraer talento. ¿Es una muestra de sensatez dado que el idioma es común con los Estados Unidos, o una capitulación? Quizá ambas cosas. Entrenar un modelo de frontera cuesta miles de millones, y la mayoría de los países no tienen tamaño, datos ni recursos para justificar esa inversión. Pero tampoco pueden aceptar sin más que su lengua, su cultura y su aparato institucional dependan de proveedores extranjeros cuyo objetivo es maximizar beneficios, no preservar identidades.

Ese es el nudo de la nueva soberanía digital: no se trata únicamente de poder computacional, sino de no perder la capacidad de pensar en tu propio idioma sin pagar un peaje. No se trata de competir con Estados Unidos o China, sino de garantizar que tu país, tu empresa o tu comunidad no quedan atrapados en una infraestructura que no fue diseñada para ellos. Como expliqué en mi artículo sobre el code-switching cultural en la inteligencia artificial, el riesgo no es solo la ineficiencia técnica, sino la irrelevancia contextual. Una inteligencia artificial que no entiende tu mercado, tu normativa, tus referencias, tus festividades o tus tabúes no es una inteligencia artificial «mejor» o «peor»: es una inteligencia artificial que no es tuya.

Pero hay algo aún más inquietante: la inteligencia artificial anglocéntrica no solo traduce mal, sino que además normaliza. Impone patrones estadísticos que deciden, sin deliberación humana, qué expresiones son naturales, qué ideas son válidas y qué formas de pensar merecen aparecer. Si un país delega su infraestructura cognitiva en modelos extranjeros, estará delegando también parte de su narrativa. Y una cultura que renuncia a contar su propia historia termina siendo reescrita por otros.

La pregunta, entonces, no es si deberíamos aspirar a «modelos nacionales», sino si podemos permitirnos no hacerlo. Cada palabra genera un coste, cada coste configura un incentivo, cada incentivo moldea una dependencia. En la economía industrial del siglo XX, el petróleo dividía el mundo entre productores y consumidores. En la economía cognitiva del XXI, la división será entre quienes producen tokens en su propio idioma y quienes tienen que comprarlos al precio que marque otro, que además, controlará la narrativa.

La soberanía de la inteligencia artificial no es un capricho tecnológico ni un ejercicio de orgullo nacional: es un recordatorio de que, si no controlas los modelos que hablan por ti, no controlas el futuro en el que te tocará vivir.