Mientras muchos gobiernos se obsesionan con tener «su propio modelo de inteligencia artificial«, la mayoría de las empresas siguen creyendo que basta con tomar un modelo en inglés, traducir su output y dar por resuelto el problema.
Esa ilusión de universalidad está empezando a romperse por todas partes. Arabia Saudí sueña con convertirse en exportador de tokens del mismo modo que exporta petróleo, como explicaba recientemente The Economist, y no es casual: en un mundo en el que la inteligencia artificial depende de enormes infraestructuras eléctricas, la geopolítica del cómputo se parece cada vez más a la vieja geopolítica de la energía. La electricidad barata y abundante es el nuevo petróleo, y los centros de datos, las nuevas refinerías. Pero incluso si uno dispone de esa infraestructura, falta algo más profundo: la cultura.
La cuestión no es ya si cada país necesita «su propio modelo», sino si puede permitirse no tenerlo cuando lo que está en juego es su capacidad de expresarse en su propia lengua sin pagar un sobrecoste por ello. Muchos modelos están entrenados con corpus abrumadoramente anglófonos, lo que implica un sesgo técnico y cultural que se traduce en mayores costes de procesamiento, peor rendimiento y resultados desfasados para quienes no viven dentro del marco mental de Silicon Valley.
Como comentaba en un artículo reciente para Fast Company, titulado «Can your AI adapt to multiple cultures?», las empresas estadounidenses que intentan desembarcar en Asia, Oriente Medio o África descubren que sus modelos «globales» no entienden realmente esos mercados: no hablan su lengua, y no me refiero a la gramática, sino al contexto. Un estudio muestra que los idiomas morfológicamente complejos pueden requerir entre tres y cinco veces más tokens que el inglés para expresar el mismo contenido, lo que dispara los costes y empeora la experiencia. Otro informe señala que 1,500 millones de personas que hablan lenguas escasamente representadas quedan automáticamente relegadas a un margen de peor rendimiento y mayor coste computacional. Traducir no es suficiente: traducir es, en realidad, someterse.
Por eso surgen modelos como Saba, de la francesa Mistral AI, que se atreve a cuestionar el dogma del «cuanto más grande, mejor». Saba es pequeño para los estándares actuales, pero está afinado para árabe y para lenguas del sur de Asia, y según la propia compañía supera a modelos cinco veces mayores en las tareas locales para las que fue diseñado. Su peor rendimiento en inglés no es un fallo: es una declaración de intenciones. Los modelos con identidad lingüística propia están destinados a proliferar, porque el contexto pesa más que el tamaño. Igual que nadie pretende que un traductor automático capture el significado de un poema sin conocer su cultura, tampoco deberíamos exigir a un modelo anglófono que entienda la India, el Golfo o el sudeste asiático con un simple fine-tuning cosmético.
El problema es que esta brecha no afecta solo a empresas o gobiernos lejanos: nos afecta a todos. Cada vez que un ciudadano, una administración pública o una compañía utiliza un modelo extranjero anglófono para resolver un problema local, está externalizando no solo su factura tecnológica, que crecerá a medida que los idiomas minoritarios sigan atrapados en sistemas de codificación ineficientes, sino también parte de su soberanía cultural. ¿Qué ocurre cuando la manera en que una sociedad se define a sí misma depende de cómo un modelo extranjero decide tokenizar sus palabras, priorizar sus sentidos o interpretar sus referencias? ¿Qué pasa cuando cada frase en gallego, catalán, euskera o español cuesta más que su equivalente en inglés? Lo que empieza siendo un detalle técnico termina convirtiéndose en un vector de dependencia.
A eso se añade un dilema político que muchos gobiernos no se atreven a formular: si la inteligencia artificial es la infraestructura cognitiva del futuro, ¿puede un país realmente renunciar a tener una mínima autonomía sobre ella? El Reino Unido, como recuerda The Economist, parece haber optado por una estrategia de no competir: deja que Estados Unidos y China se peleen por la cima mientras se concentra en regular y atraer talento. ¿Es una muestra de sensatez dado que el idioma es común con los Estados Unidos, o una capitulación? Quizá ambas cosas. Entrenar un modelo de frontera cuesta miles de millones, y la mayoría de los países no tienen tamaño, datos ni recursos para justificar esa inversión. Pero tampoco pueden aceptar sin más que su lengua, su cultura y su aparato institucional dependan de proveedores extranjeros cuyo objetivo es maximizar beneficios, no preservar identidades.
Ese es el nudo de la nueva soberanía digital: no se trata únicamente de poder computacional, sino de no perder la capacidad de pensar en tu propio idioma sin pagar un peaje. No se trata de competir con Estados Unidos o China, sino de garantizar que tu país, tu empresa o tu comunidad no quedan atrapados en una infraestructura que no fue diseñada para ellos. Como expliqué en mi artículo sobre el code-switching cultural en la inteligencia artificial, el riesgo no es solo la ineficiencia técnica, sino la irrelevancia contextual. Una inteligencia artificial que no entiende tu mercado, tu normativa, tus referencias, tus festividades o tus tabúes no es una inteligencia artificial «mejor» o «peor»: es una inteligencia artificial que no es tuya.
Pero hay algo aún más inquietante: la inteligencia artificial anglocéntrica no solo traduce mal, sino que además normaliza. Impone patrones estadísticos que deciden, sin deliberación humana, qué expresiones son naturales, qué ideas son válidas y qué formas de pensar merecen aparecer. Si un país delega su infraestructura cognitiva en modelos extranjeros, estará delegando también parte de su narrativa. Y una cultura que renuncia a contar su propia historia termina siendo reescrita por otros.
La pregunta, entonces, no es si deberíamos aspirar a «modelos nacionales», sino si podemos permitirnos no hacerlo. Cada palabra genera un coste, cada coste configura un incentivo, cada incentivo moldea una dependencia. En la economía industrial del siglo XX, el petróleo dividía el mundo entre productores y consumidores. En la economía cognitiva del XXI, la división será entre quienes producen tokens en su propio idioma y quienes tienen que comprarlos al precio que marque otro, que además, controlará la narrativa.
La soberanía de la inteligencia artificial no es un capricho tecnológico ni un ejercicio de orgullo nacional: es un recordatorio de que, si no controlas los modelos que hablan por ti, no controlas el futuro en el que te tocará vivir.
Realmente a mi no me preocupa tanto la incapacidad técnica de una AI para comprender un idioma no «nativo» e incluso, el «contexto territorial», como los sesgos intencionados que les introducen sus dueños para «orientar» política y moralmente las respuestas.
He detectado unos sesgos «woke» en ChatGPT alarmantes.
Si quieres probar sesgos del lado opuesto, prueba con Grok :-)
Ninguna herramienta sera superior a sus fuentes o algoritmos
Lo que me preocupa, es que el «dueño» de a AI, tenga la posibilidad de mediatizar a su gusto las respuestas que da la IA. Igual me molesta que lo haga la China que el Vaticano. Creo que el no poderte fiar de las respuestas coarta la utilidad del invento.
Ya…. pero te has quejado de esto: «He detectado unos sesgos «woke» en ChatGPT alarmantes»
El plumero… Gorki… el plumero… XDDD
Gorki,
Así no se hacen las cosas. No se lanza la pedrada sin más. Aporta datos de porque tendríamos que usar Chatgpt por ser una IA progresista (woke) ???
Ojalá pero no le veo el menor atisbo, a Samuel que cuando Trump aparece en escena, se pone a mover el rabito, y que es una de las empresas que aportó fondos a la para el acto de inauguración del presidente electo. Y más ahora con el proyecto Génesis.
Lo dicho aporta datos y no difundas paridas «naberas» que eres muy dado a ello.
Gorki, deberías leer el artículo de la BBC titulado «Quería que ChatGPT me ayudara. Entonces, ¿por qué me aconsejó cómo suicidarme?» que muestra una faceta de ChatGPT que no es precisamente la que tú estás diciendo. Al final, lo que uno aspiraría es que estos modelos se comportaran de manera ejemplar, aunque para ello sería necesario que los humanos entendamos que la bondad no es patrimonio de nuestra tendencia política preferida.
Gepeto siempre ayuda pero no le entendeis… XDD
Añado:
1) Deberíamos tener un LLM especializado en consultas médicas, creado por el estado y que garantice el anonimato absoluto y la destrucción de los tokens en tiempo muy breve. Esto ayudaría a desatascar el servicio público (de hecho a mí a veces me vale más la pena consultar un LLM que ir al médico: me da más información, puedo profundizar mejor en los detalles, me permite investigar qué técnicas recientes -que el médico NO conoce- hay para lo mío, etc.; pero es una lástima que el anonimato me lo tenga que crear yo con cuentas temporales, etc)
2) Otro para consultas jurídicas. Lo mismo, público y con anonimato garantizado. En este caso hay uno que funciona magníficamente: maite.ai, lo he probado unas cuantas veces con preguntas «para nota» y la verdad es que lo clava (comprobado por juristas amigos)
3) Otro para consultas sobre trámites administrativos, algunos de ellos más complejos que la teoría cuántica de campos.
* Bonus track: Ya en plan experimental, y si se ve que todo va muy bien, la releche sería conectarlo con el mundo real (y esto implica una responsabilidad personal cuando interaccionas con el LLM), es decir, pregunto cómo se hace el trámite para XXX, me genera un registro electrónico y comienza un procedimiento (punto 3); o te pone en contacto con un bufete que inicia un proceso en juzgado después de una lectura rápida de la demanda que el LLM ya ha redactado (acelerando el proceso, punto 2). O te hace un cuadro sintomático que, si el paciente decide llevar al sistema de salud, se envía a tu ambulatoria con solicitud de cita previa y un cuadro de síntomas que se puede usar para dar más prioridad a tu caso (en esto habría que tener claras las penalizaciones por mal uso del sistema, aunque ahora mismo tampoco se penalice el mal uso del sistema que tenemos)
El que traduzcan/localicen peor o más caro, en mi opinión, va a ser casi irrelevante dentro de poco. Los modelos de Google y demás mejorarán pronto en ese aspecto, sólo hay que entrenarlos también con más contenidos y darles un poco de capacidad de adaptación.
Lo que creo que sí que va a ser brutalmente relevante es que las redes sociales te muestran contenido, te pueden condicionar algo, pero Gemini/ChatGPT etc, cuando la gente los use para todo… eso sí que puede ser la herramienta de creación de opinión y condicionamiento/manipulación del comportamiento definitiva.
Para traducir los modelos locales, funcionan muy bien, y en concreto los del proyecto ALIA del Estado español, son los que mejor funcionan con las lenguas oficiales.
Cualquier empresa que vele por su «privacidad» efectiva, están usando LLM locales.
¿Merecería la pena entrenar un modelo en español común a España y América?
¿O las diferencias culturales lo harían también poco útil?
En el caso español: ¿se pueden considerar como culturalmente diferente un gallego, un vasco o un catalán del resto de españoles como para tener que crear un MML exclusivo?
Como experimento y posible implementación, lo veo más que interesante. Creas un LLM de cada cultura:
• Uno gallego
• Uno vasco
• Uno catalán
• …
Serían más pequeños, más eficientes, más precisos, menos sesgados, (presumiblemente) más baratos… vamos, que lo veo todo ganancia (si se hace en modo OpenSource).
Y después (como parte de ese experimento) puedes buscar generar una «integración» a nivel sistema entre todos esos «sub LLM’s», que básicamente vendría a ser lo mismo que se encargó de hacer el tiempo y la historia, pero sin las guerras, la acritud ni ningún aspecto negativo, solo lo positivo.
Lo veo un poco como el concepto de MoE [Mixture of Experts] pero (para este ejemplo, en lo relativo a España).
Sé que el concepto puede (sobre todo en la altamente polarizada política española actual) llevar a chistes y peleas.
Siempre y cuando el área de comentarios no se convierta en el patio de una cárcel, acepto críticas y burlas, pero díganme si mi idea tiene visos de viabilidad.
«Sé que el concepto puede (sobre todo en la altamente polarizada
política españolaactual) llevar a chistes y peleas»
Politica, no. La gente. (basta ver los comentarios de aqui)
La idea suena más que interesante… yo diría que hasta necesaria…
Pero a los muchos “peros” que se le pueden poner al MoE, me fijare solo en uno: la lengua.
Precisamente eDans, nos habla de cambios lingüísticos e idiosincrasias propias de cada lengua y territorio… y como he dicho antes, la polarización nos llevaría a matarnos (en lugar de aceptar e incluso aprender dichas lenguas, como deferencia intelectual para nosotros mismos y de “respeto” para los demás).
El MoE, estaría en castellano?
O debería ser también consciente de en que lengua se le interroga y responder en consonancia?
El proyecto español es el mejor con las lenguas oficiales
https://alia.gob.es/cat
He incluye los dataset más amplios, inluyendo variedades regionales como el balear, el aranés o el valenciano.
«La pregunta, entonces, no es si deberíamos aspirar a «modelos nacionales», sino si podemos permitirnos no hacerlo.» (EDans).
Esta frase me lleva a esta otra… ¿Por qué nos permitimos pasar la adolescencia sin construir los filtros mentales necesarios, para tener una adultez menos mediocre? Más cercana a la realidad que acontece…
¿O es qué solo hay «deberes» para la IA?
Ha habido dejación de funciones de parte de los padres en primer lugar, de los pobres maniatados legislativamente en segundo lugar y por parte del resto de la sociedad paulatinamente.
Ya veremos cuando quieras pedirles a tus hijos que te cuiden de mayor o a una IA disfrazada de robot
Deberíamos aplicar las leyes Asimovianas de la robótica a las personas, no solo a las maquinitas…
Alquimista, definitivamente sí valdría la pena «entrenar un modelo en español común a España y América», como tú manifiestas, pero no me da la impresión de que un porcentaje importante de los españoles pueda llegar a estar realmente interesado en algo de esta naturaleza.
En Alemania, los latinoamericanos solemos hablar en un español neutro que nos permite comunicarnos sin ningún problema y que es la lengua en la cual siempre escribo en este blog y que, sin duda, todos comprenden perfectamente. Sin embargo, cuando mi esposa y yo dirigíamos un grupo de conversación español-alemán, se daba el hecho de que los españoles nunca volvían en cuanto veían que el grupo estaba dirigido por latinos.
Hay en todo esto una actitud colonialista que me resulta incomprensible y que incluso llega a las altas esferas. Basta ver la lamentable hoja informativa del Centro Asesor para Lenguas de Herencia, Multilingüismo e Integración Escolar enviada, entre otras instancias, por la Autoridad Escolar Estatal de la Ciudad de Fráncfort del Meno para encontrarse con el siguiente desconcertante párrafo:
O sea un absurdo total: alemanes y españoles ofreciendo en las escuelas públicas de Alemania algo en lo que no pueden participar los niños de padres latinoamericanos bajo ningún concepto.
Te soy dos posibles motivos:
– Que haya que ser ciudadano de la UE
– Que esas condiciones sean un copia y pega de las condiciones de hace 40 años cuando había varios cientos de miles de inmigrantes españoles en Alemania y nadie se ha molestado en actualizarlas
Yo apuesto por la segunda opción.
Yo añado una tercera, y me temo, mas real…
Es un servicio del Ministerio de Educación de España, y con toda la lógica del mundo, está dirigido a españoles e hijos de españoles.
Quizás Mauricio debería dirigir sus quejas al ministerio correspondiente de su país de origen, si es que tienen esos acuerdos con el gobierno alemán (que desconozco).
Obviamente…
Mauricio:
«coger» no es lo mismo que «coger», entre España y Latam… ahí ya tenemos un problema, de lengua y de interpretación…
Un modelo común España-Latam, no sería del todo correcto (que no digo, posible)