Durante los dos últimos años, la inteligencia artificial ha tenido algo de extrañamente plana. Los grandes modelos de lenguaje se difundieron a una velocidad sin precedentes, pero al mismo tiempo, borraron buena parte de los gradientes competitivos conocidos. Ahora, todo el mundo tiene acceso a los mismos modelos, a las mismas interfaces y, cada vez más, a las mismas respuestas. Lo que al principio parecía una revolución tecnológica ha empezado rápidamente a parecerse a una utility: potente, impresionante y en gran medida intercambiable, una dinámica ya visible en el rápido avance de la comoditización entre la mayoría de los modelos fundacionales entre proveedores como OpenAI, Google, Anthropic y Meta, en una carrera que ya es hasta difícil seguir.

Ese aplanamiento no es accidental. Los LLMs son extraordinariamente buenos en una cosa, aprender a partir de texto, pero estructuralmente incapaces de otra: entender cómo se comporta el mundo real. No modelan la causalidad, no aprenden de la retroalimentación física u operativa y no construyen representaciones internas de los entornos, unas limitaciones importantes que incluso sus defensores más destacados reconocen ya abiertamente.

Predicen palabras, no consecuencias. Una diferencia que se vuelve dolorosamente evidente en cuanto se les pide que operen fuera de dominios puramente lingüísticos.

La falsa dicotomía que frena la estrategia de inteligencia artificial

Gran parte de la estrategia actual en inteligencia artificial está atrapada en un pensamiento binario. O las empresas se dedican simplemente a «alquilar inteligencia» a modelos genéricos, o intentan construirlo todo por sí mismas: infraestructura propietaria, stacks de cómputo a medida y pipelines de IA personalizados que casi intentan imitar a los hyperscalers.

Ese encuadre es poco realista y, además, históricamente miope.

La mayoría de las empresas no se volvieron competitivas construyendo sus propias bases de datos.

No escribieron sus propios sistemas operativos.

No levantaron centros de datos hiperescalables para extraer valor de sus analíticas.

En su lugar, adoptaron plataformas compartidas y construyeron sistemas altamente personalizados sobre ellas, sistemas que reflejaban sus procesos específicos, sus restricciones y sus incentivos.

La inteligencia artificial seguirá el mismo camino.

Los modelos del mundo no son proyectos de infraestructura

Los world models o modelos del mundo, sistemas que aprenden cómo se comportan los entornos, incorporan retroalimentación y permiten predecir y planificar, tienen una larga historia intelectual en la investigación en inteligencia artificial.

Recientemente, han resurgido como una dirección central de progreso precisamente porque los LLM se estancan cuando se enfrentan a la realidad, la causalidad y el tiempo.

A menudo se describen como si requirieran integración vertical en cada capa. Esa suposición es errónea.

La mayoría de las empresas no construirán centros de datos a medida ni stacks de cómputo propietarios para ejecutar modelos del mundo. Esperar que lo hagan repite el mismo error que ya vimos en narrativas anteriores como «AI-first» o «cloud-native», donde la ambición en infraestructura se confundía con necesidad estratégica.

Lo que realmente ocurrirá es algo más sutil y más poderoso: los modelos del mundo se convertirán en una nueva capa de abstracción dentro del stack empresarial, construida sobre plataformas compartidas del mismo modo que hoy lo están las bases de datos, los ERP o la analítica en la nube.

La infraestructura será común. La comprensión no.

Por qué las plataformas convertirán los modelos del mundo en ubicuos

Igual que las plataformas cloud democratizaron el acceso a la computación a gran escala, las plataformas emergentes de inteligencia artificial harán que el modelado del mundo sea accesible sin obligar a las empresas a reinventar todo el stack. Se encargarán de motores de simulación, pipelines de entrenamiento, integración con sensores y sistemas, y de la pesada carga computacional, exactamente en la dirección que ya se observa en plataformas de aprendizaje por refuerzo, en robótica o en inteligencia artificial industrial.

Esto no comoditiza los modelos del mundo. Hace lo contrario.

Cuando la capa de plataforma es compartida, la diferenciación se desplaza hacia arriba. Las empresas no compiten por quién posee el hardware, sino por lo bien que sus modelos del mundo reflejan la realidad: qué variables incluyen, cómo codifican las restricciones, cómo diseñan los bucles de retroalimentación y con qué rapidez corrigen sus predicciones cuando el mundo las contradice.

Dos compañías pueden operar sobre la misma plataforma y, aun así, tener niveles de comprensión radicalmente distintos.

De la inteligencia lingüística a la inteligencia operativa

Los LLM aplanaron la adopción de la inteligencia artificial porque universalizaron la inteligencia lingüística. Pero los sistemas entrenados únicamente con texto carecen de anclaje contextual profundo, razonamiento causal y comprensión temporal, limitaciones ampliamente documentadas en la investigación sobre modelos fundacionales. Los modelos del mundo volverán a inclinar el terreno al reintroducir contexto, causalidad y tiempo, precisamente las propiedades ausentes en los sistemas puramente textuales.

En logística, por ejemplo, la ventaja no vendrá de preguntar a un chatbot sobre optimización de la cadena de suministro. Vendrá de un modelo que entienda cómo se propagan los retrasos, cómo interactúan las decisiones de inventario con la variabilidad de la demanda y cómo pequeños cambios generan efectos en cascada durante semanas o meses.

Dónde residirá realmente la ventaja competitiva

La verdadera diferenciación será epistémica, no infraestructural: procederá de la disciplina con la que una empresa gestione la calidad de sus datos, del rigor con el que cierre los bucles de retroalimentación entre predicción y resultado (recordemos esta idea: el feedback lo es todo) y de lo bien que sus incentivos organizativos estén alineados con el aprendizaje en lugar de con la comodidad narrativa. Los modelos del mundo recompensan a las empresas dispuestas a ser corregidas por la realidad y penalizan a las que no lo están.

Las plataformas serán enormemente importantes. Pero las plataformas estandarizan capacidades, no conocimiento. Una infraestructura compartida no produce comprensión compartida: dos empresas pueden operar en la misma nube, utilizar la misma plataforma de inteligencia artificial e incluso desplegar las mismas técnicas subyacentes, y aun así terminar con resultados radicalmente distintos, porque la comprensión no está incrustada en la infraestructura. Emerge de cómo cada empresa modela su propia realidad.

La comprensión vive en una capa superior del stack, en decisiones que ninguna plataforma puede tomar por ti: qué variables importan, qué trade-offs son reales, qué restricciones son vinculantes, qué significa el éxito, cómo se incorpora la retroalimentación y cómo se corrigen los errores. Una plataforma puede permitirte construir un modelo del mundo, pero no puede decirte cuál es tu mundo.

Pensemos en ello así: no todas las empresas que usan SAP tienen la misma visión operativa. No todas las que funcionan sobre AWS poseen el mismo nivel de sofisticación analítica. La infraestructura es compartida, pero el modelo mental no. Lo mismo ocurrirá con los modelos del mundo.

Las plataformas hacen posibles los modelos del mundo. La comprensión los hace valiosos.

El próximo stack empresarial de inteligencia artificial

En la siguiente fase de la inteligencia artificial, la ventaja competitiva no vendrá de construir infraestructura propietaria. Vendrá de construir mejores modelos de la realidad sobre plataformas que harán fácil e ubicuo el modelado del mundo.

Es un desafío mucho más exigente que comprar capacidad de cómputo. Y es uno que ninguna cantidad de ingeniería de prompts podrá resolver.

(This article was previously published on Fast Company)