La interesante evolución del panorama en inteligencia artificial

IMAGE: OpenAI's DALL·E, via ChatGPT

Mi columna de esta semana en Invertia se titula «De modelos a agentes» (pdf), y trata de explicar de una manera razonablemente accesible la transición que está teniendo lugar en el panorama de la inteligencia artificial, un campo que aún resulta muy novedoso para mucha gente pero que refleja transformaciones cada vez más importantes y decisivas para su futuro.

El primer estadío de evolución tras la aparición del mítico paper que dio origen a los transformers y a la IA generativa fue el del desarrollo de modelos masivos de lenguaje. Una era que, a efectos populares, que no de investigación, se inicia con el lanzamiento por OpenAI de Dall·E, primero, y de ChatGPT después, hace ahora casi exactamente dos años, que se convirtió en un acontecimiento a todos los niveles y en el fenómeno de adopción tecnológica más rápido de la historia.

El lanzamiento de esos modelos generó, además de muchísima expectación, mucha competencia. Otras compañías, algunas de toda la vida, otras no tanto, se lanzaron al mercado; Microsoft, gracias a su privilegiada relación con OpenAI derivada de su uso de Azure, con Copilot, o Google, primero con Bard y después con Gemini. Pero también nuevos entrantes, como Anthropic con Claude, o Perplexity, Meta con Llama, y toda una suerte de ecosistema que bordea el código abierto con compañías como Mistral y un buen número de competidores chinos, entre otros. Expresar una interfaz de un modelo como un chatbot es vistoso, razonablemente sencillo y ofrece muchas ventajas de cara a su fácil adopción, lo que hace que prácticamente todos la adopten.

Todas esas compañías contaban con las llamadas scaling laws, o leyes de escalado, que describen cómo cambia el rendimiento de una red neuronal a medida que se amplían o reducen factores clave que incluyen la cantidad de parámetros, el tamaño del conjunto de datos de entrenamiento, el coste del entrenamiento o la tasa de errores post-entrenamiento. El desarrollo de modelos menos conocidos por el gran público como Chinchilla y su posterior evolución responden al razonamiento de que esas scaling laws van a hacer que la inteligencia de los modelos progrese constantemente a medida que incrementamos sus parámetros, con todo lo que ello conlleva: una lucha de fuera bruta entre compañías en función de cuántos recursos de computación pueden permitirse, bien por su acceso a la nube, bien por las cantidades ingentes de datos necesarias, a los que algunos acceden mediante acuerdos y otros directamente se llevan puestos sin preguntar.

¿Donde está el problema? Cuando esas compañías empiezan a ser conscientes de que las scaling laws no aplican eternamente. De repente, trasciende que GPT5 es solo marginalmente mejor que GPT4, y que, de alguna manera, se está alcanzando un techo o plateau. Y frente a algunos apocalípticos de esos que hay en todas partes empiezan con la cantinela de «hasta aquí hemos llegado», «era todo una burbuja» y «no se puede pasar de aquí», empezamos a encontrarnos con otras compañías que empiezan a explorar otra frontera diferente: la de los agentes.

¿Qué es un agente? Simplemente, una entidad capaz de percibir su entorno y de tomar acciones de manera autónoma para alcanzar unos objetivos definidos, que además puede mejorar su desempeño con el aprendizaje o la adquisición progresiva de conocimientos. Esta idea de los agentes, que precisa de entornos capaces de generar feedback para esa adquisición progresiva de conocimientos, empieza a surgir como reacción, y lleva a Marc Benioff, de Salesforce, a decir que «el futuro de la IA está en los agentes, no en los chatbots«.

¿Qué ocurre ahora? Que cada vez más, el futuro no apunta a modelos monolíticos y enormes, sino a poblaciones de agentes capaces de coevolucionar en función de las circunstancias que los rodean. Anthropic, de hecho, tras proponer un agente autónomo capaz de utilizar los programas de tu ordenador por ti, lanza propone una nueva manera de conectar datos con los agentes, que permite que los modelos (cualquier modelo, no solo los de Anthropic) extraigan datos de fuentes como herramientas comerciales y software para completar tareas, así como de repositorios de contenido y entornos de desarrollo de aplicaciones. Una nueva arquitectura y fisonomía que va a dar lugar a nuevos planteamientos, que aún estamos empezando a explorar.

De modelos. a agentes. Así, cuando muchos todavía no han empezado siquiera a entender lo que conlleva cada uno. Si crees que esto va muy rápido, es porque, efectivamente, va muy rápido. Pero eso no quiere decir que te puedas permitir el lujo de esperar a que se consolide nada, porque muchos veces ni lo hará. El mundo es de los que analizan y toman decisiones rápidamente.

Por el momento, quedémonos con la tendencia y su aplicación, porque la vamos a ver en cada vez más sitios. Las implicaciones evidentes son claras: sistemas capaces de ganar inteligencia de manera más rápida y adaptativa. ¿Las consecuencias? Ya las veremos.


This article is also available in English on my Medium page, «AI is changing faster than most people realize«

9 comentarios

  • #001
    Xaquín - 27 noviembre 2024 - 15:21

    No quiero ser agorero, pero toquemos el problema (ya pasado) de la introducción tecnológica en las aulas, para hablar de sus agentes.

    De como fracasó todo el mecanismo de soporte informativo hacia la mente del alumnado, por fallo clamoroso de los AGENTES encargados de esa proyección.

    Y realmente ya empezó mucho antes de que cualquier pensador logre centrarse en su origen : con las putas láminas explicativas. Realmente fue una consecuencia del copieteo vil, literal o oral, del llamado libro de texto.

    Un simple cártel inanimado, al princicpio hasta poco colorido y de un grafismo muy cutre. Pero el profesorado no fue capaz de introducir, de integrar, ese modo de proyección informativo en las aulas. Fue algo anecdótico, aunque muy enriquecedor para los que se empeñaron en interactuar con ese mecanismo laminar… aparte de ser mirados como bichos raros («no nos pagaban para eso»).

    Y podíamos seguir, con las diapositivas, los retroproyectores, los ordenadores… y el consecuente método de las presentaciones informáticas. Ya dejamos de lado el aula virtual, como una especie de maléfica gattaca, para cuatro pirados más o menos frikis…que lo hacían por gusto (no por necesidad profesional).

    Y así llegamos a la actualidad educativa : discusiones eternas en redes sociales sobre las ventajas del memorismo atroz y lo mal comprendido que fue por los «modernos» de la educación. Esos jamados con sus locos cacharros.

    Muy triste, sí, muy triste.

    Así que decidme a mí sobre los agentes digitales (IAs y demás semidioses informáticos), que nos van sacar de este atolladero tan lleno de mediocridad sapiens, que apesta. Se mire por dónde se mire. Suponiendo que seamos capaces de ver lo que miramos.

    Responder
  • #002
    Gorki - 27 noviembre 2024 - 15:36

    He de reconocer que los acontecimientos en la AI se suceden a tal velocidad que me siento arrollado e incapaz de seguir las novedades que aparecen,. Poco a poco, voy siguiendo con lentitud la vertiginosa producion de videos de DotCSV, (https://www.youtube.com/@DotCSVLab/videos), cada uno, con un nueva propuesta basada en AI mas asombrosa que las anteriores, y dia a dia, veo que mi conocimiento de la AI es mas rupestre, no porque yo no avance, sino porque el horizonte se aleja a mayor velocidad de la que yo avanzo.

    Creo haber controlado los «prompts» para generar texto pero aun estoy muy lejos de dominar la generación de imágenes, no hablo ya de hacer videos clonar voces y cosas por el estilo de las que solo se que existen y que algunos privilegiados dominan y son capaces dc hacer con ello «brujerías»

    Estoy mas que impresionado con un aparato llamado «Alter ego» que me parece que aun está en fase de laboratorio, que conecta directamente la tu mente cdon la «nube» y te permite tener «conversaciones» en tu cerebro, contigo mismo, pero donde tu interlocutor «alter ego», cerebro te contesta consultado un AI.

    Ese si, y no la gafas 3D, es un aparto que si mi economía alcanza, me compraré, aunque claro está, si Google se entra hasta de lo que pienso, mi privacidad se va de forma absoluta a la basura.

    Responder
  • #003
    Chipiron - 27 noviembre 2024 - 16:11

    Se me ocurre un Siri «supervitaminizado» para substituir al actual y poder controlar domóticamente toda la casa, además de dar el tiempo, noticias más importantes, etc, etc.

    Es que el Siri actual da pena…

    Responder
    • Guillermo - 27 noviembre 2024 - 16:51

      Y Alexa?
      Dan pena, ayudan a divinizar a la IA de chatgepeto , etc

      Responder
  • #005
    Lua - 27 noviembre 2024 - 18:18

    Efectivamente… los avances de la IA son realmente sorprendentes… y nos llevan a la frontera de lo imaginable…

    Que se lo pregunten si no, Dra. Cuernos…

    (para echarse unas risas) XDDD

    Responder
  • #006
    El hombre que ríe - 28 noviembre 2024 - 01:34

    La paradoja de los agentes, algoritmos, IA, red neuronal,etc, es les encantan hacer su trabajo. El trabajo es desagradable para los humanos, tanto que incluso es señalado en religiones. Aunque los agente se topen con progresos marginales, sigue siendo significativo respecto al humano orgánico que siempre tiene un limite donde ya no se puede aprender más.
    Cuando se adopta la tecnología se hace menos trabajo: en arquitectura no se hace calculo de cargas (fuerzas que un edificio o estructura debe soportar) mentalmente, ahora se hace en una hoja de excel y esto sin necesidad de un «agente», si en el futuro un agente esta disponible este podría hacer el análisis en segundos. El problema es cómo aplicar esto a la sociedad porque quienes toman las decisiones son ancianos anclados en clichés del siglo pasado.

    Responder
  • #007
    Jimena de Lorenzo - 28 noviembre 2024 - 09:13

    Efectivamente, vamos a velocidad increíble. Creo que hay que respirar hondo y darnos tiempo a pensar y a reflexionar sobre qué herramientas realmente necesitamos y nos pueden ayudar en nuestro trabajo, porque más vale calidad que cantidad, y más vale dos o tres herramientas multitarea y multiformato, utilizadas con cabeza humana. Utilizo Perplexity en vez de Chat GPT precisamente porque me pone las fuentes; también utilizo Canva, ya que al ser maestra puedo acceder a la versión Pro de manera gratuita. Y, la verdad, en este momento, prefiero profundizar en el uso de estas herramientas, sin dejar de poner la antena a las novedades que salen, pero con «filtro crítico y pausado». ¿Qué hago con mis compañeros y compañeras de trabajo? pues enseñarles a utilizar estas herramientas, despacio, adaptándome a lo que verdaderamente necesitan en este momento. ¿Qué resultados estoy obteniendo? pues que las utilizan, que ahorran muchísimo tiempo y, lo que es mejor, se están volviendo autónomos y experimentan y aprenden por ellos mismos. Me acabo de convertir en una agente no digital. Sin prisa, pero sin pausa. Y no nos olvidemos de respirar, de dar paseos por la naturaleza, y de dar abrazos… que a veces parece que quieren que nos olvidemos de que seguimos siendo humanos. Hay que salir de Matrix y ser conscientes de dónde estamos.

    Responder
  • #008
    Roberto - 28 noviembre 2024 - 10:48

    Hola Profesor Dans,

    En cuanto a los MCP de Anthropic, ¿cómo de seguros cree que podrán ser estos agentes que accedan a los datos? Es decir, parece que Anthropic está bastante comprometida con la privacidad, pero aun así ¿cree que deberíamos ser cautos?

    Gracias.

    Responder
  • #009
    Buzzword - 28 noviembre 2024 - 15:01

    Lo más avanzado que va a ver en agentes de IA, va a ser en la inteligencia manzana, como tienen amarrados a los clientes a sus terminales, y todo aquel que quiera incluir una experiencia IA pasa por su arco de triunfo piensan que tienen al cliente cautivo. Lo último es que la experiencia SIRI AI, no es para hoy es para mañana,… por lo que no van a tener que innovar solamente que mejorar lo que han hecho los demás. Problema será si sus esclavos se cansan de esperar, pero estoy seguro que eso no pasará. Mientras los que no tenemos cadenas tenemos esas experiencias en distintas plataformas, cada una con sus peros, como suele pasar en las novedades, lo que está claro que Apple no va a tener early adopters, sino adopters sin más, eso si, si tienes el terminal que saquen en algún septiembre y que no hayan oido los que les ha pasado a sus últimos productos. De momento SIRI con hormonas IA no sale en el año del jubileo de Roma… saldrá mañana !!

    Responder

Dejar un Comentario

Los comentarios en esta página están moderados, no aparecerán inmediatamente en la página al ser enviados. Evita, por favor, las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, sean dirigidos al autor de la página o a cualquier otro comentarista. Estás en tu perfecto derecho de comentar anónimamente, pero por favor, no utilices el anonimato para decirles a las personas cosas que no les dirías en caso de tenerlas delante. Intenta mantener un ambiente agradable en el que las personas puedan comentar sin temor a sentirse insultados o descalificados. No comentes de manera repetitiva sobre un mismo tema, y mucho menos con varias identidades (astroturfing) o suplantando a otros comentaristas. Los comentarios que incumplan esas normas básicas serán eliminados.

 

XHTML: Puedes utilizar estas etiquetas: A ABBR ACRONYM B BLOCKQUOTE CITE CODE DEL EM I Q STRIKE STRONG IMG