Google lanza Gemini… y vuelve a no impresionar

IMAGE: Google

Google anuncia el lanzamiento de Gemini, su respuesta a ChatGPT y según ellos mismos su LLM más ambicioso, y aparentemente, a pesar de lo grandilocuente del lanzamiento y de las declaraciones de Sundar Pichai y Demis Hassabis, vuelve a defraudar como ya lo hizo anteriormente con el lanzamiento de Bard.

Según TechCrunch, «no es el modelo generativo que esperábamos«, y menos después de haber reorganizado todas las divisiones dedicadas a la inteligencia artificial dentro de Google. Para The Information, el producto «no está listo todavía» y «es comparable a lo que OpenAI lanzó hace ahora un año«. Y de hecho, el mercado ha respondido al anuncio del lanzamiento con una caída del valor de las acciones de la compañía, porque «los inversores saben cuando algo no es gran cosa».

El problema, muy posiblemente, esté en la gestión de expectativas. Si te lleva todo un maldito año poner en marcha y lanzar un producto en una categoría en la que se suponía que eras el líder absoluto y en el que te dejaste adelantar por una startup bien capitalizada, lo que lances tras ese año tiene que ser algo impresionante, diferente y brutal, que no deje a nadie indiferente. Si en su lugar lanzas un producto con tres niveles pero dices que el superior, Ultra, no va a estar disponible hasta enero como muy pronto, y dejas como demostración un vídeo de una conversación bastante trivial con un agente interactivo afirmando que son «nuestras interacciones favoritas con Gemini», la cosa se queda en que «bueno, Google también tiene algo parecido», pero no va mucho más allá, y definitivamente, por mucho que se asegure que pertenece a «una nueva clase» o que se detallen sus especificaciones técnicas o el número de procesadores que utiliza.

Es, básicamente y como ya dije en su momento, un problema de liderazgo y de dilema del innovador: una compañía convencida, dispuesta a tomar riesgos y con una oferta de nube que se beneficia de todo incremento de actividad en el uso de una algoritmia generativa que supone comparativamente un fuerte incremento de las necesidades de recursos de computación, frente a otra que estaba cómodamente instalada en su liderazgo y que, por haber sido pillada dormida al volante, se encuentra ahora en la extraña situación de tener que ser quien reacciona a los movimientos de otros. Y que además, cuando reacciona, lo hace con escasa convicción, sin integrar demasiado su oferta en sus productos principales y sin presentar nada que realmente sea capaz de impresionar tanto a los que entienden del tema, como a los legos en la materia.

Por el momento, las integraciones anunciadas de Gemini en productos de Google se reducen a AlphaCode 2, que es un producto que solo pueden juzgar desarrolladores, al chatbot Bard, que tenía un uso muy reducido frente al ubicuo ChatGPT, que sigue manteniéndose como uno de los servicios de más rápido crecimiento de la historia de la tecnología, y al smartphone Pixel 8 Pro, pero en su versión Nano, la más baja.

Y mientras ChatGPT sigue creciendo – y no crece más porque la propia compañía ha decidido pausar las altas en su ChatGPT-4 debido a su alta demanda – todo indica que lo único que ha conseguido por el momento Google es situar a Gemini como uno más en la lista de alternativas a ChatGPT. Que no es poco en los tiempos que corren, pero definitivamente, no lo que esperábamos de la compañía que ya en 2014 afirmaba que la inteligencia artificial era la clave del futuro.


This article is also available in English on my Medium page, «Google launches Gemini… but again, fails to impress anyone«

15 comentarios

  • #001
    c3po - 7 diciembre 2023 - 14:26

    No estoy de acuerdo con tu comentario de Gemini, esta o supera a chatGPT en lo que son especialistas que es en el marketing, seguidos por Microsoft, que también hay que echarles de comer aparte.

    Lo primero la buena noticia del marketing, es que no hablan de gilipolleces, no ha habido AGIS, ni singularidades ni otras puñetas que les encanta a los friquis de la AI, pero con marca en la sesera de boina ajustada a rosca. No hay paridas magufas, Lo cual es un punto «+»

    Si analizamos, el evento de ayer, (el de Carlos) y vemos si Gemini está disponible en Bard… pues sigue programando como hace una semana, maaal, eso lo sigue haciendo mejor GPT 3.5. Siempre free pagar es de tontos!

    Una de las noticias mejores es lo de poner la IA de AlphaCode 2, para desarrollar, pero a este paso se queda solterona, mucho bla bla y poco lirili. Lo dicho a la par del «multimodal GPT» (para no echar gota)

    Lo mejor: uno más
    Lo peor: otro más del montón,

    En Nov. 2022. chatgpt sorprendió, y desde entonces, a cuentagotas, si hay algo, o estirando el chicle (lo más probable esto último). Virgencita virgencita…

  • #002
    menestro - 7 diciembre 2023 - 14:26

    Es un chatbot. Los chatbots no son una tecnología estratégica, solo son un producto de moda, una «novelty» (tecnología efectista, demostración).

    Google tiene LaMDA y Duplex, por ejemplo, que son tecnologías más sofisticadas que las de openAI para el mundo empresarial y que se integran en otros productos.

    Además, participa en Anthropic, lo que la sitúa bastante aventajada en el sector de los LLM.

    Gemini es un «concept» de asistente para teléfono.

    El coste de mantener un producto que no es sostenible en el futuro, con el enorme acaparamiento de recursos que supone mantener un chatbot comercial, es la razón para no lanzar un producto para consumidores.

    Hay que aprender a diferenciar entre tecnología emergente real y productos de consumo de moda, o los moonshots.

    Creo que AlphaGO ya fue una lección aprendida sobre innovación que está limitada a la PR tecnológica, la difusión publicitaria de la compañía.

    Es como «The Boring company». Tecnologías muy limitadas en su aplicación real.

    «Every day is the opportunity for a better tomorrow»

  • #003
    Benji - 7 diciembre 2023 - 15:15

    Sigo pensando que estos LLMs son todos más de lo mismo: generalistas.

    Cuando hagamos LLMs especializadas por sectores, otro gallo cantará. Me encantaría que en mi empresa usásemos los ingentes datos que producen varios clientes para crear un modelo, pero chocas de frente con regulaciones internacionales, GDPR y confidencialidad. Tendría que convencer a cada cliente uno a uno para participar de un piloto cuyo resultado aun es incierto.

    Pero es el futuro

  • #004
    F3r - 7 diciembre 2023 - 15:47

    Predecir plegado de proteínas—> magnífico

    LLM—> inútil (incluso para programar es dudosa su utilidad…)

    Seamos serios.

  • #005
    Luis - 7 diciembre 2023 - 16:43

    Yo tampoco estoy de acuerdo Enrique;

    Lo mejor de este modelo es el concepto diferente respeto a ChatGPT;

    1. Multimodalidad en origen, nada de apoyarse en LLMs para transversalizar.

    2. Fíjate cómo estructura la lógica del pensamiento utilizando esquemas, pautas de decisión, comprobaciones intermedias,…vamos un principio de «reasoning» en toda regla aunque sea en sus fases iniciales ( creo incluso que podríamos estar ante un BabyAGI). Me parece mucho más escalable este modelo que el de ChatGPT

    3. Google y OpenAI se están marcando al milímetro entre ellas ante una tecnología que en pocos meses se quedará obsoleta, lo importante es estar por delante del contrario y creo que Google con esta primera versión de Gemini vuelve a la cabeza, quién sabe lo que tendrán en laboratorio.

  • #006
    David - 7 diciembre 2023 - 18:24

    La acción de Google sube ahora hoy un 5.77%.

    No entiendo bien el punto de comparar madurez de una solución que acaba de lanzarse con otra que lleva 2 semanas de altas congeladas y que al pedirle repetir una palabra muestra datos personales utilizados para su entrenamiento. ¿Esto respeta la gdpr?

  • #007
    Javier - 7 diciembre 2023 - 19:18
    • c3po - 8 diciembre 2023 - 13:20

      Que un mal marketing no nos empañe la realidad,

      y las novedades ¿que?
      – ¿que novedades?

      Una muy buena, que un paper, ha dejado con las vergüenzas al aire a los de marketing

      Creo que recibir una pedrada de tus propios desarrolladores en la cabezota a los de marketing, es de Nobel a la honradez !!!

      Enhorabuena a los «no vende motos» !!!!

      • Javier - 8 diciembre 2023 - 13:38

        Básicamente lo de Gemini fue al LLM lo que las piernas al metaverso de Mark

        It only takes four words to sum up the absurd trajectory of the tech world in 2022: “Legs are coming soon!”

  • #010
    Gorki - 7 diciembre 2023 - 20:22

    Será un mal producto si tantos lo afirman,. (yo aún no lo he probado), pero bien venida sea la competencia, Cuanta mas mejor para el público.

  • #011
    Alqvimista - 8 diciembre 2023 - 10:20

    Si te lleva todo un maldito año poner en marcha y lanzar un producto en una categoría en la que se suponía que eras el líder absoluto…
    No, no es que no ha6an podido, es que no querían hacerlo…

    Google es una empresa de publicidad que aplica todo su esfuerzo tecnológico a intentar colocarnos publicidad de la forma más eficaz posible.
    El problema de la IA generativa, de la que fueron pioneros, es que no les produce beneficios, no les vende publicidad. Sí, lo pueden vender como servicio tal y como hace OpenAI, pero ellos no venden servicios, ellos venden publicidad, ¿qué van a hacer, meter publicidad en Bard?

    Oye Bard, cómo hacer un tiramisú.
    Necesitarás cacao de la marca xxx, queso mascarpone de la marca xxx, etc, puedes utilizar balanzas de cocina de la marca xxx, etc, etc.

    ¿Cuánto tiempo iba a durar un servicio así?

  • #012
    Manuel Ángel García - 8 diciembre 2023 - 10:40

    Burdo engaño de marketing el de Google al presentar Gemini. ¡Qué desilusión, con lo que me había gustado!

    Lo que mostraban en su demo era mentira. Todo falso. Ni interacciones por voz, ni comprensión intuitiva de la IA, ni reacciones espontáneas.

    No es posible interactuar con Gemini de forma natural y de viva voz, tal y como mostraba el vídeo, y mucho menos esperar respuestas y reacciones similares a las de una persona, como pretendían hacernos creer.

    Era publicidad engañosa pura y dura; una manipulación intolerable.

    Así los mostraban los desarrolladores de Google al desvelar cómo le habían planteado realmente a Gemini las preguntas y pruebas que luego editaron y mostraron en ese vídeo con interacciones falsas.

    Aquí lo explican:

    https://developers.googleblog.com/2023/12/how-its-made-gemini-multimodal-prompting.html

    Resulta que todo se limitaba a pasarle a su chatbot unos prompts de texto (lo que en el vídeo parecía interacción por voz, omitiendo partes importantes del contexto, que Gemini parecía adivinar), combinado con imágenes estáticas suficientemente explícitas para inducir la respuesta deseada de Gemini.

    ¡Vaya bluff…! :-(

  • #013
    Xaquín - 8 diciembre 2023 - 12:07

    Pensar que todos los día nacen miles (millones?) de crías humanas y no solo no se celebra, sino que se les preparan territorios apropiados para morir de hambre o en guerras varias, o ser objeto de tráfico («completos» o «por partes»), me deja bastante frío (y frito) ante los lanzamientos de las siliconadas tecnológicas.

    Menos mal que nos queda el desvaído Portugal y el maléfico ElonmuX haciendo de las suyas.

  • #014
    Luis - 8 diciembre 2023 - 16:37

    Enrique ¿este articulo esta basado en tu propia experiencia con Gemini?

  • #015
    Gerard - 11 diciembre 2023 - 14:12

    Artículos de opinión son solo eso. Si miras la especificación técnica de Gemini puedes comprobar por ti mismo que se trata de una tecnología superior a nada que OpenAI ofrece hoy.

    Gemini con un solo modelo supera a todos los modelos de OpenAI en su especialidad (GPT-4v, whisper, GPT-4-turbo). Un modelo más avanzado, más barato y eficiente. Un salto tecnológico sin duda.

    Artículos como el de TechCrunch ignoran que OpenAI mismo lanzó un vídeo de una demo donde usando una foto de unas notas creaba un website. No fue hasta Septiembre, 6 meses después que el servicio fue publicado y solo para usuarios de pago. Incluso Bard tenía esta funcionalidad antes que OpenAI.

    Independientemente los modelos de código libre andan muy cerca y OpenAI ha perdido mucho terreno en el pasado año.

    Las últimas decisiones de OpenAI dejan mucho que desear y el enfoque comercial sin un modelo competitivo está destinado al desastre.

Dejar un Comentario

Los comentarios están cerrados