Aprendiendo de la disrupción: el caso de Getty Images

IMAGE: The Verge (generated with Stable Diffusion)

Mi columna de esta semana en Invertia se titula «Getty Images y la lógica de los datos» (pdf), y habla de la evolución del repositorio de imágenes digitales Getty Images desde que, a finales de 2022, descubrieron que todas sus imágenes y sus descripciones habían sido capturadas, con sus marcas de agua y todo, por una compañía de desarrollo de algoritmos generativos, Stability AI, para entrenar un producto llamado Stable Diffusion, con el que además, muchos usuarios podían ahora evitarse el uso de imágenes de Getty y simplemente generar las suyas completamente libres de derechos de autor.

La imagen con la que ilustro este artículo, creada por The Verge mediante Stable Diffusion, me parece icónica: dentro de no mucho tiempo, podremos evocar cómo los primeros algoritmos generativos distorsionaban torpemente las imágenes de caras o añadían dedos extra a las manos, e incluso intentaban reproducir la marca de agua que se encontraban en muchas de las imágenes con las que habían sido entrenados. Compara eso con las últimas versiones de algunos de esos algoritmos es una prueba más de la apabullante velocidad de desarrollo de la tecnología.

La subsiguiente denuncia de Getty Images contra Stability AI se ha convertido, junto con la de The New York Times contra OpenAI, en elementos clave para entender la evolución y la regulación de los algoritmos generativos y sus ramificaciones dentro de los derechos de autor y el copyright. Si yo puedo ir a un museo, ver todas las obras de un pintor determinado, e inspirarme en su estilo para pintar un cuadro similar, ¿por qué no puede un algoritmo «ingerir» todas las imágenes de un repositorio para, posteriormente, generar imágenes diferentes pero basadas en ellas?

Obviamente, la respuesta no es tan simple: lo que las compañías desarrolladoras de algoritmos generativos están haciendo no es simplemente capturar imágenes que están disponibles en abierto (con su correspondiente marca de agua, de ahí que hasta intenten reproducirla), sino ahorrarse un trabajo enorme de etiquetado de imágenes recurriendo a las páginas web de compañías que ya lo habían hecho anteriormente, para crear con ellas su producto. Un producto que, además, puede ser utilizado precisamente en lugar de los de esas compañías: son ya muchas las páginas que ilustran con imágenes generadas por Stable Diffusion para evitar incluir imágenes procedentes del repositorio de Getty Images por las que tendrían que pagar; y no cuesta mucho imaginarse, en un futuro nada lejano, a alguien sustituyendo la lectura de The New York Times por una consulta a ChatGPT con distintas variaciones del prompt «¿qué ha pasado hoy?»

Pero lo verdaderamente interesante es, en realidad, lo que pasa a partir de ahí: Getty Images ha reaccionado a las acciones de Stability AI, además de con su denuncia ante los tribunales, desarrollando ella misma su propio algoritmo generativo entrenado en exclusiva con sus imágenes y en colaboración con Nvidia, la compañía que se ha convertido en billonaria diseñando los chips que se utilizan para entrenar a la mayoría de estos algoritmos.

Esa es, en realidad, la verdadera lección que pretendo destacar: si la disrupción impacta tu negocio, podrás intentar recurrir a los tribunales y ganarás o perderás, pero sobre todo, utilízala: lo que Getty hace, además de intentar detener por la vía legal a Stability AI, es utilizar sus propias armas, su enorme repositorio de imágenes etiquetadas, para construir un nuevo producto, Generative AI by Getty Images, que le permita ofrecer a sus usuarios la posibilidad de generar sus propias imágenes.

Con eso, por un lado, aprende de la disrupción y la integra en sus procesos, lo que le permite defenderse y mejorar su producto. Por otro, justifica ante el juez la evidencia de que Stability AI le está, en realidad, haciendo la competencia de manera desleal utilizando sus propios datos, los que Getty Images lleva generando durante años. Con ello, obtiene un argumento potencialmente más contundente que podría ayudar a Getty Images a obtener un acuerdo extrajudicial o un veredicto más ventajoso, porque, no lo olvidemos: de lo que se trata aquí, y lo que pretende Getty Images, no es que Stability AI deje de utilizar su repositorio (algo que en realidad ya hizo hace tiempo), sino de ponerle el precio correspondiente y de obligarla a pasar por caja.

La lección es clara para todas las compañías: examina tus repositorios de datos, todos los datos que has generado para dar soporte a tu actividad o los que ha generado tu propia actividad, y sobre todo, aquellos que puedan de alguna manera ser públicos, y piensa en qué podrías hacer con ellos utilizando las herramientas algorítmicas adecuadas. Eso te permitirá dar más valor a tu compañía integrando esta tecnología como parte de sus procesos. Pero además, piensa que si no lo haces tú, lo va a hacer otro, bien con sus propios datos parecidos a los tuyos (un competidor) o incluso, si es posible, con los tuyos propios. Y eso, como bien sabe Getty Images, no sienta nada bien.


This article is also available in English on my Medium page, «It took a while, but finally Getty Images has learned something from disruption«

17 comentarios

  • #001
    menestro - 10 enero 2024 - 15:15

    Lo que está haciendo Getty es tomar una acción legal preventiva, utilizando su fondo de imágenes en la misma actividad que la empresa a la que ha demandado y, de esa forma, cerrando la posibilidad de que se aplique una indemnización menor porque se asuma que no hay un perjuicio directo de su negocio o que Getty es un «acaparador de patentes».

    Trol de patentes

    Si tienes la patente o propiedad intelectual de un bien que no utilizas, un juez puede asumir que el uso efectivo de la misma, ya sea para un nuevo propósito o en una actividad novedosa, puede ser lícito y, disminuir el monto del perjuicio causado a la empresa, limitando la protección que se aplica a esa propiedad intelectual para fomentar su uso real y beneficiar a la sociedad con nuevas aplicaciones.

    Es una medida de la legislación anti Patent Trolls en EE.UU., cuando no existe un uso real de una patente o propiedad intelectual. El uso efectivo de esa propiedad intelectual la protege de la apropiación por terceros.

    Es en lo que se basa la usucapión o prescripción adquisitiva en Europa, por la que se adquiere la propiedad o el derecho de uso de una cosa a través del empleo efectivo, posesión continuada o utilización novedosa, de buena fe.

    Navigating the landscape of anti-trolling legislation

    Patent Trolls: The Impact of Non-Practicing Entity Litigation on Firm Innovation Strategies

    What Happens When A.I. Enters the Concert Hall?

    • menestro - 10 enero 2024 - 17:06

      Por supuesto, las miniaturas y el etiquetado, taxonomía, anotación, metadatos, e índices, etc. de Getty están igualmente protegidos.

      Las taxonomías de los datos están tan protegidas como los datos mismos y hay toda una industria dedicada a la definición y tagging de imágenes. Es parte del «core» de negocio de Getty.

      Data labeling companies are raising prices in the AI boom – Quartz

      Apple Wants to Solve One of Classical Music’s Biggest Problems –
      Forget the metaverse. The future is metada now -.

      • Gorki - 10 enero 2024 - 19:26

        Si, pero es evidente que no sólo lo dejaron libremente para que el publico lo viera, sino que ademas pusieron herramientas para buscar con más facilidad,
        Luego dieron poemiso para su uso de forma explícita, Lo único que no supieron prever es el uso que el usuario hiciera de eso, Pero en países civilizados lo que no esta explícitamente prohibido está permitido.

        Y Pomgo un ejemplo ,si utilizo el catálogo de Amazon o de Netflix para algo parecido, Tu crees que me podrían ganar en un juicio. Yo creo que es muy opinable al menos, porque desconozco la Ley de Copyright en sus detalles,

        • c3po - 10 enero 2024 - 21:41

          Gorki

          En la página de sus términos prohiben casi hasta respirar

          https://www.gettyimages.es/eula

          Lo que no tengo tan claro es:

          1. que si Stable Diffusion no hace apenas negocio de ello puedan pedirles algo. Y la obra derivada (generadas) no son copias exactas. los modelos de esta empresa son en general libres. Por tanto no parece que haya dolo, ya que en la práctica su uso se puede asimilar al de la visión. No olvidemos que SD se alimenta de imágenes de 512×512 ( 1024×1024 en XL) que son aproximadamente iguales a las que ellos ofrecen en visualización libre

          En cuanto a los metadatos, son importantes, pero para etiquetar fotos para IA se suelen utilizar algoritmos especializados como BLIP, que leen una imagen y describen lo que hay.

          2. Que esos Términos no sean nulos de pleno derecho o que vayan en contra de alguna ley

          Las copias que están en 2023 libre de copyright por la fecha que se supone que se hicieron las imágenes originales, en una copia digital, deberían prevalecer a su licencia posterior. Digamos que estas poniendo en el mercado un producto que está en el dominio público. Cuando Espasa edita el Quijote, les pertenece la reedición de la obra impresa, pero el contenido es libre. Se puede argumentar lo mismo con las imágenes.

          Creo que el derecho de los autores de obras es una cosa, y otra la de unos mercaderes que negocian o trapichean con imágenes históricas.

          Lo que hay detrás es sencillamente mantener y fomentar su nuevo negocio de generación de imágenes. Puro mercantilismo, no proteger a artistas.

  • #005
    Gorki - 10 enero 2024 - 15:37

    Por partes como Frankestein

    Lo que ha hecho Stability AI es utilizar no las imágenes, sino los índices de esas imágenes puestos al libre servicio del público, por eso tienen las marcas de Agua, Es como si yo, aprovecho el índice de un repositorio privado como el de películas de Netflix, o el catálogo de Amazon para obtener., no cabe duda una obra derivada, pero de algo que la compañía propietaria, no solo ha dejaba libremente que consultaras, sino que estaba incitaba y facilitaba el uso del público poniendo buscadores y otros selectores. Lo único que no supo es prever el uso que ibas a hacer tu de esa consulta.

    No se si es ilegal o legal depende de lo que digan las leyes ya escritas cuando se hizo ese trabajo/expolio, pero es mu discutible Casi todos los trabajos de BIG DATA se obtiene capturando datos que el propietario cede libremente, pero no para el fin que le estas dando.
    Yo he aconsejado que los informáticos en paro aprendan a capturar datos libres, y que luego piensen que utilidad pueden tener para las empresas el conocimiento de ese Big Data. Por ejemplo revisas la audiencia de los cines haciendo que compras un billete on line ,lo cruzas con la informacion de la película de Filmaffinity y das recomendaciones a quien le interese sobre las tendencias y preferencias del publico.

    Segndo, el poner la palabra «banco» a la foto de un «banco», no creo que autorice que hagas copyright ni a la palabra ni a la imagen, Yo puedo fotografiar todos los banco que me de la gana y utilizar esa palabra cuando quiera, Tampoco creo que la inmensa mayoría de las fotos de Getty Images, sean originales, no en su confección fotográfica, sino lo que enseñan; si hacen la foto de un panadero, quien de verdad detentaría los derechos, es el panadero fotografiado y no Getty Images, lo mismo pasa si fotorfaria un coche o un a casa, el propietario real de la imagen es el diseñador del coche o de la casa, o simplemente ha finalizado su derecho de imagen y son «libres».

    A ver si a Getty Images, le crecen los enanos y empiezan a pedirles indemnización los auténticos propietarios de la imágenes.

    Por ultimo creo que el negocio tradicional de Getty Images, ceder imágenes, se ha ido al garete con el avance tecnológico, como le sucedió a Kodak o Blockbuster. como antes se fue al garete el negocio a los herradores y a los vendedores de hielo y a los copistas,

    Ajo, Agua y reina, qué se lo va a hacer.

    , ,

    • Martin - 25 enero 2024 - 17:58

      Enohrabuena por el analisis, creo que es el mas sensato de los puntos de vista que he leido hasta ahora.
      Solo agregaria que siento que hay como muchos «neoludistas» del copyright…
      El mismo enrique dio el ejemplo del ira un museo e inspirarse en los cuadros para pintar, pues podria aprovecharse del trabajo de «curado» del jefe de exposicion. de la clasificacion y luego usar su inspiracion para hacerse a el mismo un cuadro que poner en su sala en detrimento de los que podria comprar de esos artistas.. vamos que en el parrafo el ejemplo empieza bien pero no lo terminó. si lo terminaba se hubiera dado cuenta que estaba en las mismas.
      Sludos.

  • #007
    c3po - 10 enero 2024 - 16:33

    Creo que conviene no generalizar… y veamos como funciona el banco de imágenes getty:

    a) Entramos en el banco y ponemos «Berlin 1900» salen unas fotos asumamos que tomadas en ese año, y que cualquier derecho sobre la imagen no tiene ya un posible copyright. (leer todo el comentario antes de decir que si lo tiene)
    b) La imagen de muestra de tamaño pequeño p.ej. 600×600 no tiene marca de agua
    c) El primer click a esa imagen, aparece en 2000×2000 y tiene marca de agua
    d) Si quiero comprar esa imagen en 4000×4000 me cuesta la friolera de 475€.

    Pero en realidad no es mia es un copia digital de esa imagen. Ese es su modelo de negocio. Modelo guarreras porque en ningún momento ha tratado un profesional la foto para quitar artefactos, arañazos, etc se nota que no la han trabajado.

    Obviamente a getty le cuesta un dinero hacerse con el original, o ir con un scanner a una hemeroteca (p.ej. pública) a copiarla… y ellos estiman un precio, que a mi me parece ridículamente alto, pero es mi opinión

    Observaciones:

    a) Que es obvio que la foto original hubiera perdido los derechos de copia si estuviera depositado en una biblioteca y cualquiera puede copiarlos. Otra cosa es que el ejemplar sea tuyo y vendes su propiedad, eso nadie lo niega igual que un incunable, un Van Gogh o un vino de 1900.
    b) Pero a ti no te están vendiendo un original sino una copia digital, pero no adquieres su copyright, ya que la casa la sigue vendiendo en digital las que quiera. Es decir es una propiedad capada en ese derecho. ¿Tienes tu derecho a revender digitalmente esa propiedad? Digamos que si. Si alguien te cobra por un jog lo siento mucho, pero ese jpg es mio y hago las copias y ventas que quiero…
    c) Cuando te haces con una copia digital de su web de menor calidad, es como si te la vendieran sin derechos a 0€ ¿pero porque no puedes usarla? ¿Por que solo visionarla? si es una foto cuyo original ya dejó el copyright en el sueño de los justos. ¿¿Alguien me puede obligar a revenderla por 0€??

    Me puede parece lógico que ese banco de imágenes, deterioradas aposta por ellos no pueda ser comercialmente usado, ¿pero por que no se puede usar, si el checkpoint se pone al servicio público gratis?

    Es parecido a cuando querían capar que en un blog no se pudieran poner enlaces a otros sitios. Un sin sentido.

    • Rodrigo - 10 enero 2024 - 17:13

      Tienes un mínimo gazapo al final del penúltimo párrafo donde dices: … ya ha hizo hace tiempo …

      • c3po - 10 enero 2024 - 18:36

        Gracias,

        Por cierto vaya «modelo de negocio» más turbio…

        https://www.gettyimages.es/eula

        Me imagino que si el juez se lo pide pueden demostrar el 100% de esas copias digitales que venden, pueden exhibir sus derechos de propiedad

  • #010
    Javier Lux - 11 enero 2024 - 08:24

    Con las patentes contenido-media hemos topado!!!

    La patentes de ingeniería duran 20 años. Las de farmacia, 25 años. Las de media-contenidos, literatura, cine, tv… etc… algunas hasta 70 años después de muerto el autor!!!!

    Como se nota que los media son los que mandan a los políticos-legisladores. Tu legisla a mi favor, yo hablaré bien de ti. Haz algo que me perjudique y te arrastraré por el barro en mis medios.

    ¿Cuándo actuaremos contra esa mafia?

    • Gorki - 11 enero 2024 - 11:21

      Caso estremo de corrupción política, estudia la patente de Micky Mouse, 95 años

      En 2024 Mickey Mouse será de dominio público (en Estados Unidos), y ya están vendiendo figuras libres de derechos

      • Javier Lux - 11 enero 2024 - 14:29

        Gracias por el ejemplo.

        Exactamente denunciaba eso. Walt Disney murió en los la década de los 60!!!

        Son pura mafia. Y pagamos un gran lastre por ello. Otro ejemplo son las TV. El ver la TV en un segundo idioma es FUNDAMENTAL para dominarlo. Y europa necesita ciudadanos que dominen, además del su idiona, el Inglés, Francés o Alemán. La mejor clase de idiomas básica que puedes tomar es ver todos los días el Telediario en esa lenguan. Y la mejor clase de idiomas avanzada es ver películas en ese idioma.

        Europa neceista acabar con la mafia multimedia que se reparte el continente por barrios (países), como las maras centroamericanas.

        ¿Algún político que se atreva a desfiarlos?, No Los grandes medios lo arrastrarían por el barro.

        • JM - 11 enero 2024 - 17:42

          Se puede ver la televisión de muchos países europeos online.

          Lástima que yo ya no vea televisión.

          • Javier Lux - 11 enero 2024 - 18:18

            VPN es necesaria, ya que el geoblocaje está muy extendido. Además he visto sitios que detectan servidores VPN y los bloquean tambien

            La mayor parte de la gente no activa VPN.

      • Javier Lux - 11 enero 2024 - 14:38

        Por cierto. A título demostrativo Mickey se creó en los años 30 y Walt murió en 1960. Se liberalizará en 2024.

        En cambio los fantásticos e inovadores sooters de tres ruedas, Piaggio MP3, salieron al mercado en 2006. En 2025 o 26 las orquillas serán del dominio público y veremos un montón de scootters de 3 ruedas a partir del 26-27

    • Chipiron - 11 enero 2024 - 12:20

      Bien dicho! Cuando además, las patentes de ingeniería y farmacia son de mayor interés social que las del arte.

      Hay que fomentar que la gente invente, no sólo que «cree arte». Y eso implica una mayor vigencia, más protección y un descenso de los precios a la hora de patentar un invento!

    • JM - 11 enero 2024 - 17:43

      Totalmente de acuerdo.

Dejar un Comentario

Los comentarios están cerrados