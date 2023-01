Mi columna en Invertia de esta semana se titula «El copyright ataca de nuevo» (pdf), y pretende explicar la situación generada por la profusión de asistentes capaces de crear ilustraciones a partir de un texto, y por la denuncia por violaciones del copyright de tres artistas y del repositorio de imágenes Getty Images contra varias de las compañías que han creado esos asistentes.

En primer lugar, es importante entender que las denuncias planteadas tienen un importante problema: no son capaces de entender el proceso llevado a cabo por los algoritmos de machine learning que utilizan esos asistentes. De hecho, acusan a las compañías de almacenar enormes repositorios de imágenes comprimidas extraídas de la web sin el consentimiento de sus creadores originales, cuando la realidad es que esas compañías no almacenan imágenes, ni comprimidas ni sin comprimir, sino representaciones matemáticas de las mismas. Un algoritmo, por mucho que «mire», no «ve» una imagen, sino un mapa de píxeles que puede, eventualmente, interpretar de una manera determinada y modelizar matemáticamente mediante una serie de funciones. El software tampoco “recombina” ni funciona como “herramienta[s] de collage del siglo XXI”, ni junta fragmentos de imágenes en forma de collage, sino que crea imágenes desde cero basadas en estas representaciones matemáticas, como haría un artista que se inspira en otro.

Esos modelos matemáticos son los que almacenan las compañías en sus repositorios, que sería, en realidad, el equivalente de la memoria humana: no almacenamos una imagen, sino un conjunto de circuitos neuronales redundantes que nos permiten evocarla. Intentar impedir que un algoritmo pueda pasar por una página, examinar las imágenes contenidas en ella – recordemos que el web scraping es legal a todos los efectos – y generar con ellas una serie de funciones matemáticas sería como intentar impedir que los visitantes a un museo pudieran recordar lo que han visto, o que pudiesen inspirarse en ello para crear sus propias obras.

Con los algoritmos ocurre un poco lo que con el cerebro: si solo enseñamos a una persona obras creadas por un autor y muy similares, terminará creando, si posee las habilidades necesarias para ello, obras muy parecidas, que de hecho, podrán en realidad ser un plagio y ser consideradas como tal. Si enseñamos a un algoritmo obras de Leonardo da Vinci, considerando que su obra más habitualmente citada es la Mona Lisa («la más conocida, la más visitada, la más escrita, la más cantada, la obra de arte más parodiada del mundo»), ese sobre-muestreo hará que, ante un prompt que solicite «en el estilo de Leonardo da Vinci», se reproduzcan obras muy similares a la Mona Lisa.

Si algo conocemos del copyright son sus excesos. Artistas o herederos de artistas que ponen demandas y solicitan indemnizaciones porque una obra, aunque no repita ninguna secuencia de notas ni patrón instrumental, según los demandantes, «evoca su sentido y su sonido«. Y que no contentos con ganar en los tribunales más de siete millones de dólares, y creyendo que han encontrado el chollo de su vida, procedan a denunciar a otro artista por lo mismo. Los excesos del copyright son los que permiten que haya sinvergüenzas, que generalmente además no son artistas sino otra cosa diferente, que puedan enriquecerse reclamando el copyright del silencio, del ronroneo de un gato, de una imagen copiada de otro artista o en el dominio público, de la disposición de la comida en un plato o de cualquier otra cuestión completamente absurda y demencial, mucho más digna del diván de un psicoanalista que del estrado de un juez. Decididamente, si hay que poner algo bajo control, no es a los asistentes de machine learning que crean imágenes, sino más bien a los impresentables que se dedican a abusar del copyright.

Dicho esto, posiblemente haya que estudiar, por ejemplo, que si un autor no quiere y su copyright está vigente, los asistentes no admitan, por ejemplo, peticiones de imágenes que sigan su estilo, aunque incluso eso tendría que ser objeto de una discusión (porque si no se puede impedir que yo me inspire en un artista concreto, parece difícil impedir que lo haga un algoritmo). Que sus imágenes no sean incluidas en repositorios, lo lamento, pero es lo que hay: si tu arte se crea para ser visto, será visto, y la única manera que tienes de evitarlo es no publicándolo, guardando tu creación en un armario cerrado con llave. A partir de ahí, con los términos más claros y sin maximalismos tan típicos de los defensores radicales del copyright, que se abra la discusión…

Ah, y no, la ilustración del robot no es de Banksy. Es lo que Stable Diffusion generó cuando le pedí «a grafiti of a robot on a wall in Banksy style».