LAION, la compañía alemana sin ánimo de lucro dedicada a la recopilación de imágenes para el desarrollo de sus propios algoritmos de inteligencia artificial y de otros que quieran utilizar su banco de datos libremente, ha obtenido una victoria judicial contra un fotógrafo aleman que pretendía que borrasen una serie de fotos de su autoría de la base de datos.

Esta victoria es la primera que un repositorio dedicado al entrenamiento de algoritmos obtiene contra una reclamación de copyright, y es potencialmente por ello muy importante de cara al futuro. Tras la publicación de herramientas que permiten saber si alguna imagen tuya o algún texto han sido utilizados para el entrenamiento de algoritmos, los juzgados se han llenado de pedigüeños que pretenden obtener compensaciones económicas por ello, algo que refleja únicamente su codicia y, desde mi punto de vista, una extensión injustificada, injustificable e ilógica de los derechos de autor.

Pretender que una imagen o una información, por el hecho de tener copyright, no puede ser utilizada para el entrenamiento de un algoritmo es como pretender que no podamos verla, recordarla o utilizarla para construir otras obras sobre ella, y debería ser considerado un absurdo conceptual. Como en su momento comentó Mustafa Suleyman, CEO de Microsoft AI, lo que está en la web en abierto, debe poder ser utilizado para el entrenamiento de algoritmos, y si no quieres que lo sea, no lo pongas en internet o especifica claramente, de manera que pueda ser leída e interpretada por una máquina, que no deseas que ese material sea utilizado para ese uso en concreto. Lo siento, pero eso de «no mires mi obra, que está libremente accesible en la red, porque podrías almacenarla en tu cerebro y utilizarla posteriormente sin pagarme» es completamente disfuncional.

Pocas cosas me parecen más pacatas, cutres e injustificables que protestar y pretender compensaciones porque un contenido creado por alguien ha sido utilizado para el entrenamiento de un modelo. Si quieres cobrar cuando alguien vea, lea, consuma o distribuya una obra tuya, vale, hazlo. ¿Pero cobrar cuando un algoritmo la utiliza para entrenarse? ¿Qué será lo siguiente? ¿Cobrar porque alguien piense en ella? He creado en mi vida miles de imágenes y textos, y las he publicado siempre con una licencia que permite su uso por parte de terceros. Me consta que muchas de esas imágenes y textos han sido, de hecho, recopiladas y utilizadas para muchos usos, y es más, me enorgullece. ¿Tiene algún sentido que me ofenda porque esos contenidos sean utilizados para entrenar a unos algoritmos que, eventualmente, serán la base de la inteligencia del futuro y de una eventual generación de riqueza? En modo alguno puede resultarme ofensivo que un algoritmo piense como yo lo he expresado en mis artículos o componga fotografías como yo lo he hecho. Cuanto más las utilicen, mejor para mí.

De hecho, en la primera contestación de LAION a la petición del fotógrafo, la compañía afirmó simplemente que no había nada que pudiera borrar, porque no posee imágenes, sino únicamente enlaces a las mismas. Ante eso, el fotógrafo argumentó que la compañía había hecho copias de las fotografías para extraer información de ellas, y que eso, según él, constituía una violación del copyright. Sin embargo, el argumento presentado por los demandados fue que cumplían escrupulosamente con la excepción de recopilación de datos para la minería de textos y datos existente en la legislación alemana, y que como tal, y por el hecho de ser una organización de investigación, se les permite llevar a cabo una reproducción de una obra con el fin de extraer información.

El tribunal apreció que si bien la gigantesca base de datos de LAION ha sido utilizada por organizaciones comerciales, el conjunto de datos en sí se había puesto a disposición del público de forma gratuita, y no se había presentado ninguna prueba de que ninguna entidad comercial tuviera control sobre sus operaciones, y por lo tanto, el conjunto de datos no es comercial y está destinado a la investigación científica. Por tanto, las acciones de LAION están cubiertas por la sección 60d de la Ley de Derechos de Autor alemana y, en consecuencia, no existe infracción de derechos de autor, lo que permite desestimar el caso.

Se trata de un caso que podría terminar siendo histórico y muy significativo, la primera prueba jurídica de las excepciones que permiten el entrenamiento de algoritmos con contenidos disponibles en la red. Sin embargo, el impacto jurídico en sí mismo podría ser limitado porque solamente habla del uso de minería de texto y datos para la creación de un conjunto de datos, sin entrar específicamente en el entrenamiento real de un modelo, de modo que otros tribunales de otros países o incluso alemanes podrían llegar a distintas conclusiones. Pero por el momento, todo parece indicar que LAION y otras compañías en casuísticas similares pueden estar razonablemente tranquilas: todo indica que están operando en el lado correcto de las excepciones a un concepto como el copyright, que además, debería ser objeto de una revisión y una restricción muy necesarias.

Veremos si más tribunales siguen poniéndose del lado correcto, del que afirma que por muchos derechos de autor que se esgriman, lo razonable es que una creación a la que puede accederse libremente pueda ser utilizada para el entrenamiento de modelos, ya que ese uso no tiene absolutamente nada que ver ni con el consumo de esos materiales sujetos a derechos de autor, ni con su distribución. Ya está bien de abusos irracionales de un copyright que jamás debió llegar a los extremos y a los niveles a los que ha llegado.

This article is also available in English on my Medium page, «LAION case could leave a lasting imprint«