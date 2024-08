En marzo de este año, tres autores, Brian Keene, Abdi Nazemian y Stewart O’Nan iniciaron un procedimiento legal contra Nvidia porque sus obras formaban parte de una colección de 196,640 libros, conocida como Books3, utilizada por la compañía para entrenar su plataforma NeMo, que ofrece a sus clientes para la construcción, personalización y despliegue de aplicaciones de inteligencia artificial generativa.

La colección en cuestión, Books3, es polémica porque fue compilada por investigadores precisamente con la función de entrenar algoritmos y compartida a través de Hugging Face, y ha sido utilizada por prácticamente todas las compañías dedicadas a ello, pero nunca solicitó ningún tipo de derechos de autor, porque la función de esa colección no era en ningún momento proporcionar los libros para su lectura ni para su distribución. Pero a partir del momento en que se supo que esa colección estaba siendo ampliamente utilizada, varios autores que encontraron sus obras en ella han denunciado a varias compañías alegando que han sido utilizadas sin su permiso. De hecho, la colección ya no está disponible, ha sido retirada.

¿La respuesta de Nvidia? Muy sencilla: niega cualquier tipo de infracción del copyright y afirma que su plataforma NeMo cumple con los derechos de autor, y que todos los libros han sido utilizados en perfecta consonancia con la doctrina de uso legítimo o fair use. Nvidia, con toda lógica, sostiene que sus modelos de inteligencia artificial no utilizan los libros como lo hacen los humanos, ni mucho menos los reproducen. Lo que hacen, simplemente, es examinar los hechos e ideas que aparecen reflejados en los libros, y transformar su propósito original para construir un modelo de inteligencia artificial complejo.

Según la compañía, los demandantes no pueden pretender utilizar los derechos de autor para impedir el acceso a los hechos y las ideas, porque aceptar la teoría de los demandantes significaría que un autor podría registrar las reglas gramaticales, o los hechos básicos sobre el mundo, algo que nunca ha sido legal – y por una muy buena razón. Por tanto, el proceso de entrenamiento, que transforma completamente las obras y en modo alguno las consume (de manera sustitutiva de un consumo legítimo por un humano) ni las distribuye, está protegido por completo por la bien establecida doctrina del uso legítimo.

El proceso de entrenamiento mide las correlaciones estadísticas en conjunto a lo largo de un enorme conjunto de datos, y las codifica en los parámetros de un modelo. Los demandantes no intentan reclamar derechos de autor sobre esas correlaciones estadísticas, sino que afirman que los datos de entrenamiento en sí mismos se «copian» con fines de infracción, algo completa y absolutamente falso.

El copyright, como todo, debe tener límites. Si creas una obra y está protegida por copyright, debes disfrutar de una protección LIMITADA que impida determinadas explotaciones o usos que puedan resultar competitivos con el que tú deseas hacer. Sin embargo, entrenar a un algoritmo no es leer un libro, ni venderlo, ni reproducirlo, ni mucho menos distribuirlo (no puedes obtener el libro a partir del algoritmo), y por tanto, no debe regirse por los mismos principios que una infracción de copyright al uso, porque no se está produciendo ninguno de los supuestos de esta.

Francamente, y sabiendo que eso será polémico, me alineo completamente con la idea de Nvidia. El copyright no puede servir para impedir cualquier uso, del mismo modo que no puede servir para que alguien se inspire o para que cree nuevas obras basadas en otras, siempre que no las reproduzca de manera textual. Seguir extendiendo el copyright, originalmente «derecho de copia», más allá de lo que ya está extendido – y que, personalmente, siempre he considerado a todas luces excesivo – supone impedir usos que no tiene ningún sentido impedir, basándose en supuestos que no se cumplen y que no reflejan lo que las leyes de protección del copyright pretenden proteger. El copyright nunca incluyó la prohibición de entrenar un algoritmo con una obra, del mismo modo que no podría incluir el hecho de «pensar sobre ella» o «basar un razonamiento en ella».

Estamos, seguramente, ante lo que será una de las grandes polémicas de la inteligencia artificial, y sin duda, tardará mucho en resolverse. Para cuando lo haga, seguramente, será ya irrelevante y únicamente podrá generar, si lo hace, pagos a unos autores cuyos libros no han sido leídos ni consumidos por nadie, que no han sido distribuidos de manera irregular, y sobre todo, de una manera que no ha generado ningún tipo de perjuicio a esos autores (salvo el de no recibir ese dinero). Sería equivalente a tener que pagarles por utilizar sus libros para construir con ellos una estantería o un mueble.

Los excesos y el fundamentalismo aplicados al copyright nunca traerán nada bueno. Dejémonos de utilizar el copyright para todo y por encima de todo, por favor.