Anthropic podrá entrenar sus modelos de IA con libros adquiridos legalmente sin el permiso de los autores

Guardar

Anthropic podrá utilizar libros adquiridos legalmente para entrenar sus modelos de inteligencia artificial (IA) sin necesidad de obtener permiso de los autores, aunque deberá enfrentarse a un nuevo juicio por beneficiarse "millones de libros" pirateados descargados de Internet.

El entrenamiento de los modelos de IA requiere utilizar enormes cantidades de datos para mejorar sus resultados, lo que en ocasiones puede motivar el uso indebido de contenidos, en su mayoría procedentes de Internet, incluido aquel que está protegido por los derechos de autor.

Esto llevó a un grupo de escritores, liderado por Andrea Bartz, Charles Graeber y Kirk Wallace Johnson, a demandar a Anthropic en agosto del pasado año, acusándola de robar "cientos de miles de libros con derechos de autor", al utilizar libros físicos y un conjunto de datos de código abierto llamado 'The Pile' para entrenar sus modelos de IA, Claude, incluyendo una biblioteca de libros electrónicos pirateados denominada Books3.

Ahora, el juez federal del Distrito Norte de California, William Alsup, quien ha valorado el caso, ha determinado que entrenar modelos de IA con libros adquiridos legalmente, aún sin el permiso de los autores, constituye un uso legítimo.

Concretamente, Anthropic podrá utilizar libros adquiridos en formato físico y posteriormente digitalizados por la empresa porque se considera un uso suficientemente "transformador" de estas obras y, por tanto, no se están incumpliendo los derechos de autor, aunque su uso deberá estar limitado exclusivamente al entrenamiento de modelos de IA.

Esto se debe a que, según ha matizado el juez en el documento del fallo, la tecnología de IA de Anthropic "es una de las más transformadoras" que muchos de los usuarios verán en sus vidas. Además, ha apostillado que la Ley de Derechos de Autor "busca promover las obras originales de autoría, no proteger a los autores de la competencia".

USO DE LIBROS PIRATEADOS

No obstante, Alsup ha dictaminado que la tecnológica deberá enfrentarse igualmente a un nuevo juicio para examinar el uso de libros pirateados, ya que, almacenar copias de libros, como las halladas en la biblioteca Books3, no se considera un uso legítimo.

Así, el juez ha puesto en duda por qué Anthropic decidió recurrir a la descarga de copias originales a partir de sitios pirata, cuando podría haber comprado dichos libros o acceder legalmente a su contenido, y ha señalado que el juicio enfocado a este comportamiento servirá para determinar los daños resultantes.

Anthropic descargó al menos siete millones de libros ilegalmente, según se desprende del documento del fallo y, tal y como ha recogido Wired, la multa por esta descarga ilegal puede ascender a los 750 dólares por libro.

Por su parte, Anthropic ha trasladado su satisfacción por la decisión del Tribunal, al tiempo que ha matizado que "en consonancia con el propósito del derecho de autor de fomentar la creatividad y el progreso científico", sus modelos se entrenaron con obras literarias "no para adelantase a ellas y replicarlas o suplantarlas, sino para superar un obstáculo y crear algo diferente", tal y como ha manifestado la portavoz de la compañía, Jennifer Martinez, en declaraciones a The Verge.

Se ha de tener en cuenta que Anthropic ya enfrentó una demanda interpuesta por grupos editores de música en Estados Unidos, como es el caso de Concord Music Group, Universal Music Group y ABKCO Music, quienes señalaron que la compañía había infringido "de manera sistemática y generalizada" los derechos de autor al utilizar letras de canciones protegidas, con el fin de "construir y operar modelos de IA".

En este caso, la demanda se saldó a favor de los grupos editores de música, teniendo Anthropic que garantizar que sus modelos Claude no reproduzcan letras de canciones protegidas por derechos de autor, mediante medidas de contención en sus grandes modelos de lenguaje.