Un grupo de escritores demanda a Microsoft por el uso de sus libros en el entrenamiento de IA

Los demandantes reclaman hasta $150.000 por cada obra utilizada indebidamente

Guardar
Se acusa a Microsoft de
Se acusa a Microsoft de emplear versiones digitales no autorizadas de sus libros para alimentar a su IA Megatron. (Vecteezy)

Un grupo de autores ha presentado una demanda federal en Nueva York contra Microsoft, compañía a la que acusa de utilizar libros pirateados para entrenar su modelo de inteligencia artificial. La acción legal, interpuesta el martes 26 de junio, representa el episodio más reciente en la creciente disputa entre creadores de contenido y gigantes tecnológicos por el uso de obras protegidas por derechos de autor en el desarrollo de dichos sistemas.

Entre los demandantes figuran Kai Bird, Jia Tolentino y Daniel Okrent, junto a otros escritores que sostienen que Microsoft empleó versiones digitales no autorizadas de sus libros para alimentar a Megatron, un sistema de IA capaz de responder a indicaciones humanas mediante texto. Según la denuncia difundida por The Guardian, la empresa habría recurrido a una colección de casi 200.000 libros pirateados, lo que, a juicio de los autores, constituye una infracción directa de sus derechos de propiedad intelectual.

La demanda solicita al tribunal que emita una orden judicial para impedir que Microsoft continúe con la supuesta infracción y reclama daños legales de hasta $150.000 por cada obra utilizada indebidamente. Esta cifra podría traducirse en una suma multimillonaria si se confirma el uso de la totalidad del corpus alegado. Los portavoces de Microsoft no respondieron de inmediato a las solicitudes de comentarios sobre el caso, mientras que el abogado de los autores declinó hacer declaraciones públicas.

Microsoft y NVIDIA desarrollan Megatron.
Microsoft y NVIDIA desarrollan Megatron. (TNE)

El documento presentado ante el tribunal sostiene además que Microsoft habría diseñado su modelo informático para “generar una amplia gama de expresiones que imitan la sintaxis, la voz y los temas de las obras protegidas por derechos de autor con las que se entrenó”. Los demandantes argumentan que este proceso va más allá de un uso incidental o transformador, ya que la IA resultante reproduce patrones estilísticos y temáticos propios de los textos originales.

Aumento de casos similares

La controversia sobre el uso de material protegido para entrenar sistemas de inteligencia artificial no es exclusiva de este caso. En los últimos meses, varios autores, medios de comunicación y otros titulares de derechos han iniciado acciones legales contra empresas tecnológicas como Meta Platforms, Anthropic y OpenAI —esta última respaldada por Microsoft— por prácticas similares. La batalla legal se ha intensificado a medida que la IA generativa, capaz de producir texto, música, imágenes y vídeos a partir de indicaciones de los usuarios, se consolida como una de las tecnologías más disruptivas de la actualidad.

El proceso de entrenamiento de estos modelos requiere la recopilación de enormes bases de datos multimedia, que los ingenieros de software utilizan para programar la IA y lograr que produzca resultados comparables a los de los creadores humanos.

La demanda contra Microsoft se produce en un contexto judicial especialmente activo. Un día antes de su presentación, un juez federal de California dictaminó que Anthropic hizo un uso legítimo, bajo la ley estadounidense de derechos de autor, del material de los autores para entrenar sus sistemas de IA, aunque dejó abierta la posibilidad de que la empresa pudiera ser responsable de piratear libros.

Microsoft. (AFP)
Microsoft. (AFP)

El día posterior a la demanda, otro juez de California falló a favor de Meta en una disputa similar sobre el uso de libros con derechos de autor para entrenar sus modelos de IA. El fallo, sin embargo, se basó más en la debilidad de los argumentos de los demandantes que en la fortaleza de la defensa de la empresa tecnológica, según consta en la resolución judicial.

Disputa con los medios

La lucha por los derechos de autor en la era de la inteligencia artificial se ha extendido a múltiples sectores creativos. El New York Times ha demandado a OpenAI por la presunta infracción de los derechos de autor de su archivo de artículos, mientras que Dow Jones, empresa matriz de The Wall Street Journal y The New York Post, ha presentado una demanda similar contra Perplexity AI.

Las grandes discográficas han iniciado acciones legales contra compañías que desarrollan generadores de música con IA, y la empresa de fotografía Getty Images ha demandado a Stability AI por su producto de conversión de texto a imagen. Disney y NBC Universal también han llevado a los tribunales a Midjourney, responsable de un popular generador de imágenes con IA, por el presunto uso indebido de personajes de cine y televisión reconocidos mundialmente.