OpenAI y The New York Times intensifican su disputa judicial por el registro de las conversaciones de ChatGPT

La empresa de Altman asegura que la entrega masiva de esta información podría exponer datos sensibles, mientras desarrolla nuevas funciones de seguridad y cuestiona la pertinencia de la solicitud en el contexto de derechos de autor

Guardar
The New York Times exige
The New York Times exige el acceso a millones de conversaciones de ChatGPT para investigar presunta infracción de derechos de autor. REUTERS/Shannon Stapleton/File Photo

La disputa entre OpenAI y The New York Times ha escalado luego de que la empresa de inteligencia artificial solicitara a un tribunal federal en Nueva York la revocación de la orden que la obliga a entregar 20 millones de registros anónimos de chats de ChatGPT. Esta exigencia surge en el marco de una demanda por presunta infracción de derechos de autor.

Según informó Reuters, OpenAI argumenta que cumplir con este requerimiento pondría en riesgo la privacidad de los usuarios y que la gran mayoría de los registros no guarda relación con las acusaciones planteadas en el caso. El eje de la controversia es la demanda presentada por The New York Times y otros medios de comunicación, quienes afirman que OpenAI utilizó artículos protegidos por derechos de autor para entrenar ChatGPT, permitiendo que el sistema reproduzca contenido periodístico en sus respuestas.

Los demandantes sostienen que el acceso a los registros de chat sería esencial para demostrar si el chatbot replicó material protegido y para refutar la afirmación de OpenAI de que los demandantes “hackearon” las respuestas del sistema para fabricar pruebas, informó Reuters.

En la documentación judicial, OpenAI advirtió que la entrega de los registros implicaría revelar información confidencial de los usuarios, ya que cada chat solicitado representa una conversación entera compuesta por múltiples pares de preguntas y respuestas.

OpenAI solicita a un tribunal
OpenAI solicita a un tribunal de Nueva York revocar la orden de entregar 20 millones de chats de ChatGPT a The New York Times. REUTERS/Dado Ruvic/Illustration

La empresa subrayó que “más del 99,99%” de los registros no guardan relación con el caso, y expresó que esto podría equivaler a que cualquier usuario de ChatGPT en los últimos tres años enfrente la posibilidad de que sus conversaciones personales sean examinadas por The New York Times, según el expediente judicial citado por Reuters.

La jueza magistrada Ona Wang ordenó a OpenAI producir los chats, asegurando salvaguardas como un proceso “exhaustivo de desidentificación” de la información y otras medidas para resguardar la privacidad. La orden fija como fecha máxima de entrega el 14 de noviembre de 2025, o bien siete días después de finalizar el proceso de anonimización, informó Business Insider.

No obstante, OpenAI sostiene que la desidentificación no elimina datos que, aunque no permitan identificar a los usuarios, podrían seguir siendo privados. La empresa ejemplificó con el uso hipotético de ChatGPT por parte de un periodista de The Washington Post para preparar un artículo, según la presentación recogida por Reuters.

En una publicación en el sitio web corporativo, el director de seguridad de la información de OpenAI, Dane Stuckey, cuestionó la solicitud de The New York Times y afirmó: “La exigencia de la publicación ignora protecciones de privacidad de larga data y contradice prácticas de seguridad de sentido común”.

La jueza Ona Wang ordena
La jueza Ona Wang ordena a OpenAI producir los chats bajo estrictas medidas de desidentificación y protección de datos personales. (Imagen Ilustrativa Infobae)

Stuckey agregó: “El periodismo ha defendido históricamente el derecho a la privacidad de las personas. Sin embargo, esta exigencia de The New York Times no está a la altura de ese legado, y estamos pidiendo al tribunal que la rechace”, según publicó Business Insider.

OpenAI también informó a sus usuarios que The New York Times exige la entrega de 20 millones de conversaciones privadas con ChatGPT para buscar ejemplos de elusión del muro de pago, según declaraciones recogidas por Reuters. Además, anunció el desarrollo de “funciones avanzadas de seguridad diseñadas para proteger la privacidad de los datos, incluyendo cifrado del lado del cliente para los mensajes con ChatGPT”.

La empresa argumenta que la producción de los registros debe limitarse a los relevantes para el caso, y asegura que nunca tuvo conocimiento de una orden judicial que obligara a entregar datos personales en escala similar.

En su escrito, OpenAI manifestó: “Esto sienta un precedente peligroso: sugiere que cualquiera que demande a una empresa de inteligencia artificial puede exigir decenas de millones de conversaciones sin limitar su pertinencia".

OpenAI desarrolla nuevas funciones de
OpenAI desarrolla nuevas funciones de seguridad y cifrado para proteger la privacidad de los datos de los usuarios de ChatGPT. (Imagen Ilustrativa Infobae)

La muestra de 20 millones de chats corresponde a conversaciones aleatorias de usuarios de ChatGPT entre diciembre de 2022 y noviembre de 2024, excluyendo clientes empresariales, según OpenAI. Los registros se almacenan en un sistema seguro, “protegido bajo retención legal”, lo que impide su uso fuera del cumplimiento de obligaciones legales. OpenAI recalcó que The New York Times estaría legalmente obligado a no divulgar ningún dato fuera del proceso judicial y que la empresa se opondrá a intentos de publicitar las conversaciones.

En documentos judiciales, The New York Times acusó a OpenAI de incumplir acuerdos previos al negarse a entregar una muestra, aunque pequeña, de los miles de millones de resultados generados por el modelo en cuestión. OpenAI sostiene que las solicitudes iniciales de los demandantes se limitaron a registros relacionados con contenido del Times, y que estuvo colaborando a través del muestreo de registros.

Sin embargo, al culminar ese proceso, los demandantes solicitaron la entrega completa de la muestra de 20 millones de registros “mediante disco duro”, según datos recogidos por Reuters.

La jueza Wang fundamentó su decisión en el caso Concord Music Group, Inc. v. Anthropic PBC, en California, donde se ordenó la entrega de cinco millones de registros. Expresó que OpenAI no explicó por qué ese precedente no sería aplicable aquí. OpenAI, a su vez, argumentó que no tuvo oportunidad de detallar por qué el fallo anterior no debía extrapolarse, ya que los demandantes no lo mencionaron en su moción.

OpenAI argumenta que más del
OpenAI argumenta que más del 99,99% de los registros solicitados no están relacionados con la demanda de The New York Times. (Imagen Ilustrativa Infobae)

La empresa también destacó que, a diferencia del caso Concord —donde los registros eran pares individuales de pregunta y respuesta—, los registros solicitados ahora comprenden conversaciones completas, lo que podría equivaler a “hasta 80 millones de pares de preguntas y respuestas”, según documentación citada por Reuters.

El litigio entre The New York Times, OpenAI y Microsoft figura entre los más avanzados y de mayor alcance en materia de derechos de autor aplicados a inteligencia artificial, según Business Insider. Los abogados de las partes trabajan bajo estrictas medidas de seguridad: deben revisar el material confidencial en computadoras sin acceso a internet y bajo vigilancia, además del proceso de desidentificación para suprimir datos sensibles.

OpenAI solicitó al tribunal que reconsidere la orden, argumentando que “ni el sentido común ni las normas federales justifican la producción forzada de una enorme cantidad de conversaciones personales irrelevantes de los usuarios”, de acuerdo con información judicial citada por Business Insider.

La empresa sostiene que no se le brindó la oportunidad adecuada para explicar por qué la jueza Wang habría aplicado precedentes legales incorrectos al sustentar su decisión.