Resumo
- A OpenAI deve entregar 20 milhões de logs anônimos do ChatGPT em processo movido por jornais dos EUA, incluindo o The New York Times.
- A juíza Ona Wang determinou que os logs são essenciais para avaliar alegações de violação de direitos autorais, com medidas de desidentificação para proteger a privacidade dos usuários.
- A disputa envolve o uso de conteúdo jornalístico sem permissão para treinar IA, com a OpenAI contestando a decisão e apresentando recurso.
A OpenAI terá de entregar 20 milhões de logs de conversas anônimas do ChatGPT como parte do processo movido pelo The New York Times e outros veículos da imprensa dos Estados Unidos. A determinação foi tornada pública nesta quarta-feira (4), após decisão da juíza federal Ona Wang, em Nova York, que classificou os logs como essenciais para avaliar as acusações de violação de direitos autorais.
A disputa, iniciada em 2023, se concentra no uso de conteúdos jornalísticos sem permissão para treinar modelos de IA. A juíza rejeitou os argumentos de privacidade apresentados pela empresa, afirmando que o processo inclui “múltiplas camadas de proteção neste caso precisamente por causa da natureza altamente sensível e privada de grande parte das provas”.
O que a Justiça determinou?
Segundo a decisão, os logs devem ser entregues em até sete dias, desde que passem por um processo de remoção de qualquer dado que possa identificar usuários. A juíza reafirmou que a “exaustiva desidentificação” exigida no caso “mitigariam razoavelmente as preocupações com a privacidade”.
A OpenAI contestou a determinação e já apresentou recurso ao juiz principal do caso, Sidney Stein. Em comunicado anterior, o chefe de segurança da empresa, Dane Stuckey, afirmou que o pedido dos jornais “desconsidera proteções de privacidade de longa data” e “rompe com práticas de segurança de bom senso”.
Os jornais, por outro lado, sustentam que os logs são necessários para verificar se o ChatGPT reproduziu trechos protegidos por copyright – e para rebater a alegação da OpenAI de que teria havido uma espécie de tentativa de “hackear” as respostas do chatbot que se parecessem com material protegido.

Por que veículos pressionam as Big Techs?
Veículos administrados pela MediaNews Group também integram o processo. O editor-executivo do grupo, Frank Pine, declarou que a liderança da OpenAI estaria “alucinando quando pensavam que poderiam se safar ocultando provas de como seu modelo de negócios se baseia em roubar jornalistas que trabalham duro”.
A ação é uma entre várias movidas por detentores de direitos autorais contra empresas como OpenAI, Meta e Microsoft, acusadas de treinar sistemas de IA com conteúdo protegido sem autorização.
OpenAI é obrigada a entregar milhões de logs secretos do ChatGPT