Nova Iorque
CNN
–
O New York Times processou a OpenAI e a Microsoft por violação de direitos autorais, alegando que a tecnologia de IA das empresas copiou ilegalmente milhões de artigos do Times para treinar o ChatGPT e outros serviços para fornecer às pessoas acesso instantâneo à informação – tecnologia que agora compete com… O Tempos.
A reclamação é O mais recente de uma série de ações judiciais Que procura limitar o uso de suposta extração de grandes áreas de conteúdo online – sem compensação – para treinar os chamados modelos de IA de grande linguagem. atores, Escritores, jornalistas e outros tipos criativos Aqueles que publicam o seu trabalho online temem que a inteligência artificial aprenda com o seu material e lhes forneça chatbots competitivos e outras fontes de informação sem compensação adequada.
Mas o processo do Times é o primeiro entre os principais editores de notícias a competir com a OpenAI e a Microsoft, as duas marcas de IA mais conhecidas. Microsoft (MSFT) tem assento no conselho de administração da OpenAI e um investimento multibilionário na empresa.
Em uma reclamação apresentada na quarta-feira, o Times disse que tinha o dever de informar seus assinantes, mas que “o uso ilegal do trabalho do Times pela Microsoft e pela OpenAI para criar produtos de inteligência artificial que concorram com ele ameaça a capacidade do Times de fornecer esse serviço”. O jornal observou que a OpenAI e a Microsoft usaram outras fontes para a “cópia em grande escala”, mas “deram foco especial ao conteúdo do Times”, buscando “aproveitar o enorme investimento do Times em seu jornalismo, usando-o para construir alternativas produtos sem permissão ou prêmio.”
“Respeitamos os direitos dos criadores e proprietários de conteúdo e estamos comprometidos em trabalhar com eles para garantir que se beneficiem da tecnologia de IA e de novos modelos de receita”, disse a OpenAI em comunicado do porta-voz Lindsey Held. “Nossas conversas contínuas com o The New York Times têm sido produtivas e avançando de forma construtiva, por isso estamos surpresos e desapontados com este desenvolvimento. Esperamos encontrar uma maneira mutuamente benéfica de trabalharmos juntos, como fazemos com muitos outros editores.”
A Microsoft não respondeu a um pedido de comentário sobre o processo.
Na sua queixa, o Times disse que se opôs quando descobriu, meses atrás, que o seu trabalho tinha sido usado para treinar grandes modelos de linguagem corporativa. O Times disse que começou em abril Negocie com a OpenAI e a Microsoft para obter uma compensação justa e determinar os termos do acordo.
Mas o Times afirma que não conseguiu chegar a uma solução com as empresas. A Microsoft e a OpenAI afirmam que os trabalhos do Times se qualificam como “uso justo”, dando-lhes a capacidade de usar material protegido por direitos autorais para “fins transformadores”, afirma a reclamação.
O Times contestou veementemente esta afirmação, dizendo que o ChatGPT e o chatbot Bing da Microsoft (também conhecido como “copiloto”) poderiam fornecer um serviço semelhante ao do The New York Times.
“Não há nada de 'transformador' em usar o conteúdo do Times sem remuneração para criar produtos que substituam o Times e roubem audiência dele”, disse o jornal em sua denúncia. “Como os resultados dos modelos GenAI dos réus competem e imitam de perto os dados usados para treiná-los, copiar os trabalhos do Times para esse fim não é um uso justo.”
O Times está entre uma série de redações importantes, incluindo a CNN, que no início deste ano Adicionado código ao site deles O que impede que o rastreador da Web da OpenAI, GTBot, verifique conteúdo em suas plataformas.
Em ações judiciais separadas, mas relacionadas, no início deste ano, a comediante Sarah Silverman e dois autores foram acusados Abra uma ação judicial contra Meta e OpenAI Em julho, ela alegou que os modelos de linguagem de IA das empresas foram treinados em material protegido por direitos autorais escrito por ela sem o seu conhecimento ou consentimento. Nenhuma das empresas comentou o processo. Juiz em novembro Foi rejeitado A maioria das reivindicações judiciais.
Um grupo de escritores de ficção famosos juntou-se ao Authors Guild para abrir um processo separado Processo Contra OpenAI em setembro, Com base na tecnologia da empresa Usa ilegalmente seus trabalhos protegidos por direitos autorais.
O Times alega em seu processo que os conjuntos de dados usados para treinar os mais recentes modelos de linguagem de grande porte da OpenAI, que alimentam suas ferramentas de IA, “provavelmente teriam sido usados por milhões de empresas de propriedade do Times”. Em um instantâneo em inglês de 2019 de um desses conjuntos de dados – chamado Common Crawl e conhecido como “uma cópia da Internet” – o site do New York Times é a terceira fonte de informação mais representativa, depois da Wikipedia e do banco de dados de documentos de patentes dos EUA, de acordo com a denúncia.
O Times afirma que, como suas ferramentas de IA são treinadas em seu conteúdo, elas podem “gerar resultados que lêem o conteúdo do Times literalmente, resumem-no de perto e imitam seu estilo expressivo, conforme demonstrado por dezenas de exemplos… Essas ferramentas também falsamente atribuir informações falsas ao Times.”, afirma a denúncia.
Em um caso citado na reclamação, o ChatGPT forneceu a um usuário os três primeiros parágrafos do artigo vencedor do Prêmio Pulitzer de 2012, “Queda de neve: a avalanche em Tunnel Creek”, depois que o usuário reclamou no bate-papo sobre ter sido atingido por um acesso pago em Os tempos. E não poder ler.
A agência de notícias também afirma que o mecanismo de busca Bing da Microsoft, que foi Ele foi promovido no início deste ano Usando a tecnologia OpenAI, ele “transcreve e classifica” o conteúdo do Times para produzir respostas mais longas e detalhadas do que os motores de busca tradicionais.
“Ao disponibilizar o conteúdo do Times sem permissão ou autorização do The Times, os réus prejudicam e prejudicam o relacionamento do Times com seus leitores e privam o Times de receitas de assinaturas, licenciamento, publicidade e afiliados”, disse a denúncia.
Mas lutar contra a IA é como enfiar o dedo numa represa. Está chegando, e editores como o The New York Times sabem que terão que abraçar o futuro. Eles só querem ter certeza de que será um futuro em que receberão uma compensação justa, disse o New York Times.
“Reconhecemos o potencial”, disse a vice-presidente executiva e conselheira geral do New York Times, Diane Brighton, à equipe do jornal em um memorando na manhã de quarta-feira. [generative AI] Ao público e à imprensa.”
“Mas, ao mesmo tempo, acreditamos que o sucesso da GenAI e das empresas que a desenvolvem não deve ocorrer às custas das organizações de notícias”, segundo o memorando obtido pela CNN. “O uso do nosso trabalho para criar ferramentas GenAI deve vir com permissão e um acordo que reflita o valor justo desse trabalho, conforme determina a lei.”
Na sua acção judicial, o jornal pede milhares de milhões de dólares por danos, mas não especifica a compensação que pretende pela alegada violação dos seus materiais protegidos por direitos de autor. Também está buscando uma liminar permanente que impeça a Microsoft e a OpenAI de continuar a alegada infração. O Times também procura “destruir” o GPT e quaisquer outros modelos de inteligência artificial ou conjuntos de dados de treinamento que seu jornalismo inclua.
O processo do Times poderia, em última análise, estabelecer um precedente para a indústria em geral, porque a questão de saber se o uso de materiais protegidos por direitos autorais para treinar modelos de IA viola a lei é uma questão legal não resolvida, de acordo com Dina Blichstein, sócia do Artificial Intelligence and Deep Learning Practice Group. No escritório de advocacia Heinz Bohn.
“Acho que muitos desses tipos de trajes serão lançados, acho que eventualmente [the issue will] “Levando isso à Suprema Corte, nesse ponto teremos alguma jurisprudência específica”, disse Blichstein, acrescentando que agora, “não há nada específico para grandes modelos de linguagem e IA só porque é muito novo”.
Esta história foi atualizada com desenvolvimentos e contexto adicionais.