martedì, Dicembre 24, 2024

Il New York Times fa causa a OpenAI e Microsoft per violazione del copyright

| Data:


New York
CNN

Il New York Times ha citato in giudizio OpenAI e Microsoft per violazione del copyright, sostenendo che la tecnologia AI delle società ha copiato illegalmente milioni di articoli del Times per addestrare ChatGPT e altri servizi a fornire alle persone accesso immediato alle informazioni, tecnologia che ora compete con… Volte.

La denuncia è L'ultimo di una serie di cause legali Che cerca di limitare l’uso del presunto scraping di ampie fasce di contenuti online – senza compenso – per addestrare i cosiddetti modelli di intelligenza artificiale big-lingual. attori, Scrittori, giornalisti e altri tipi creativi Coloro che pubblicano il proprio lavoro online temono che l’intelligenza artificiale impari dal loro materiale e fornisca loro chatbot competitivi e altre fonti di informazione senza un adeguato compenso.

Ma la causa del Times è la prima tra i principali editori di notizie a competere con OpenAI e Microsoft, i due marchi di intelligenza artificiale più noti. Microsoft (MSFT) ha un posto nel consiglio di amministrazione di OpenAI e un investimento multimiliardario nella società.

In una denuncia presentata mercoledì, il Times ha affermato di avere il dovere di informare i propri abbonati, ma che “l'uso illegale del lavoro del Times da parte di Microsoft e OpenAI per creare prodotti di intelligenza artificiale che competono con esso minaccia la capacità del Times di fornire tale servizio”. Il giornale ha osservato che OpenAI e Microsoft hanno utilizzato altre fonti per la “copia su larga scala”, ma hanno “prestato particolare attenzione ai contenuti del Times” cercando di “sfruttare gratuitamente il massiccio investimento del Times nel suo giornalismo utilizzandolo per costruire alternative”. prodotti senza permesso o premio.

“Rispettiamo i diritti dei creatori e dei proprietari di contenuti e ci impegniamo a lavorare con loro per garantire che traggano vantaggio dalla tecnologia AI e dai nuovi modelli di reddito”, ha affermato OpenAI in una dichiarazione del portavoce Lindsey Held. “Le nostre conversazioni in corso con il New York Times sono state produttive e stanno andando avanti in modo costruttivo, quindi siamo sorpresi e delusi da questo sviluppo. Speriamo di trovare un modo reciprocamente vantaggioso di lavorare insieme, come facciamo con molti altri editori.”

READ  Lauren Sanchez, fidanzata di Jeff Bezos, dice che Southwest l'ha rifiutata come assistente di volo a causa del suo peso

Microsoft non ha risposto a una richiesta di commento sulla causa.

Nella sua denuncia, il Times ha affermato di essersi opposto quando ha scoperto mesi fa che il suo lavoro era stato utilizzato per formare modelli linguistici aziendali di grandi dimensioni. Il Times ha detto che è iniziato ad aprile Negoziare con OpenAI e Microsoft per ottenere un giusto compenso e determinare i termini dell'accordo.

Ma il Times sostiene di non essere riuscito a raggiungere una soluzione con le aziende. Microsoft e OpenAI sostengono che le opere del Times si qualificano come “fair use”, dando loro la possibilità di utilizzare materiale protetto da copyright per “scopi trasformativi”, afferma la denuncia.

Il Times ha contestato fermamente questa affermazione, affermando che ChatGPT e il chatbot Bing di Microsoft (noto anche come “copilota”) potrebbero fornire un servizio simile a quello del New York Times.

“Non c'è nulla di 'trasformativo' nell'utilizzare i contenuti del Times senza compenso per creare prodotti che sostituiscano il Times e gli sottraggano pubblico”, ha affermato il giornale nella sua denuncia. “Poiché i risultati dei modelli GenAI degli imputati competono e imitano da vicino gli input utilizzati per addestrarli, copiare i lavori del Times per questo scopo non è un fair use”.

Il Times è tra una serie di importanti redazioni, inclusa la CNN, che ha pubblicato all'inizio di quest'anno Aggiunto codice al loro sito web Ciò impedisce al web crawler di OpenAI, GTBot, di scansionare le proprie piattaforme alla ricerca di contenuti.

In cause legali separate ma correlate all'inizio di quest'anno, la comica Sarah Silverman e due autori sono stati accusati Avvia una causa contro Meta e OpenAI A luglio, ha affermato che i modelli linguistici dell'intelligenza artificiale delle aziende erano stati addestrati su materiale protetto da copyright scritto da lei a sua insaputa o senza il suo consenso. Nessuna delle due società ha commentato la causa. Giudice a novembre È stato rifiutato La maggior parte delle richieste legali.

Un gruppo di famosi scrittori di narrativa si è unito alla Authors Guild intentando una causa separata Causa Contro OpenAI a settembre, Sulla base della tecnologia dell'azienda Utilizza illegalmente le loro opere protette da copyright.

READ  Le esportazioni cinesi sono diminuite per il quarto mese consecutivo

Il Times sostiene nella sua causa che i set di dati utilizzati per addestrare gli ultimi modelli linguistici di grandi dimensioni di OpenAI, che alimentano i suoi strumenti di intelligenza artificiale, “erano probabilmente stati utilizzati da milioni di aziende di proprietà del Times”. In un’istantanea in lingua inglese del 2019 di uno di questi set di dati – chiamato Common Crawl e noto come “una copia di Internet” – il sito web del New York Times è la terza fonte di informazioni più rappresentativa, dopo Wikipedia e il database dei documenti sui brevetti degli Stati Uniti. secondo la denuncia.

Il Times afferma che, poiché i suoi strumenti di intelligenza artificiale sono addestrati sul suo contenuto, possono “generare un output che legge il contenuto del Times alla lettera, lo riassume fedelmente e ne imita lo stile espressivo, come dimostrato da dozzine di esempi… Questi strumenti sono anche falsamente attribuiscono false informazioni al Times”, si legge nella denuncia.

In un caso citato nella denuncia, ChatGPT ha fornito a un utente i primi tre paragrafi dell'articolo vincitore del Premio Pulitzer 2012 “Snow Fall: The Avalanche at Tunnel Creek”, dopo che l'utente si era lamentato nella chat di essere stato colpito da un paywall all'indirizzo I tempi. E non riuscire a leggerlo.

Il notiziario afferma inoltre che il motore di ricerca Bing di Microsoft, che era È stato promosso all'inizio di quest'anno Utilizzando la tecnologia OpenAI, “trascrive e ordina” il contenuto del Times per produrre risposte più lunghe e dettagliate rispetto ai motori di ricerca tradizionali.

“Rendendo disponibili i contenuti del Times senza il permesso o l'autorizzazione del Times, gli imputati minano e danneggiano il rapporto del Times con i suoi lettori e privano il Times di abbonamenti, licenze, pubblicità e entrate di affiliazione”, si legge nella denuncia.

Ma combattere l’intelligenza artificiale è come infilare un dito in una diga. Sta arrivando e editori come il New York Times sanno che dovranno abbracciare il futuro. Vogliono solo assicurarsi che sia un futuro in cui otterranno un giusto compenso, ha detto il New York Times.

READ  Le azioni statunitensi salgono dopo che Powell ha affermato che la Fed è pronta a essere più aggressiva

“Riconosciamo il potenziale”, ha detto mercoledì mattina in una nota allo staff del giornale Diane Brighton, vicepresidente esecutiva e consigliere generale del New York Times. [generative AI] Al pubblico e alla stampa”.

“Ma allo stesso tempo, crediamo che il successo di GenAI e delle aziende che lavorano per svilupparlo non dovrebbe andare a scapito delle testate giornalistiche”, secondo la nota ottenuta dalla CNN. “L'utilizzo del nostro lavoro per creare strumenti GenAI deve essere accompagnato da un permesso e da un accordo che rifletta il valore equo di quel lavoro, come afferma la legge.”

Nella sua causa, il giornale chiede danni per miliardi di dollari, ma non specifica il risarcimento che chiede per la presunta violazione dei suoi materiali protetti da copyright. Chiede inoltre un’ingiunzione permanente che impedisca a Microsoft e OpenAI di continuare la presunta violazione. Il Times cerca anche di “distruggere” GPT e qualsiasi altro modello di intelligenza artificiale o set di dati di addestramento incluso nel suo giornalismo.

La causa del Times potrebbe in definitiva creare un precedente per l'industria in generale, perché la questione se l'uso di materiali protetti da copyright per addestrare modelli di intelligenza artificiale violi la legge è una questione legale irrisolta, secondo Dina Blichstein, partner dello studio legale Artificial Intelligence and Deep. Gruppo di pratica di apprendimento Heinz Bohn.

“Penso che alla fine usciranno molti di questi tipi di abiti [the issue will] “Portate la questione alla Corte Suprema, e a quel punto avremo una giurisprudenza specifica”, ha detto Blichstein, aggiungendo che in questo momento, “non c'è nulla di specifico per i grandi modelli linguistici e l'intelligenza artificiale solo perché è così nuovo.”

Questa storia è stata aggiornata con ulteriori sviluppi e contesto.

Popolare

Altri simili