Mustafa Soliman, CEO di Microsoft AI, ha affermato questa settimana che le società di machine learning possono estrarre la maggior parte dei contenuti pubblicati online e utilizzarli per addestrare le reti neurali perché sono essenzialmente “software libero”.
Poco dopo, il Centro per i rapporti investigativi Avvia una causa contro OpenAI Il suo più grande investitore, Microsoft, “per aver utilizzato il contenuto della testata giornalistica senza scopo di lucro senza permesso o senza fornire alcun compenso”.
Questo segue le orme di otto giornali Ha intentato una causa contro OpenAI e Microsoft Ad aprile, il New York Times ha accusato Facebook di presunta appropriazione indebita di contenuti, cosa che lo stesso giornale aveva fatto quattro mesi prima.
Poi ci sono i due autori geniali Ha intentato una causa contro OpenAI e Microsoft A gennaio, hanno affermato di aver addestrato modelli di intelligenza artificiale sui lavori degli autori senza permesso. Inoltre, nel 2022, diversi sviluppatori anonimi hanno intentato una causa contro OpenAI e GitHub sulla base delle accuse secondo cui le organizzazioni avrebbero utilizzato codice di programmazione pubblicato pubblicamente per addestrare modelli generativi in violazione dei termini della loro licenza software.
Ho chiesto di entrare Colloquio Parlando con Andrew Ross Sorkin della CNBC all’Aspen Ideas Festival per sapere se le società di intelligenza artificiale abbiano effettivamente rubato la proprietà intellettuale mondiale, Solomon ha riconosciuto la controversia e ha cercato di distinguere tra i contenuti che le persone mettono online e i contenuti supportati dai detentori di copyright aziendali.
“Penso che, in termini di contenuti già esistenti sul web aperto, il contratto sociale per tali contenuti a partire dagli anni ’90 sia basato sul fair use”, ha affermato. “Chiunque poteva copiarlo, ricrearlo, riprodurlo con esso. Era software libero, se lo si voleva. Questa era l’intesa.”
Suleiman ha sottolineato che esiste un’altra categoria di contenuti, ovvero i materiali pubblicati da aziende che hanno avvocati.
“Esiste una categoria separata in cui un sito web, un editore o una testata giornalistica ha esplicitamente detto: ‘Non cancellarmi o scansionarmi per nessun motivo diverso dall’indicizzarmi, in modo che altri possano trovare questo contenuto'”, ha spiegato. “Ma questa è una zona grigia. Penso che questo si farà strada attraverso i tribunali.”
Questo è per usare un eufemismo. Anche se sembra certo che le dichiarazioni di Soliman offenderanno i creatori di contenuti, non ha del tutto torto: non è chiaro dove si trovino le linee legali riguardo all’addestramento del modello di intelligenza artificiale e all’output del modello.
La maggior parte delle persone che pubblicano contenuti online come individui hanno violato in qualche modo i propri diritti accettando i termini di servizio offerti dalle principali piattaforme di social media. La decisione di Reddit di concedere in licenza i post dei suoi utenti a OpenAI non avverrebbe se il gigante dei social media credesse che i suoi utenti abbiano un diritto legittimo sui meme e sui dati che diffonde.
Il fatto che OpenAI e altre società che creano modelli di intelligenza artificiale stiano stringendo accordi sui contenuti con i principali editori dimostra che un marchio forte, tasche profonde e un team legale possono portare sul tavolo grandi operazioni tecnologiche.
In altre parole, coloro che creano contenuti e li pubblicano online stanno realizzando software libero a meno che non riescano a trattenere o attrarre avvocati disposti a sfidare Microsoft e i suoi simili.
In carta Distribuito tramite SSRN il mese scorso, Frank Pasquale, professore di diritto alla Cornell Tech e alla Cornell Law School negli Stati Uniti, e Haochen Sun, professore associato di diritto presso l’Università di Hong Kong, esplorano l’incertezza giuridica che circonda l’uso di dati protetti da copyright per formazione. Intelligenza artificiale e se i tribunali riterranno giusto questo utilizzo. I ricercatori hanno concluso che l’intelligenza artificiale deve essere affrontata a livello politico, perché le leggi attuali sono inadeguate a rispondere alle domande che ora devono essere affrontate.
“Poiché esiste una significativa incertezza sulla legalità dell’uso delle opere protette da copyright da parte dei fornitori di intelligenza artificiale, i legislatori dovranno articolare una nuova visione audace per riequilibrare diritti e responsabilità, proprio come hanno fatto sulla scia dello sviluppo di Internet (che ha portato alla Digital Millennium Copyright Act e pubblicazione nel 1998), come sostengono.
Gli autori sottolineano che la continua raccolta non compensata di opere creative minaccia non solo scrittori, compositori, giornalisti, attori e altri professionisti creativi, ma la stessa intelligenza artificiale, che finirà per essere privata dei dati di formazione. Gli autori prevedono che le persone smetteranno di rendere il proprio lavoro disponibile online se verrà utilizzato solo per alimentare modelli di intelligenza artificiale che riducono a zero il costo marginale della creazione di contenuti e negano ai creatori la possibilità di qualsiasi ricompensa.
Questo è il futuro che Salomone prevede. “L’economia dell’informazione sta per cambiare radicalmente perché saremo in grado di ridurre a zero i costi di produzione della conoscenza in termini di costo marginale”, afferma.
Tutto il software gratuito che potresti aver contribuito a creare può essere tuo pagando una piccola quota di abbonamento mensile. ®
“Esperto di Internet. Lettore. Fanatico della TV. Comunicatore amichevole. Esperto di alcolisti certificato. Appassionato di pancetta. Esploratore. Evil twitteraholic.”