Data Bill: Svolta per il Diritto d'Autore | it

L’era digitale ha aperto opportunità senza precedenti per l’innovazione, in particolare nel campo dell’intelligenza artificiale (AI). Tuttavia, questo progresso ha anche sollevato questioni cruciali sui confini etici e legali dell’uso dei dati, soprattutto per quanto riguarda i materiali protetti da copyright. Il dibattito sull’uso di libri piratati per addestrare modelli di intelligenza artificiale ha raggiunto il punto di ebollizione, richiedendo una rivalutazione delle leggi sul copyright esistenti e una posizione più ferma contro la violazione della proprietà intellettuale.

Il problema principale: uso non autorizzato di materiale protetto da copyright

Il nocciolo della questione risiede nell’uso non autorizzato di libri protetti da copyright per addestrare modelli di intelligenza artificiale. Questa pratica, presumibilmente impiegata da colossi tecnologici come Meta, ha suscitato indignazione tra autori ed editori che si sentono violati nei loro diritti a fini commerciali. Mark Price, ex amministratore delegato di Waitrose, è stato un critico esplicito di questa pratica, rivolgendosi direttamente all’amministratore delegato di Meta, Mark Zuckerberg, e mettendo in discussione la giustificazione dell’azienda per lo sfruttamento delle opere di autori britannici senza autorizzazione.

Il team legale di Price sta esplorando diverse strade per intraprendere azioni legali contro Meta nel Regno Unito. Un approccio prevede la determinazione se i libri provenienti dal database pirata LibGen siano stati “ingestiti ed elaborati” all’interno del Regno Unito. Se dimostrato, ciò potrebbe stabilire un caso chiaro contro Meta ai sensi della legge sul copyright del Regno Unito.

Esaminare l’output: una chiave per dimostrare la violazione

Un altro approccio, forse più intrigante, si concentra sull’analisi del contenuto generato dal modello di intelligenza artificiale di Meta, Llama. Price sostiene che se Llama produce contenuti che assomigliano molto a passaggi dei libri utilizzati per addestrarlo, ciò potrebbe servire come prova convincente della violazione del copyright. Questa linea di indagine traccia parallelismi con il caso Getty Images in corso contro Stability AI, che si concentra sulla presunta riproduzione di immagini protette da copyright da parte del modello Stable Diffusion di Stability AI.

Il caso Getty Images, previsto per il processo nel giugno 2025, potrebbe creare un precedente significativo per future controversie sul copyright che coinvolgono contenuti generati dall’intelligenza artificiale. I ricorrenti nel caso Getty Images sostengono che Stable Diffusion ha riprodotto parti sostanziali di immagini protette da copyright utilizzate durante la sua formazione. Se Getty Images prevale, potrebbe incoraggiare autori ed editori a intraprendere azioni legali simili contro società come Meta.

Meta ha difeso le sue pratiche sostenendo che il suo modello di intelligenza artificiale non riproduce opere protette da copyright, ma le utilizza semplicemente a scopo di formazione. L’azienda afferma inoltre che gli autori non subiscono alcun danno economico di conseguenza. Tuttavia, se Getty Images può dimostrare che i modelli di intelligenza artificiale possono, di fatto, riprodurre contenuti protetti da copyright, ciò minerebbe la difesa di Meta ed esporrebbe l’azienda a significative responsabilità legali.

Accordi di licenza: una potenziale soluzione?

La complessità del copyright nell’era dell’intelligenza artificiale è ulteriormente evidenziata dagli accordi di licenza tra editori e società di intelligenza artificiale. Ad esempio, HarperCollins avrebbe stipulato un accordo di licenza con Microsoft che include restrizioni sulla quantità di un libro a cui è possibile accedere come parte dell’accordo. Tali accordi, pur offrendo un potenziale percorso per compensare i titolari di copyright, sollevano anche interrogativi sulla portata e sui limiti del fair use nella formazione dell’intelligenza artificiale.

L’assenza di accordi simili tra Meta e i titolari dei diritti lascia l’azienda vulnerabile a contestazioni legali. Un ex avvocato di Meta ha persino riconosciuto che le conseguenze involontarie dei sistemi di intelligenza artificiale che potenzialmente violano il copyright potrebbero rappresentare una minaccia significativa per l’azienda in tribunale.

Il Data (Use and Access) Bill: un’opportunità legislativa

Il Data (Use and Access) Bill del Regno Unito rappresenta un’opportunità cruciale per rafforzare la legge sul copyright e affrontare le sfide poste dall’intelligenza artificiale. Gli emendamenti al disegno di legge, che saranno discussi alla Camera dei Comuni, mirano a garantire la conformità, la trasparenza e l’applicazione delle normative sul copyright. Se approvati, questi emendamenti potrebbero frenare i tentativi del governo del Regno Unito di concedere alle società tecnologiche esenzioni sull’uso di materiali pubblicati per la formazione dell’intelligenza artificiale. Questa è una posizione che molti ritengono che il governo avrebbe dovuto adottare fin dall’inizio.

Tom West, CEO di Publishers’ Licensing Services, sostiene che il Data (Use and Access) Bill potrebbe “turbo caricare” la concessione di licenze per i contenuti. Sottolinea che la richiesta di responsabilità non è anti-tecnologica o anti-innovazione. Invece, riflette il riconoscimento che l’accuratezza e la qualità delle informazioni sono fondamentali man mano che l’intelligenza artificiale generativa svolge un ruolo sempre più importante nelle nostre vite.

Un punto di inflessione: regolamentare l’impatto dell’intelligenza artificiale

La situazione attuale rappresenta un punto di inflessione. Man mano che il potere e l’influenza dell’intelligenza artificiale continuano a crescere, è imperativo stabilire confini e regolamenti chiari per prevenire danni, caos o azioni che potrebbero portare al rimpianto. Questo principio, preso in prestito da ChatGPT, sottolinea la necessità di uno sviluppo e di un’implementazione responsabili delle tecnologie di intelligenza artificiale.

Approfondire il pantano legale ed etico

Il dibattito sull’uso di materiali protetti da copyright nella formazione dell’intelligenza artificiale non è semplicemente una questione legale; tocca anche fondamentali considerazioni etiche. La questione se alle società di intelligenza artificiale debba essere consentito di trarre profitto dall’uso non autorizzato di opere creative è una questione di equità e rispetto per i diritti di proprietà intellettuale.

La dottrina del fair use: un complesso argomento legale

Uno degli argomenti legali centrali in questo dibattito ruota attorno alla dottrina del fair use. Il fair use è un principio legale che consente l’uso limitato di materiale protetto da copyright senza il permesso del titolare del copyright. La dottrina ha lo scopo di promuovere la libertà di espressione e incoraggiare la creatività consentendo determinati usi trasformativi di opere protette da copyright.

Tuttavia, l’applicazione della dottrina del fair use nel contesto della formazione dell’intelligenza artificiale è complessa e contestata. Le società di intelligenza artificiale sostengono spesso che il loro uso di materiali protetti da copyright rientra nel fair use perché utilizzano i materiali per creare tecnologie nuove e trasformative. Sostengono che i modelli di intelligenza artificiale non si limitano a riprodurre le opere protette da copyright, ma stanno invece imparando da esse per generare output completamente nuovi.

I titolari di copyright, d’altra parte, sostengono che l’uso delle loro opere per addestrare modelli di intelligenza artificiale è un uso commerciale che li priva di potenziali entrate. Sostengono che alle società di intelligenza artificiale dovrebbe essere richiesto di ottenere licenze per i materiali protetti da copyright che utilizzano per la formazione, proprio come farebbero per qualsiasi altro uso commerciale.

L’impatto economico su autori ed editori

L’impatto economico della formazione non autorizzata sull’intelligenza artificiale su autori ed editori è una preoccupazione significativa. Se alle società di intelligenza artificiale è consentito utilizzare liberamente opere protette da copyright senza compenso, ciò potrebbe minare l’incentivo per autori ed editori a creare nuovi contenuti. Ciò potrebbe portare a un calo della qualità e della disponibilità di opere creative, danneggiando in definitiva la società nel suo complesso.

Inoltre, l’uso non autorizzato di materiali protetti da copyright potrebbe creare condizioni di concorrenza ineguali nel mercato. Le società di intelligenza artificiale che utilizzano opere protette da copyright senza autorizzazione avrebbero un vantaggio competitivo rispetto a quelle che ottengono licenze o creano i propri dati di formazione. Ciò potrebbe soffocare l’innovazione e portare a una concentrazione di potere nelle mani di poche società di intelligenza artificiale dominanti.

La necessità di trasparenza e responsabilità

La trasparenza e la responsabilità sono essenziali per garantire che le società di intelligenza artificiale utilizzino i materiali protetti da copyright in modo responsabile. Alle società di intelligenza artificiale dovrebbe essere richiesto di divulgare le fonti dei dati che utilizzano per addestrare i loro modelli. Ciò consentirebbe ai titolari di copyright di monitorare l’uso delle loro opere e garantire che siano adeguatamente compensati.

Inoltre, le società di intelligenza artificiale dovrebbero essere ritenute responsabili per qualsiasi violazione del copyright che si verifichi a seguito dei loro modelli di intelligenza artificiale. Ciò potrebbe includere la responsabilità per violazione diretta, nonché per violazione colposa se il modello di intelligenza artificiale viene utilizzato per creare opere illecite.

Esplorare soluzioni alternative

Oltre a rafforzare la legge sul copyright e a promuovere la trasparenza, è importante esplorare soluzioni alternative che potrebbero contribuire a bilanciare gli interessi delle società di intelligenza artificiale e dei titolari di copyright.

Licenze collettive

La licenza collettiva è una potenziale soluzione. Nell’ambito di un regime di licenza collettiva, un’organizzazione di gestione collettiva (CMO) negozierebbe licenze con società di intelligenza artificiale per conto dei titolari di copyright. Il CMO distribuirebbe quindi le royalty raccolte dalle licenze ai titolari di copyright.

La licenza collettiva potrebbe fornire un modo più efficiente e semplificato per le società di intelligenza artificiale di ottenere licenze per i materiali protetti da copyright di cui hanno bisogno. Potrebbe anche garantire che i titolari di copyright siano equamente compensati per l’uso delle loro opere.

Dati open source

Un’altra potenziale soluzione è promuovere lo sviluppo di set di dati open source per la formazione dell’intelligenza artificiale. I set di dati open source sono set di dati liberamente disponibili per chiunque da utilizzare, modificare e distribuire.

Lo sviluppo di set di dati open source potrebbe ridurre la dipendenza delle società di intelligenza artificiale dai materiali protetti da copyright. Potrebbe anche promuovere l’innovazione e la concorrenza nel settore dell’intelligenza artificiale.

Soluzioni tecnologiche

Anche le soluzioni tecnologiche potrebbero svolgere un ruolo nell’affrontare le sfide del copyright poste dall’intelligenza artificiale. Ad esempio, le tecnologie di watermarking potrebbero essere utilizzate per tenere traccia dell’uso di materiali protetti da copyright nella formazione dell’intelligenza artificiale. Ciò consentirebbe ai titolari di copyright di monitorare l’uso delle loro opere e identificare i casi di uso non autorizzato.

Inoltre, le tecnologie di intelligenza artificiale potrebbero essere utilizzate per rilevare e prevenire la creazione di opere illecite. Ad esempio, strumenti basati sull’intelligenza artificiale potrebbero essere utilizzati per identificare contenuti sostanzialmente simili a opere protette da copyright.

Il percorso da seguire

Il dibattito sull’uso di materiali protetti da copyright nella formazione dell’intelligenza artificiale è complesso e sfaccettato. Non ci sono risposte facili. Tuttavia, rafforzando la legge sul copyright, promuovendo la trasparenza e la responsabilità, esplorando soluzioni alternative e promuovendo un dialogo aperto tra le società di intelligenza artificiale e i titolari di copyright, possiamo creare un quadro che bilanci gli interessi di tutte le parti interessate e promuova l’innovazione proteggendo al contempo i diritti di proprietà intellettuale. Il Data (Use and Access) Bill rappresenta un passo fondamentale in questa direzione, offrendo una via legislativa per affrontare questi urgenti problemi e plasmare il futuro della legge sul copyright nell’era digitale. Le decisioni prese ora avranno conseguenze durature per le industrie creative e lo sviluppo dell’intelligenza artificiale per gli anni a venire.

aggiornato il 2025-05-10

# AIGC # Llama # Meta