La Controversia DeepSeek e la Risposta dell’Industria Tecnologica Americana
L’ascesa dell’intelligenza artificiale ha portato con sé una pletora di strumenti convenienti, ma ha anche acceso un acceso dibattito sulla privacy dei dati. Man mano che i chatbot AI diventano sempre più integrati nella nostra vita quotidiana, la questione di quante informazioni personali queste piattaforme raccolgono è diventata fondamentale. Mentre le recenti preoccupazioni si sono concentrate sui modelli di intelligenza artificiale cinesi come DeepSeek, un esame più attento rivela una verità sorprendente: alcuni dei più popolari chatbot AI con sede negli Stati Uniti potrebbero essere ancora più voraci nelle loro pratiche di raccolta dati.
A gennaio, DeepSeek, una società cinese, ha presentato il suo modello di intelligenza artificiale open-source di punta. Il debutto ha suscitato ondate di apprensione nell’industria tecnologica americana. Quasi immediatamente, è sorto un coro di preoccupazioni sulla privacy e sulla sicurezza. Organizzazioni private e governative, alimentate dalle ansie sui potenziali rischi, si sono mosse rapidamente per vietare l’uso di DeepSeek sia a livello nazionale che internazionale.
Il fulcro dell’apprensione derivava dalla convinzione che DeepSeek, con le sue origini in Cina, rappresentasse un rischio maggiore per il pubblico americano. Sono state frequentemente citate paure di sorveglianza, guerra informatica e altre minacce alla sicurezza nazionale. Ad alimentare queste preoccupazioni è stata una clausola specifica nella politica sulla privacy di DeepSeek, che affermava: ‘Le informazioni personali che raccogliamo da te potrebbero essere archiviate su un server situato al di fuori del paese in cui vivi. Archiviamo le informazioni che raccogliamo in server sicuri situati nella Repubblica Popolare Cinese’.
Questa affermazione apparentemente innocua è stata interpretata da alcuni come un potenziale gateway per il governo cinese per accedere ai dati sensibili degli utenti. Il rapido progresso dello sviluppo globale dell’IA e la percepita ‘corsa agli armamenti dell’IA’ tra Stati Uniti e Cina, non hanno fatto altro che amplificare queste preoccupazioni, creando un’atmosfera di profonda sfiducia e sollevando questioni etiche.
Una Rivelazione Sorprendente: L’Appetito di Dati di Gemini
Tuttavia, in mezzo al clamore che circonda DeepSeek, è emersa una rivelazione sorprendente. Nonostante l’intenso scrutinio diretto al modello di intelligenza artificiale cinese, si scopre che DeepSeek non è il più grande raccoglitore di dati nell’arena dei chatbot. Una recente indagine di Surfshark, un rispettabile provider VPN, ha fatto luce sulle pratiche di raccolta dati di alcune delle più popolari applicazioni di chatbot AI.
I ricercatori hanno analizzato meticolosamente i dettagli sulla privacy di dieci importanti chatbot, tutti prontamente disponibili sull’Apple App Store: ChatGPT, Gemini, Copilot, Perplexity, DeepSeek, Grok, Jasper, Poe, Claude e Pi. La loro analisi si è concentrata su tre aspetti chiave:
- Tipi di dati raccolti: Quali categorie specifiche di informazioni utente raccoglie ciascuna applicazione?
- Collegamento dei dati: Alcuni dei dati raccolti sono direttamente collegati all’identità dell’utente?
- Inserzionisti di terze parti: L’applicazione condivide i dati dell’utente con entità pubblicitarie esterne?
I risultati sono stati sorprendenti. Gemini di Google è emerso come l’app di chatbot AI più affamata di dati, superando i suoi concorrenti per il volume e la varietà di informazioni personali che raccoglie. L’applicazione raccoglie ben 22 dei 35 possibili tipi di dati utente. Ciò include dati altamente sensibili come:
- Dati di localizzazione precisi: Individuazione dell’esatta posizione geografica dell’utente.
- Contenuto dell’utente: Acquisizione del contenuto delle interazioni dell’utente all’interno dell’app.
- Elenco dei contatti: Accesso ai contatti del dispositivo dell’utente.
- Cronologia di navigazione: Tracciamento dell’attività di navigazione web dell’utente.
Questa vasta raccolta di dati supera di gran lunga quella di altri popolari chatbot esaminati nello studio. DeepSeek, oggetto di molte controversie, si è classificato al quinto posto su dieci applicazioni, raccogliendo un numero relativamente moderato di 11 tipi di dati univoci.
Dati di Localizzazione e Condivisione con Terze Parti: Uno Sguardo Più da Vicino
Lo studio ha anche scoperto tendenze preoccupanti per quanto riguarda i dati di localizzazione e la condivisione dei dati con terze parti. Solo Gemini, Copilot e Perplexity sono risultati raccogliere dati di localizzazione precisi, un’informazione altamente sensibile che può rivelare molto sui movimenti e sulle abitudini di un utente.
Più in generale, è stato riscontrato che circa il 30% dei chatbot analizzati condivide dati sensibili degli utenti, inclusi dati di localizzazione e cronologia di navigazione, con entità esterne come i data broker. Questa pratica solleva significative preoccupazioni sulla privacy, in quanto espone le informazioni dell’utente a una rete più ampia di attori, potenzialmente per scopi che vanno oltre la conoscenza o il controllo dell’utente.
Tracciamento dei Dati Utente: Pubblicità Mirata e Oltre
Un’altra scoperta allarmante è stata la pratica di tracciare i dati degli utenti per pubblicità mirata e altri scopi. È stato riscontrato che il 30% dei chatbot, in particolare Copilot, Poe e Jasper, raccoglie dati per tracciare i propri utenti. Ciò significa che i dati utente raccolti dall’app sono collegati a dati di terze parti, consentendo la pubblicità mirata o la misurazione dell’efficacia della pubblicità.
È stato riscontrato che Copilot e Poe raccolgono ID dispositivo per questo scopo, mentre Jasper è andato ancora oltre, raccogliendo non solo ID dispositivo ma anche dati sull’interazione con il prodotto, dati pubblicitari e ‘qualsiasi altro dato sull’attività dell’utente nell’app’, secondo gli esperti di Surfshark.
DeepSeek: Non il Migliore, Non il Peggiore
Il controverso modello DeepSeek R1, pur essendo oggetto di intenso scrutinio, occupa una posizione intermedia in termini di raccolta dati. Raccoglie una media di 11 tipi di dati univoci, concentrandosi principalmente su:
- Informazioni di contatto: Nomi, indirizzi e-mail, numeri di telefono, ecc.
- Contenuto dell’utente: Contenuto generato dagli utenti all’interno dell’app.
- Diagnostica: Dati relativi alle prestazioni dell’app e alla risoluzione dei problemi.
Sebbene non sia il chatbot più rispettoso della privacy, le pratiche di raccolta dati di DeepSeek sono meno estese di quelle di alcune delle sue controparti statunitensi, in particolare Gemini.
ChatGPT: Una Prospettiva Comparativa
Per fare un confronto, ChatGPT, uno dei chatbot AI più utilizzati, raccoglie 10 tipi unici di dati. Questi includono:
- Informazioni di contatto
- Contenuto dell’utente
- Identificatori
- Dati di utilizzo
- Diagnostica
È importante notare che ChatGPT accumula anche la cronologia delle chat. Tuttavia, gli utenti hanno la possibilità di utilizzare la ‘Chat temporanea’, una funzione progettata per mitigare questo problema non memorizzando la cronologia delle conversazioni.
La Politica sulla Privacy di DeepSeek: Controllo dell’Utente e Cancellazione dei Dati
La politica sulla privacy di DeepSeek, pur essendo fonte di preoccupazione per alcuni, include disposizioni per il controllo dell’utente sulla cronologia delle chat. La politica afferma che gli utenti possono gestire la propria cronologia delle chat e hanno la possibilità di eliminarla tramite le impostazioni. Ciò offre un grado di controllo che non è sempre presente in altre applicazioni di chatbot.
Il Contesto Più Ampio: Sviluppo dell’IA e la Dinamica USA-Cina
Le preoccupazioni che circondano DeepSeek, e il più ampio dibattito sulla privacy dei dati dell’IA, sono inestricabilmente legate alla rapida accelerazione dello sviluppo globale dell’IA e alla percepita corsa agli armamenti dell’IA tra Stati Uniti e Cina. Questo contesto geopolitico aggiunge un altro livello di complessità alla questione, alimentando le ansie sulla sicurezza nazionale e il potenziale uso improprio delle tecnologie AI.
I risultati dello studio Surfshark, tuttavia, servono come un promemoria cruciale che le preoccupazioni sulla privacy dei dati non sono limitate ai modelli di intelligenza artificiale sviluppati in paesi specifici. Il raccoglitore di dati più eclatante tra i popolari chatbot analizzati è, in effetti, un’applicazione con sede negli Stati Uniti. Ciò sottolinea la necessità di un approccio più sfumato e completo alla privacy dei dati dell’IA, che trascenda i confini nazionali e si concentri sulle pratiche delle singole aziende e sulle garanzie che implementano. È imperativo che gli utenti siano informati sulle pratiche di raccolta dati degli strumenti di intelligenza artificiale che utilizzano, indipendentemente dalla loro origine, e che vengano messe in atto solide normative per proteggere la privacy degli utenti nel panorama dell’IA in rapida evoluzione. L’attenzione dovrebbe essere rivolta alla definizione di standard chiari per la raccolta, l’utilizzo e la condivisione dei dati, garantendo la trasparenza e il controllo dell’utente e ritenendo le aziende responsabili delle loro pratiche in materia di dati.