Gemini sammelt mehr Daten als DeepSeek

Die DeepSeek-Kontroverse und die Reaktion der amerikanischen Tech-Industrie

Die Einführung von DeepSeek, einem Open-Source-KI-Modell eines chinesischen Unternehmens, im Januar löste in der amerikanischen Tech-Industrie Besorgnis aus. Es wurden schnell Bedenken hinsichtlich des Datenschutzes und der Sicherheit geäußert. Private und staatliche Organisationen reagierten prompt und verboten die Nutzung von DeepSeek sowohl im Inland als auch international, getrieben von Ängsten vor potenziellen Risiken.

Der Kern der Befürchtungen lag in der Annahme, dass DeepSeek aufgrund seiner Herkunft aus China ein erhöhtes Risiko für die amerikanische Öffentlichkeit darstelle. Es wurden Befürchtungen vor Überwachung, Cyber-Kriegsführung und anderen Bedrohungen der nationalen Sicherheit laut. Diese Bedenken wurden durch eine spezielle Klausel in der Datenschutzrichtlinie von DeepSeek verstärkt, die besagte: ‘Die persönlichen Daten, die wir von Ihnen sammeln, können auf einem Server außerhalb des Landes, in dem Sie leben, gespeichert werden. Wir speichern die von uns gesammelten Informationen auf sicheren Servern in der Volksrepublik China.’

Diese scheinbar harmlose Aussage wurde von einigen als potenzielles Einfallstor für die chinesische Regierung interpretiert, um auf sensible Benutzerdaten zuzugreifen. Die rasante Entwicklung der globalen KI und das wahrgenommene ‘KI-Wettrüsten’ zwischen den USA und China verstärkten diese Bedenken zusätzlich und schufen eine Atmosphäre tiefen Misstrauens und ethischer Fragen.

Eine überraschende Enthüllung: Geminis Datenhunger

Inmitten der Aufregung um DeepSeek ist jedoch eine überraschende Enthüllung ans Licht gekommen. Trotz der intensiven Überprüfung des chinesischen KI-Modells stellt sich heraus, dass DeepSeek nicht der größte Datensammler im Chatbot-Bereich ist. Eine kürzlich durchgeführte Untersuchung von Surfshark, einem renommierten VPN-Anbieter, hat die Datenerfassungspraktiken einiger der beliebtesten KI-Chatbot-Anwendungen beleuchtet.

Die Forscher analysierten akribisch die Datenschutzdetails von zehn prominenten Chatbots, die alle im Apple App Store erhältlich sind: ChatGPT, Gemini, Copilot, Perplexity, DeepSeek, Grok, Jasper, Poe, Claude und Pi. Ihre Analyse konzentrierte sich auf drei Hauptaspekte:

  1. Arten der gesammelten Daten: Welche spezifischen Kategorien von Benutzerinformationen sammelt jede Anwendung?
  2. Datenverknüpfung: Sind die gesammelten Daten direkt mit der Identität des Benutzers verknüpft?
  3. Drittanbieter-Werbung: Gibt die Anwendung Benutzerdaten an externe Werbeunternehmen weiter?

Die Ergebnisse waren alarmierend. Googles Gemini erwies sich als die datenintensivste KI-Chatbot-App und übertraf seine Konkurrenten bei weitem in Bezug auf die Menge und Vielfalt der gesammelten persönlichen Informationen. Die Anwendung sammelt erstaunliche 22 von 35 möglichen Benutzerdatentypen. Dazu gehören hochsensible Daten wie:

  • Genaue Standortdaten: Die genaue geografische Position des Benutzers wird ermittelt.
  • Benutzerinhalte: Erfassung der Inhalte von Benutzerinteraktionen innerhalb der App.
  • Kontaktliste: Zugriff auf die Kontakte des Benutzers auf dem Gerät.
  • Browserverlauf: Verfolgung der Web-Browsing-Aktivitäten des Benutzers.

Diese umfangreiche Datenerfassung übertrifft die anderer beliebter Chatbots, die in der Studie untersucht wurden, bei weitem. DeepSeek, das Gegenstand vieler Kontroversen war, rangierte auf Platz fünf von zehn Anwendungen und sammelte vergleichsweise moderate 11 eindeutige Datentypen.

Standortdaten und Weitergabe an Dritte: Ein genauerer Blick

Die Studie deckte auch besorgniserregende Trends in Bezug auf Standortdaten und die Weitergabe von Daten an Dritte auf. Nur Gemini, Copilot und Perplexity sammelten genaue Standortdaten, eine hochsensible Information, die viel über die Bewegungen und Gewohnheiten eines Benutzers verraten kann.

Im Allgemeinen wurde festgestellt, dass etwa 30 % der analysierten Chatbots sensible Benutzerdaten, einschließlich Standortdaten und Browserverlauf, an externe Stellen wie Datenbroker weitergeben. Diese Praxis wirft erhebliche Datenschutzbedenken auf, da sie Benutzerinformationen einem größeren Netzwerk von Akteuren zugänglich macht, möglicherweise für Zwecke, die über das Wissen oder die Kontrolle des Benutzers hinausgehen.

Verfolgung von Benutzerdaten: Gezielte Werbung und mehr

Ein weiteres alarmierendes Ergebnis war die Praxis, Benutzerdaten für gezielte Werbung und andere Zwecke zu verfolgen. Bei 30 % der Chatbots, insbesondere Copilot, Poe und Jasper, wurde festgestellt, dass sie Daten sammeln, um ihre Benutzer zu verfolgen. Das bedeutet, dass die von der App gesammelten Benutzerdaten mit Daten von Drittanbietern verknüpft werden, um gezielte Werbung zu ermöglichen oder die Effektivität von Werbung zu messen.

Copilot und Poe sammelten zu diesem Zweck Geräte-IDs, während Jasper laut den Experten von Surfshark noch weiter ging und nicht nur Geräte-IDs, sondern auch Daten zur Produktinteraktion, Werbedaten und ‘alle anderen Daten über die Benutzeraktivität in der App’ sammelte.

DeepSeek: Nicht das Beste, nicht das Schlechteste

Das umstrittene DeepSeek R1-Modell steht zwar unter intensiver Beobachtung, nimmt aber in Bezug auf die Datenerfassung eine mittlere Position ein. Es sammelt durchschnittlich 11 eindeutige Datentypen, wobei der Schwerpunkt hauptsächlich auf folgenden Bereichen liegt:

  • Kontaktinformationen: Namen, E-Mail-Adressen, Telefonnummern usw.
  • Benutzerinhalte: Von Benutzern innerhalb der App generierte Inhalte.
  • Diagnose: Daten zur App-Leistung und Fehlerbehebung.

Obwohl DeepSeek nicht der Chatbot mit dem größten Datenschutz ist, sind seine Datenerfassungspraktiken weniger umfangreich als die einiger seiner US-amerikanischen Pendants, insbesondere Gemini.

ChatGPT: Eine vergleichende Perspektive

Zum Vergleich: ChatGPT, einer der am häufigsten verwendeten KI-Chatbots, sammelt 10 eindeutige Datentypen. Dazu gehören:

  • Kontaktinformationen
  • Benutzerinhalte
  • Identifikatoren
  • Nutzungsdaten
  • Diagnose

Es ist wichtig zu beachten, dass ChatGPT auch den Chatverlauf speichert. Benutzer haben jedoch die Möglichkeit, den ‘Temporären Chat’ zu verwenden, eine Funktion, die dies verhindern soll, indem der Gesprächsverlauf nicht gespeichert wird.

DeepSeeks Datenschutzrichtlinie: Benutzerkontrolle und Datenlöschung

Die Datenschutzrichtlinie von DeepSeek, die für einige Anlass zur Sorge gab, enthält Bestimmungen zur Benutzerkontrolle über den Chatverlauf. Die Richtlinie besagt, dass Benutzer ihren Chatverlauf verwalten und die Möglichkeit haben, ihn über ihre Einstellungen zu löschen. Dies bietet ein Maß an Kontrolle, das in anderen Chatbot-Anwendungen nicht immer vorhanden ist.

Der breitere Kontext: KI-Entwicklung und die Dynamik zwischen den USA und China

Die Bedenken in Bezug auf DeepSeek und die breitere Debatte über den Datenschutz bei KI sind untrennbar mit der rasanten Beschleunigung der globalen KI-Entwicklung und dem wahrgenommenen KI-Wettrüsten zwischen den USA und China verbunden. Dieser geopolitische Kontext fügt dem Thema eine weitere Komplexitätsebene hinzu und schürt Ängste vor der nationalen Sicherheit und dem potenziellen Missbrauch von KI-Technologien.

Die Ergebnisse der Surfshark-Studie erinnern jedoch eindringlich daran, dass Datenschutzbedenken nicht auf KI-Modelle beschränkt sind, die in bestimmten Ländern entwickelt wurden. Der schlimmste Datensammler unter den analysierten beliebten Chatbots ist tatsächlich eine US-amerikanische Anwendung. Dies unterstreicht die Notwendigkeit eines differenzierteren und umfassenderen Ansatzes für den Datenschutz bei KI, der über nationale Grenzen hinausgeht und sich auf die Praktiken einzelner Unternehmen und die von ihnen implementierten Sicherheitsvorkehrungen konzentriert. Es ist unerlässlich, dass Benutzer über die Datenerfassungspraktiken der von ihnen verwendeten KI-Tools informiert werden, unabhängig von deren Herkunft, und dass strenge Vorschriften zum Schutz der Privatsphäre der Benutzer in der sich schnell entwickelnden KI-Landschaft eingeführt werden. Der Schwerpunkt sollte auf der Festlegung klarer Standards für die Datenerfassung, -nutzung und -weitergabe, der Gewährleistung von Transparenz und Benutzerkontrolle sowie der Rechenschaftspflicht von Unternehmen für ihre Datenpraktiken liegen.