DeepSeekをめぐる論争と米国テクノロジー業界の反応
1月、中国企業のDeepSeekは、同社の主力オープンソースAIモデルを発表した。この発表は、米国のテクノロジー業界に懸念の波紋を広げた。プライバシーとセキュリティに関する懸念の声が、ほぼ即座に上がった。潜在的なリスクへの不安から、民間および政府機関は、DeepSeekの使用を国内外で禁止するよう迅速に動いた。
懸念の中心は、DeepSeekが中国に起源を持つため、米国国民にとってより高いリスクをもたらすという考えだった。監視、サイバー戦争、その他の国家安全保障上の脅威への懸念が頻繁に挙げられた。これらの懸念を煽ったのは、DeepSeekのプライバシーポリシーにある特定の条項だった。そこには、「当社がお客様から収集する個人情報は、お客様が居住する国以外のサーバーに保存される場合があります。当社は、収集した情報を中華人民共和国にある安全なサーバーに保存します」と記載されていた。
この一見無害な記述は、中国政府が機密性の高いユーザーデータにアクセスするための潜在的な入り口であると一部で解釈された。グローバルなAI開発の急速な進歩と、米国と中国の間の’AI軍拡競争’と認識されているものが、これらの懸念をさらに増幅させ、深い不信感の雰囲気を作り出し、倫理的な問題を提起した。
驚くべき事実:Geminiのデータ収集欲
しかし、DeepSeekをめぐる騒動の中で、驚くべき事実が明らかになった。中国のAIモデルに向けられた厳しい監視にもかかわらず、DeepSeekはチャットボット分野で最大のデータ収集者ではないことが判明した。信頼できるVPNプロバイダーであるSurfsharkによる最近の調査は、最も人気のあるAIチャットボットアプリケーションのいくつかのデータ収集慣行に光を当てた。
研究者らは、Apple App Storeで容易に入手できる10の主要なチャットボット(ChatGPT、Gemini、Copilot、Perplexity、DeepSeek、Grok、Jasper、Poe、Claude、Pi)のプライバシー詳細を綿密に分析した。彼らの分析は、次の3つの主要な側面に焦点を当てた。
- 収集されるデータの種類: 各アプリケーションは、具体的にどのような種類のユーザー情報を収集しているか?
- データの関連付け: 収集されたデータは、ユーザーの身元に直接関連付けられているか?
- サードパーティの広告主: アプリケーションはユーザーデータを外部の広告エンティティと共有しているか?
その結果は驚くべきものだった。GoogleのGeminiは、最もデータ集約的なAIチャットボットアプリとして浮上し、収集する個人情報の量と種類の点で競合他社を圧倒した。このアプリケーションは、35の可能なユーザーデータタイプのうち、なんと22ものデータを収集している。これには、次のような非常に機密性の高いデータが含まれる。
- 正確な位置情報: ユーザーの正確な地理的位置を特定する。
- ユーザーコンテンツ: アプリ内のユーザーインタラクションのコンテンツをキャプチャする。
- 連絡先リスト: ユーザーのデバイスの連絡先にアクセスする。
- 閲覧履歴: ユーザーのWebブラウジングアクティビティを追跡する。
この広範なデータ収集は、調査で検証された他の人気のあるチャットボットのそれをはるかに上回っている。多くの論争の的となっているDeepSeekは、10のアプリケーションの中で5位にランクインし、比較的控えめな11の固有のデータ型を収集している。
位置情報とサードパーティとの共有:詳細な調査
この調査では、位置情報とサードパーティとのデータ共有に関する懸念すべき傾向も明らかになった。Gemini、Copilot、Perplexityのみが、正確な位置情報を収集していることが判明した。これは、ユーザーの動きや習慣について多くを明らかにする可能性のある、非常に機密性の高い情報である。
より広範には、分析されたチャットボットの約30%が、位置情報や閲覧履歴などの機密性の高いユーザーデータを、データブローカーなどの外部エンティティと共有していることが判明した。この慣行は、ユーザー情報をより広範なアクターのネットワークにさらし、ユーザーの知らない、または制御できない目的で使用される可能性があるため、重大なプライバシー上の懸念を引き起こす。
ユーザーデータの追跡:ターゲット広告など
もう1つの憂慮すべき発見は、ターゲット広告やその他の目的のためにユーザーデータを追跡する慣行だった。チャットボットの30%、具体的にはCopilot、Poe、Jasperが、ユーザーを追跡するためにデータを収集していることが判明した。これは、アプリから収集されたユーザーデータがサードパーティのデータとリンクされ、ターゲット広告や広告効果の測定を可能にすることを意味する。
CopilotとPoeは、この目的のためにデバイスIDを収集していることが判明したが、Jasperはさらに進んで、デバイスIDだけでなく、製品のインタラクションデータ、広告データ、および「アプリ内のユーザーアクティビティに関するその他のデータ」も収集していると、Surfsharkの専門家は述べている。
DeepSeek:最高ではないが、最悪でもない
物議を醸しているDeepSeek R1モデルは、厳しい監視の対象となっているが、データ収集の点では中間的な位置を占めている。主に以下のような、平均11の固有のデータ型を収集する。
- 連絡先情報: 名前、メールアドレス、電話番号など。
- ユーザーコンテンツ: アプリ内でユーザーが生成したコンテンツ。
- 診断: アプリのパフォーマンスとトラブルシューティングに関連するデータ。
DeepSeekのデータ収集慣行は、最もプライバシーを尊重するチャットボットではないが、特にGeminiなど、米国の競合他社の一部よりも広範囲ではない。
ChatGPT:比較の視点
比較のために、最も広く使用されているAIチャットボットの1つであるChatGPTは、10種類の固有のデータを収集する。これには以下が含まれる。
- 連絡先情報
- ユーザーコンテンツ
- 識別子
- 使用状況データ
- 診断
ChatGPTもチャット履歴を蓄積することに注意することが重要である。ただし、ユーザーは「一時チャット」を利用するオプションがある。これは、会話履歴を保存しないことで、この問題を軽減するように設計された機能である。
DeepSeekのプライバシーポリシー:ユーザーコントロールとデータ削除
DeepSeekのプライバシーポリシーは、一部の人々にとって懸念の原因となっているが、チャット履歴に対するユーザーコントロールの規定が含まれている。ポリシーには、ユーザーがチャット履歴を管理し、設定を通じて削除するオプションがあると記載されている。これは、他のチャットボットアプリケーションでは必ずしも存在しないある程度の制御を提供する。
より広い文脈:AI開発と米中関係
DeepSeekをめぐる懸念、およびAIデータプライバシーに関するより広範な議論は、グローバルなAI開発の急速な加速と、米国と中国の間のAI軍拡競争と認識されているものと密接に関連している。この地政学的な文脈は、問題に別の複雑さの層を追加し、国家安全保障とAI技術の誤用の可能性に関する不安を煽る。
しかし、Surfsharkの調査結果は、データプライバシーの懸念が特定の国で開発されたAIモデルに限定されないことを明確に示す重要な注意喚起となる。分析された人気のあるチャットボットの中で最もひどいデータ収集者は、実際には米国を拠点とするアプリケーションである。これは、AIデータプライバシーに対する、より微妙で包括的なアプローチの必要性を強調している。それは、国境を超越し、個々の企業の慣行とそれらが実装する保護手段に焦点を当てたものである。ユーザーは、AIツールのデータ収集慣行について、その起源に関係なく情報を得ることが不可欠であり、急速に進化するAIの状況においてユーザーのプライバシーを保護するために、堅牢な規制が導入されることが不可欠である。焦点は、データ収集、使用、および共有に関する明確な基準を確立し、透明性とユーザーコントロールを確保し、企業にデータ慣行に対する責任を負わせることに置かれるべきである。