الجدل حول DeepSeek ورد فعل صناعة التكنولوجيا الأمريكية
في يناير، كشفت شركة DeepSeek، وهي شركة صينية، عن نموذجها الرائد للذكاء الاصطناعي مفتوح المصدر. أثار هذا الظهور الأول موجات من القلق في صناعة التكنولوجيا الأمريكية. على الفور تقريبًا، ظهرت مجموعة من المخاوف المتعلقة بالخصوصية والأمن. تحركت المنظمات الخاصة والحكومية، مدفوعة بالقلق بشأن المخاطر المحتملة، بسرعة لحظر استخدام DeepSeek محليًا ودوليًا.
كان جوهر التخوف نابعًا من الاعتقاد بأن DeepSeek، بأصوله في الصين، يشكل خطرًا متزايدًا على الجمهور الأمريكي. وكثيرًا ما تم الاستشهاد بمخاوف المراقبة والحرب السيبرانية والتهديدات الأمنية القومية الأخرى. ومما زاد من حدة هذه المخاوف بند محدد في سياسة الخصوصية الخاصة بـ DeepSeek، والذي نص على ما يلي: ‘قد يتم تخزين المعلومات الشخصية التي نجمعها منك على خادم موجود خارج البلد الذي تعيش فيه. نقوم بتخزين المعلومات التي نجمعها في خوادم آمنة موجودة في جمهورية الصين الشعبية’.
فسر البعض هذا البيان الذي يبدو بسيطًا على أنه بوابة محتملة للحكومة الصينية للوصول إلى بيانات المستخدم الحساسة. إن التقدم السريع لتطوير الذكاء الاصطناعي العالمي، و’سباق التسلح بالذكاء الاصطناعي’ المتصور بين الولايات المتحدة والصين، لم يؤد إلا إلى تضخيم هذه المخاوف، وخلق جو من عدم الثقة العميق وإثارة تساؤلات أخلاقية.
كشف مفاجئ: شهية Gemini للبيانات
ومع ذلك، وسط الضجة المحيطة بـ DeepSeek، ظهر كشف مفاجئ. على الرغم من التدقيق المكثف الموجه إلى نموذج الذكاء الاصطناعي الصيني، اتضح أن DeepSeek ليس أكبر جامع للبيانات في ساحة روبوتات الدردشة. سلط تحقيق حديث أجرته Surfshark، وهي شركة VPN مرموقة، الضوء على ممارسات جمع البيانات لبعض تطبيقات روبوتات الدردشة الأكثر شيوعًا.
قام الباحثون بتحليل دقيق لتفاصيل الخصوصية لعشرة روبوتات محادثة بارزة، وكلها متاحة بسهولة على Apple App Store: ChatGPT، Gemini، Copilot، Perplexity، DeepSeek، Grok، Jasper، Poe، Claude، و Pi. ركز تحليلهم على ثلاثة جوانب رئيسية:
- أنواع البيانات التي تم جمعها: ما هي فئات معلومات المستخدم المحددة التي يجمعها كل تطبيق؟
- ربط البيانات: هل أي من البيانات التي تم جمعها مرتبطة مباشرة بهوية المستخدم؟
- المعلنون الخارجيون: هل يشارك التطبيق بيانات المستخدم مع كيانات إعلانية خارجية؟
كانت النتائج مذهلة. ظهر Gemini من Google كتطبيق روبوت الدردشة الأكثر كثافة في البيانات، متفوقًا على منافسيه في الحجم الهائل وتنوع المعلومات الشخصية التي يجمعها. يجمع التطبيق 22 نوعًا مذهلاً من بيانات المستخدم من أصل 35 نوعًا محتملاً. يتضمن هذا بيانات حساسة للغاية مثل:
- بيانات الموقع الدقيقة: تحديد الموقع الجغرافي الدقيق للمستخدم.
- محتوى المستخدم: التقاط محتوى تفاعلات المستخدم داخل التطبيق.
- قائمة جهات الاتصال: الوصول إلى جهات اتصال جهاز المستخدم.
- سجل التصفح: تتبع نشاط تصفح الويب الخاص بالمستخدم.
يتجاوز جمع البيانات الشامل هذا بكثير ما تجمعه روبوتات الدردشة الشهيرة الأخرى التي تم فحصها في الدراسة. احتل DeepSeek، موضوع الكثير من الجدل، المرتبة الخامسة من بين التطبيقات العشرة، حيث جمع 11 نوعًا فريدًا من البيانات بشكل معتدل نسبيًا.
بيانات الموقع ومشاركتها مع أطراف ثالثة: نظرة فاحصة
كشفت الدراسة أيضًا عن اتجاهات مثيرة للقلق فيما يتعلق ببيانات الموقع ومشاركة البيانات مع أطراف ثالثة. تم العثور على Gemini و Copilot و Perplexity فقط لجمع بيانات الموقع الدقيقة، وهي معلومة حساسة للغاية يمكن أن تكشف الكثير عن تحركات المستخدم وعاداته.
بشكل أعم، وجد أن ما يقرب من 30٪ من روبوتات الدردشة التي تم تحليلها تشارك بيانات المستخدم الحساسة، بما في ذلك بيانات الموقع وسجل التصفح، مع كيانات خارجية مثل وسطاء البيانات. تثير هذه الممارسة مخاوف كبيرة تتعلق بالخصوصية، لأنها تعرض معلومات المستخدم لشبكة أوسع من الجهات الفاعلة، ربما لأغراض تتجاوز معرفة المستخدم أو سيطرته.
تتبع بيانات المستخدم: الإعلانات المستهدفة وما بعدها
كان الاكتشاف المثير للقلق الآخر هو ممارسة تتبع بيانات المستخدم للإعلانات المستهدفة وأغراض أخرى. تم العثور على ثلاثين بالمائة من روبوتات الدردشة، وتحديداً Copilot و Poe و Jasper، لجمع البيانات لتتبع مستخدميها. هذا يعني أن بيانات المستخدم التي تم جمعها من التطبيق مرتبطة ببيانات الطرف الثالث، مما يتيح الإعلان المستهدف أو قياس فعالية الإعلان.
تم العثور على Copilot و Poe لجمع معرفات الأجهزة لهذا الغرض، بينما ذهب Jasper إلى أبعد من ذلك، حيث جمع ليس فقط معرفات الأجهزة ولكن أيضًا بيانات تفاعل المنتج وبيانات الإعلان و’أي بيانات أخرى حول نشاط المستخدم في التطبيق’، وفقًا لخبراء Surfshark.
DeepSeek: ليس الأفضل، وليس الأسوأ
يحتل نموذج DeepSeek R1 المثير للجدل، على الرغم من خضوعه لتدقيق مكثف، مكانة متوسطة من حيث جمع البيانات. يجمع ما متوسطه 11 نوعًا فريدًا من البيانات، ويركز بشكل أساسي على:
- معلومات الاتصال: الأسماء وعناوين البريد الإلكتروني وأرقام الهواتف وما إلى ذلك.
- محتوى المستخدم: المحتوى الذي ينشئه المستخدمون داخل التطبيق.
- التشخيص: البيانات المتعلقة بأداء التطبيق واستكشاف الأخطاء وإصلاحها.
على الرغم من أنه ليس روبوت الدردشة الأكثر احترامًا للخصوصية، إلا أن ممارسات جمع البيانات في DeepSeek أقل شمولاً من تلك الخاصة ببعض نظرائه في الولايات المتحدة، ولا سيما Gemini.
ChatGPT: منظور مقارن
للمقارنة، يجمع ChatGPT، أحد أكثر روبوتات الدردشة استخدامًا، 10 أنواع فريدة من البيانات. هذا يشمل:
- معلومات الاتصال
- محتوى المستخدم
- المعرفات
- بيانات الاستخدام
- التشخيص
من المهم ملاحظة أن ChatGPT يجمع أيضًا محفوظات الدردشة. ومع ذلك، يتوفر للمستخدمين خيار استخدام ‘الدردشة المؤقتة’، وهي ميزة مصممة للتخفيف من ذلك من خلال عدم تخزين محفوظات المحادثة.
سياسة الخصوصية الخاصة بـ DeepSeek: تحكم المستخدم وحذف البيانات
تتضمن سياسة الخصوصية الخاصة بـ DeepSeek، على الرغم من كونها مصدر قلق للبعض، أحكامًا للتحكم في المستخدم في محفوظات الدردشة. تنص السياسة على أنه يمكن للمستخدمين إدارة محفوظات الدردشة الخاصة بهم ولديهم خيار حذفها من خلال إعداداتهم. يوفر هذا درجة من التحكم غير موجودة دائمًا في تطبيقات روبوتات الدردشة الأخرى.
السياق الأوسع: تطوير الذكاء الاصطناعي والديناميكية بين الولايات المتحدة والصين
إن المخاوف المحيطة بـ DeepSeek، والنقاش الأوسع حول خصوصية بيانات الذكاء الاصطناعي، مرتبطة ارتباطًا وثيقًا بالتسارع السريع لتطوير الذكاء الاصطناعي العالمي وسباق التسلح بالذكاء الاصطناعي المتصور بين الولايات المتحدة والصين. يضيف هذا السياق الجيوسياسي طبقة أخرى من التعقيد إلى القضية، مما يغذي المخاوف بشأن الأمن القومي واحتمال إساءة استخدام تقنيات الذكاء الاصطناعي.
ومع ذلك، فإن نتائج دراسة Surfshark بمثابة تذكير حاسم بأن مخاوف خصوصية البيانات لا تقتصر على نماذج الذكاء الاصطناعي التي تم تطويرها في بلدان معينة. إن أكثر جامعي البيانات فظاعة بين روبوتات الدردشة الشهيرة التي تم تحليلها هو، في الواقع، تطبيق مقره الولايات المتحدة. يؤكد هذا على الحاجة إلى نهج أكثر دقة وشمولية لخصوصية بيانات الذكاء الاصطناعي، وهو نهج يتجاوز الحدود الوطنية ويركز على ممارسات الشركات الفردية والضمانات التي تنفذها. من الضروري أن يكون المستخدمون على علم بممارسات جمع البيانات لأدوات الذكاء الاصطناعي التي يستخدمونها، بغض النظر عن أصلها، وأن يتم وضع لوائح قوية لحماية خصوصية المستخدم في مشهد الذكاء الاصطناعي سريع التطور. يجب أن ينصب التركيز على وضع معايير واضحة لجمع البيانات واستخدامها ومشاركتها، وضمان الشفافية وتحكم المستخدم، ومحاسبة الشركات عن ممارسات البيانات الخاصة بها.