نگرانی از DeepSeek؟ جمینای بزرگترین ناقض داده است

جنجال DeepSeek و واکنش صنعت فناوری آمریکا

در ژانویه، DeepSeek، یک شرکت چینی، مدل هوش مصنوعی متن‌باز پرچم‌دار خود را رونمایی کرد. این رونمایی موجی از نگرانی را در صنعت فناوری آمریکا ایجاد کرد. تقریباً بلافاصله، گروهی از نگرانی‌های مربوط به حریم خصوصی و امنیت مطرح شد. سازمان‌های خصوصی و دولتی، که از خطرات احتمالی نگران بودند، به سرعت برای ممنوعیت استفاده از DeepSeek در داخل و خارج از کشور اقدام کردند.

هسته اصلی این نگرانی‌ها از این باور ناشی می‌شد که DeepSeek، با ریشه‌های خود در چین، خطر بیشتری برای عموم مردم آمریکا ایجاد می‌کند. ترس از نظارت، جنگ سایبری و سایر تهدیدات امنیت ملی مکرراً ذکر می‌شد. یکی از بندهای خاص در سیاست حفظ حریم خصوصی DeepSeek، که بیان می‌کرد: “اطلاعات شخصی‌ای که ما از شما جمع‌آوری می‌کنیم ممکن است در سروری واقع در خارج از کشوری که در آن زندگی می‌کنید ذخیره شود. ما اطلاعاتی را که جمع‌آوری می‌کنیم در سرورهای امن واقع در جمهوری خلق چین ذخیره می‌کنیم.”، به این نگرانی‌ها دامن می‌زد.

این بیانیه به ظاهر بی‌ضرر توسط برخی به عنوان دروازه‌ای بالقوه برای دولت چین برای دسترسی به داده‌های حساس کاربران تعبیر شد. پیشرفت سریع توسعه جهانی هوش مصنوعی و “مسابقه تسلیحاتی هوش مصنوعی” درک شده بین ایالات متحده و چین، تنها به تشدید این نگرانی‌ها کمک کرد و فضایی از بی‌اعتمادی عمیق ایجاد کرد و سؤالات اخلاقی را مطرح کرد.

یک افشاگری شگفت‌انگیز: اشتهای Gemini به داده

با این حال، در میان هیاهوی پیرامون DeepSeek، یک افشاگری شگفت‌انگیز ظاهر شده است. با وجود بررسی دقیق مدل هوش مصنوعی چینی، معلوم می‌شود که DeepSeek بزرگترین جمع‌کننده داده در عرصه ربات‌های گفتگو نیست. تحقیقات اخیر Surfshark، یک ارائه‌دهنده معتبر VPN، روش‌های جمع‌آوری داده برخی از محبوب‌ترین برنامه‌های ربات گفتگوی هوش مصنوعی را روشن کرده است.

محققان به طور دقیق جزئیات حریم خصوصی ده ربات گفتگوی برجسته را که همگی در Apple App Store در دسترس هستند، تجزیه و تحلیل کردند: ChatGPT، Gemini، Copilot، Perplexity، DeepSeek، Grok، Jasper، Poe، Claude و Pi. تجزیه و تحلیل آنها بر سه جنبه کلیدی متمرکز بود:

  1. انواع داده‌های جمع‌آوری‌شده: هر برنامه چه دسته‌های خاصی از اطلاعات کاربر را جمع‌آوری می‌کند؟
  2. پیوند داده: آیا هیچ یک از داده‌های جمع‌آوری‌شده مستقیماً به هویت کاربر مرتبط است؟
  3. تبلیغ‌کنندگان شخص ثالث: آیا برنامه داده‌های کاربر را با نهادهای تبلیغاتی خارجی به اشتراک می‌گذارد؟

یافته‌ها تکان‌دهنده بود. Gemini گوگل به عنوان حریص‌ترین برنامه ربات گفتگوی هوش مصنوعی ظاهر شد و از نظر حجم و تنوع اطلاعات شخصی‌ای که جمع‌آوری می‌کند، رقبای خود را تحت‌الشعاع قرار داد. این برنامه 22 نوع از 35 نوع داده کاربری ممکن را جمع‌آوری می‌کند. این شامل داده‌های بسیار حساسی مانند:

  • داده‌های دقیق موقعیت مکانی: مشخص کردن مکان دقیق جغرافیایی کاربر.
  • محتوای کاربر: ضبط محتوای تعاملات کاربر در برنامه.
  • فهرست مخاطبین: دسترسی به مخاطبین دستگاه کاربر.
  • تاریخچه مرور: ردیابی فعالیت مرور وب کاربر.

این جمع‌آوری گسترده داده بسیار فراتر از سایر ربات‌های گفتگوی محبوبی است که در این مطالعه مورد بررسی قرار گرفته‌اند. DeepSeek، موضوع بحث‌های فراوان، از بین ده برنامه رتبه پنجم را به خود اختصاص داد و 11 نوع داده منحصر به فرد را جمع‌آوری کرد.

داده‌های موقعیت مکانی و اشتراک‌گذاری با اشخاص ثالث: نگاهی دقیق‌تر

این مطالعه همچنین روندهای نگران‌کننده‌ای را در مورد داده‌های موقعیت مکانی و اشتراک‌گذاری داده‌ها با اشخاص ثالث کشف کرد. مشخص شد که فقط Gemini، Copilot و Perplexity داده‌های دقیق موقعیت مکانی را جمع‌آوری می‌کنند، که یک قطعه اطلاعات بسیار حساس است که می‌تواند اطلاعات زیادی در مورد حرکات و عادات کاربر نشان دهد.

به طور کلی، تقریباً 30 درصد از ربات‌های گفتگوی تجزیه و تحلیل شده، داده‌های حساس کاربر، از جمله داده‌های موقعیت مکانی و تاریخچه مرور را با نهادهای خارجی مانند دلالان داده به اشتراک می‌گذارند. این عمل نگرانی‌های جدی در مورد حریم خصوصی را ایجاد می‌کند، زیرا اطلاعات کاربر را در معرض شبکه گسترده‌تری از بازیگران قرار می‌دهد، احتمالاً برای اهدافی فراتر از دانش یا کنترل کاربر.

ردیابی داده‌های کاربر: تبلیغات هدفمند و فراتر از آن

یکی دیگر از یافته‌های هشداردهنده، عمل ردیابی داده‌های کاربر برای تبلیغات هدفمند و سایر اهداف بود. مشخص شد که سی درصد از ربات‌های گفتگو، به طور خاص Copilot، Poe و Jasper، داده‌ها را برای ردیابی کاربران خود جمع‌آوری می‌کنند. این بدان معناست که داده‌های کاربر جمع‌آوری‌شده از برنامه با داده‌های شخص ثالث مرتبط است و امکان تبلیغات هدفمند یا اندازه‌گیری اثربخشی تبلیغات را فراهم می‌کند.

مشخص شد که Copilot و Poe شناسه‌های دستگاه را برای این منظور جمع‌آوری می‌کنند، در حالی که Jasper حتی فراتر رفت و نه تنها شناسه‌های دستگاه، بلکه داده‌های تعامل محصول، داده‌های تبلیغاتی و “هر داده دیگری در مورد فعالیت کاربر در برنامه” را جمع‌آوری کرد، به گفته کارشناسان Surfshark.

DeepSeek: نه بهترین، نه بدترین

مدل بحث‌برانگیز DeepSeek R1، در حالی که تحت بررسی دقیق قرار دارد، از نظر جمع‌آوری داده در جایگاه میانی قرار دارد. این مدل به طور متوسط 11 نوع داده منحصر به فرد را جمع‌آوری می‌کند که عمدتاً بر موارد زیر تمرکز دارد:

  • اطلاعات تماس: نام‌ها، آدرس‌های ایمیل، شماره تلفن و غیره.
  • محتوای کاربر: محتوای تولید شده توسط کاربران در برنامه.
  • تشخیص: داده‌های مربوط به عملکرد برنامه و عیب‌یابی.

در حالی که DeepSeek محرمانه‌ترین ربات گفتگو نیست، شیوه‌های جمع‌آوری داده‌های آن کمتر از برخی از همتایان آمریکایی خود، به ویژه Gemini، است.

ChatGPT: یک دیدگاه مقایسه‌ای

برای مقایسه، ChatGPT، یکی از پرکاربردترین ربات‌های گفتگوی هوش مصنوعی، 10 نوع داده منحصر به فرد را جمع‌آوری می‌کند. این شامل:

  • اطلاعات تماس
  • محتوای کاربر
  • شناسه‌ها
  • داده‌های استفاده
  • تشخیص

ذکر این نکته ضروری است که ChatGPT تاریخچه چت را نیز جمع‌آوری می‌کند. با این حال، کاربران می‌توانند از “چت موقت” استفاده کنند، قابلیتی که برای کاهش این مشکل با ذخیره نکردن تاریخچه مکالمه طراحی شده است.

سیاست حفظ حریم خصوصی DeepSeek: کنترل کاربر و حذف داده‌ها

سیاست حفظ حریم خصوصی DeepSeek، در حالی که برای برخی منبع نگرانی است، شامل مقرراتی برای کنترل کاربر بر تاریخچه چت است. این خط‌مشی بیان می‌کند که کاربران می‌توانند تاریخچه چت خود را مدیریت کنند و می‌توانند آن را از طریق تنظیمات خود حذف کنند. این امر درجه‌ای از کنترل را ارائه می‌دهد که همیشه در سایر برنامه‌های ربات گفتگو وجود ندارد.

زمینه گسترده‌تر: توسعه هوش مصنوعی و پویایی ایالات متحده و چین

نگرانی‌های پیرامون DeepSeek و بحث گسترده‌تر در مورد حریم خصوصی داده‌های هوش مصنوعی، به طور جدایی‌ناپذیری با شتاب سریع توسعه جهانی هوش مصنوعی و مسابقه تسلیحاتی هوش مصنوعی درک شده بین ایالات متحده و چین مرتبط است. این زمینه ژئوپلیتیکی لایه دیگری از پیچیدگی را به این موضوع اضافه می‌کند و به نگرانی‌ها در مورد امنیت ملی و پتانسیل سوء استفاده از فناوری‌های هوش مصنوعی دامن می‌زند.

با این حال، یافته‌های مطالعه Surfshark به عنوان یک یادآوری حیاتی عمل می‌کند که نگرانی‌های مربوط به حریم خصوصی داده‌ها به مدل‌های هوش مصنوعی توسعه‌یافته در کشورهای خاص محدود نمی‌شود. در واقع، حریص‌ترین جمع‌کننده داده در میان ربات‌های گفتگوی محبوب تجزیه و تحلیل شده، یک برنامه مستقر در ایالات متحده است. این امر بر نیاز به یک رویکرد دقیق‌تر و جامع‌تر به حریم خصوصی داده‌های هوش مصنوعی تأکید می‌کند، رویکردی که فراتر از مرزهای ملی باشد و بر شیوه‌های شرکت‌های தனி و حفاظ‌هایی که آنها اجرا می‌کنند متمرکز باشد. ضروری است که کاربران در مورد شیوه‌های جمع‌آوری داده ابزارهای هوش مصنوعی‌ای که استفاده می‌کنند، صرف نظر از منشأ آنها، مطلع شوند و مقررات قوی برای محافظت از حریم خصوصی کاربر در چشم‌انداز هوش مصنوعی که به سرعت در حال تحول است، وضع شود. تمرکز باید بر ایجاد استانداردهای روشن برای جمع‌آوری، استفاده و اشتراک‌گذاری داده‌ها، تضمین شفافیت و کنترل کاربر و پاسخگویی شرکت‌ها در قبال شیوه‌های داده‌هایشان باشد.