جنجال DeepSeek و واکنش صنعت فناوری آمریکا
در ژانویه، DeepSeek، یک شرکت چینی، مدل هوش مصنوعی متنباز پرچمدار خود را رونمایی کرد. این رونمایی موجی از نگرانی را در صنعت فناوری آمریکا ایجاد کرد. تقریباً بلافاصله، گروهی از نگرانیهای مربوط به حریم خصوصی و امنیت مطرح شد. سازمانهای خصوصی و دولتی، که از خطرات احتمالی نگران بودند، به سرعت برای ممنوعیت استفاده از DeepSeek در داخل و خارج از کشور اقدام کردند.
هسته اصلی این نگرانیها از این باور ناشی میشد که DeepSeek، با ریشههای خود در چین، خطر بیشتری برای عموم مردم آمریکا ایجاد میکند. ترس از نظارت، جنگ سایبری و سایر تهدیدات امنیت ملی مکرراً ذکر میشد. یکی از بندهای خاص در سیاست حفظ حریم خصوصی DeepSeek، که بیان میکرد: “اطلاعات شخصیای که ما از شما جمعآوری میکنیم ممکن است در سروری واقع در خارج از کشوری که در آن زندگی میکنید ذخیره شود. ما اطلاعاتی را که جمعآوری میکنیم در سرورهای امن واقع در جمهوری خلق چین ذخیره میکنیم.”، به این نگرانیها دامن میزد.
این بیانیه به ظاهر بیضرر توسط برخی به عنوان دروازهای بالقوه برای دولت چین برای دسترسی به دادههای حساس کاربران تعبیر شد. پیشرفت سریع توسعه جهانی هوش مصنوعی و “مسابقه تسلیحاتی هوش مصنوعی” درک شده بین ایالات متحده و چین، تنها به تشدید این نگرانیها کمک کرد و فضایی از بیاعتمادی عمیق ایجاد کرد و سؤالات اخلاقی را مطرح کرد.
یک افشاگری شگفتانگیز: اشتهای Gemini به داده
با این حال، در میان هیاهوی پیرامون DeepSeek، یک افشاگری شگفتانگیز ظاهر شده است. با وجود بررسی دقیق مدل هوش مصنوعی چینی، معلوم میشود که DeepSeek بزرگترین جمعکننده داده در عرصه رباتهای گفتگو نیست. تحقیقات اخیر Surfshark، یک ارائهدهنده معتبر VPN، روشهای جمعآوری داده برخی از محبوبترین برنامههای ربات گفتگوی هوش مصنوعی را روشن کرده است.
محققان به طور دقیق جزئیات حریم خصوصی ده ربات گفتگوی برجسته را که همگی در Apple App Store در دسترس هستند، تجزیه و تحلیل کردند: ChatGPT، Gemini، Copilot، Perplexity، DeepSeek، Grok، Jasper، Poe، Claude و Pi. تجزیه و تحلیل آنها بر سه جنبه کلیدی متمرکز بود:
- انواع دادههای جمعآوریشده: هر برنامه چه دستههای خاصی از اطلاعات کاربر را جمعآوری میکند؟
- پیوند داده: آیا هیچ یک از دادههای جمعآوریشده مستقیماً به هویت کاربر مرتبط است؟
- تبلیغکنندگان شخص ثالث: آیا برنامه دادههای کاربر را با نهادهای تبلیغاتی خارجی به اشتراک میگذارد؟
یافتهها تکاندهنده بود. Gemini گوگل به عنوان حریصترین برنامه ربات گفتگوی هوش مصنوعی ظاهر شد و از نظر حجم و تنوع اطلاعات شخصیای که جمعآوری میکند، رقبای خود را تحتالشعاع قرار داد. این برنامه 22 نوع از 35 نوع داده کاربری ممکن را جمعآوری میکند. این شامل دادههای بسیار حساسی مانند:
- دادههای دقیق موقعیت مکانی: مشخص کردن مکان دقیق جغرافیایی کاربر.
- محتوای کاربر: ضبط محتوای تعاملات کاربر در برنامه.
- فهرست مخاطبین: دسترسی به مخاطبین دستگاه کاربر.
- تاریخچه مرور: ردیابی فعالیت مرور وب کاربر.
این جمعآوری گسترده داده بسیار فراتر از سایر رباتهای گفتگوی محبوبی است که در این مطالعه مورد بررسی قرار گرفتهاند. DeepSeek، موضوع بحثهای فراوان، از بین ده برنامه رتبه پنجم را به خود اختصاص داد و 11 نوع داده منحصر به فرد را جمعآوری کرد.
دادههای موقعیت مکانی و اشتراکگذاری با اشخاص ثالث: نگاهی دقیقتر
این مطالعه همچنین روندهای نگرانکنندهای را در مورد دادههای موقعیت مکانی و اشتراکگذاری دادهها با اشخاص ثالث کشف کرد. مشخص شد که فقط Gemini، Copilot و Perplexity دادههای دقیق موقعیت مکانی را جمعآوری میکنند، که یک قطعه اطلاعات بسیار حساس است که میتواند اطلاعات زیادی در مورد حرکات و عادات کاربر نشان دهد.
به طور کلی، تقریباً 30 درصد از رباتهای گفتگوی تجزیه و تحلیل شده، دادههای حساس کاربر، از جمله دادههای موقعیت مکانی و تاریخچه مرور را با نهادهای خارجی مانند دلالان داده به اشتراک میگذارند. این عمل نگرانیهای جدی در مورد حریم خصوصی را ایجاد میکند، زیرا اطلاعات کاربر را در معرض شبکه گستردهتری از بازیگران قرار میدهد، احتمالاً برای اهدافی فراتر از دانش یا کنترل کاربر.
ردیابی دادههای کاربر: تبلیغات هدفمند و فراتر از آن
یکی دیگر از یافتههای هشداردهنده، عمل ردیابی دادههای کاربر برای تبلیغات هدفمند و سایر اهداف بود. مشخص شد که سی درصد از رباتهای گفتگو، به طور خاص Copilot، Poe و Jasper، دادهها را برای ردیابی کاربران خود جمعآوری میکنند. این بدان معناست که دادههای کاربر جمعآوریشده از برنامه با دادههای شخص ثالث مرتبط است و امکان تبلیغات هدفمند یا اندازهگیری اثربخشی تبلیغات را فراهم میکند.
مشخص شد که Copilot و Poe شناسههای دستگاه را برای این منظور جمعآوری میکنند، در حالی که Jasper حتی فراتر رفت و نه تنها شناسههای دستگاه، بلکه دادههای تعامل محصول، دادههای تبلیغاتی و “هر داده دیگری در مورد فعالیت کاربر در برنامه” را جمعآوری کرد، به گفته کارشناسان Surfshark.
DeepSeek: نه بهترین، نه بدترین
مدل بحثبرانگیز DeepSeek R1، در حالی که تحت بررسی دقیق قرار دارد، از نظر جمعآوری داده در جایگاه میانی قرار دارد. این مدل به طور متوسط 11 نوع داده منحصر به فرد را جمعآوری میکند که عمدتاً بر موارد زیر تمرکز دارد:
- اطلاعات تماس: نامها، آدرسهای ایمیل، شماره تلفن و غیره.
- محتوای کاربر: محتوای تولید شده توسط کاربران در برنامه.
- تشخیص: دادههای مربوط به عملکرد برنامه و عیبیابی.
در حالی که DeepSeek محرمانهترین ربات گفتگو نیست، شیوههای جمعآوری دادههای آن کمتر از برخی از همتایان آمریکایی خود، به ویژه Gemini، است.
ChatGPT: یک دیدگاه مقایسهای
برای مقایسه، ChatGPT، یکی از پرکاربردترین رباتهای گفتگوی هوش مصنوعی، 10 نوع داده منحصر به فرد را جمعآوری میکند. این شامل:
- اطلاعات تماس
- محتوای کاربر
- شناسهها
- دادههای استفاده
- تشخیص
ذکر این نکته ضروری است که ChatGPT تاریخچه چت را نیز جمعآوری میکند. با این حال، کاربران میتوانند از “چت موقت” استفاده کنند، قابلیتی که برای کاهش این مشکل با ذخیره نکردن تاریخچه مکالمه طراحی شده است.
سیاست حفظ حریم خصوصی DeepSeek: کنترل کاربر و حذف دادهها
سیاست حفظ حریم خصوصی DeepSeek، در حالی که برای برخی منبع نگرانی است، شامل مقرراتی برای کنترل کاربر بر تاریخچه چت است. این خطمشی بیان میکند که کاربران میتوانند تاریخچه چت خود را مدیریت کنند و میتوانند آن را از طریق تنظیمات خود حذف کنند. این امر درجهای از کنترل را ارائه میدهد که همیشه در سایر برنامههای ربات گفتگو وجود ندارد.
زمینه گستردهتر: توسعه هوش مصنوعی و پویایی ایالات متحده و چین
نگرانیهای پیرامون DeepSeek و بحث گستردهتر در مورد حریم خصوصی دادههای هوش مصنوعی، به طور جداییناپذیری با شتاب سریع توسعه جهانی هوش مصنوعی و مسابقه تسلیحاتی هوش مصنوعی درک شده بین ایالات متحده و چین مرتبط است. این زمینه ژئوپلیتیکی لایه دیگری از پیچیدگی را به این موضوع اضافه میکند و به نگرانیها در مورد امنیت ملی و پتانسیل سوء استفاده از فناوریهای هوش مصنوعی دامن میزند.
با این حال، یافتههای مطالعه Surfshark به عنوان یک یادآوری حیاتی عمل میکند که نگرانیهای مربوط به حریم خصوصی دادهها به مدلهای هوش مصنوعی توسعهیافته در کشورهای خاص محدود نمیشود. در واقع، حریصترین جمعکننده داده در میان رباتهای گفتگوی محبوب تجزیه و تحلیل شده، یک برنامه مستقر در ایالات متحده است. این امر بر نیاز به یک رویکرد دقیقتر و جامعتر به حریم خصوصی دادههای هوش مصنوعی تأکید میکند، رویکردی که فراتر از مرزهای ملی باشد و بر شیوههای شرکتهای தனி و حفاظهایی که آنها اجرا میکنند متمرکز باشد. ضروری است که کاربران در مورد شیوههای جمعآوری داده ابزارهای هوش مصنوعیای که استفاده میکنند، صرف نظر از منشأ آنها، مطلع شوند و مقررات قوی برای محافظت از حریم خصوصی کاربر در چشمانداز هوش مصنوعی که به سرعت در حال تحول است، وضع شود. تمرکز باید بر ایجاد استانداردهای روشن برای جمعآوری، استفاده و اشتراکگذاری دادهها، تضمین شفافیت و کنترل کاربر و پاسخگویی شرکتها در قبال شیوههای دادههایشان باشد.