Gemini Pengumpul Data Terbesar? | ms

Kontroversi DeepSeek dan Respons Industri Teknologi Amerika

Pada bulan Januari, DeepSeek, sebuah syarikat China, melancarkan model AI sumber terbuka utamanya. Pelancaran itu menimbulkan kebimbangan dalam industri teknologi Amerika. Hampir serta-merta, kebimbangan privasi dan keselamatan timbul. Organisasi swasta dan kerajaan, didorong oleh kebimbangan terhadap potensi risiko, bertindak pantas untuk mengharamkan penggunaan DeepSeek di dalam dan di luar negara.

Inti kebimbangan itu berpunca daripada kepercayaan bahawa DeepSeek, dengan asal-usulnya di China, menimbulkan risiko yang lebih tinggi kepada orang awam Amerika. Ketakutan terhadap pengawasan, peperangan siber, dan ancaman keselamatan negara lain sering disebut. Kebimbangan ini didorong oleh klausa khusus dalam dasar privasi DeepSeek, yang menyatakan: ‘Maklumat peribadi yang kami kumpulkan daripada anda mungkin disimpan pada pelayan yang terletak di luar negara tempat anda tinggal. Kami menyimpan maklumat yang kami kumpulkan dalam pelayan selamat yang terletak di Republik Rakyat China.’

Kenyataan yang kelihatan tidak berbahaya ini ditafsirkan oleh sesetengah pihak sebagai pintu masuk yang berpotensi bagi kerajaan China untuk mengakses data pengguna yang sensitif. Kemajuan pesat pembangunan AI global, dan persepsi ‘perlumbaan senjata AI’ antara AS dan China, hanya memburukkan lagi kebimbangan ini, mewujudkan suasana ketidakpercayaan yang mendalam dan menimbulkan persoalan etika.

Pendedahan Mengejutkan: Selera Data Gemini

Walau bagaimanapun, di tengah-tengah kekecohan yang menyelubungi DeepSeek, satu pendedahan mengejutkan telah muncul. Walaupun penelitian yang mendalam ditujukan kepada model AI China, ternyata DeepSeek bukanlah pengumpul data yang paling ketara dalam arena chatbot. Satu penyiasatan baru-baru ini oleh Surfshark, penyedia VPN yang bereputasi, telah memberi penerangan tentang amalan pengumpulan data beberapa aplikasi chatbot AI yang paling popular.

Para penyelidik menganalisis butiran privasi sepuluh chatbot terkemuka, semuanya tersedia di Apple App Store: ChatGPT, Gemini, Copilot, Perplexity, DeepSeek, Grok, Jasper, Poe, Claude, dan Pi. Analisis mereka tertumpu pada tiga aspek utama:

Jenis Data yang Dikumpul: Apakah kategori khusus maklumat pengguna yang dikumpulkan oleh setiap aplikasi?
Perkaitan Data: Adakah mana-mana data yang dikumpul dikaitkan secara langsung dengan identiti pengguna?
Pengiklan Pihak Ketiga: Adakah aplikasi berkongsi data pengguna dengan entiti pengiklanan luaran?

Penemuan itu mengejutkan. Gemini Google muncul sebagai aplikasi chatbot AI yang paling intensif data, mengatasi pesaingnya dalam jumlah dan kepelbagaian maklumat peribadi yang dikumpulnya. Aplikasi ini mengumpul 22 daripada 35 jenis data pengguna yang mungkin. Ini termasuk data yang sangat sensitif seperti:

Data Lokasi Tepat: Menentukan lokasi geografi tepat pengguna.
Kandungan Pengguna: Merakam kandungan interaksi pengguna dalam aplikasi.
Senarai Kenalan: Mengakses kenalan peranti pengguna.
Sejarah Pelayaran: Menjejak aktiviti pelayaran web pengguna.

Pengumpulan data yang meluas ini jauh melebihi chatbot popular lain yang diperiksa dalam kajian itu. DeepSeek, subjek banyak kontroversi, menduduki tempat kelima daripada sepuluh aplikasi, mengumpul 11 jenis data unik yang agak sederhana.

Data Lokasi dan Perkongsian Pihak Ketiga: Pemeriksaan Lebih Dekat

Kajian itu juga mendedahkan trend yang membimbangkan mengenai data lokasi dan perkongsian data dengan pihak ketiga. Hanya Gemini, Copilot, dan Perplexity didapati mengumpul data lokasi yang tepat, sekeping maklumat yang sangat sensitif yang boleh mendedahkan banyak perkara tentang pergerakan dan tabiat pengguna.

Secara lebih meluas, kira-kira 30% daripada chatbot yang dianalisis didapati berkongsi data pengguna yang sensitif, termasuk data lokasi dan sejarah pelayaran, dengan entiti luaran seperti broker data. Amalan ini menimbulkan kebimbangan privasi yang ketara, kerana ia mendedahkan maklumat pengguna kepada rangkaian pelakon yang lebih luas, berpotensi untuk tujuan di luar pengetahuan atau kawalan pengguna.

Menjejak Data Pengguna: Pengiklanan Bersasar dan Selebihnya

Satu lagi penemuan yang membimbangkan ialah amalan menjejak data pengguna untuk pengiklanan bersasar dan tujuan lain. Tiga puluh peratus daripada chatbot, khususnya Copilot, Poe, dan Jasper, didapati mengumpul data untuk menjejak pengguna mereka. Ini bermakna data pengguna yang dikumpul daripada aplikasi dikaitkan dengan data pihak ketiga, membolehkan pengiklanan bersasar atau pengukuran keberkesanan pengiklanan.

Copilot dan Poe didapati mengumpul ID peranti untuk tujuan ini, manakala Jasper melangkah lebih jauh, mengumpul bukan sahaja ID peranti tetapi juga data interaksi produk, data pengiklanan, dan ‘sebarang data lain tentang aktiviti pengguna dalam aplikasi,’ menurut pakar Surfshark.

DeepSeek: Bukan yang Terbaik, Bukan yang Terburuk

Model DeepSeek R1 yang kontroversi, walaupun tertakluk kepada penelitian yang mendalam, menduduki pertengahan dari segi pengumpulan data. Ia mengumpul purata 11 jenis data unik, terutamanya memfokuskan pada:

Maklumat Perhubungan: Nama, alamat e-mel, nombor telefon, dll.
Kandungan Pengguna: Kandungan yang dijana oleh pengguna dalam aplikasi.
Diagnostik: Data yang berkaitan dengan prestasi aplikasi dan penyelesaian masalah.

Walaupun bukan chatbot yang paling menghormati privasi, amalan pengumpulan data DeepSeek adalah kurang meluas daripada beberapa rakan sejawatannya yang berpangkalan di AS, terutamanya Gemini.

ChatGPT: Perspektif Perbandingan

Sebagai perbandingan, ChatGPT, salah satu chatbot AI yang paling banyak digunakan, mengumpul 10 jenis data yang unik. Ini termasuk:

Maklumat Perhubungan
Kandungan Pengguna
Pengecam
Data Penggunaan
Diagnostik

Penting untuk ambil perhatian bahawa ChatGPT juga mengumpul sejarah sembang. Walau bagaimanapun, pengguna mempunyai pilihan untuk menggunakan ‘Sembang Sementara,’ ciri yang direka untuk mengurangkan ini dengan tidak menyimpan sejarah perbualan.

Dasar Privasi DeepSeek: Kawalan Pengguna dan Pemadaman Data

Dasar privasi DeepSeek, walaupun menjadi sumber kebimbangan bagi sesetengah pihak, termasuk peruntukan untuk kawalan pengguna ke atas sejarah sembang. Dasar itu menyatakan bahawa pengguna boleh mengurus sejarah sembang mereka dan mempunyai pilihan untuk memadamkannya melalui tetapan mereka. Ini menawarkan tahap kawalan yang tidak selalu ada dalam aplikasi chatbot lain.

Konteks yang Lebih Luas: Pembangunan AI dan Dinamik AS-China

Kebimbangan yang menyelubungi DeepSeek, dan perdebatan yang lebih luas tentang privasi data AI, berkait rapat dengan pecutan pesat pembangunan AI global dan persepsi perlumbaan senjata AI antara AS dan China. Konteks geopolitik ini menambah satu lagi lapisan kerumitan kepada isu itu, mencetuskan kebimbangan tentang keselamatan negara dan potensi penyalahgunaan teknologi AI.

Penemuan kajian Surfshark, bagaimanapun, berfungsi sebagai peringatan penting bahawa kebimbangan privasi data tidak terhad kepada model AI yang dibangunkan di negara-negara tertentu. Pengumpul data yang paling teruk di kalangan chatbot popular yang dianalisis, sebenarnya, adalah aplikasi yang berpangkalan di AS. Ini menggariskan keperluan untuk pendekatan yang lebih bernuansa dan komprehensif terhadap privasi data AI, yang melangkaui sempadan negara dan memberi tumpuan kepada amalan syarikat individu dan perlindungan yang mereka laksanakan. Adalah penting bahawa pengguna dimaklumkan tentang amalan pengumpulan data alat AI yang mereka gunakan, tanpa mengira asal usulnya, dan peraturan yang teguh disediakan untuk melindungi privasi pengguna dalam landskap AI yang berkembang pesat. Tumpuan harus diberikan pada penetapan piawaian yang jelas untuk pengumpulan, penggunaan dan perkongsian data, memastikan ketelusan dan kawalan pengguna, dan memastikan syarikat bertanggungjawab terhadap amalan data mereka.

dikemaskinikan pada 2025-03-15

# Google # Gemini # Chatbot