Utata wa DeepSeek na Majibu ya Sekta ya Teknolojia ya Marekani
Kuibuka kwa akili bandia (AI) kumeleta wingi wa zana rahisi, lakini pia kumechochea mjadala mkali kuhusu faragha ya data. Kadiri chatbot za AI zinavyozidi kuunganishwa katika maisha yetu ya kila siku, swali la ni kiasi gani cha taarifa za kibinafsi ambazo mifumo hii hukusanya limekuwa muhimu sana. Wakati wasiwasi wa hivi majuzi umejikita kwenye miundo ya AI ya Uchina kama DeepSeek, uchunguzi wa karibu unaonyesha ukweli wa kushangaza: baadhi ya chatbot maarufu za AI zenye makao yake Marekani zinaweza kuwa na pupa zaidi katika mbinu zao za ukusanyaji wa data.
Mnamo Januari, DeepSeek, kampuni ya Uchina, ilizindua muundo wake mkuu wa AI wa chanzo huria. Uzinduzi huo ulisababisha hofu katika sekta ya teknolojia ya Marekani. Karibu mara moja, wimbi la wasiwasi wa faragha na usalama uliibuka. Mashirika ya kibinafsi na ya serikali, yakichochewa na wasiwasi juu ya hatari zinazoweza kutokea, yalichukua hatua haraka kupiga marufuku matumizi ya DeepSeek ndani na kimataifa.
Kiini cha hofu hiyo kilitokana na imani kwamba DeepSeek, yenye asili yake nchini Uchina, ilileta hatari kubwa kwa umma wa Marekani. Hofu ya ufuatiliaji, vita vya mtandaoni, na vitisho vingine vya usalama wa taifa vilitajwa mara kwa mara. Kuchochea wasiwasi huu ilikuwa kifungu maalum katika sera ya faragha ya DeepSeek, ambayo ilisema: ‘Taarifa za kibinafsi tunazokusanya kutoka kwako zinaweza kuhifadhiwa kwenye seva iliyo nje ya nchi unayoishi. Tunahifadhi taarifa tunazokusanya katika seva salama zilizopo katika Jamhuri ya Watu wa Uchina.’
Taarifa hii inayoonekana kuwa ya kawaida ilitafsiriwa na baadhi ya watu kama lango linalowezekana kwa serikali ya Uchina kufikia data nyeti za watumiaji. Maendeleo ya haraka ya maendeleo ya AI duniani, na ‘mbio za silaha za AI’ zinazoonekana kati ya Marekani na Uchina, zilizidisha tu wasiwasi huu, na kuunda mazingira ya kutoaminiana sana na kuibua maswali ya kimaadili.
Ufunuo wa Kushangaza: Hamu ya Data ya Gemini
Hata hivyo, katikati ya ghasia kuhusu DeepSeek, ufunuo wa kushangaza umeibuka. Licha ya uchunguzi mkali ulioelekezwa kwa muundo wa AI wa Uchina, inageuka kuwa DeepSeek sio mkusanyaji mkuu wa data katika uwanja wa chatbot. Uchunguzi wa hivi majuzi wa Surfshark, mtoa huduma wa VPN anayeaminika, umetoa mwanga juu ya mbinu za ukusanyaji wa data za baadhi ya programu maarufu za chatbot za AI.
Watafiti walichambua kwa makini maelezo ya faragha ya chatbot kumi maarufu, zote zinapatikana kwa urahisi kwenye Apple App Store: ChatGPT, Gemini, Copilot, Perplexity, DeepSeek, Grok, Jasper, Poe, Claude, na Pi. Uchambuzi wao ulijikita katika vipengele vitatu muhimu:
- Aina za Data Zilizokusanywa: Ni aina gani mahususi za taarifa za mtumiaji ambazo kila programu hukusanya?
- Uhusiano wa Data: Je, data yoyote iliyokusanywa imeunganishwa moja kwa moja na utambulisho wa mtumiaji?
- Watangazaji wa Nje: Je, programu inashiriki data ya mtumiaji na vyombo vya nje vya utangazaji?
Matokeo yalikuwa ya kushangaza. Gemini ya Google iliibuka kama programu ya chatbot ya AI yenye data nyingi zaidi, ikizidi washindani wake kwa wingi na aina mbalimbali za taarifa za kibinafsi inazokusanya. Programu hukusanya aina 22 kati ya 35 zinazowezekana za data ya mtumiaji. Hii inajumuisha data nyeti sana kama vile:
- Data Sahihi ya Mahali: Kubainisha mahali halisi pa kijiografia pa mtumiaji.
- Maudhui ya Mtumiaji: Kunasa maudhui ya mwingiliano wa mtumiaji ndani ya programu.
- Orodha ya Anwani: Kufikia anwani za kifaa cha mtumiaji.
- Historia ya Kuvinjari: Kufuatilia shughuli za mtumiaji za kuvinjari wavuti.
Ukusanyaji huu mkubwa wa data unazidi ule wa chatbot nyingine maarufu zilizochunguzwa katika utafiti huo. DeepSeek, ambayo imekuwa ikichunguzwa sana, ilishika nafasi ya tano kati ya programu kumi, ikikusanya aina 11 za kipekee za data.
Data ya Mahali na Kushiriki na Wengine: Mtazamo wa Karibu
Utafiti huo pia uligundua mienendo ya kutia wasiwasi kuhusu data ya mahali na kushiriki data na wahusika wengine. Ni Gemini, Copilot, na Perplexity pekee zilizopatikana kukusanya data sahihi ya mahali, kipande cha taarifa nyeti sana ambacho kinaweza kufichua mengi kuhusu mienendo na tabia za mtumiaji.
Kwa upana zaidi, takriban 30% ya chatbot zilizochambuliwa zilipatikana kushiriki data nyeti za watumiaji, ikiwa ni pamoja na data ya mahali na historia ya kuvinjari, na vyombo vya nje kama vile madalali wa data. Zoezi hili linazua wasiwasi mkubwa wa faragha, kwani linaweka taarifa za mtumiaji kwenye mtandao mpana wa wahusika, ikiwezekana kwa madhumuni yaliyo nje ya ufahamu au udhibiti wa mtumiaji.
Kufuatilia Data ya Mtumiaji: Utangazaji Unaolengwa na Zaidi
Ugunduzi mwingine wa kutisha ulikuwa ni zoezi la kufuatilia data ya mtumiaji kwa utangazaji unaolengwa na madhumuni mengine. Asilimia thelathini ya chatbot, haswa Copilot, Poe, na Jasper, zilipatikana kukusanya data ili kufuatilia watumiaji wao. Hii inamaanisha kuwa data ya mtumiaji iliyokusanywa kutoka kwa programu imeunganishwa na data ya wahusika wengine, kuwezesha utangazaji unaolengwa au kipimo cha ufanisi wa utangazaji.
Copilot na Poe zilipatikana kukusanya vitambulisho vya kifaa kwa madhumuni haya, huku Jasper ikienda mbali zaidi, ikikusanya sio tu vitambulisho vya kifaa bali pia data ya mwingiliano wa bidhaa, data ya utangazaji, na ‘data nyingine yoyote kuhusu shughuli za mtumiaji katika programu,’ kulingana na wataalamu wa Surfshark.
DeepSeek: Sio Bora Zaidi, Sio Mbaya Zaidi
Muundo wa DeepSeek R1 wenye utata, ingawa ulichunguzwa sana, unachukua nafasi ya kati katika suala la ukusanyaji wa data. Inakusanya wastani wa aina 11 za kipekee za data, ikizingatia zaidi:
- Taarifa za Mawasiliano: Majina, anwani za barua pepe, nambari za simu, n.k.
- Maudhui ya Mtumiaji: Maudhui yanayozalishwa na watumiaji ndani ya programu.
- Uchunguzi: Data inayohusiana na utendaji wa programu na utatuzi wa matatizo.
Ingawa sio chatbot inayoheshimu faragha zaidi, mbinu za ukusanyaji wa data za DeepSeek ni ndogo kuliko zile za baadhi ya wenzao wa Marekani, haswa Gemini.
ChatGPT: Mtazamo Linganishi
Kwa kulinganisha, ChatGPT, mojawapo ya chatbot za AI zinazotumiwa sana, hukusanya aina 10 za kipekee za data. Hii inajumuisha:
- Taarifa za Mawasiliano
- Maudhui ya Mtumiaji
- Vitambulisho
- Data ya Matumizi
- Uchunguzi
Ni muhimu kutambua kwamba ChatGPT pia hukusanya historia ya mazungumzo. Hata hivyo, watumiaji wana chaguo la kutumia ‘Temporary chat,’ kipengele kilichoundwa kupunguza hili kwa kutohifadhi historia ya mazungumzo.
Sera ya Faragha ya DeepSeek: Udhibiti wa Mtumiaji na Ufutaji wa Data
Sera ya faragha ya DeepSeek, ingawa ni chanzo cha wasiwasi kwa baadhi ya watu, inajumuisha masharti ya udhibiti wa mtumiaji juu ya historia ya mazungumzo. Sera inasema kuwa watumiaji wanaweza kudhibiti historia yao ya mazungumzo na wana chaguo la kuifuta kupitia mipangilio yao. Hii inatoa kiwango cha udhibiti ambacho hakipatikani kila wakati katika programu zingine za chatbot.
Muktadha Mpana: Maendeleo ya AI na Mienendo ya Marekani na Uchina
Wasiwasi kuhusu DeepSeek, na mjadala mpana kuhusu faragha ya data ya AI, unahusishwa kwa karibu na kuongezeka kwa kasi kwa maendeleo ya AI duniani na mbio za silaha za AI zinazoonekana kati ya Marekani na Uchina. Muktadha huu wa kijiografia unaongeza safu nyingine ya utata kwa suala hilo, na kuchochea wasiwasi kuhusu usalama wa taifa na uwezekano wa matumizi mabaya ya teknolojia za AI.
Matokeo ya utafiti wa Surfshark, hata hivyo, yanatumika kama ukumbusho muhimu kwamba wasiwasi wa faragha ya data hauhusiani tu na miundo ya AI iliyoendelezwa katika nchi maalum. Mkusanyaji mkuu wa data kati ya chatbot maarufu zilizochambuliwa, kwa kweli, ni programu yenye makao yake Marekani. Hii inasisitiza haja ya mbinu ya kina zaidi na ya kina ya faragha ya data ya AI, ambayo inapita mipaka ya kitaifa na kuzingatia mbinu za kampuni binafsi na ulinzi wanaotekeleza. Ni muhimu kwamba watumiaji wajulishwe kuhusu mbinu za ukusanyaji wa data za zana za AI wanazotumia, bila kujali asili yao, na kwamba kanuni thabiti ziwekwe ili kulinda faragha ya mtumiaji katika mazingira ya AI yanayoendelea kwa kasi. Lengo linapaswa kuwa katika kuweka viwango vya wazi vya ukusanyaji, matumizi, na ushirikishaji wa data, kuhakikisha uwazi na udhibiti wa mtumiaji, na kuwajibisha kampuni kwa mbinu zao za data.