Mafunzo ya DeepSeek: Gemini alihusika?

Hivi karibuni, kumekuwa na uvumi unaoashiria kuwa DeepSeek, maabara ya akili bandia (AI) ya Kichina, huenda ilitumia data kutoka kwa modeli ya akili bandia ya Google, Gemini, kwa ajili ya kuifunza toleo lake jipya zaidi, modeli ya akili bandia ya kufikiri, R1. Modeli hii imeonyesha ufanisi mkubwa katika alama za hesabu na uandishi wa msimbo. Ingawa DeepSeek imesalia kimya kuhusu vyanzo vya data vilivyotumiwa kuifunza R1, watafiti kadhaa wa akili bandia wamependekeza kuwa Gemini, au angalau sehemu za Gemini, ilichukua jukumu.

Ushahidi na Madai

Sam Paech, msanidi programu anayeishi Melbourne ambaye ana utaalam wa kuunda tathmini za "akili ya hisia" kwa ajili ya akili bandia, amewasilisha kile anachoamini kuwa ni ushahidi kwamba modeli ya DeepSeek ilifunzwa kwa kutumia matokeo yaliyozalishwa na Gemini. Paech alibainisha katika chapisho kwenye X (zamani Twitter) kwamba modeli ya DeepSeek, haswa toleo la R1-0528, huonyesha upendeleo kwa lugha na misemo inayofanana na ile inayopendelewa na Google’s Gemini 2.5 Pro.

Zaidi ya hayo, msanidi programu mwingine, anayefanya kazi chini ya jina bandia la muundaji wa SpeechMap, "tathmini ya uhuru wa kusema" kwa ajili ya akili bandia, ameona kwamba "mawazo" yanayozalishwa na modeli ya DeepSeek inavyofanya kazi kuelekea hitimisho yanafanana sana na athari za Gemini. Uchunguzi huu unaongeza safu nyingine ya udadisi kwa madai hayo.

Hii sio mara ya kwanza kwa DeepSeek kukabiliwa na madai ya kutumia data kutoka kwa modeli shindani za akili bandia. Hapo awali mwezi Desemba, wasanidi programu waligundua kuwa modeli ya V3 ya DeepSeek mara nyingi ilijitambulisha kama ChatGPT, jukwaa maarufu la mazungumzo la OpenAI. Hii ilionyesha kuwa modeli hiyo ilikuwa imefunzwa kwa kumbukumbu za mazungumzo za ChatGPT, na kuibua wasiwasi kuhusu mazoea ya matumizi ya data.

Madai Mazito Zaidi: Uchujaji na Uhamishaji Data

Mapema mwaka huu, OpenAI ilishirikisha na Financial Times kwamba walikuwa wamegundua ushahidi unaohusisha DeepSeek na matumizi ya mbinu inayoitwa uchujaji. Uchujaji unahusisha kufunza modeli za akili bandia kwa kutoa data kutoka kwa modeli kubwa na za kisasa zaidi. Bloomberg iliripoti kuwa Microsoft, mshirika mkuu na mwekezaji katika OpenAI, alikuwa amegundua uhamishaji mkubwa wa data kupitia akaunti za wasanidi wa OpenAI mwishoni mwa 2024. OpenAI inaamini kuwa akaunti hizi zimeunganishwa na DeepSeek.

Uchujaji, ingawa sio mbaya kimaadili, huwa na shida inapoenda kinyume na masharti ya huduma. Masharti ya OpenAI yanawakataza wateja waziwazi kutumia matokeo ya modeli ya kampuni hiyo kutengeneza mifumo shindani ya akili bandia. Hii inaibua maswali mazito kuhusu uzingatiaji wa DeepSeek wa masharti haya.

Maji Yaliyochafuka ya Data ya Mafunzo ya Akili Bandia

Ni muhimu kutambua kwamba modeli za akili bandia mara nyingi hujitambulisha vibaya na hukutana na maneno na misemo inayofanana. Hii ni kwa sababu ya asili ya wavuti iliyo wazi, ambayo hutumika kama chanzo kikuu cha data ya mafunzo kwa kampuni nyingi za akili bandia. Mtandao unazidi kujaa maudhui yanayotokana na akili bandia. Mashamba ya maudhui yanatumia akili bandia kutoa chambo za kubofya, na roboti zinafurika majukwaa kama Reddit na X na machapisho yanayotokana na akili bandia.

"Uchafuzi" huu hufanya iwe changamoto sana kuchuja kwa ufanisi matokeo ya akili bandia kutoka kwa seti za data za mafunzo, na kuzidisha swali la ikiwa DeepSeek ilitumia data ya Gemini kwa makusudi.

Maoni na Mitazamo ya Wataalamu

Licha ya changamoto katika kuthibitisha madai hayo kwa uhakika, baadhi ya wataalamu wa akili bandia wanaamini kuwa inawezekana kwamba DeepSeek ilifunzwa kwa data kutoka kwa Google’s Gemini. Nathan Lambert, mtafiti katika taasisi isiyo ya faida ya utafiti wa akili bandia AI2, alisema kwenye X, "Ikiwa ningekuwa DeepSeek, hakika ningeunda tani nyingi za data bandia kutoka kwa modeli bora zaidi ya API huko nje. [DeepSeek ina] upungufu wa GPU na imejazwa na pesa. Ni hesabu bora zaidi kwao."

Mtazamo wa Lambert unaangazia motisha za kiuchumi za DeepSeek kutumia modeli zilizopo za akili bandia ili kuongeza uwezo wake, haswa kutokana na vikwazo vyake vya rasilimali.

Hatua za Usalama na Kinga

Kampuni za akili bandia zimekuwa zikiimarisha hatua za usalama, kwa sehemu kuzuia mazoea kama vile uchujaji. OpenAI, mnamo Aprili, ilianza kuzitaka mashirika kukamilisha mchakato uthibitishaji wa kitambulisho ili kufikia modeli fulani za hali ya juu. Mchakato huu unahusisha kuwasilisha kitambulisho kilichotolewa na serikali kutoka nchi inayoungwa mkono na API ya OpenAI. Uchina haipo katika orodha hii.

Katika hatua nyingine, Google ilianza hivi majuzi "kutoa muhtasari" wa athari zinazozalishwa na modeli zinazopatikana kupitia jukwaa lake la msanidi programu la AI Studio. Kitendo hiki hufanya iwe vigumu zaidi kufunza modeli pinzani kwenye athari za Gemini kwa ufanisi. Vile vile, Anthropic ilitangaza mnamo Mei kwamba ingeanza kutoa muhtasari wa athari za modeli yake yenyewe, ikitoa mfano wa hitaji la kulinda "faida zake za ushindani." Hatua hizi zinaonyesha ufahamu unaokua wa uwezekano wa matumizi mabaya ya matokeo ya modeli ya akili bandia na juhudi za makusudi za kupunguza hatari hizo.

Athari na Matokeo

Madai dhidi ya DeepSeek yanaibua maswali muhimu kuhusu maadili na uhalali wa mazoea ya mafunzo ya akili bandia. Ikiwa DeepSeek ilitumia data ya Gemini kufunza modeli yake ya R1, inaweza kukabiliwa na athari za kisheria na uharibifu wa sifa. Hali hii pia inaangazia hitaji la uwazi zaidi na udhibiti katika tasnia ya akili bandia, haswa kuhusu upatikanaji na matumizi ya data.

Madai dhidi ya DeepSeek yanaangazia shida kubwa: jinsi ya kusawazisha hamu ya uvumbuzi na maendeleo katika akili bandia na hitaji la kulinda mali miliki na kuhakikisha ushindani wa haki. Tasnia ya akili bandia inabadilika haraka, na miongozo wazi na mifumo ya maadili ni muhimu ili kuabiri mandhari tata ya kisheria na kimaadili. Kampuni lazima ziwe wazi kuhusu vyanzo vyao vya data na zizingatie makubaliano ya masharti ya huduma ili kudumisha uaminifu na kuepuka madeni ya kisheria yanayoweza kutokea.

Zaidi ya hayo, suala la maudhui yanayotokana na akili bandia kuchafua seti za data za mafunzo linatoa changamoto kubwa kwa jumuiya nzima ya akili bandia. Kadiri modeli za akili bandia zinavyozidi kuwa mahiri katika kutoa maandishi, picha na aina nyinginezo za maudhui, inakuwa vigumu zaidi kutofautisha kati ya data inayotokana na binadamu na data inayotokana na akili bandia. "Uchafuzi" huu unaweza kusababisha usawa wa modeli za akili bandia, ambapo zote zinaanza kuonyesha upendeleo na mapungufu sawa.

Ili kukabiliana na changamoto hii, kampuni za akili bandia zinahitaji kuwekeza katika mbinu za kisasa zaidi za uchujaji wa data na kuchunguza vyanzo mbadala vya data ya mafunzo. Pia wanahitaji kuwa wazi zaidi kuhusu muundo wa seti zao za data za mafunzo na mbinu zinazotumiwa kuchuja maudhui yanayotokana na akili bandia.

Kuabiri Mustakabali wa Mafunzo ya Akili Bandia

Utata wa DeepSeek unaangazia hitaji la haraka la mjadala uliojaa zaidi kuhusu mustakabali wa mafunzo ya akili bandia. Kadiri modeli za akili bandia zinavyozidi kuwa na nguvu na data inavyozidi kuwa haba, kampuni zinaweza kushawishiwa kukata kona na kujihusisha na mazoea yasiyo ya kimaadili au haramu. Hata hivyo, mazoea kama hayo hatimaye hudhoofisha uendelevu wa muda mrefu na uaminifu wa tasnia ya akili bandia.

Juhudi shirikishi zinazohusisha watafiti, watunga sera na viongozi wa tasnia zinahitajika ili kuendeleza miongozo ya kimaadili na mifumo ya kisheria ambayo inakuza maendeleo ya akili bandia yenye uwajibikaji. Miongozo hii inapaswa kushughulikia masuala kama vile upatikanaji wa data, uwazi na uwajibikaji. Pia wanapaswa kuhimiza kampuni kuwekeza katika mazoea ya mafunzo ya akili bandia yenye maadili na endelevu.

Mazingatio muhimu kwa mustakabali wa mafunzo ya akili bandia:

  • Uwazi: Kampuni zinapaswa kuwa wazi kuhusu vyanzo vya data vilivyotumiwa kufunza modeli zao za akili bandia na mbinu zinazotumiwa kuchuja maudhui yanayotokana na akili bandia.
  • Maadili: Maendeleo ya akili bandia yanapaswa kuzingatia kanuni za kimaadili zinazokuza haki, uwajibikaji na heshima kwa mali miliki.
  • Udhibiti: Watunga sera wanapaswa kuunda mifumo wazi ya kisheria ambayo inashughulikia changamoto za kipekee zinazoletwa na mafunzo ya akili bandia.
  • Ushirikiano: Watafiti, watunga sera na viongozi wa tasnia wanapaswa kushirikiana ili kuendeleza miongozo ya kimaadili na mbinu bora za maendeleo ya akili bandia.
  • Tofauti za Takwimu: Mafunzo ya akili bandia yanapaswa kuweka kipaumbele tofauti za takwimu ili kupunguza upendeleo na kuboresha utendaji wa jumla wa modeli za akili bandia.
  • Uendelevu: Mafunzo ya akili bandia yanapaswa kufanywa kwa njia endelevu, kupunguza athari zake za kimazingira.
  • Usalama: Hatua za usalama zinapaswa kulinda modeli za akili bandia na data ya mafunzo kutoka kwa ufikiaji na matumizi yasiyoidhinishwa.

Kwa kushughulikia mazingatio haya muhimu, tasnia ya akili bandia inaweza kuhakikisha kwamba maendeleo ya akili bandia yanafanywa kwa njia yenye uwajibikaji na kimaadili, kukuza uvumbuzi huku ikipunguza hatari zinazoweza kutokea.

Njia ya Mbele

Madai yaliyotolewa dhidi ya DeepSeek yanatumika kama simu ya kuamsha jamii ya akili bandia. Wanaangazia hitaji muhimu la uwazi zaidi, maadili na ulinzi thabiti katika maendeleo ya akili bandia. Kadiri akili bandia inavyoendelea kupenya vipengele mbalimbali vya maisha yetu, ni muhimu kwamba tuanzishe mipaka wazi na miongozo ya kimaadili ili kuhakikisha matumizi yake ya uwajibikaji na yenye manufaa.

Kesi ya DeepSeek, bila kujali matokeo yake ya mwisho, bila shaka itaunda mjadala unaoendelea kuhusu maadili ya akili bandia na kuathiri mwelekeo wa baadaye wa maendeleo ya akili bandia. Inatumika kama ukumbusho kwamba harakati za uvumbuzi lazima zizamishwe na kujitolea kwa kanuni za kimaadili na utambuzi wa matokeo yanayoweza kutokea ya vitendo vyetu. Mustakabali wa akili bandia unategemea uwezo wetu wa kuabiri changamoto hizi tata kwa hekima na kuona mbali.