Changamoto ya DeepSeek
Kufunuliwa kwa DeepSeek-R1 mnamo Januari kulizua shauku kubwa ndani ya jumuiya ya teknolojia. Miundo ya lugha ya Kichina ya awali, kama vile Ernie ya Baidu na Doubao ya ByteDance, ilionyesha ahadi katika matumizi ya lugha ya Kichina, hesabu, na kuweka misimbo, lakini ilikuwa na kikomo na ujuzi dhaifu wa Kiingereza na ufikiaji mdogo. DeepSeek-R1, hata hivyo, iliashiria hatua muhimu kama LLM ya kwanza ya Kichina kupata kutambuliwa kimataifa.
Moja ya mambo ya kushangaza zaidi ya DeepSeek-R1 ilikuwa gharama yake ya chini ya maendeleo. Tofauti na GPT-4o ya OpenAI, ambayo inadaiwa iligharimu zaidi ya dola za Kimarekani milioni 100 kufunza, watafiti wa DeepSeek walidai chatbot yao ilitengenezwa kwa dola za Kimarekani milioni 5.6 tu. Huku ikiendeleza zaidi simulizi la ufanisi, wahandisi wa DeepSeek walifunza muundo wa R1 kwa kutumia CPUs za kiwango cha kati kama Nvidia H800, badala ya chips za kiwango cha juu zinazotumiwa katika miundo kama GPT-4o au Claude ya Anthropic. Licha ya vikwazo vya Marekani vya kusafirisha chips za utendaji wa juu hadi China, DeepSeek-R1 iliweza kuzidi roboti zingine zinazoongoza kwa kutumia wasindikaji 2,048 tu walioenea katika seva 256.
Ufanisi huu wa ajabu na gharama ya chini ya maendeleo ilihusishwa sana na mbinu za hali ya juu za programu, pamoja na PTX, lugha kama ya mkutano ambayo inawezesha wasanidi programu kurekebisha utendaji na kuongeza matumizi ya maunzi.
Muda mfupi baada ya kutolewa kwake, programu ya DeepSeek-R1 ilipanda hadi kileleni mwa viwango vya upakuaji bila malipo vya Duka la Programu la Apple la Marekani, na kuzidi ChatGPT, TikTok, na majukwaa ya mitandao ya kijamii ya Meta. Nasdaq ilipata kushuka, na hisa za Nvidia zilishuka baada ya kuonyeshwa kwa DeepSeek-R1.
Kuhoji Madai ya DeepSeek
Licha ya shauku ya awali, waangalizi wengi wamezua maswali kuhusu uhalali wa madai ya DeepSeek kuhusu LLM yake. Wachambuzi wamependekeza kuwa takwimu zilizotajwa zinawezekana kuhesabu gharama za kompyuta tu, huku ukiondoa au kupunguza miundombinu, maunzi, na gharama za rasilimali watu.
Wesley Kuo, mwanzilishi na Mkurugenzi Mtendaji wa Ubitus, mtoa huduma wa AI jenereta na michezo ya wingu anayeishi Taipei, alirudia wasiwasi huu, akisema kuwa gharama halisi ina uwezekano wa kuwa juu zaidi kuliko inavyoripotiwa. Ubitus, ikiungwa mkono na Nvidia, ilisaidia Mradi wa TAME, LLM iliyoandaliwa kwa lugha ya jadi ya Kichina. Walitoa H100 CPUs na data ya michezo. Ubitus pia ilishirikiana na Foxlink na Shinfox Energy kuanzisha Ubilink.AI, wakijenga kituo kikubwa zaidi cha huduma ya supercomputing ya AI kinachoendeshwa na nishati ya kijani kibichi nchini Taiwan kwa kushirikiana na Asus.
Kuo anasisitiza ushiriki wa kampuni katika kuendeleza programu na miundo ya LLM kwa serikali, ikiwa ni pamoja na serikali ya Kijapani, katika sekta kama vile michezo ya kubahatisha, utalii, na rejareja, akiangazia uwezo wa AI kushughulikia uhaba wa wafanyakazi na watu wanaozeeka.
Wasiwasi wa Uadilifu wa Data
Kuo anaungana na OpenAI na Microsoft katika kupendekeza kwamba DeepSeek huenda ilipata data kupitia uchujaji wa muundo. Mchakato huu unahusisha kufunza miundo midogo ya lugha kuiga matokeo ya miundo mikubwa. OpenAI na Microsoft zinadai kwamba DeepSeek ilitumia kiolesura cha programu ya maombi ya OpenAI ili kuwezesha maendeleo yake.
Kuo anadai kuwa DeepSeek ilipata data kutoka OpenAI na kwamba kuna kutoelewana kuhusu madai ya kampuni kuhusu ufanisi. Anaeleza kuwa DeepSeek-R1, ikiwa na vigezo vyake bilioni 670, ni kubwa zaidi kuliko Llama 3.1 405B ya Meta AI. Vigezo ni maadili ya nambari ya ndani ambayo muundo hujifunza wakati wa mafunzo ili kufanya ubashiri. Kuo pia anapendekeza kwamba miundo ya DeepSeek huenda ilichujwa kutoka Llama 3.1.
Zaidi ya pingamizi hizi, wasiwasi pia umeibuka kuhusu uwezo wa DeepSeek-R1. Wataalamu wanapendekeza kwamba, kama watangulizi wake, R1 hutumia vyema kazi maalum, mahususi kwa kazi lakini inaenda nyuma ya matoleo ya GPT-4o katika utendaji wa madhumuni ya jumla.
Kikomo kikubwa cha miundo ya DeepSeek ni kizuizi cha ufikiaji wa bure wa habari. Watumiaji waligundua kuwa maswali kuhusu mada nyeti za kisiasa yalikutana na majibu ya kukwepa. Kuhusu mada kama vile hadhi ya wachache wa Uyghur wa Xinjiang na Taiwan, majibu ya DeepSeek yanaakisi misimamo rasmi ya Chama cha Kikomunisti cha China. Utafiti unapendekeza kwamba sehemu kubwa ya matokeo ya DeepSeek yamecungwa ili kukandamiza habari zinazohusiana na demokrasia, haki za binadamu, na madai ya uhuru yenye utata ya China.
Mbadala wa Taiwan: TAIDE na Zaidi
Kwa kujibu, LLM zilizotengenezwa na Taiwan, kama vile TAME, zimejitokeza kama mbadala kwa DeepSeek ndani ya Sinosphere. Injini ya Mazungumzo ya AI Inayoaminika (TAIDE), iliyozinduliwa mnamo Juni 2023 na Taasisi ya Kitaifa ya Utafiti Uliotumika, inalenga kuendeleza muundo unaoendana na kanuni za kijamii, kitamaduni, na lugha za Taiwan.
Ingawa kazi kwenye TAIDE inaonekana kusimama, ilitumika kama alama muhimu ya Mradi wa TAME. TAME, iliyoandaliwa na Maabara ya Akili ya Mashine na Uelewa (MiuLab) katika Chuo Kikuu cha Kitaifa cha Taiwan, na ufadhili kutoka kwa mashirika mbalimbali, ilifunzwa kwenye tokeni bilioni 500. Ilizidi washindani, ikiwa ni pamoja na GPT-4o, katika tathmini 39, ikipata alama za juu kwenye mitihani ya kuingia chuo kikuu, baa, na dawa za jadi za Kichina.
Moja ya malengo ya TAME ni kukuza utamaduni wa ndani. Kufungua uwezo wa lugha za ndani ni hatua muhimu. Kuo anataja uendelezaji wa LLM ya sauti ya Taiwan kulingana na Whisper, ambayo imepata matokeo mazuri katika kuelewa lugha ya mdomo ya Taiwan. Juhudi zinafanyika kuendeleza utambuzi wa lugha ya Hakka.
Juhudi hizi zimepokelewa vyema na taasisi katika mikoa ambako lugha hizi zimeenea. Pia kuna juhudi za kufunza muundo katika utambuzi wa lugha ya kiasili, lakini data ndogo inasalia kuwa kikwazo. Kufunza AI kujifunza lugha mpya kunahitaji kiasi kikubwa cha rekodi za sauti zilizounganishwa na maandishi.
Kupata data ya kihistoria katika kumbukumbu za serikali kunatoa fursa nyingine. Hata hivyo, data fulani inalindwa na hakimiliki. Kuibuka kwa akili ya jumla ya bandia kunatoa uwezekano wa kusaidia katika kufufua lugha zilizo hatarini na zilizokufa.
Utafutaji wa Uhuru wa AI
Muunganiko wa lugha na utamaduni unasisitiza umuhimu wa uhuru wa AI kama njia ya kuimarisha utambulisho wa Taiwan, kuwasilisha simulizi ya Taiwan, na kulinda mazingira yake ya habari.
Julian Chu, mshauri wa sekta na mkurugenzi katika Taasisi ya Ushauri na Akili ya Soko (MIC), anasisitiza uwezekano wa upendeleo katika miundo ya LLM na data ya mafunzo. Anaeleza kuwa hata wakati wa kutumia herufi za jadi, matokeo ya LLM yanaweza kuakisi mtindo wa Jamhuri ya Watu wa China na kushindwa kunasa utamaduni wa Taiwan. Lengo ni kwa kampuni za Taiwan kutumia lugha au data ya Taiwan kufunza LLM na kujenga uhuru wa AI.
Chu anataja Muundo wa Msingi wa Formosa (FFM-Llama2) kama LLM nyingine ya kuahidi ya Taiwan. Iliyotolewa mnamo Septemba 2023 na Huduma ya Mtandao ya Taiwan, ililenga kuleta demokrasia ya AI. Foxconn pia ilizindua LLM yake, FoxBrain, mnamo Machi. Hata hivyo, wachangiaji wengine wanasalia na wasiwasi juu ya ubia wa mashirika makubwa katika LLM.
Lin Yen-ting, mwanachama wa timu ya MiuLab iliyoendeleza TAME, anasisitiza haja ya kushughulikia pengo katika mazingira ya habari kuhusu Taiwan. Anaeleza kuwa DeepSeek-R1 na LLM nyingine za Kichina zinatoa mtazamo potofu wa Taiwan. Miundo iliyoendelezwa na Marekani pia wakati mwingine inaweza kuwakilisha vibaya Taiwan. Miundo ya chanzo huria inaweza isipe kipaumbele Taiwan, na data ya mafunzo inatawaliwa na China.
Kwa hiyo, ni muhimu kuingiza kwa kuchagua maudhui ya Taiwan na kuifunza upya katika muundo. Mbinu hii makini inahakikisha kwamba mazingira ya kipekee ya kitamaduni na lugha ya Taiwan yanawakilishwa kwa usahihi katika ulimwengu wa kidijitali, kukuza hisia ya utambulisho wa kitaifa na kuhifadhi urithi wake tofauti katika kukabiliana na maendeleo ya kimataifa ya AI. Kujitolea huku kwa kuhifadhi utambulisho wa Taiwan kunahakikisha kwamba utamaduni na maadili ya kipekee ya taifa la kisiwa hicho hayafunikwi na simulizi kuu.
Changamoto za asili katika jitihada hii ni kubwa. Kujenga muundo wa AI unaowakilisha kweli kunahitaji uwekezaji mkubwa wa rasilimali, ikiwa ni pamoja na ufikiaji wa seti kubwa za data za maudhui yaliyoandaliwa na utaalam katika usindikaji wa lugha asilia. Zaidi ya hayo, haja inayoendelea ya kukabiliana na upotoshaji wa habari na habari iliyopendelea inahitaji mchakato unaoendelea wa uboreshaji na urekebishaji.
Licha ya changamoto hizi, kujitolea kwa Taiwan kwa uhuru wa AI kunasalia kuwa thabiti. Uendelezaji wa TAME na LLM nyingine zilizolengwa unawakilisha hatua muhimu kuelekea kuhakikisha kwamba mustakabali wa akili bandia unaakisi utambulisho wa kipekee wa kitamaduni wa kisiwa hicho, maadili ya kidemokrasia, na kujitolea bila kuyumbayumba kwa kuhifadhi nafasi yake tofauti ulimwenguni. Kwa kuipa kipaumbele uhuru wa AI, Taiwan haihifadhi tu urithi wake wa kitamaduni bali pia inajiweka kama mhusika mkuu katika mandhari ya kimataifa ya AI, ikionyesha kwamba maendeleo ya kiteknolojia yanaweza kuunganishwa na kuhifadhi utambulisho wa kitamaduni na kanuni za kidemokrasia.
Kuendeleza Safari
Safari kuelekea uhuru kamili wa AI inaendelea. Utafiti zaidi, uendelezaji, na ushirikiano ni muhimu ili kushinda changamoto na kuhakikisha mafanikio ya muda mrefu ya mipango hii. Kwa kuendelea kuipa kipaumbele uhuru wa AI, Taiwan inaweza kuunda mandhari ya kidijitali ambayo inaakisi kweli utambulisho wake wa kipekee wa kitamaduni na maadili ya kidemokrasia, na kuweka mfano kwa mataifa mengine yanayojitahidi kudumisha nafasi yao tofauti katika ulimwengu unaozidi kuunganishwa.