Uchambuzi Linganishi: DeepSeek dhidi ya Gemini 2.5

Ulimwengu wa akili bandia (AI) unabadilika kwa kasi ya ajabu, huku modeli na uwezo mpya vikijitokeza kila mara. Miongoni mwa vigogo wa sekta hiyo, Google hivi karibuni ilileta msisimko kwa kutoa modeli yake ya kisasa ya Gemini 2.5 bure kwa umma, mabadiliko makubwa kutoka upatikanaji wake wa awali kupitia usajili wa kulipia pekee. Hatua hii iliweka Gemini 2.5, iliyosifiwa kwa hoja zake zilizoimarishwa, uwezo wa kuandika msimbo, na utendaji kazi wa aina nyingi, kama mshindani wa moja kwa moja katika nafasi ya AI inayopatikana kwa urahisi. Alama za Google zenyewe zilipendekeza utendaji wa kuvutia, haswa katika tathmini ngumu zenye msingi wa maarifa, na kuiweka kama zana yenye nguvu.

Hata hivyo, katika uwanja wenye mabadiliko wa ulinganisho wa AI, matarajio si mara zote huendana na matokeo. Mfululizo wa awali wa majaribio ulikuwa umemtawaza DeepSeek, jina lisilojulikana sana kimataifa, kama mwigizaji mwenye uwezo wa ajabu katika kazi mbalimbali. Swali la asili liliibuka: je, toleo la juu zaidi la bure la Google, Gemini 2.5, lingewezaje kushindana na bingwa huyu asiyetarajiwa lilipowekwa chini ya seti sawa ya maagizo magumu? Uchambuzi huu unachunguza ulinganisho wa ana kwa ana katika changamoto tisa tofauti, zilizoundwa kuchunguza kina cha uwezo wa kila AI katika ubunifu, hoja, uelewa wa kiufundi, na zaidi, ukitoa maelezo ya kina ya nguvu na udhaifu wao husika.

Changamoto 1: Kuunda Hadithi ya Kufurahisha kwa Watoto

Jaribio la kwanza liliingia katika ulimwengu wa uandishi wa ubunifu, likilenga hasa uwezo wa kutumia sauti ya upole, ya kufurahisha inayofaa kwa hadithi ya kulala ya watoto. Agizo liliomba aya ya ufunguzi wa hadithi kuhusu roboti mwenye woga anayegundua ujasiri ndani ya msitu uliojaa wanyama wanaoimba. Kazi hii inatathmini si tu uzalishaji wa lugha, bali pia hisia za hila, uthabiti wa sauti, na ujenzi wa ulimwengu wa kufikirika ulioandaliwa kwa hadhira changa.

Gemini 2.5 ilitoa simulizi ambayo hakika ilikuwa na uwezo. Ilianzisha Bolt, roboti, na kwa ufanisi ikawasilisha wasiwasi wake. Ujumuishaji wa maelezo ya kimazingira kama ‘uyoga unaowaka’ na ‘vijito vinavyonong’ona’ ulionyesha uwezo wa kujenga ulimwengu, na kuongeza umbile kwenye tukio. Hata hivyo, nathari ilihisi kuwa ndefu kiasi na iliegemea zaidi kwenye maelezo badala ya kuvutia. Ingawa ilikuwa nzuri kiutendaji, aya ilikosa ubora fulani wa kishairi; mdundo ulihisi kuwa wa maelezo zaidi kuliko wa kimuziki, uwezekano wa kukosa mwanguko wa kutuliza unaofaa kwa hadithi ya kabla ya kulala. Ilianzisha mhusika na mazingira kwa uwazi, lakini utekelezaji ulihisi kuwa wa kiutaratibu zaidi kuliko wa kishairi.

DeepSeek, kinyume chake, mara moja ilimzamisha msomaji katika mazingira yaliyojaa hisia zaidi na yaliyoingizwa kimuziki. Maelezo yake ya msitu yalitumia sitiari na lugha iliyoibua sauti na mwanga kwa namna ya ndoto, ikiendana kikamilifu na sauti ya kufurahisha iliyoombwa. Nathari yenyewe ilionekana kuwa na mdundo wa upole, na kuifanya iweze kufaa zaidi kusomwa kwa sauti wakati wa kulala. Kulikuwa na mwangwi wa kihisia katika maelezo yake ya roboti mwenye woga ndani ya mazingira haya ya kuvutia ambayo yalihisi kuwa ya asili zaidi na ya kuvutia kwa mtoto. Chaguo za lugha zilichora tukio ambalo halikuelezewa tu bali lilihisiwa, likionyesha ufahamu imara wa umbile la angahewa na kihisia linalohitajika.

Uamuzi: Kwa amri yake bora ya lugha ya kishairi, uundaji wake wa angahewa la kufurahisha kweli kupitia maelezo ya hisia na sitiari za kimuziki, na mdundo wake unaofaa wakati wa kulala, DeepSeek iliibuka mshindi katika changamoto hii ya ubunifu. Haikusimulia tu mwanzo wa hadithi; iliunda mwaliko katika ulimwengu wa upole, wa kichawi.

Changamoto 2: Kutoa Mwongozo wa Vitendo kwa Wasiwasi wa Kawaida wa Utotoni

Kutoka kwa usemi wa ubunifu hadi utatuzi wa matatizo ya vitendo, agizo la pili lilishughulikia hali ya kawaida ya uzazi: kumsaidia mtoto wa miaka 10 kushinda woga wa kuzungumza mbele ya darasa lake. Ombi lilikuwa la mikakati mitatu inayoweza kutekelezeka ambayo mzazi angeweza kumfundisha mtoto wake ili kuongeza kujiamini. Changamoto hii inajaribu uwezo wa AI kutoa ushauri wa huruma, unaofaa umri, na wenye msaada wa kweli.

Gemini 2.5 ilitoa mikakati ambayo ilikuwa ya msingi na iliyowasilishwa kimantiki. Ushauri huo - pengine ukihusisha mazoezi, kujisemea maneno chanya, na labda kuzingatia ujumbe - uliwakilisha mbinu za kawaida, zenye ufanisi za kudhibiti wasiwasi wa kuzungumza mbele ya umma. Mzazi anayepokea ushauri huu angeuona kuwa wa busara na sahihi. Hata hivyo, sauti na uwasilishaji ulihisi kuwa umeelekezwa kwa watu wazima. Lugha iliyotumika ilikosa vipengele vya kufikirika au vya kuchekesha ambavyo mara nyingi huwavutia zaidi watoto wa miaka 10. Mikakati hiyo, ingawa ilikuwa halali, iliwasilishwa zaidi kama maagizo kuliko shughuli za kuvutia, ikiwezekana kukosa fursa ya kufanya mchakato usiwe wa kutisha kwa mtoto. Mkazo ulikuwa kwenye vipengele vya utambuzi badala ya kujumuisha mbinu za kugusa au zenye msingi wa ucheshi ambazo zinaweza kuwa na ufanisi hasa katika kupunguza hofu za utotoni.

DeepSeek ilichukua mbinu tofauti kabisa. Ingawa mikakati yake iliyopendekezwa pia ilikuwa ya vitendo, iliundwa kwa namna iliyolingana zaidi na mtazamo wa mtoto. Haikuorodhesha tu mbinu; ilipendekeza jinsi ya kuzifanyia mazoezi kwa njia ambazo zingeweza kuonekana kama za kufurahisha au za mwingiliano, ikibadilisha kazi inayoweza kuwa ya mkazo kuwa kitu kinachoweza kufikiwa zaidi. Kwa mfano, inaweza kupendekeza kufanya mazoezi mbele ya wanyama wa kuchezea au kutumia sauti za kuchekesha. Muhimu zaidi, DeepSeek ilionekana kulenga misingi maalum ya kihisia ya hofu ya mtoto ya kuzungumza mbele ya umma, ikitambua woga na kutoa mbinu za kukabiliana (kama vile kupumua kwa kina kuwasilishwa kama mchezo) pamoja na mikakati ya mazoezi. Ilijumuisha vidokezo vya ziada vilivyolenga mbinu za kutuliza za haraka, ikionyesha uelewa kamili zaidi wa kudhibiti wasiwasi kwa mtu mdogo. Lugha ilikuwa ya kutia moyo na iliyoundwa kikamilifu kwa mzazi kumweleza mtoto wake wa miaka 10.

Uamuzi: DeepSeek ilipata ushindi katika raundi hii kutokana na mwongozo wake wa ubunifu zaidi, wa huruma, na unaofaa umri. Ilionyesha uwezo bora wa kurekebisha ushauri wa vitendo kulingana na mahitaji maalum ya kihisia na utambuzi ya mtoto, ikitoa mikakati ambayo haikuwa tu yenye ufanisi bali pia iliwasilishwa kwa njia ya kuvutia na ya kutia moyo.

Changamoto 3: Kuchambua Mitindo ya Uongozi – Mandela dhidi ya Jobs

Changamoto ya tatu iligeukia hoja za uchambuzi, ikiuliza ulinganisho wa mitindo ya uongozi ya Nelson Mandela na Steve Jobs. Agizo lilihitaji kutambua kilichomfanya kila kiongozi kuwa na ufanisi na kuelezea tofauti zao kuu. Kazi hii inatathmini uwezo wa AI kuunganisha taarifa kuhusu watu tata, kufanya ulinganisho wa kina, kutambua sifa kuu, na kueleza uchambuzi wake kwa uwazi.

Gemini 2.5 ilitoa jibu lililokuwa limepangwa vizuri, la kina, na sahihi kwa ukweli, likifanana na ingizo lililoandikwa vizuri katika kitabu cha biashara au ripoti kamili ya shule. Ilitambua kwa usahihi vipengele muhimu vya mtindo wa kila kiongozi, pengine ikirejelea dhana kama vile uongozi wa utumishi wa Mandela na mbinu ya maono, wakati mwingine ya kudai, ya Jobs. Matumizi ya vichwa vya habari wazi kama ‘Ufanisi’ na ‘Tofauti Kuu’ yalisaidia mpangilio na usomaji. Hata hivyo, uchambuzi huo, ingawa ulikuwa sahihi, ulihisi kuwa wa kitaalamu kiasi na ulikosa safu ya kina ya tafsiri. Ilifafanua na kuelezea sifa za uongozi lakini ilitoa ufahamu mdogo juu ya athari au mwangwi wa mitindo hii zaidi ya kiwango cha juu juu. Sauti ilikuwa ya kuelimisha lakini ilikosa nguvu ya ushawishi au kina cha kihisia ambacho ulinganisho wenye ufahamu zaidi ungeweza kufikia.

DeepSeek ilikaribia ulinganisho huo kwa kiwango kikubwa cha ustadi wa uchambuzi na ustadi wa simulizi. Ilipanga uchambuzi wake kando ya vipimo maalum, vyenye ufahamu - kama vile maono, mwitikio kwa shida, mtindo wa mawasiliano, michakato ya kufanya maamuzi, na urithi - ikiruhusu ulinganisho wa kina zaidi na wa moja kwa moja katika nyanja muhimu za uongozi. Mfumo huu ulitoa uwazi na kina kwa wakati mmoja. Muhimu zaidi, DeepSeek iliweza kusawazisha pongezi kwa watu wote wawili na mtazamo wa kukosoa, ikiepuka sifa rahisi. Lugha iliyotumika ilikuwa ya kuamsha hisia zaidi na ya kutafsiri, ikilenga si tu kuelezea bali kuangazia kiini cha mbinu na athari zao tofauti. Iliwasilisha si tu ukweli bali pia hisia ya mchezo wa kibinadamu na umuhimu wa kihistoria unaohusika, na kufanya ulinganisho kuwa wa kukumbukwa zaidi na wa kuvutia.

Uamuzi: Kwa muundo wake bora wa uchambuzi, ufahamu wa kina wa tafsiri, mtindo wa simulizi unaovutia zaidi, na uwezo wa kuwasilisha mwangwi wa kihisia na kihistoria pamoja na ulinganisho wa ukweli, DeepSeek ilishinda changamoto hii. Ilivuka maelezo tu kutoa uelewa wa kina zaidi wa dhana mbili tofauti za uongozi.

Changamoto 4: Kuelezea Teknolojia Ngumu – Kesi ya Blockchain

Kazi ya nne ilijaribu uwezo wa kufafanua somo gumu la kiufundi: blockchain. Agizo lilihitaji maelezo rahisi ya jinsi blockchain inavyofanya kazi, ikifuatiwa na maelezo ya matumizi yake yanayowezekana katika ufuatiliaji wa mnyororo wa ugavi. Hii inatathmini uwazi, matumizi bora ya mlinganisho, na uwezo wa kuunganisha dhana dhahania na matumizi halisi, ya ulimwengu halisi.

Gemini 2.5 ilitumia sitiari ya daftari la kidijitali kuelezea dhana ya blockchain, ambayo inaweza kuwa mahali pazuri pa kuanzia. Maelezo yake yalikuwa sahihi na yalishughulikia vipengele muhimu vya leja zilizosambazwa na uunganishaji wa kriptografia. Hata hivyo, maelezo yalielekea kwenye sentensi ndefu na sauti rasmi zaidi, kama ya kitabu cha kiada, ambayo bado inaweza kuhisi kuwa nzito au ngumu kwa anayeanza kweli. Ilipojadili matumizi ya mnyororo wa ugavi, ilitoa mifano halali kama kufuatilia kahawa au dawa, lakini maelezo yalibaki katika kiwango cha juu na cha dhana, labda bila kuwasilisha kikamilifu faida zinazoonekana au kipengele cha ‘jinsi ya kufanya’ kwa njia dhahiri. Maelezo yalikuwa sahihi lakini hayakuvutia kama yalivyoweza kuwa.

DeepSeek, kinyume chake, ilishughulikia maelezo hayo kwa nguvu zaidi na ustadi wa ufundishaji. Ilitumia sitiari wazi, zenye nguvu ambazo zilionekana kuwa za asili zaidi na zinazoweza kufikiwa mara moja na hadhira isiyo ya kiufundi, ikikata haraka istilahi. Maelezo ya blockchain yenyewe yaligawanywa katika hatua zinazoweza kumeng’enywa, ikidumisha usahihi bila kurahisisha kupita kiasi hadi kupoteza maana. Muhimu zaidi, ilipoelezea matumizi ya mnyororo wa ugavi, DeepSeek ilitoa mifano ya kuvutia, halisi iliyoleta dhana hiyo uhai. Ilichora picha wazi zaidi ya jinsi kufuatilia vitu kwenye blockchain kunavyotoa faida kama uwazi na usalama, na kufanya teknolojia ihisi kuwa muhimu na yenye manufaa badala ya kuwa ngumu tu. Sauti ya jumla ilikuwa na nguvu zaidi na ya kielelezo.

Uamuzi: DeepSeek ilidai ushindi katika raundi hii kwa kutoa maelezo ya kuvutia zaidi, ya kielelezo, na yanayofaa kwa anayeanza. Matumizi yake bora ya sitiari na usimulizi halisi yalifanya mada ngumu ya blockchain iweze kufikiwa zaidi na matumizi yake ya vitendo yawe rahisi kueleweka.

Changamoto 5: Kupitia Ugumu wa Tafsiri ya Ushairi

Changamoto hii iliingia katika ugumu wa lugha na utamaduni, ikiuliza tafsiri ya mstari wa Emily Dickinson, ‘Hope is the thing with feathers that perches in the soul,’ katika Kifaransa, Kijapani, na Kiarabu. Muhimu zaidi, ilihitaji pia maelezo ya changamoto za kishairi zilizokutana nazo katika kila tafsiri. Hii inajaribu si tu uwezo wa kutafsiri lugha nyingi bali pia usikivu wa kifasihi na uelewa wa tamaduni mbalimbali.

Gemini 2.5 ilitoa tafsiri sahihi za kirai katika lugha zilizoombwa. Maelezo yake yaliyofuata yalilenga sana miundo ya kisarufi, mabadiliko yanayowezekana katika maana halisi, na vipengele kama matamshi au uchaguzi wa maneno kutoka kwa mtazamo wa isimu. Ilitoa uchanganuzi wa kina ambao ungekuwa muhimu kwa mtu anayejifunza lugha zenyewe. Hata hivyo, jibu lilihisi zaidi kama zoezi la maagizo ya lugha ya kiufundi kuliko uchunguzi wa sanaa ya kishairi. Ilishughulikia mechanics ya tafsiri kwa ufanisi lakini ilitoa msisitizo mdogo kwa upotevu au mabadiliko ya hisia ya sitiari ya asili, mwangwi wa kitamaduni, au ubora wa kipekee wa kishairi katika miktadha tofauti ya lugha na kitamaduni. Lengo lilikuwa la kimakanika zaidi kuliko la kishairi.

DeepSeek pia ilitoa tafsiri sahihi lakini ilifaulu katika kushughulikia sehemu ya pili, yenye ugumu zaidi ya agizo. Maelezo yake yaliingia kwa kina zaidi katika changamoto za asili za kutafsiri ushairi, ikijadili jinsi maana maalum za ‘feathers,’ ‘perches,’ na ‘soul’ huenda zisipate vilinganishi vya moja kwa moja au huenda zikabeba uzito tofauti wa kitamaduni katika Kifaransa, Kijapani, na Kiarabu. Ilichunguza upotevu unaowezekana wa taswira maalum ya sitiari ya Dickinson na ugumu wa kuiga sauti na mdundo maridadi wa asili. Uchambuzi wa DeepSeek uligusia hoja za kifalsafa na kitamaduni zinazohusiana na dhana ya matumaini katika kila muktadha, ukitoa maoni tajiri zaidi, yenye ufahamu zaidi juu ya ugumu wa kishairi, si tu wa kiisimu. Ilihitimisha kwa muhtasari wa kufikirika ambao ulisisitiza ugumu unaohusika.

Uamuzi: Kutokana na ufahamu wake wa kina wa kifasihi, usikivu mkubwa wa kitamaduni katika kuelezea changamoto za tafsiri, na lengo lililoendana vizuri zaidi na ombi la agizo la kuchunguza ‘changamoto za kishairi,’ DeepSeek ilishinda raundi hii. Ilionyesha uthamini bora wa sanaa na ugumu unaohusika katika kutafsiri lugha ya sitiari katika tamaduni mbalimbali.

Changamoto 6: Kuzalisha na Kuelezea Msimbo wa Python kwa Nambari za Primi

Changamoto ya sita iliingia katika uwanja wa programu, ikihitaji uzalishaji wa kazi ya Python kutambua nambari za primi ndani ya orodha. Muhimu vile vile ilikuwa ombi la maelezo rahisi ya jinsi kazi hiyo ilivyofanya kazi. Hii inajaribu ustadi wa kuandika msimbo, kufuata mazoea bora, na uwezo wa kuelezea mantiki ya kiufundi kwa uwazi kwa mtu asiye mprogramu.

DeepSeek ilizalisha hati ya Python inayofanya kazi ambayo ilitambua kwa usahihi nambari za primi. Maelezo yake yaliyofuata yalipangwa na vichwa vya sehemu wazi na maelezo, ikianzisha dhana kimantiki. Ilifanya hoja ya kuelezea kwa nini nambari chini ya 2 zinarukwa, ufafanuzi muhimu kwa wanaoanza. Msimbo wenyewe ulikuwa wazi, na maelezo ya hatua kwa hatua yalilenga ufikiaji, ikivunja mantiki ya kuangalia vigawanyo. Lilikuwa jibu thabiti na lenye uwezo linalotimiza vipengele vyote vya agizo.

Gemini 2.5, hata hivyo, ilijitofautisha katika uwazi na ubora wa ufundishaji wa maelezo yake. Ingawa pia ilitoa msimbo sahihi na wenye ufanisi wa Python, maelezo yake yalichukua sauti ya uvumilivu wa kipekee, karibu kama ya mafunzo. Ilipitia mantiki kwa uangalifu, ikifanya hata dhana zinazoweza kutatanisha, kama vile uboreshaji wa kuangalia vigawanyo hadi mzizi wa mraba wa nambari tu, kuhisi kuwa ya asili na inayoeleweka kwa mtu mpya katika programu au nadharia ya nambari. Muundo ulikuwa safi, na lugha ilikuwa inafaa hasa kwa anayeanza anayetafuta kuelewa kweli kwa nini msimbo ulifanya kazi, si tu kwamba ulifanya kazi. Asili ya kina lakini inayoweza kufikiwa ya maelezo iliipa faida.

Uamuzi: Katika mabadiliko ya mwenendo uliopo, Gemini 2.5 ilipata ushindi katika changamoto hii. Ingawa AI zote mbili zilizalisha msimbo sahihi na kutoa maelezo, maelezo ya Gemini yalichukuliwa kuwa bora kwa uwazi wake wa kipekee, urafiki kwa anayeanza, na sauti ya uvumilivu, ya ufundishaji iliyofanya mantiki ngumu iweze kufikiwa kwa kushangaza.

Changamoto 7: Kuchunguza Maeneo ya Kimaadili Yasiyo Wazi – Uhalalishaji wa Uongo

Tukirejea kwenye hoja dhahania zaidi, agizo la saba lilishughulikia swali la maadili: ‘Je, ni sahihi kimaadili kusema uwongo?’ Iliuliza mfano mmoja ambapo kusema uwongo kunaweza kuhalalishwa kimaadili, pamoja na hoja nyuma ya uhalalishaji huo. Hii inachunguza uwezo wa AI kwa hoja za kimaadili, hoja zenye ugumu, na matumizi ya mifano ya kuvutia kuunga mkono msimamo wa kimaadili.

Gemini 2.5 ilishughulikia swali hilo kwa kurejelea dhana muhimu za kimaadili, ikiwezekana kutaja mifumo kama vile consequentialism (kuhukumu matendo kwa matokeo yake) dhidi ya maadili ya deontological (kufuata majukumu au sheria za kimaadili). Mbinu yake iliegemea upande wa kinadharia, ikitoa mjadala mzuri, ingawa wa kitaaluma kiasi, wa kwa nini kusema uwongo kwa ujumla ni makosa lakini kunaweza kuruhusiwa katika hali fulani. Hata hivyo, mfano ilioutoa kuonyesha uwongo unaoweza kuhalalishwa ulielezewa kama wa kubuni na wenye athari ya wastani tu. Ingawa ulikuwa na mantiki, ulikosa uzito wa kihisia au nguvu ya ushawishi ambayo mfano wenye nguvu zaidi ungeweza kutoa.

DeepSeek, kinyume kabisa, ilitumia mtanziko wa kimaadili wa ulimwengu halisi wa kawaida na wenye nguvu: hali ya kusema uwongo kwa mamlaka ya Nazi wakati wa Vita vya Pili vya Dunia ili kuwalinda wakimbizi wa Kiyahudi waliofichwa nyumbani kwa mtu. Mfano huu unatambulika mara moja, umejaa hisia, na unawasilisha mgongano wazi kati ya wajibu wa kusema ukweli na wajibu mkuu wa kimaadili wa kuokoa maisha ya wasio na hatia. Matumizi ya muktadha huu maalum, wa kihistoria wenye hatari kubwa yaliimarisha kwa kiasi kikubwa hoja ya uwongo unaoweza kuhalalishwa. Ilikuwa na mwangwi katika kiwango cha kimaadili na kihisia, na kufanya uhalalishaji kuwa wa kushawishi zaidi na wa kukumbukwa. DeepSeek iliunganisha kwa ufanisi kanuni dhahania ya kimaadili na hali halisi ambapo hesabu ya kimaadili inapendelea sana udanganyifu kwa manufaa makubwa zaidi.

Uamuzi: DeepSeek ilishinda raundi hii kwa kushawishi. Matumizi yake ya mfano wenye nguvu, uliowekwa kihistoria, na wenye mwangwi wa kihisia yalifanya hoja yake iwe ya kushawishi zaidi na yenye mvuto kimaadili kuliko mbinu ya kinadharia zaidi na yenye athari ndogo ya Gemini. Ilionyesha amri imara zaidi ya kutumia matukio ya kielelezo kuchunguza hoja ngumu za kimaadili.

Changamoto 8: Kuwazia Jiji Kuu la Baadaye – Jaribio la Nguvu ya Maelezo

Changamoto ya kabla ya mwisho iligusa mawazo ya kuona na uandishi wa maelezo. Agizo liliuliza maelezo ya jiji la baadaye miaka 150 kutoka sasa, likilenga usafiri, mawasiliano, na ujumuishaji wa asili, yote yakiwasilishwa kwa kutumia lugha dhahiri. Hii inajaribu ubunifu, mshikamano katika ujenzi wa ulimwengu, na uwezo wa kuchora picha ya kuvutia kwa maneno.

Gemini 2.5 ilizalisha jibu la kina, ikigusia vipengele vilivyoombwa vya usafiri, mawasiliano, na asili katika jiji la baadaye. Ilijumuisha dhana mbalimbali za baadaye. Hata hivyo, maelezo ya jumla yalihisi kuwa ya kawaida kiasi, yakitegemea dhana za kawaida za sayansi ya kubuni bila lazima kuunda maono ya kipekee au ya kukumbukwa kweli. Muundo ulikuwa umepangwa kidogo ikilinganishwa na mshindani wake, na lugha wakati mwingine ilielekea kwenye misemo mizito au iliyopambwa kupita kiasi (‘overwrought’), ambayo inaweza kupunguza uwazi na ushiriki wa msomaji badala ya kuimarisha taswira. Ingawa vipengele vilikuwepo, muundo wa jumla ulihisi kuwa hauna mshikamano na haukuwa dhahiri sana kionyesho.

DeepSeek, kwa upande mwingine, iliunda maono yaliyohisi kuwa ya sinema zaidi na yenye hisia nyingi. Ilitumia taswira halisi, za asili kuonyesha usafiri wa baadaye (labda maganda ya sumaku kimya, magari ya angani ya kibinafsi), mawasiliano (violesura vya holografia vilivyounganishwa bila mshono), na asili (misitu ya wima, mbuga zenye mwanga wa kibayolojia). Maelezo yalielezewa kama ya kuchekesha lakini yenye msingi, yakipendekeza mustakabali uliokuwa umeendelea kiteknolojia lakini pia ulizingatiwa kwa uzuri na labda wenye mwangwi wa kihisia. Muundo ulikuwa wazi, ukimwongoza msomaji kupitia nyanja tofauti za jiji kwa njia iliyopangwa. Lugha ilipata usawa bora kati ya maelezo ya kufikirika na uwazi, ikiunda mustakabali uliohisi kuwa wa kushangaza na wa kuaminika kiasi au angalau uliowaziwa kwa uwazi.

Uamuzi: DeepSeek iliibuka mshindi katika changamoto hii kwa kutoa maono yaliyosawazishwa zaidi, yaliyoandikwa vizuri, yaliyopangwa wazi, na yenye maono tofauti ya jiji la baadaye. Uwezo wake wa kuunda taswira za asili, zenye hisia nyingi huku ikidumisha mshikamano uliipa jibu lake nguvu bora ya maelezo na mwangwi wa kihisia.

Changamoto 9: Ustadi wa Muhtasari na Marekebisho ya Sauti

Changamoto ya mwisho ilijaribu ujuzi mbili tofauti lakini zinazohusiana: kufupisha maandishi muhimu ya kihistoria (Hotuba ya Gettysburg) kwa ufupi (katika sentensi tatu) na kisha kuandika upya muhtasari huo kwa sauti tofauti kabisa, iliyobainishwa (ile ya maharamia). Hii inatathmini ufahamu, uchujaji wa mawazo makuu, na unyumbufu wa ubunifu katika kupitisha sauti tofauti.

Gemini 2.5 ilifanikiwa kutekeleza sehemu zote mbili za kazi. Ilitoa muhtasari wa Hotuba ya Gettysburg ambao ulinasa kwa usahihi hoja kuu kuhusu usawa, madhumuni ya Vita vya Wenyewe kwa Wenyewe (Civil War), na wito wa kujitolea kwa demokrasia. Uandishi upya wa maharamia pia ulifuata maagizo, ukipitisha msamiati na misemo kama ya maharamia (‘Ahoy,’ ‘mateys,’ n.k.) kuwasilisha yaliyomo kwenye muhtasari. Jibu lilikuwa na uwezo na lilitimiza mahitaji ya agizo kihalisi. Hata hivyo, muhtasari huo, ingawa ulikuwa sahihi, labda ulikosa uzito fulani wa usemi au kina cha kihisia kinachonasa athari kubwa ya Hotuba hiyo. Toleo la maharamia lilihisi kuwa la kawaida kiasi, likigonga dhana za maharamia bila lazima kufikia ucheshi au tabia halisi.

DeepSeek pia ilitoa muhtasari sahihi wa sentensi tatu wa Hotuba ya Gettysburg, lakini muhtasari wake ulibainika kuwa wenye ufahamu hasa, ukinasa si tu maudhui ya ukweli bali pia sauti ya kihisia na umuhimu wa kihistoria wa maneno ya Lincoln kwa ufanisi zaidi. Ambapo DeepSeek iling’aa kweli, hata hivyo, ilikuwa katika uandishi upya wa mtindo wa maharamia. Haikunyunyiza tu istilahi za maharamia kwenye muhtasari; ilionekana kukumbatia kikamilifu persona hiyo, ikitoa toleo lililoelezewa kuwa la kuchekesha kweli, la ujasiri, na la kufikirika. Lugha ilihisi kuwa ya kimaharamia zaidi kiasili, ikiwa imejaa nguvu ya kucheza na tabia, na kufanya mabadiliko ya sauti kuwa ya kushawishi zaidi