AI: Ubunifu wa Google, xAI, na Mistral

Maendeleo ya Google katika AI ya Huduma za Afya

Google hivi karibuni ilizindua mfululizo wa masasisho ya Health AI katika hafla yake ya kila mwaka ya ‘The Check Up’, ikionyesha dhamira ya kampuni ya kutumia AI kwa matumizi mbalimbali ya huduma za afya. Masasisho haya yanaanzia kuboresha maswali yanayohusiana na afya katika Google Search hadi kuanzisha modeli mpya za AI ‘wazi’ zilizoundwa ili kuongeza ufanisi wa ugunduzi wa dawa unaoendeshwa na AI.

Google inatumia AI na mifumo ya hali ya juu ya ubora na upangaji ili kupanua wigo wa majibu ya ‘knowledge panel’ kwa mada mbalimbali zinazohusiana na afya. Upanuzi huu unajumuisha kuongeza usaidizi kwa maswali ya huduma za afya katika lugha nyingi, kama vile Kihispania, Kireno, na Kijapani, awali kwenye majukwaa ya simu. Ingawa Search tayari ilitoa majibu ya knowledge panel kwa masuala ya kawaida ya kiafya kama vile mafua au homa ya kawaida, sasisho hili linapanua kwa kiasi kikubwa safu ya mada ambazo paneli hizi zinashughulikia.

Zaidi ya hayo, Google inaleta kipengele kipya katika Search kinachoitwa ‘What People Suggest’. Kipengele hiki kimeundwa ili kuwasilisha watumiaji habari inayotokana na watu ambao wameshiriki uzoefu sawa wa matibabu. Nyongeza hii inatoa njia ya kipekee kwa watumiaji kupata maarifa. Inaruhusu watumiaji kugundua kwa haraka mitazamo halisi kutoka kwa wengine walio na hali sawa, kamili na viungo vya uchunguzi zaidi. ‘What People Suggest’ inapatikana kwa sasa kwenye vifaa vya mkononi nchini Marekani.

Kurahisisha Rekodi za Matibabu na API Mpya

Google pia imezindua kimataifa application programming interfaces (APIs) mpya za rekodi za matibabu kwa jukwaa lake la Health Connect, linalooana na vifaa vya Android. API hizi huwezesha programu kusoma na kuandika data ya rekodi za matibabu, ikijumuisha mizio, dawa, chanjo, na matokeo ya maabara, zote katika muundo sanifu wa FHIR. Maboresho haya yanaleta usaidizi wa Health Connect kwa zaidi ya aina 50 za data, zinazohusu shughuli, usingizi, lishe, ishara muhimu, na sasa rekodi za matibabu. Muunganisho huu huwezesha uhusiano usio na mshono kati ya data ya afya ya kila siku ya watumiaji na habari kutoka kwa watoa huduma wao wa afya.

Mwanasayansi-Mwenza wa AI: Mshirika wa Utafiti wa Mtandaoni

Ubunifu wa msingi kutoka Google ni ‘AI co-scientist,’ mfumo mpya unaoendeshwa na Gemini 2.0. Mfumo huu unalenga kuwa ‘mshirika wa kisayansi wa mtandaoni’ kwa watafiti na wanasayansi. Mwanasayansi-mwenza wa AI ameundwa kusaidia watafiti katika kupitia fasihi kubwa ya kisayansi, na hivyo kuwezesha uzalishaji wa nadharia mpya. Kwa kusaidia katika uchambuzi wa seti kubwa za data na karatasi ngumu za utafiti, mwanasayansi-mwenza wa AI analenga kuwawezesha wataalamu kugundua mawazo mapya na kuharakisha juhudi zao za utafiti. Google inashirikiana kikamilifu na taasisi kama vile Imperial College London, Houston Methodist, na Chuo Kikuu cha Stanford kuchunguza matumizi ya vitendo ya zana hii na inakusudia kuanzisha mpango wa majaribio kwa wateja wanaoaminika.

TxGemma: Kuharakisha Ugunduzi wa Dawa

Google pia ilianzisha TxGemma, mkusanyiko wa modeli wazi zenye msingi wa Gemma zinazolenga kuongeza ufanisi wa ugunduzi wa dawa unaoendeshwa na AI. TxGemma ina uwezo wa kuelewa maandishi ya kawaida na miundo ya vyombo mbalimbali vya matibabu, ikiwa ni pamoja na molekuli ndogo, kemikali, na protini. Uzinduzi wa TxGemma umepangwa kufanyika hivi karibuni.

Zana ya Capricorn AI: Kuendeleza Oncology ya Watoto

Kwa kushirikiana na Kituo cha Princess Maxima cha Oncology ya Watoto nchini Uholanzi, Google imekuwa ikitengeneza zana ya AI inayoitwa Capricorn. Zana hii inasisitiza kujitolea kwa Google kutumia AI katika nyanja maalum za matibabu, haswa katika oncology ya watoto.

Athari Kubwa ya AI kwenye Huduma za Afya

Google hapo awali imeangazia ushawishi chanya wa AI kwenye matokeo ya afya duniani. Kampuni hiyo imetengeneza modeli za AI kusaidia katika kugundua magonjwa kama vile saratani ya matiti, saratani ya mapafu, na ugonjwa wa kisukari wa retina. Mnamo Mei 2024, Google ilitangaza Med-Gemini, familia ya modeli za Gemini zilizoboreshwa kwa matumizi ya matibabu ya multimodal. Zaidi ya hayo, mnamo Juni 2024, Google ilianzisha Personal Health Large Language Model kwa vifaa vya rununu na vinavyoweza kuvaliwa. Toleo hili lililoboreshwa la Gemini limeundwa kutafsiri data ya sensorer na kutoa maarifa na mapendekezo ya kibinafsi kuhusu usingizi na mifumo ya mazoezi ya mtu binafsi.

Upataji wa Hotshot na xAI: Hatua katika Video ya AI ya Uzalishaji

Kampuni ya AI ya Elon Musk, xAI, imepata Hotshot, kampuni inayoanzisha zana za uzalishaji wa video zinazoendeshwa na AI. Upataji huu unaweka xAI kushindana na Sora ya OpenAI, jukwaa linaloongoza katika nafasi ya video ya AI ya uzalishaji. Hotshot ilitangaza kwenye tovuti yake kwamba ilianza kuondoa uundaji mpya wa video mnamo Machi 14, huku wateja waliopo wakiwa na hadi Machi 30 kupakua video zao walizounda.

Grok 3: Chatbot Kabambe ya AI ya xAI

Mnamo Februari 19, xAI ilizindua Grok 3, toleo la hivi punde la chatbot yake, ambayo Elon Musk alitangaza kama ‘AI yenye akili zaidi Duniani.’ Baadaye, kampuni hiyo ilitangaza kutolewa kwa beta ya modeli mbili za hoja, Grok 3 (Think) na Grok 3 Mini (Think). xAI ilisema kuwa Grok 3, iliyoandaliwa kwenye supercluster yao ya Colossus yenye nguvu mara kumi ya hesabu ya modeli za awali za hali ya juu, inaonyesha maboresho makubwa katika hoja, hisabati, usimbaji, maarifa ya ulimwengu, na kazi za kufuata maagizo.

Mistral Small 3.1 ya Mistral AI: Ndogo na Yenye Nguvu

Kampuni ya AI ya Ufaransa, Mistral AI, ilianzisha modeli mpya ya chanzo huria mnamo Machi 17, iliyoitwa Mistral Small 3.1. Kampuni hiyo inadai kuwa modeli hii inazidi modeli zinazofanana kama Gemma 3 ya Google na GPT-4o Mini ya OpenAI, na hivyo kuongeza ushindani katika soko linalotawaliwa kwa kiasi kikubwa na makampuni makubwa ya teknolojia ya Marekani.

Mistral Small 3.1 inachakata maandishi na picha zenye vigezo bilioni 24 - ukubwa mdogo sana ikilinganishwa na modeli zinazoongoza za umiliki - huku ikilingana au kuzidi utendaji wao. Mistral AI ilisisitiza kuwa Mistral Small 3.1 ni modeli ya kwanza ya chanzo huria ambayo sio tu inakidhi lakini inazidi utendaji wa modeli zinazoongoza ndogo za umiliki katika vipimo mbalimbali.

Ikijengwa juu ya Mistral Small 3, modeli hii mpya inajivunia utendaji ulioboreshwa wa maandishi, uelewa wa multimodal, na dirisha lililopanuliwa la muktadha la hadi tokeni 128,000. Mistral AI inadai modeli hiyo inachakata habari kwa kasi ya tokeni 150 kwa sekunde, na kuifanya iwe inafaa kwa matumizi yanayohitaji nyakati za majibu ya haraka.

Uwezo Mbalimbali na Upatikanaji wa Mistral Small 3.1

Mistral Small 3.1 imeundwa kufanya kazi kwenye vifaa vinavyopatikana kama vile RTX 4090 moja au Mac yenye 32GB RAM, na kuifanya iwe inafaa sana kwa matumizi ya kwenye kifaa. Modeli inaweza kuboreshwa kwa vikoa maalum, kuwezesha uundaji wa wataalam sahihi sana wa mada, muhimu sana katika nyanja kama vile ushauri wa kisheria, uchunguzi wa matibabu, na usaidizi wa kiufundi.

Modeli mpya imeundwa kwa wigo mpana wa matumizi ya biashara na watumiaji yanayohitaji uelewa wa multimodal. Kesi zinazowezekana za matumizi ni pamoja na uthibitishaji wa hati, uchunguzi, usindikaji wa picha kwenye kifaa, ukaguzi wa kuona kwa udhibiti wa ubora, utambuzi wa vitu katika mifumo ya usalama, usaidizi wa wateja unaotegemea picha, na usaidizi wa madhumuni ya jumla.

Mistral OCR: Uelewa wa Hati wa Hali ya Juu

Mapema mwezi Machi, Mistral AI ilitangaza Mistral OCR, ambayo kampuni hiyo inaitangaza kama ‘API bora zaidi ya uelewa wa hati Duniani.’ Mistral OCR ni API ya Optical Character Recognition (OCR) yenye uwezo wa kutoa maandishi, majedwali, milinganyo, na picha kutoka kwa hati ngumu. Mistral AI inaamini teknolojia hii itabadilisha jinsi mashirika yanavyochakata na kutumia hazina kubwa za habari.

Kulingana na kampuni hiyo, Mistral OCR inachakata hadi kurasa 2000 kwa dakika, inasaidia uwezo wa lugha nyingi na multimodal, na inatoa matokeo yaliyopangwa kama JSON kwa ujumuishaji usio na mshono katika mtiririko wa kazi wa AI. Vipimo vya ndani vinaonyesha kuwa Mistral OCR inaongoza soko katika usahihi wa uchimbaji wa maandishi, haswa kwa hati zilizochanganuliwa, maudhui ya hisabati, na maandishi ya lugha nyingi. Tofauti na suluhisho za jadi za OCR, pia hutoa picha zilizopachikwa, na kuifanya iwe bora kwa utafiti wa kisayansi, uwasilishaji wa udhibiti, na uwekaji dijitali wa hati za kihistoria.

Mistral AI inaripoti kuwa OCR tayari inasaidia biashara na taasisi za utafiti katika kuweka dijitali fasihi, kurahisisha huduma kwa wateja, na kuhifadhi kumbukumbu za kihistoria. Zaidi ya hayo, OCR inasaidia kampuni kubadilisha fasihi ya kiufundi, michoro ya uhandisi, maelezo ya mihadhara, mawasilisho, uwasilishaji wa udhibiti, na zaidi kuwa fomati zilizowekwa faharasa, zilizo tayari kwa majibu. Uwezo wa Mistral OCR unapatikana kwa jaribio la bure kwenye le Chat, na kampuni inatarajia maboresho zaidi kwa modeli katika wiki zijazo. Maendeleo haya yanayoendelea yanaonyesha hali ya nguvu ya AI na uwezo wake wa kuunda upya tasnia mbalimbali.