Microsoft Phi-4: Akili Ndogo, Ufahamu Kubwa!

Microsoft Phi-4 Reasoning inatoa miundo midogo (SLMs) iliyo wazi (leseni ya MIT), yenye kasi, ufanisi na uwezo wa kufanya hoja za hali ya juu.

Microsoft, ikiwa mshirika mkuu wa OpenAI na ikishirikiana na wachezaji wengi kuunganisha miundo yao ya AI katika Azure AI Foundry, haisiti kufuatilia njia zake za kiteknolojia. Hii ni pamoja na kufanya kazi kwenye uvumbuzi katika msingi wa mitandao ya neva, kama vile muundo wa kuvutia wa BitNet b1.58 kulingana na Trit, SLM zake za chanzo huria, na hata miundo mipya iliyofichwa (Project MAI-1).

Mwaka mmoja baada ya kuanzisha safu yake ya miundo midogo ya AI (SLMs) Phi-3 na miezi miwili baada ya kuonyesha kizazi cha 4 na SLM ya aina nyingi (Phi-4-Multimodal) na muundo mdogo (Phi-4-mini), Microsoft inatangaza aina tatu mpya za kizazi chake cha hivi karibuni cha SLM: Phi-4-reasoning, Phi-4-reasoning-plus, na Phi-4-mini-reasoning.

Imetolewa Aprili 30, 2025, matoleo haya ya "hoja-jumuishi" yanapanua toleo la uzani wazi la miundo midogo kwa wasanidi programu ambao wanahitaji kudumisha utendaji mdogo huku wakihitaji hoja ngumu.

Msingi wa mbinu ya wahandisi wa Microsoft ya kufanya SLM zake "hoja": kutegemea usimamizi wa kina (SFT) kutoka kwa minyororo ya hoja ya OpenAI o3-mini, na kutumia ujifunzaji wa uimarishaji (RL) kwa toleo la "plus". "Kupitia kunereka, ujifunzaji wa uimarishaji, na data bora, miundo hii inapatanisha ukubwa na utendaji," Microsoft inaeleza.

Ndogo Lakini Yenye Kipawa

Matokeo kwenye viwango mbalimbali vinavyoongoza vya soko yanatosha kuifanya ushindani uwe hafifu: kwa kawaida na vigezo bilioni 14 tu, Phi-4-reasoning inazidi DeepSeek-R1-Distill-Llama-70B (vigezo bilioni 70) kwenye mfululizo wa AIME 2025, MMLU-Pro au HumanEval-Plus, na inakaribia muundo kamili wa DeepSeek-R1 (vigezo bilioni 671)! Aina ya Phi-4-reasoning-plus, iliyopangwa kwenye vigezo sawa bilioni 14 lakini iliyo fundishwa na tokeni mara 1.5 zaidi, karibu inalingana na alama za OpenAI za o3-mini kwenye OmniMath! Kwa taarifa, Phi-4-reasoning inanufaika na dirisha la muktadha la tokeni 128,000 ambalo limeongezwa hadi tokeni 256,000 kwa toleo la Phi-4-reasoning-plus.

Iliyoundwa kwa mifumo iliyoingia, Phi-4-mini-reasoning inaonyesha vigezo bilioni 3.8, seti sintetiki ya matatizo milioni moja ya hisabati yaliyozalishwa na DeepSeek-R1, na inafikia utendaji wa o1-mini kwenye Math-500 huku ikizidi miundo kadhaa yenye vigezo bilioni 7 hadi 8. Kwa ukubwa wake mdogo sana, muundo huu ni bora kwa utekelezaji wa ndani, ikiwa ni pamoja na kwenye vifaa vya mkononi, na kwa kukidhi mahitaji ya majibu ya karibu papo hapo. Inafaa hasa kwa matumizi ya elimu na chatbots za ndani.

Miundo Wazi kwa Matumizi Mbalimbali

Kwa upande wa upelekaji, CISOs zitapata miundo hii tayari imeboreshwa kwa Copilot+ PCs: lahaja ya NPU "Phi Silica" imepakiwa mapema kwenye kumbukumbu na hutoa muda wa majibu wa karibu papo hapo, kuhakikisha kuishi pamoja kwa ufanisi wa nishati na matumizi ya biashara. APIs za Windows huruhusu kuunganisha kizazi cha nje ya mtandao katika Outlook au zana za ndani.

Kwa upande wa usalama, Microsoft inadai bomba linaloendana na kanuni zake za uwajibikaji - uwajibikaji, haki, uaminifu, usalama, na ujumuishaji. Miundo hupitia mafunzo ya baada ya mafunzo kuchanganya SFT, Uboreshaji wa Mapendeleo ya Moja kwa Moja, na RLHF kutoka seti za umma na za ndani zilizoelekezwa "msaada/kutodhuru". Microsoft pia huchapisha "Kadi" za miundo yake, ambayo inaeleza mapungufu yaliyobaki na hatua za kupunguza.

Inapatikana sasa kwenye Azure AI Foundry, Hugging Face, na GitHub Models, miundo mitatu imechapishwa chini ya leseni ya MIT yenye ruhusa sana, ikifungua njia ya uingizaji wa ndani pamoja na upelekaji wa wingu mseto. Kwa timu za usalama na usanifu, kizazi hiki kipya cha SLMs kinatoa mbadala ya kuaminika kwa LLMs kubwa, na TCO iliyopunguzwa, utekelezaji wa ndani pamoja na Edge, na udhibiti ulioongezeka wa data. Miundo hii ni uthibitisho wa maendeleo ya ajabu yaliyofanywa na SLMs katika mwaka mmoja na uwezo wao wa ajabu katika ulimwengu unaotafuta AI ya bei nafuu na yenye nishati na rasilimali kidogo.

Uchambuzi wa Kina wa Uwezo wa Hoja wa Phi-4

Kufika kwa familia ya miundo ya Phi-4 kunawakilisha hatua muhimu mbele katika maendeleo ya miundo midogo ya lugha (SLMs). Kinachotofautisha miundo hii ni uwezo wao ulioimarishwa wa kufikiri, unaopatikana kupitia mbinu za ubunifu za mafunzo na kuzingatia data bora. Ahadi ya Microsoft kwa kanuni za chanzo huria huendeleza zaidi demokrasia ya upatikanaji wa zana hizi zenye nguvu, kuwawezesha wasanidi programu kuunganisha uwezo wa hali ya juu wa AI katika matumizi mbalimbali.

Kuelewa Usanifu

Miundo ya Phi-4 imejengwa juu ya usanifu wa transfoma, mfumo uliothibitishwa wa usindikaji wa lugha asilia. Hata hivyo, Microsoft imetekeleza ubunifu kadhaa muhimu ili kuboresha miundo kwa kazi za kufikiri.

  • Usimamizi wa Kina (SFT): Miundo imefundishwa kwa kutumia mbinu inayoitwa usimamizi wa kina (SFT), ambayo inahusisha kujifunza kutoka kwa minyororo ya kina ya hoja inayotokana na muundo wa OpenAI wa o3-mini. Hii inaruhusu miundo ya Phi-4 kujifunza hatua zinazohusika katika michakato ngumu ya kufikiri.
  • Ujifunzaji wa Uimarishaji (RL): Lahaja ya "plus" ya muundo wa Phi-4, Phi-4-reasoning-plus, hutumia ujifunzaji wa uimarishaji (RL) ili kuimarisha zaidi uwezo wake wa kufikiri. RL inahusisha kufundisha muundo ili kuongeza ishara ya zawadi, ambayo katika kesi hii inategemea usahihi na ufanisi wa kufikiri kwake.
  • Kunereka: Kunereka hutumiwa kuhamisha ujuzi kutoka kwa miundo mikubwa, ngumu zaidi hadi miundo midogo ya Phi-4. Hii inaruhusu SLMs kufikia viwango vya utendaji vinavyolingana na miundo mikubwa zaidi, huku zikidumisha ukubwa wao mdogo na ufanisi.

Kupima Utendaji

Miundo ya Phi-4 imeonyesha utendaji wa kuvutia kwenye viwango mbalimbali vya kufikiri, ikizidi miundo mikubwa katika baadhi ya matukio. Kwa mfano, Phi-4-reasoning, yenye vigezo bilioni 14 tu, inazidi DeepSeek-R1-Distill-Llama-70B (vigezo bilioni 70) kwenye seti kadhaa za data zenye changamoto, ikiwa ni pamoja na AIME 2025, MMLU-Pro, na HumanEval-Plus. Hii inaonyesha ufanisi na ufanisi wa usanifu wa Phi-4 na mbinu za mafunzo.

Lahaja ya Phi-4-reasoning-plus, iliyofundishwa na tokeni mara 1.5 zaidi, inafikia alama karibu na o3-mini ya OpenAI kwenye kiwango cha OmniMath, inayoonyesha uwezo wake wa kushughulikia matatizo magumu ya kufikiri ya hisabati.

Matumizi na Matukio ya Matumizi

Miundo ya Phi-4 inafaa kwa matumizi mbalimbali ambayo yanahitaji uwezo wa hali ya juu wa kufikiri.

  • Zana za Elimu: Muundo wa Phi-4-mini-reasoning, kwa ukubwa wake mdogo na utendaji wa juu, ni bora kwa matumizi ya elimu. Inaweza kutumika kuunda zana za kujifunza zinazoingiliana ambazo huwapa wanafunzi maoni na usaidizi wa kibinafsi.
  • Chatbots za Ndani: Miundo ya Phi-4 inaweza kutumika kujenga chatbots za ndani ambazo huwapa watumiaji upatikanaji wa papo hapo wa habari na usaidizi. Ukubwa wao mdogo huwaruhusu kupelekwa kwenye vifaa vya mkononi na mazingira mengine yenye rasilimali chache.
  • Copilot+ PCs: Miundo ya Phi-4 imeboreshwa kwa Copilot+ PCs, ikitoa watumiaji uzoefu usio na mshono wa AI. Lahaja ya "Phi Silica" imepakiwa mapema kwenye kumbukumbu na hutoa muda wa majibu wa karibu papo hapo.
  • Kizazi cha Nje ya Mtandao: APIs za Windows huruhusu kuunganisha kizazi cha nje ya mtandao katika Outlook au zana za ndani, kuwawezesha watumiaji kupata uwezo wa AI hata wanapokuwa hawaunganishwi kwenye mtandao.

Usalama na Uwajibikaji

Microsoft imejitolea kuendeleza na kupeleka miundo ya AI kwa njia inayowajibika na ya kimaadili. Miundo ya Phi-4 sio ubaguzi.

  • Kanuni za Uwajibikaji: Bomba la maendeleo ya AI la Microsoft linaendana na kanuni zake za uwajibikaji, ambazo ni pamoja na uwajibikaji, haki, uaminifu, usalama, na ujumuishaji.
  • Mafunzo ya Baada ya Mafunzo: Miundo ya Phi-4 hupitia mafunzo ya baada ya mafunzo kwa kutumia SFT, Uboreshaji wa Mapendeleo ya Moja kwa Moja, na RLHF kutoka kwa seti za data za umma na za ndani zilizoelekezwa "msaada/kutodhuru". Hii husaidia kuhakikisha kwamba miundo ni salama na ya kuaminika.
  • Kadi za Muundo: Microsoft huchapisha "Kadi" kwa miundo yake, ambayo inaeleza mapungufu yaliyosalia na hatua za kupunguza. Hii huwapa watumiaji uwazi na kuwaruhusu kufanya maamuzi sahihi kuhusu jinsi ya kutumia miundo.

Mustakabali wa SLMs

Miundo ya Phi-4 inawakilisha hatua muhimu mbele katika maendeleo ya miundo midogo ya lugha (SLMs). Uwezo wao ulioimarishwa wa kufikiri, pamoja na ukubwa wao mdogo na ufanisi, huwafanya kuwa mbadala ya kulazimisha kwa miundo mikubwa ya lugha (LLMs) katika matumizi mengi.

Kadiri SLMs zinavyoendelea kuboreka, zina uwezekano wa kuchukua jukumu muhimu zaidi katika mazingira ya AI. Uwezo wao wa kufanya kazi kwenye vifaa vyenye rasilimali chache na kutoa utendaji wa haraka na ufanisi huwafanya kufaa kwa matumizi mbalimbali, kutoka kwa zana za elimu hadi chatbots za ndani hadi vifaa vya kompyuta vya makali.

Ahadi ya Microsoft kwa kanuni za chanzo huria na maendeleo ya AI inayowajibika zaidi huweka miundo ya Phi-4 kama rasilimali muhimu kwa jumuiya ya AI. Kwa kuongeza demokrasia ya upatikanaji wa zana hizi zenye nguvu, Microsoft inawawezesha wasanidi programu kuunda matumizi ya ubunifu na yenye athari ambayo yanaweza kufaidisha jamii kwa ujumla.

Uchunguzi wa Karibu wa Vipengele vya Kiufundi

Kuingia zaidi katika maelezo maalum ya usanifu wa Phi-4 na mafunzo kunafunua mbinu za ubunifu zinazowezesha SLMs hizi kufikia uwezo wa kufikiri wa kuvutia sana. Mchanganyiko wa seti za data zilizoratibiwa kwa uangalifu, algorithms za kisasa za mafunzo, na kuzingatia ufanisi kumesababisha familia ya miundo ambayo ni yenye nguvu na ya vitendo.

Uratibu na Maandalizi wa Data

Mafanikio ya muundo wowote wa kujifunza mashine hutegemea ubora na umuhimu wa data ambayo imefunzwa. Microsoft ilianzisha juhudi kubwa katika kuratibu na kuandaa seti za data zilizotumiwa kufundisha miundo ya Phi-4.

  • Minyororo ya Hoja kutoka kwa o3-mini ya OpenAI: Miundo hutumia minyororo ya hoja inayotokana na muundo wa OpenAI wa o3-mini ili kujifunza hatua zinazohusika katika michakato ngumu ya hoja. Minyororo hii hutoa ramani ya kina kwa SLMs kufuata, kuwawezesha kukuza uelewa wa kina wa mantiki ya msingi.
  • Matatizo Sintetiki ya Hisabati: Muundo wa Phi-4-mini-reasoning umefunzwa kwenye seti sintetiki ya matatizo milioni moja ya hisabati yaliyotokana na DeepSeek-R1. Seti hii ya data hutoa aina mbalimbali za changamoto za hisabati, kuruhusu muundo kukuza ujuzi thabiti wa kutatua matatizo.
  • Seti za Data za Msaada/Kutodhuru: Miundo hupitia mafunzo ya baada ya mafunzo kwa kutumia seti za data zilizoundwa ili kukuza msaada na kutodhuru. Hii husaidia kuhakikisha kwamba miundo inazalisha matokeo salama na ya kuwajibika.

Algorithms za Mafunzo

Miundo ya Phi-4 imefunzwa kwa kutumia mchanganyiko wa ujifunzaji uliosimamiwa, ujifunzaji wa uimarishaji, na kunereka. Mbinu hizi zinafanya kazi pamoja ili kuboresha miundo kwa kazi za hoja na kuhakikisha kwamba ni sahihi na yenye ufanisi.

  • Uboreshaji Bora Uliosimamiwa (SFT): SFT hutumiwa kuboresha miundo kwenye minyororo ya hoja inayotokana na muundo wa OpenAI wa o3-mini. Hii inaruhusu miundo kujifunza mifumo maalum na mahusiano ambayo ni tabia ya michakato ngumu ya hoja.
  • Ujifunzaji wa Uimarishaji (RL): RL hutumiwa kufundisha muundo wa Phi-4-reasoning-plus ili kuongeza ishara ya zawadi kulingana na usahihi na ufanisi wa hoja zake. Hii inahimiza muundo kukuza mikakati ya kutatua matatizo ambayo ni yenye ufanisi na yenye ufanisi wa hesabu.
  • Kunereka: Kunereka hutumiwa kuhamisha ujuzi kutoka kwa miundo mikubwa, ngumu zaidi hadi miundo midogo ya Phi-4. Hii inaruhusu SLMs kufikia viwango vya utendaji vinavyolingana na miundo mikubwa zaidi, huku zikidumisha ukubwa wao mdogo na ufanisi.

Uboreshaji wa Ufanisi

Moja ya malengo muhimu katika kuendeleza miundo ya Phi-4 ilikuwa kuiboresha kwa ufanisi. Hii inaonekana katika vipengele kadhaa vya muundo wao na mafunzo.

  • Usanifu Mdogo: Miundo ya Phi-4 imeundwa na usanifu mdogo ambao hupunguza idadi ya vigezo vinavyohitajika. Hii inapunguza gharama ya hesabu ya kuendesha miundo na kuifanya ifae kwa upelekaji kwenye vifaa vyenye rasilimali chache.
  • Kuweka Kiasi: Kuweka kiasi hutumiwa kupunguza alama ya kumbukumbu ya miundo na kuboresha kasi yao ya uingizaji. Hii inahusisha kuwakilisha vigezo vya muundo kwa kutumia biti chache, ambazo zinaweza kupunguza sana gharama ya hesabu ya kuendesha muundo.
  • Kuongeza kasi ya Vifaa: Miundo ya Phi-4 imeboreshwa kwa kuongeza kasi ya vifaa kwenye majukwaa mbalimbali, ikiwa ni pamoja na CPUs, GPUs, na NPUs. Hii inawaruhusu kufikia utendaji wa juu kwenye aina mbalimbali za vifaa.

Maana kwa Mustakabali wa AI

Miundo ya Phi-4 inawakilisha hatua muhimu mbele katika maendeleo ya AI, na maana ambayo inaenea mbali zaidi ya matumizi maalum ambayo yameundwa. Uwezo wao wa kufikia utendaji wa juu na ukubwa mdogo na rasilimali za hesabu hufungua uwezekano mpya wa kupeleka AI katika mipangilio mbalimbali.

Demokrasia ya AI

Miundo ya Phi-4 ni ushuhuda wa ukweli kwamba uwezo mkubwa wa AI unaweza kufikiwa bila kuhitaji rasilimali kubwa za hesabu au upatikanaji wa seti za data za umiliki. Hii inaongeza demokrasia ya upatikanaji wa AI, kuwawezesha wasanidi programu na watafiti kuunda matumizi ya ubunifu hata na rasilimali chache.

Kompyuta ya Makali

Ukubwa mdogo na ufanisi wa miundo ya Phi-4 huifanya ifae kwa matumizi ya kompyuta ya makali. Hii inaruhusu AI kupelekwa karibu na chanzo cha data, kupunguza muda wa kusubiri na kuboresha mwitikio. Kompyuta ya makali ina uwezo wa kuleta mapinduzi katika viwanda mbalimbali, kutoka kwa utengenezaji hadi huduma ya afya hadi usafiri.

AI Iliyobinafsishwa

Miundo ya Phi-4 inaweza kubadilishwa na kubadilishwa ili kukidhi mahitaji maalum ya watumiaji binafsi au mashirika. Hii inaruhusu uundaji wa uzoefu wa AI uliobinafsishwa ambao umeundwa kwa mahitaji ya kipekee ya kila mtumiaji. AI iliyobinafsishwa ina uwezo wa kuboresha uzalishaji, kuimarisha ujifunzaji, na kuboresha ustawi kwa ujumla.

AI Endelevu

Miundo ya Phi-4 ni mbadala endelevu zaidi kwa miundo mikubwa ya lugha, inayohitaji nishati ndogo na rasilimali za hesabu. Hii ni muhimu kwa kupunguza athari za mazingira za AI na kuhakikisha kwamba inaweza kupelekwa kwa njia inayowajibika na endelevu.

Miundo ya Microsoft Phi-4-Reasoning sio tu marudio mengine katika ulimwengu unaoendelea wa AI; ni mabadiliko ya dhana. Zinaonyesha kwamba akili sio tu kazi ya ukubwa na nguvu ya hesabu lakini inaweza kupatikana kupitia muundo mzuri, uratibu makini wa data, na mbinu za ubunifu za mafunzo. Kadiri miundo hii inavyoendelea kubadilika, ziko tayari kufungua uwezekano mpya wa AI na kubadilisha jinsi tunavyoshirikiana na teknolojia.