Ubunifu wa NVIDIA: Llama Nemotron Ultra na Parakeet

Katika mazungumzo ya kina, Joey Conway kutoka NVIDIA anatoa mtazamo wa kina kuhusu maendeleo ya hivi karibuni ya kampuni katika mifumo ya lugha kubwa huria (LLMs) na utambuzi wa hotuba otomatiki (ASR). Majadiliano yanaangazia Llama Nemotron Ultra na Parakeet, miradi miwili muhimu inayoonyesha dhamira ya NVIDIA ya kupanua mipaka ya teknolojia ya AI.

Mkakati wa NVIDIA wa Chanzo Huria

NVIDIA inaibuka kwa kasi kama nguvu muhimu katika uwanja wa AI huria. Kutolewa kwa mifumo ya hali ya juu kama Llama Nemotron Ultra na Parakeet TDT kunaonyesha hatua ya kimkakati ya kuwezesha teknolojia ya AI na kukuza uvumbuzi ndani ya jamii. Kwa kufanya zana hizi za kisasa zipatikane, NVIDIA inalenga kuharakisha utafiti, maendeleo, na utumiaji wa suluhisho za AI katika viwanda mbalimbali.

Llama Nemotron Ultra: Kufafanua Ufanisi na Utendaji Upya

Llama Nemotron Ultra, mfumo wa vigezo bilioni 253, ni ushuhuda wa ustadi wa uhandisi wa NVIDIA. Kinachoitofautisha ni uwezo wake wa kutoa utendaji unaolingana na mifumo mara mbili ya ukubwa wake, kama vile Llama 405B na DeepSeek R1. Mafanikio haya ya ajabu yanaifanya iweze kutumwa kwenye nodi moja ya 8x H100, na kuifanya ipatikane kwa watumiaji wengi zaidi.

Siri ya Mafanikio: Muunganisho wa FFN

Ufanisi wa kuvutia wa Llama Nemotron Ultra unatokana kwa kiasi kikubwa na mbinu bunifu inayoitwa muunganisho wa FFN (Feed-Forward Network). Mkakati huu wa uboreshaji, uliogunduliwa kupitia utafutaji wa usanifu wa neural wa Puzzle wa NVIDIA, hurahisisha usanifu wa mfumo kwa kupunguza tabaka za umakini ambazo hazihitajiki.

Kwa kupanga tabaka za FFN katika mlolongo, mbinu hii huwezesha hesabu sawa kwenye GPUs. Kuunganisha au kuchanganya tabaka zilizobaki huongeza ufanisi, hasa kwa mifumo mikubwa kulingana na Meta’s Llama 3.1 - 405B. Faida za muunganisho wa FFN ni mbili: inaboresha kwa kiasi kikubwa uwezo wa utendaji, kufikia ongezeko la kasi katika kiwango cha 3 hadi 5x, na kupunguza ukubwa wa kumbukumbu ya mfumo. Ukubwa uliopunguzwa huruhusu matumizi ya akiba kubwa ya KV, kuwezesha mfumo kushughulikia urefu mrefu zaidi wa muktadha.

Kutoa Sababu Inapohitajika: Kipengele Kinachobadilisha Mchezo

Moja ya vipengele vya kipekee na muhimu zaidi vya Llama Nemotron Ultra ni uwezo wake wa "kutoa sababu on/off". Hii inaruhusu udhibiti usio na kifani juu ya mchakato wa kutoa sababu wa mfumo, kutoa faida kubwa kwa matumizi ya uzalishaji na uboreshaji wa gharama.

Uwezo wa kuwasha na kuzima kutoa sababu kupitia kidokezo cha mfumo huwapa biashara kubadilika ili kusawazisha usahihi na muda wa kunakili na gharama. Kutoa sababu, ingawa ni muhimu kwa kutatua matatizo magumu, huzalisha tokeni zaidi, na kusababisha muda mrefu wa kunakili na gharama. Kwa kutoa udhibiti wa wazi, NVIDIA inawawezesha watumiaji kufanya maamuzi sahihi kuhusu wakati wa kutumia kutoa sababu, na hivyo kuboresha utendaji na matumizi ya rasilimali.

Ili kutekeleza kipengele hiki, NVIDIA ilifundisha wazi mfumo wakati wa kutoa sababu na wakati wa kutokutoa sababu wakati wa hatua ya kurekebisha ufundishaji unaosimamiwa. Hii ilihusisha kuwasilisha swali moja na majibu mawili tofauti: moja na sababu za kina na moja bila, kimsingi kuongeza ukubwa wa data mara mbili kwa kusudi hili maalum. Matokeo ni mfumo mmoja ambapo watumiaji wanaweza kudhibiti mchakato wa kutoa sababu kwa kujumuisha tu "tumia mawazo ya kina kuwasha" au "tumia mawazo ya kina kuzima" kwenye kidokezo.

Mapinduzi ya Utambuzi wa Hotuba na Parakeet TDT

Parakeet TDT, mfumo wa ASR wa hali ya juu wa NVIDIA, umefafanua upya vigezo vya kasi na usahihi katika utambuzi wa hotuba. Inaweza kunakili saa moja ya sauti kwa sekunde moja tu na kiwango cha makosa ya neno cha 6% - mara 50 kwa kasi zaidi kuliko njia mbadala zingine za chanzo huria.

Ubunifu wa Usanifu: "Jinsi" Utendaji wa Parakeet Unavyofanya Kazi

Utendaji wa kuvutia wa Parakeet TDT ni matokeo ya mchanganyiko wa chaguo za usanifu na uboreshaji maalum. Inategemea usanifu wa Fast Conformer, ulioimarishwa na mbinu kama vile upunguzaji wa ukubwa wa kina wa convolution unaoweza kutenganishwa na umakini mdogo wa muktadha.

Upunguzaji wa ukubwa wa kina wa convolution unaoweza kutenganishwa katika hatua ya ingizo hupunguza kwa kiasi kikubwa gharama ya hesabu na mahitaji ya kumbukumbu kwa usindikaji. Umakini mdogo wa muktadha, kwa kuzingatia vipande vidogo na vinavyoingiliana vya sauti, hudumisha usahihi huku ukipata kasi katika usindikaji. Kwenye upande wa encoder, mbinu ya umakini wa dirisha linaloteleza inaruhusu mfumo kusindika faili ndefu za sauti bila kuzigawanya katika sehemu fupi, muhimu kwa kushughulikia sauti ndefu.

Transducer ya Muda wa Tokeni (TDT): Ufunguo wa Kasi

Zaidi ya usanifu wa Conformer, Parakeet TDT inajumuisha Transducer ya Tokeni na Muda (TDT). Teknolojia ya jadi ya Recurrent Neural Network (RNN) transducer husindika sauti fremu kwa fremu. TDT inawezesha mfumo kutabiri tokeni na muda unaotarajiwa wa tokeni hizo, na kuwaruhusu kuruka fremu zisizohitajika na kuharakisha mchakato wa unakili kwa kiasi kikubwa.

Ubunifu huu wa TDT pekee unachangia karibu 1.5 hadi 2x kasi. Zaidi ya hayo, algoriti ya kurudia lebo inaruhusu maendeleo huru ya tokeni kwa sampuli tofauti wakati wa hitimisho la batch, na kuharakisha zaidi mchakato wa uamuzi. Kuhamisha hesabu zingine kwenye upande wa decoder kwenye grafu za CUDA hutoa msukumo mwingine wa kasi wa 3x. Ubunifu huu unawezesha Parakeet TDT kufikia kasi inayolingana na decoders za Connectionist Temporal Classification (CTC), zinazojulikana kwa kasi zao, huku zikidumisha usahihi wa hali ya juu.

Kuwezesha AI kwa Chanzo Huria cha Data

Dhamira ya NVIDIA kwa jamii huria inaenea zaidi ya utoaji wa mfumo ili kujumuisha kushiriki seti kubwa za data za ubora wa juu kwa lugha na hotuba. Mbinu ya kampuni ya kuandaa data inasisitiza uwazi na uwazi, kwa lengo la kushiriki kadri inavyowezekana kuhusu data yake, mbinu, na zana ili jamii iweze kuelewa na kuzitumia.

Uandaaji wa Data kwa Llama Nemotron Ultra

Lengo kuu la uandaaji wa data kwa Llama Nemotron Ultra lilikuwa kuboresha usahihi katika vikoa kadhaa muhimu, ikiwa ni pamoja na kazi za kutoa sababu kama vile hesabu na uandishi wa kanuni, pamoja na kazi zisizo za kutoa sababu kama vile kupiga simu kwa zana, kufuata maelekezo, na mazungumzo.

Mkakati ulihusisha kuandaa seti maalum za data ili kuimarisha utendaji katika maeneo haya. Ndani ya mchakato wa kurekebisha ufundishaji unaosimamiwa, NVIDIA ilitofautisha kati ya matukio ya "kutoa sababu on" na "kutoa sababu off". Mifumo ya ubora wa juu kutoka kwa jamii ilitumiwa kama "wataalam" katika vikoa maalum. Kwa mfano, DeepSeek R-1 ilitumiwa sana kwa kazi za hesabu na uandishi wa kanuni zinazohitaji kutoa sababu sana, huku mifumo kama vile Llama na Qwen zilitumiwa kwa kazi zisizo za kutoa sababu kama vile hesabu za msingi, uandishi wa kanuni, mazungumzo, na kupiga simu kwa zana. Seti hii ya data iliyoandaliwa, inayojumuisha jozi za maswali-majawabu milioni 30, imefanywa ipatikane kwa umma kwenye Hugging Face.

Kuhakikisha Ubora wa Data: Mbinu ya Tabaka Nyingi

Kwa kuzingatia kwamba sehemu kubwa ya data ilizalishwa kwa kutumia mifumo mingine, NVIDIA ilitekeleza mchakato mkali wa uhakikisho wa ubora wa tabaka nyingi. Hii ilihusisha:

  • Kizalisha majibu mengi yanayoweza kutokea kwa kidokezo kimoja kwa kutumia kila mfumo mtaalam.
  • Kutumia seti tofauti ya mifumo ya "ukosoaji" kutathmini wagombea hawa kulingana na usahihi, uwiano, na kufuata kidokezo.
  • Kutekeleza mfumo wa alama ambapo kila jozi ya swali-jibu iliyozalishwa ilipokea alama ya ubora kulingana na tathmini ya mfumo wa ukosoaji, na kizingiti cha juu kiliwekwa kwa kukubalika.
  • Kuunganisha ukaguzi wa binadamu katika hatua mbalimbali, huku wanasayansi wa data na wahandisi wakikagua sampuli za data iliyozalishwa kwa mikono ili kutambua makosa yoyote ya kimfumo, upendeleo, au matukio ya ndoto.
  • Kuzingatia utofauti wa data iliyozalishwa ili kuhakikisha anuwai kubwa ya mifano ndani ya kila kikoa.
  • Kufanya tathmini za kina dhidi ya seti za data za vigezo na katika matukio ya matumizi ya ulimwengu halisi baada ya kufunza Llama Nemotron Ultra kwenye data hii iliyoandaliwa.

Kutoa Chanzo Huria cha Seti ya Data ya Hotuba kwa Parakeet TDT

NVIDIA inapanga kutoa chanzo huria cha seti kubwa ya data ya hotuba, karibu saa 100,000, iliyoandaliwa kwa uangalifu ili kuonyesha utofauti wa ulimwengu halisi. Seti hii ya data itajumuisha tofauti katika viwango vya sauti, uwiano wa mawimbi-kwa-kelele, aina za kelele za usuli, na hata fomati za sauti za simu zinazohusiana na vituo vya simu. Lengo ni kutoa jamii data ya ubora wa juu na anuwai ambayo inawezesha mifumo kufanya kazi vizuri katika anuwai ya matukio ya ulimwengu halisi.

Mielekeo ya Baadaye: Mifumo Ndogo, Usaidizi wa Lugha Nyingi, na Utiririshaji wa Wakati Halisi

Maono ya NVIDIA kwa siku zijazo ni pamoja na maendeleo zaidi katika usaidizi wa lugha nyingi, mifumo midogo zaidi iliyoboreshwa kwa matumizi ya pembeni, na maboresho katika utiririshaji wa wakati halisi kwa utambuzi wa hotuba.

Uwezo wa Lugha Nyingi

Kusaidia lugha nyingi ni muhimu kwa biashara kubwa. NVIDIA inalenga kuzingatia lugha chache muhimu na kuhakikisha usahihi wa kiwango cha ulimwengu kwa kutoa sababu, kupiga simu kwa zana, na mazungumzo ndani ya hizo. Hili lina uwezekano wa kuwa eneo kubwa linalofuata la upanuzi.

Mifumo Iliyoboreshwa kwa Matumizi ya Pembeni

NVIDIA inazingatia mifumo hadi karibu vigezo milioni 50 ili kushughulikia matukio ya matumizi ya pembeni ambapo nyayo ndogo ni muhimu, kama vile kuwezesha usindikaji wa sauti wa wakati halisi kwa roboti katika mazingira yenye kelele.

Utiririshaji wa Wakati Halisi kwa Parakeet TDT

Kiteknolojia, NVIDIA inapanga kufanya kazi kwenye uwezo wa utiririshaji wa TDT ili kuwezesha unakili wa moja kwa moja wa wakati halisi.

AI Tayari kwa Uzalishaji: Kubuni kwa Matumizi ya Ulimwengu Halisi

Llama Nemotron Ultra na Parakeet TDT zote zimeundwa kwa akili na changamoto za matumizi ya ulimwengu halisi, zikizingatia usahihi, ufanisi, na ufanisi wa gharama.

Kutoa Sababu On/Off kwa Kuongeza Ukubwa na Ufanisi wa Gharama

Kutoa sababu kupita kiasi kunaweza kusababisha masuala ya kuongeza ukubwa na kuongezeka kwa muda wa kunakili katika mazingira ya uzalishaji. Kipengele cha kutoa sababu on/off kilichoanzishwa katika Llama Nemotron Ultra kinatoa kubadilika ili kudhibiti kutoa sababu kwa kila swali, kuwezesha matukio mengi ya matumizi ya uzalishaji.

Kusawazisha Usahihi na Ufanisi

Kusawazisha usahihi na ufanisi ni changamoto ya mara kwa mara. Mbinu ya NVIDIA inahusisha kuzingatia kwa uangalifu idadi ya vipindi vya kila ujuzi wakati wa mafunzo na kupima usahihi mara kwa mara. Lengo ni kuboresha utendaji katika maeneo yote muhimu.

Jukumu la Mifumo ya NVIDIA katika Mfumo wa Ikolojia wa Chanzo Huria

NVIDIA inaona jukumu la Llama Nemotron Ultra na Parakeet TDT ndani ya mfumo mpana wa ikolojia wa chanzo huria na LLM kama kujenga juu ya misingi iliyopo na kuzingatia kwa karibu maeneo maalum ili kuongeza thamani kubwa. Kampuni inalenga kuendelea kutambua maeneo maalum ambapo inaweza kuchangia, wakati wengine wanaendelea kujenga mifumo bora ya madhumuni ya jumla inayofaa kwa uzalishaji wa biashara.

Mambo Muhimu: Chanzo Huria, Haraka, Uwezo Mkubwa, Ufanisi wa Gharama

Mambo muhimu kutoka kwa kazi ya NVIDIA kwenye Llama Nemotron Ultra na Parakeet TDT ni dhamira ya kutoa chanzo huria cha kila kitu, kufikia usahihi wa hali ya juu, kuboresha nyayo kwa matumizi bora ya GPU kulingana na muda wa kunakili na uwezo, na kuwezesha jamii.

Mifumo na seti zote za data zinapatikana kwenye Hugging Face. Safu ya programu ya kuziendesha inatoka NVIDIA na inapatikana kwenye NGC, hazina yake ya maudhui. Sehemu kubwa ya programu msingi pia ni chanzo huria na inaweza kupatikana kwenye GitHub. Mfumo wa Nemo ndio kitovu kikuu cha safu hii ya programu.