AI మోడల్ శిక్షణలో యాంట్ యొక్క వినూత్న విధానం
జాక్ మా మద్దతు ఉన్న ఫిన్టెక్ దిగ్గజం యాంట్ గ్రూప్, చైనీస్-నిర్మిత సెమీకండక్టర్లను ఉపయోగించడం ద్వారా ఆర్టిఫిషియల్ ఇంటెలిజెన్స్లో గణనీయమైన పురోగతిని సాధించింది. ఈ వినూత్న విధానం AI మోడల్లకు శిక్షణ ఇచ్చే సాంకేతికతలను అభివృద్ధి చేయడానికి కంపెనీకి వీలు కల్పించింది, ఫలితంగా ఖర్చులు 20% తగ్గాయి. ఈ విషయంతో పరిచయం ఉన్న వర్గాలు తెలిపిన ప్రకారం, యాంట్ తన అనుబంధ సంస్థ అలీబాబా గ్రూప్ హోల్డింగ్ లిమిటెడ్ మరియు హువావే టెక్నాలజీస్ కో. నుండి వచ్చిన వాటితో సహా దేశీయ చిప్లను ఉపయోగించి మిక్స్చర్ ఆఫ్ ఎక్స్పర్ట్స్ (MoE) మెషిన్ లెర్నింగ్ విధానాన్ని ఉపయోగించి మోడళ్లకు శిక్షణ ఇచ్చింది.
యాంట్ సాధించిన ఫలితాలు Nvidia Corp. యొక్క చిప్లను ఉపయోగించి పొందిన వాటితో పోల్చదగినవి, ఉదాహరణకు H800, ఇది U.S. ద్వారా చైనాకు ఎగుమతి చేయకుండా నిరోధించబడిన శక్తివంతమైన ప్రాసెసర్. యాంట్ AI అభివృద్ధి కోసం Nvidiaని ఉపయోగించడం కొనసాగిస్తున్నప్పటికీ, ఇది అధునాతన మైక్రో డివైజెస్ ఇంక్. (AMD) మరియు చైనీస్ చిప్లతో సహా ప్రత్యామ్నాయాలపై ఎక్కువగా ఆధారపడుతోంది.
AI రేసులోకి ప్రవేశం: చైనా vs. U.S.
AI మోడల్ అభివృద్ధిలో యాంట్ యొక్క ప్రవేశం చైనీస్ మరియు U.S. కంపెనీల మధ్య తీవ్రమైన పోటీ మధ్యలో ఉంచుతుంది. OpenAI మరియు Alphabet Inc. యొక్క Google వంటి పరిశ్రమ దిగ్గజాలు బిలియన్ల పెట్టుబడి పెట్టిన వ్యయంలో కొంత భాగానికి అత్యంత సామర్థ్యం గల మోడళ్లకు శిక్షణ ఇచ్చే సామర్థ్యాన్ని డీప్సీక్ ప్రదర్శించినప్పటి నుండి ఈ రేసు తీవ్రమైంది. అత్యంత అధునాతన Nvidia సెమీకండక్టర్లకు స్థానికంగా లభించే ప్రత్యామ్నాయాలను ఉపయోగించుకోవాలనే చైనీస్ కంపెనీల సంకల్పాన్ని యాంట్ సాధించిన విజయం నొక్కి చెబుతుంది.
ఖర్చు-సమర్థవంతమైన AI అనుమితి యొక్క వాగ్దానం
యాంట్ ఈ నెలలో ప్రచురించిన పరిశోధనా పత్రం దాని నమూనాల సామర్థ్యాన్ని హైలైట్ చేస్తుంది, Meta Platforms Inc.తో పోలిస్తే కొన్ని బెంచ్మార్క్లలో అత్యుత్తమ పనితీరును క్లెయిమ్ చేస్తుంది, అయినప్పటికీ ఈ క్లెయిమ్లు బ్లూమ్బెర్గ్ న్యూస్ ద్వారా స్వతంత్రంగా ధృవీకరించబడలేదు. ఏదేమైనప్పటికీ, యాంట్ యొక్క ప్లాట్ఫారమ్లు ప్రచారం చేసిన విధంగా పని చేస్తే, అవి చైనీస్ ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ అభివృద్ధిలో గణనీయమైన పురోగతిని సూచిస్తాయి. AI సేవలకు మద్దతు ఇచ్చే ప్రక్రియ అయిన అనుమితి ఖర్చును గణనీయంగా తగ్గించగల సామర్థ్యం దీనికి ప్రధాన కారణం.
మిక్స్చర్ ఆఫ్ ఎక్స్పర్ట్స్: AIలో గేమ్-ఛేంజర్
కంపెనీలు AIలో గణనీయమైన వనరులను కుమ్మరిస్తున్నందున, MoE మోడల్లు జనాదరణ పొందిన మరియు సమర్థవంతమైన విధానంగా ప్రాముఖ్యతను సంతరించుకున్నాయి. గూగుల్ మరియు హాంగ్జౌ ఆధారిత స్టార్టప్ డీప్సీక్ వంటి కంపెనీలు ఉపయోగించే ఈ సాంకేతికత, పనులను చిన్న డేటా సెట్లుగా విభజించడాన్ని కలిగి ఉంటుంది. ఇది నిపుణుల బృందాన్ని కలిగి ఉండటానికి సమానంగా ఉంటుంది, ప్రతి ఒక్కరూ ఒక నిర్దిష్ట విభాగంపై దృష్టి పెడతారు, తద్వారా మొత్తం ప్రక్రియను ఆప్టిమైజ్ చేస్తుంది.
GPU బాటిల్నెక్ను అధిగమించడం
సాంప్రదాయకంగా, MoE మోడల్ల శిక్షణ Nvidia తయారు చేసిన గ్రాఫిక్స్ ప్రాసెసింగ్ యూనిట్లు (GPUలు) వంటి అధిక-పనితీరు గల చిప్లపై ఎక్కువగా ఆధారపడి ఉంటుంది. ఈ చిప్ల యొక్క నిషేధిత ధర చాలా చిన్న సంస్థలకు ఒక ప్రధాన అవరోధంగా ఉంది, ఇది MoE మోడల్లను విస్తృతంగా స్వీకరించడాన్ని పరిమితం చేస్తుంది. ఏదేమైనా, యాంట్ పెద్ద భాషా నమూనాలను (LLMలు) మరింత సమర్థవంతంగా శిక్షణ ఇచ్చే పద్ధతులపై శ్రద్ధగా పని చేస్తోంది, ఈ పరిమితిని సమర్థవంతంగా తొలగిస్తుంది. “ప్రీమియం GPUలు లేకుండా” ఒక నమూనాను స్కేల్ చేయడానికి లక్ష్యాన్ని నిర్దేశించే వారి పరిశోధనా పత్రం యొక్క శీర్షిక ఈ లక్ష్యాన్ని స్పష్టంగా ప్రతిబింబిస్తుంది.
Nvidia యొక్క ఆధిపత్యాన్ని సవాలు చేయడం
యాంట్ యొక్క విధానం Nvidia యొక్క CEO, జెన్సెన్ హువాంగ్ సమర్థించిన ప్రబలమైన వ్యూహాన్ని నేరుగా సవాలు చేస్తుంది. డీప్సీక్ యొక్క R1 వంటి మరింత సమర్థవంతమైన నమూనాల ఆవిర్భావంతో కూడా గణన డిమాండ్ పెరుగుతూనే ఉంటుందని హువాంగ్ నిరంతరం వాదించారు. ఖర్చులను తగ్గించడానికి చౌకైన వాటి కంటే అధిక ఆదాయాన్ని ఆర్జించడానికి కంపెనీలకు మెరుగైన చిప్లు అవసరమని ఆయన అభిప్రాయపడ్డారు. పర్యవసానంగా, Nvidia మెరుగైన ప్రాసెసింగ్ కోర్లు, ట్రాన్సిస్టర్లు మరియు పెరిగిన మెమరీ సామర్థ్యంతో పెద్ద GPUలను నిర్మించడంపై దృష్టి సారించింది.
ఖర్చు పొదుపులను లెక్కించడం
యాంట్ తన ఆప్టిమైజ్ చేసిన విధానం యొక్క ఖర్చు-ప్రభావాన్ని ప్రదర్శించడానికి ఖచ్చితమైన గణాంకాలను అందించింది. అధిక-పనితీరు గల హార్డ్వేర్ను ఉపయోగించి 1 ట్రిలియన్ టోకెన్లకు శిక్షణ ఇవ్వడానికి సుమారు 6.35 మిలియన్ యువాన్లు ($880,000) ఖర్చవుతుందని కంపెనీ పేర్కొంది. ఏదేమైనా, తక్కువ-స్పెసిఫికేషన్ హార్డ్వేర్ మరియు దాని ఆప్టిమైజ్ చేసిన సాంకేతికతలను ఉపయోగించడం ద్వారా, యాంట్ ఈ ఖర్చును 5.1 మిలియన్ యువాన్లకు తగ్గించగలదు. టోకెన్లు ప్రపంచం గురించి తెలుసుకోవడానికి మరియు వినియోగదారు ప్రశ్నలకు సంబంధిత ప్రతిస్పందనలను అందించడానికి ఒక మోడల్ ప్రాసెస్ చేసే సమాచార యూనిట్లను సూచిస్తాయి.
పారిశ్రామిక పరిష్కారాల కోసం AI పురోగతులను ఉపయోగించడం
ఆరోగ్య సంరక్షణ మరియు ఫైనాన్స్ వంటి రంగాల కోసం పారిశ్రామిక AI పరిష్కారాలను అభివృద్ధి చేయడానికి, ప్రత్యేకంగా లింగ్-ప్లస్ మరియు లింగ్-లైట్ అనే పెద్ద భాషా నమూనాలలో తన ఇటీవలి పురోగతులను ఉపయోగించుకోవాలని యాంట్ యోచిస్తోంది. ఈ నమూనాలు నిర్దిష్ట పరిశ్రమ అవసరాలను పరిష్కరించడానికి మరియు తగిన పరిష్కారాలను అందించడానికి రూపొందించబడ్డాయి.
ఆరోగ్య సంరక్షణలో AI అప్లికేషన్లను విస్తరించడం
చైనీస్ ఆన్లైన్ ప్లాట్ఫారమ్ Haodf.comని తన ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ సేవల్లోకి చేర్చడంలో యాంట్ యొక్క ఆరోగ్య సంరక్షణ పట్ల నిబద్ధత స్పష్టంగా కనిపిస్తుంది. AI డాక్టర్ అసిస్టెంట్ను సృష్టించడం ద్వారా, వైద్య రికార్డు నిర్వహణ వంటి పనులతో సహాయం చేయడం ద్వారా 290,000 మంది వైద్యుల యొక్క విస్తృతమైన నెట్వర్క్కు మద్దతు ఇవ్వాలని యాంట్ లక్ష్యంగా పెట్టుకుంది. AI యొక్క ఈ అప్లికేషన్ ఆరోగ్య సంరక్షణ డెలివరీలో సామర్థ్యం మరియు ఖచ్చితత్వాన్ని గణనీయంగా మెరుగుపరిచే సామర్థ్యాన్ని కలిగి ఉంది.
రోజువారీ జీవితానికి AI-ఆధారిత సహాయం
ఆరోగ్య సంరక్షణకు మించి, యాంట్ Zhixiaobao అనే AI ‘లైఫ్ అసిస్టెంట్’ యాప్ను మరియు Maxiaocai అనే ఆర్థిక సలహా AI సేవను కూడా అభివృద్ధి చేసింది. ఈ అప్లికేషన్లు వినియోగదారులకు వ్యక్తిగతీకరించిన మరియు తెలివైన సహాయాన్ని అందిస్తూ, రోజువారీ జీవితంలోని వివిధ అంశాలలో AIని సమగ్రపరచాలనే యాంట్ యొక్క ఆశయాన్ని ప్రదర్శిస్తాయి.
బెంచ్మార్కింగ్ పనితీరు: లింగ్ మోడల్స్ vs. పోటీదారులు
తన పరిశోధనా పత్రంలో, ఇంగ్లీష్-భాషా అవగాహన కోసం కీలకమైన బెంచ్మార్క్లో లింగ్-లైట్ మోడల్ Meta యొక్క Llama మోడల్లలో ఒకదానిని అధిగమించిందని యాంట్ పేర్కొంది. ఇంకా, లింగ్-లైట్ మరియు లింగ్-ప్లస్ మోడల్లు రెండూ చైనీస్-భాషా బెంచ్మార్క్లపై డీప్సీక్ యొక్క సమానమైన వాటితో పోలిస్తే అత్యుత్తమ పనితీరును ప్రదర్శించాయి. ఇది AI ల్యాండ్స్కేప్లో యాంట్ యొక్క పోటీ స్థానాన్ని హైలైట్ చేస్తుంది.
బీజింగ్ ఆధారిత AI సొల్యూషన్ ప్రొవైడర్ షెంగ్షాంగ్ టెక్ కో. యొక్క చీఫ్ టెక్నాలజీ ఆఫీసర్ రాబిన్ యు సరిగ్గా చెప్పినట్లుగా, “ప్రపంచంలోని అత్యుత్తమ కుంగ్ ఫూ మాస్టర్ను ఓడించడానికి మీరు ఒక పాయింట్ ఆఫ్ అటాక్ను కనుగొంటే, మీరు ఇప్పటికీ వారిని ఓడించారని చెప్పవచ్చు, అందుకే వాస్తవ-ప్రపంచ అప్లికేషన్ ముఖ్యం.”
సహకారం మరియు ఆవిష్కరణ కోసం ఓపెన్ సోర్సింగ్
యాంట్ లింగ్ మోడల్లను ఓపెన్ సోర్స్ చేసింది, AI కమ్యూనిటీలో సహకారం మరియు ఆవిష్కరణలను ప్రోత్సహిస్తుంది. లింగ్-లైట్లో 16.8 బిలియన్ పారామితులు ఉన్నాయి, ఇవి మోడల్ పనితీరును నియంత్రించే సర్దుబాటు సెట్టింగ్లు. మరోవైపు, లింగ్-ప్లస్ గణనీయంగా పెద్ద 290 బిలియన్ పారామితులను కలిగి ఉంది, ఇది పెద్ద భాషా నమూనాలలో ఉంచుతుంది. సందర్భం అందించడానికి, నిపుణులు ChatGPT యొక్క GPT-4.5 సుమారు 1.8 ట్రిలియన్ పారామితులను కలిగి ఉందని అంచనా వేస్తున్నారు, అయితే DeepSeek-R1 671 బిలియన్లను కలిగి ఉంది.
మోడల్ శిక్షణలో సవాళ్లను పరిష్కరించడం
ఈ నమూనాలను అభివృద్ధి చేయడంలో యాంట్ యొక్క ప్రయాణం సవాళ్లు లేకుండా లేదు. కంపెనీ శిక్షణలోని కొన్ని రంగాలలో, ముఖ్యంగా స్థిరత్వానికి సంబంధించిన ఇబ్బందులను ఎదుర్కొంది. హార్డ్వేర్ లేదా మోడల్ నిర్మాణంలో చిన్న మార్పులు కూడా మోడళ్ల ఎర్రర్ రేటులో హెచ్చుతగ్గులతో సహా సమస్యలకు దారితీస్తాయి. ఇది అధునాతన AI మోడళ్లకు శిక్షణ ఇవ్వడంలో ఉన్న సంక్లిష్టత మరియు సున్నితత్వాన్ని నొక్కి చెబుతుంది.
ఆరోగ్య సంరక్షణలో వాస్తవ-ప్రపంచ విస్తరణ
ఆచరణాత్మక అనువర్తనాల పట్ల యాంట్ యొక్క నిబద్ధత ఆరోగ్య సంరక్షణ-కేంద్రీకృత పెద్ద మోడల్ యంత్రాల విస్తరణ ద్వారా మరింత ప్రదర్శించబడుతుంది. ఈ యంత్రాలు ప్రస్తుతం బీజింగ్ మరియు షాంఘై వంటి ప్రధాన నగరాల్లో ఏడు ఆసుపత్రులు మరియు ఆరోగ్య సంరక్షణ ప్రదాతలచే ఉపయోగించబడుతున్నాయి. పెద్ద మోడల్ వైద్య కన్సల్టెన్సీ సేవలను అందించడానికి DeepSeek R1, అలీబాబా యొక్క Qwen మరియు యాంట్ యొక్క స్వంత LLMని ఉపయోగిస్తుంది.
మెరుగైన ఆరోగ్య సంరక్షణ సేవల కోసం AI ఏజెంట్లు
పెద్ద మోడల్ యంత్రాలతో పాటు, యాంట్ ఏంజెల్ మరియు యిబావోర్ అనే రెండు వైద్య AI ఏజెంట్లను పరిచయం చేసింది. ఏంజెల్ ఇప్పటికే 1,000 కంటే ఎక్కువ వైద్య సౌకర్యాలకు సేవలు అందించింది, అయితే యిబావోర్ వైద్య బీమా సేవలకు మద్దతును అందిస్తుంది. ఇంకా, మునుపటి సంవత్సరం సెప్టెంబర్లో, యాంట్ తన Alipay చెల్లింపుల యాప్లో AI హెల్త్కేర్ మేనేజర్ సేవను ప్రారంభించింది, ఆరోగ్య సంరక్షణ రంగంలో తన పరిధిని మరింత విస్తరించింది. ఈ కార్యక్రమాలు ఆరోగ్య సంరక్షణ డెలివరీని మార్చడానికి మరియు మెరుగుపరచడానికి AIని ఉపయోగించుకోవడానికి యాంట్ యొక్క అంకితభావాన్ని ప్రదర్శిస్తాయి.