చైనీస్ చిప్‌లతో AIని ఆంట్ గ్రూప్ అభివృద్ధి చేసింది

AI మోడల్ శిక్షణలో యాంట్ యొక్క వినూత్న విధానం

జాక్ మా మద్దతు ఉన్న ఫిన్‌టెక్ దిగ్గజం యాంట్ గ్రూప్, చైనీస్-నిర్మిత సెమీకండక్టర్‌లను ఉపయోగించడం ద్వారా ఆర్టిఫిషియల్ ఇంటెలిజెన్స్‌లో గణనీయమైన పురోగతిని సాధించింది. ఈ వినూత్న విధానం AI మోడల్‌లకు శిక్షణ ఇచ్చే సాంకేతికతలను అభివృద్ధి చేయడానికి కంపెనీకి వీలు కల్పించింది, ఫలితంగా ఖర్చులు 20% తగ్గాయి. ఈ విషయంతో పరిచయం ఉన్న వర్గాలు తెలిపిన ప్రకారం, యాంట్ తన అనుబంధ సంస్థ అలీబాబా గ్రూప్ హోల్డింగ్ లిమిటెడ్ మరియు హువావే టెక్నాలజీస్ కో. నుండి వచ్చిన వాటితో సహా దేశీయ చిప్‌లను ఉపయోగించి మిక్స్‌చర్ ఆఫ్ ఎక్స్‌పర్ట్స్ (MoE) మెషిన్ లెర్నింగ్ విధానాన్ని ఉపయోగించి మోడళ్లకు శిక్షణ ఇచ్చింది.

యాంట్ సాధించిన ఫలితాలు Nvidia Corp. యొక్క చిప్‌లను ఉపయోగించి పొందిన వాటితో పోల్చదగినవి, ఉదాహరణకు H800, ఇది U.S. ద్వారా చైనాకు ఎగుమతి చేయకుండా నిరోధించబడిన శక్తివంతమైన ప్రాసెసర్. యాంట్ AI అభివృద్ధి కోసం Nvidiaని ఉపయోగించడం కొనసాగిస్తున్నప్పటికీ, ఇది అధునాతన మైక్రో డివైజెస్ ఇంక్. (AMD) మరియు చైనీస్ చిప్‌లతో సహా ప్రత్యామ్నాయాలపై ఎక్కువగా ఆధారపడుతోంది.

AI రేసులోకి ప్రవేశం: చైనా vs. U.S.

AI మోడల్ అభివృద్ధిలో యాంట్ యొక్క ప్రవేశం చైనీస్ మరియు U.S. కంపెనీల మధ్య తీవ్రమైన పోటీ మధ్యలో ఉంచుతుంది. OpenAI మరియు Alphabet Inc. యొక్క Google వంటి పరిశ్రమ దిగ్గజాలు బిలియన్ల పెట్టుబడి పెట్టిన వ్యయంలో కొంత భాగానికి అత్యంత సామర్థ్యం గల మోడళ్లకు శిక్షణ ఇచ్చే సామర్థ్యాన్ని డీప్‌సీక్ ప్రదర్శించినప్పటి నుండి ఈ రేసు తీవ్రమైంది. అత్యంత అధునాతన Nvidia సెమీకండక్టర్‌లకు స్థానికంగా లభించే ప్రత్యామ్నాయాలను ఉపయోగించుకోవాలనే చైనీస్ కంపెనీల సంకల్పాన్ని యాంట్ సాధించిన విజయం నొక్కి చెబుతుంది.

ఖర్చు-సమర్థవంతమైన AI అనుమితి యొక్క వాగ్దానం

యాంట్ ఈ నెలలో ప్రచురించిన పరిశోధనా పత్రం దాని నమూనాల సామర్థ్యాన్ని హైలైట్ చేస్తుంది, Meta Platforms Inc.తో పోలిస్తే కొన్ని బెంచ్‌మార్క్‌లలో అత్యుత్తమ పనితీరును క్లెయిమ్ చేస్తుంది, అయినప్పటికీ ఈ క్లెయిమ్‌లు బ్లూమ్‌బెర్గ్ న్యూస్ ద్వారా స్వతంత్రంగా ధృవీకరించబడలేదు. ఏదేమైనప్పటికీ, యాంట్ యొక్క ప్లాట్‌ఫారమ్‌లు ప్రచారం చేసిన విధంగా పని చేస్తే, అవి చైనీస్ ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ అభివృద్ధిలో గణనీయమైన పురోగతిని సూచిస్తాయి. AI సేవలకు మద్దతు ఇచ్చే ప్రక్రియ అయిన అనుమితి ఖర్చును గణనీయంగా తగ్గించగల సామర్థ్యం దీనికి ప్రధాన కారణం.

మిక్స్‌చర్ ఆఫ్ ఎక్స్‌పర్ట్స్: AIలో గేమ్-ఛేంజర్

కంపెనీలు AIలో గణనీయమైన వనరులను కుమ్మరిస్తున్నందున, MoE మోడల్‌లు జనాదరణ పొందిన మరియు సమర్థవంతమైన విధానంగా ప్రాముఖ్యతను సంతరించుకున్నాయి. గూగుల్ మరియు హాంగ్‌జౌ ఆధారిత స్టార్టప్ డీప్‌సీక్ వంటి కంపెనీలు ఉపయోగించే ఈ సాంకేతికత, పనులను చిన్న డేటా సెట్‌లుగా విభజించడాన్ని కలిగి ఉంటుంది. ఇది నిపుణుల బృందాన్ని కలిగి ఉండటానికి సమానంగా ఉంటుంది, ప్రతి ఒక్కరూ ఒక నిర్దిష్ట విభాగంపై దృష్టి పెడతారు, తద్వారా మొత్తం ప్రక్రియను ఆప్టిమైజ్ చేస్తుంది.

GPU బాటిల్‌నెక్‌ను అధిగమించడం

సాంప్రదాయకంగా, MoE మోడల్‌ల శిక్షణ Nvidia తయారు చేసిన గ్రాఫిక్స్ ప్రాసెసింగ్ యూనిట్‌లు (GPUలు) వంటి అధిక-పనితీరు గల చిప్‌లపై ఎక్కువగా ఆధారపడి ఉంటుంది. ఈ చిప్‌ల యొక్క నిషేధిత ధర చాలా చిన్న సంస్థలకు ఒక ప్రధాన అవరోధంగా ఉంది, ఇది MoE మోడల్‌లను విస్తృతంగా స్వీకరించడాన్ని పరిమితం చేస్తుంది. ఏదేమైనా, యాంట్ పెద్ద భాషా నమూనాలను (LLMలు) మరింత సమర్థవంతంగా శిక్షణ ఇచ్చే పద్ధతులపై శ్రద్ధగా పని చేస్తోంది, ఈ పరిమితిని సమర్థవంతంగా తొలగిస్తుంది. “ప్రీమియం GPUలు లేకుండా” ఒక నమూనాను స్కేల్ చేయడానికి లక్ష్యాన్ని నిర్దేశించే వారి పరిశోధనా పత్రం యొక్క శీర్షిక ఈ లక్ష్యాన్ని స్పష్టంగా ప్రతిబింబిస్తుంది.

Nvidia యొక్క ఆధిపత్యాన్ని సవాలు చేయడం

యాంట్ యొక్క విధానం Nvidia యొక్క CEO, జెన్సెన్ హువాంగ్ సమర్థించిన ప్రబలమైన వ్యూహాన్ని నేరుగా సవాలు చేస్తుంది. డీప్‌సీక్ యొక్క R1 వంటి మరింత సమర్థవంతమైన నమూనాల ఆవిర్భావంతో కూడా గణన డిమాండ్ పెరుగుతూనే ఉంటుందని హువాంగ్ నిరంతరం వాదించారు. ఖర్చులను తగ్గించడానికి చౌకైన వాటి కంటే అధిక ఆదాయాన్ని ఆర్జించడానికి కంపెనీలకు మెరుగైన చిప్‌లు అవసరమని ఆయన అభిప్రాయపడ్డారు. పర్యవసానంగా, Nvidia మెరుగైన ప్రాసెసింగ్ కోర్లు, ట్రాన్సిస్టర్‌లు మరియు పెరిగిన మెమరీ సామర్థ్యంతో పెద్ద GPUలను నిర్మించడంపై దృష్టి సారించింది.

ఖర్చు పొదుపులను లెక్కించడం

యాంట్ తన ఆప్టిమైజ్ చేసిన విధానం యొక్క ఖర్చు-ప్రభావాన్ని ప్రదర్శించడానికి ఖచ్చితమైన గణాంకాలను అందించింది. అధిక-పనితీరు గల హార్డ్‌వేర్‌ను ఉపయోగించి 1 ట్రిలియన్ టోకెన్‌లకు శిక్షణ ఇవ్వడానికి సుమారు 6.35 మిలియన్ యువాన్లు ($880,000) ఖర్చవుతుందని కంపెనీ పేర్కొంది. ఏదేమైనా, తక్కువ-స్పెసిఫికేషన్ హార్డ్‌వేర్ మరియు దాని ఆప్టిమైజ్ చేసిన సాంకేతికతలను ఉపయోగించడం ద్వారా, యాంట్ ఈ ఖర్చును 5.1 మిలియన్ యువాన్‌లకు తగ్గించగలదు. టోకెన్‌లు ప్రపంచం గురించి తెలుసుకోవడానికి మరియు వినియోగదారు ప్రశ్నలకు సంబంధిత ప్రతిస్పందనలను అందించడానికి ఒక మోడల్ ప్రాసెస్ చేసే సమాచార యూనిట్లను సూచిస్తాయి.

పారిశ్రామిక పరిష్కారాల కోసం AI పురోగతులను ఉపయోగించడం

ఆరోగ్య సంరక్షణ మరియు ఫైనాన్స్ వంటి రంగాల కోసం పారిశ్రామిక AI పరిష్కారాలను అభివృద్ధి చేయడానికి, ప్రత్యేకంగా లింగ్-ప్లస్ మరియు లింగ్-లైట్ అనే పెద్ద భాషా నమూనాలలో తన ఇటీవలి పురోగతులను ఉపయోగించుకోవాలని యాంట్ యోచిస్తోంది. ఈ నమూనాలు నిర్దిష్ట పరిశ్రమ అవసరాలను పరిష్కరించడానికి మరియు తగిన పరిష్కారాలను అందించడానికి రూపొందించబడ్డాయి.

ఆరోగ్య సంరక్షణలో AI అప్లికేషన్‌లను విస్తరించడం

చైనీస్ ఆన్‌లైన్ ప్లాట్‌ఫారమ్ Haodf.comని తన ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ సేవల్లోకి చేర్చడంలో యాంట్ యొక్క ఆరోగ్య సంరక్షణ పట్ల నిబద్ధత స్పష్టంగా కనిపిస్తుంది. AI డాక్టర్ అసిస్టెంట్‌ను సృష్టించడం ద్వారా, వైద్య రికార్డు నిర్వహణ వంటి పనులతో సహాయం చేయడం ద్వారా 290,000 మంది వైద్యుల యొక్క విస్తృతమైన నెట్‌వర్క్‌కు మద్దతు ఇవ్వాలని యాంట్ లక్ష్యంగా పెట్టుకుంది. AI యొక్క ఈ అప్లికేషన్ ఆరోగ్య సంరక్షణ డెలివరీలో సామర్థ్యం మరియు ఖచ్చితత్వాన్ని గణనీయంగా మెరుగుపరిచే సామర్థ్యాన్ని కలిగి ఉంది.

రోజువారీ జీవితానికి AI-ఆధారిత సహాయం

ఆరోగ్య సంరక్షణకు మించి, యాంట్ Zhixiaobao అనే AI ‘లైఫ్ అసిస్టెంట్’ యాప్‌ను మరియు Maxiaocai అనే ఆర్థిక సలహా AI సేవను కూడా అభివృద్ధి చేసింది. ఈ అప్లికేషన్‌లు వినియోగదారులకు వ్యక్తిగతీకరించిన మరియు తెలివైన సహాయాన్ని అందిస్తూ, రోజువారీ జీవితంలోని వివిధ అంశాలలో AIని సమగ్రపరచాలనే యాంట్ యొక్క ఆశయాన్ని ప్రదర్శిస్తాయి.

బెంచ్‌మార్కింగ్ పనితీరు: లింగ్ మోడల్స్ vs. పోటీదారులు

తన పరిశోధనా పత్రంలో, ఇంగ్లీష్-భాషా అవగాహన కోసం కీలకమైన బెంచ్‌మార్క్‌లో లింగ్-లైట్ మోడల్ Meta యొక్క Llama మోడల్‌లలో ఒకదానిని అధిగమించిందని యాంట్ పేర్కొంది. ఇంకా, లింగ్-లైట్ మరియు లింగ్-ప్లస్ మోడల్‌లు రెండూ చైనీస్-భాషా బెంచ్‌మార్క్‌లపై డీప్‌సీక్ యొక్క సమానమైన వాటితో పోలిస్తే అత్యుత్తమ పనితీరును ప్రదర్శించాయి. ఇది AI ల్యాండ్‌స్కేప్‌లో యాంట్ యొక్క పోటీ స్థానాన్ని హైలైట్ చేస్తుంది.

బీజింగ్ ఆధారిత AI సొల్యూషన్ ప్రొవైడర్ షెంగ్‌షాంగ్ టెక్ కో. యొక్క చీఫ్ టెక్నాలజీ ఆఫీసర్ రాబిన్ యు సరిగ్గా చెప్పినట్లుగా, “ప్రపంచంలోని అత్యుత్తమ కుంగ్ ఫూ మాస్టర్‌ను ఓడించడానికి మీరు ఒక పాయింట్ ఆఫ్ అటాక్‌ను కనుగొంటే, మీరు ఇప్పటికీ వారిని ఓడించారని చెప్పవచ్చు, అందుకే వాస్తవ-ప్రపంచ అప్లికేషన్ ముఖ్యం.”

సహకారం మరియు ఆవిష్కరణ కోసం ఓపెన్ సోర్సింగ్

యాంట్ లింగ్ మోడల్‌లను ఓపెన్ సోర్స్ చేసింది, AI కమ్యూనిటీలో సహకారం మరియు ఆవిష్కరణలను ప్రోత్సహిస్తుంది. లింగ్-లైట్‌లో 16.8 బిలియన్ పారామితులు ఉన్నాయి, ఇవి మోడల్ పనితీరును నియంత్రించే సర్దుబాటు సెట్టింగ్‌లు. మరోవైపు, లింగ్-ప్లస్ గణనీయంగా పెద్ద 290 బిలియన్ పారామితులను కలిగి ఉంది, ఇది పెద్ద భాషా నమూనాలలో ఉంచుతుంది. సందర్భం అందించడానికి, నిపుణులు ChatGPT యొక్క GPT-4.5 సుమారు 1.8 ట్రిలియన్ పారామితులను కలిగి ఉందని అంచనా వేస్తున్నారు, అయితే DeepSeek-R1 671 బిలియన్లను కలిగి ఉంది.

మోడల్ శిక్షణలో సవాళ్లను పరిష్కరించడం

ఈ నమూనాలను అభివృద్ధి చేయడంలో యాంట్ యొక్క ప్రయాణం సవాళ్లు లేకుండా లేదు. కంపెనీ శిక్షణలోని కొన్ని రంగాలలో, ముఖ్యంగా స్థిరత్వానికి సంబంధించిన ఇబ్బందులను ఎదుర్కొంది. హార్డ్‌వేర్ లేదా మోడల్ నిర్మాణంలో చిన్న మార్పులు కూడా మోడళ్ల ఎర్రర్ రేటులో హెచ్చుతగ్గులతో సహా సమస్యలకు దారితీస్తాయి. ఇది అధునాతన AI మోడళ్లకు శిక్షణ ఇవ్వడంలో ఉన్న సంక్లిష్టత మరియు సున్నితత్వాన్ని నొక్కి చెబుతుంది.

ఆరోగ్య సంరక్షణలో వాస్తవ-ప్రపంచ విస్తరణ

ఆచరణాత్మక అనువర్తనాల పట్ల యాంట్ యొక్క నిబద్ధత ఆరోగ్య సంరక్షణ-కేంద్రీకృత పెద్ద మోడల్ యంత్రాల విస్తరణ ద్వారా మరింత ప్రదర్శించబడుతుంది. ఈ యంత్రాలు ప్రస్తుతం బీజింగ్ మరియు షాంఘై వంటి ప్రధాన నగరాల్లో ఏడు ఆసుపత్రులు మరియు ఆరోగ్య సంరక్షణ ప్రదాతలచే ఉపయోగించబడుతున్నాయి. పెద్ద మోడల్ వైద్య కన్సల్టెన్సీ సేవలను అందించడానికి DeepSeek R1, అలీబాబా యొక్క Qwen మరియు యాంట్ యొక్క స్వంత LLMని ఉపయోగిస్తుంది.

మెరుగైన ఆరోగ్య సంరక్షణ సేవల కోసం AI ఏజెంట్లు

పెద్ద మోడల్ యంత్రాలతో పాటు, యాంట్ ఏంజెల్ మరియు యిబావోర్ అనే రెండు వైద్య AI ఏజెంట్లను పరిచయం చేసింది. ఏంజెల్ ఇప్పటికే 1,000 కంటే ఎక్కువ వైద్య సౌకర్యాలకు సేవలు అందించింది, అయితే యిబావోర్ వైద్య బీమా సేవలకు మద్దతును అందిస్తుంది. ఇంకా, మునుపటి సంవత్సరం సెప్టెంబర్‌లో, యాంట్ తన Alipay చెల్లింపుల యాప్‌లో AI హెల్త్‌కేర్ మేనేజర్ సేవను ప్రారంభించింది, ఆరోగ్య సంరక్షణ రంగంలో తన పరిధిని మరింత విస్తరించింది. ఈ కార్యక్రమాలు ఆరోగ్య సంరక్షణ డెలివరీని మార్చడానికి మరియు మెరుగుపరచడానికి AIని ఉపయోగించుకోవడానికి యాంట్ యొక్క అంకితభావాన్ని ప్రదర్శిస్తాయి.