Tag: AIGC

రోకిడ్'స్ AR గ్లాసెస్: చైనా యొక్క ఎంటర్‌ప్రైజ్ AI భవిష్యత్తు

రోకిడ్, చైనాకు చెందిన ఒక ఆగ్మెంటెడ్ రియాలిటీ (AR) పరికరాల తయారీదారు, AI-ఆధారిత గ్లాసెస్‌తో సంచలనం సృష్టిస్తోంది. ఇవి కేవలం భవిష్యత్ భావనలు మాత్రమే కాదు; AI ని ఎలా ధరించగలిగే సాంకేతికతలో, వాస్తవ-ప్రపంచ అనువర్తనాల కోసం ఏకీకృతం చేయవచ్చో చూపుతున్నాయి.

రోకిడ్'స్ AR గ్లాసెస్: చైనా యొక్క ఎంటర్‌ప్రైజ్ AI భవిష్యత్తు

సోప్రా స్టెరియా, మిస్ట్రల్ AI భాగస్వామ్యం

సోప్రా స్టెరియా మరియు మిస్ట్రల్ AI, యూరోపియన్ సంస్థల కోసం సార్వభౌమ, పారిశ్రామిక ఉత్పాదక AI పరిష్కారాలను అందించడానికి దళాలను ఏకం చేశాయి. ఇది అనుకూలమైన AI అనుసంధానం.

సోప్రా స్టెరియా, మిస్ట్రల్ AI భాగస్వామ్యం

మూన్షాట్ AI యొక్క మ్యూయాన్ మూన్లైట్

మూన్‌షాట్ ఏఐ పరిశోధకులు మ్యూయాన్ మరియు మూన్‌లైట్‌లను పరిచయం చేశారు, ఇవి సమర్థవంతమైన శిక్షణా పద్ధతులతో పెద్ద-స్థాయి భాషా నమూనాలను ఆప్టిమైజ్ చేస్తాయి.

మూన్షాట్ AI యొక్క మ్యూయాన్ మూన్లైట్

కిమీ ఓపెన్ సోర్స్ మూన్‌లైట్

మూన్‌షాట్ AI యొక్క కిమీ 'మూన్‌లైట్' అనే ఒక హైబ్రిడ్ ఎక్స్‌పర్ట్ మోడల్‌ను పరిచయం చేసింది ఇది 30 బిలియన్ మరియు 160 బిలియన్ పారామితులను కలిగి ఉంది మ్యూయాన్ ఆర్కిటెక్చర్‌పై శిక్షణ పొందిన ఈ మోడల్ 57 ట్రిలియన్ టోకెన్‌లను ఉపయోగించుకుంటుంది

కిమీ ఓపెన్ సోర్స్ మూన్‌లైట్

బైచువాన్-M1 వైద్య భాషా నమూనాలు

బైచువాన్-M1 అనేది 20T టోకెన్‌లపై శిక్షణ పొందిన ఒక కొత్త తరం పెద్ద భాషా నమూనాల శ్రేణి, ఇది వైద్య సామర్థ్యాలను మెరుగుపరచడంపై ప్రత్యేక దృష్టి పెడుతుంది.

బైచువాన్-M1 వైద్య భాషా నమూనాలు

AI మోడల్స్ ప్రపంచ చరిత్రలో కచ్చితత్వంతో పోరాడుతున్నాయి - అధ్యయనం

కృత్రిమ మేధస్సు ప్రపంచ చరిత్రను అర్థం చేసుకోవడంలో బలహీనంగా ఉందని ఒక అధ్యయనం వెల్లడించింది. OpenAI యొక్క GPT-4, Meta యొక్క Llama, మరియు Google యొక్క Gemini వంటి అధునాతన నమూనాలు కూడా చారిత్రక ప్రశ్నలకు సరిగ్గా సమాధానం చెప్పలేకపోతున్నాయి. ఈ నమూనాలు చారిత్రక సందర్భాన్ని అర్థం చేసుకోకుండా, డేటా నుండి సాధారణీకరించే ధోరణిని కలిగి ఉన్నాయి. ఇది విద్యా, మీడియా, సాంస్కృతిక వారసత్వం, వ్యాపారం, శాస్త్రం మరియు రాజకీయ రంగాలలో తప్పు సమాచారాన్ని వ్యాప్తి చేయడానికి దారితీస్తుంది. AI నమూనాలు మరింత కచ్చితమైన మరియు సమగ్రమైన చారిత్రక జ్ఞానాన్ని కలిగి ఉండటం చాలా అవసరం.

AI మోడల్స్ ప్రపంచ చరిత్రలో కచ్చితత్వంతో పోరాడుతున్నాయి - అధ్యయనం

డిఫ్యూషన్ మోడల్ ఇన్ఫరెన్స్ స్కేలింగ్ కొత్త నమూనా

డిఫ్యూషన్ మోడల్స్‌లో ఇన్ఫరెన్స్ సమయాన్ని స్కేల్ చేయడంపై ఈ పరిశోధన దృష్టి పెడుతుంది, అధిక కంప్యూటేషనల్ రిసోర్స్‌లను కేటాయించడం ద్వారా నమూనాల నాణ్యతను మెరుగుపరచవచ్చని కనుగొన్నారు. ఇది శబ్దాన్ని మెరుగ్గా వెతకడం ద్వారా నమూనా దశలను పెంచకుండా NFE ని స్కేల్ చేయగలదని సూచిస్తుంది, వెరిఫైయర్‌లు మరియు అల్గారిథమ్‌లు అనే రెండు డిజైన్ యాక్సెస్‌లను ఉపయోగించి ఒక ఫ్రేమ్‌వర్క్‌ను ఏర్పాటు చేసింది. ఇది వివిధ అప్లికేషన్ల కోసం అనుకూలీకరించిన భాగాల కలయికలను అనుమతిస్తుంది మరియు చిన్న నమూనాలలో కూడా సమర్థవంతంగా స్కేల్ చేయగలదని చూపిస్తుంది.

డిఫ్యూషన్ మోడల్ ఇన్ఫరెన్స్ స్కేలింగ్ కొత్త నమూనా

తక్కువ మెమరీతో LLMల కోసం నూతన శ్రద్ధ విధానం

పెద్ద భాషా నమూనాల (LLMలు) విస్తృత వినియోగం మరియు అనుమితిలో కొత్త నమూనాల ఆవిర్భావం సమర్థవంతమైన పెద్ద-స్థాయి అనుమితి యొక్క సవాలును తెరపైకి తెచ్చాయి. సాంప్రదాయ శ్రద్ధ విధానాలలో కీ-విలువ (KV) కాష్ ఒక ముఖ్యమైన అడ్డంకి, ఇది బ్యాచ్ పరిమాణం మరియు క్రమం పొడవుతో సరళంగా విస్తరిస్తుంది, LLMల యొక్క స్కేలింగ్ మరియు విస్తరణను అడ్డుకునే 'మెమరీ హోగ్'గా మారుతుంది. మల్టీ-మాట్రిక్స్ ఫ్యాక్టరైజేషన్ అటెన్షన్ (MFA) మరియు దాని వేరియంట్ MFA-కీ-రీయూస్ (MFA-KR) వంటి కొత్త శ్రద్ధ విధానాలు ఈ సమస్యను పరిష్కరించడానికి ఉద్భవించాయి. MFA మరియు MFA-KR, MLA పనితీరును అధిగమించడమే కాకుండా, KV కాష్ వినియోగాన్ని 93.7% వరకు తగ్గించడంతోపాటు సాంప్రదాయ MHA పనితీరుతో సరిపోలుతున్నాయి. MFA అనేది సరళత, సులభంగా పునరుత్పత్తి, హైపర్‌పారామీటర్‌లకు తక్కువ సున్నితత్వం మరియు వివిధ Pos-ఎంబెడింగ్ పద్ధతులతో అనుకూలత కోసం రూపొందించబడింది. ఈ పరిశోధన బృందం శ్రద్ధ విధానాల యొక్క సాధారణ రూపకల్పన మరియు సామర్థ్యాన్ని విశ్లేషించింది, సామర్థ్యానికి సంబంధించిన రెండు క్లిష్టమైన కోణాలను గుర్తించింది. ఈ విశ్లేషణ కొత్త విశ్లేషణాత్మక పద్ధతులు మరియు రూపకల్పన సూత్రాల అభివృద్ధికి దారితీసింది. వారు వివిధ MHA వేరియంట్‌లను అర్థం చేసుకోవడానికి ఏకీకృత చట్రంగా జనరలైజ్డ్ మల్టీ-హెడ్ అటెన్షన్ (GMHA) అనే భావనను ప్రవేశపెట్టారు. అంతేకాకుండా, వారు అనుమితి దృక్కోణం నుండి కీ-విలువలను లెక్కించడం మరియు నిల్వ చేయడాన్ని అన్వేషించారు మరియు నమూనా సామర్థ్యాన్ని విచ్ఛిన్నం దృక్కోణం నుండి పరిశీలించారు. మల్టీ-క్వెరీ అటెన్షన్ (MQA) మరియు మల్టీ-హెడ్ లాటెంట్ అటెన్షన్ (MLA) వంటి రెండు ప్రాతినిధ్య మెరుగుదల పథకాలపై విశ్లేషణ దృష్టి సారించింది. MFA యొక్క అభివృద్ధి వనరుల వినియోగాన్ని తగ్గించేటప్పుడు సైద్ధాంతిక పనితీరు పరిమితులను చేరుకునే శ్రద్ధ విధానాన్ని సృష్టించే లక్ష్యంతో నడపబడింది. MFA రూపకల్పనలో మూడు ముఖ్యమైన ఆవిష్కరణలు ఉన్నాయి: నమూనా సామర్థ్యాన్ని పెంచడానికి శ్రద్ధా శీర్షికల సంఖ్య మరియు పరిమాణాన్ని గణనీయంగా పెంచడం, శ్రద్ధా శీర్షికల సంఖ్య మరియు కొలతలు విస్తరిస్తూ పరామితి సామర్థ్యాన్ని కొనసాగించడానికి దూకుడు తక్కువ-ర్యాంక్ విచ్ఛిన్నం వ్యూహాన్ని ఉపయోగించడం మరియు పెరిగిన నమూనా సంక్లిష్టతతో కూడా మెమరీ వినియోగాన్ని కనిష్టంగా ఉంచడానికి ఒకే కీ-విలువ శీర్షిక రూపకల్పనను ఉపయోగించడం. MFA, MQA కంటే ఎక్కువ SLSD మరియు TERని సాధిస్తుంది. MLAతో పోలిస్తే, MFA సమాన పరామితి బడ్జెట్‌లతో చిన్న KV కాష్ పరిమాణం మరియు అధిక TERని సాధిస్తుంది, అయితే పోల్చదగిన SLSDని నిర్వహిస్తుంది. సాంప్రదాయ MHAతో పోలిస్తే, MFA యొక్క SLSD చిన్నదిగా ఉన్నప్పటికీ, అధిక TERని కలిగి ఉంది. విస్తృతమైన ప్రయోగాలు కొత్త నిర్మాణ పనితీరును పెద్ద స్థాయిలో అంచనా వేయడానికి నిర్వహించబడ్డాయి, 1B నుండి 7B పరామితుల వరకు మరియు 10B నుండి 1T వరకు శిక్షణా డేటాను పరీక్షించాయి. MFA సాంప్రదాయ MHAతో పోల్చదగిన స్కేలింగ్ సామర్థ్యాలను ప్రదర్శించింది, పెద్ద స్థాయిలలో కూడా అద్భుతమైన పనితీరును కొనసాగించింది. MFA మరియు MFA-KR యొక్క మెమరీ-పొదుపు ప్రయోజనాలు నమూనా పరిమాణంతో విస్తరిస్తూనే ఉన్నాయి, MFA 87.5% మెమరీ పొదుపును సాధించింది మరియు MFA-KR అతిపెద్ద స్థాయిలో 6.25%కి మెమరీ వినియోగాన్ని తగ్గించింది. MFA అనేది సరళమైన రూపకల్పనతో గణనీయమైన మెరుగుదలలను అందిస్తుంది, అదనపు ఇంజనీరింగ్ సంక్లిష్టతను జోడించకుండా LLM అనుమితిలో మెమరీ అడ్డంకిని సమర్థవంతంగా పరిష్కరిస్తుంది. ఇది ఇప్పటికే ఉన్న ట్రాన్స్‌ఫార్మర్ పర్యావరణ వ్యవస్థలోకి సజావుగా కలిసిపోతుంది, వివిధ దృశ్యాలలో LLMల అనువర్తనాన్ని వేగవంతం చేస్తుంది.

తక్కువ మెమరీతో LLMల కోసం నూతన శ్రద్ధ విధానం

ఎవల్యూషనరీస్కేల్ యొక్క ESM3 ప్రోటీన్ పరిశోధనలో ఒక ముందడుగు

ఎవల్యూషనరీస్కేల్ యొక్క ESM3, 98 బిలియన్ పారామీటర్‌లతో కూడిన ఒక వినూత్న జీవ నమూనా, ప్రోటీన్లను అర్థం చేసుకునే మరియు మార్చే విధానంలో ఒక ముఖ్యమైన పురోగతిని సూచిస్తుంది. ఇది ప్రోటీన్ల త్రీ-డైమెన్షనల్ నిర్మాణాన్ని మరియు పనితీరును వివిక్త అక్షరమాలలోకి మారుస్తుంది, సంక్లిష్ట ప్రాంప్ట్‌లకు ప్రతిస్పందిస్తుంది మరియు కొత్త ప్రోటీన్లను ఉత్పత్తి చేస్తుంది. ESM3 యొక్క ఉచిత API అందుబాటులోకి రావడం, ప్రపంచవ్యాప్తంగా శాస్త్రవేత్తలకు ప్రోటీన్ అంచనాను వేగవంతం చేస్తుంది. ట్యూరింగ్ అవార్డు గ్రహీత యాన్ లెకన్ దీనిని 'చాలా కూల్' అని ప్రశంసించారు. ESM3 యొక్క గణన శక్తి మరియు కోర్ సామర్థ్యాలు, బహుళ విధాన విధానం మరియు ముసుగు భాషా నమూనా ద్వారా నవల ప్రోటీన్లను ఉత్పత్తి చేయడంలో సహాయపడతాయి. ESM3 500 మిలియన్ సంవత్సరాల సహజ పరిణామాన్ని అనుకరించగలదు, ఇది వైద్య రంగంలో ఒక ముఖ్యమైన పురోగతి.

ఎవల్యూషనరీస్కేల్ యొక్క ESM3 ప్రోటీన్ పరిశోధనలో ఒక ముందడుగు