Tag: LLM

कृत्रिम बुद्धिमत्ता या जेनरेटिव एआई में प्रवेश करने के लिए 20 टिप्स

यह लेख फोर्ब्स बिजनेस काउंसिल के 20 सदस्यों की अंतर्दृष्टि पर आधारित है, जो कृत्रिम बुद्धिमत्ता (AI) या जेनरेटिव AI के क्षेत्र में प्रवेश करने के इच्छुक पेशेवरों के लिए उपयोगी सुझाव प्रदान करता है। इसमें छोटे से शुरुआत करने, बुनियादी अवधारणाओं को समझने, तकनीकी और सॉफ्ट कौशल विकसित करने, और नैतिक विचारों को ध्यान में रखने जैसे महत्वपूर्ण पहलुओं पर जोर दिया गया है। यह लेख AI के तेजी से विकसित हो रहे क्षेत्र में सफल होने के लिए एक बहुआयामी दृष्टिकोण प्रदान करता है।

कृत्रिम बुद्धिमत्ता या जेनरेटिव एआई में प्रवेश करने के लिए 20 टिप्स

चीन में AI चैटबॉट बाजार में बाइटडांस का दबदबा, अलीबाबा और बैदु को पछाड़ा

चीन में आर्टिफिशियल इंटेलिजेंस चैटबॉट का परिदृश्य एक महत्वपूर्ण परिवर्तन से गुजर रहा है, जिसमें बाइटडांस का Doubao एक प्रमुख शक्ति के रूप में उभर रहा है, जो अलीबाबा और बैदु जैसे स्थापित खिलाड़ियों को ग्रहण कर रहा है। यह बदलाव चीनी तकनीकी बाजार की गतिशील प्रकृति को रेखांकित करता है, जहां तेजी से नवाचार और उपयोगकर्ता-केंद्रित दृष्टिकोण सफलता की कुंजी हैं। यह लेख Doubao के उदय, इसके प्रतिस्पर्धियों के सामने आने वाली चुनौतियों और चीन में AI के भविष्य के लिए व्यापक निहितार्थों पर प्रकाश डालता है।

चीन में AI चैटबॉट बाजार में बाइटडांस का दबदबा, अलीबाबा और बैदु को पछाड़ा

मूनशॉट AI का Kimi k1.5 मॉडल: OpenAI के o1 को टक्कर

मूनशॉट AI ने Kimi k1.5 मल्टीमॉडल मॉडल पेश किया, जो OpenAI के o1 के बराबर प्रदर्शन करता है। यह गणित, कोडिंग और मल्टीमॉडल तर्क में उत्कृष्ट है, और GPT-4o और Claude 3.5 Sonnet को भी मात देता है। यह AI में एक महत्वपूर्ण प्रगति है।

मूनशॉट AI का Kimi k1.5 मॉडल: OpenAI के o1 को टक्कर

OpenAI का रियल-टाइम AI एजेंट 20 मिनट में तैयार

यह लेख आर्टिफिशियल इंटेलिजेंस जेनरेटेड कंटेंट (AIGC) के क्षेत्र में एक महत्वपूर्ण प्रगति पर प्रकाश डालता है: OpenAI द्वारा एक रियल-टाइम AI एजेंट का रिलीज, जिसे केवल 20 मिनट में विकसित किया जा सकता है। यह सफलता AI-संचालित अनुप्रयोगों के क्षेत्र में उच्च-दक्षता विकास की क्षमता को दर्शाती है।

OpenAI का रियल-टाइम AI एजेंट 20 मिनट में तैयार

बड़े भाषा मॉडल में मेमोरी प्रबंधन के लिए एक नया ध्यान तंत्र

बड़े भाषा मॉडल (LLM) में कुशल अनुमान एक महत्वपूर्ण चुनौती है। पारंपरिक ध्यान तंत्र में Key-Value (KV) कैश एक मेमोरी बाधा है। मल्टी-मैट्रिक्स फैक्टराइजेशन अटेंशन (MFA) और MFA-Key-Reuse (MFA-KR) जैसे नए तंत्र मेमोरी के उपयोग को कम करते हैं और प्रदर्शन को बढ़ाते हैं। MFA पारंपरिक MHA के प्रदर्शन से मेल खाता है और KV कैश उपयोग को 93.7% तक कम करता है। यह डिजाइन में सरल, पुनरुत्पादन में आसान और विभिन्न पॉस-एम्बेडिंग विधियों के साथ संगत है। MFA के विश्लेषण में टोटल इफेक्टिव रैंक (TER) और शेयर्ड लेटेंट सबस्पेस डायमेंशन (SLSD) जैसे नए मैट्रिक्स शामिल हैं। MFA, MQA और MLA की तुलना में बेहतर प्रदर्शन करता है, और यह LLM अनुप्रयोगों को गति देने में मदद करता है।

बड़े भाषा मॉडल में मेमोरी प्रबंधन के लिए एक नया ध्यान तंत्र

प्रोटीन अनुसंधान में विकासवादी पैमाने का ESM3 एक बड़ी छलांग

इवोल्यूशनरीस्केल का ESM3 एक अभूतपूर्व जैविक मॉडल है, जिसमें 98 बिलियन पैरामीटर हैं, जो इसे विश्व स्तर पर अपनी तरह का सबसे बड़ा मॉडल बनाता है। यह मॉडल प्रोटीन को समझने और हेरफेर करने के तरीके में एक महत्वपूर्ण उन्नति का प्रतिनिधित्व करता है। ESM3 3D संरचना और प्रोटीन के कार्य को एक अलग वर्णमाला में बदल देता है, जिससे प्रत्येक 3D संरचना को अक्षरों के अनुक्रम के रूप में दर्शाया जा सकता है। यह मॉडल एक साथ प्रोटीन के अनुक्रम, संरचना और कार्य को संसाधित कर सकता है, और नए प्रोटीन उत्पन्न करने के लिए जटिल संकेतों का जवाब दे सकता है। ESM3 की विकास का अनुकरण करने की क्षमता प्राकृतिक विकास के 5 ट्रिलियन वर्षों के बराबर है। हाल ही में, इवोल्यूशनरीस्केल ने ESM3 API को मुफ्त में उपलब्ध कराया है, जिसका उद्देश्य दुनिया भर के वैज्ञानिकों के लिए प्रोटीन की भविष्यवाणी में तेजी लाना है। इस कदम का स्वागत ट्यूरिंग पुरस्कार विजेता और मेटा के मुख्य वैज्ञानिक यान लेकन ने किया, जिन्होंने इवोल्यूशनरीस्केल की उपलब्धि को 'बहुत अच्छी बात' बताया। ESM3 एक मॉडल से कहीं अधिक है; यह परमाणु स्तर पर प्रोटीन को समझने और उत्पन्न करने में एक सफलता है, जिसका चिकित्सा क्षेत्र पर गहरा प्रभाव पड़ने का वादा है।

प्रोटीन अनुसंधान में विकासवादी पैमाने का ESM3 एक बड़ी छलांग

माइक्रोसॉफ्ट का मटेरियल डिज़ाइन में AI मॉडल 10 गुना बेहतर

माइक्रोसॉफ्ट ने MatterGen का अनावरण किया, एक अभूतपूर्व बड़ा भाषा मॉडल जो विशेष रूप से अकार्बनिक सामग्रियों के निर्माण के लिए डिज़ाइन किया गया है। यह मॉडल, एक डिफ्यूजन मॉडल आर्किटेक्चर पर निर्मित, परमाणु प्रकारों, निर्देशांकों और आवधिक जाली को प्रगतिशील रूप से अनुकूलित करने में सक्षम है। इससे विविध नई अकार्बनिक सामग्रियों का तेजी से उत्पादन संभव है। ऊर्जा क्षेत्र में इसकी क्षमता का एक प्रमुख उदाहरण है, जहां MatterGen उपन्यास लिथियम-आयन बैटरी कैथोड सामग्री उत्पन्न कर सकता है। पारंपरिक तरीकों की तुलना में, MatterGen स्थिर, अद्वितीय और उपन्यास सामग्री के अनुपात को दोगुने से अधिक बढ़ा देता है।

माइक्रोसॉफ्ट का मटेरियल डिज़ाइन में AI मॉडल 10 गुना बेहतर