GOSIM AI Paris 2025: ओपन सोर्स AI क्रांति

कृत्रिम बुद्धिमत्ता (AI) के परिदृश्य में पिछले एक साल में नाटकीय परिवर्तन हुआ है, जिसे ओपन सोर्स विकास की सहयोगात्मक भावना ने बढ़ावा दिया है। अब केवल तकनीकी दिग्गजों का क्षेत्र नहीं रहा, बड़े भाषा मॉडल (LLMs) अब सामुदायिक प्रयासों और खुले आदान-प्रदान के माध्यम से विकसित हो रहे हैं, जो बुनियादी ढांचे से लेकर एल्गोरिथ्म अनुकूलन और तैनाती तक हर चीज को प्रभावित कर रहे हैं। यह ओपन सोर्स आंदोलन AI की प्रगति को तेज कर रहा है, इसे अधिक सुलभ बना रहा है और बुद्धिमान प्रणालियों की अगली पीढ़ी में योगदान करने के अवसर का लोकतंत्रीकरण कर रहा है।

इस पृष्ठभूमि के खिलाफ, GOSIM AI Paris 2025 सम्मेलन, जिसे GOSIM, CSDN और 1ms.ai द्वारा सह-होस्ट किया गया, 6 मई को पेरिस, फ्रांस में शुरू हुआ। यह आयोजन एक महत्वपूर्ण मंच के रूप में कार्य करता है, जो वैश्विक प्रौद्योगिकी चिकित्सकों और शोधकर्ताओं को ओपन सोर्स AI में नवीनतम सफलताओं और भविष्य की दिशाओं का पता लगाने के लिए जोड़ता है।

सम्मेलन में अलीबाबा, Hugging Face, BAAI, MiniMax, Neo4j, Dify, MetaGPT, Zhipu AI, Eigent.AI, Docker, Inflow, Peking University, Fraunhofer, Oxford University और फ्रेंच openLLM समुदाय जैसे प्रमुख संगठनों के 80 से अधिक प्रौद्योगिकी विशेषज्ञों और विद्वानों की प्रभावशाली लाइनअप है। Huawei, फ्रांस में ऑल-चाइना यूथ इनोवेशन एंड एंटरप्रेन्योरशिप एसोसिएशन, चीन-फ्रांसीसी आर्टिफिशियल इंटेलिजेंस एसोसिएशन, Apache Software Foundation, Eclipse Foundation, The Khronos Group, WasmEdgeRuntime, LF Generative AI Commons, Linux Foundation Research, OpenWallet Foundation, Open Source Initiative (OSI), Software Heritage और K8SUG सहित प्रमुख भागीदार भी सक्रिय रूप से भाग ले रहे हैं। सम्मेलन में AI मॉडल, बुनियादी ढांचे, एप्लिकेशन परिनियोजन और एम्बोडिड इंटेलिजेंस जैसे मुख्य विषयों के आसपास केंद्रित 60 से अधिक तकनीकी सत्र हैं, जो ओपन सोर्स पारिस्थितिकी तंत्र के विकास और उभरते रुझानों का व्यापक दृष्टिकोण प्रदान करते हैं।

AI और ओपन सोर्स के बीच सहजीवी संबंध

GOSIM के सह-संस्थापक माइकल युआन ने "ओपन सोर्स ने पकड़ लिया है, आगे क्या है?" शीर्षक से एक मुख्य भाषण के साथ सम्मेलन की शुरुआत की। उन्होंने ओपन सोर्स AI की वर्तमान स्थिति और भविष्य के प्रक्षेपवक्र पर अपनी अंतर्दृष्टि साझा की, यह जोर देते हुए कि यह एक महत्वपूर्ण क्षण पर पहुंच गया है।

युआन ने कहा, "हमने एक बार भविष्यवाणी की थी कि ओपन सोर्स को बंद स्रोत मॉडल के साथ पकड़ने में 5-10 साल लगेंगे, लेकिन ऐसा लगता है कि यह लक्ष्य समय से पहले ही हासिल हो गया है।" उन्होंने Qwen 3 की हालिया रिलीज़ को एक उदाहरण के रूप में उद्धृत किया, यह देखते हुए कि ओपन सोर्स मॉडल अब केवल एक-दूसरे के साथ प्रतिस्पर्धा नहीं कर रहे हैं, बल्कि अब सीधे मालिकाना प्रमुख मॉडलों को चुनौती दे रहे हैं, यहां तक कि कुछ बेंचमार्क में उन्हें पार भी कर रहे हैं। युआन ने यह भी सुझाव दिया कि यह प्रगति पूरी तरह से ओपन सोर्स प्रगति के कारण नहीं है, बल्कि बंद स्रोत विकास अपेक्षाओं को पूरा करने में विफल रहा है और प्रदर्शन बाधाओं का सामना कर रहा है। इसके विपरीत, ओपन सोर्स मॉडल तेजी से विकसित हो रहे हैं, एक खड़ी प्रदर्शन वृद्धि वक्र दिखा रहे हैं और एक वास्तविक "पकड़" घटना का प्रदर्शन कर रहे हैं।

यह अवलोकन एक मौलिक प्रश्न उठाता है: हम कृत्रिम सामान्य बुद्धिमत्ता (AGI) प्राप्त करने से कितने दूर हैं? युआन का मानना है कि AGI का भविष्य एक एकल, सर्वव्यापी मॉडल में नहीं हो सकता है, बल्कि निजी हार्डवेयर या रोबोटिक उपकरणों पर तैनात विशेष मॉडल, ज्ञान आधार और उपकरणों के नेटवर्क में हो सकता है।

उन्होंने आगे बताया कि AI वास्तुकला एक केंद्रीकृत से विकेंद्रीकृत प्रतिमान में बदल रही है। उन्होंने OpenAI के Completion API से नए Responses API में संक्रमण पर प्रकाश डाला, जिसका उद्देश्य एक बड़े पैमाने पर बुद्धिमान एजेंट प्लेटफ़ॉर्म का निर्माण करना है। लगभग 600,000 उपयोगकर्ता और डेवलपर पहले ही इस परिवर्तन में शामिल हो चुके हैं, जो वितरित AI अनुप्रयोगों के विकास में योगदान कर रहे हैं।

युआन ने जोर देकर कहा, "AGI का भविष्य विशेष रूप से एक एकल, अच्छी तरह से वित्त पोषित कंपनी द्वारा विकसित नहीं किया जाना चाहिए।" "इसके बजाय, इसे वैश्विक सहयोग के माध्यम से बनाया जाना चाहिए, एक ऐसा पारिस्थितिकी तंत्र नेटवर्क बनाना चाहिए जिसमें मॉडल, ज्ञान आधार, रोबोट और निष्पादन प्रणाली शामिल हों।"

युआन के संबोधन के बाद, OpenWallet Foundation के कार्यकारी निदेशक डैनियल गोल्डस्चाइडर ने "GDC वॉलेट्स एंड क्रेडेंशियल्स" पर एक प्रस्तुति दी, जिसमें संयुक्त राष्ट्र महासभा द्वारा अपनाए गए ग्लोबल डिजिटल कॉम्पैक्ट (GDC) परियोजना पर ध्यान केंद्रित किया गया। उन्होंने समझाया कि GDC के दो मुख्य उद्देश्य हैं:

  • यह पहचानना कि डिजिटल तकनीकों ने हमारे जीवन और सामाजिक विकास को गहराई से बदल दिया है, जिससे अभूतपूर्व अवसर और अप्रत्याशित जोखिम दोनों आए हैं।
  • इस बात पर जोर देना कि सभी मानवता के लाभ के लिए डिजिटल तकनीकों की पूरी क्षमता को साकार करने के लिए वैश्विक सहयोग की आवश्यकता है, देशों, उद्योगों और यहां तक कि सार्वजनिक और निजी क्षेत्रों के बीच बाधाओं को तोड़ना।

इस साझा समझ के आधार पर, GDC ने "ग्लोबल डिजिटल सहयोग" पहल को जन्म दिया है, जिसका उद्देश्य सरकारों, व्यवसायों, गैर-लाभकारी संगठनों और अन्य हितधारकों के बीच वास्तविक सहयोग को बढ़ावा देना है।

परिचालन पहलुओं पर चर्चा करते हुए, गोल्डस्चाइडर ने जोर दिया कि यह सहयोग किसी एक संगठन द्वारा तय नहीं किया जाता है, बल्कि एक "संयुक्त रूप से बुलाने" दृष्टिकोण को अपनाता है, जो सभी इच्छुक अंतर्राष्ट्रीय संगठनों, मानक-सेटिंग निकायों, ओपन सोर्स समुदायों और अंतरसरकारी संगठनों को भाग लेने के लिए आमंत्रित करता है। उन्होंने स्पष्ट किया कि यह "कौन किसका नेतृत्व करता है" परियोजना नहीं है, बल्कि एक समान सहयोग मंच है जहां हर पार्टी की आवाज है और कोई भी दूसरे से अधिक महत्वपूर्ण नहीं है।

उन्होंने आगे बताया कि ग्लोबल डिजिटल सहयोग का उद्देश्य सीधे मानकों या तकनीकों को विकसित करना नहीं है, बल्कि विविध पृष्ठभूमि के संगठनों के बीच बातचीत को सुविधाजनक बनाना है, जिससे उन्हें एक सहमति तक पहुंचने के लिए अपने दृष्टिकोण और जरूरतों को प्रस्तुत करने की अनुमति मिलती है। इसके बाद, विशिष्ट मानकों और तकनीकी कार्य को संबंधित विशिष्ट निकायों द्वारा आगे बढ़ाया जाएगा। उन्होंने "डिजिटल पहचान" और "बायोमेट्रिक तकनीक" को उदाहरण के रूप में उद्धृत करते हुए कहा कि कई संगठन पहले से ही इन क्षेत्रों में काम कर रहे हैं, जिससे सभी को एक साथ लाने, दोहराव, संघर्षों और संसाधन बर्बादी से बचने के लिए एक तटस्थ मंच की आवश्यकता पर प्रकाश डाला गया है।

चार समर्पित मंच: ओपन सोर्स AI का व्यापक विश्लेषण

सम्मेलन में चार विशेष मंच शामिल थे: AI मॉडल, AI बुनियादी ढांचा, AI एप्लिकेशन और एम्बोडिड इंटेलिजेंस। इन मंचों ने अंतर्निहित वास्तुकला से लेकर एप्लिकेशन परिनियोजन तक और मॉडल क्षमताओं से लेकर बुद्धिमान एजेंट प्रथाओं तक महत्वपूर्ण विषयों को कवर किया। प्रत्येक मंच ने वैश्विक उद्यमों और अनुसंधान संस्थानों के प्रमुख विशेषज्ञों की मेजबानी की, जिसमें नवीनतम तकनीकी रुझानों का गहन विश्लेषण और समृद्ध इंजीनियरिंग अभ्यास मामलों का प्रदर्शन किया गया, जो कई क्षेत्रों में ओपन सोर्स AI के व्यापक एकीकरण और विकास का प्रदर्शन करते हैं।

AI बड़े मॉडलों के अंतर्निहित तर्क का विघटन

AI मॉडल मंच ने बड़े मॉडल के क्षेत्र में वास्तुशिल्प नवाचारों, ओपन सोर्स सहयोग और पारिस्थितिकी तंत्र विकास पर अंतर्दृष्टि साझा करने के लिए ओपन सोर्स समुदायों और अनुसंधान संस्थानों के विशेषज्ञों को एक साथ लाया।

Hugging Face में मशीन लर्निंग रिसर्च इंजीनियर गुइलहर्मे पेनेडो ने "Open-R1: डीपसीक-R1 का पूरी तरह से ओपन सोर्स पुनरुत्पादन" प्रस्तुत किया, जिसमें डीपसीक-R1 मॉडल को दोहराने के Open-R1 परियोजना के प्रयासों को प्रदर्शित किया गया, जिसमें अनुमान कार्यों से संबंधित डेटा की खुलापन और मानकीकरण को बढ़ावा देने पर ध्यान केंद्रित किया गया। Zhiyuan Research Institute में डेटा रिसर्च टीम के टेक्नोलॉजी लीडर गुआंग लियू ने "ओपनसीक: बड़े मॉडल की अगली पीढ़ी की ओर सहयोगात्मक नवाचार" साझा किया, जिसमें एल्गोरिथ्म, डेटा और सिस्टम स्तर पर मॉडल प्रदर्शन में सफलता प्राप्त करने में वैश्विक सहयोग के महत्व पर जोर दिया गया, जिसका लक्ष्य बड़े मॉडलों की अगली पीढ़ी को विकसित करना है जो डीपसीक को पार कर जाते हैं।

CSDN के वरिष्ठ उपाध्यक्ष जेसन ली ने "डीकोडिंग डीपसीक: तकनीकी नवाचार और AI पारिस्थितिकी तंत्र पर इसका प्रभाव" दिया, जिसमें तकनीकी प्रतिमानों, मॉडल आर्किटेक्चर और औद्योगिक पारिस्थितिकी में डीपसीक के नवाचारों का गहन विश्लेषण, साथ ही वैश्विक AI पारिस्थितिकी तंत्र पर इसके संभावित प्रभाव को प्रदान किया गया। MiniMax में वरिष्ठ अनुसंधान निदेशक यिरान झोंग ने "रेखीय भविष्य: बड़े भाषा मॉडल आर्किटेक्चर का विकास" प्रस्तुत किया, जिसमें टीम के प्रस्तावित लाइटनिंग अटेंशन तंत्र को पेश किया गया, जो दक्षता और प्रदर्शन के मामले में ट्रांसफार्मर आर्किटेक्चर के लिए एक संभावित विकल्प प्रदान करता है। ऑक्सफोर्ड विश्वविद्यालय में रॉयल सोसाइटी न्यूटन इंटरनेशनल फेलो शिवेई लियू ने "बड़े भाषा मॉडल में गहराई का अभिशाप" पर चर्चा की, जिसमें मॉडलों के गहरा होने पर गहरी तंत्रिका नेटवर्क के कम होते योगदान की खोज की गई और गहरी परत उपयोग और समग्र दक्षता को बढ़ाने के लिए प्री-एलएन तंत्र को बेहतर बनाने के लिए LayerNorm स्केलिंग के उपयोग का प्रस्ताव किया गया। Zhipu AI के रिसर्च इंजीनियर डिएगो रोजस ने "कोड बड़े भाषा मॉडल: टोकन से परे खोज" में बताया कि वर्तमान बड़े मॉडल, जबकि शक्तिशाली हैं, फिर भी टोकनाइजेशन पर निर्भर करते हैं, जो अक्षम है, और टोकनाइजेशन को छोड़ने के लिए नए तरीकों को साझा किया ताकि मॉडल तेज और मजबूत हो सकें। Fraunhofer IAIS में बेसिक मॉडल टीम के प्रमुख निकोलस फ्लोरेस-हेर ने "वैश्विक स्तर पर प्रतिस्पर्धी ‘यूरोपीय-निर्मित’ बड़े भाषा मॉडल कैसे बनाएं?" के साथ मंच का समापन किया, यह जोर देते हुए कि यूरोप बहुभाषी, ओपन सोर्स और भरोसेमंद स्थानीयकृत बड़े मॉडल परियोजनाओं के माध्यम से डेटा, विविधता और नियामक चुनौतियों को दूर कर रहा है, ताकि AI की अगली पीढ़ी का निर्माण किया जा सके जो यूरोपीय मूल्यों को दर्शाती है।

AI इंफ्रास्ट्रक्चर की त्रय: डेटा, कंप्यूटिंग पावर और एल्गोरिथम विकास

बड़े मॉडलों के लिए अधिक खुला, कुशल और समावेशी आधार बनाने पर ध्यान केंद्रित करते हुए, AI इंफ्रास्ट्रक्चर फोरम अनुसंधान संस्थानों और उद्यमों के प्रमुख विशेषज्ञों को एक साथ लाया ताकि डेटा, कंप्यूटिंग पावर और सिस्टम आर्किटेक्चर जैसे प्रमुख मुद्दों पर गहन चर्चा की जा सके।

Zhiyuan Research Institute (BAAI) के उपाध्यक्ष योंगहुआ लिन ने "अच्छे के लिए AI ओपन सोर्स: समावेशी एप्लिकेशन, निष्पक्ष डेटा और सार्वभौमिक कंप्यूटिंग पावर" में चीनी इंटरनेट कॉर्पस CCI 4.0 लॉन्च किया, जिसमें तीन प्रमुख डेटासेट शामिल हैं: CCI4.0-M2-Base V1, CCI4.0-M2-CoT V1 और CCI4.0-M2-Extra V1। CCI4.0-M2-Base V1 में 35000GB का डेटा वॉल्यूम है, यह चीनी और अंग्रेजी में द्विभाषी है, जिसमें 5000GB चीनी डेटा है, CCI3.0 की तुलना में डेटा स्केल में 5 गुना वृद्धि हुई है। CCI4.0-M2-CoT V1 में तर्क क्षमता में सुधार के लिए 450 मिलियन रिवर्स सिंथेसाइज्ड मानव विचार प्रक्षेपवक्र डेटा शामिल हैं, जिसमें कुल टोकन संख्या 425B (425 बिलियन) है, जो Cosmopedia (Hugging Face द्वारा ओपन सोर्स), सबसे बड़ा ओपन सोर्स सिंथेटिक डेटासेट वर्तमान में विश्व स्तर पर उपलब्ध है, के आकार का लगभग 20 गुना है।

Huawei के वरिष्ठ सॉफ्टवेयर इंजीनियर Xiyuan Wang ने तब "Ascend CANN पर आधारित प्रशिक्षण और अनुमान के लिए सर्वोत्तम अभ्यास" में बताया कि CANN आर्किटेक्चर AI फ्रेमवर्क और Ascend हार्डवेयर को कैसे जोड़ता है, और PyTorch और vLLM जैसे सहायक पारिस्थितिक तंत्र के माध्यम से इष्टतम प्रशिक्षण अनुमान प्राप्त करता है। Carrefour के डेटा आर्किटेक्ट Guillaume Blaquiere ने प्रदर्शित किया कि Google Cloud Run के माध्यम से GPU का समर्थन करने वाले सर्वरलेस बड़े मॉडल इंस्टेंस को कैसे तैनात किया जाए ताकि लागत कम हो सके और संसाधन उपयोग दक्षता में सुधार हो सके "अपने LLM को सर्वरलेस बनाना"। Peking University के इंजीनियर Yinping Ma ने "ओपन सोर्स इंटेलिजेंट कंप्यूटिंग इंटीग्रेटेड मैनेजमेंट एंड शेड्यूलिंग बेसिक सॉफ्टवेयर - SCOW and CraneSched" पर एक मुख्य भाषण दिया, जिसमें Peking University द्वारा विकसित दो प्रमुख ओपन सोर्स बेसिक सॉफ्टवेयर SCOW और CraneSched को पेश किया गया, जिन्हें पूरे देश में दर्जनों विश्वविद्यालयों और उद्यमों में तैनात किया गया है, जो बुद्धिमान कंप्यूटिंग संसाधनों के एकीकृत प्रबंधन और उच्च-प्रदर्शन शेड्यूलिंग का समर्थन करते हैं। Beihang University के PhD उम्मीदवार Yaowei Zheng ने "verl: हाइब्रिड कंट्रोलर पर आधारित RLHF सिस्टम" भाषण में Verl सिस्टम में हाइब्रिड कंट्रोलर आर्किटेक्चर की डिज़ाइन अवधारणा को साझा किया, और बड़े पैमाने पर सुदृढीकरण सीखने के प्रशिक्षण में इसके दक्षता लाभों पर चर्चा की। Oxen.ai के CEO Greg Schoeninger ने "DeepSeek-R1 स्टाइल सुदृढीकरण सीखने के लिए प्रशिक्षण डेटासेट और इन्फ्रास्ट्रक्चर (GRPO)" प्रस्तुत किया और तर्क LLM के लिए सुदृढीकरण सीखने की प्रशिक्षण प्रक्रियाओं के लिए अभ्यास पथ का विस्तृत विवरण दिया, जिसमें डेटासेट निर्माण, इन्फ्रास्ट्रक्चर बिल्डिंग और स्थानीय प्रशिक्षण कोड जनरेशन मॉडल शामिल हैं।

"क्या इसका उपयोग किया जा सकता है" से "क्या इसका अच्छी तरह से उपयोग किया जाता है": AI एप्लिकेशन व्यावहारिक चरण में प्रवेश करते हैं

AI एप्लिकेशन फोरम में, प्रमुख कंपनियों के R&D चिकित्सकों और प्रौद्योगिकी निर्णय निर्माताओं ने अंतर्दृष्टि की एक विविध श्रेणी साझा की, जिसमें बड़े मॉडलों द्वारा संचालित AI अनुप्रयोगों के वास्तविक दुनिया के परिनियोजन मार्गों और भविष्य की संभावनाओं को प्रदर्शित किया गया।

Alibaba Tongyi Lab के मुख्य शोधकर्ता योंगबिन ली ने "Tongyi Lingma: कोडिंग कोपिलॉट से कोडिंग एजेंट तक" में तकनीकी विकास और उत्पाद अनुप्रयोग में Tongyi Lingma की नवीनतम प्रगति साझा की। Huawei के सॉफ्टवेयर इंजीनियर Dongjie Chen ने "Cangjie Magic: बड़े मॉडल के युग में डेवलपर्स के लिए एक नया विकल्प" पर एक मुख्य भाषण दिया, जिसमें Cangjie प्रोग्रामिंग भाषा पर आधारित AI बड़े मॉडल एजेंट विकास फ्रेमवर्क को पेश किया गया, जो बुद्धिमान HarmonyOS अनुप्रयोगों के निर्माण में डेवलपर्स की दक्षता में काफी सुधार कर सकता है और उत्कृष्ट विकास अनुभव ला सकता है। LangGenius डेवलपर इकोसिस्टम के निदेशक Xinrui Liu ने "एक साथ काम करना, Dify द्वारा सक्षम तकनीकी शक्ति" पर ध्यान केंद्रित किया, Dify के ओपन सोर्स इकोसिस्टम और AI अनुप्रयोगों के लोकतंत्रीकरण में तेजी लाने में इसकी भूमिका पर जोर दिया।

AI और सिस्टम इंजीनियरिंग के संयोजन के बारे में, Makepad के सह-संस्थापक Rik Arends ने एक अनूठी प्रस्तुति दी: "एम्बिएंट कोडिंग का उपयोग करना, मोबाइल डिवाइस, वेब पेजों और मिश्रित वास्तविकता के लिए Rust UI बनाने के लिए AI का उपयोग करना", UI के लिए एक नया प्रतिमान बनाने के लिए एम्बिएंट कोडिंग का उपयोग करने के तरीके की खोज करना। Broadcom Spring टीम के R&D सॉफ्टवेयर इंजीनियर Christian Tzolov ने प्रदर्शित किया कि MCP Java SDK और Spring AI MCP के माध्यम से AI मॉडल को मौजूदा सिस्टम और संसाधनों के साथ कुशलतापूर्वक कैसे एकीकृत किया जाए "MCP के माध्यम से AI एकीकरण के लिए एक एकीकृत प्रतिमान"। Futurewei में प्रौद्योगिकी रणनीति के वरिष्ठ निदेशक Wenjing Chu ने "MCP और A2A में ‘T’ का अर्थ विश्वास है" में आगे परिप्रेक्ष्य को ऊपर उठाया, एजेंट-आधारित अनुप्रयोगों में वास्तव में भरोसेमंद AI सिस्टम बनाने के तरीके का गहन विश्लेषण किया। इसके अलावा, Cegid के सॉफ्टवेयर इंजीनियरिंग मैनेजर Hong-Thai Nguyen ने "Cegid Pulse: मल्टी-एजेंट बिजनेस मैनेजमेंट प्लेटफॉर्म" भाषण में व्यावहारिक परिदृश्यों के संयोजन में मल्टी-एजेंट व्यवसाय प्रक्रियाओं को कैसे नया आकार दे सकता है और स्मार्ट उद्यम निर्णय लेने और संचालन को प्राप्त कर सकता है, इसका परिचय दिया।

जब बड़े मॉडल "शरीर" से लैस होते हैं: एम्बोडिड इंटेलिजेंस आता है

एम्बोडिड इंटेलिजेंस AI के क्षेत्र में सबसे चुनौतीपूर्ण और आशाजनक विकास दिशाओं में से एक बन रहा है। इस मंच में, उद्योग के कई शीर्ष तकनीकी विशेषज्ञों ने "एम्बोडिड इंटेलिजेंस" विषय के आसपास गहन चर्चा में भाग लिया, वास्तुशिल्प डिजाइन, मॉडल अनुप्रयोग और परिदृश्य परिनियोजन में अपनी व्यावहारिक खोजों को साझा किया।

ZettaScale के CEO और CTO एंजेलो कोरसारो ने "माइंड, बॉडी और जेनोह" में बताया कि जेनोह प्रोटोकॉल बुद्धिमान रोबोट युग में धारणा, निष्पादन और संज्ञान के बीच बाधाओं को कैसे तोड़ सकता है। डोरा परियोजना के परियोजना प्रबंधक फिलिप ओपरमैन ने "वितरित डेटा प्रवाह को लागू करने के लिए डोरा में जेनोह का उपयोग करना" लाया, जिसमें डोरा में वितरित डेटा प्रवाह को लागू करने के लिए जेनोह प्रोटोकॉल के महत्वपूर्ण अनुप्रयोग की व्याख्या की गई। University of Science and Technology of China के प्रोफेसर जेम्स यांग ने "स्वायत्त ड्राइविंग में प्रतिकूल सुरक्षा-महत्वपूर्ण परिदृश्यों का उत्पादन" पर एक भाषण दिया, जिसमें जटिल वातावरण में स्थिरता और विश्वसनीयता सुनिश्चित करने के लिए प्रतिकूल परिदृश्यों को उत्पन्न करके स्वायत्त ड्राइविंग तकनीक की सुरक्षा में सुधार करने के तरीके का परिचय दिया गया।

इसके अलावा, Zhiyuan Research Institute में एम्बोडिड इंटेलिजेंस शोधकर्ता Minglan Lin ने "RoboBrain: रोबोट ऑपरेशन के लिए एक एकीकृत मस्तिष्क मॉडल और RoboOS: RoboBrain और रोबोट इंटेलिजेंट एजेंटों के लिए एक पदानुक्रमित सहयोग फ्रेमवर्क" विषय पर भी ध्यान केंद्रित किया, यह प्रदर्शित करते हुए कि RoboBrain रोबोटों के बुद्धिमत्ता स्तर को कैसे सुधार सकता है और रोबोट सहयोग में RoboOS की महत्वपूर्ण भूमिका क्या है। Voyage Robotics के संस्थापक Ville Kuosmanen ने "ओपन सोर्स VLA मॉडल के साथ रोबोट एप्लिकेशन का निर्माण" पर एक अद्भुत भाषण दिया, जिसमें बताया गया कि रोबोट अनुप्रयोगों के लिए मजबूत समर्थन प्रदान करने के लिए ओपन सोर्स VLA मॉडल का उपयोग कैसे किया जाए। अंत में, Menlo Research के एक बड़े भाषा मॉडल शोधकर्ता Huy Hoang Ha ने इस बारे में चर्चा की कि स्थानिक तर्क रोबोटों को जटिल 2D और 3D वातावरण को बेहतर ढंग से समझने में कैसे मदद कर सकता है, जिससे "स्थानिक तर्क LLM: रोबोट संचालन और नेविगेशन का समर्थन करने के लिए 2D और 3D की समझ को बढ़ाना" के मुख्य भाषण में उनकी संचालन और नेविगेशन क्षमताओं में सुधार हो सके।

स्पॉटलाइट वार्ता: अत्याधुनिक प्रौद्योगिकियों और अभिनव अनुप्रयोगों को प्रकाशित करना

स्पॉटलाइट वार्ता दिवस 1 में उद्योग विशेषज्ञों द्वारा अत्याधुनिक प्रौद्योगिकियों और अभिनव अनुप्रयोगों पर आकर्षक प्रस्तुतियां दी गईं। इस खंड ने विभिन्न डोमेन के प्रौद्योगिकी चिकित्सकों के लिए AI की नवीनतम प्रगति और व्यावहारिक अनुप्रयोगों पर चर्चा करने के लिए एक मंच के रूप में कार्य किया। फ्रांसीसी परमाणु ऊर्जा आयोग (CEA) के रिसर्च इंजीनियर सिरिल मोइनो ने "Aidge" भाषण में बताया कि Eclipse Aidge परियोजना एम्बेडेड प्लेटफॉर्म पर डीप न्यूरल नेटवर्क के परिनियोजन और अनुकूलन का समर्थन कैसे करती है, जिससे एज इंटेलिजेंट सिस्टम के विकास में तेजी आती है।

Bielik.ai के डेटा वैज्ञानिक Paweł Kiszczak ने इस सम्मेलन में पहली बार पोलिश मूल AI परियोजना Bielik की नवीनतम प्रगति को सार्वजनिक रूप से साझा किया और "Bielik.AI का उदय" शीर्षक से एक भाषण दिया, जिसमें बताया गया कि परियोजना ओपन सोर्स भाषा मॉडल और एक पूर्ण टूल इकोसिस्टम के माध्यम से एक स्थानीय स्वायत्त AI सिस्टम के निर्माण को कैसे बढ़ावा देती है। Bielik परियोजना ने न केवल कई ओपन सोर्स भाषा मॉडल (पैरामीटर स्केल 1.5B, 4.5B और 11B को कवर करते हैं) जारी किए हैं, बल्कि डेटासेट, मूल्यांकन, प्रशिक्षण और फाइन-ट्यूनिंग को कवर करने वाला एक एंड-टू-एंड टूलचैन भी बनाया है, जो अनुसंधान टीमों और डेवलपर्स को बुनियादी मॉडलों के आधार पर फाइन-ट्यून या लगातार प्री-ट्रेन करने का समर्थन करता है, जो बड़े मॉडल के लिए R&D थ्रेशोल्ड को काफी कम करता है और स्थानीय प्रौद्योगिकी नवाचार क्षमताओं को उत्तेजित करता है।

Second State के तकनीकी लीड Hung-Ying Tai ने "LlamaEdge के साथ एज डिवाइस पर GenAI मॉडल चलाना" साझा किया, जिसमें एज डिवाइस पर जेनरेटिव AI मॉडल को तैनात करने में LlamaEdge की हल्की और उच्च-प्रदर्शन क्षमताओं का प्रदर्शन किया गया, जिससे अधिक लचीला और कुशल स्थानीय तर्क अनुभव मिला। Peking University के PhD उम्मीदवार Tianyu Chen ने बताया कि SAFE फ्रेमवर्क "डेटा संश्लेषण-मॉडल फाइन-ट्यूनिंग" के स्व-विकास तंत्र के माध्यम से दुर्लभ प्रशिक्षण डेटा की समस्या को कैसे कम करता है, जिससे "स्व-विकास फ्रेमवर्क के आधार पर Rust कोड के लिए स्वचालित औपचारिक सत्यापन प्राप्त करना" में Rust कोड औपचारिक सत्यापन की दक्षता और सटीकता में काफी सुधार होता है। Illuin Technology के R&D निदेशक Gautier Viaud ने साझा किया कि टीम द्वारा ColBERT आर्किटेक्चर और PaliGemma मॉडल के आधार पर निर्मित ColPali सिस्टम ग्राफिक और टेक्स्ट जानकारी के संयोजन से दस्तावेज़ पुनर्प्राप्ति की सटीकता और दक्षता को प्रभावी ढंग से कैसे सुधारता है "ColPali: विज़ुअल लैंग्वेज मॉडल के आधार पर कुशल दस्तावेज़ पुनर्प्राप्ति" भाषण में। अंत में, Dynamia.ai के CEO Xiao Zhang ने बताया कि HAMi की मदद से विषम GPU संसाधनों को बेहतर ढंग से कैसे प्रबंधित और शेड्यूल किया जाए और "विषम AI इंफ्रास्ट्रक्चर की K8s क्लस्टर क्षमताओं को अनलॉक करना: HAMi की शक्ति को जारी करना" में AI इंफ्रास्ट्रक्चर की उपयोग दर और देखने की क्षमता में कैसे सुधार किया जाए।

विविध इंटरैक्शन और पहले दिन की मुख्य बातें

उच्च-घनत्व वाले मुख्य भाषणों के अलावा, सम्मेलन में कई विशेष इकाइयां भी शामिल थीं। बंद कमरे की बैठक इकाई ने सीमा पार सहयोग को बढ़ावा देने के लिए रणनीतिक संवादों और गहन उद्योग आदान-प्रदानों पर ध्यान केंद्रित किया। शोकेस सत्रों ने उद्यमों और अनुसंधान संस्थानों के नवीनतम AI प्रौद्योगिकी उत्पादों को प्रस्तुत करने पर ध्यान केंद्रित किया, जिससे बड़ी संख्या में आगंतुक रुकने और संवाद करने के लिए आकर्षित हुए। प्रतियोगिता सत्रों में, दुनिया भर के AI और रोबोटिक्स डेवलपर्स, इंजीनियरों और रोबोटिक्स उत्साही लोगों ने इमिटेशन लर्निंग की व्यावहारिक खोज को आगे बढ़ाने के लिए ओपन सोर्स SO-ARM100 रोबोटिक आर्म किट पर ध्यान केंद्रित किया। किट Hugging Face के LeRobot फ्रेमवर्क को एकीकृत करती है और ACT और डिफ्यूजन पॉलिसी सहित अत्याधुनिक AI आर्किटेक्चर का समर्थन करने के लिए NVIDIA की AI और रोबोटिक्स तकनीकों को जोड़ती है, जो प्रतिभागियों को एक ठोस तकनीकी आधार प्रदान करती है। प्रतिभागियों ने इसके प्रभावों और व्यवहार्यता का व्यापक मूल्यांकन करने के लिए वास्तविक परिदृश्यों में व्यावहारिक खोजों का संचालन किया।

Workshop सत्रों ने OpenHarmony पारिस्थितिकी तंत्र को मुख्य विषय के रूप में लिया और Open Atom Open Source Foundation द्वारा इनक्यूबेट और संचालित ओपन सोर्स परियोजना का पता लगाया। OpenHarmony सभी परिदृश्यों, सभी कनेक्शन और सभी बुद्धि के युग के लिए एक बुद्धिमान टर्मिनल ऑपरेटिंग सिस्टम फ्रेमवर्क बनाने, एक खुला, वैश्विक और अभिनव अग्रणी वितरित ऑपरेटिंग सिस्टम प्लेटफॉर्म बनाने, विविध बुद्धिमान उपकरणों की सेवा करने और इंटरनेट ऑफ एवरीथिंग उद्योग के विकास में मदद करने के लिए प्रतिबद्ध है। सम्मेलन स्थल पर, प्रतिभागियों ने व्यावहारिक कार्यशालाओं की एक श्रृंखला के माध्यम से बहु-डिवाइस सहयोग और हल्के सिस्टम डिज़ाइन में OpenHarmony के मूल लाभों को गहराई से समझा, व्यक्तिगत रूप से ड्राइवर विकास से लेकर एप्लिकेशन परिनियोजन तक प्रमुख प्रक्रियाओं में भाग लिया। हैंड्स-ऑन अभ्यास न केवल डेवलपर्स को "बॉटम-टू-एंड" तकनीकी पथ खोलने में मदद करता है, बल्कि सिस्टम-स्तरीय विकास और डिबगिंग क्षमताओं में भी व्यापक रूप से सुधार करता है।

GOSIM AI Paris 2025 दिवस 1 का एजेंडा सफलतापूर्वक समाप्त हो गया है, लेकिन उत्साह जारी है। कल, सम्मेलन AI मॉडल, AI इंफ्रास्ट्रक्चर, AI एप्लिकेशन और एम्बोडिड इंटेलिजेंस के चार प्रमुख मंचों के आसपास आगे बढ़ता रहेगा, और बहुप्रतीक्षित PyTorch दिवस का स्वागत करेगा, जिसमें अधिक हेवीवेट मेहमान और पहली पंक्ति की व्यावहारिक सामग्री जल्द ही आ रही है, इसलिए बने रहें!