GOSIM AI पॅरिस २०२५: ओपन सोर्स AI क्रांती

गेल्या वर्षभरात AI क्षेत्रात मोठे बदल झाले आहेत, ज्यामध्ये ओपन सोर्स डेव्हलपमेंटच्या सहकार्याच्या भावनेने महत्त्वपूर्ण भूमिका बजावली आहे. पूर्वी हे क्षेत्र फक्त मोठ्या तंत्रज्ञान कंपन्यांपुरते मर्यादित होते, परंतु आता मोठ्या भाषिक मॉडेल (LLMs) समुदाय प्रयत्नांमुळे विकसित होत आहेत. यामुळे पायाभूत सुविधांपासून ते अल्गोरिदम ऑप्टिमायझेशन आणि उपयोजनापर्यंत (deployment) सर्व गोष्टींवर परिणाम होत आहे. या ओपन सोर्स चळवळीमुळे AI चा विकास झपाट्याने होत आहे, ज्यामुळे ते अधिक सुलभ झाले आहे आणि पुढील पिढीतील बुद्धिमान प्रणालींमध्ये योगदान देण्याची संधी लोकशाही पद्धतीने उपलब्ध झाली आहे.

या पार्श्वभूमीवर, GOSIM, CSDN आणि 1ms.ai यांच्या संयुक्त विद्यमाने GOSIM AI पॅरिस २०२५ परिषद ६ मे रोजी पॅरिस, फ्रान्स येथे सुरू झाली. ही परिषद जागतिक तंत्रज्ञान क्षेत्रातील व्यावसायिक आणि संशोधकांना ओपन सोर्स AI मधील नवीनतम प्रगती आणि भविष्यातील दिशा एक्सप्लोर करण्यासाठी एक महत्त्वपूर्ण व्यासपीठ म्हणून काम करते.

या परिषदेत Alibaba, Hugging Face, BAAI, MiniMax, Neo4j, Dify, MetaGPT, Zhipu AI, Eigent.AI, Docker, Inflow, पेकिंग युनिव्हर्सिटी, फ्राउनहोफर, ऑक्सफर्ड युनिव्हर्सिटी आणि फ्रेंच ओपनLLM समुदाय यांसारख्या आघाडीच्या संस्थांमधील ८० हून अधिक तंत्रज्ञान तज्ञ आणि विद्वानांचा सहभाग आहे. Huawei, फ्रान्समधील ऑल-चायना यूथ इनोव्हेशन अँड आंत्रप्रेन्योरशिप असोसिएशन, सिनो-फ्रेंच आर्टिफिशियल इंटेलिजन्स असोसिएशन, Apache Software Foundation, Eclipse Foundation, The Khronos Group, WasmEdgeRuntime, LF Generative AI Commons, the Linux Foundation Research, the OpenWallet Foundation, the Open Source Initiative (OSI), Software Heritage, आणि K8SUG यांसारख्या प्रमुख भागीदारांचा देखील सक्रिय सहभाग आहे. या परिषदेत AI मॉडेल, इन्फ्रास्ट्रक्चर, एप्लीकेशन डेप्लॉयमेंट आणि एम्बोडीड इंटेलिजन्स यांसारख्या मुख्य विषयांवर आधारित ६० हून अधिक तांत्रिक सत्रे आहेत, जी ओपन सोर्स इकोसिस्टमच्या उत्क्रांती आणि उदयोन्मुख ट्रेंडचा विस्तृत दृष्टिकोन प्रदान करतात.

AI आणि ओपन सोर्सचे सहजीवी संबंध

GOSIM चे सह-संस्थापक मायकल युआन यांनी "ओपन सोर्सने पकड घेतली आहे, आता पुढे काय?" या शीर्षकाखाली Keynote ॲड्रेस देऊन परिषदेची सुरुवात केली. त्यांनी ओपन सोर्स AI च्या वर्तमान स्थिती आणि भविष्यातील वाटचालीवर आपले विचार मांडले आणि याने एक महत्त्वाचा टप्पा गाठला आहे, यावर जोर दिला.

युआन म्हणाले, "आम्ही एकदा भविष्यवाणी केली होती की ओपन सोर्सला क्लोज्ड-सोर्स मॉडेलशी बरोबरी साधायला ५-१० वर्षे लागतील, पण असे दिसते की हे उद्दिष्ट वेळेआधीच साध्य झाले आहे." त्यांनी Qwen 3 च्या अलीकडील प्रकाशनाचे उदाहरण दिले आणि नमूद केले की ओपन सोर्स मॉडेल आता एकमेकांशी स्पर्धा करत नाहीत, तर थेट मालकीच्या फ्लॅगशिप मॉडेलला आव्हान देत आहेत आणि काही बेंचमार्क मध्ये त्यांना मागे टाकत आहेत. युआन यांनी असेही सुचवले की ही प्रगती केवळ ओपन सोर्स प्रगतीमुळे झालेली नाही, तर क्लोज्ड-सोर्स डेव्हलपमेंट अपेक्षेप्रमाणे न Performance देण्यात आणि कार्यक्षमतेच्या अडचणींना (Bottlenecks) सामोरे जाण्यात अयशस्वी ठरल्यामुळे झाली आहे. याउलट, ओपन सोर्स मॉडेल झपाट्याने विकसित होत आहेत, एक तीव्र वाढ दर्शवित आहेत आणि एक खरे "पकड" घेण्याचे प्रदर्शन करत आहेत.

या निरीक्षणातून एक मूलभूत प्रश्न उभा राहतो: आपण कृत्रिम सामान्य बुद्धिमत्ता (Artificial General Intelligence - AGI) साध्य करण्यापासून किती दूर आहोत? युआन यांचा असा विश्वास आहे की AGI चे भविष्य एकाच सर्वसमावेशक मॉडेलमध्ये नसेल, तर खाजगी हार्डवेअर किंवा रोबोटिक उपकरणांवर तैनात केलेल्या विशेष मॉडेल, ज्ञान बेस आणि साधनांच्या नेटवर्कमध्ये असू शकते.

त्यांनी पुढे सांगितले की AI आर्किटेक्चर सेंट्रलाईज्ड (centralized) पासून डिसेंट्रलाईज्ड (decentralized) paradigms कडे सरकत आहे. त्यांनी OpenAI च्या Completion API मधून नवीन Responses API कडे झालेल्या बदलावर प्रकाश टाकला, ज्याचा उद्देश मोठ्या प्रमाणावर इंटेलिजेंट एजंट प्लॅटफॉर्म तयार करणे आहे. या बदलामध्ये सुमारे ६,००,००० वापरकर्ते आणि विकासक आधीच सामील झाले आहेत, जे वितरित AI ॲप्लिकेशन्सच्या विकासासाठी योगदान देत आहेत.

युआन म्हणाले, "AGI चे भविष्य केवळ एका चांगल्या निधी असलेल्या कंपनीने विकसित करू नये. त्याऐवजी, ते जागतिक स्तरावर सहकार्याने तयार केले जावे, जे मॉडेल, ज्ञान बेस, रोबोट आणि अंमलबजावणी प्रणाली (execution systems) यांचा समावेश असलेले इकोसिस्टम नेटवर्क तयार करेल."

युआन यांच्या भाषणानंतर, ओपन वॉलेट फाउंडेशनचे कार्यकारी संचालक डॅनियल गोल्डस्चेडर यांनी "GDC wallets & Credentials" या विषयावर सादरीकरण केले, ज्यामध्ये संयुक्त राष्ट्र महासभेने स्वीकारलेल्या ग्लोबल डिजिटल कॉम्पॅक्ट (GDC) प्रकल्पावर लक्ष केंद्रित केले. त्यांनी स्पष्ट केले की GDC चे दोन मुख्य उद्देश आहेत:

  • डिजिटल तंत्रज्ञानाने आपले जीवन आणि सामाजिक विकासात मोठे बदल घडवले आहेत, हे ओळखून अभूतपूर्व संधी आणि अनपेक्षित धोके निर्माण केले आहेत.
  • मानवतेच्या फायद्यासाठी डिजिटल तंत्रज्ञानाची पूर्ण क्षमता साकारण्यासाठी जागतिक सहकार्याची गरज आहे, जे देश, उद्योग आणि सार्वजनिक तसेच खाजगी क्षेत्रांमधील अडथळे दूर करते.

या सामायिक समजाच्या आधारावर, GDC ने "ग्लोबल डिजिटल कोलाबोरेशन" (Global Digital Collaboration) उपक्रम सुरू केला आहे, ज्याचा उद्देश सरकार, व्यवसाय, ना-नफा संस्था आणि इतर भागधारकांमध्ये वास्तविक सहकार्य वाढवणे आहे.

गोल्डस्चेडर यांनी operational पैलूंवर चर्चा करताना सांगितले की हे सहकार्य कोणत्याही एका संस्थेद्वारे चालवले जात नाही, तर "संयुक्त convening" दृष्टिकोन स्वीकारते, ज्यामध्ये इच्छुक आंतरराष्ट्रीय संस्था, मानक-सेटिंग संस्था, ओपन सोर्स समुदाय आणि आंतरसरकारी संस्थांना सहभागी होण्यासाठी आमंत्रित केले जाते. त्यांनी स्पष्ट केले की हा प्रकल्प "कोण कोणाचे नेतृत्व करतो" असा नाही, तर एक समान सहकार्याचे व्यासपीठ आहे, जिथे प्रत्येक पक्षाला आवाज आहे आणि कोणीही इतरांपेक्षा महत्त्वाचे नाही.

त्यांनी पुढे स्पष्ट केले की ग्लोबल डिजिटल कोलाबोरेशनचा उद्देश थेट मानके किंवा तंत्रज्ञान विकसित करणे नाही, तर विविध पार्श्वभूमीतील संस्थांमध्ये संवाद सुलभ करणे आहे, ज्यामुळे त्यांना त्यांचे दृष्टिकोन आणि गरजा सादर करता येतील आणि एकमत साधता येईल. त्यानंतर, विशिष्ट मानके आणि तांत्रिक कामे संबंधित विशेष संस्थांद्वारे पुढे नेली जातील. त्यांनी "डिजिटल ओळख" आणि "बायोमेट्रिक तंत्रज्ञान" यांची उदाहरणे दिली आणि नमूद केले की अनेक संस्था या क्षेत्रांमध्ये आधीच काम करत आहेत, ज्यामुळे प्रत्येकाला एकत्र आणण्यासाठी, duplication, संघर्ष आणि संसाधनांचा अपव्यय टाळण्यासाठी एका तटस्थ व्यासपीठाची आवश्यकता आहे.

चार समर्पित मंच: ओपन सोर्स AI चे सर्वंकष विश्लेषण

या परिषदेत AI मॉडेल, AI इन्फ्रास्ट्रक्चर, AI ॲप्लिकेशन्स आणि एम्बोडीड इंटेलिजन्स हे चार विशेष मंच होते. या मंचांमध्ये मूलभूत आर्किटेक्चरपासून ते ॲप्लिकेशन डेप्लॉयमेंटपर्यंत आणि मॉडेल क्षमतांपासून ते इंटेलिजेंट एजंट पद्धतींपर्यंतच्या महत्त्वाच्या विषयांचा समावेश करण्यात आला होता. प्रत्येक मंचावर जागतिक स्तरावरील कंपन्या आणि संशोधन संस्थांमधील आघाडीच्या तज्ञांनी नवीनतम तांत्रिक ट्रेंडचे सखोल विश्लेषण केले आणि अनेक अभियांत्रिकी पद्धती सादर केल्या, ज्यामुळे ओपन सोर्स AI चे अनेक क्षेत्रांमधील सर्वंकष एकत्रीकरण आणि उत्क्रांती दिसून येते.

AI मोठ्या मॉडेलच्या मूळ लॉजिकचे विश्लेषण

AI मॉडेल मंचाने मोठ्या मॉडेलच्या क्षेत्रात आर्किटेक्चरल नवकल्पना, ओपन सोर्स सहयोग आणि इकोसिस्टम उत्क्रांती यावर अंतर्दृष्टी सामायिक करण्यासाठी ओपन सोर्स समुदाय आणि संशोधन संस्थांमधील तज्ञांना एकत्र आणले.

हगिंग फेसचे मशीन लर्निंग रिसर्च इंजिनियर Guilherme Penedo यांनी "ओपन-R1: DeepSeek-R1 चे पूर्णपणे ओपन सोर्स पुनरुत्पादन" सादर केले, ज्यामध्ये DeepSeek-R1 मॉडेलची प्रतिकृती बनवण्याच्या ओपन-R1 प्रकल्पाच्या प्रयत्नांवर प्रकाश टाकला, ज्यामध्ये अनुमान कार्यांशी संबंधित डेटाची openness आणि standardization वाढवण्यावर लक्ष केंद्रित केले. Zhiyuan Research Institute च्या डेटा रिसर्च टीमचे टेक्नॉलॉजी लीडर Guang Liu यांनी "ओपनसीक: मोठ्या मॉडेलच्या पुढील पिढीसाठी सहयोगी नवोपक्रम" सामायिक केले, ज्यामध्ये अल्गोरिदम, डेटा आणि सिस्टम स्तरावर मॉडेल कार्यक्षमतेत यश मिळवण्यासाठी जागतिक सहकार्याचे महत्त्व सांगितले, ज्याचा उद्देश DeepSeek ला मागे टाकणारी मोठ्या मॉडेलची पुढील पिढी विकसित करणे आहे.

CSDN चे वरिष्ठ उपाध्यक्ष Jason Li यांनी "DeepSeek चे डिकोडिंग: तांत्रिक नवोपक्रम आणि AI इकोसिस्टमवर त्याचा प्रभाव" सादर केले, ज्यामध्ये DeepSeek च्या तांत्रिक paradigms, मॉडेल आर्किटेक्चर आणि औद्योगिक परिसंस्थेतील नवोपक्रमांचे सखोल विश्लेषण केले, तसेच जागतिक AI परिसंस्थेवर त्याचा संभाव्य प्रभाव स्पष्ट केला. MiniMax चे वरिष्ठ संशोधन संचालक Yiran Zhong यांनी "रेखीय भविष्य: मोठ्या भाषिक मॉडेल आर्किटेक्चरची उत्क्रांती" सादर केले, ज्यामध्ये कार्यक्षमतेच्या दृष्टीने Transformer आर्किटेक्चरला संभाव्य पर्याय देणारी Lightning Attention यंत्रणा सादर केली. ऑक्सफर्ड युनिव्हर्सिटीमधील रॉयल सोसायटी न्यूटन इंटरनॅशनल फेलो Shiwei Liu यांनी "मोठ्या भाषिक मॉडेलमध्ये Depth Curse" यावर चर्चा केली, ज्यामध्ये मॉडेल जसजसे सखोल होत जातात तसतसे deep neural networks चे घटते योगदान आणि deep layer चा वापर आणि एकूण कार्यक्षमता सुधारण्यासाठी LayerNorm Scaling वापरण्याचा प्रस्ताव दिला. Zhipu AI चे संशोधन अभियंता Diego Rojas यांनी "कोड लार्ज लँग्वेज मॉडेल: टोकनच्या पलीकडे एक्सप्लोर करणे" मध्ये निदर्शनास आणले की सध्याची मोठी मॉडेल शक्तिशाली असली तरी ती अजूनही tokenization वर अवलंबून आहेत, जे कार्यक्षम नाही आणि टोकन वगळण्याचे नवीन मार्ग सामायिक केले ज्यामुळे मॉडेल अधिक जलद आणि मजबूत होऊ शकतील. Fraunhofer IAIS मधील बेसिक मॉडेल टीमचे प्रमुख Nicolas Flores-Herr यांनी "जागतिक स्तरावर स्पर्धात्मक ‘युरोपियन-निर्मित’ मोठी भाषिक मॉडेल कशी तयार करावी?" यासह मंचाचा समारोप केला, ज्यामध्ये युरोपियन मूल्यांचे प्रतिबिंब असलेल्या AI ची पुढील पिढी तयार करण्यासाठी डेटा, विविधता आणि नियामक आव्हानांवर मात करून बहुभाषिक, ओपन सोर्स आणि विश्वासार्ह localized मोठी मॉडेल प्रकल्प तयार करण्यावर भर दिला.

AI इन्फ्रास्ट्रक्चरची त्रिकूट: डेटा, कंप्यूटिंग पॉवर आणि अल्गोरिदम उत्क्रांती

मोठ्या मॉडेलसाठी अधिक open, कार्यक्षम आणि सर्वसमावेशक पाया तयार करण्यावर लक्ष केंद्रित करून, AI इन्फ्रास्ट्रक्चर मंचाने संशोधन संस्था आणि उद्योगांमधील आघाडीच्या तज्ञांना डेटा, कंप्यूटिंग पॉवर आणि सिस्टम आर्किटेक्चर यांसारख्या महत्त्वाच्या समस्यांवर सखोल चर्चा करण्यासाठी एकत्र आणले.

Zhiyuan Research Institute (BAAI) चे उपाध्यक्ष Yonghua Lin यांनी "चांगल्यासाठी AI ओपन सोर्स: सर्वसमावेशक ॲप्लिकेशन्स, निष्पक्ष डेटा आणि युनिव्हर्सल कंप्यूटिंग पॉवर" मध्ये चायनीज इंटरनेट कॉर्पस CCI 4.0 लाँच केले, ज्यामध्ये तीन प्रमुख डेटासेट समाविष्ट आहेत: CCI4.0-M2-Base V1, CCI4.0-M2-CoT V1 आणि CCI4.0-M2-Extra V1. CCI4.0-M2-Base V1 मध्ये 35000GB डेटा आहे, जो चीनी आणि इंग्रजीमध्ये द्विभाषिक आहे, ज्यामध्ये 5000GB चीनी डेटा आहे, जो CCI3.0 च्या तुलनेत डेटा स्केलमध्ये 5 पटीने वाढला आहे. CCI4.0-M2-CoT V1 मध्ये 450 दशलक्ष रिव्हर्स सिंथेसाइज्ड मानवी विचार trajectory डेटा आहे, जो तर्क क्षमता सुधारण्यासाठी आहे, ज्यामध्ये एकूण टोकन संख्या 425B (425 अब्ज) आहे, जी Cosmopedia (हगिंग फेसद्वारे ओपन सोर्स केलेले) च्या आकाराच्या जवळपास 20 पट आहे, जो सध्या जागतिक स्तरावर उपलब्ध असलेला सर्वात मोठा ओपन सोर्स सिंथेटिक डेटासेट आहे.

यानंतर Huawei चे वरिष्ठ सॉफ्टवेअर अभियंता Xiyuan Wang यांनी "Ascend CANN वर आधारित प्रशिक्षण आणि अनुमानासाठी सर्वोत्तम पद्धती" मध्ये CANN आर्किटेक्चर AI फ्रेमवर्क आणि Ascend हार्डवेअरला कसे जोडते आणि PyTorch आणि vLLM सारख्या सपोर्टिंग इकोसिस्टमद्वारे इष्टतम प्रशिक्षण अनुमान कसे साध्य करते याबद्दल माहिती दिली. Carrefour चे डेटा आर्किटेक्ट Guillaume Blaquiere यांनी "तुमचे LLM सर्व्हरलेस बनवणे" मध्ये GPU ला सपोर्ट करणारे सर्व्हरलेस मोठे मॉडेल Google Cloud Run द्वारे कसे तैनात करायचे, खर्च कसा कमी करायचा आणि संसाधनांचा वापर कार्यक्षमतेने कसा करायचा हे दाखवले. पेकिंग युनिव्हर्सिटीतील अभियंता Yinping Ma यांनी "ओपन सोर्स इंटेलिजेंट कंप्यूटिंग इंटिग्रेटेड मॅनेजमेंट आणि शेड्युलिंग बेसिक सॉफ्टवेअर - SCOW आणि CraneSched" यावर Keynote भाषण दिले, ज्यामध्ये पेकिंग युनिव्हर्सिटीने विकसित केलेले दोन प्रमुख ओपन सोर्स बेसिक सॉफ्टवेअर SCOW आणि CraneSched सादर केले, जे देशभरातील डझनभर विद्यापीठे आणि उद्योगांमध्ये तैनात केले गेले आहेत, जे इंटेलिजेंट कंप्यूटिंग संसाधनांचे एकीकृत व्यवस्थापन आणि उच्च-कार्यक्षमता शेड्युलिंगला समर्थन देतात. Beihang University मधील PhD उमेदवार Yaowei Zheng यांनी "verl: हायब्रीड कंट्रोलरवर आधारित RLHF प्रणाली" भाषणात Verl प्रणालीतील हायब्रीड कंट्रोलर आर्किटेक्चरची रचना संकल्पना सामायिक केली आणि मोठ्या प्रमाणावर reinforcement learning प्रशिक्षणातील त्याच्या कार्यक्षमतेच्या फायद्यांवर चर्चा केली. Oxen.ai चे CEO Greg Schoeninger यांनी "DeepSeek-R1 शैलीतील reinforcement learning साठी प्रशिक्षण डेटासेट आणि इन्फ्रास्ट्रक्चर (GRPO)" सादर केले आणि reasoning LLMs साठी reinforcement learning प्रशिक्षण प्रक्रियेसाठी डेटासेट बांधकाम, इन्फ्रास्ट्रक्चर इमारत आणि लोकल प्रशिक्षण कोड जनरेशन मॉडेलसह सराव मार्ग तपशीलवारपणे सांगितले.

"ते वापरले जाऊ शकते" पासून "ते चांगले वापरले जाते" पर्यंत: AI ॲप्लिकेशन्स व्यावहारिक टप्प्यात प्रवेश करतात

AI ॲप्लिकेशन्स मंचावर, आघाडीच्या कंपन्यांमधील R&D व्यावसायिकांनी आणि तंत्रज्ञान निर्णयकर्त्यांनी मोठ्या मॉडेलद्वारे चालवल्या जाणार्‍या AI ॲप्लिकेशन्सच्या वास्तविक-जगातील उपयोजन मार्गांचे आणि भविष्यातील शक्यतांचे प्रदर्शन करून विविध प्रकारचे अंतर्दृष्टी सामायिक केले.

Alibaba Tongyi Lab चे मुख्य संशोधक Yongbin Li यांनी "Tongyi Lingma: कोडिंग कोपायलट ते कोडिंग एजंट" मध्ये तांत्रिक उत्क्रांती आणि उत्पादन ॲप्लिकेशनमध्ये Tongyi Lingma च्या नवीनतम प्रगतीबद्दल माहिती दिली. Huawei चे सॉफ्टवेअर अभियंता Dongjie Chen यांनी "Cangjie Magic: मोठ्या मॉडेलच्या युगात विकासकांसाठी एक नवीन निवड" यावर Keynote भाषण दिले, ज्यामध्ये Cangjie प्रोग्रामिंग भाषेवर आधारित AI मोठ्या मॉडेल एजंट डेव्हलपमेंट फ्रेमवर्क सादर केले, जे बुद्धिमान HarmonyOS ॲप्लिकेशन्स तयार करण्यात विकासकांची कार्यक्षमता लक्षणीयरीत्या सुधारू शकते आणि उत्कृष्ट विकास अनुभव देऊ शकते. LangGenius डेव्हलपर इकोसिस्टमचे संचालक Xinrui Liu यांनी "वर्किंग टुगेदर, टेक्निकल पॉवर इनेबल्ड बाय Dify" यावर लक्ष केंद्रित केले, ज्यामध्ये Dify च्या ओपन सोर्स इकोसिस्टम आणि AI ॲप्लिकेशन्सच्या लोकप्रियतेला गती देणारी भूमिका यावर जोर दिला.

AI आणि सिस्टम इंजिनियरिंगच्या संयोजनासंदर्भात, Makepad चे सह-संस्थापक Rik Arends यांनी एक अद्वितीय सादरीकरण दिले: "ॲम्बियंट कोडिंग वापरून, मोबाईल डिव्हाइसेस, वेब पेजेस आणि मिक्स्ड रिॲलिटीसाठी Rust UI तयार करण्यासाठी AI चा वापर करा," ज्यामध्ये UI साठी एक नवीन paradigm तयार करण्यासाठी ॲम्बियंट कोडिंग कसे वापरायचे याबद्दल माहिती दिली. Broadcom Spring टीममधील R&D सॉफ्टवेअर अभियंता Christian Tzolov यांनी "MCP द्वारे AI एकत्रीकरणासाठी एक एकीकृत Paradigm" मध्ये MCP Java SDK आणि Spring AI MCP द्वारे AI मॉडेलला विद्यमान सिस्टम आणि संसाधनांमध्ये कार्यक्षमतेने कसे integrate करायचे यावर लक्ष केंद्रित केले. Futurewei मधील टेक्नॉलॉजी स्ट्रॅटेजीचे वरिष्ठ संचालक Wenjing Chu यांनी "MCP आणि A2A मधील ‘T’ म्हणजे Trust" मध्ये दृष्टिकोन अधिक उंच केला आणि एजंट-आधारित ॲप्लिकेशन्समध्ये खऱ्या अर्थाने विश्वासार्ह AI प्रणाली कशा तयार करायच्या याचे सखोल विश्लेषण केले. याव्यतिरिक्त, Cegid मधील सॉफ्टवेअर इंजिनियरिंग व्यवस्थापक Hong-Thai Nguyen यांनी "Cegid Pulse: मल्टी-एजंट बिझनेस मॅनेजमेंट प्लॅटफॉर्म" भाषणात व्यावहारिक परिस्थितीच्या संयोगाने मल्टी-एजंट व्यवसाय प्रक्रिया कशा reshape करू शकतात आणि अधिक स्मार्ट एंटरप्राइज निर्णय घेणे आणि ऑपरेशन कसे साध्य करू शकतात याबद्दल माहिती दिली.

जेव्हा मोठ्या मॉडेलला "शरीर" मिळते: एम्बोडीड इंटेलिजन्स येते

एम्बोडीड इंटेलिजन्स AI क्षेत्रातील सर्वात आव्हानात्मक आणि आशादायक विकास दिशांपैकी एक बनत आहे. या मंचावर, उद्योगातील अनेक शीर्ष तांत्रिक तज्ञांनी "एम्बोडीड इंटेलिजन्स" या थीमवर सखोल चर्चा केली, त्यांच्या architectural डिझाइन, मॉडेल ॲप्लिकेशन आणि scenario deployment मधील व्यावहारिक संशोधना सामायिक केल्या.

ZettaScale चे CEO आणि CTO Angelo Corsaro यांनी "Mind, Body, आणि Zenoh" मध्ये Zenoh प्रोटोकॉल इंटेलिजेंट रोबोट युगात परसेप्शन, execution आणि cognition मधील अडथळे कसे तोडू शकतो याबद्दल माहिती दिली. Dora प्रोजेक्टचे प्रोजेक्ट मॅनेजर Philipp Oppermann यांनी "वितरित डेटा फ्लो लागू करण्यासाठी Dora मध्ये Zenoh चा वापर करणे" सादर केले, ज्यामध्ये वितरित डेटा फ्लो लागू करण्यासाठी Dora मध्ये Zenoh प्रोटोकॉलच्या महत्त्वाच्या ॲप्लिकेशनबद्दल माहिती दिली. चीन विज्ञान आणि तंत्रज्ञान विद्यापीठातील प्राध्यापक James Yang यांनी "Autonomous Driving मध्ये Adversarial Safety-Critical परिस्थितीची निर्मिती" यावर भाषण दिले, ज्यामध्ये जटिल वातावरणात स्थिरता आणि विश्वसनीयता सुनिश्चित करण्यासाठी प्रतिकूल परिस्थिती निर्माण करून autonomous driving तंत्रज्ञानाची सुरक्षितता कशी सुधारायची याबद्दल माहिती दिली.

याव्यतिरिक्त, Zhiyuan Research Institute मधील एम्बोडीड इंटेलिजन्स संशोधक Minglan Lin यांनी "RoboBrain: रोबोट ऑपरेशनसाठी एक एकीकृत ब्रेन मॉडेल आणि RoboOS: RoboBrain आणि रोबोट इंटेलिजेंट एजंट्ससाठी श्रेणीबद्ध सहयोग फ्रेमवर्क" या विषयावर लक्ष केंद्रित केले, RoboBrain रोबोट्सची बुद्धिमत्ता पातळी कशी सुधारू शकते आणि रोबोट सहकार्यामध्ये RoboOS ची महत्त्वपूर्ण भूमिका याबद्दल माहिती दिली. Voyage Robotics चे संस्थापक Ville Kuosmanen यांनी "ओपन सोर्स VLA मॉडेलसह रोबोट ॲप्लिकेशन्स तयार करणे" यावर एक अद्भुत भाषण दिले, ज्यामध्ये रोबोट ॲप्लिकेशन्सना मजबूत आधार देण्यासाठी ओपन सोर्स VLA मॉडेल कसे वापरायचे याबद्दल माहिती दिली. शेवटी, Menlo Research मधील मोठ्या भाषिक मॉडेल संशोधक Huy Hoang Ha यांनी "Spatial Reasoning LLM: रोबोट ऑपरेशन आणि नेव्हिगेशनला सपोर्ट करण्यासाठी 2D आणि 3D ची समज वाढवणे" या Keynote भाषणात spatial reasoning रोबोट्सना जटिल 2D आणि 3D वातावरण अधिक चांगल्या प्रकारे समजून घेण्यास कशी मदत करू शकते, ज्यामुळे त्यांची ऑपरेशन आणि नेव्हिगेशन क्षमता सुधारते यावर चर्चा केली.

Spotlight Talks: अत्याधुनिक तंत्रज्ञान आणि नाविन्यपूर्ण ॲप्लिकेशन्सवर प्रकाश टाकणे

Spotlight Talks Day 1 मध्ये उद्योगातील तज्ञांनी अत्याधुनिक तंत्रज्ञान आणि नाविन्यपूर्ण ॲप्लिकेशन्सवर आकर्षक सादरीकरणे दिली. हा विभाग विविध क्षेत्रांतील तंत्रज्ञान व्यावसायिकांसाठी AI मधील नवीनतम प्रगती आणि व्यावहारिक ॲप्लिकेशन्सवर चर्चा करण्यासाठी एक व्यासपीठ म्हणून काम करतो. फ्रेंच ॲटोमिक एनर्जी कमिशन (CEA) मधील संशोधन अभियंता Cyril Moineau यांनी "Aidge" भाषणात स्पष्ट केले की Eclipse Aidge प्रकल्प एम्बेडेड प्लॅटफॉर्मवर deep neural networks च्या deployment आणि optimization ला संपूर्ण टूलचेन प्रदान करून कसा सपोर्ट करतो, ज्यामुळे एज इंटेलिजेंट सिस्टमच्या विकासाला गती मिळते.

Bielik.ai मधील डेटा वैज्ञानिक Paweł Kiszczak यांनी या परिषदेत प्रथमच पोलिश मूळ AI प्रकल्प Bielik च्या नवीनतम प्रगतीची माहिती दिली आणि "The Rise of Bielik.AI" या शीर्षकाचे भाषण दिले, ज्यामध्ये ओपन सोर्स भाषिक मॉडेल आणि संपूर्ण टूल इकोसिस्टमद्वारे स्थानिक autonomous AI प्रणालीच्या बांधकामास हा प्रकल्प कसा प्रोत्साहन देतो याबद्दल सांगितले. Bielik प्रकल्पाने केवळ अनेक ओपन सोर्स भाषिक मॉडेल (1.5B, 4.5B आणि 11B पॅरामीटर स्केल कव्हर करणारे) जारी केले नाहीत, तर डेटासेट, मूल्यांकन, प्रशिक्षण आणि फाइन-ट्यूनिंग कव्हर करणारे एंड-टू-एंड टूलचेन देखील तयार केले आहे, जे संशोधन टीम आणि विकासकांना मूलभूत मॉडेलवर आधारित फाइन-ट्यून किंवा सतत प्री-ट्रेनिंग करण्यास मदत करते, ज्यामुळे मोठ्या मॉडेलसाठी R&D थ्रेशोल्ड मोठ्या प्रमाणात कमी होतो आणि स्थानिक तंत्रज्ञान नवोपक्रम क्षमता उत्तेजित होतात.

Second State मधील तांत्रिक लीड Hung-Ying Tai यांनी "LlamaEdge सह एज डिव्हाइसेसवर GenAI मॉडेल चालवणे" सामायिक केले, ज्यामध्ये जनरेटिव्ह AI मॉडेल एज डिव्हाइसेसवर तैनात करण्यात LlamaEdge ची हलकी आणि उच्च-कार्यक्षमता क्षमता दर्शविली, ज्यामुळे अधिक लवचिक आणि कार्यक्षम लोकल रीजनिंग अनुभव मिळतो. पेकिंग युनिव्हर्सिटीमधील PhD उमेदवार Tianyu Chen यांनी "स्व-उत्क्रांती फ्रेमवर्कवर आधारित Rust कोडसाठी स्वयंचलित औपचारिक पडताळणी साध्य करणे" मध्ये SAFE फ्रेमवर्क "डेटा संश्लेषण-मॉडेल फाइन-ट्यूनिंग" च्या स्व-उत्क्रांती यंत्रणेद्वारे प्रशिक्षण डेटाच्या कमतरतेची समस्या कशी कमी करते, ज्यामुळे Rust कोड औपचारिक पडताळणीची कार्यक्षमता आणि अचूकता लक्षणीयरीत्या सुधारते याबद्दल माहिती दिली. Illuin Technology मधील R&D संचालक Gautier Viaud यांनी "ColPali: व्हिज्युअल लँग्वेज मॉडेलवर आधारित कार्यक्षम डॉक्युमेंट पुनर्प्राप्ती" भाषणात सांगितले की ColBERT आर्किटेक्चर आणि PaliGemma मॉडेलवर आधारित टीमने तयार केलेली ColPali प्रणाली ग्राफिक आणि टेक्स्ट माहिती एकत्र करून डॉक्युमेंट पुनर्प्राप्तीची अचूकता आणि कार्यक्षमता प्रभावीपणे कशी सुधारते. शेवटी, Dynamia.ai चे CEO Xiao Zhang यांनी "Heterogeneous AI इन्फ्रास्ट्रक्चरच्या K8s क्लस्टर क्षमता अनलॉक करणे: HAMi ची शक्ती सोडवणे" मध्ये HAMi च्या मदतीने heterogeneous GPU संसाधनांचे अधिक चांगले व्यवस्थापन आणि शेड्युल कसे करावे आणि AI इन्फ्रास्ट्रक्चरचा उपयोग दर आणि observability कसा सुधारायचा याबद्दल माहिती दिली.

विविध संवाद आणि पहिल्या दिवसाचे Highlights

उच्च-घनतेच्या Keynote भाषणांव्यतिरिक्त, परिषदेत अनेक विशेष युनिट्स देखील होते. Closed-door Meeting युनिटमध्ये सीमा-पार सहकार्याला प्रोत्साहन देण्यासाठी धोरणात्मक संवाद आणि उद्योगातील सखोल देवाणघेवाण यावर लक्ष केंद्रित केले. Showcase Sessions मध्ये उद्योगांमधील आणि संशोधन संस्थांमधील नवीनतम AI तंत्रज्ञान उत्पादने सादर करण्यावर लक्ष केंद्रित केले, ज्यामुळे मोठ्या संख्येने अभ्यागतांना थांबायला आणि संवाद साधायला आकर्षित केले. Competition Sessions मध्ये जगभरातील AI आणि रोबोटिक्स डेव्हलपर, अभियंते आणि रोबोटिक्स उत्साही लोकांनी ओपन सोर्स SO-ARM100 रोबोटिक आर्म किटवर लक्ष केंद्रित केले आणि imitation learning चे व्यावहारिक संशोधन केले. या किटमध्ये Hugging Face चे LeRobot फ्रेमवर्क एकत्रित केले आहे आणि NVIDIA च्या AI आणि रोबोटिक्स तंत्रज्ञानाचा समावेश आहे, जे ACT आणि Diffusion Policy सह अत्याधुनिक AI आर्किटेक्चरला सपोर्ट करते आणि सहभागींना एक मजबूत तांत्रिक आधार प्रदान करते. सहभागींनी वास्तविक परिस्थितींमध्ये त्याचे परिणाम आणि व्यवहार्यता यांचे सर्वंकष मूल्यांकन करण्यासाठी व्यावहारिक संशोधन केले.

Workshop Sessions ने OpenHarmony इकोसिस्टमला मुख्य विषय म्हणून घेतले आणि Open Atom Open Source Foundation द्वारे incubate आणि ऑपरेट केलेल्या ओपन सोर्स प्रोजेक्टचे परीक्षण केले. OpenHarmony सर्व-परिस्थिती, सर्व-कनेक्शन आणि सर्व-बुद्धिमत्ता युगासाठी एक बुद्धिमान टर्मिनल ऑपरेटिंग सिस्टम फ्रेमवर्क तयार करण्यासाठी, एक open, जागतिक आणि नाविन्यपूर्ण आघाडीचे वितरित ऑपरेटिंग सिस्टम प्लॅटफॉर्म तयार करण्यासाठी, विविध बुद्धिमान उपकरणांना सेवा देण्यासाठी आणि इंटरनेट ऑफ एव्हरीथिंग उद्योगाच्या विकासास मदत करण्यासाठी वचनबद्ध आहे. परिषदेच्या ठिकाणी, सहभागींनी multi-device सहकार्य आणि lightweight सिस्टम डिझाइनमधील OpenHarmony च्या मुख्य फायद्यांविषयी अनेक व्यावहारिक कार्यशाळांद्वारे सखोल माहिती घेतली आणि ड्रायव्हर डेव्हलपमेंटपासून ते ॲप्लिकेशन deployment पर्यंतच्या महत्त्वाच्या प्रक्रियांमध्ये वैयक्तिकरित्या भाग घेतला. Hands-on सरावाने केवळ विकासकांना "तळापासून शेवटपर्यंत" तांत्रिक मार्ग उघडण्यास मदत केली नाही, तर सिस्टम-स्तरीय विकास आणि डीबगिंग क्षमतांमध्ये देखील सर्वंकष सुधारणा केली.

GOSIM AI पॅरिस २०२५ Day 1 चा अजेंडा यशस्वीपणे पार पडला आहे, परंतु उत्साह अजूनही कायम आहे. उद्या, परिषद AI मॉडेल, AI इन्फ्रास्ट्रक्चर, AI ॲप्लिकेशन्स आणि एम्बोडीड इंटेलिजन्स या चार प्रमुख मंचांवर प्रगती करत राहील आणि बहुप्रतिक्षित PyTorch Day चे स्वागत करेल, ज्यामध्ये आणखी मोठे पाहुणे आणि फर्स्ट-लाइन प्रात्यक्षिक सामग्री लवकरच येत आहे, त्यामुळे संपर्कात रहा!