अलीकडेच, गुगलने एजंट्ससाठी Agent2Agent नावाचा एक नवीन ओपन प्रोटोकॉल सादर केला, ज्याला A2A असेही म्हणतात. त्याच वेळी, अलीबाबा क्लाउडच्या बैलियानने MCP मध्ये प्रवेश करण्याची घोषणा केली. A2A आणि MCP म्हणजे काय याबद्दल सविस्तर माहिती पाहूया.
या प्रोटोकॉल समजून घेण्यासाठी, राष्ट्रांमधील राजनैतिक संबंधांचेउदाहरण घेऊ. प्रत्येक AI एजंटला एक लहान देश मानूया, ज्याची स्वतःची भाषा आणि चालीरीती आहेत. हे ‘देश’ एकाच इमारतीत असलेल्या दूतावासांमध्ये राहतात आणि संवाद साधण्याचा, व्यापार करण्याचा आणि माहितीची देवाणघेवाण करण्याचा प्रयत्न करतात.
एका आदर्श परिस्थितीत, या राष्ट्रांचे मैत्रीपूर्ण संबंध असतील आणि ते राजनैतिक नियमांचे स्पष्टपणे पालन करतील, ज्यामुळे त्यांना अखंडपणे संवाद साधता येईल, करारांवर स्वाक्षरी करता येईल आणि एका परिषदेच्या टेबलाभोवती आंतरराष्ट्रीय प्रकल्पांवर सहयोग करता येईल.
परंतु, वास्तव हे आहे की प्रत्येक दूतावास वेगवेगळ्या प्रोटोकॉलसह स्वतंत्रपणे कार्य करतो. परिणामी, ‘देश अ’ सोबत साधा व्यापार करार सुरू करण्यासाठी तरतुदी, प्रमाणपत्रे, भाषांतर आणि विशेष किल्लीसह अनेक आवश्यकता पूर्ण करणे आवश्यक आहे. ‘देश ब’ आणि ‘देश क’ यांच्याशी संपर्क साधण्यासाठी अनेक वेळा अशाच प्रक्रियेची पुनरावृत्ती करणे आवश्यक आहे. हा तदर्थ, खंडित आणि बहुआयामी दृष्टीकोन संवाद खर्चात वाढ करतो, कारण प्रत्येक संवादावर अतिरिक्त ‘माहिती शुल्क’ लागतो.
भूतकाळात, AI एजंट्सना सहयोग करण्याचा प्रयत्न करताना अशाच अडचणी येत होत्या.
उदाहरणार्थ, तुमच्याकडे ईमेलला स्वयंचलितपणे प्रतिसाद देणारा एजंट आणि वेळापत्रक तयार करण्यासाठी कॅलेंडर ऍप्लिकेशनमध्ये समाकलित केलेला दुसरा एजंट असू शकतो. तथापि, हे AI घटक थेट संवाद साधण्यासाठी संघर्ष करतात, ज्यामुळे माहितीची व्यक्तिचलितपणे कॉपी आणि पेस्ट करणे किंवा कस्टम-बिल्ट इंटरफेसवर अवलंबून राहावे लागते.
परिणामी, AI एजंट्स एकाकीपणे कार्य करतात, त्यांची आंतरकार्यक्षमता कमी असते. हे विभाजन वापरकर्त्यांना निराश करते, कारण त्यांना अनेक AI ऍप्लिकेशन्समध्ये नेव्हिगेट करावे लागते आणि AI ची क्षमता मर्यादित होते. जटिल कार्ये जी मल्टी-एजंट सहकार्याने पूर्ण केली जाऊ शकतात, ती कृत्रिमरित्या वैयक्तिक सिलोसमध्ये मर्यादित आहेत.
ही परिस्थिती दुसर्या महायुद्धानंतरच्या परिदृश्यासारखी आहे, जिथे प्रत्येक AI एजंट स्वतंत्रपणे कार्य करतो, त्यांच्यात एकसमान नियम नाहीत आणि त्यांना संवादाचे अडथळे येतात. सध्याचे AI इकोसिस्टम युद्धानंतरच्या ओसाड भूमीसारखे आहे, जिथे डेटा आणि कार्यक्षमतेमध्ये प्रवेश करण्यासाठी विशिष्ट इंटरफेस आणि प्रोटोकॉलचे पालन करणे आवश्यक आहे. मानकांची अनुपस्थिती प्रत्येक नवीन सहकार्याच्या संबंधात अतिरिक्त ‘शुल्क’ लावते, ज्यामुळे एक विस्कळीत आणि अक्षम AI इकोसिस्टम तयार होते, जी एकाकीपणा आणि स्वार्थाने दर्शविली जाते.
AI उद्योग एजंट्स आणि बाह्य साधनांमध्ये अखंड संवाद सुलभ करण्यासाठी सार्वत्रिकरित्या स्वीकारलेला प्रोटोकॉल स्थापित करण्याच्या शक्यतेचा शोध घेत आहे. गुगल आणि अँथ्रोपिक आघाडीवर आले आहेत, प्रत्येकाने एक उपाय प्रस्तावित केला आहे: A2A प्रोटोकॉल आणि MCP प्रोटोकॉल.
A2A प्रोटोकॉल
A2A प्रोटोकॉल, म्हणजेच Agent2Agent, AI एजंट्सना थेट संवाद साधण्यास आणि सहयोग करण्यास सक्षम करतो.
A2A प्रोटोकॉलचा प्राथमिक उद्देश विविध मूळ आणि विक्रेत्यांच्या एजंट्सना एकमेकांना समजून घेण्यास आणि सहकार्य करण्यास सक्षम करणे आहे, जसे की जागतिक व्यापार संघटनेचे व्यापार अडथळे कमी करण्याचे प्रयत्न आहेत.
A2A स्वीकारून, विविध विक्रेते आणि फ्रेमवर्कचे एजंट्स एका मुक्त व्यापार क्षेत्रात सामील होऊ शकतात, सामान्य भाषेत संवाद साधू शकतात आणि वैयक्तिक एजंट्सच्या क्षमतेच्या पलीकडे असलेली जटिल कार्ये पूर्ण करण्यासाठी अखंडपणे सहयोग करू शकतात.
A2A कसे कार्य करते हे स्पष्ट करण्यासाठी, खालील उदाहरणे विचारात घ्या:
1. एजंट = राष्ट्रीय राजनैतिक
प्रत्येक एजंट एका देशाच्या दूतावासाचे प्रतिनिधित्व करणार्या राजदूताचे कार्य करतो. A2A प्रोटोकॉलचा उद्देश एकसमान राजनैतिक शिष्टाचार आणि संवाद प्रक्रिया स्थापित करणे आहे. पूर्वी, ‘देश अ’ चे राजदूत फक्त फ्रेंचमध्ये संवाद साधत होते, तर ‘देश ब’ चे लोक सिरिलिक लिपी वापरत होते आणि ‘देश क’ प्राचीन सोन्याच्या पानाच्या पत्राद्वारे पत्रव्यवहार करण्याची मागणी करत होते. A2A प्रोटोकॉल हे सुनिश्चित करतो की सर्व सहभागी पूर्व-सहमत भाषेत संवाद साधू शकतात, समान स्वरूपात कागदपत्रे सादर करू शकतात आणि सहमत झालेल्या निष्कर्षांचे पालन करू शकतात.
2. एजंट कार्ड = राजनैतिक क्रेडेन्शियल्स / ॲम्बेसेडरचे बिझनेस कार्ड
A2A फ्रेमवर्कमध्ये, प्रत्येक एजंटला ‘एजंट कार्ड’ प्रकाशित करणे आवश्यक आहे, जे राजदूताच्या बिझनेस कार्डसारखे आहे. त्यात एजंटचे नाव, आवृत्ती, क्षमता आणि समर्थित भाषा किंवा स्वरूप यासारखे तपशील असतात.
ज्याप्रमाणे राजदूताचे बिझनेस कार्ड त्यांची भूमिका आणि संलग्नता दर्शवते, त्याचप्रमाणे एजंट कार्ड एजंटची कौशल्ये, प्रमाणीकरण पद्धती आणि इनपुट/आउटपुट स्वरूप सूचीबद्ध करते. हे इतर राजदूतांना क्षमता त्वरित ओळखण्यास आणि समजून घेण्यास सक्षम करते, ज्यामुळे संवाद अडथळे कमी होतात.
3. कार्य = द्विपक्षीय किंवा बहुपक्षीय राजनैतिक प्रकल्प
कार्य ही संकल्पना A2A च्या केंद्रस्थानी आहे. जेव्हा एखादा एजंट दुसर्या एजंटला एखादे कार्य सोपवू इच्छितो, तेव्हा तो ‘सहकार्य प्रकल्प इरादा पत्र’ जारी करतो. स्वीकृती मिळाल्यानंतर, दोन्ही पक्ष प्रगतीचा मागोवा घेण्यासाठी आणि पूर्ण होईपर्यंत माहितीची देवाणघेवाण करण्यासाठी एक Task ID रेकॉर्ड करतात.
राजनैतिक दृष्टीने, एक राष्ट्र दुसर्या राष्ट्राला असे म्हणू शकते, ‘आम्ही सीमा ओलांडणारी हाय-स्पीड रेल्वे लाईन तयार करण्यासाठी सहकार्य करू इच्छितो; कृपया तुमची अभियांत्रिकी टीम पाठवा.’ हे A2A कार्याला प्रतिबिंबित करते, जिथे आरंभ करणारा पक्ष आवश्यकतांची रूपरेषा देतो, दूरस्थ एजंट स्वीकारतो आणि दोन्ही पक्ष संपूर्ण प्रकल्पादरम्यान नियमितपणे प्रगती अद्यतनित करतात.
संदेश हे प्रकल्पाच्या सुरुवातीच्या किंवा मधल्या टप्प्यात देवाणघेवाण केलेल्या संवादांचे प्रतिनिधित्व करतात, जसे की राजनैतिक केबल्स, नोट्स आणि दूतांचे आदानप्रदान.
4. पुश नोटिफिकेशन = राजनैतिक दूतावास बुलेटिन
A2A मध्ये, जर एखादे कार्य दीर्घकालीन प्रकल्प असेल ज्यास पूर्ण होण्यासाठी जास्त वेळ लागत असेल, तर दूरस्थ एजंट पुश नोटिफिकेशनद्वारे आरंभ करणार्या पक्षाला अद्यतन देऊ शकतो, जसे की एखादा देश दीर्घकालीन पायाभूत सुविधा प्रकल्पावर वेळोवेळी अद्यतने प्रदान करतो. हे एसिंक्रोनस सहकार्याच्या क्षमता वाढवते.
5. प्रमाणीकरण आणि सुरक्षा = राजनैतिक विशेषाधिकार आणि प्रोटोकॉल
A2A एंटरप्राइझ-ग्रेड प्रमाणीकरण धोरणे वापरते, ज्यामध्ये दोन्ही संवाद पक्षांना प्रतिरूपण किंवा दुर्भावनापूर्ण हेरगिरी टाळण्यासाठी क्रेडेन्शियल्स सत्यापित करणे आवश्यक आहे. ही यंत्रणा राजनैतिक विशेषाधिकार आणि प्रोटोकॉलच्या समांतर आहे.
थोडक्यात, A2A आंतरराष्ट्रीय राजनैतिक संबंध किंवा व्यावसायिक सहकार्याच्या गतिशीलतेचे प्रतिबिंब आहे, जे प्रमाणित संवाद आणि सुरक्षिततेवर जोर देते.
MCP प्रोटोकॉल
MCP प्रोटोकॉल, किंवा मॉडेल कॉन्टेक्स्ट प्रोटोकॉल, हे ॲन्थ्रोपिकने नोव्हेंबर 2024 मध्ये सादर केलेले आणि ओपन-सोर्स केलेले एक मानक आहे.
A2A AI राजदूतांदरम्यानच्या संवाद प्रक्रियेला संबोधित करत असताना, एक सतत आव्हान कायम आहे: विश्वसनीय माहिती स्रोतांचा अभाव. अत्यंत प्रभावी राजदूत किंवा व्यावसायिक अधिकारीसुद्धा आंतरराष्ट्रीय परिस्थिती आणि संसाधनांच्या वाटपाबद्दल अचूक माहिती नसल्यास प्रभावीपणे कार्य करण्यास सक्षम नसतात.
आधुनिक राजदूत त्यांची कर्तव्ये पार पाडण्यासाठी व्हिसा प्रणाली, आंतरराष्ट्रीय सेटलमेंट प्रणाली आणि गुप्तचर डेटाबेस यांसारख्या बाह्य साधनांवर अवलंबून असतात. त्याचप्रमाणे, जटिल जबाबदाऱ्या स्वीकारणाऱ्या एजंटला विविध डेटाबेस, डॉक्युमेंट सिस्टम, एंटरप्राइझ ऍप्लिकेशन्स आणि अगदी हार्डवेअर उपकरणांशी कनेक्ट करणे आवश्यक आहे.
याची तुलना राजदूतांसाठी एक व्यापक गुप्तचर संस्था स्थापन करण्या आणि त्यांना त्यांचे कार्य सुलभ करण्यासाठी साधने उपलब्ध करून देण्यासारखे आहे.
पूर्वी, एजंट्सना कस्टम प्लगइन विकसित करावे लागत होते आणि वेगवेगळ्या साधनांशी सखोलपणे समाकलित करावे लागत होते, जे श्रमintensive्ह आणि वेळखाऊ होते. तथापि, MCP आता प्रक्रिया सुव्यवस्थित करण्यासाठी उपलब्ध आहे.
MCP मोठ्या भाषिक मॉडेल्स आणि बाह्य डेटा स्रोत आणि साधनांमधील संवाद प्रमाणित करते. ॲन्थ्रोपिकने MCP ची तुलना AI ऍप्लिकेशन्ससाठी USB-C पोर्टशी केली आहे.
USB-C हे उपकरणांसाठी एक सार्वत्रिक इंटरफेस म्हणून काम करते, जे एकाच पोर्टद्वारे चार्जिंग आणि डेटा हस्तांतरण दोन्ही हाताळते. MCP चा उद्देश AI क्षेत्रात एक सार्वत्रिक इंटरफेस तयार करणे आहे, ज्यामुळे विविध मॉडेल्स आणि बाह्य प्रणाली प्रत्येक वेळी कस्टम इंटिग्रेशन सोल्यूशन्स विकसित करण्याऐवजी समान प्रोटोकॉल वापरून कनेक्ट होऊ शकतील.
डेटाबेस, शोध इंजिन किंवा तृतीय-पक्ष ऍप्लिकेशन्सशी कनेक्ट होणारे AI मॉडेल्स जर MCP ला सपोर्ट करत असतील, तर ते अखंडपणे संवाद साधू शकतात.
MCP क्लायंट-सर्व्हर आर्किटेक्चर वापरते:
1. MCP सर्व्हर = एकत्रित गुप्तचर संस्था
संघटना किंवा व्यक्ती डेटाबेस, फाइल सिस्टम, कॅलेंडर आणि तृतीय-पक्ष सेवा MCP सर्व्हरमध्ये समाविष्ट करू शकतात. हे सर्व्हर MCP प्रोटोकॉलचे पालन करतात, समान स्वरूपात ऍक्सेस एंडपॉइंट्स उघड करतात, ज्यामुळे MCP क्लायंट मानकांचे पालन करणारा कोणताही एजंट विनंत्या पाठवू शकतो, माहिती मिळवू शकतो किंवा ऑपरेशन्स कार्यान्वित करू शकतो.
2. MCP क्लायंट = राजदूतांनी वापरलेले टर्मिनल उपकरण
एका एजंट राजदूताकडे समर्पित टर्मिनल उपकरण असते, जे त्यांना ‘वित्तीय प्रणालीतून इन्व्हेंटरी डेटा मिळवा’, ‘एका API ला विनंती सबमिट करा’ किंवा ‘PDF डॉक्युमेंट मिळवा’ यासारखे कमांड इनपुट करण्यास सक्षम करते.
MCP शिवाय, विविध सिस्टम्सशी समाकलित होण्यासाठी भिन्न ऍक्सेस कोड लिहावे लागतात, जे किचकट आहे. तथापि, MCP सह, प्रोटोकॉलला सपोर्ट करणारे क्लायंट विविध MCP सर्व्हरमध्ये सहजपणे स्विच करू शकतात, माहिती मिळवू शकतात आणि व्यवसाय प्रक्रिया कार्यान्वित करू शकतात.
थोडक्यात, MCP AI एजंट्स आणि बाह्य संसाधनांमध्ये अखंड एकत्रीकरण सुलभ करते.
A2A आणि MCP मधील फरक
A2A आणि MCP मधील फरक स्पष्ट करण्यासाठी, एका काल्पनिक आंतरराष्ट्रीय शिखर परिषदेचा विचार करा, जिथे राष्ट्राध्यक्ष (कंपन्यांच्या AI एजंट्सचे प्रतिनिधित्व करणारे) एका आंतरराष्ट्रीय कार्यावर सहयोग करण्यासाठी एकत्र येतात, जसे की जागतिक आर्थिक विश्लेषण अहवाल तयार करणे.
सार्वत्रिक प्रोटोकॉलशिवाय, अशी बैठक अक्षरशः अशक्य आहे, कारण प्रत्येक प्रतिनिधी वेगळी भाषा बोलतो. तथापि, A2A प्रोटोकॉलसह, सर्व प्रतिनिधी बैठकीत प्रवेश करण्यापूर्वी ‘A2A व्हिएन्ना डिप्लोमॅटिक कन्व्हेन्शन’ वर स्वाक्षरी करतात, एकसमान स्वरूपात संवाद साधण्यास, स्वतःची ओळख पटविण्यास, त्यांचे हेतू स्पष्ट करण्यास आणि प्रतिसाद देताना मागील भाषणांचे आयडी उद्धृत करण्यास सहमत होतात.
हे ‘एजंट जी’ ला ‘एजंट ओ’ ला A2A स्वरूपात संदेश पाठविण्यास सक्षम करते आणि ‘एजंट ओ’ त्यानुसार प्रतिसाद देतो. वेगवेगळ्या कंपन्यांच्या AI एजंट्समधील हा पहिला अबाधित संवादाचा प्रसंग आहे.
चर्चांदरम्यान, AI प्रतिनिधींना डेटाचा सल्ला घ्यावा लागतो किंवा विश्लेषणासाठी साधने वापरावी लागतात. ॲन्थ्रोपिकचे ‘एजंट ए’ बाह्य डेटा किंवा टूल सपोर्टसाठी MCP प्रणाली वापरण्याची सूचना करतात.
परिषदेच्या सभागृहासमोर ‘MCP एकाचवेळी भाषांतर कक्ष’ उभारला जातो, ज्यात तज्ञ MCP द्वारे विनंत्या प्राप्त झाल्यावर एकसमान भाषेत प्रतिसाद देऊ शकतात.
उदाहरणार्थ, ‘एजंट क्यू’ ला गणनेसाठी त्यांच्या क्लाउड डेटाबेसमध्ये प्रवेश करण्याची आवश्यकता आहे. कोणालातरी परत देशात पाठवण्याऐवजी, ते डेटाबेस X मधून डेटासाठी MCP विनंती पाठवतात. MCP डेटाबेस प्रशासक विनंतीचे भाषांतर करतो, परिणाम मिळवतो आणि ‘एजंट क्यू’ ला MCP भाषेत प्रतिसाद देतो. ही संपूर्ण प्रक्रिया इतर एजंट्ससाठी पारदर्शक आहे, ज्यांना ‘एजंट क्यू’ ने उद्धृत केलेला डेटा समजतो, कारण MCP भाषांतर एका मान्यताप्राप्त स्वरूपात आहे.
अहवाल लेखन जसजसे पुढे जाते, तसतसे ‘एजंट जी’ आणि ‘एजंट ए’ यांना त्यांच्या संबंधित योगदानांचे एकत्रीकरण करण्याची आवश्यकता आहे हे लक्षात येते. ‘एजंट जी’ संख्यात्मक विश्लेषणात तज्ञ आहे, तर ‘एजंट ए’ भाषिक सारांशामध्ये उत्कृष्ट आहे.
‘एजंट जी’ A2A द्वारे GDP वाढीचा डेटा प्रसारित करतो आणि ‘एजंट ए’ MCP द्वारे एक्सेल स्प्रेडशीट प्लगइनशी कनेक्ट होतो, डेटा ट्रेंड सत्यापित करतो आणि सारांश परिच्छेदासह प्रतिसाद देतो.
या परिस्थितीत, A2A एजंट्समधील संवाद सुलभ करते, तर MCP एजंट्सना बाह्य साधने आणि माहितीमध्ये प्रवेश करण्यास सक्षम करते. एकत्रितपणे, हे प्रोटोकॉल AI च्या संयुक्त राष्ट्रांसाठी तयार केलेला संवाद करार तयार करतात. हे प्रोटोकॉल अस्तित्वात असल्याने, AI एजंट प्रभावीपणे सहयोग करू शकतात, एक आंतरकनेक्टेड AI इकोसिस्टम तयार करू शकतात.
A2A हे राजनैतिक संवादासाठी समर्पित हॉटलाइनसारखे आहे, जे थेट एजंट संवादाला संबोधित करते. MCP हे एकाचवेळी भाषांतर आणि संसाधन-सामायिकरण प्रणालीसारखे आहे, जे बाह्य माहितीशी कनेक्ट होणाऱ्या बुद्धिमान घटकांच्या समस्येचे निराकरण करते.
A2A आणि MCP चा उदय AI उद्योगाच्या स्पर्धेऐवजी सहकार्याकडे होणाऱ्या उत्क्रांतीची घोषणा करतो. असंख्य AI एजंट्स वेबसाइट्ससारखे तैनात केले जातील, A2A द्वारे शोध आणि संवाद साधतील आणि MCP द्वारे संसाधने मिळवतील आणि ज्ञान सामायिक करतील.