एजेंट दुनिया में A2A और MCP प्रोटोकॉल को समझना
हाल ही में, Google ने एजेंटों के लिए एक नया ओपन प्रोटोकॉल पेश किया, जिसे एजेंट2एजेंट या संक्षेप में A2A कहा जाता है। साथ ही, अलीबाबा क्लाउड के Bailian ने भी MCP में अपनी शुरुआत की घोषणा की। आइए गहराई से जानते हैं कि A2A और MCP आखिर क्या हैं।
इन प्रोटोकॉल को समझने के लिए, राष्ट्रों के बीच कूटनीति की उपमा पर विचार करें। कल्पना कीजिए कि प्रत्येक AI एजेंट एक छोटे देश के रूप में है जिसकी अपनी भाषा और रीति-रिवाज हैं। ये ‘देश’ एक ही इमारत के भीतर स्थित दूतावासों के माध्यम से संवाद करने, व्यापार करने और जानकारी का आदान-प्रदान करने का प्रयास करते हैं।
एक आदर्श परिदृश्य में, ये राष्ट्र सौहार्दपूर्ण संबंध बनाए रखेंगे और कूटनीतिक नियमों के एक स्पष्ट सेट का पालन करेंगे, जिससे वे निर्बाध रूप से बातचीत कर सकेंगे, समझौतों पर हस्ताक्षर कर सकेंगे और एक सम्मेलन कक्ष के चारों ओर अंतर्राष्ट्रीय परियोजनाओं पर सहयोग कर सकेंगे।
हालांकि, वास्तविकता यह है कि प्रत्येक दूतावास असमान प्रोटोकॉल के साथ स्वतंत्र रूप से संचालित होता है। नतीजतन, ‘देश ए’ के साथ एक साधारण व्यापार समझौते को शुरू करने के लिए, प्रावधानों, प्रमाणपत्रों, अनुवादों और विशेष चाबियों सहित कई आवश्यकताओं को पूरा करना पड़ता है। ‘देश बी’ और ‘देश सी’ के साथ जुड़ने के लिए, समान प्रक्रियाओं को कई बार दोहराना पड़ता है। यह तदर्थ, खंडित और बहुआयामी दृष्टिकोण संचार लागत को बढ़ाता है, प्रत्येक बातचीत के साथ एक अतिरिक्त ‘सूचना टैरिफ’ लगता है।
अतीत में, AI एजेंटों को सहयोग करने का प्रयास करते समय इसी तरह की दुर्दशा का सामना करना पड़ा।
उदाहरण के लिए, आपके पास एक एजेंट हो सकता है जो स्वचालित रूप से ईमेल का जवाब देता है और दूसरा कैलेंडर एप्लिकेशन में एकीकृत होता है ताकि शेड्यूलिंग में सहायता मिल सके। हालांकि, ये AI इकाइयां सीधे संवाद करने के लिए संघर्ष करती हैं, जिससे जानकारी की मैन्युअल प्रतिलिपि और चिपकाने की आवश्यकता होती है या कस्टम-निर्मित इंटरफेस पर निर्भरता होती है।
नतीजतन, AI एजेंट अलगाव में काम करते हैं, खराब अंतर-संचालन क्षमता प्रदर्शित करते हैं। यह विखंडन उन उपयोगकर्ताओं को निराश करता है जिन्हें कई AI अनुप्रयोगों के बीच नेविगेट करना होता है और AI की क्षमता को सीमित करता है। जटिल कार्य जो बहु-एजेंट सहयोग के माध्यम से पूरे किए जा सकते हैं, उन्हें कृत्रिम रूप से व्यक्तिगत साइलो के भीतर सीमित कर दिया जाता है।
यह स्थिति द्वितीय विश्व युद्ध के बाद के परिदृश्य को दर्शाती है, जहां प्रत्येक AI एजेंट स्वायत्त रूप से कार्य करता है, जिसमें एकीकृत नियमों का अभाव होता है और संचार बाधाओं का सामना करना पड़ता है। वर्तमान AI पारिस्थितिकी तंत्र युद्ध के बाद की बंजर भूमि जैसा दिखता है, जिसके लिए डेटा और कार्यात्मकताओं तक पहुंचने के लिए विशिष्ट इंटरफेस और प्रोटोकॉल के पालन की आवश्यकता होती है। मानकों की अनुपस्थिति प्रत्येक नए सहयोगी संबंध के साथ अतिरिक्त ‘टैरिफ’ लगाती है, जिससे एक अलग और अक्षम AI पारिस्थितिकी तंत्र बनता है जो अलगाव और स्वार्थ की विशेषता है।
AI उद्योग एजेंटों और बाहरी उपकरणों के बीच निर्बाध बातचीत को सुविधाजनक बनाने के लिए एक सार्वभौमिक रूप से स्वीकृत प्रोटोकॉल स्थापित करने की संभावना तलाश रहा है। Google और Anthropic अग्रणी के रूप में उभरे हैं, प्रत्येक ने एक समाधान प्रस्तावित किया है: A2A प्रोटोकॉल और MCP प्रोटोकॉल।
A2A प्रोटोकॉल
A2A प्रोटोकॉल, एजेंट2एजेंट का संक्षिप्त रूप है, AI एजेंटों को सीधे संवाद करने और सहयोग करने में सक्षम बनाता है।
A2A प्रोटोकॉल का प्राथमिक उद्देश्य विभिन्न मूल और विक्रेताओं के एजेंटों को एक-दूसरे को समझने और सहयोग करने में सक्षम बनाना है, जो विश्व व्यापार संगठन के व्यापार बाधाओं को कम करने के प्रयासों के समान है।
A2A को अपनाकर, विभिन्न विक्रेताओं और ढांचे के एजेंट एक मुक्त व्यापार क्षेत्र में शामिल हो सकते हैं, एक सामान्य भाषा का उपयोग करके संवाद कर सकते हैं और व्यक्तिगत एजेंटों की क्षमताओं से परे जटिल कार्यों को पूरा करने के लिए निर्बाध रूप से सहयोग कर सकते हैं।
यह समझाने के लिए कि A2A कैसे काम करता है, निम्नलिखित उपमाओं पर विचार करें:
1. एजेंट = राष्ट्रीय राजनयिक
प्रत्येक एजेंट एक देश के दूतावास का प्रतिनिधित्व करने वाले राजनयिक के रूप में कार्य करता है। A2A प्रोटोकॉल का उद्देश्य एक समान राजनयिक शिष्टाचार और संचार प्रक्रियाएं स्थापित करना है। पहले, ‘देश ए’ के राजनयिक विशेष रूप से फ्रांसीसी में संवाद करते थे, जबकि ‘देश बी’ के राजनयिक सिरिलिक लिपि का उपयोग करते थे, और ‘देश सी’ ने प्राचीन सोने की पत्ती पत्रों के माध्यम से पत्राचार की मांग की। A2A प्रोटोकॉल सुनिश्चित करता है कि सभी प्रतिभागी पूर्व-सहमत भाषा में संवाद कर सकते हैं, एक ही प्रारूप में दस्तावेज जमा कर सकते हैं और सहमत परिणामों को निष्पादित कर सकते हैं।
2. एजेंट कार्ड = राजनयिक प्रमाण पत्र / राजदूत का बिजनेस कार्ड
A2A ढांचे के भीतर, प्रत्येक एजेंट को एक ‘एजेंट कार्ड’ प्रकाशित करना आवश्यक है, जो एक राजनयिक के बिजनेस कार्ड के समान है, जिसमें एजेंट का नाम, संस्करण, क्षमताएं और समर्थित भाषाएं या प्रारूप जैसे विवरण शामिल हैं।
जिस तरह एक राजनयिक का बिजनेस कार्ड उनकी भूमिका और संबद्धता की पहचान करता है, उसी तरह एजेंट कार्ड एजेंट के कौशल, प्रमाणीकरण विधियों और इनपुट/आउटपुट प्रारूपों को सूचीबद्ध करता है। यह अन्य राजनयिकों को क्षमताओं को जल्दी से पहचानने और समझने में सक्षम बनाता है, जिससे संचार बाधाएं कम होती हैं।
3. कार्य = द्विपक्षीय या बहुपक्षीय राजनयिक परियोजना
कार्य अवधारणा A2A के लिए केंद्रीय है। जब कोई एजेंट किसी अन्य एजेंट को कोई कार्य सौंपने का इरादा रखता है, तो वह ‘सहयोग परियोजना आशय पत्र’ जारी करता है। स्वीकृति पर, दोनों पक्ष प्रगति को ट्रैक करने और पूर्ण होने तक जानकारी का आदान-प्रदान करने के लिए एक कार्य आईडी रिकॉर्ड करते हैं।
राजनयिक शब्दों में, एक राष्ट्र दूसरे को प्रस्ताव दे सकता है, ‘हम सीमा पार हाई-स्पीड रेल लाइन के निर्माण पर सहयोग करना चाहते हैं; कृपया अपनी इंजीनियरिंग टीम भेजें।’ यह एक A2A कार्य को दर्शाता है, जहां आरंभ करने वाला पक्ष आवश्यकताओं को रेखांकित करता है, दूरस्थ एजेंट स्वीकार करता है, और दोनों पक्ष पूरे प्रोजेक्ट में नियमित रूप से प्रगति अपडेट करते हैं।
संदेश परियोजना के प्रारंभिक या मध्यवर्ती चरणों के दौरान आदान-प्रदान किए गए संचार का प्रतिनिधित्व करते हैं, जो राजनयिक केबलों, नोट्स और दूत एक्सचेंजों के समान हैं।
4. पुश नोटिफिकेशन = राजनयिक दूतावास बुलेटिन
A2A में, यदि कोई कार्य एक लंबी अवधि की परियोजना है जिसके लिए विस्तारित पूर्णता समय की आवश्यकता होती है, तो दूरस्थ एजेंट आरंभ करने वाले पक्ष को पुश नोटिफिकेशन के माध्यम से अपडेट कर सकता है, जैसे कि एक देश लंबी अवधि की बुनियादी ढांचा परियोजना पर समय-समय पर अपडेट प्रदान करता है। यह अतुल्यकालिक सहयोग क्षमताओं को बढ़ाता है।
5. प्रमाणीकरण और सुरक्षा = राजनयिक विशेषाधिकार और प्रोटोकॉल
A2A एंटरप्राइज़-ग्रेड प्रमाणीकरण रणनीतियों को नियोजित करता है, जिसके लिए दोनों संचार करने वाले पक्षों को प्रतिरूपण या दुर्भावनापूर्ण जासूसी को रोकने के लिए क्रेडेंशियल्स को सत्यापित करने की आवश्यकता होती है। यह तंत्र राजनयिक विशेषाधिकारों और प्रोटोकॉल के समानांतर है।
संक्षेप में, A2A अंतर्राष्ट्रीय कूटनीति या व्यावसायिक सहयोग की गतिशीलता को दर्शाता है, जो मानकीकृत संचार और सुरक्षा पर जोर देता है।
MCP प्रोटोकॉल
MCP प्रोटोकॉल, या मॉडल संदर्भ प्रोटोकॉल, Anthropic द्वारा नवंबर 2024 में पेश किया गया और ओपन-सोर्स किया गया एक मानक है।
जबकि A2A AI राजनयिकों के बीच संचार प्रक्रिया को संबोधित करता है, एक स्थायी चुनौती बनी हुई है: विश्वसनीय जानकारी स्रोतों की अनुपस्थिति। सबसे वाक्पटु राजनयिक या व्यवसाय कार्यकारी भी अंतरराष्ट्रीय परिदृश्य और संसाधन आवंटन के बारे में सटीक जानकारी के बिना प्रभावी ढंग से काम करने के लिए सुसज्जित नहीं है।
आधुनिक राजनयिक अपने कर्तव्यों का पालन करने के लिए वीज़ा सिस्टम, अंतर्राष्ट्रीय निपटान प्रणाली और खुफिया डेटाबेस जैसे बाहरी उपकरणों पर निर्भर करते हैं। इसी तरह, जटिल जिम्मेदारियों को संभालने वाले एक एजेंट को विभिन्न डेटाबेस, दस्तावेज़ प्रणालियों, उद्यम अनुप्रयोगों और यहां तक कि हार्डवेयर उपकरणों से कनेक्ट होना चाहिए।
इसे राजनयिकों के लिए एक व्यापक खुफिया एजेंसी स्थापित करने और उन्हें अपने काम को सुविधाजनक बनाने के लिए उपकरणों तक पहुंच प्रदान करने के समान कहा जा सकता है।
पहले, एजेंटों को कस्टम प्लगइन्स विकसित करने और विभिन्न उपकरणों के साथ गहराई से एकीकृत करने की आवश्यकता होती थी, जो श्रमसाध्य और समय लेने वाला दोनों था। हालांकि, प्रक्रिया को सुव्यवस्थित करने के लिए MCP अब उपलब्ध है।
MCP बड़े भाषा मॉडल और बाहरी डेटा स्रोतों और उपकरणों के बीच बातचीत को मानकीकृत करता है। Anthropic MCP को AI अनुप्रयोगों के लिए USB-C पोर्ट के समान मानता है।
USB-C उपकरणों के लिए एक सार्वभौमिक इंटरफ़ेस के रूप में कार्य करता है, जो एक ही पोर्ट के माध्यम से चार्जिंग और डेटा स्थानांतरण को संभालता है। MCP का उद्देश्य AI डोमेन में एक सार्वभौमिक इंटरफ़ेस बनाना है, जो विभिन्न मॉडलों और बाहरी प्रणालियों को हर बार कस्टम एकीकरण समाधान विकसित करने के बजाय एक ही प्रोटोकॉल का उपयोग करके कनेक्ट करने में सक्षम बनाता है।
डेटाबेस, खोज इंजन या तृतीय-पक्ष अनुप्रयोगों से कनेक्ट होने वाले AI मॉडल निर्बाध रूप से संवाद कर सकते हैं यदि वे सभी MCP का समर्थन करते हैं।
MCP एक क्लाइंट-सर्वर आर्किटेक्चर को नियोजित करता है:
1. MCP सर्वर = समेकित खुफिया एजेंसी
संगठन या व्यक्ति डेटाबेस, फ़ाइल सिस्टम, कैलेंडर और तृतीय-पक्ष सेवाओं को MCP सर्वर में इनकैप्सुलेट कर सकते हैं। ये सर्वर MCP प्रोटोकॉल का पालन करते हैं, समान रूप से स्वरूपित एक्सेस एंडपॉइंट्स को उजागर करते हैं, जिससे MCP क्लाइंट मानकों के अनुरूप कोई भी एजेंट अनुरोध भेज सकता है, जानकारी प्राप्त कर सकता है या संचालन निष्पादित कर सकता है।
2. MCP क्लाइंट = राजनयिकों द्वारा उपयोग किए जाने वाले टर्मिनल उपकरण
एक एजेंट राजनयिक समर्पित टर्मिनल उपकरण ले जाता है, जो उन्हें ‘वित्तीय प्रणाली से इन्वेंट्री डेटा प्राप्त करें’, ‘एक API को एक अनुरोध सबमिट करें’ या ‘एक PDF दस्तावेज़ प्राप्त करें’ जैसे कमांड इनपुट करने में सक्षम बनाता है।
विभिन्न प्रणालियों के साथ एकीकृत करने के लिए MCP के बिना, विभिन्न एक्सेस कोड लिखने की आवश्यकता होती है, जो बोझिल है। हालांकि, MCP के साथ, प्रोटोकॉल का समर्थन करने वाले क्लाइंट विभिन्न MCP सर्वरों के बीच आसानी से स्विच कर सकते हैं, जानकारी प्राप्त कर सकते हैं और व्यावसायिक प्रक्रियाओं को निष्पादित कर सकते हैं।
संक्षेप में, MCP AI एजेंटों और बाहरी संसाधनों के बीच निर्बाध एकीकरण को सुविधाजनक बनाता है।
A2A और MCP के बीच अंतर
A2A और MCP के बीच अंतर को स्पष्ट करने के लिए, एक काल्पनिक अंतर्राष्ट्रीय शिखर सम्मेलन पर विचार करें जहां राष्ट्र के प्रमुख (कंपनियों के AI एजेंटों का प्रतिनिधित्व करते हैं) एक ट्रांसनेशनल कार्य पर सहयोग करने के लिए इकट्ठा होते हैं, जैसे कि एक वैश्विक आर्थिक विश्लेषण रिपोर्ट तैयार करना।
एक सार्वभौमिक प्रोटोकॉल के बिना, ऐसी बैठक वस्तुतः असंभव होगी, क्योंकि प्रत्येक प्रतिनिधि अलग-अलग भाषा बोलता है। हालांकि, A2A प्रोटोकॉल के साथ, सभी प्रतिनिधि बैठक में प्रवेश करने से पहले ‘A2A वियना राजनयिक सम्मेलन’ पर हस्ताक्षर करते हैं, एक समान प्रारूप का उपयोग करके संवाद करने, अपनी पहचान बताने, अपने इरादे बताने और जवाब देते समय पिछले发言 आईडी का हवाला देने के लिए सहमत होते हैं।
यह ‘एजेंट जी’ को A2A प्रारूप में ‘एजेंट ओ’ को एक संदेश भेजने में सक्षम बनाता है, और ‘एजेंट ओ’ तदनुसार प्रतिक्रिया करता है। यह विभिन्न कंपनियों के AI एजेंटों के बीच निर्बाध संचार का पहला उदाहरण है।
चर्चाओं के दौरान, AI प्रतिनिधियों को डेटा से परामर्श करने या विश्लेषण के लिए उपकरणों का उपयोग करने की आवश्यकता होती है। Anthropic के ‘एजेंट ए’ बाहरी डेटा या उपकरण समर्थन के लिए MCP सिस्टम का उपयोग करने का सुझाव देते हैं।
सम्मेलन कक्ष के साथ एक ‘MCP एक साथ व्याख्या कक्ष’ स्थापित किया गया है, जिसमें विशेषज्ञ हैं जो अनुरोध प्राप्त होने पर MCP के माध्यम से एक समान भाषा में जवाब दे सकते हैं।
उदाहरण के लिए, ‘एजेंट क्यू’ को गणना के लिए अपने क्लाउड डेटाबेस तक पहुंचने की आवश्यकता है। किसी को वापस देश भेजने के बजाय, वे डेटाबेस एक्स से डेटा के लिए एक MCP अनुरोध भेजते हैं। MCP डेटाबेस व्यवस्थापक अनुरोध का अनुवाद करता है, परिणाम प्राप्त करता है और MCP भाषा में ‘एजेंट क्यू’ को जवाब देता है। पूरी प्रक्रिया अन्य एजेंटों के लिए पारदर्शी है, जो ‘एजेंट क्यू’ द्वारा उद्धृत डेटा को समझते हैं क्योंकि MCP अनुवाद एक मान्यता प्राप्त प्रारूप में है।
जैसे-जैसे रिपोर्ट लेखन आगे बढ़ता है, ‘एजेंट जी’ और ‘एजेंट ए’ को पता चलता है कि उन्हें अपने संबंधित योगदानों को एकीकृत करने की आवश्यकता है। ‘एजेंट जी’ संख्यात्मक विश्लेषण में माहिर हैं, जबकि ‘एजेंट ए’ भाषा संक्षेपण में उत्कृष्टता प्राप्त करते हैं।
‘एजेंट जी’ A2A के माध्यम से GDP विकास दर डेटा का संचार करते हैं, और ‘एजेंट ए’ MCP के माध्यम से एक Excel स्प्रेडशीट प्लगइन से कनेक्ट होते हैं, डेटा रुझानों को सत्यापित करते हैं और एक सारांश पैराग्राफ के साथ प्रतिक्रिया करते हैं।
इस परिदृश्य में, A2A एजेंटों के बीच संचार को सुगम बनाता है, जबकि MCP एजेंटों को बाहरी उपकरणों और जानकारी तक पहुंचने में सक्षम बनाता है। साथ में, प्रोटोकॉल संयुक्त राष्ट्र के AI संस्करण के लिए एक अनुकूलित संचार समझौता बनाते हैं। इन प्रोटोकॉल के साथ, AI एजेंट प्रभावी ढंग से सहयोग कर सकते हैं, एक अंतर-जुड़े AI पारिस्थितिकी तंत्र का निर्माण कर सकते हैं।
A2A राजनयिक संचार के लिए एक समर्पित हॉटलाइन के समान है, जो प्रत्यक्ष एजेंट संचार को संबोधित करता है। MCP एक साथ व्याख्या और संसाधन-साझाकरण प्रणाली के समान है, जो बुद्धिमान संस्थाओं को बाहरी जानकारी से जोड़ने के मुद्दे को संबोधित करता है।
A2A और MCP का उदय प्रतियोगिता के बजाय सहयोग की ओर AI उद्योग के विकास का प्रतीक है। अनगिनत AI एजेंटों को वेबसाइटों की तरह तैनात किया जाएगा, A2A के माध्यम से खोज और संचार किया जाएगा और MCP के माध्यम से संसाधनों तक पहुंचा जाएगा और ज्ञान साझा किया जाएगा।