गूगल का एजेंट2एजेंट प्रोटोकॉल: एक गहराई से जानकारी

कृत्रिम बुद्धिमत्ता का परिदृश्य तेजी से विकसित हो रहा है, जिसमें एआई एजेंट एक महत्वपूर्ण घटक के रूप में उभर रहे हैं। एक एआई एजेंट अनिवार्य रूप से बड़े भाषा मॉडल (एलएलएम) की संज्ञानात्मक क्षमता को एक टूलकिट के साथ जोड़ता है जो इसे स्वायत्त रूप से कमांड निष्पादित करने, जानकारी प्राप्त करने और कार्यों को पूरा करने में सक्षम बनाता है। ये एजेंट उपयोगकर्ताओं से अनुरोधों का जवाब देते हैं या अन्य एजेंटों के साथ बातचीत करते हैं। एआई एजेंटों की क्षमता संचालन को बढ़ाने, जटिल प्रक्रियाओं को स्वचालित करने और विभिन्न व्यावसायिक कार्यों में दक्षता बढ़ाने में निहित है, जिससे व्यक्तिगत उत्पादकता में उल्लेखनीय वृद्धि होती है।

आम सहमति यह है कि एक सार्वभौमिक ‘एक आकार सभी के लिए फिट बैठता है’ एजेंट एआई एजेंटों से अपेक्षित विविध और जटिल कार्यों को प्रभावी ढंग से नहीं संभाल सकता है। इसका समाधान एजेंटिक वर्कफ़्लो में निहित है। ये स्वायत्त एआई एजेंटों के नेटवर्क द्वारा बनाए गए हैं जो न्यूनतम मानवीय देखरेख के साथ निर्णय ले सकते हैं, क्रियाएं निष्पादित कर सकते हैं और कार्यों का समन्वय कर सकते हैं।

एजेंट इंटरऑपरेबिलिटी के लिए गूगल का विजन: एजेंट2एजेंट प्रोटोकॉल (ए2ए)

गूगल ने 9 अप्रैल, 2025 को एजेंट2एजेंट (ए2ए) प्रोटोकॉल पेश किया। यह एआई एजेंटों के बीच निर्बाध संचार को सुविधाजनक बनाने के लिए डिज़ाइन किया गया है, जिससे उन्हें सुरक्षित रूप से डेटा का आदान-प्रदान करने और जटिल व्यावसायिक वर्कफ़्लो को स्वचालित करने की अनुमति मिलती है। यह उद्यम प्रणालियों और तीसरे पक्ष के प्लेटफार्मों के साथ बातचीत के माध्यम से प्राप्त किया जाता है।

ए2ए प्रोटोकॉल गूगल और 50 से अधिक उद्योग भागीदारों के बीच सहयोग का परिणाम है, जो सभी एआई एजेंट सहयोग के भविष्य के लिए एक समान दृष्टिकोण साझा करते हैं। महत्वपूर्ण बात यह है कि यह सहयोग विशिष्ट तकनीकों से परे है और खुले और सुरक्षित मानकों पर आधारित है।

ए2ए के मूल डिजाइन सिद्धांत

ए2ए प्रोटोकॉल के विकास के दौरान, गूगल और उसके भागीदारों को कई मौलिक सिद्धांतों द्वारा निर्देशित किया गया:

  • खुला और विक्रेता-अज्ञेयवादी: ए2ए प्रोटोकॉल खुला होना चाहिए, जिसका अर्थ है कि इसकी विशिष्टताएँ सार्वजनिक रूप से सुलभ हैं। यह सुनिश्चित करता है कि कोई भी डेवलपर या संगठन मालिकाना प्रतिबंधों के बिना प्रोटोकॉल को लागू कर सकता है। विक्रेता-अज्ञेयवादी का मतलब है कि प्रोटोकॉल किसी विशिष्ट विक्रेता की तकनीक से बंधा नहीं है। यह सभी प्रतिभागियों के लिए एक समान अवसर को बढ़ावा देता है।
  • सहयोग के लिए प्राकृतिक तौर-तरीके: ए2ए एजेंटों को संचार के अपने अंतर्निहित, असंरचित तरीकों का उपयोग करके सहयोग करने की अनुमति देता है। यह एजेंटों को उपकरणों से अलग करता है और ए2ए को मॉडल संदर्भ प्रोटोकॉल (एमसीपी) से अलग करता है।
  • मौजूदा मानकों पर निर्मित: मौजूदा आईटी बुनियादी ढांचे के साथ एकीकरण को सरल बनाने के लिए, प्रोटोकॉल HTTP, सर्वर-सेंट इवेंट्स (एसएसई), और JSON-RPC जैसे स्थापित मानकों पर बनाया गया है।
  • डिफ़ॉल्ट रूप से सुरक्षित: सुरक्षा एक सर्वोपरि चिंता है। ए2ए संवेदनशील डेटा की सुरक्षा और सुरक्षित इंटरैक्शन सुनिश्चित करने के लिए एंटरप्राइज़-ग्रेड प्रमाणीकरण और प्राधिकरण तंत्र को शामिल करता है।
  • डेटा तौर-तरीका अज्ञेयवादी: ए2ए केवल पाठ-आधारित संचार तक सीमित नहीं है। यह छवियों, ऑडियो और वीडियो स्ट्रीम सहित विभिन्न प्रकार के डेटा को संभाल सकता है।

ए2ए की कार्यक्षमताएँ: एजेंट सहयोग को सशक्त बनाना

ए2ए एजेंट इंटरैक्शन को सुव्यवस्थित करने के लिए कई अंतर्निहित कार्यक्षमताएँ प्रदान करता है:

  • क्षमता खोज: यह एजेंटों को अपनी क्षमताओं का विज्ञापन करने की अनुमति देता है। ग्राहक आसानी से पहचान सकते हैं कि कौन सा एजेंट किसी विशिष्ट कार्य के लिए सबसे उपयुक्त है। इसे एक डिजिटल बाज़ार की तरह समझें जहाँ एजेंट अपने कौशल और विशेषज्ञता का प्रदर्शन करते हैं।
  • कार्य और राज्य प्रबंधन: एक ग्राहक और एक एजेंट के बीच संचार कार्यों के निष्पादन के इर्द-गिर्द घूमता है। इन कार्यों को प्रोटोकॉल द्वारा परिभाषित किया गया है और इनका एक अच्छी तरह से परिभाषित जीवनचक्र होता है। एक कार्य के परिणाम को कलाकृति कहा जाता है। कार्यों और उनकी स्थितियों का प्रबंधन एक विश्वसनीय और ट्रैक करने योग्य वर्कफ़्लो सुनिश्चित करता है।
  • सुरक्षित सहयोग: एजेंट संदर्भ साझा करने, प्रतिक्रियाएँ प्रदान करने, कलाकृतियाँ वितरित करने या उपयोगकर्ता निर्देशों को रिले करने के लिए सुरक्षित रूप से संदेशों का आदान-प्रदान कर सकते हैं। यह एक सहयोगी वातावरण को सुविधाजनक बनाता है जहाँ एजेंट एक साथ निर्बाध रूप से काम कर सकते हैं।
  • उपयोगकर्ता अनुभव वार्ता: प्रत्येक संदेश में ‘भाग’ शामिल होते हैं, जो सामग्री के स्व-निहित टुकड़े होते हैं, जैसे कि उत्पन्न छवि। प्रत्येक भाग में एक सामग्री प्रकार निर्दिष्ट होता है, जो ग्राहक और दूरस्थ एजेंट दोनों को आवश्यक प्रारूप पर सहमत होने में सक्षम बनाता है। इस सुविधा में उपयोगकर्ता की यूआई क्षमताओं, जैसे कि आईफ्रेम, वीडियो और वेब फॉर्म की बातचीत भी शामिल है।

क्षमता खोज और उपयोगकर्ता अनुभव वार्ता सुविधाएँ विशेष रूप से सम्मोहक हैं क्योंकि वे एजेंट बाज़ारों के निर्माण का मार्ग प्रशस्त करती हैं। इन बाज़ारों में, प्रदाता अपने एजेंटों को सूचीबद्ध कर सकते हैं, और ग्राहक विशिष्ट कार्यों को करने के लिए सबसे उपयुक्त एजेंट का चयन कर सकते हैं।

हालांकि यह अवधारणा बेहद आशाजनक है और एआई एजेंट बाजार के विकास के लिए संभावित रूप से आवश्यक है, लेकिन इस दृष्टि को साकार करने के लिए केवल एक इंटरैक्शन प्रोटोकॉल को परिभाषित करने से कहीं अधिक की आवश्यकता है।

एजेंट2एजेंट प्रोटोकॉल अवधारणाओं को समझना

प्रोटोकॉल को रेखांकित करने वाली मूल अवधारणाओं को समझना प्रभावी कार्यान्वयन और उपयोग के लिए महत्वपूर्ण है। ये अवधारणाएँ पहले से ही एआई एजेंटों के कई डेवलपर्स से परिचित होंगी:

  • एजेंट कार्ड: यह एक सार्वजनिक मेटाडेटा फ़ाइल है जो एक एजेंट की क्षमताओं, कौशल, समापन बिंदु यूआरएल और प्रमाणीकरण आवश्यकताओं का विवरण देती है। एजेंट कार्ड खोज चरण में महत्वपूर्ण भूमिका निभाता है, जिससे उपयोगकर्ताओं को उपयुक्त एजेंट का चयन करने और यह समझने में सक्षम बनाया जाता है कि इसके साथ कैसे इंटरैक्ट किया जाए।
  • सर्वर: एक एजेंट जो JSON विशिष्टता में परिभाषित A2A प्रोटोकॉल विधियों को लागू करता है। अनिवार्य रूप से, सर्वर A2A प्रोटोकॉल के माध्यम से अपनी सेवाएं प्रदान करने वाला एजेंट है।
  • क्लाइंट: यह एक एप्लिकेशन या कोई अन्य एजेंट हो सकता है जो A2A सेवाओं का उपयोग करता है। क्लाइंट अनुरोधों को आरंभ करता है और सर्वर द्वारा प्रदान की जाने वाली क्षमताओं का उपयोग करता है।
  • कार्य: एजेंट के लिए कार्य की मूलभूत इकाई। क्लाइंट द्वारा आरंभ किया गया और सर्वर द्वारा किया गया, यह अपने जीवनचक्र के दौरान विभिन्न राज्यों से गुजरता है।
  • संदेश: क्लाइंट और एजेंट के बीच संचार आदान-प्रदान का प्रतिनिधित्व करता है। प्रत्येक संदेश की एक परिभाषित भूमिका होती है और इसमें भाग होते हैं।
  • भाग: यह एक संदेश या एक कलाकृति के भीतर मूल सामग्री इकाई है। एक भाग पाठ, एक फ़ाइल या संरचित डेटा हो सकता है। यह विभिन्न प्रकार के डेटा के लचीले संचार की अनुमति देता है।
  • कलाकृति: एक कार्य को पूरा करते समय एजेंट द्वारा उत्पन्न आउटपुट का प्रतिनिधित्व करता है। संदेशों की तरह, कलाकृतियों में भाग होते हैं।
  • स्ट्रीमिंग: प्रोटोकॉल स्ट्रीमिंग का समर्थन करता है, जिससे सर्वर क्लाइंट को वास्तविक समय में लंबे समय तक चलने वाले कार्यों की स्थिति पर अपडेट कर सकता है। यह निरंतर प्रतिक्रिया प्रदान करके उपयोगकर्ता अनुभव को बढ़ाता है।

एजेंट2एजेंट प्रोजेक्ट का वर्तमान परिदृश्य

A2A को हाल ही में सार्वजनिक किया गया है, और इसकी विशिष्टताएँ अब GitHub पर उपलब्ध हैं। अभी तक, प्रोटोकॉल का कोई आधिकारिक रोडमैप या उत्पादन-तैयार कार्यान्वयन नहीं है। हालांकि, गूगल 2025 के अंत में उत्पादन-तैयार संस्करण लॉन्च करने के लिए भागीदारों के साथ सक्रिय रूप से सहयोग कर रहा है।

A2A GitHub रिपॉजिटरी TypeScript और Python दोनों में कई कोड नमूने प्रदान करता है, साथ ही एक व्यापक डेमो एप्लिकेशन भी प्रदान करता है। यह एप्लिकेशन विभिन्न एजेंट विकास किट (एडीके) का उपयोग करके विकसित एजेंटों के बीच बातचीत को दर्शाता है।

हालांकि यह प्रयोग के लिए एक आधार प्रदान करता है, A2A को मिशन-महत्वपूर्ण अनुप्रयोगों में अपनाने से पहले एजेंटिक वर्कफ़्लो को तैनात करने के लिए उपयोग किए जाने वाले मौजूदा पारिस्थितिकी तंत्र के ढांचे और उपकरणों में एकीकृत किया जाना चाहिए।

बड़ी संख्या में प्रमुख खिलाड़ियों (विशेष रूप से, नींव मॉडल प्रदान करने वाली कोई भी कंपनी मौजूद नहीं है) से समर्थन जो प्रोटोकॉल परिभाषा पर गूगल के साथ काम कर रहे हैं, दृढ़ता से सुझाव देते हैं कि आवश्यक उपकरण जल्द ही उपलब्ध होंगे और A2A को प्रमुख एजेंट ढांचे में एकीकृत किया जाएगा।

A2A बनाम मॉडल संदर्भ प्रोटोकॉल (MCP): अंतर को समझना

मॉडल संदर्भ प्रोटोकॉल (एमसीपी), जिसे एंथ्रोपिक द्वारा विकसित किया गया है, अनुप्रयोगों को बड़े भाषा मॉडल को संदर्भ प्रदान करने में सक्षम बनाता है। एंथ्रोपिक एमसीपी को ‘एआई अनुप्रयोगों के लिए यूएसबी-सी पोर्ट’ के रूप में वर्णित करता है, जो एलएलएम को डेटा स्रोतों और उपकरणों से जोड़ने का एक मानकीकृत तरीका प्रदान करता है, जैसे यूएसबी विभिन्न परिधीय उपकरणों को उपकरणों से जोड़ता है।

गूगल के अनुसार, A2A का उद्देश्य MCP को प्रतिस्थापित करना नहीं है। दोनों प्रोटोकॉल के बीच न्यूनतम ओवरलैप है; वे विभिन्न समस्याओं का समाधान करते हैं और अमूर्तता के विभिन्न स्तरों पर काम करते हैं। A2A एजेंटों के बीच बातचीत को सुविधाजनक बनाता है, जबकि MCP बड़े भाषा मॉडल को उपकरणों से जोड़ता है, जो बदले में उन्हें सेवाओं और डेटा से जोड़ते हैं। इस प्रकार दोनों प्रोटोकॉल पूरक हैं।

एजेंट2एजेंट और मॉडल संदर्भ प्रोटोकॉल एक ही पहेली के दो टुकड़े हैं, और एजेंटिक वर्कफ़्लो और सर्वव्यापी एआई के भविष्य के दृष्टिकोण को साकार करने के लिए दोनों की आवश्यकता होगी।