ایم سی پی: ایک تنقیدی جائزہ

ایم سی پی: اس کی خامیوں اور صلاحیت کا ایک تنقیدی جائزہ

مشین کمیونیکیشن پروٹوکول (MCP) کے تصور نے ٹیک کی دنیا میں کافی توجہ حاصل کی ہے، خاص طور پر لارج لینگویج ماڈلز (LLMs) کے دائرے میں۔ اگرچہ یہ LLMs اور بیرونی وسائل کے مابین تعامل کو آسان بنانے کا وعدہ کرتا ہے، لیکن ایک گہری نظر سے کئی موروثی مسائل اور حدود ظاہر ہوتے ہیں جن پر احتیاط سے غور کرنے کی ضرورت ہے۔ یہ تجزیہ ایم سی پی کے گرد موجود تنقیدوں میں شامل ہے، اس کی کمزوریوں، اسکیل ایبلٹی چیلنجوں اور AI ایجنٹ کی ترقی کے لیے وسیع تر مضمرات کو تلاش کرتا ہے۔

ایم سی پی کی ذمہ داریوں کا زیادہ بوجھ

ایک عام تنقید یہ ہے کہ ایم سی پی کو بہت زیادہ ذمہ داری سونپی جارہی ہے۔ مصنف کا استدلال ہے کہ ایم سی پی کو بنیادی طور پر LLMs کے لیے بیرونی وسائل تک رسائی اور ان کے ساتھ تعامل کے لیے ایک گیٹ وے کے طور پر کام کرنا چاہیے۔ اسے محض ایک ‘دروازے’ یا ‘پل’ کے طور پر دیکھنا اس کے مقصد اور حدود کو واضح کرنے میں مدد کرتا ہے۔

حادثاتی ڈیٹا کی نمائش، فوری انجیکشن کی کمزوریوں اور لاگت پر قابو پانے کی کمی جیسے مسائل کو براہ راست ایم سی پی سے منسوب کرنا الزام تراشی کی غلط جگہ ہے۔ یہ وہ مسائل ہیں جنھیں ڈویلپرز کو اپنی کنٹرول کی حدود میں حل کرنا چاہیے۔ ڈویلپرز کو شرح کی حدوں کو نافذ کرنے اور استعمال کی نگرانی کرنے کی ضرورت ہے، چاہے کوئی بھی پروٹوکول استعمال ہو۔ اس کا موازنہ تیز رفتاری کے لیے سڑک کو مورد الزام ٹھہرانے سے ہے – انفراسٹرکچر انفرادی رویے کے لیے ذمہ دار نہیں ہے۔

بالآخر، بہت سے خدشات جو اٹھائے گئے ہیں وہ AI ایجنٹوں کو کام سونپنے سے متعلق وسیع تر مسائل ہیں۔ ڈویلپرز کو اپنی مخصوص ایپلیکیشنز میں ان چیلنجوں کا انتظام کرنے کی ذمہ داری لینی چاہیے، بجائے اس کے کہ API سے یہ توقع کریں کہ وہ سب کچھ سنبھال لے۔

ایل ایل ایم اور فوری انجیکشن کی دو دھاری تلوار

ایم سی پی کے بارے میں حالیہ مباحثے اکثر تیز دھار چاقو کے موروثی خطرات کے بارے میں انتباہات سے مشابہت رکھتے ہیں – اگر غلط طریقے سے سنبھالا جائے تو وہ کاٹ سکتے ہیں۔ فوری انجیکشن، ایک اہم تشویش، خود LLMs کی نوعیت کا نتیجہ ہے۔ فوری انجیکشن کے خطرے کو ختم کرنے کی کوشش LLMs کی ان صلاحیتوں کو کم کر سکتی ہے جو انھیں قیمتی بناتی ہیں۔

‘کنٹرول بمقابلہ ڈیٹا’ کی علیحدگی کا تصور، جو روایتی نظاموں میں عام ہے، LLMs میں قدرتی طور پر موجود نہیں ہے۔ LLMs اپنی طاقت اور عمومیت بالکل اس لیے حاصل کرتے ہیں کیونکہ ان میں یہ سخت علیحدگی نہیں ہوتی ہے۔ یہ موروثی خصوصیت انہیں فوری انجیکشن حملوں کا شکار بناتی ہے۔

جبکہ ریموٹ ایم سی پیز بطور سروس خطرات پیش کر سکتے ہیں، قصور خود پروٹوکول کا نہیں بلکہ غیر معتبر فریق ثالث کو حساس کام سونپنے کا ہے۔ یہ تشبیہ ایک غیر متوقع رومبا پر چاقو کو ڈکٹ ٹیپ کرنے کے خیال تک پھیلی ہوئی ہے – مسئلہ خود چاقو نہیں ہے، بلکہ اسے ایک غیر متوقع آلے سے منسلک کرنے کا فیصلہ ہے۔

‘محتاط رہنے’ کی تلقین یا حفاظتی گیئر کی تجاویز، اگرچہ تکنیکی طور پر درست ہیں، لیکن بنیادی مسئلے کو نظر انداز کر دیتی ہیں: ایک تیز آلے کو غیر کنٹرول شدہ نظام کے ساتھ جوڑنے کا غیر دانشمندانہ فیصلہ۔

scalability کے چیلنجز

سیکورٹی کے خدشات سے ہٹ کر، ایم سی پی کو بنیادی scalability کی حدود کا سامنا ہے۔ مصنف اس بات پر روشنی ڈالتا ہے کہ LLM کی وشوسنییتا اور فراہم کردہ ہدایاتی سیاق و سباق کی مقدار کے درمیان منفی تعلق ہے۔ یہ اس عام عقیدے کو چیلنج کرتا ہے کہ مزید ڈیٹا اور انضمام کو شامل کرنے سے خود بخود مسائل حل ہوجائیں گے۔ جیسے جیسے ٹولز اور انضمام کی تعداد بڑھتی ہے، کسی ایجنٹ کی کارکردگی کم ہوسکتی ہے جبکہ ہر درخواست کی لاگت میں بیک وقت اضافہ ہوتا ہے۔

مصنف اس بات پر زور دیتا ہے کہ ایم سی پی ایک خاص حد سے آگے نہیں بڑھتا ہے۔ کسی ایجنٹ کے تناظر میں لامحدود تعداد میں ٹولز شامل کرنے کی کوشش ناگزیر طور پر اس کی صلاحیتوں پر منفی اثر ڈالے گی۔ یہ حد ایم سی پی کے تصور میں موروثی ہے اور اسے تصدیق کے مسائل سے زیادہ توجہ کی ضرورت ہے۔

صارفین کو بالآخر کارکردگی میں کمی کا سامنا کرنا پڑ سکتا ہے کیونکہ وہ مزید ایم سی پی سرورز کو فعال کرتے ہیں، جس کی وجہ سے ان کے مابین مداخلت ہوتی ہے۔ یہ عام پیکیج مینجمنٹ سسٹم کے بالکل برعکس ہے، جہاں عدم مداخلت ایک بنیادی خاصیت ہے۔

ایم سی پی کے ساتھ بنیادی مسئلہ یہ ہے کہ اس کا اصل رویہ صارف کی توقعات سے مختلف ہے۔ یہ تسلیم کرنا ضروری ہے کہ ایم سی پی ایک پلگ اینڈ پلے حل نہیں ہے جو بغیر کسی نتائج کے لامحدود تعداد میں ٹولز کو بغیر کسی رکاوٹ کے ضم کرتا ہے۔

UI اور ٹول مینجمنٹ کے ساتھ حدود کو حل کرنا

ایم سی پی کی حدود کا ایک مجوزہ حل صارف انٹرفیس کو بہتر بنانا ہے۔ اگر کوئی ٹول غیر ارادی طور پر عمل میں لایا جاتا ہے تو UI کو اسے غیر فعال کرنے یا اس کے مطلوبہ استعمال کو واضح کرنے کے لیے اس کی تفصیل میں ترمیم کرنے کا ایک آسان طریقہ فراہم کرنا چاہیے۔

مصنف یہ بھی نوٹ کرتا ہے کہ سیاق و سباق کی نشوونما اکثر بہتر کارکردگی اور حقیقی دنیا کے استعمال کی صلاحیتوں کا باعث بنتی ہے، جو سختی سے منفی تعلق کے تصور کی تردید کرتی ہے۔ تاہم، وہ تسلیم کرتے ہیں کہ بعض استعمال کے معاملات میں یا ناقص ڈیزائن کردہ سیاق و سباق کے ساتھ، کارکردگی میں کمی واقع ہو سکتی ہے۔

ٹولز کے زبردست انتخاب کو حل کرنے کے لیے، ایک ‘تقسیم اور فتح’ نقطہ نظر تجویز کیا گیا ہے۔ اس میں ایک خاص ٹول شامل کرنا شامل ہے جو کسی دیئے گئے کام کے لیے سب سے زیادہ متعلقہ ٹولز کو منتخب کرنے کے لیے ڈیزائن کیا گیا ہے۔ یہ ‘ٹول چننے والا ٹول’ ایک اور LLM کال ہو سکتا ہے، جسے ‘والدین’ ایجنٹ کو دستیاب ٹولز کا ایک ذیلی سیٹ واپس کرنے کا کام سونپا جاتا ہے۔ یہ پرتوں والا نقطہ نظر پیچیدگی کو منظم کرنے کے لیے اضافی سطحوں کا اضافہ کرتا ہے۔

تاہم، صرف سیاق و سباق میں ٹولز رکھنے سے ماڈل کی آؤٹ پٹ میں نمایاں تبدیلی آسکتی ہے۔ اگرچہ سیاق و سباق سے متعلقہ ٹولز (جیسے کہ بازیافت-بڑھا ہوا جنریشن یا RAG جیسی تکنیکوں کے ذریعے حاصل کیا گیا) فائدہ مند ہیں، لیکن تمام ٹولز کو ‘get_tools’ کی درخواست کے پیچھے چھپانا نقصان دہ ہو سکتا ہے۔

نقل و حمل اور اجازت کی تہہ کے طور پر ایم سی پی

ایم سی پی بنیادی طور پر ٹول کی سطح پر اجازت پر توجہ مرکوز کرتے ہوئے درخواست/جواب لائف سائیکل کے ساتھ نقل و حمل اور تار کی شکل کے طور پر کام کرتا ہے۔ مضمون میں استدلال کیا گیا ہے کہ ایم سی پی کے ساتھ سب سے بڑا مسئلہ یہ ہے کہ یہ AI ایجنٹوں کو عملی طور پر ٹولز مرتب کرنے کے قابل نہیں بناتا ہے۔

مصنف کا استدلال ہے کہ ایم سی پی پہلی جگہ میں غیر ضروری ہو سکتا ہے، کیونکہ LLMs کے پاس پہلے سے ہی OpenAPI وضاحتوں کا استعمال کرتے ہوئے دستاویزی API کے ساتھ تعامل کرنے کی صلاحیت موجود ہے۔ گمشدہ عنصر اجازت ہے – یہ کنٹرول کرنے کی صلاحیت کہ کون سے APIs تک AI رسائی حاصل کر سکتا ہے۔ ایم سی پی کے بجائے، مصنف تجویز کرتا ہے کہ AIs کو HTTP درخواستیں کرنے کی اجازت دی جائے جبکہ مخصوص endpoints پر اجازت کا اطلاق کیا جائے۔ یہ نقطہ نظر موجودہ APIs کو پتلے ایم سی پی ٹولز کے ساتھ لپیٹنے کے موجودہ رجحان کے مطابق ہے۔

ایم سی پی کا ایک خاص طور پر پریشان کن پہلو اس میں اسٹریمنگ ٹول کال کے نتائج کے لیے سپورٹ کی کمی ہے۔ واحد درخواست/جواب جوڑا کلائنٹس کو صفحہ بندی کے لیے بار بار ٹولز کو کال کرنے پر مجبور کرتا ہے، طویل عرصے تک چلنے والے عمل میں رکاوٹ ڈالتا ہے۔ اسٹریمنگ کی صلاحیت کو نافذ کرنا، شاید gRPC کا استعمال کرتے ہوئے، ایم سی پی کی کارکردگی کو نمایاں طور پر بہتر بنا سکتا ہے۔

حساس ڈیٹا کی نمائش میں آسانی

ایم سی پی کے ساتھ ایک اہم تشویش حساس ڈیٹا کی آسانی سے نمائش کا امکان ہے۔ مزید برآں، ایم سی پی میں موروثی طور پر AI ایجنٹوں کو زیادہ قابل اعتماد نہیں بنایا جاتا ہے۔ یہ محض انہیں مزید ٹولز تک رسائی فراہم کرتا ہے، جو متضاد طور پر بعض حالات میں وشوسنییتا کو کم کر سکتا ہے۔

مصنف تسلیم کرتا ہے کہ وہ ایم سی پی سے ان تمام مسائل کو حل کرنے یا ان کا ذمہ دار ہونے کی توقع نہیں کرتے ہیں۔ بلکہ، ایم سی پی ان مسائل کے لیے ایک بڑا سطح کا رقبہ بناتا ہے، جس کے لیے ایپ ڈویلپرز اور صارفین کو چوکس رہنے کی ضرورت ہوتی ہے۔

تشبیہات اور شہری منصوبہ بندی

مصنف اس مسئلے کی وضاحت کے لیے شہری منصوبہ بندی کی تشبیہ کا استعمال کرتا ہے۔ ایم سی پی کا موازنہ چھ لین والی شہر کی سڑک سے کرنا جس میں 25 میل فی گھنٹہ کی رفتار کی حد ہے ڈیزائن اور مطلوبہ استعمال کے درمیان منقطع ہونے کو اجاگر کرتا ہے۔ محض جرمانے عائد کرنے یا سطحی ‘اصلاحات’ شامل کرنے سے ناقص ڈیزائن کے بنیادی مسئلے کو حل نہیں کیا جاتا ہے۔

مؤثر شہری منصوبہ بندی میں ایسی سڑکیں ڈیزائن کرنا شامل ہے جو قدرتی طور پر رفتار کی حدوں کی پابندی کی حوصلہ افزائی کریں۔ اسی طرح، ایم سی پی کو ممکنہ خطرات کو دور کرنے کے لیے موروثی طور پر ڈیزائن کیا جانا چاہیے، بجائے اس کے کہ مکمل طور پر بیرونی کنٹرول پر انحصار کیا جائے۔

ایل ایل ایم کے ناپسندیدہ اقدامات کرنا

مضمون ان پروٹوکول کی ایک وسیع تنقید کی طرف جاتا ہے جو LLMs کو خدمات پر کارروائی کرنے کی اجازت دیتے ہیں۔ مصنف ایک بنیادی مسئلہ کی نشاندہی کرتا ہے: LLMs ایسے اقدامات کر سکتے ہیں جو صارفین نہیں چاہتے کہ وہ کریں۔ وہ ان اقدامات کے درمیان فرق کرتے ہیں جو LLMs آزادانہ طور پر لے سکتے ہیں اور جن کے لیے صارف کی فوری ضرورت ہوتی ہے۔

جبکہ حتمی مقصد یہ ہو سکتا ہے کہ LLMs پورے کاروبار کا انتظام کریں، لیکن ٹیکنالوجی ابھی تک ایسی خود مختاری کے لیے تیار نہیں ہے۔ فی الحال، صارفین یہ بھی نہیں چاہتے کہ AIs پہلے جائزے کے بغیر ای میل بھیجیں۔

مصنف صارف سے تصدیق طلب کرنے کے حل کو مسترد کرتا ہے، اس خطرے کا حوالہ دیتے ہوئے کہ صارفین خودکار تصدیق (‘یولو موڈ’) کے ایک پیٹرن میں گر جائیں گے جب زیادہ تر ٹولز بے ضرر نظر آتے ہیں۔ اس کا موازنہ اس نفسیاتی رجحان سے کیا جاتا ہے جس میں لوگ نقد کے مقابلے میں کارڈز کے ساتھ زیادہ خرچ کرتے ہیں – ایک ایسا مسئلہ جو انسانی رویے میں جڑا ہوا ہے، نہ کہ ٹیکنالوجی میں۔

بنیادی سوال: کیوں نہ صرف APIs استعمال کریں؟

ایم سی پی کے بارے میں ہونے والی بات چیت میں ایک بار بار اٹھنے والا سوال یہ ہے کہ صرف APIs براہ راست کیوں استعمال نہ کریں۔

ایم سی پی LLM کلائنٹس کو اجازت دیتا ہے جن پر صارفین براہ راست کنٹرول نہیں کرتے ہیں (مثال کے طور پر، Claude, ChatGPT, Cursor, VSCode) APIs کے ساتھ تعامل کرنے کے لیے۔ ایم سی پی کے بغیر، ڈویلپرز کو LLM APIs کا استعمال کرتے ہوئے کسٹم کلائنٹس بنانے کی ضرورت ہوگی، جو موجودہ کلائنٹس کو سبسکرپشن کے ساتھ استعمال کرنے اور انہیں مخصوص ٹولز استعمال کرنے کا طریقہ سکھانے سے کہیں زیادہ مہنگا کام ہے۔

ایک ڈویلپر USB کے ذریعے اپنے FM ہارڈ ویئر سنتھیسائزر سے منسلک ہونے کے لیے ایک MCP سرور بنانے کے اپنے تجربے کا اشتراک کرتا ہے، جو AI سے چلنے والے صوتی ڈیزائن کو فعال کرتا ہے۔

ایل ایل ایم کلائنٹ انضمام اور معیاری کاری

بنیادی مسئلہ یہ ہے کہ تمام LLM کلائنٹس مقامی طور پر براہ راست API تعامل کو سپورٹ نہیں کرتے ہیں، ChatGPT کسٹم GPT ایکشنز ایک قابل ذکر استثنا ہے۔ Anthropic, Google اور OpenAI اس عمل کو ہموار کرنے کے لیے ایک مشترکہ پروٹوکول کے طور پر MCP کو اپنانے پر راضی ہو گئے ہیں LLM سے چلنے والے کلائنٹس جیسے Claude, ChatGPT اور Cursor کے لیے۔

ایم سی پی ان لوگوں کے لیے اس عمل کو آسان بناتا ہے جو LLM کلائنٹس بنا رہے ہیں۔ اگر آپ چاہتے ہیں کہ ایک LLM ایک API کے ساتھ تعامل کرے، تو آپ صرف ایک API کلید فراہم نہیں کر سکتے اور یہ توقع نہیں کر سکتے کہ یہ کام کرے گا – آپ کو ایک ایجنٹ بنانے کی ضرورت ہے۔

ایم سی پی کو APIs کو دستاویزی کرنے اور یہ بتانے کے طریقے کے طور پر دیکھا جا سکتا ہے کہ انہیں کیسے کال کیا جائے، ساتھ ہی اس دستاویزی دستاویز کو ظاہر کرنے اور کالوں کی سہولت فراہم کرنے کے لیے معیاری ٹولز۔ یہ غیر ضروری پیچیدگی کے بغیر APIs کو لپیٹنے کے لیے کافی تجرید فراہم کرتا ہے، لیکن یہ سادگی صارفین کو ‘اپنے آپ کو پاؤں میں گولی مارنے’ کا باعث بھی بن سکتی ہے۔

ایم سی پی کی کارکردگی اور دوبارہ استعمال کی صلاحیت

ایم سی پی کے بغیر، ڈویلپرز کو ہر بار جب اسے طلب کیا جائے تو LLM کو یہ بتانا ہوگا کہ ٹول کو کیسے استعمال کیا جائے۔ اس میں اس خطرے کو شامل کیا گیا ہے کہ LLM بھولی ہوئی معلومات یا غیر معیاری API رویے کی وجہ سے ٹول کو صحیح طریقے سے استعمال کرنے میں ناکام ہو جائے گا۔

یہ مستقل وضاحت اور نقل سیاق و سباق میں ٹوکن ضائع کرتی ہے، جس سے لاگت اور وقت میں اضافہ ہوتا ہے۔ ایم سی پی تمام ضروری معلومات کو بنڈل کرکے اس عمل کو ہموار کرتا ہے، جس سے ٹول کا استعمال زیادہ موثر ہوتا ہے اور ٹول شیئرنگ میں سہولت ملتی ہے۔

LLM فراہم کنندہ کو بتاتے ہوئے ‘یہ ایک ٹول ہے جسے آپ استعمال کرسکتے ہیں’ API دستاویزات کے ساتھ، صارفین اس ٹول کو بار بار یاد دہانیوں کے بغیر متعدد چیٹس میں دوبارہ استعمال کرسکتے ہیں۔ یہ ڈیسک ٹاپ LLM کلائنٹس کو مقامی طور پر چلنے والے پروگراموں سے منسلک کرنے کے قابل بناتا ہے، جو OS مخصوص عمل درآمد کے عمل کے مسئلے کو حل کرتا ہے۔

ایم سی پی اور مقامی وسائل تک رسائی

ایم سی پی LLMs کے لیے مقامی وسائل جیسے فائلوں، ماحولیاتی متغیرات اور نیٹ ورک تک رسائی کی سہولت فراہم کرتا ہے۔ یہ مقامی طور پر چلانے کے لیے ڈیزائن کیا گیا ہے، LLM کو ان وسائل تک کنٹرولڈ رسائی فراہم کرتا ہے۔

معیاری LLM ٹول کال ‘شکل’ ایم سی پی ٹول کال ‘شکل’ کی قریبی عکاسی کرتی ہے، جس سے یہ ٹولز کو ایجنٹوں سے منسلک کرنے کے لیے ایک سیدھا سادا معیار بن جاتا ہے۔

ایم سی پی AI ماڈل کے سامنے آنے والے فنکشن کالنگ اسکیما اور بنیادی APIs کے درمیان ایک پل کا کام کرتا ہے۔ یہ فنکشن کالز کو ٹولز میں ترجمہ کرتا ہے، بغیر کسی رکاوٹ کے مواصلات کو فعال کرتا ہے۔

اگر آپ ایک ٹول فراہم کنندہ ہیں، تو MCP آپ کے ٹول سے منسلک ہونے کے لیے AI ایجنٹ فرنٹ اینڈز کے لیے ایک معیاری پروٹوکول پیش کرتا ہے۔ اس سے اس سوال کا جواب ملتا ہے کہ معیاری پروٹوکول صرف HTTP اور OpenAPI کیوں نہیں ہو سکتا۔

ایم سی پی ایک میٹا-API ہے جو endpoints اور ان کی آپریشنل تفصیلات کو تفصیلات میں شامل کرتا ہے، جس سے LLMs ان کے ساتھ زیادہ مؤثر طریقے سے تعامل کر سکتے ہیں۔

مخصوص منظرناموں میں ایم سی پی

ایم سی پی مسائل کو حل کر سکتا ہے جب صارفین سوالات پوچھتے ہیں یا اس بات کا یقین نہیں رکھتے ہیں کہ کون سے APIs استعمال کرنے ہیں۔ یہ پچھلے پیغامات کی بنیاد پر درخواستوں پر بھی کارروائی کر سکتا ہے۔

ایک صارف اپنے ‘X’ کو بازیافت کرنے اور اسے ایک endpoint پر بھیجنے کے تجربے کا اشتراک کرتا ہے۔ انہوں نے پایا کہ ایم سی پی اس طرح کے ایک آسان کام کے لیے حد سے زیادہ تھا، اس بات کی نشاندہی کرتے ہوئے کہ بنیادی API تعاملات کے لیے یہ ہمیشہ ضروری نہیں ہوتا ہے۔

ایم سی پی کا موازنہ ایک FastAPI ویب ایپ فریم ورک سے کیا جاتا ہے جو سافٹ ویئر بنانے کے لیے ہے جو نیٹ ورک پر بات چیت کر سکتا ہے، خاص طور پر ایجنٹک تجربات کے لیے ڈیزائن کیا گیا ہے۔ اسے ‘Rails-for-Skynet’ کے طور پر دیکھا جا سکتا ہے، جو AI ایجنٹ کی ترقی کے لیے ایک معیاری فریم ورک فراہم کرتا ہے۔

فراہم کنندہ کے کنٹرول کے بارے میں خدشات

یہ خدشات ہیں کہ MCP کو سسٹم پر فراہم کنندہ کی طرف سے کنٹرول بڑھانے کے لیے آگے بڑھایا جا رہا ہے۔ LLM فراہم کنندگان بالآخر API تک رسائی کو محدود کر سکتے ہیں، جیسا کہ گوگل نے Gmail کے ساتھ IMAP/SMTP استعمال کرنا مشکل بنا دیا تھا۔

OpenAPI ایجنٹوں کو /openapi.json سے API تفصیلات بازیافت کرنے کی اجازت دیتا ہے۔

ایم سی پی تیز رفتار تعاملات کو فعال کرتا ہے، جس سے صارفین ان پٹ ڈیٹا تیار کرنے، اسے API کو بھیجنے، آؤٹ پٹ کو پارس کرنے اور ہر پیغام کے لیے اس عمل کو دہرانے میں وقت گزارنے کے بجائے سیکنڈوں میں کام انجام دے سکتے ہیں۔

سینڈ باکسنگ اور سیکورٹی کے خطرات

سب سے بڑا مسئلہ یہ ہے کہ ایک ہی پیغام کے تھریڈ میں ایک MCP سرور ٹول کی آؤٹ پٹ دوسرے ٹولز کو کیسے متاثر کر سکتی ہے۔ اس کے لیے ناپسندیدہ نتائج کو روکنے کے لیے ٹولز کے درمیان سینڈ باکسنگ کی ضرورت ہے۔ انویرینٹ لیبز نے ٹول کی تفصیلات کے ساتھ اس کا ازالہ کیا، جبکہ دوسروں نے ایم سی پی کے وسائل کے اٹیچمنٹ استعمال کیے ہیں۔ سینڈ باکسنگ کی کمی فوری انجیکشن کے خطرات کو بڑھا دیتی ہے۔

اس کا موازنہ SQL انجیکشن سے کیا جاتا ہے – ایک ایسا نظام جو ایک ساتھ جوڑا گیا ہے جہاں کم سے کم مشاہدے کے ساتھ کسی بھی مقام پر کمزوریوں کا استحصال کیا جا سکتا ہے۔

فوری انٹرفیس بھی SQL انجیکشن کی ایک شکل کا شکار ہے، کیونکہ ماڈل فوری کے قابل اعتماد حصوں کو صارف کے آلودہ ان پٹ سے ممتاز نہیں کر سکتا۔ اس کو حل کرنے کے لیے انکوڈنگ، ڈیکوڈنگ اور ماڈل کی تربیت میں بنیادی تبدیلیاں ضروری ہیں۔

یہ فوری انجیکشن اور ٹول انجیکشن دونوں کی اجازت دیتا ہے، جس سے ممکنہ طور پر ناقابل اعتماد کوڈ پر عمل درآمد ہو سکتا ہے۔

کنٹینرائزیشن اور کنٹرولڈ رسائی

ایک ڈویلپر نے ایک MCP سرور بنایا جو پروجیکٹ کوڈ کے ساتھ نصب ڈوکر کنٹینر شروع کرتا ہے۔ یہ نقطہ نظر LLM کو سینڈ باکسڈ ماحول میں پورے یونکس ٹول سیٹ اور پروجیکٹ کے مخصوص ٹولز تک رسائی کی اجازت دیتا ہے۔

چیٹ پر مبنی انٹرفیس کے ذریعے چلنے والا یہ ایجنٹک ورک فلو روایتی طریقوں سے زیادہ موثر ثابت ہوا ہے۔

اہم بات یہ ہے کہ MCP ایجنٹوں کو اس تک رسائی فراہم کی جائے جس کی انہیں ضرورت ہے، اور اس سے زیادہ نہیں۔ سیکورٹی کے خطرات کو کم کرنے کے لیے کنٹینرائزیشن اور شفاف ٹول UX بہت ضروری ہیں۔

ورچوئل مشینیں اور انٹرنیٹ تک رسائی

ایجنٹوں کو کم سے کم لینکس انسٹالیشن (بطور VM یا کنٹینر) کے ساتھ ایک کمپیوٹر دینے سے بہتر نتائج حاصل ہو سکتے ہیں، جس سے انہیں انٹرنیٹ سے معلومات بازیافت کرنے کی اجازت ملتی ہے۔ تاہم، یہ بدنیتی پر مبنی ہدایات اور ڈیٹا کے اخراج کے حوالے سے سیکورٹی کے خدشات کو جنم دیتا ہے۔

قابل اعتماد ویب سائٹس تک رسائی کو محدود کرنا کچھ خطرات کو کم کر سکتا ہے، لیکن یہاں تک کہ قابل اعتماد ذرائع بھی بدنیتی پر مبنی مواد کی میزبانی کر سکتے ہیں۔ بدنیتی پر مبنی ہدایات کا سامنا کرنے کے امکان اور پیداواری فوائد کے درمیان توازن پر احتیاط سے غور کیا جانا چاہیے۔

ملازمین اور AI ایجنٹوں کے درمیان اختلافات نمایاں ہیں۔ ملازمین قانونی افراد ہیں جو قوانین اور معاہدوں کے تابع ہیں، جو احتساب فراہم کرتے ہیں۔ AI ایجنٹوں میں اس قانونی فریم ورک کا فقدان ہے، جس سے اعتماد زیادہ مشکل ہو جاتا ہے۔

ایم سی پی کی ترقی کے ابتدائی مراحل

ایم سی پی کا اعلان صرف نومبر 2024 میں کیا گیا تھا، اور RFC فعال طور پر تیار ہو رہا ہے۔

کچھ لوگ ایم سی پی سمیت پورے AI ذاتی معاون کے تصور کو بنیادی طور پر غلط سمجھتے ہیں۔

1990 کی دہائی کے آخر میں اور 2000 کی دہائی کے اوائل میں AI معاونین کے لیے ابتدائی زور ناکام رہا کیونکہ عمودی انضمام اور بلک خریدنے کی طاقت کے ساتھ مواد جمع کرنے والے زیادہ موثر ثابت ہوئے۔ اس کی وجہ سے Expedia اور eBay جیسے پلیٹ فارمز کا عروج ہوا۔

متعدد ایجنٹوں کے نظام کے لیے پروگرامرز کو ایجنٹوں کی حالت کو متاثر کرنے کی ضرورت ہوتی ہے، جو ایک مشکل پروگرامنگ کام ہے۔

مفت قیمت کی حدود

‘پارکنگ کی دستیابی کے لحاظ سے نتائج کی درجہ بندی’ کرنے کی خواہش ادا شدہ APIs یا اشتہار سے چلنے والے فرنٹ اینڈ کے پیچھے موجود ڈیٹا تک رسائی کے مسئلے کو اجاگر کرتی ہے۔ کمپنیاں اپنے پورے ڈیٹا سیٹ تک API کے ذریعے مفت رسائی فراہم کرنے کا امکان نہیں رکھتیں۔

جبکہ تمام کمپنیاں اپنے ڈیٹا کو AI ایجنٹوں میں ضم نہیں کریں گی، لیکن مختلف ٹولز کو ملا کر ورک فلو کو طاقت دینے کی صلاحیت اب بھی نمایاں ہے۔

وہ کمپنیاں جو ڈیٹا موٹ کو برقرار رکھنے کو ترجیح دیتی ہیں وہ غالباً نئی ٹیکنالوجیز کی مزاحمت کریں گی جو اس موٹ کو خطرہ بناتی ہیں۔

اگر booking.com کے پاس ایک API ہوتا، تو وہ غالباً اپنی ویب سائٹ کی طرح ہی نتائج واپس کرتے، ممکنہ طور پر JSON یا XML فارمیٹنگ کے ساتھ۔

مڈل مین کو بائی پاس کرنا

booking.com جیسے مڈل مین کے لیے صارفین کو اپنی خدمات کو مکمل طور پر بائی پاس کرنے کی اجازت دینا سمجھ میں نہیں آتا۔

تاہم، انفرادی ہوٹلوں کے لیے booking.com کو بائی پاس کرنا فائدہ مند ہو سکتا ہے، ایک مڈل مین جسے وہ اکثر ناپسند کرتے ہیں۔

ایک ڈیپ ریسرچ AI مخصوص معیار کی بنیاد پر ہوٹلوں کو اسکین کر سکتا ہے اور انفرادی ہوٹلوں کے ذریعے چلنے والے ہوٹل ڈسکوری MCP سرورز کے ساتھ تعامل کر سکتا ہے، جس سے booking.com کے انٹرفیس اور اشتہارات کو نیویگیٹ کرنے کی ضرورت ختم ہو جاتی ہے۔

عملی استعمال کے معاملات

ایم سی پی زیادہ منظم طریقے سے Elasticsearch سے لاگز بازیافت کرنے یا ڈیٹا بیس کو استفسار کرنے جیسے کاموں میں سہولت فراہم کر سکتا ہے۔

ایم سی پی سرور کی ترتیب کی جامد نوعیت، جہاں نئے سرورز کے لیے .json فائل میں ترمیم کرنے اور ایپ کو دوبارہ شروع کرنے کی ضرورت ہوتی ہے، محدود ہو سکتی ہے۔

فائن ٹیونڈ ماڈلز

ایم سی پی کو ایک چھوٹا، فائن ٹیونڈ ماڈل سمجھا جا سکتا ہے جو متعدد ایم سی پی ٹولز کو سمجھتا ہے اور ہر گفتگو کے لیے صحیح کا انتخاب کرتا ہے۔

بعض منظرناموں کے لیے سیاق و سباق کی بنیاد پر ٹولز کو متحرک طور پر ایڈجسٹ کرنے کی ضرورت پڑ سکتی ہے۔

کھلی بات چیت اور کاروباری مسائل

ایم سی پی عام، کھلی گفتگو کے نظام کے لیے موزوں ہے جس میں کوئی پہلے سے طے شدہ فلو نہیں ہے۔ تاہم، یہ ہر کاروباری مسئلے کے لیے ایک سائز فٹ بیٹھنے والا حل نہیں ہے۔ اس کا مقصد LangChain جیسے فریم ورکس کو تبدیل کرنا نہیں ہے۔

ایم سی پی کا متبادل، ایک کھلی کمیونٹی سے چلنے والا معیار، فریکچرڈ، ملکیتی اور وینڈر لاکڈ پروٹوکول ہے۔ ایک ناقص لیکن تیار ہوتا ہوا معیار کسی بھی معیار سے بہتر ہے۔

ایم سی پی کو دیکھنے کا بہترین طریقہ یہ ہے کہ یہ انفرادی ڈویلپرز کے APIs کے ارد گرد کلائنٹ ریپرز بنانے سے API فراہم کنندگان یا کمیونٹی کے زیر انتظام ریپرز بنانے کی طرف منتقلی ہے۔ یہ NPM یا PyPi کی طرح ایک بڑا ٹول باکس فراہم کرتا ہے۔ تاہم، آرکیسٹریشن، سیکورٹی اور استعمال کی تعریف کی اب بھی ضرورت ہے۔

Langchains کی اگلی نسل اس بڑے ٹول چیسٹ سے مستفید ہوگی، لیکن جدت کی اب بھی ضرورت ہے۔

صارف کے مخصوص ٹولز

بعض صورتوں میں، ٹولز صارف کے ڈیٹا کے لیے مخصوص ہو سکتے ہیں، جیسے کہ اپ لوڈ کی گئی CSV فائلوں کو سلائس کرنے اور ان میں ہیرا پھیری کرنے کے ٹولز۔

ایک اکثر نظر انداز کیا جانے والا مسئلہ یہ ہے کہ ایم سی پی ماڈل سیاق و سباق کو بہت زیادہ اختیارات سے بھر سکتا ہے۔ ضائع شدہ ٹوکن کے استعمال اور غیر متوقع ماڈل کے رویے سے بچنے کے لیے ترجیحی ترتیب اور میٹا ڈیٹا کی نمائش بہت ضروری ہے۔

معیارات اور تیار ہوتی ہوئی ٹیکنالوجی

نئے معیارات وقت کے ساتھ ساتھ ابھرتے ہیں، اور معیارات واقعی اہمیت اختیار کیے ہوئے اتنا عرصہ ہو گیا ہے کہ لوگ بھول گئے ہیں کہ وہ کیسے تیار ہوتے ہیں۔

LLM کلائنٹس میں ‘ٹولز’ شامل کرنے کے لیے بے ترتیب ڈویلپرز سے چھوٹے سرور پروگرام ڈاؤن لوڈ کرنا خطرناک ہو سکتا ہے۔

اٹھائے گئے مسائل جائز مسائل ہیں جن کو ایم سی پی ایکو سسٹم کو حل کرنے کی ضرورت ہے۔ کچھ حل ایم سی پی اسپیک کے اندر ہوں گے، جبکہ کچھ بیرونی ہوں گے۔

کلاڈ کوڈ اور حقیقی دنیا کا استعمال

ایم سی پی کی کامیابی کے بارے میں متضاد آراء ہیں۔ کچھ نے ایم سی پی کے ساتھ انضمام کرنے والی کمپنیوں کی کہانیاں سنی ہیں، جبکہ دوسروں نے ان صارفین سے سنا ہے جنہوں نے اسے مایوس کن پایا۔

یہ ہائپ اور ابتدائی اپنانے کا نقصان اجاگر کرتا ہے۔

کچھ ڈویلپرز کو معلوم ہوا کہ HTTP APIs زیادہ تر استعمال کے معاملات کے لیے ایم سی پی سے بہتر ہیں۔ ان کا استدلال ہے کہ ‘ٹول’ کا استعمال صلاحیتوں اور فعالیت کے لیے API endpoints تک محدود ہے۔

APIs بطور ڈیفالٹ خود وضاحتی نہیں ہیں، جو REST اور HATEOAS کے حامیوں کے لیے اپنے نقطہ نظر کو ظاہر کرنے کے موقع سے محرومی کی نمائندگی کرتی ہیں۔

لینگ چین کا متبادل؟

ایم سی پی کو ‘لینگ چین کی بو’ کے طور پر بیان کیا گیا ہے – کسی دباؤ والے مسئلے کو حل نہ کرنا، ضرورت سے زیادہ تجریدی ہونا اور اس کے فوائد کی وضاحت کرنے میں دشواری ہونا۔

شاید اسے ‘END OF LINE’ کہنے اور ہیکرز کو گیم گرڈ میں جلاوطن کرنے کی ضرورت ہے!

ایک اہم سوال یہ ہے کہ کیا ‘عام’ چیٹ بوٹ پیراڈائم برقرار رہے گا۔ اپنی اپنی ٹولز کے ساتھ خصوصی ایپس کو ایم سی پی کی ضرورت نہیں ہو سکتی ہے۔

اس کے برعکس، جیسے جیسے LLMs زیادہ قابل ہوتے جاتے ہیں، بیرونی ٹولز کی ضرورت کم ہو سکتی ہے۔ آپ فوٹوشاپ چلانے کے لیے MCP کیوں چاہیں گے جب LLM سیدھے طور پر تصویر میں ترمیم کر سکتا ہے؟

سائنس فائی روبوٹ اسسٹنٹ کا خواب پورا نہیں ہو سکتا، اور خصوصی لینگویج ہیرا پھیری ٹولز زیادہ کارآمد ہو سکتے ہیں۔

صارف کی بنیاد اور سیکورٹی سے آگاہی

ایم سی پی کے صارف کی بنیاد میں کم تکنیکی افراد شامل ہیں، جس کی وجہ سے سیکورٹی کے مسائل خاص طور پر متعلقہ ہیں۔ سیکورٹی کے بہترین طریقوں کے بارے میں آگاہی بڑھانا بہت ضروری ہے۔

Xops کو OpenRPC پر مبنی بنانا، جس میں نتیجہ اسکیما کی وضاحت کرنے کی ضرورت ہوتی ہے، اس بات کی منصوبہ بندی کرنے میں مدد کرتا ہے کہ آؤٹ پٹ ان پٹ سے کیسے جڑتے ہیں، پیچیدہ ورک فلو کے لیے وشوسنییتا کو بہتر بناتے ہیں۔

اس ٹیکنالوجی کے وقت کے ساتھ ساتھ تیار ہونے اور طے ہونے کا امکان ہے۔

فالتو پن اور کلاؤڈ انفراسٹرکچر

کچھ لوگ OpenAPI معیار پر ایم سی پی استعمال کرنے کے فوائد پر سوال اٹھاتے ہیں، اسے فالتو سمجھتے ہیں۔

LLM OpenAPI سسٹم کو کال کرنے کے لیے کیا استعمال کرے گا؟ یہ شیل سے کیسے بندھے گا؟ LLM کا میزبان اسے کیسے آرکیسٹریٹ کرے گا؟

ایم سی پی LLMs کے لیے ٹول کال کرنے کا ایک منظم طریقہ فراہم کرتا ہے۔

ایم سی پی سرورز پہلے ہی HTTP سرورز ہیں۔

ایم سی پی کا سب سے بڑا فائدہ LLM فراہم کنندگان جیسے OpenAI کے لیے ہے، نہ کہ ایپلیکیشن ڈویلپرز کے لیے۔

LLMs ٹولز کے بغیر دماغ ہیں، اور ٹول کالنگ انہیں بااختیار بناتی ہے۔ تاہم، عام APIs کے ساتھ، LLM فراہم کنندگان کو ان ٹولز تک رسائی حاصل نہیں ہے۔ ایم سی پی انہیں رسائی فراہم کرتا ہے، انہیں AI کے گیٹ وے کے طور پر رکھتا ہے۔

CLI بمقابلہ API

CLI کو براہ راست کیوں استعمال نہ کیا جائے، اس بات کو دیکھتے ہوئے کہ LLMs کو قدرتی زبان پر تربیت دی جاتی ہے اور CLIs ایک عام انسانی قابل پڑھنے اور لکھنے کے قابل حل ہیں؟

ایم سی پی بہت جلد ابھرا ہے اور اسے پختہ ہونے میں وقت درکار ہے۔ اس میں کسی روایتی معیاری ادارے کی جانچ پڑتال کی کمی ہے اور یہ ہائپ سے چلتا ہے۔

حقیقی دنیا کی ایپلی کیشنز کی کمی ہے۔

ایم سی پی کی اہم ایپلی کیشنز

ایم سی پی کلاڈ ڈیسک ٹاپ اور طاق AI چیٹ ایپس، کوڈ آٹومیشن ٹولز اور ایجنٹ/LLM آٹومیشن فریم ورکس میں استعمال ہوتا ہے۔

یہ ایک اور عجلت میں تیار کی گئی ٹیکنالوجی ہے جس کے اگلے ہائپ ایبل مخفف کے آنے پر خارج ہونے کا امکان ہے۔

زبان ماڈل ٹول کالنگ پروٹوکول دو قسم کے ہوتے ہیں: وہ جن کے بارے میں لوگ شکایت کرتے ہیں اور وہ جنہیں کوئی استعمال نہیں کرتا۔

انتھروپک نے اس ‘معیار’ کو خلا میں تیار کیا، جس کی وجہ سے سیکورٹی کے مسائل پیدا ہوئے۔

JSON-RPC 2.0

ایم سی پی JSON-RPC 2.0 پر بنایا گیا ہے، جو ایک ہلکا پھلکا پروٹوکول ہے جو کلائنٹ اور سرور مواصلات کو JSON کا استعمال کرتے ہوئے اجازت دیتا ہے۔

یہ ایک مخصوص ایکو سسٹمکے لیے ڈیزائن کی گئی ایک مرکزی وضاحت کی طرح محسوس ہوتا ہے، جو اسے کمائے بغیر عالمگیریت کا دعویٰ کرتا ہے۔

ایم سی پی مفید چیزیں کرنے کے لیے کافی طاقتور ہے، جو سیکورٹی کے خدشات کو جنم دیتا ہے۔

یہ ایک پختہ معیار نہیں ہے اور اسے محفوظ بنانے کے لیے ڈیزائن نہیں کیا گیا تھا۔

جبکہ سفارشات موجود ہیں، لیکن ان پر عمل درآمد یا نفاذ نہیں کیا جاتا ہے۔

لینگ چین اور ٹول کالنگ

لینگ چین بہت سے فریم ورکس میں سے ایک ہے جو ‘ٹول کالنگ’ پیٹرن کو نافذ کرتے ہیں۔

ایم سی پی ایک اسپیک ہے کہ بیرونی معلومات زبان کے ماڈل کی سیاق و سباق کی ونڈو میں کیسے داخل ہوتی ہیں، بشمول ٹول کالنگ، ٹیمپلیٹڈ ان پٹ، منسوخی، پیش رفت سے باخبر رہنا اور ٹول سرورز کی حالت۔

یہ تفصیلات کو معیاری بنانے میں مدد کرتا ہے تاکہ کوئی بھی اسسٹنٹ/انضمام کومبو مطابقت پذیر ہو۔

جبکہ ایم سی پی کے ساتھ جائز مسائل ہیں، ناقدین کو اپنے دلائل کو بہتر بنانا چاہیے۔

تصدیق بہت ضروری ہے اور اسے ابتدائی ورژن سے خارج نہیں کیا جانا چاہیے تھا۔

بہت سی پیچیدگیاں ہیں۔