در حال حاضر، بحث پیرامون قابلیت تعاملپذیری هوش مصنوعی به طور فزایندهای در حال شدت گرفتن است. پس از اعلام خدمات جامع MCP توسط Baidu در کنفرانس توسعهدهندگان خود در هفته گذشته، شرکتهای بزرگ فناوری چینی مانند Alibaba، ByteDance و Tencent همگی سفر MCP خود را آغاز کردهاند.
MCP، یا پروتکل متن مدل (Model Context Protocol)، به عنوان یک استاندارد یکپارچهکننده تصور میشود که هوش مصنوعی را قادر میسازد تا به طور یکپارچه با تعداد زیادی از برنامهها و خدمات ارتباط برقرار کند. میتوان آن را به رابط USB فراگیر موجود در رایانهها و تلفنهای هوشمند تشبیه کرد که امکان ادغام پلاگین و پخش دستگاههای خارجی متنوع را فراهم میکند. در اصل، MCP قصد دارد یک ‘پورت USB’ جهانی را برای دسترسی به ابزارها و اجرای وظایف در اختیار هوش مصنوعی قرار دهد.
در نوامبر 2024، Anthropic، یک شرکت هوش مصنوعی آمریکایی، استاندارد MCP را معرفی کرد، که به سرعت توسط رقبایی مانند OpenAI و Google پذیرفته شد، و نشاندهنده خروج از شیوه رقابتی مرسوم اکوسیستمهای اختصاصی بود. از آوریل، شرکتهای پیشرو فناوری چینی، از جمله Bailian ابر Alibaba، موتور دانش ابر Tencent، Kouzi Space ByteDance و Baidu AI Cloud، خدمات جامع MCP خود را راهاندازی کردند.
وعدهها و چالشهای یکپارچهسازی
هدف اصلی MCP ترویج یکپارچهسازی است، اما این تلاش با چالشهای مهمی روبرو است. به گفته چندین توسعهدهنده و محقق، در حالی که MCP برای دسترسی به دادههای محلی سازمانی مؤثر است، هنگام تلاش برای ادغام با برنامههای اینترنتی برای وظایفی مانند رزرو بلیط هواپیما، بررسی قیمتها و ایجاد راهنمای سفر با موانعی روبرو میشود. این چالشها ناشی از عدم بلوغ فرایندهای فراخوانی هوش مصنوعی و در دسترس بودن محدود ابزارهای اینترنتی است، به طوری که بسیاری از پلتفرمها فقط دسترسی به عملکردهای جانبی را ارائه میدهند.
همه پلتفرمهای اینترنتی به یک اندازه مشتاق پذیرش این استاندارد مشترک و پیوستن به شبکه ارائهدهنده خدمات MCP نیستند. ماهیت بسته اکوسیستم اینترنتی چین، همراه با حساسیت شدید به حریم خصوصی دادهها، باعث شده است که بسیاری از پلتفرمها محتاط باشند. آنها ترجیح میدهند قبل از تعهد کامل به آن، دوام و توسعه اکوسیستم MCP را ارزیابی کنند.
چشمانداز هوش مصنوعی به دلیل اصطلاحات و مفاهیم به سرعت در حال تحول خود شناخته شده است. هنگامی که Anthropic در اواخر سال گذشته پروتکل MCP را به صورت متن باز ارائه کرد، صنعت عمدتاً رویکرد صبر و تماشا را در پیش گرفت. با این حال، محبوبیت انفجاری Manus از آن زمان علاقه به MCP را در چین افزایش داده است.
MCP به عنوان کاتالیزور برای نمایندگی هوش مصنوعی
به گفته Hou Xinyi از دانشگاه علم و صنعت Huazhong، گام مهم در فراتر رفتن از محدودیتهای ‘رباتهای گفتگو’ در فعال کردن هوش مصنوعی برای تعامل با دادهها و ابزارهای خارجی نهفته است، که دقیقاً همان چیزی است که MCP به دنبال تسهیل آن است.
قبل از MCP، رویکردهای جایگزینی برای رسیدگی به کمبود درک شده ‘نمایندگی هوش مصنوعی’ مورد بررسی قرار گرفت. در اواخر سال 2023، OpenAI مفهوم یک فروشگاه اپلیکیشن (GPT Store) را معرفی کرد، که به ChatGPT اجازه میدهد از طریق افزونهها بر اساس مجموعهای از استانداردهای تعریفشده از ابزارهای خارجی استفاده کند. فروشگاههای اپلیکیشن هوش مصنوعی مشابه، مانند Kouzi ByteDance، Qianfan Baidu و Bailian Alibaba، از این روند پیروی کردند.
با این حال، این رویکردها در نهایت به محدودیتهای خود رسیدند. افزونهها و فروشگاههای اپلیکیشن یک مشکل مشترک داشتند: سیلو سازی. هر ابزار دارای مستندات توسعه منحصر به فرد، قالبهای پارامتر و مشخصات رابط خود بود. این بدان معنا بود که توسعهدهندگان مجبور بودند هر بار که ابزار جدیدی را در هوش مصنوعی ادغام میکردند، چرخ را دوباره اختراع کنند، که منجر به ناکارآمدی میشد.
با گذشت زمان، تعداد ابزارهای جدید اضافه شده به فروشگاههای اپلیکیشن کاهش یافت، و کیفیت افزونهها به طور قابل توجهی متفاوت بود، که مانع از توانایی انجام وظایف پیچیده میشد. این نشان داد که رویکردهای موجود به محدودیتهای خود نزدیک میشوند.
MCP به عنوان یک راه حل یکپارچهکننده
MCP به دلیل تاکید بر یکپارچهسازی، به عنوان یک راه حل امیدوارکننده در نظر گرفته میشود. در مستندات رسمی خود، Anthropic، MCP را به یک رابط USB-C جهانی برای دنیای هوش مصنوعی تشبیه میکند. Hou Xinyi ترجیح میدهد آن را به عنوان ‘ایستگاه اتصال’ توصیف کند - یک آداپتور چندمنظوره که به هوش مصنوعی اجازه میدهد به طور همزمان به چندین ابزار خارجی متصل شود، و نیاز به تبدیل فرمت را از بین میبرد.
بسیاری پیشبینی میکنند که MCP تأثیر تحولآفرینی خواهد داشت، شبیه به استانداردسازی اوزان و مقیاسها توسط Qin Shi Huang، که تجارت و ارتباطات را در میان ایالتهای قبلی تجزیه شده دوره بهار و پاییز تسهیل کرد.
به گفته یک رهبر فنی در گروه کاری اتصال متقابل هوشمند یک شرکت بزرگ فناوری، MCP تعاملات زبانی هوش مصنوعی را نیز بهینه میکند. قبلاً، هوش مصنوعی از کاربران میخواست که به طور دقیق ‘من میخواهم ناوبری کنم’ را برای استفاده از API یک سرویس ناوبری بیان کنند. حتی یک انحراف جزئی میتوانست باعث شود که هوش مصنوعی با شکست مواجه شود. اکنون، هر ابزار باید نامها، پارامترها و توضیحات عملکردی استاندارد را ارائه دهد. در نتیجه، هوش مصنوعی فقط باید هدف کاربر را درک کند و سپس آن را با مناسبترین سرور MCP بر اساس توضیحات مطابقت دهد.
این رویکرد نزدیکتر به قابلیتهای ذاتی مدلهای زبانی بزرگ است، و کاربران را قادر میسازد تا خدمات را با یک جمله فراخوانی کنند، و از نیاز قبلی به ارتباط مستقیم رابط به رابط دور میشوند.
پذیرش فعلی و محدودیتهای MCP
با وجود پتانسیل درک شده آن، MCP هنوز به پذیرش گسترده دست نیافته است، و کاربردهای عملی آن محدود باقی مانده است. در حال حاضر، MCP در بین پرسنل فنی شرکت و توسعهدهندگان مستقل محبوبتر است.
Gong Dian به عنوان یک مهندس فرانتاند، به شدت به دستیار برنامهنویسی هوش مصنوعی Cursor متکی است. با این حال، Cursor برای ادغام یکپارچه با سیستمهای پروژه داخلی شرکت او با مشکل مواجه شده است و نیاز به مداخله دستی دارد. در حالی که افزونهها یا فراخوانیهای عملکردی قبلاً قابل استفاده بودند، هوش مصنوعی خارجی نمیتوانست به سیستمهای داخلی شرکت دسترسی داشته باشد، و فراخوانی بیدرنگ نگرانیهای امنیتی را ایجاد میکرد. از سوی دیگر، MCP میتواند در شبکه داخلی شرکت آغاز شود، و آن را قابل اعتمادتر و سازگارتر میکند.
توسعهدهنده مستقل Zhu Mama اخیراً به Cursor دستور داد تا مستندات MCP را یاد بگیرد و Google Maps و Search API را در یک سرور MCP بستهبندی کند، که سپس برای فراخوانی مدل زبانی بزرگ Google’s Gemini استفاده شد. Gemini مجهز به MCP به یک دستیار راهنمای سفر تبدیل شد. هنگامی که از او در مورد مسیرهای حمل و نقل عمومی از فرودگاه سنگاپور به جاذبههای مختلف سؤال شد، دستیار اطلاعات دقیقتر و دقیقتری نسبت به پاسخ Doubao ارائه داد.
دستیارهای سفر مختلف در جامعه توسعهدهندگان در حال ظهور هستند. هنگامی که Kouzi Space ByteDance نسخه بتا داخلی خود را در 19 آوریل راهاندازی کرد، مورد نمایشی نیز یک دستیار هوش مصنوعی سفر بود، و برخی را بر آن داشت تا در مورد وسواس صنعت به سفر شوخی کنند.
Zhu Mama صادقانه اعتراف میکند که تمرکز بر سناریوهای سفر در درجه اول به دلیل ارتباط آنها با نیازهای روزمره مصرفکنندگان است. دلیل دیگر در دسترس بودن محدود نرمافزار اینترنتی سازگار با MCP در چین است که پتانسیل بازار را محدود میکند.
بر اساس آخرین آمار پلتفرم ناوبری MCP.so، بیش از 11028 ارائهدهنده خدمات MCP در سراسر جهان وجود دارد، و این تعداد به سرعت در حال رشد است. با این حال، در داخل چین، تنها تعداد انگشتشماری از برنامههای مکان جغرافیایی اصلی، مانند AutoNavi، Baidu Maps و Tencent Maps، در حال حاضر به عنوان سرورهای MCP در مقیاس بزرگ عمل میکنند.
این محدودیت دلیل متوقف شدن سریع برنامه Zhu Mama برای ایجاد یک نسخه چینی از یک دستیار سفر است. برای توسعه یک راهنمای سفر چینی، استفاده از خدمات نقشه داخلی ایدهآل خواهد بود. با این حال، Zhu Mama متوجه شد که سرور رسمی MCP ارائه شده توسط AutoNavi اطلاعات بسیار محدودی را ارائه میدهد. در حالی که میتوانست جستارهای مسیر بین دو مکان را ارائه دهد، اما فاقد اطلاعات دقیق در مورد نشانههای مهم، بررسیها، قیمت بلیط هتل و سایر جزئیات ضروری بود.
در مقابل، Google Maps API روشهای رزرو دقیق، قیمت هتل، بررسی هتل، امکانات هتل و حتی مقایسه قیمتها را در پلتفرمهای متعدد ارائه میدهد، سطحی از جزئیات که تصور آن در اکوسیستم چین دشوار است.
در حالی که محصولات Tencent، Alibaba، ByteDance و Baidu در حال پذیرش MCP هستند، برنامههای پرکاربرد آنها هنوز به طور رسمی به شبکه ارائهدهنده خدمات MCP نپیوستهاند. پلتفرمهایی مانند WeChat، Xiaohongshu و Douyin، و همچنین پلتفرمهای خدمات سبک زندگی مانند Ele.me، Meituan و Ctrip به طور آشکاری غایب هستند.
چالشها در دسترس بودن ابزار و زمانبندی هوش مصنوعی
علاوه بر در دسترس بودن محدود ابزارها، قابلیتهای زمانبندی هوش مصنوعی نیز یک محدودیت است. Zhu Mama 6-8 رابط API، از جمله Google Hotels، Maps و Search را در یک سرور MCP واحد بستهبندی کرد، که بسیار کمتر از حداکثر محدودیت است (Cursor حداکثر 40 ابزار در هر عامل را مجاز میداند). با این حال، هوش مصنوعی در حال حاضر برای تعیین اینکه کدام ابزار را فراخوانی کند، مشکل داشت. هنگامی که با درخواستهای پیچیده روبرو میشد، هوش مصنوعی قادر به تجزیه فرآیند و فراخوانی MCP در مراحل نبود، و در عوض سعی میکرد همه چیز را یکباره انجام دهد.
به گفته Gong Dian، ارزش MCP به کیفیت هر دو طرف مشتری و سرور بستگی دارد. همانطور که یک پورت USB قابلیتهای ذاتی ندارد و به خدمات پشت آن متکی است، MCP برای تحقق پتانسیل خود به خدمات قوی نیاز دارد.
MCP پایه و اساس عوامل هوش مصنوعی را میگذارد، اما تمام مشکلات را حل نمیکند. استانداردی که استفاده نشود، فقط یک تکه کاغذ است.
رهبر فنی مذکور اظهار داشت که پذیرش گسترده استاندارد MCP Anthropic به دلیل ماهیت متن باز، غیرانتفاعی و اعتبار خالق آن است. سایر سازمانها مایل به پیروی از استانداردی هستند که توسط یک نهاد معتبر تعیین شده است.
در حال حاضر، شرکتهای کوچک و متوسط و شرکتهای بزرگ اینترنتی که به دنبال تنوع بخشیدن به جریانهای درآمدی خود هستند، از پذیرندگان اصلی استاندارد MCP هستند.
شرکت همراهی هوش مصنوعی MiniMax اخیراً یک سرور MCP راهاندازی کرده است، و مدیر انجمن Cai Jiaren بیان کرده است که توسعهدهندگان میتوانند از MCP برای فراخوانی قابلیتهای چندوجهی MiniMax برای تولید ویدئو، تولید صدا و شبیهسازی صدا استفاده کنند. MCP شامل مکانیسمهای کنترل دسترسی دقیق برای اطمینان از انطباق هنگام دسترسی شرکتها به دادههای داخلی است. فرآیند فراخوانی کلی نیز ساده شده است، بدون اینکه هزینههای توکن اضافی اضافه شود.
تصمیم MiniMax برای راهاندازی یک سرور MCP ناشی از تمایل به این بود که توسعهدهندگان جهانی به راحتی از قابلیتهای مدل MiniMax استفاده کنند و قفل ایجاد انعطافپذیرتر و کارآمدتر را باز کنند.
سایر استارتاپها نیز آرزوهای مشابهی دارند. Biu Technology در مصاحبهای اشاره کرد که توسعهدهندگان میتوانند از AutoNavi MCP برای به دست آوردن دادههای حمل و نقل استفاده کنند و سپس از محصولات Biu برای تولید PPT استفاده کنند. MCP با ارائه دسترسی به رابط AutoNavi، که در غیر این صورت برای آنها در دسترس نخواهد بود، مانع ورود را کاهش میدهد.
رهبر فنی مذکور معتقد است که MCP اساساً داستانی در مورد ارائهدهندگان خدمات است. ارائهدهندگان خدمات برنامه با کپسوله کردن APIهای خود مطابق با استاندارد MCP، میتوانند خدمات خود را برای همه هوش مصنوعی در دسترس قرار دهند.
اختلافات و نگرانیها در بین ارائهدهندگان خدمات
با این حال، در بین ارائهدهندگان خدمات اختلاف نظرهایی وجود دارد. بسیاری از شرکتها به طور کامل به این ایده متعهد نیستند. در حالی که پلتفرمهای اصلی مانند AutoNavi و Baidu Maps سرورهای MCP را راهاندازی کردهاند، آنها در درجه اول رابطهای API موجود را بستهبندی میکنند و عملکردهای معمولی را ارائه میدهند در حالی که کنترل دقیق بر مجوزهای اصلی کاربر و دادههای تراکنش را حفظ میکنند.
علاوه بر خدمات مکان نقشه، ناشر خودکار Xiaohongshu یک توسعهدهنده شخص ثالث، که جستجو و ارسال خودکار محتوا را خودکار میکند، در حال حاضر محبوبترین مورد در پلازای MCP جامعه Modeng است. Hou Xinyi پیشنهاد میکند که این ممکن است تأثیر محدودی بر پلتفرمهای محتوای اجتماعی مانند Xiaohongshu داشته باشد، اما دادهها و مجوزها در سناریوهای متراکم تراکنش مانند پلتفرمهای تحویل غذا به ویژه حساس میشوند.
یکی از نگرانیهای اصلی ارائهدهندگان خدمات، کنترل تجربه کاربر است.
به عنوان مثال، باز کردن یک سرویس تحویل غذای کامل مستلزم اعطای دسترسی به عوامل هوش مصنوعی به دادههای شخصی حساس مانند قیمتها، اطلاعات فروشگاه و آدرسها و اطلاعات تماس کاربر است. Anthropic تایید کرده است که سیستم امنیتی MCP، از جمله مدیریت مجوز و ممیزی فراخوانی، هنوز در حال توسعه است. در نتیجه، برخی از پلتفرمها نگران خطر فراخوانی غیرمجاز هنگام اتصال به MCP هستند.
برخی از پلتفرمها در حال آزمایش سناریوهای تراکنش نسبتاً ایمن هستند. به عنوان مثال، Alipay اخیراً یک سرور MCP راهاندازی کرده است و ادعا میکند که به عوامل هوش مصنوعی ‘دسترسی با یک کلیک به قابلیتهای پرداخت’ میدهد. با این حال، یک نگاه دقیق نشان میدهد که در درجه اول خدمات جمعآوری را به جای خدمات پرداخت ارائه میدهد.
به گفته Hou Xinyi، رویکرد Alipay بر تسهیل جمعآوری پرداختهای تجار متمرکز است تا اینکه به هوش مصنوعی اجازه دهد از طرف مصرفکنندگان پرداخت کند. این یک گزینه مناسب است، زیرا اجازه دادن به هوش مصنوعی برای کنترل کیف پولها و سفارش دادن آزادانه هنوز برای آسایش همه به اندازه کافی ایمن نیست. این همچنین دلیل اصلی عدم تبلیغ گسترده خدمات تراکنش است.
یک مشکل عمیقتر این است که اگر هوش مصنوعی آزادانه در فرآیند تراکنش شرکت کند - کمک به کاربران برای مقایسه قیمتها یا توصیه مقرون به صرفهترین رستوران - بدون شک راحتی قابل توجهی را برای کاربران فراهم میکند. با این حال، این همچنین به این معنی است که پلتفرمهای خدمات کنترل فرآیند انتخاب کاربر را از دست میدهند، و مزایای الگوریتم اصلی آنها به حاشیه رانده میشود و آنها را به تامینکنندگان معمولی تبدیل میکند.
پرداختن به امنیت و ترویج جهانیبودن
چندین مصاحبهشونده معتقدند که MCP باید به دو موضوع کلیدی رسیدگی کند: امنیت و جهانیبودن.
اول، امنیت. Hou Xinyi اشاره میکند که MCP با دو چالش امنیتی روبرو است: فقدان نظارت امنیتی متمرکز و یک مکانیسم تأیید هویت و مجوز داده ناقص. در حال حاضر، هیچ ‘پلازای کشف’ رسمی برای MCP وجود ندارد. بسیاری از پلتفرمهای ناوبری شخص ثالث خدمات MCP را با کشیدن مستقیم پروژههای کد از GitHub جمعآوری میکنند، که سریع و سرراست است اما فاقد یک فرآیند بررسی رسمی است. Anthropic بیان کرده است که به طور رسمی به مکانیسم میزبانی MCP و مسائل مربوط به کشفپذیری در سال جاری رسیدگی خواهد کرد. پیشنویس پروتکل بهروزرسانی شده اخیر Anthropic در تلاش است تا این نقص را برطرف کند. علاوه بر این، سازمانهای داخلی مانند IIFAA (اتحادیه احراز هویت قابل اعتماد اینترنت) در تلاش هستند تا شکاف امنیتی را پر کنند.
همچنین مسائل دیرینه در زمینه عامل هوش مصنوعی وجود دارد، مانند ربودن اعلان و حملات ترکیبی ابزار. با این حال، رهبر فنی مذکور معتقد است که اینها آسیبپذیریهای MCP نیستند، بلکه خطراتی هستند که برای هر عامل هوش مصنوعی وجود دارد. در حال حاضر، هیچ آسیبپذیری امنیتی آشکاری در خود پروتکل MCP یافت نشده است، و مکانیسمهای انتقال داده و تعامل به طور کلی قابل اعتماد هستند.
امنیت تنها مانع اول است. چالش واقعی غلبه بر دفاعهای منافع تولیدکنندگان و متقاعد کردن تولیدکنندگان بیشتری برای تبدیل شدن به سرورهای MCP است.
به گفته Hou Xinyi، این مربوط به درک ماهیت ‘باغ دیواردار’ پلتفرمهای اینترنتی است. دادهها یک مانع رقابتی مهم برای پلتفرمهای مختلف هستند، بنابراین بسیاری از تولیدکنندگان ممکن است فقط برخی از عملکردهای جانبی را به عنوان سرورهای MCP برای آزمایش باز کنند. ممکن است تولیدکنندگان نیاز داشته باشند منتظر بمانند و ببینند اکوسیستم MCP چه تاثیری خواهد داشت.
فرد مسئول مذکور گفت که اگر به عنوان یک سرور MCP به هوش مصنوعی متصل شود، میتواند دادهها و عادات کاربر بیشتری را به دست آورد و به مدل پایه خود بازگرداند، که ممکن است بزرگترین انگیزه برای تولیدکنندگان برای پیوستن فعالانه باشد.
هنگامی که بازار سرور MCP واقعاً فراوان است، باید مسائل دورتر را در نظر گرفت.
به عنوان مثال، چگونه بدنهای هوشمند برنامههای مختلف را در تلفنهای همراه فراخوانی میکنند؟ فرد مسئول ذکر کرد که برای بیدار کردن برنامه دیگری از طریق بدن هوشمند هوش مصنوعی محلی تلفن همراه، یک لایه اضافی مجوز برنامه و تأیید هویت وجود خواهد داشت، که به سادگی MCP فراخوانی خدمات ابری نیست، و در حال حاضر هیچ راه حل خاصی وجود ندارد.
برای مثال دیگر، زمانی که عرضه خدمات بیش از حد باشد، بدنهای هوشمند چگونه انتخاب میکنند - با JD takeaway تماس بگیرید یا Meituan takeaway؟ از Gaode map یا Baidu map استفاده کنید؟ چندین مصاحبهشونده ذکر کردند که منطق فراخوانی MCP امروزی هنوز بسیار اساسی است، عمدتاً توسط ‘توضیحات عملکردی’ ارائهدهنده خدمات تعیین میشود و هیچ مکانیسم مرتبسازی و بهینهسازی وجود ندارد. اگر یک ارائهدهنده خدمات عمداً زبان القایی را به توضیحات اضافه کند، مانند ‘کارآمدترین’ و ‘حتماً انتخاب کنید’، هوش مصنوعی ممکن است گمراه شود و به جاهایی که نباید برود، منحرف شود.
همانطور که فرد مسئول فناوری مذکور توضیح داد، ‘این مانند این است که نمیتوانید سرویسی را که میخواهید در موتور جستجو پیدا کنید، اما انبوهی از اطلاعات درهم و برهم ظاهر میشود. چگونه به طور دقیق سرویسی را که کاربران بیشتر به آن نیاز دارند مطابقت دهید، اکوسیستم MCP آینده نیز با همین مشکل روبرو خواهد شد.’
در نهایت، فرآیند پیادهسازی هر استانداردی مملو از چالش است. Hou Xinyi گفت که برای ترویج محبوبیت MCP، ممکن است یک فرصت کلیدی مشابه Manus مورد نیاز باشد تا واقعاً کل صنعت قدرت MCP را درک کند.