Resepsi Suam-suam Kuku MCP di Raksasa Internet

Discourse seputar interoperabilitas AI semakin intensif. Setelah pengumuman Baidu tentang layanan MCP komprehensifnya di konferensi pengembangannya minggu lalu, perusahaan teknologi besar Tiongkok seperti Alibaba, ByteDance, dan Tencent semuanya telah memulai perjalanan MCP.

MCP, atau Model Context Protocol, dibayangkan sebagai standar pemersatu yang memungkinkan AI untuk berinteraksi secara mulus dengan banyak aplikasi dan layanan. Ini dapat disamakan dengan antarmuka USB yang ada di mana-mana yang ditemukan di komputer dan ponsel cerdas, memungkinkan integrasi plug-and-play dari beragam perangkat eksternal. Intinya, MCP bertujuan untuk menyediakan AI dengan ‘port USB’ universal untuk mengakses alat dan menjalankan tugas.

Pada November 2024, Anthropic, sebuah perusahaan AI Amerika, memperkenalkan standar MCP, yang dengan cepat dianut oleh pesaing seperti OpenAI dan Google, menandakan keberangkatan dari praktik kompetitif konvensional ekosistem kepemilikan. Mulai bulan April, perusahaan teknologi terkemuka Tiongkok, termasuk Bailian Alibaba Cloud, Knowledge Engine Tencent Cloud, Kouzi Space ByteDance, dan Baidu AI Cloud, meluncurkan layanan MCP komprehensif mereka sendiri.

Janji dan Tantangan Unifikasi

Tujuan utama MCP adalah untuk mendorong unifikasi, tetapi upaya ini menghadapi tantangan yang signifikan. Menurut beberapa pengembang dan peneliti, meskipun MCP efektif untuk mengakses data perusahaan lokal, ia menghadapi hambatan ketika mencoba untuk berintegrasi dengan aplikasi internet untuk tugas-tugas seperti memesan penerbangan, memeriksa harga, dan membuat panduan perjalanan. Tantangan-tantangan ini berasal dari ketidakmatangan proses invokasi AI dan ketersediaan alat internet yang terbatas, dengan banyak platform hanya menawarkan akses ke fungsionalitas periferal.

Tidak semua platform internet sama antusiasnya tentang mengadopsi standar umum ini dan bergabung dengan jaringan penyedia layanan MCP. Sifat tertutup dari ekosistem internet Tiongkok, ditambah dengan meningkatnya sensitivitas terhadap privasi data, telah membuat banyak platform berhati-hati. Mereka lebih suka menilai kelayakan dan pengembangan ekosistem MCP sebelum sepenuhnya berkomitmen untuk itu.

Lanskap AI dikenal karena terminologi dan konsepnya yang berkembang pesat. Ketika Anthropic awalnya membuka-sumber protokol MCP akhir tahun lalu, industri sebagian besar mengadopsi pendekatan tunggu dan lihat. Namun, popularitas eksplosif Manus sejak itu memicu minat pada MCP di Tiongkok.

MCP sebagai Katalis untuk Agensi AI

Menurut Hou Xinyi dari Universitas Sains dan Teknologi Huazhong, langkah penting dalam melampaui keterbatasan ‘chatbot’ terletak pada memungkinkan AI untuk berinteraksi dengan data dan alat eksternal, yang justru ingin difasilitasi oleh MCP.

Sebelum MCP, pendekatan alternatif dieksplorasi untuk mengatasi persepsi kurangnya ‘agensi AI’. Pada akhir 2023, OpenAI memperkenalkan konsep toko aplikasi (GPT Store), memungkinkan ChatGPT untuk memanfaatkan alat eksternal melalui plugin berdasarkan serangkaian standar yang ditentukan. Toko aplikasi AI serupa, seperti Kouzi ByteDance, Qianfan Baidu, dan Bailian Alibaba, mengikuti jejaknya.

Namun, pendekatan-pendekatan ini akhirnya mencapai batasnya. Plugin dan toko aplikasi berbagi masalah umum: siloization. Setiap alat memiliki dokumentasi pengembangan, format parameter, dan spesifikasi antarmuka yang unik. Ini berarti bahwa pengembang harus menciptakan kembali roda setiap kali mereka mengintegrasikan alat baru ke dalam AI, yang mengakibatkan inefisiensi.

Seiring waktu, jumlah alat baru yang ditambahkan ke toko aplikasi menurun, dan kualitas plugin sangat bervariasi, menghambat kemampuan untuk mengatasi tugas-tugas kompleks. Ini menunjukkan bahwa pendekatan yang ada mendekati batasnya.

MCP sebagai Solusi Pemersatu

MCP dipandang sebagai solusi yang menjanjikan karena penekanannya pada unifikasi. Dalam dokumentasi resminya, Anthropic menyamakan MCP dengan antarmuka USB-C universal untuk dunia AI. Hou Xinyi lebih suka menggambarkannya sebagai ‘stasiun docking’—adaptor serbaguna yang memungkinkan AI untuk terhubung ke beberapa alat eksternal secara bersamaan, menghilangkan kebutuhan untuk konversi format.

Banyak yang mengantisipasi bahwa MCP akan memiliki dampak transformatif, mirip dengan standardisasi berat dan ukuran Qin Shi Huang, yang memfasilitasi perdagangan dan komunikasi di antara negara-negara Zaman Musim Semi dan Gugur yang sebelumnya terfragmentasi.

Menurut pemimpin teknis di kelompok kerja interkoneksi cerdas sebuah perusahaan teknologi besar, MCP juga mengoptimalkan interaksi bahasa AI. Sebelumnya, AI mengharuskan pengguna untuk secara tepat menyatakan ‘Saya ingin bernavigasi’ untuk memanfaatkan API layanan navigasi. Bahkan sedikit penyimpangan pun dapat menyebabkan AI gagal. Sekarang, setiap alat harus menyediakan nama, parameter, dan deskripsi fungsional standar. Akibatnya, AI hanya perlu memahami maksud pengguna dan kemudian mencocokkannya dengan server MCP yang paling tepat berdasarkan deskripsi.

Pendekatan ini lebih selaras dengan kemampuan inheren model bahasa besar, memungkinkan pengguna untuk memanggil layanan dengan satu kalimat, beralih dari persyaratan sebelumnya untuk komunikasi antarmuka-ke-antarmuka langsung.

Adopsi dan Batasan MCP Saat Ini

Meskipun potensi yang dirasakannya, MCP belum mencapai adopsi yang luas, dan aplikasi praktisnya tetap terbatas. Saat ini, MCP paling populer di kalangan personel teknis perusahaan dan pengembang independen.

Sebagai seorang insinyur front-end, Gong Dian sangat bergantung pada asisten pemrograman AI Cursor. Namun, Cursor telah berjuang untuk berintegrasi secara mulus dengan sistem proyek internal perusahaannya, yang membutuhkan intervensi manual. Sementara plugin atau panggilan fungsi dapat digunakan sebelumnya, AI eksternal tidak dapat mengakses sistem internal perusahaan, dan invokasi real-time menimbulkan masalah keamanan. MCP, di sisi lain, dapat dimulai dalam jaringan internal perusahaan, membuatnya lebih andal dan patuh.

Pengembang independen Zhu Mama baru-baru ini menginstruksikan Cursor untuk mempelajari dokumentasi MCP dan mengemas Google Maps dan Search API ke dalam server MCP, yang kemudian digunakan untuk memanggil model bahasa besar Gemini Google. Gemini yang dilengkapi MCP yang dihasilkan diubah menjadi asisten panduan perjalanan. Ketika ditanya tentang rute transportasi umum dari Bandara Singapura ke berbagai atraksi, asisten memberikan informasi yang lebih rinci dan akurat dibandingkan dengan respons Doubao.

Berbagai asisten perjalanan muncul dalam komunitas pengembang. Ketika Kouzi Space ByteDance meluncurkan beta internalnya pada 19 April, kasus demonstrasi juga merupakan asisten AI perjalanan, mendorong beberapa orang untuk bercanda tentang obsesi industri dengan perjalanan.

Zhu Mama dengan jujur mengakui bahwa fokus pada skenario perjalanan terutama karena relevansinya dengan kebutuhan konsumen sehari-hari. Alasan lain adalah ketersediaan terbatas perangkat lunak internet yang kompatibel dengan MCP di Tiongkok, yang membatasi potensi pasar.

Menurut statistik terbaru dari platform navigasi MCP.so, ada lebih dari 11.028 penyedia layanan MCP di seluruh dunia, dan jumlahnya meningkat pesat. Namun, di Tiongkok, hanya beberapa aplikasi lokasi geografis utama, seperti AutoNavi, Baidu Maps, dan Tencent Maps, yang saat ini berfungsi sebagai server MCP skala besar.

Keterbatasan inilah yang menyebabkan rencana Zhu Mama untuk membuat versi Tiongkok dari asisten perjalanan dengan cepat terhenti. Untuk mengembangkan panduan perjalanan Tiongkok, idealnya adalah menggunakan layanan peta domestik. Namun, Zhu Mama menemukan bahwa server MCP resmi yang disediakan oleh AutoNavi menawarkan informasi yang sangat terbatas. Sementara itu dapat memberikan kueri rute antara dua lokasi, itu tidak memiliki informasi rinci tentang landmark, ulasan, harga tiket hotel, dan detail penting lainnya.

Sebaliknya, Google Maps API menyediakan metode pemesanan terperinci, harga hotel, ulasan hotel, fasilitas hotel, dan bahkan perbandingan harga di beberapa platform, tingkat detail yang sulit dibayangkan dalam ekosistem Tiongkok.

Sementara produk Tencent, Alibaba, ByteDance, dan Baidu merangkul MCP, aplikasi frekuensi tinggi mereka belum secara resmi bergabung dengan jaringan penyedia layanan MCP. Platform seperti WeChat, Xiaohongshu, dan Douyin, serta platform layanan gaya hidup seperti Ele.me, Meituan, dan Ctrip, sangat tidak hadir.

Tantangan dalam Ketersediaan Alat dan Penjadwalan AI

Selain ketersediaan alat yang terbatas, kemampuan penjadwalan AI juga menjadi kendala. Zhu Mama mengemas 6-8 antarmuka API, termasuk Google Hotels, Maps, dan Search, ke dalam satu server MCP, yang jauh di bawah batas maksimum (Cursor memungkinkan maksimum 40 alat per agen). Namun, AI sudah berjuang untuk menentukan alat mana yang akan dipanggil. Ketika dihadapkan dengan permintaan yang kompleks, AI tidak dapat memecah proses dan memanggil MCP secara bertahap, alih-alih mencoba untuk menangani semuanya sekaligus.

Menurut Gong Dian, nilai MCP bergantung pada kualitas sisi klien dan server. Sama seperti port USB tidak memiliki kemampuan inheren dan bergantung pada layanan di baliknya, MCP membutuhkan layanan yang kuat untuk mewujudkan potensinya.

MCP meletakkan dasar untuk agen AI, tetapi itu tidak menyelesaikan semua masalah. Standar yang tetap tidak digunakan hanyalah selembar kertas.

Pemimpin teknis yang disebutkan di atas menunjukkan bahwa adopsi luas standar MCP Anthropic adalah karena sifat open-source, nirlaba, dan kredibilitas penciptanya. Organisasi lain bersedia mengikuti standar yang ditetapkan oleh entitas terkemuka.

Saat ini, perusahaan kecil dan menengah serta perusahaan internet besar yang ingin mendiversifikasi aliran pendapatan mereka adalah pengadopsi utama standar MCP.

Perusahaan pendampingan AI MiniMax baru-baru ini meluncurkan server MCP, dengan manajer komunitas Cai Jiaren menyatakan bahwa pengembang dapat menggunakan MCP untuk memanggil kemampuan multi-modal MiniMax untuk pembuatan video, pembuatan suara, dan kloning suara. MCP mencakup mekanisme kontrol akses yang ketat untuk memastikan kepatuhan ketika perusahaan mengakses data internal. Proses invokasi keseluruhan juga disederhanakan, tanpa menambahkan biaya token tambahan.

Keputusan MiniMax untuk meluncurkan server MCP didorong oleh keinginan untuk memungkinkan pengembang global dengan mudah memanfaatkan kemampuan model MiniMax dan membuka kreasi yang lebih fleksibel dan efisien.

Startup lain berbagi aspirasi serupa. Biu Technology menyebutkan dalam sebuah wawancara bahwa pengembang dapat menggunakan AutoNavi MCP untuk mendapatkan data transportasi dan kemudian menggunakan produk Biu untuk menghasilkan PPT. MCP menurunkan hambatan masuk dengan menyediakan akses ke antarmuka AutoNavi, yang jika tidak akan tidak tersedia bagi mereka.

Pemimpin teknis yang disebutkan di atas percaya bahwa MCP pada dasarnya adalah cerita tentang penyedia layanan. Dengan merangkum API mereka sesuai dengan standar MCP, penyedia layanan aplikasi dapat membuat layanan mereka dapat diakses oleh semua AI.

Perbedaan dan Kekhawatiran di antara Penyedia Layanan

Namun, ketidaksepakatan muncul di antara penyedia layanan. Banyak perusahaan tidak sepenuhnya berkomitmen pada ide tersebut. Sementara platform besar seperti AutoNavi dan Baidu Maps telah meluncurkan server MCP, mereka terutama mengemas ulang antarmuka API yang ada, menawarkan fungsionalitas konvensional sambil mempertahankan kontrol ketat atas izin pengguna inti dan data transaksi.

Selain layanan lokasi peta, penerbit otomatis Xiaohongshu pengembang pihak ketiga, yang mengotomatiskan pencarian dan pengeposan konten, saat ini merupakan item paling populer di plaza MCP komunitas Modeng. Hou Xinyi menyarankan bahwa ini mungkin memiliki dampak terbatas pada platform konten sosial seperti Xiaohongshu, tetapi data dan izin menjadi sangat sensitif dalam skenario intensif transaksi seperti platform pengiriman makanan.

Salah satu kekhawatiran utama bagi penyedia layanan adalah kontrol pengalaman pengguna.

Misalnya, membuka layanan pengiriman makanan lengkap mengharuskan pemberian agen AI akses ke data pribadi sensitif seperti harga, informasi toko, dan alamat serta informasi kontak pengguna. Anthropic telah mengakui bahwa sistem keamanan MCP, termasuk manajemen izin dan audit invokasi, masih dalam pengembangan. Akibatnya, beberapa platform khawatir tentang risiko invokasi tidak sah ketika terhubung ke MCP.

Beberapa platform menguji skenario transaksi yang relatif aman. Misalnya, Alipay baru-baru ini meluncurkan server MCP, mengklaim untuk memberi agen AI ‘akses sekali klik ke kemampuan pembayaran’. Namun, tinjauan lebih dekat mengungkapkan bahwa itu terutama menawarkan layanan koleksi daripada pembayaran.

Menurut Hou Xinyi, pendekatan Alipay berfokus pada memfasilitasi koleksi pembayaran pedagang daripada mengizinkan AI untuk melakukan pembayaran atas nama konsumen. Ini adalah opsi yang layak, karena mengizinkan AI untuk mengendalikan dompet dan melakukan pemesanan secara bebas belum cukup aman untuk kenyamanan semua orang. Ini juga merupakan alasan utama mengapa layanan transaksi tidak dapat dipromosikan secara luas.

Masalah yang lebih dalam adalah bahwa jika AI secara bebas berpartisipasi dalam proses transaksi – membantu pengguna membandingkan harga atau merekomendasikan restoran yang paling hemat biaya – itu pasti akan memberikan kenyamanan yang signifikan bagi pengguna. Namun, itu juga berarti bahwa platform layanan akan kehilangan kendali atas proses pemilihan pengguna, dan keuntungan algoritma inti mereka akan terpinggirkan, mengurangi mereka menjadi pemasok biasa.

Mengatasi Keamanan dan Mempromosikan Universalitas

Beberapa pewawancara percaya bahwa MCP perlu mengatasi dua masalah utama: keamanan dan universalitas.

Pertama, keamanan. Hou Xinyi menunjukkan bahwa MCP menghadapi dua tantangan keamanan: kurangnya pengawasan keamanan terpusat dan mekanisme verifikasi identitas dan otorisasi data yang tidak lengkap. Saat ini, tidak ada ‘plaza penemuan’ resmi untuk MCP. Banyak platform navigasi pihak ketiga mengumpulkan layanan MCP dengan langsung menarik proyek kode dari GitHub, yang cepat dan mudah tetapi tidak memiliki proses peninjauan formal. Anthropic telah menyatakan bahwa itu akan secara resmi membahas mekanisme hosting MCP dan masalah discoverability tahun ini. Draf protokol Anthropic yang baru-baru ini diperbarui sedang berupaya mengatasi kekurangan ini. Selain itu, organisasi domestik seperti IIFAA (Internet Trusted Authentication Alliance) sedang berusaha untuk mengisi kesenjangan keamanan.

Ada juga masalah lama di bidang agen AI, seperti pembajakan prompt dan serangan kombinasi alat. Namun, pemimpin teknis yang disebutkan di atas percaya bahwa ini bukanlah kerentanan MCP tetapi risiko yang ada untuk agen AI mana pun. Saat ini, tidak ada kerentanan keamanan yang jelas yang ditemukan dalam protokol MCP itu sendiri, dan mekanisme transmisi dan interaksi data umumnya andal.

Keamanan hanyalah rintangan pertama. Tantangan sebenarnya adalah mengatasi pertahanan kepentingan produsen dan membujuk lebih banyak produsen untuk menjadi server MCP.

Menurut Hou Xinyi, ini terkait dengan pemahaman tentang sifat ‘taman bertembok’ platform internet. Data adalah penghalang kompetitif penting bagi berbagai platform, jadi banyak produsen hanya dapat membuka beberapa fungsi periferal sebagai server MCP untuk pengujian. Produsen mungkin perlu menunggu dan melihat seberapa besar dampak yang akan ditimbulkan oleh ekosistem MCP.

Orang yang bertanggung jawab yang disebutkan di atas mengatakan bahwa jika terhubung ke AI sebagai server MCP, itu dapat memperoleh lebih banyak data dan kebiasaan pengguna, dan memberikan kembali ke model dasarnya sendiri, yang mungkin menjadi motivasi terbesar bagi produsen untuk secara aktif bergabung.

Ketika pasar server MCP benar-benar berlimpah, masalah yang lebih jauh harus dipertimbangkan.

Misalnya, bagaimana tubuh pintar memanggil Aplikasi yang berbeda di ponsel? Orang yang bertanggung jawab menyebutkan bahwa untuk membangunkan Aplikasi lain melalui tubuh pintar AI lokal dari ponsel, akan ada lapisan otorisasi aplikasi dan verifikasi identitas tambahan, yang tidak sesederhana MCP yang memanggil layanan cloud, dan saat ini tidak ada solusi yang sangat cocok.

Sebagai contoh lain, ketika pasokan layanan berlebihan, bagaimana tubuh pintar membuat pilihan - memanggil JD takeaway atau Meituan takeaway? Gunakan Gaode map atau Baidu map? Beberapa pewawancara menyebutkan bahwa logika invokasi MCP saat ini masih sangat mendasar, terutama ditentukan oleh ‘deskripsi fungsional’ penyedia layanan, dan tidak ada mekanisme penyortiran dan pengoptimalan. Jika penyedia layanan dengan sengaja menambahkan bahasa induktif ke deskripsi, seperti ‘paling efisien’ dan ‘harus dipilih’, AI dapat disesatkan dan dialihkan ke tempat-tempat yang seharusnya tidak dituju.

Seperti yang dijelaskan oleh orang yang bertanggung jawab atas teknologi yang disebutkan di atas, ‘Ini seperti Anda tidak dapat menemukan layanan yang Anda inginkan di mesin pencari, tetapi banyak informasi berantakan muncul. Bagaimana secara akurat mencocokkan layanan yang paling dibutuhkan pengguna, ekosistem MCP masa depan juga akan menghadapi masalah yang sama.’

Pada akhirnya, proses implementasi standar apa pun penuh dengan tantangan. Hou Xinyi mengatakan bahwa untuk mempromosikan popularisasi MCP, peluang utama yang mirip dengan Manus mungkin diperlukan untuk benar-benar membuat seluruh industri menyadari kekuatan MCP.