MCP: Cuộc đua mới của các gã khổng lồ công nghệ

Trong bối cảnh Trí tuệ Nhân tạo (AI) không ngừng phát triển, một lĩnh vực mới đã nổi lên, thu hút sự chú ý của cả những gã khổng lồ công nghệ và các nhà phát triển. ‘Ngôi sao mới’ này là Model Context Protocol (MCP), một công nghệ hứa hẹn sẽ cách mạng hóa cách các mô hình AI tương tác với thế giới bên ngoài.

Vào ngày 29 tháng 4, Alibaba đã gây tiếng vang lớn khi phát hành và mã nguồn mở mô hình Tongyi Qianwen thế hệ tiếp theo của mình, Qwen3. Mô hình này không chỉ tự hào có hiệu suất nâng cao và chi phí giảm mà còn có hỗ trợ cải tiến cho MCP. Sự tiến bộ này cho phép các nhà phát triển tích hợp liền mạch các nguồn dữ liệu và công cụ bên ngoài khác nhau với mô hình ngôn ngữ lớn Qwen3, mở đường cho việc phát triển các AI Agents (tác nhân thông minh) hiệu quả và tiết kiệm chi phí hơn.

Các nhà phát triển đầy nhiệt huyết đã thử nghiệm Qwen3 để tạo ra các ứng dụng sáng tạo. Feng Lei, người sáng lập Mars Waves và cựu lãnh đạo sản phẩm tại MiniMax Conch AI, đã phát triển một trang web sử dụng thành công nhiều MCP khác nhau, bao gồm hình ảnh, âm thanh và bản đồ, để nhanh chóng đạt được kết quả mong muốn. Ông chia sẻ thành tích của mình trên mạng xã hội, nhấn mạnh tầm quan trọng sống còn của việc hỗ trợ MCP gốc.

Tương tự, trong Hội nghị Nhà phát triển AI Baidu Create 2025 vào ngày 25 tháng 4, người sáng lập Baidu Li Yanhong tuyên bố rằng “MCP cho phép AI hiểu rõ hơn về thế giới bên ngoài, truy cập thông tin dễ dàng hơn và sử dụng các công cụ tự do hơn. Chúng tôi tin rằng MCP là một bước tiến quan trọng đối với sự phát triển của AI và các nhà phát triển nên hiểu và chấp nhận nó càng sớm càng tốt.” Tại hội nghị, Baidu Intelligent Cloud đã chính thức ra mắt dịch vụ MCP cấp doanh nghiệp đầu tiên tại Trung Quốc, khuyến khích các nhà phát triển áp dụng hoàn toàn MCP.

Về bản chất, MCP có thể được xem như một ‘ổ cắm đa năng’ cho kỷ nguyên AI. Nó cho phép các mô hình ngôn ngữ lớn dễ dàng truy cập các nguồn dữ liệu và công cụ bên ngoài đa dạng, đạt được ‘kết nối một cú nhấp chuột’ với thế giới bên ngoài. Điều này sẽ tăng cường đáng kể hiệu quả phát triển của các ứng dụng AI và các AI Agents khác nhau. Trên thực tế, trước Baidu, một số gã khổng lồ internet khác, bao gồm Alibaba, Tencent và ByteDance, đã triển khai hỗ trợ MCP. Ban đầu là một thuật ngữ thích hợp giữa các nhà phát triển, MCP đã biến thành một khái niệm chủ đạo, trở thành một chiến trường mới cho các công ty khác nhau. Khi hệ sinh thái MCP tiếp tục phát triển và thịnh vượng, các ứng dụng AI agent dự kiến sẽ phát triển mạnh mẽ.

‘Ổ cắm đa năng’ của kỷ nguyên AI

Song Jiaji, Phó Giám đốc Viện Nghiên cứu Chứng khoán Guosheng và Chuyên gia phân tích trưởng của Ngành Truyền thông, so sánh sự nổi lên của MCP với giao thức TCP/IP trong lĩnh vực truyền thông, khẳng định rằng nó sẽ thúc đẩy sự ra đời của các ứng dụng gốc AI. Trong kỷ nguyên internet, TCP/IP đóng vai trò là giao thức truyền thông dữ liệu cơ bản, cho phép truyền dữ liệu hiệu quả và kết nối liền mạch giữa các thiết bị khác nhau. Tương tự, trong kỷ nguyên AI, MCP đóng một vai trò tương đương, cung cấp ‘kết nối một cú nhấp chuột’ cho các mô hình ngôn ngữ lớn để truy cập dữ liệu và công cụ bên ngoài.

Theo một chuyên gia AI cao cấp, MCP về cơ bản là một giao thức kỹ thuật, một tập hợp các thông số kỹ thuật được thống nhất chung để phát triển AI Agents, tương tự như việc tiêu chuẩn hóa văn bản và vận chuyển trong triều đại nhà Tần. Với một tiêu chuẩn và thông số kỹ thuật thống nhất, hiệu quả cộng tác sẽ được cải thiện đáng kể. MCP không phải là một phát minh gần đây; nó ban đầu được phát hành bởi Anthropic, một công ty khởi nghiệp mô hình ngôn ngữ lớn nổi tiếng có trụ sở tại Hoa Kỳ, vào tháng 11 năm ngoái, với mục tiêu giảm chi phí sử dụng dữ liệu và công cụ bên ngoài cho các mô hình ngôn ngữ lớn.

Mặc dù MCP ban đầu nhận được phản hồi yếu ớt, nhưng sự xuất hiện của Manus, một AI agent đa năng do nội địa phát triển, vào tháng 2 năm nay, đã làm dấy lên sự quan tâm trở lại. Manus, có khả năng tự động thực hiện các nhiệm vụ phức tạp dựa trên hướng dẫn của con người, từ tự động đặt vé và tạo hướng dẫn du lịch đến tạo trang web, đã nhanh chóng trở nên phổ biến vì khả năng không chỉ trò chuyện và suy nghĩ mà còn ‘xắn tay áo’ như con người. Mặc dù người sáng lập của nó tuyên bố rằng Manus được phát triển trước khi MCP được phát hành và do đó không sử dụng giao thức, thay vào đó sử dụng các phương pháp mã hóa khác để gọi nhiều công cụ, Manus vẫn nhấn mạnh giá trị của các tác nhân thông minh và tầm quan trọng của MCP.

Trước khi giới thiệu MCP, chi phí truy cập các công cụ bên ngoài cho các mô hình ngôn ngữ lớn tương đối cao. Ví dụ: nếu người dùng muốn sử dụng một mô hình ngôn ngữ lớn để đặt vé máy bay và khách sạn và nhận xác nhận qua email, mô hình sẽ cần gọi các API (Giao diện Lập trình Ứng dụng) của các ứng dụng hãng hàng không, khách sạn và email riêng biệt. Mỗi tích hợp API sẽ yêu cầu viết mã, tài liệu, phương pháp xác thực, xử lý lỗi và phương pháp bảo trì riêng biệt, về cơ bản yêu cầu các ‘khóa’ khác nhau để mở khóa các dịch vụ này. Tuy nhiên, với MCP, chỉ cần kết nối hoặc định cấu hình các máy chủ MCP của các dịch vụ hàng không, khách sạn và email, tương tự như cắm ổ USB chứa các dịch vụ hàng không, khách sạn và email vào máy tính của người dùng qua cổng Type-C.

Ưu điểm của một tiêu chuẩn thống nhất là nó làm giảm sự phát triển và xây dựng dư thừa, tránh mã hóa lặp đi lặp lại và do đó cải thiện đáng kể hiệu quả phát triển và giảm chi phí phát triển. Miễn là nó tuân thủ và hỗ trợ tiêu chuẩn MCP, tất cả các công cụ có thể đạt được chức năng ‘cắm và chạy’, cho phép các nhà phát triển nhanh chóng xây dựng các ứng dụng AI mạnh mẽ hơn. Báo cáo nghiên cứu của Galaxy Securities chỉ ra rằng MCP dự kiến sẽ thúc đẩy việc nâng cấp các ứng dụng AI agent từ khả năng tư vấn và đề xuất thông tin đơn giản sang khả năng thực thi, thúc đẩy việc xây dựng một hệ sinh thái ứng dụng phong phú và phức tạp hơn cho các AI agent.

Sự tham gia toàn diện của các gã khổng lồ internet

Năm 2025 đang được ca ngợi là ‘Năm số không’ cho các AI agent. Là một giao thức tiêu chuẩn, MCP có thể giải quyết đáng kể các vấn đề về chi phí kỹ thuật cao và hiệu quả thấp trong việc gọi các công cụ bên ngoài trong quá trình phát triển tác nhân thông minh, biến nó thành một tiêu điểm mới cho các gã khổng lồ internet.

Vào ngày 21 tháng 3, Baidu Maps thông báo rằng các API cốt lõi của nó hoàn toàn tương thích với MCP, trở thành nhà cung cấp dịch vụ bản đồ đầu tiên ở Trung Quốc làm như vậy. Vào ngày 9 tháng 4, nền tảng Bailian của Alibaba Cloud đã ra mắt dịch vụ MCP vòng đời đầy đủ đầu tiên trong ngành. Vào ngày 14 tháng 4, Tencent Cloud thông báo rằng công cụ kiến thức mô hình ngôn ngữ lớn của họ đã được nâng cấp để hỗ trợ giao thức MCP. Vào ngày 18 tháng 4, nền tảng phát triển ứng dụng AI của ByteDance, Kouzi Space, đã bắt đầu thử nghiệm nội bộ, với nền tảng tích hợp hệ thống mở rộng MCP. Giai đoạn đầu của thử nghiệm nội bộ hỗ trợ tích hợp các thành phần tần số cao như bảng đa chiều Feishu, Bản đồ Gaode và các công cụ hình ảnh.

Xu Zhiyuan, Chuyên gia Sản phẩm Cấp cao tại Alibaba Cloud Bailian, tuyên bố rằng Alibaba Cloud là nhà sản xuất mô hình ngôn ngữ lớn hàng đầu ở Trung Quốc, sở hữu mô hình Tongyi Qianwen tự phát triển toàn diện và cũng là nhà cung cấp dịch vụ đám mây số 1 tại Trung Quốc, khiến nó trở thành một điều kiện cần thiết để triển khai Agent+MCP thành công. Khả năng mô hình mạnh mẽ đảm bảo hỗ trợ lý luận sâu sắc và lên lịch các nhiệm vụ và công cụ phức tạp, trong khi nguồn tài nguyên điện toán đám mây dồi dào đảm bảo rằng các dịch vụ MCP ổn định, khả dụng và hiệu quả.

Cụ thể, nền tảng Alibaba Cloud Bailian tích hợp Alibaba Cloud Function Compute, hơn 200 mô hình ngôn ngữ lớn hàng đầu trong ngành và gần 100 dịch vụ MCP chính thống, giải quyết toàn diện các tài nguyên điện toán, tài nguyên mô hình ngôn ngữ lớn và chuỗi công cụ ứng dụng cần thiết cho việc phát triển tác nhân thông minh. Điều này loại bỏ nhu cầu người dùng quản lý tài nguyên, phát triển triển khai và thực hiện các hoạt động kỹ thuật, giảm đáng kể rào cản gia nhập để phát triển Agent. Ví dụ: người dùng đã xây dựng một tác nhân thông minh trên nền tảng Bailian bằng dịch vụ Bocha MCP và mô hình ngôn ngữ lớn Tongyi Qianwen, có thể truy vấn hiệu quả lượng lớn dữ liệu và nhanh chóng tạo ra các biểu đồ trực quan. Toàn bộ quá trình rất thuận tiện, chỉ mất vài phút để hoàn thành quá trình phát triển.

Bocha, như Xu Zhiyuan đã đề cập, là một công cụ tìm kiếm dựa trên AI hỗ trợ chức năng tìm kiếm trực tuyến của các mô hình ngôn ngữ lớn như DeepSeek. Alibaba Cloud Bailian hiện đã triển khai dịch vụ Bocha MCP và tìm kiếm trực tuyến là một công cụ cơ bản mà nhiều tác nhân thông minh phải gọi trong quá trình thực hiện nhiệm vụ. Công cụ này sẽ tránh được một lượng lớn công việc mã hóa lặp đi lặp lại.

Hơn nữa, sự hỗ trợ đầy đủ của MCP bởi các gã khổng lồ internet, với các dòng kinh doanh và hệ thống hệ sinh thái ứng dụng rộng lớn của họ, cung cấp cho các tác nhân thông minh một loạt các công cụ có thể gọi được. Ví dụ: Alipay đã ra mắt ‘Máy chủ MCP Thanh toán’ đầu tiên của Trung Quốc vào ngày 15 tháng 4, cung cấp hỗ trợ khả năng thanh toán gốc cho các tác nhân thông minh AI. Các nhà phân tích trong ngành cho biết rằng với dịch vụ MCP của Alipay, các nhà phát triển có thể rút ngắn đáng kể quy trình phát triển các liên kết thanh toán cho các ứng dụng dịch vụ khác nhau. Trong tác nhân thông minh, họ có thể dễ dàng sử dụng Alipay để hoàn thành một loạt các hoạt động khép kín như truy vấn, giao dịch và hoàn tiền, do đó mở ra ‘dặm cuối cùng’ của vòng khép kín thương mại.

Chuyên gia AI cao cấp nói trên cho biết rằng với việc bổ sung MCP, số lượng dòng mã cần thiết để xây dựng một tác nhân thông minh có cùng chức năng đã giảm từ hơn 3.000 xuống dưới 500, mang lại một bước nhảy vọt về chất trong hiệu quả phát triển của các tác nhân thông minh. Xu Zhiyuan tiết lộ rằng trong vòng một tuần sau khi ra mắt dịch vụ MCP của họ, số lượng người dùng được kích hoạt đã vượt quá 10.000 và họ đang xây dựng các tác nhân thông minh cho các tình huống khác nhau dựa trên dịch vụ MCP. Nhiều khách hàng và đối tác của Alibaba Cloud cũng đã tham gia hệ sinh thái MCP. Gần đây, nền tảng Alibaba Cloud Bailian đã ra mắt hàng chục dịch vụ MCP dựa trên đám mây, bao gồm Baiwang Finance and Taxation, Feichangzhun, Bocha Search và Yingmi Fund, với nhiều nhà cung cấp dịch vụ đang dần tham gia nền tảng. Trong tương lai, nó sẽ tiếp tục làm phong phú thêm nguồn cung hệ sinh thái và đẩy nhanh việc ứng dụng AI.

Vẫn trong giai đoạn phát triển nhanh chóng

Có một sự đồng thuận chung trong ngành rằng MCP cung cấp một phương pháp tiêu chuẩn hóa để các mô hình AI giao tiếp với các nguồn dữ liệu và công cụ khác nhau, và là ‘chìa khóa’ để đẩy nhanh việc ứng dụng các mô hình ngôn ngữ lớn. Với sự tham gia và bố trí của các công ty internet lớn, ranh giới sinh thái của MCP cũng sẽ được mở rộng hơn nữa. Tuy nhiên, sự phát triển của các tác nhân thông minh vẫn còn ở giai đoạn đầu và tương ứng, MCP vẫn chưa được cố định và hoàn thiện, mà đang trong quá trình phát triển nhanh chóng.

Trước MCP, OpenAI đã đề xuất Function Calling vào tháng 6 năm 2023 để giúp các nhà phát triển tích hợp các mô hình ngôn ngữ lớn với các chức năng hoặc công cụ bên ngoài. Function Calling là một thiết kế rất tốt đã được ngành công nghiệp coi là tiêu chuẩn kể từ khi ra đời. Tuy nhiên, vấn đề duy nhất là lượng công việc cần thiết để viết các hàm bên ngoài là quá lớn. Với sự phát triển của công nghệ, sự phức tạp của các tác nhân thông minh ngày càng tăng và độ khó của sự phát triển đang tăng lên theo cấp số nhân. Ưu điểm của MCP là nó thống nhất các tiêu chuẩn Function Calling khác biệt ban đầu của các mô hình ngôn ngữ lớn khác nhau, hình thành một giao thức chung.

Sau MCP, Google Cloud đã công bố mã nguồn mở của giao thức tương tác tác nhân thông minh tiêu chuẩn đầu tiên, Agent2Agent Protocol (A2A), vào đầu tháng 4, nhằm mục đích phá vỡ các rào cản giữa các tác nhân thông minh hiện tại và đạt được sự giao tiếp và cộng tác lẫn nhau giữa các tác nhân thông minh được xây dựng bởi các nhà sản xuất khác nhau và các khuôn khổ khác nhau. Trong một thời gian, câu nói ‘MCP đã lỗi thời’ đã xuất hiện trong cộng đồng nhà phát triển, với một số người tin rằng MCP có thể chỉ là một công nghệ chuyển tiếp và sẽ là một hiện tượng thoáng qua trong một khoảng thời gian.

Đáp lại, một báo cáo nghiên cứu của Guosheng Securities tin rằng cuộc chiến cho các giao thức giao tiếp Agent vẫn chưa kết thúc. Mặc dù A2A và MCP có các mục đích khác nhau, trước đây là để giao tiếp giữa các Agents, trong khi sau này là để kết nối giữa các Agents và các công cụ và dữ liệu bên ngoài. Tuy nhiên, trong tình huống phức tạp khi ‘các công cụ cũng có thể được đóng gói dưới dạng Agents’, các chức năng của cả hai phải có một số chồng chéo, nhưng sự cạnh tranh này giúp giảm chi phí cho các mô hình ngôn ngữ lớn gọi các công cụ bên ngoài và giao tiếp.

Cho dù đó là MCP hay A2A, bản thân giao thức không có tính độc đáo tuyệt đối. Nó cung cấp một phương pháp kết nối tiêu chuẩn hơn cho mô hình, kích hoạt nguồn cung và giảm độ khó của việc kết nối mô hình với các dịch vụ thực khác nhau. Cuối cùng, đó là để giải phóng năng suất AI và đẩy nhanh sự bùng nổ của các ứng dụng. MCP là một sản phẩm tự nhiên của toàn bộ giai đoạn phát triển mô hình ngôn ngữ lớn. Ngay cả khi không có MCP ngày nay, có những giao thức khác để đạt được bước này.

Xu Zhiyuan tiếp tục chỉ ra rằng MCP hiện có nhiều vấn đề, chẳng hạn như xác thực thống nhất, bảo vệ an ninh, kết nối dài ổn định và quản lý đa bên thuê. Từ quan điểm cá nhân, các vấn đề hiện tại không khủng khiếp, nhưng phản ánh những nhu cầu thực tế tồn tại trong các nhà phát triển và triển khai kinh doanh thực tế. Gần đây, chúng tôi cũng đã thấy rằng sự phát triển giao thức của MCP đang tiếp tục. Là một giao thức mã nguồn mở, nó sẽ tiếp tục lặp lại và cải thiện với sự phát triển của công nghệ và hệ sinh thái, và sẽ dần đạt đến trạng thái tương đối ổn định trong tương lai.