Khi nhu cầu về các agent thông minh đa dạng hóa giữa các nhóm người dùng, quản trị phải giải quyết các ưu tiên khác nhau. Giao thức Ngữ cảnh Mô hình (MCP), được củng cố bằng sự hợp tác nguồn mở và sự giám sát của con người, cung cấp một nền tảng cho một hệ sinh thái agent an toàn và đáng tin cậy.
Các agent thông minh (AI Agent) là các hệ thống được cung cấp bởi các mô hình ngôn ngữ lớn, có khả năng tương tác với thế giới bên ngoài thông qua các công cụ và hành động thay mặt cho người dùng. Sự xuất hiện gần đây của Manus làm nổi bật sự mong đợi của thị trường đối với các ứng dụng agent thực tế.
Được công bố vào tháng 11 năm 2024, Giao thức Ngữ cảnh Mô hình (MCP) mã nguồn mở của Anthropic cung cấp một giải pháp kỹ thuật để tăng cường hiệu quả và bảo mật của các agent đa năng. MCP hợp lý hóa tích hợp thông qua các giao diện được tiêu chuẩn hóa, tăng cường hiệu quả truy cập dữ liệu và công cụ. Nó cũng củng cố bảo mật bằng cách cô lập các mô hình khỏi các nguồn dữ liệu cụ thể và tăng cường tính minh bạch trong kiểm soát lệnh. Cách tiếp cận cân bằng này ưu tiên trải nghiệm người dùng đồng thời đảm bảo ủy quyền được kiểm soát.
Mặc dù MCP thiết lập một nền tảng cho quản trị agent, nhưng nó không giải quyết mọi thách thức. Ví dụ: nó không xác thực cơ sở lý luận đằng sau việc lựa chọn công cụ hoặc tính chính xác của kết quả thực thi, cũng như không giải quyết hiệu quả sự cạnh tranh và hợp tác trong hệ sinh thái ứng dụng agent.
Các thách thức mà Agent đa năng phải đối mặt trong ứng dụng
Một Agent là một hệ thống được trang bị bộ nhớ, lập kế hoạch, nhận thức, triệu gọi công cụ và khả năng hành động, được hỗ trợ bởi các mô hình ngôn ngữ rộng lớn, tương tác với môi trường bên ngoài thông qua các công cụ, hành động thay mặt cho người dùng. Agent cần nhận thức và hiểu ý định của người dùng, thu thập và lưu trữ thông tin thông qua mô-đun bộ nhớ, xây dựng và tối ưu hóa các chiến lược bằng cách tận dụng mô-đun lập kế hoạch, triệu gọi mô-đun công cụ để thực hiện các tác vụ cụ thể và thực hiện các kế hoạch thông qua mô-đun hành động, do đó đạt được mục tiêu hoàn thành các tác vụ một cách tự chủ.
Manus giống một Agent đa năng hơn, không giống như các sản phẩm Agent định hướng quy trình làm việc.
Kỳ vọng của ngành đối với Agent, đặc biệt là Agent đa năng, bắt nguồn từ các nhu cầu chung mà chúng giải quyết. Trong thị trường vốn, Agent đại diện cho con đường khép kín dự kiến của ngành đối với giá trị thương mại của các mô hình, chuyển giá AI từ tính toán dựa trên mã thông báo sang định giá dựa trên hiệu ứng cho các dịch vụ tùy chỉnh, dẫn đến lợi nhuận cao hơn. Về phía người dùng, các doanh nghiệp kỳ vọng Agent thực hiện các quy trình lặp đi lặp lại, được tiêu chuẩn hóa và xác định rõ ràng với tự động hóa chính xác, trong khi công chúng kỳ vọng Agent mang lại ‘lợi ích công nghệ’, trở thành ‘quản gia kỹ thuật số’ được cá nhân hóa, ngưỡng thấp cho mọi người.
Tuy nhiên, Agent đa năng phải đối mặt với các thách thức về khả năng tương thích, bảo mật và cạnh tranh trong ứng dụng. Về khả năng tương thích, các mô hình cần cộng tác hiệu quả với các công cụ và nguồn dữ liệu khác nhau trong cuộc gọi. Về bảo mật, Agent cần thực hiện các tác vụ một cách rõ ràng và minh bạch theo hướng dẫn của người dùng và phân bổ hợp lý trách nhiệm bảo mật theo sự hội tụ dữ liệu của nhiều bên. Về cạnh tranh, Agent cần giải quyết các mối quan hệ cạnh tranh và hợp tác trong hệ sinh thái kinh doanh mới.
Do đó, giao thức MCP, cho phép các mô hình cộng tác hiệu quả với các công cụ và nguồn dữ liệu khác nhau và phân bổ hợp lý trách nhiệm bảo mậttheo sự hội tụ dữ liệu của nhiều bên, đáng để nghiên cứu sâu so với chính sản phẩm Manus.
Các mối quan tâm về khả năng tương thích
Thế giới AI đang phát triển nhanh chóng, với các mô hình và công cụ mới liên tục xuất hiện. Để một agent đa năng thực sự hữu ích, nó cần có khả năng tích hợp liền mạch với nhiều loại tài nguyên. Điều này đặt ra một thách thức đáng kể, vì mỗi công cụ hoặc nguồn dữ liệu có thể có giao diện và định dạng dữ liệu riêng. Nếu không có một phương pháp tiêu chuẩn hóa, các nhà phát triển sẽ cần viết mã tùy chỉnh cho mỗi tích hợp, điều này tốn thời gian và không hiệu quả. Việc thiếu khả năng tương thích này có thể cản trở việc áp dụng rộng rãi các agent AI, vì người dùng có thể miễn cưỡng đầu tư vào một công nghệ không dễ dàng hoạt động với các hệ thống hiện có của họ.
Rủi ro bảo mật
Agent AI được thiết kế để hành động thay mặt cho người dùng, điều đó có nghĩa là chúng thường có quyền truy cập vào dữ liệu và hệ thống nhạy cảm. Điều này làm dấy lên những lo ngại đáng kể về bảo mật, vì một agent bị xâm phạm có thể được sử dụng để đánh cắp dữ liệu, phá vỡ hoạt động hoặc thậm chí gây ra tác hại vật chất. Điều quan trọng là phải đảm bảo rằng các agent được thiết kế có tính đến bảo mật và chúng phải chịu sự kiểm tra và giám sát nghiêm ngặt để ngăn chặn các lỗ hổng. Ngoài ra, điều quan trọng là phải thiết lập các dòng trách nhiệm rõ ràng về bảo mật, đặc biệt khi nhiều bên tham gia vào việc phát triển và triển khai một agent.
Bối cảnh cạnh tranh
Khi agent AI trở nên phổ biến hơn, chúng có khả năng phá vỡ các mô hình kinh doanh hiện có và tạo ra các hình thức cạnh tranh mới. Ví dụ: một agent có thể tự động đàm phán giá với các nhà cung cấp có thể mang lại cho một công ty một lợi thế cạnh tranh đáng kể. Tuy nhiên, điều này cũng có thể dẫn đến một cuộc chạy đua xuống đáy, khi các công ty cạnh tranh để cung cấp giá thấp nhất. Điều quan trọng là phải xem xét tác động tiềm tàng của agent AI đối với bối cảnh cạnh tranh và phát triển các chiến lược để điều hướng môi trường mới này. Điều này bao gồm giải quyết các vấn đề như quyền sở hữu dữ liệu, sở hữu trí tuệ và khả năng có hành vi chống cạnh tranh.
MCP: Một giải pháp kỹ thuật cho khả năng tương thích và bảo mật trong các ứng dụng Agent
Vào tháng 11 năm 2024, Anthropic đã mở mã nguồn MCP (Giao thức Ngữ cảnh Mô hình), cho phép các hệ thống cung cấp ngữ cảnh cho các mô hình AI và có thể được phổ quát hóa trong các tình huống tích hợp khác nhau. MCP sử dụng kiến trúc phân lớp để giải quyết các vấn đề tiêu chuẩn hóa và bảo mật trong các ứng dụng Agent. Một ứng dụng chủ (chẳng hạn như Manus) kết nối với nhiều chương trình dịch vụ (MCP Server) thông qua máy khách MCP cùng một lúc và mỗi Server thực hiện nhiệm vụ riêng, cung cấp quyền truy cập được tiêu chuẩn hóa vào một nguồn dữ liệu hoặc ứng dụng.
Đầu tiên, MCP giải quyết vấn đề tương thích trong các cuộc gọi dữ liệu/công cụ của Agent thông qua sự đồng thuận tiêu chuẩn. MCP thay thế tích hợp phân mảnh bằng một giao diện thống nhất và AI chỉ cần hiểu và tuân thủ thỏa thuận để tương tác với tất cả các công cụ đáp ứng các thông số kỹ thuật, điều này làm giảm đáng kể việc tích hợp trùng lặp. Thứ hai, MCP có ba cân nhắc về bảo mật. Đầu tiên, mô hình và các nguồn dữ liệu cụ thể được cô lập trên liên kết dữ liệu và hai bên tương tác thông qua giao thức MCP Server. Mô hình không phụ thuộc trực tiếp vào các chi tiết bên trong của nguồn dữ liệu, làm rõ nguồn gốc của việc trộn dữ liệu nhiều bên. Thứ hai là cải thiện tính minh bạch và khả năng kiểm tra của liên kết điều khiển lệnh thông qua các giao thức giao tiếp và giải quyết các thách thức về bất đối xứng thông tin và hộp đen của tương tác dữ liệu người dùng-mô hình. Thứ ba là đảm bảo khả năng kiểm soát của liên kết ủy quyền bằng cách phản hồi theo quyền và đảm bảo quyền kiểm soát của người dùng đối với Agent trong việc sử dụng công cụ/dữ liệu.
MCP xây dựng một giao diện được tiêu chuẩn hóa và cơ chế bảo vệ bảo mật thông qua kiến trúc phân lớp, đạt được sự cân bằng giữa khả năng tương tác và bảo mật trong các cuộc gọi dữ liệu và công cụ. Ở cấp độ giá trị người dùng, MCP mang lại sự cộng tác và tương tác mạnh mẽ hơn giữa các cơ thể thông minh và nhiều công cụ hơn, và thậm chí nhiều cơ thể thông minh hơn. Trong giai đoạn tiếp theo, MCP sẽ tập trung vào phát triển hỗ trợ cho các kết nối từ xa.
Giao diện được tiêu chuẩn hóa để tăng cường khả năng tương thích
Một trong những tính năng chính của MCP là việc sử dụng các giao diện được tiêu chuẩn hóa. Điều này có nghĩa là các agent AI có thể tương tác với các công cụ và nguồn dữ liệu khác nhau mà không yêu cầu mã tùy chỉnh cho mỗi tích hợp. Thay vào đó, agent chỉ cần hiểu giao thức MCP, xác định một tập hợp các lệnh và định dạng dữ liệu chung. Điều này đơn giản hóa đáng kể quy trình tích hợp và giảm khối lượng công việc phát triển cần thiết. Nó cũng giúp dễ dàng chuyển đổi giữa các công cụ và nguồn dữ liệu khác nhau hơn, vì agent không cần phải cấu hình lại mỗi lần.
Việc sử dụng các giao diện được tiêu chuẩn hóa cũng thúc đẩy khả năng tương tác giữa các agent AI khác nhau. Nếu nhiều agent đều hỗ trợ giao thức MCP, họ có thể dễ dàng giao tiếp và chia sẻ dữ liệu với nhau. Điều này có thể dẫn đến sự phát triển của các hệ thống AI phức tạp và tinh vi hơn, nơi nhiều agent làm việc cùng nhau để giải quyết một vấn đề.
Cơ chế bảo mật mạnh mẽ để bảo vệ dữ liệu
Bảo mật là ưu tiên hàng đầu trong thiết kế của MCP. Giao thức này bao gồm một số cơ chế để bảo vệ dữ liệu và ngăn chặn truy cập trái phép. Một tính năng quan trọng là sự cô lập của các mô hình khỏi các nguồn dữ liệu cụ thể. Điều này có nghĩa là agent không có quyền truy cập trực tiếp vào dữ liệu cơ bản mà thay vào đó tương tác với nó thông qua giao thức MCP Server. Điều này thêm một lớp gián tiếp gây khó khăn hơn cho kẻ tấn công xâm phạm dữ liệu.
MCP cũng bao gồm các cơ chế để cải thiện tính minh bạch và khả năng kiểm tra của các liên kết điều khiển lệnh. Điều này cho phép người dùng xem chính xác những lệnh nào đang được gửi đến agent và xác minh rằng agent đang hành động theo hướng dẫn của họ. Điều này rất quan trọng để xây dựng niềm tin vào các hệ thống AI, vì nó cho phép người dùng hiểu cách agent đưa ra quyết định.
Cuối cùng, MCP cung cấp một cơ chế để kiểm soát ủy quyền của các agent. Điều này cho phép người dùng chỉ định những công cụ và nguồn dữ liệu nào mà agent được phép truy cập. Điều này rất quan trọng để ngăn agent truy cập dữ liệu nhạy cảm hoặc thực hiện các hành động mà nó không được ủy quyền thực hiện.
MCP: Đặt nền móng cho quản trị Agent
MCP cung cấp các đảm bảo về khả năng tương thích và bảo mật cho các cuộc gọi dữ liệu và công cụ, đặt nền tảng cho quản trị Agent, nhưng nó không thể giải quyết tất cả các thách thức phải đối mặt trong quản trị.
Đầu tiên, về độ tin cậy, MCP chưa hình thành một tiêu chuẩn quy phạm cho việc lựa chọn các nguồn dữ liệu và công cụ gọi, cũng như chưa đánh giá và xác minh kết quả thực thi. Thứ hai, MCP không thể tạm thời điều chỉnh loại quan hệ hợp tác cạnh tranh thương mại mới do Agent mang lại.
Nhìn chung, MCP cung cấp một phản ứng kỹ thuật ban đầu đối với những lo ngại chính về bảo mật mà người dùng gặp phải khi sử dụng Agent và đã trở thành điểm khởi đầu cho quản trị Agent. Với sự phổ biến của Agent và các ứng dụng AI khác, cần có các phương pháp phân tán để đáp ứng các nhu cầu khác biệt của những người dùng khác nhau. Trọng tâm của quản trị không chỉ là bảo mật của mô hình mà còn là yêu cầu cốt lõi là đáp ứng nhu cầu của người dùng. Giao thức MCP đã thực hiện bước đầu tiên trong việc đáp ứng nhu cầu của người dùng và thúc đẩy đồng quản trị công nghệ. Cũng chính trên cơ sở MCP mà Agent đạt được sự phân công lao động hiệu quả và sự cộng tác của các công cụ và tài nguyên khác nhau. Một tuần trước, Google đã mở mã nguồn giao thức Agent2Agent (A2A) để liên lạc giữa các Agent, để các Agent được xây dựng trên các nền tảng khác nhau có thể thương lượng các tác vụ và tiến hành hợp tác an toàn, đồng thời thúc đẩy sự phát triển của một hệ sinh thái đa cơ thể thông minh.
Giải quyết các mối quan tâm về độ tin cậy và độ tin cậy
Mặc dù MCP cung cấp một nền tảng vững chắc cho quản trị agent, nhưng nó không giải quyết tất cả các thách thức. Một lĩnh vực quan trọng cần được quan tâm hơn nữa là vấn đề về độ tin cậy và độ tin cậy. MCP hiện không bao gồm bất kỳ cơ chế nào để xác minh tính chính xác của kết quả thực thi hoặc để đảm bảo rằng các agent đang chọn các nguồn dữ liệu và công cụ thích hợp. Điều này có nghĩa là người dùng có thể không hoàn toàn tin tưởng vào các quyết định do một agent đưa ra, đặc biệt là trong các tình huống có rủi ro cao.
Để giải quyết mối quan tâm này, cần phải phát triển các tiêu chuẩn và phương pháp hay nhất mới để phát triển và triển khai agent. Điều này có thể bao gồm những thứ như các phương pháp xác minh chính thức, có thể được sử dụng để chứng minh rằng một agent sẽ luôn hành xử theo một cách có thể dự đoán và an toàn. Nó cũng có thể bao gồm việc sử dụng các kỹ thuật AI có thể giải thích, có thể giúp người dùng hiểu cách một agent đưa ra quyết định.
Điều hướng bối cảnh cạnh tranh mới
Một thách thức khác mà MCP không giải quyết đầy đủ là tác động của các agent đối với bối cảnh cạnh tranh. Khi các agent trở nên phổ biến hơn, chúng có khả năng phá vỡ các mô hình kinh doanh hiện có và tạo ra các hình thức cạnh tranh mới. Điều quan trọng là phải xem xét tác động tiềm tàng của các agent đối với bối cảnh cạnh tranh và phát triển các chiến lược để điều hướng môi trường mới này. Điều này bao gồm giải quyết các vấn đề như quyền sở hữu dữ liệu, sở hữu trí tuệ và khả năng có hành vi chống cạnh tranh.
Một cách tiếp cận tiềm năng là phát triển các khuôn khổ pháp lý mới được thiết kế đặc biệt cho các agent AI. Các khuôn khổ này có thể giải quyết các vấn đề như quyền riêng tư dữ liệu, thiên vị thuật toán và khả năng thao túng thị trường. Chúng cũng có thể bao gồm các cơ chế để thúc đẩy cạnh tranh và ngăn chặn độc quyền.
Con đường phía trước: Hợp tác và đổi mới
Sự phát triển của MCP là một bước tiến đáng kể trong lĩnh vực quản trị agent. Tuy nhiên, điều quan trọng là phải nhận ra rằng đây chỉ là sự khởi đầu. Vẫn còn nhiều thách thức cần vượt qua và nó sẽ đòi hỏi một nỗ lực hợp tác từ các nhà nghiên cứu, nhà phát triển, nhà hoạch định chính sách và người dùng để đảm bảo rằng các agent AI được sử dụng một cách an toàn và có trách nhiệm.
Một sự phát triển đầy hứa hẹn là việc phát hành gần đây giao thức Agent2Agent (A2A) của Google. Giao thức này cho phép các agent được xây dựng trên các nền tảng khác nhau giao tiếp và cộng tác với nhau. Điều này có thể dẫn đến sự phát triển của các hệ thống AI phức tạp và tinh vi hơn, nơi nhiều agent làm việc cùng nhau để giải quyết một vấn đề. Nó cũng có thể giúp thúc đẩy một hệ sinh thái AI cạnh tranh và đổi mới hơn, vì các nhà phát triển có thể xây dựng các agent có thể tích hợp liền mạch với các agent khác.
Khi công nghệ AI tiếp tục phát triển, điều quan trọng là phải đi trước đón đầu và phát triển các cơ chế quản trị mới có thể giải quyết các thách thức của tương lai. Điều này sẽ đòi hỏi một cam kết hợp tác, đổi mới và sẵn sàng thích ứng với bối cảnh AI không ngừng thay đổi.