Mistral AI, một thế lực đang nổi lên trong lĩnh vực trí tuệ nhân tạo, đã ra mắt Agents API đột phá, một dịch vụ mới được thiết kế riêng cho cả khách hàng doanh nghiệp và các nhà phát triển phần mềm cá nhân. Sản phẩm sáng tạo này cho phép người dùng tích hợp liền mạch các khả năng AI tạo sinh tự động vào các ứng dụng hiện có của họ, tận dụng mô hình Medium 3 tiên tiến của Mistral làm đơn vị thông minh trung tâm.
Agents API đóng vai trò như một nền tảng "plug and play" linh hoạt, cung cấp các tùy chọn tùy chỉnh mở rộng để triển khai các tác nhân AI có khả năng hợp lý hóa quy trình làm việc của doanh nghiệp và nhà phát triển. Theo Sophia Yang, Trưởng bộ phận Quan hệ nhà phát triển tại Mistral, Agents API được thiết kế để cho phép các doanh nghiệp khai thác AI theo những cách thiết thực và có tác động. Bản phát hành mới này bổ sung cho Chat Completion API hiện có của Mistral, nhấn mạnh vào điều phối tác nhân, trình kết nối tích hợp, bộ nhớ liên tục và khả năng điều phối nhiều tác nhân AI cho các tác vụ phức tạp.
Giải quyết các hạn chế của mô hình ngôn ngữ truyền thống
Trong khi các mô hình ngôn ngữ thông thường vượt trội trong việc tạo văn bản, chúng thường gặp khó khăn trong việc thực hiện các hành động hoặc duy trì ngữ cảnh trong suốt cuộc trò chuyện. Agents API của Mistral giải quyết những thiếu sót này bằng cách trang bị cho các nhà phát triển các công cụ để tạo ra các tác nhân AI có thể thực hiện các tác vụ trong thế giới thực, quản lý các tương tác trong các cuộc trò chuyện và điều phối linh hoạt nhiều tác nhân khi cần thiết.
Các tính năng chính và trình kết nối tích hợp
Agents API tự hào có một số trình kết nối tích hợp giúp mở rộngchức năng của nó:
Thực thi mã: Cho phép thực thi an toàn mã Python, tạo điều kiện thuận lợi cho các ứng dụng trong lĩnh vực trực quan hóa dữ liệu, điện toán khoa học và các lĩnh vực kỹ thuật khác.
Tạo hình ảnh: Sử dụng Black Forest Lab FLUX1.1 [pro] Ultra để tạo ra các hình ảnh tùy chỉnh cho mục đích tiếp thị, giáo dục và nghệ thuật.
Thư viện tài liệu: Cung cấp quyền truy cập vào các tài liệu được lưu trữ trong Mistral Cloud, nâng cao khả năng tạo tăng cường truy xuất (RAG).
Tìm kiếm trên web: Cho phép các tác nhân truy xuất thông tin hiện tại từ các nguồn trực tuyến, các hãng tin tức và các nền tảng có uy tín.
Đáng chú ý, API cũng hỗ trợ các công cụ MCP, kết nối các tác nhân với các tài nguyên bên ngoài như API, cơ sở dữ liệu, dữ liệu người dùng và tài liệu, mở rộng khả năng xử lý nội dung động, thế giới thực của chúng.
Nâng cao độ chính xác thông qua tích hợp tìm kiếm trên web
Một tính năng quan trọng của Agents API là tích hợp tìm kiếm trên web như một trình kết nối, giúp cải thiện đáng kể hiệu suất trên các tác vụ yêu cầu thông tin cập nhật. Trong một thử nghiệm điểm chuẩn sử dụng bộ dữ liệu SimpleQA, độ chính xác của Mistral Large đã được cải thiện từ 23% lên 75% khi bật tìm kiếm trên web. Tương tự, Mistral Medium đã chứng kiến sự gia tăng từ 22,08% lên 82,32%.
Các trường hợp sử dụng đa dạng trên các lĩnh vực khác nhau
Mistral AI đã giới thiệu một loạt các trường hợp sử dụng cho Agents API, chứng minh khả năng thích ứng của nó trên các lĩnh vực khác nhau:
Trợ lý viết mã với GitHub: Một tác nhân giám sát một trợ lý nhà phát triển được hỗ trợ bởi DevStral, quản lý các tác vụ và tự động hóa quy trình làm việc phát triển mã.
Trợ lý vé tuyến tính: Chuyển đổi bản ghi cuộc gọi thành các sản phẩm dự án bằng kiến trúc MCP đa máy chủ.
Nhà phân tích tài chính: Tìm nguồn cung cấp các số liệu tài chính và biên soạn báo cáo một cách an toàn thông qua các máy chủ MCP được điều phối.
Trợ lý du lịch: Giúp người dùng lên kế hoạch chuyến đi, đặt chỗ ở và quản lý nhu cầu du lịch.
Trợ lý dinh dưỡng: Hỗ trợ người dùng đặt mục tiêu ăn uống, ghi nhật ký bữa ăn và nhận các đề xuất được cá nhân hóa.
Hệ thống đàm thoại có trạng thái của Agents API đảm bảo rằng các tác nhân duy trì ngữ cảnh trong suốt các tương tác của họ. Các nhà phát triển có thể bắt đầu hoặc tiếp tục các cuộc trò chuyện mà không bị mất dấu, vì lịch sử cuộc trò chuyện được lưu trữ và có thể truy cập để sử dụng trong tương lai. API cũng hỗ trợ đầu ra phát trực tuyến, cho phép cập nhật theo thời gian thực để đáp ứng yêu cầu của người dùng hoặc hành động của tác nhân.
Điều phối nhiều tác nhân để giải quyết vấn đề phức tạp
Một khả năng cốt lõi của Agents API là khả năng điều phối nhiều tác nhân một cách liền mạch. Các nhà phát triển có thể tạo các quy trình làm việc tùy chỉnh, gán các tác vụ cụ thể cho các tác nhân chuyên biệt và cho phép bàn giao khi cần thiết. Cách tiếp cận mô-đun này cho phép các doanh nghiệp triển khai các tác nhân AI làm việc cùng nhau để giải quyết các vấn đề phức tạp hiệu quả hơn.
Ý nghĩa đối với kỹ sư cấp cao và các tổ chức doanh nghiệp
Đối với các kỹ sư cấp cao trong các tổ chức doanh nghiệp, Mistral Agents API đại diện cho một sự bổ sung có giá trị cho bộ công cụ AI của họ. Khả năng điều phối linh hoạt các tác nhân và tích hợp liền mạch các nguồn dữ liệu trong thế giới thực cho phép những chuyên gia này triển khai các giải pháp AI nhanh hơn và với độ chính xác cao hơn, điều này rất quan trọng trong các môi trường yêu cầu lặp lại nhanh chóng và điều chỉnh hiệu suất.
Những chuyên gia này thường phải đối mặt với những thách thức trong việc cân bằng thời gian triển khai chặt chẽ với nhu cầu duy trì hiệu suất mô hình trên các môi trường khác nhau. Các trình kết nối tích hợp của Agents API, chẳng hạn như tìm kiếm trên web, thư viện tài liệu và thực thi mã an toàn, có thể giảm đáng kể nhu cầu tích hợp đặc biệt và công cụ chắp vá. Cách tiếp cận hợp lý này giúp tiết kiệm thời gian và giảm thiểu ma sát, cho phép các nhóm tập trung nhiều hơn vào việc tinh chỉnh mô hình và ít hơn vào việc xây dựng cơ sở hạ tầng xung quanh.
Hơn nữa, quản lý cuộc trò chuyện có trạng thái và cập nhật theo thời gian thực thông qua đầu ra phát trực tuyến phù hợp với các yêu cầu về điều phối và triển khai AI. Các tính năng này giúp các kỹ sư dễ dàng duy trì ngữ cảnh giữa các lần lặp lại và đảm bảo các tương tác chất lượng cao, nhất quán với người dùng cuối. Hỗ trợ cho các công cụ MCP cũng đảm bảo rằng các tác nhân có thể truy cập dữ liệu từ một loạt các API và hệ thống, nâng cao hơn nữa hiệu quả hoạt động cho những người chịu trách nhiệm giới thiệu và tích hợp các công cụ AI mới vào quy trình làm việc của tổ chức.
Le Chat Enterprise và Mistral Medium 3
Việc phát hành Agents API diễn ra sau khi Mistral AI ra mắt Le Chat Enterprise, một nền tảng trợ lý AI thống nhất được thiết kế để tăng năng suất doanh nghiệp và bảo mật dữ liệu. Le Chat Enterprise được hỗ trợ bởi mô hình Mistral Medium 3 mới, mang lại hiệu suất ấn tượng với chi phí tính toán thấp hơn so với các mô hình lớn hơn.
Mistral Medium 3 vượt trội trong các tác vụ phát triển phần mềm, vượt trội hơn các mô hình tương đương trong các điểm chuẩn mã hóa chính như HumanEval và MultiPL-E. Nó cũng thể hiện hiệu suất cạnh tranh trong các tình huống đa ngôn ngữ và đa phương thức, khiến nó trở thành một lựa chọn hấp dẫn cho các doanh nghiệp hoạt động trong các môi trường đa dạng.
Le Chat Enterprise hỗ trợ các tính năng cấp doanh nghiệp như chủ quyền dữ liệu, triển khai kết hợp và kiểm soát truy cập nghiêm ngặt, rất quan trọng đối với các tổ chức trong các lĩnh vực được quản lý. Nền tảng này hợp nhất chức năng AI trong một môi trường duy nhất, cho phép tùy chỉnh, tích hợp liền mạch với các quy trình làm việc hiện có và kiểm soát hoàn toàn việc triển khai và bảo mật dữ liệu.
Cân nhắc về mô hình độc quyền
Trong khi các bản phát hành trước đó của Mistral, như Mistral 7B, là nguồn mở và được cộng đồng nhà phát triển áp dụng rộng rãi vì tính minh bạch và linh hoạt của chúng, Mistral Medium 3 là một mô hình độc quyền. Quyền truy cập yêu cầu sử dụng nền tảng, API hoặc đối tác của Mistral và nó không còn khả dụng theo giấy phép nguồn mở. Sự thay đổi này đã dẫn đến một số lo ngại trong cộng đồng AI, nơi quyền truy cập mở và tính minh bạch được đánh giá cao cho mục đích thử nghiệm và tùy chỉnh.
Bản thân Agents API cũng tuân theo một khuôn khổ độc quyền; nó không có sẵn theo giấy phép nguồn mở và được quản lý độc quyền bởi Mistral, với quyền truy cập có sẵn thông qua đăng ký và các lệnh gọi API.
Cấu trúc giá
Giá cho Agents API phù hợp với bộ mô hình và công cụ rộng hơn của Mistral:
- Mistral Medium 3: 0,4 đô la trên một triệu mã thông báo đầu vào và 2 đô la trên một triệu mã thông báo đầu ra.
- Trình kết nối tìm kiếm trên web: 30 đô la trên 1.000 lệnh gọi.
- Thực thi mã: 30 đô la trên 1.000 lệnh gọi.
- Tạo hình ảnh: 100 đô la trên 1.000 hình ảnh.
- Truy cập tin tức cao cấp: 50 đô la trên 1.000 lệnh gọi.
- Thư viện tài liệu với RAG: Được bao gồm trong các gói như Team và Enterprise, với tối đa 30GB cho mỗi người dùng trong một số bậc.
- Trình kết nối tùy chỉnh, nhật ký kiểm tra, SAML SSO và các tính năng doanh nghiệp khác: Có sẵn trong các gói Team và Enterprise (giá thường yêu cầu liên hệ với nhóm bán hàng của Mistral).
Những chi phí này có thể tích lũy nhanh chóng đối với các nhà phát triển và khách hàng doanh nghiệp, khiến các cân nhắc về ngân sách và lập kế hoạch tích hợp cẩn thận trở nên cần thiết.
Tầm nhìn của Mistral về các tác nhân AI cấp doanh nghiệp
Mistral AI hình dung Agents API của mình là nền tảng cho các nền tảng tác nhân cấp doanh nghiệp, trao quyền cho các nhà phát triển tạo ra các giải pháp vượt xa việc tạo văn bản truyền thống. Bất chấp cuộc tranh luận xung quanh nguồn mở so với quyền truy cập độc quyền, việc Mistral tập trung vào các tính năng cấp doanh nghiệp, quy trình làm việc tùy chỉnh và tích hợp an toàn định vị API này như một tùy chọn quan trọng cho các doanh nghiệp đang tìm kiếm các khả năng AI tiên tiến.
Đối với các nhà phát triển và những người ra quyết định kỹ thuật, câu hỏi cốt lõi sẽ là liệu bản chất độc quyền của Agents API và các mô hình cơ bản có phù hợp với nhu cầu hoạt động và ngân sách của chính họ hay không.Đối với những người ưu tiên triển khai nhanh chóng, các dịch vụ được quản lý và tích hợp đầy đủ với các hệ thống doanh nghiệp, nền tảng đang phát triển của Mistral có thể mang lại những lợi thế đáng kể.
Tìm hiểu sâu hơn về Agents API
Mistral AI Agents API sẵn sàng cách mạng hóa cách các doanh nghiệp và nhà phát triển tiếp cận tự động hóa dựa trên AI. Bộ tính năng toàn diện của nó, từ các trình kết nối tích hợp đến điều phối nhiều tác nhân, cung cấp một bộ công cụ linh hoạt và mạnh mẽ để giải quyết các tác vụ phức tạp và hợp lý hóa quy trình làm việc.
Tự động hóa tác vụ nâng cao với thực thi mã
Trình kết nối Thực thi mã nổi bật như một thành phần quan trọng, cung cấp khả năng chạy mã Python một cách an toàn trực tiếp trong môi trường tác nhân AI. Điều này mở ra một loạt các khả năng, bao gồm xử lý dữ liệu nâng cao, tính toán toán học và thực thi các thuật toán tùy chỉnh. Hãy xem xét một kịch bản trong đó một nhà phân tích tài chính cần tự động tính toán các chỉ số hiệu suất chính (KPI) từ một tập dữ liệu lớn. Với trình kết nối Thực thi mã, tác nhân AI có thể thực thi một tập lệnh Python để thực hiện các tính toán này, tự động tạo báo cáo và bảng điều khiển mà không cần sự can thiệp thủ công. Mức độ tự động hóa này làm giảm đáng kể thời gian và công sức cần thiết cho phân tích dữ liệu, cho phép các nhà phân tích tập trung vào các nhiệm vụ chiến lược cấp cao hơn.
Tạo nội dung sáng tạo với tạo hình ảnh
Trình kết nối Tạo hình ảnh, được hỗ trợ bởi Black Forest Lab FLUX1.1 [pro] Ultra, cung cấp một khả năng độc đáo để tạo ra các hình ảnh tùy chỉnh trực tiếp trong quy trình làm việc của tác nhân AI. Tính năng này đặc biệt hữu ích cho các nhóm tiếp thị, nhà giáo dục và nghệ sĩ cần tạo nội dung trực quan hấp dẫn theo yêu cầu. Ví dụ: một nhóm tiếp thị có thể sử dụng tác nhân AI để tự động tạo các bài đăng trên phương tiện truyền thông xã hội với các hình ảnh tùy chỉnh phù hợp với các đối tượng mục tiêu cụ thể. Tương tự, các nhà giáo dục có thể sử dụng công cụ này để tạo ra các công cụ hỗ trợ trực quan cho các khóa học trực tuyến, giúp việc học trở nên tương tác và hấp dẫn hơn. Khả năng tích hợp liền mạch việc tạo hình ảnh vào quy trình làm việc của tác nhân AI mở ra những con đường mới cho biểu hiện sáng tạo và tạo nội dung.
Tận dụng khả năng truy xuất thông tin với thư viện tài liệu và tìm kiếm trên web
Các trình kết nối Thư viện tài liệu và Tìm kiếm trên web giải quyết nhu cầu quan trọng của các tác nhân AI để truy cập và xử lý thông tin liên quan từ cả nguồn nội bộ và bên ngoài. Thư viện tài liệu cung cấp quyền truy cập an toàn vào các tài liệu được lưu trữ trong Mistral Cloud, cho phép các tính năng tạo tăng cường truy xuất (RAG). Điều này đảm bảo rằng tác nhân AI có thể dựa vào một kho kiến thức phong phú khi tạo ra các phản hồi và hoàn thành các tác vụ. Trình kết nối Tìm kiếm trên web bổ sung một lớp thông minh khác bằng cách cho phép các tác nhân truy xuất thông tin cập nhật từ các nguồn trực tuyến, các hãng tin tức và các nền tảng có uy tín.
Sự kết hợp của hai trình kết nối này đảm bảo rằng tác nhân AI được trang bị kiến thức cần thiết để cung cấp các câu trả lời và thông tin chi tiết chính xác, phù hợp theo ngữ cảnh. Hãy tưởng tượng một nhân viên dịch vụ khách hàng sử dụng trợ lý AI được hỗ trợ bởi Agents API. Tác nhân AI có thể nhanh chóng tìm kiếm cơ sở kiến thức nội bộ của công ty để biết thông tin về vấn đề của khách hàng và bổ sung thông tin đó bằng thông tin liên quan từ web, cung cấp cho nhân viên sự hiểu biết toàn diện về tình hình và cho phép họ giải quyết vấn đề hiệu quả hơn.
Hợp lý hóa quy trình làm việc với các công cụ MCP
Các công cụ MCP (Multi-Connector Protocol) tiếp tục nâng cao tính linh hoạt của Agents API bằng cách cho phép nó kết nối với các tài nguyên bên ngoài như API, cơ sở dữ liệu, dữ liệu người dùng và tài liệu. Điều này có nghĩa là tác nhân AI có thể tích hợp liền mạch với các hệ thống và quy trình làm việc doanh nghiệp hiện có, truy cập dữ liệu và chức năng cần thiết để hoàn thành các tác vụ một cách hiệu quả. Ví dụ: một tác nhân AI có thể được định cấu hình để tự động cập nhật hồ sơ khách hàng trong hệ thống CRM dựa trên thông tin thu thập được từ các tương tác của khách hàng. Mức độ tích hợp này giúp hợp lý hóa các quy trình kinh doanh và giảm nhu cầu nhập dữ liệu thủ công, giải phóng nhân viên để tập trung vào các tác vụ chiến lược hơn.
Quản lý cuộc trò chuyện và cập nhật theo thời gian thực
Hệ thống đàm thoại có trạng thái của Agents API đảm bảo rằng các tác nhân duy trì ngữ cảnh trong suốt các tương tác. Điều này rất quan trọng để tạo ra trải nghiệm người dùng hấp dẫn và hiệu quả. Khả năng của API để lưu trữ và truy cập lịch sử cuộc trò chuyện cho phép các tác nhân hiểu ý định của người dùng và cung cấp các phản hồi phù hợp hơn. Hỗ trợ cho đầu ra phát trực tuyến tiếp tục nâng cao trải nghiệm người dùng bằng cách cung cấp các bản cập nhật theo thời gian thực để đáp ứng yêu cầu của người dùng hoặc hành động của tác nhân. Điều này tạo ra một trải nghiệm tương tác và phản hồi nhanh chóng hơn, khiến tác nhân AI cảm thấy giống như một trợ lý hữu ích hơn là một chatbot đơn giản.
Tương lai của tự động hóa dựa trên AI
Mistral AI Agents API đại diện cho một bước tiến đáng kể trong sự phát triển của tự động hóa dựa trên AI. Bộ tính năng toàn diện, tính linh hoạt và hỗ trợ cho tích hợp doanh nghiệp khiến nó trở thành một công cụ mạnh mẽ cho các doanh nghiệp và nhà phát triển muốn tận dụng sức mạnh của AI để hợp lý hóa quy trình làm việc, cải thiện hiệu quả và nâng cao trải nghiệm của khách hàng.