IBM: AI nhỏ hơn, hiệu quả hơn

Tinh chỉnh dòng Granite: Khả năng tập trung, giảm thiểu tài nguyên

Các mô hình Granite 3.2 của IBM thể hiện sự tiếp nối chiến lược của công ty trong việc phát triển các mô hình nhỏ hơn. Những mô hình này được thiết kế để cung cấp các khả năng cụ thể mà không đòi hỏi quá nhiều tài nguyên tính toán. Cách tiếp cận này phù hợp với nhu cầu thực tế của nhiều doanh nghiệp đòi hỏi các giải pháp AI vừa mạnh mẽ vừa tiết kiệm chi phí.

Các mô hình này được cung cấp công khai theo giấy phép Apache 2.0 trên Hugging Face. Các phiên bản chọn lọc cũng có sẵn thông qua nền tảng watsonx.ai của riêng IBM, cũng như Ollama, Replicate và LM Studio. Khả năng truy cập rộng rãi này còn được tăng cường hơn nữa bằng các kế hoạch tích hợp các mô hình này vào Red Hat Enterprise Linux AI 1.5 trong những tháng tới, củng cố cam kết của IBM đối với AI nguồn mở.

Cách mạng hóa xử lý tài liệu: Mô hình Granite Vision

Một tính năng nổi bật của bản phát hành này là một mô hình ngôn ngữ thị giác mới được thiết kế đặc biệt cho các tác vụ hiểu tài liệu. Mô hình này thể hiện một bước tiến đáng kể trong cách các doanh nghiệp có thể tương tác và trích xuất thông tin từ tài liệu. Theo các bài kiểm tra benchmark nội bộ của IBM, mô hình mới này hoạt động ngang bằng hoặc thậm chí vượt trội hơn nhiều mô hình đối thủ lớn hơn trong các bài kiểm tra được thiết kế đặc biệt để phản ánh khối lượng công việc cấp doanh nghiệp.

Việc phát triển khả năng này liên quan đến việc tận dụng bộ công cụ Docling nguồn mở của IBM. Bộ công cụ này đã được sử dụng để xử lý 85 triệu tài liệu PDF đáng kinh ngạc, tạo ra 26 triệu cặp câu hỏi-câu trả lời tổng hợp. Sự chuẩn bị rộng rãi này đảm bảo rằng mô hình được trang bị tốt để xử lý các quy trình công việc chuyên sâu về tài liệu, đặc trưng của nhiều môi trường doanh nghiệp, bao gồm tài chính, chăm sóc sức khỏe và dịch vụ pháp lý.

Các số liệu thống kê chính làm nổi bật quy mô và hiệu quả:

  • 85 triệu: Số lượng tài liệu PDF được xử lý bằng bộ công cụ Docling của IBM để đào tạo mô hình thị giác mới. Tập dữ liệu khổng lồ này nhấn mạnh sự sẵn sàng của mô hình cho các thách thức xử lý tài liệu trong thế giới thực.
  • 30%: Mức giảm kích thước đạt được trong các mô hình an toàn Granite Guardian trong khi vẫn duy trì mức hiệu suất. Điều này thể hiện cam kết của IBM trong việc tối ưu hóa hiệu quả mà không làm giảm sự an toàn.
  • 2 năm: Phạm vi dự báo tối đa của các mô hình TinyTimeMixers của IBM, mặc dù có ít hơn 10 triệu tham số. Điều này cho thấy khả năng đáng chú ý của các mô hình chuyên biệt này để dự báo dài hạn.

Tăng cường suy luận: Chuỗi suy nghĩ và mở rộng suy luận

IBM cũng đã tích hợp suy luận “chuỗi suy nghĩ” (chain of thought) vào các phiên bản tham số 2B và 8B của Granite 3.2. Tính năng này cho phép các mô hình tiếp cận các vấn đề một cách có cấu trúc, có phương pháp, chia nhỏ chúng thành các bước phản ánh quá trình suy luận của con người. Điều này giúp tăng cường khả năng của các mô hình trong việc giải quyết các nhiệm vụ phức tạp đòi hỏi suy luận logic.

Quan trọng là, người dùng có thể linh hoạt kích hoạt hoặc hủy kích hoạt khả năng này tùy thuộc vào độ phức tạp của tác vụ. Khả năng thích ứng này là một điểm khác biệt chính, cho phép các tổ chức tối ưu hóa việc sử dụng tài nguyên dựa trên nhu cầu cụ thể của họ. Đối với các tác vụ đơn giản hơn, suy luận chuỗi suy nghĩ có thể bị vô hiệu hóa để tiết kiệm năng lượng tính toán, trong khi đối với các vấn đề phức tạp hơn, nó có thể được kích hoạt để tận dụng toàn bộ tiềm năng suy luận của mô hình.

Những cải tiến này đã dẫn đến những cải thiện đáng kể về hiệu suất của mô hình 8B trên các bài benchmark theo hướng dẫn, vượt qua các phiên bản trước. Thông qua các phương pháp “mở rộng suy luận” (inference scaling) đổi mới, IBM đã chứng minh rằng ngay cả mô hình tương đối nhỏ này cũng có thể cạnh tranh hiệu quả với các hệ thống lớn hơn nhiều trên các bài benchmark suy luận toán học. Điều này làm nổi bật tiềm năng của các mô hình nhỏ hơn, được tối ưu hóa để mang lại hiệu suất ấn tượng trong các lĩnh vực cụ thể.

An toàn và sắc thái: Cập nhật Granite Guardian

Các mô hình an toàn Granite Guardian, được thiết kế để giám sát và giảm thiểu các rủi ro tiềm ẩn liên quan đến nội dung do AI tạo ra, cũng đã trải qua các bản cập nhật đáng kể. Các mô hình này đã được giảm kích thước 30% trong khi vẫn duy trì mức hiệu suất của chúng. Việc tối ưu hóa này góp phần mang lại hiệu quả cao hơn và giảm tiêu thụ tài nguyên.

Hơn nữa, các mô hình này hiện bao gồm một tính năng được gọi là “độ tin cậy được diễn đạt bằng lời nói” (verbalized confidence). Tính năng này cung cấp đánh giá rủi ro sắc thái hơn bằng cách thừa nhận mức độ không chắc chắn trong việc giám sát an toàn. Thay vì chỉ cung cấp phân loại an toàn/không an toàn nhị phân, các mô hình có thể thể hiện các mức độ tin cậy khác nhau trong các đánh giá của chúng, cung cấp cho người dùng một đánh giá nhiều thông tin và minh bạch hơn.

TinyTimeMixers: Dự báo tầm xa cho lập kế hoạch chiến lược

Ngoài các bản cập nhật Granite, IBM cũng đã phát hành thế hệ tiếp theo của các mô hình TinyTimeMixers. Các mô hình này cực kỳ nhỏ, chứa ít hơn 10 triệu tham số – một phần nhỏ so với kích thước của nhiều mô hình khác trong ngành. Mặc dù có kích thước nhỏ gọn, các mô hình chuyên biệt này có khả năng dự báo dữ liệu chuỗi thời gian lên đến hai năm trong tương lai.

Khả năng này đặc biệt có giá trị đối với một loạt các ứng dụng kinh doanh, bao gồm:

  • Phân tích xu hướng tài chính: Dự đoán biến động thị trường và xác định cơ hội đầu tư.
  • Lập kế hoạch chuỗi cung ứng: Tối ưu hóa mức tồn kho và dự đoán biến động nhu cầu.
  • Quản lý hàng tồn kho bán lẻ: Đảm bảo mức tồn kho đầy đủ để đáp ứng nhu cầu của khách hàng đồng thời giảm thiểu lãng phí.

Tất cả các ứng dụng này đều dựa vào khả năng đưa ra quyết định sáng suốt dựa trên các dự báo dài hạn, làm cho các mô hình TinyTimeMixers trở thành một công cụ mạnh mẽ để lập kế hoạch kinh doanh chiến lược.

Giải quyết các ràng buộc kinh doanh trong thế giới thực

Khả năng chuyển đổi khả năng suy luận trong các mô hình Granite trực tiếp giải quyết một thách thức thực tế trong việc triển khai AI. Các phương pháp tiếp cận suy luận từng bước, mặc dù mạnh mẽ, đòi hỏi sức mạnh tính toán đáng kể mà không phải lúc nào cũng cần thiết. Bằng cách làm cho tính năng này trở thành tùy chọn, IBM cho phép các tổ chức giảm chi phí tính toán cho các tác vụ đơn giản hơn trong khi vẫn giữ tùy chọn suy luận nâng cao cho các vấn đề phức tạp hơn.

Cách tiếp cận này phản ánh sự hiểu biết sâu sắc về các ràng buộc kinh doanh trong thế giới thực, nơi hiệu quả và hiệu quả chi phí thường quan trọng không kém hiệu suất thô. Việc IBM tập trung vào việc cung cấp các giải pháp thực tế có thể được điều chỉnh cho phù hợp với nhu cầu kinh doanh cụ thể là một điểm khác biệt chính trong thị trường AI ngày càng đông đúc.

Thu hút sự chú ý: Bằng chứng về tác động thực tế

Chiến lược phát triển các mô hình nhỏ hơn, chuyên biệt hơn của IBM dường như đang gây được tiếng vang trên thị trường. Mô hình Granite 3.1 8B trước đây gần đây đã đạt được hiệu suất mạnh mẽ trên Salesforce LLM Benchmark cho Quản lý quan hệ khách hàng (CRM). Bài benchmark này được thiết kế đặc biệt để đánh giá hiệu suất của LLM trên các tác vụ liên quan đến CRM, chẳng hạn như phân tích tương tác khách hàng và tạo nội dung được cá nhân hóa.

Hiệu suất mạnh mẽ của mô hình Granite 3.1 8B trên bài benchmark này cho thấy rằng các mô hình nhỏ hơn, chuyên biệt hơn thực sự có thể đáp ứng các nhu cầu kinh doanh cụ thể một cách hiệu quả. Điều này cung cấp thêm bằng chứng cho thấy cách tiếp cận của IBM không chỉ hợp lý về mặt lý thuyết mà còn khả thi về mặt thực tế.

Tập trung vào hiệu quả, tích hợp và tác động thực tế

Sriram Raghavan, Phó Chủ tịch Nghiên cứu AI của IBM, tóm tắt triết lý của công ty một cách ngắn gọn: “Kỷ nguyên tiếp theo của AI là về hiệu quả, tích hợp và tác động trong thế giới thực – nơi các doanh nghiệp có thể đạt được kết quả mạnh mẽ mà không cần chi tiêu quá nhiều cho tính toán. Các phát triển Granite mới nhất của IBM tập trung vào các giải pháp mở thể hiện một bước tiến nữa trong việc làm cho AI dễ tiếp cận hơn, tiết kiệm chi phí hơn và có giá trị hơn cho các doanh nghiệp hiện đại.”

Tuyên bố này gói gọn cam kết của IBM trong việc phát triển các giải pháp AI không chỉ tiên tiến về công nghệ mà còn thiết thực, dễ tiếp cận và phù hợp với nhu cầu thực tế của các doanh nghiệp. Việc tập trung vào các giải pháp mở càng nhấn mạnh sự cống hiến của IBM trong việc thúc đẩy sự hợp tác và đổi mới trong cộng đồng AI. Trọng tâm đang chuyển từ việc chỉ đơn giản là xây dựng các mô hình lớn nhất sang việc tạo ra các công cụ AI mang lại giá trị hữu hình và trao quyền cho các doanh nghiệp để đạt được các mục tiêu chiến lược của họ.