IBM 以更精巧的 AI 模型瞄準企業效率

Granite 系列的精進:專注能力,縮減規模

IBM 的 Granite 3.2 模型延續了該公司開發較小型模型的策略。這些模型的設計宗旨是在不對運算資源造成過度需求的情況下,提供特定的能力。這種方法符合許多企業的實際需求,它們需要既強大又符合成本效益的 AI 解決方案。

這些模型在 Hugging Face 上以 Apache 2.0 授權公開提供。特定版本也可透過 IBM 自家的 watsonx.ai 平台,以及 Ollama、Replicate 和 LM Studio 取得。未來幾個月內,這些模型還計劃整合到 Red Hat Enterprise Linux AI 1.5 中,進一步鞏固了 IBM 對開源 AI 的承諾,從而擴大了其可及性。

革新文件處理:Granite Vision 模型

本次發布的一大亮點是一個專為文件理解任務設計的新型視覺語言模型。此模型代表了企業與文件互動並從中提取資訊方式的重大進步。根據 IBM 的內部基準測試,這個新模型在專為反映企業級工作負載而設計的測試中,表現與更大的競爭對手模型相當,甚至更勝一籌。

這項功能的開發利用了 IBM 的開源 Docling 工具組。該工具組用於處理驚人的 8500 萬份 PDF 文件,產生了 2600 萬個合成問答對。這種廣泛的準備工作確保了該模型能夠很好地處理許多企業環境(包括金融、醫療保健和法律服務)中常見的文件密集型工作流程。

關鍵統計數據突顯了規模和效率:

  • 8500 萬: 使用 IBM 的 Docling 工具組處理的 PDF 文件數量,用於訓練新的視覺模型。這個龐大的數據集強調了該模型已為應對現實世界的文件處理挑戰做好了準備。
  • 30%: Granite Guardian 安全模型在保持性能水平的同時實現的尺寸縮減。這證明了 IBM 致力於在不犧牲安全性的前提下優化效率。
  • 2 年: IBM 的 TinyTimeMixers 模型的最大預測範圍,儘管參數少於 1000 萬個。這展示了這些專門模型在長期預測方面的卓越能力。

增強推理:思維鏈和推理擴展

IBM 還將「思維鏈」推理納入了 Granite 3.2 的 2B 和 8B 參數版本中。此功能允許模型以結構化、有條理的方式處理問題,將其分解為反映人類推理過程的步驟。這增強了模型處理需要邏輯推理的複雜任務的能力。

至關重要的是,用戶可以根據任務的複雜性靈活地啟用或停用此功能。這種適應性是一個關鍵的區別因素,允許組織根據其特定需求優化資源利用率。對於較簡單的任務,可以停用思維鏈推理以節省運算能力,而對於更複雜的問題,可以啟用它以利用模型的全部推理潛力。

這些增強功能使 8B 模型在指令遵循基準測試中的性能顯著提高,超越了以前的版本。通過創新的「推理擴展」方法,IBM 證明了即使是這個相對較小的模型,也可以在數學推理基準測試中有效地與更大的系統競爭。這突顯了較小的、優化的模型在特定領域提供出色性能的潛力。

安全性和細微差別:Granite Guardian 更新

Granite Guardian 安全模型旨在監控和減輕與 AI 生成內容相關的潛在風險,也進行了重大更新。這些模型的尺寸縮減了 30%,同時保持了其性能水平。這種優化有助於提高效率並減少資源消耗。

此外,這些模型現在包含一個稱為「口語化信心」的功能。此功能通過承認安全監控中的不確定性程度來提供更細緻的風險評估。模型不再僅僅提供二元的安全/不安全分類,而是可以表達對其評估的不同程度的信心,為用戶提供更具資訊性和透明度的評估。

TinyTimeMixers:用於戰略規劃的遠程預測

除了 Granite 更新之外,IBM 還發布了下一代 TinyTimeMixers 模型。這些模型非常小,包含少於 1000 萬個參數——只是業界許多其他模型大小的一小部分。儘管尺寸小巧,但這些專門的模型能夠預測未來長達兩年的時間序列數據。

此功能對於一系列業務應用特別有價值,包括:

  • 財務趨勢分析: 預測市場走勢並識別投資機會。
  • 供應鏈規劃: 優化庫存水平並預測需求波動。
  • 零售庫存管理: 確保充足的庫存水平以滿足客戶需求,同時最大限度地減少浪費。

這些應用都依賴於基於長期預測做出明智決策的能力,這使得 TinyTimeMixers 模型成為戰略業務規劃的強大工具。

解決實際業務限制

在 Granite 模型中切換推理能力的功能直接解決了 AI 實施中的一個實際挑戰。逐步推理方法雖然強大,但需要大量的運算能力,而這並不總是必要的。通過使此功能成為可選功能,IBM 使組織能夠降低較簡單任務的運算成本,同時保留更複雜問題的高級推理選項。

這種方法反映了對現實世界業務限制的深刻理解,在這些限制中,效率和成本效益通常與原始性能一樣重要。IBM 專注於提供可根據特定業務需求量身定制的實用解決方案,這是在日益擁擠的 AI 市場中的一個關鍵區別因素。

獲得關注:實際影響的證據

IBM 開發更小、更專業模型的策略似乎引起了市場的共鳴。之前的 Granite 3.1 8B 模型最近在 Salesforce 客戶關係管理 (CRM) 的 LLM 基準測試中取得了優異的表現。此基準測試專門用於評估 LLM 在與 CRM 相關的任務(例如客戶互動分析和個人化內容生成)上的性能。

Granite 3.1 8B 模型在此基準測試中的出色表現表明,更小、更專業的模型確實可以有效地滿足特定的業務需求。這進一步證明了 IBM 的方法不僅在理論上是合理的,而且在實踐中也是可行的。

專注於效率、整合和實際影響

IBM AI 研究副總裁 Sriram Raghavan 簡潔地總結了該公司的理念:「AI 的下一個時代是關於效率、整合和實際影響——企業可以在不花費過多運算費用的情況下實現強大的成果。IBM 最新的 Granite 開發專注於開放解決方案,這表明在使 AI 對現代企業更易於訪問、更具成本效益和更有價值方面又向前邁進了一步。」

這句話概括了 IBM 致力於開發不僅技術先進,而且實用、易於使用並符合企業實際需求的 AI 解決方案。對開放解決方案的關注進一步強調了 IBM 致力於促進 AI 社群內的協作和創新。重點正在從僅僅構建最大的模型轉變為創建能夠提供實際價值並使企業能夠實現其戰略目標的 AI 工具。