人工智能 (AI) 领域的竞争在很大程度上表现为规模竞赛,众多公司争相创建尽可能大的模型。虽然一些公司凭借消耗巨大计算能力的模型吸引了人们的注意,但许多企业正在积极寻找更符合其特定需求和资源限制的务实解决方案。
IBM 正战略性地定位于满足这一日益增长的需求。这家全球技术和咨询巨头最近推出了其 Granite 大型语言模型 (LLM) 系列的下一代产品,强调为实际的、真实的企业应用量身定制的紧凑、高效的系统。
精简 Granite 系列:专注能力,减少占用
IBM 的 Granite 3.2 模型延续了该公司开发更小型号模型的战略。这些模型旨在提供特定功能,而不会对计算资源提出过高要求。这种方法符合许多企业的实际需求,这些企业需要既强大又具有成本效益的 AI 解决方案。
这些模型在 Hugging Face 上以 Apache 2.0 许可证公开提供。部分版本也可通过 IBM 自己的 watsonx.ai 平台,以及 Ollama、Replicate 和 LM Studio 获取。这种广泛的可访问性将通过未来几个月内将这些模型集成到 Red Hat Enterprise Linux AI 1.5 中的计划得到进一步增强,巩固了 IBM 对开源 AI 的承诺。
革新文档处理:Granite 视觉模型
此次发布的一个突出特点是专门为文档理解任务设计的全新视觉语言模型。该模型代表了企业与文档交互并从中提取信息方式的重大进步。根据 IBM 的内部基准测试,这个新模型在专门为反映企业级工作负载而设计的测试中,其性能与更大的竞争对手模型相当,甚至更胜一筹。
此功能的开发利用了 IBM 的开源 Docling 工具包。该工具包用于处理惊人的 8500 万份 PDF 文档,生成 2600 万个合成问答对。这种广泛的准备工作确保了该模型能够很好地处理许多企业环境(包括金融、医疗保健和法律服务)中常见的文档密集型工作流程。
关键统计数据突出了规模和效率:
- 8500 万: 使用 IBM 的 Docling 工具包处理的 PDF 文档数量,用于训练新的视觉模型。这个庞大的数据集强调了该模型已为应对现实世界的文档处理挑战做好了准备。
- 30%: Granite Guardian 安全模型在保持性能水平的同时实现了尺寸减小。这表明了 IBM 致力于在不牺牲安全性的前提下优化效率。
- 2 年: IBM 的 TinyTimeMixers 模型的最大预测范围,尽管参数少于 1000 万个。这展示了这些专用模型在长期预测方面的卓越能力。
增强推理:思维链和推理扩展
IBM 还在 Granite 3.2 的 2B 和 8B 参数版本中加入了“思维链”推理。此功能允许模型以结构化、有条理的方式处理问题,将问题分解为类似于人类推理过程的步骤。这增强了模型处理需要逻辑推理的复杂任务的能力。
至关重要的是,用户可以根据任务的复杂性灵活地激活或停用此功能。这种适应性是一个关键的区别,允许组织根据其特定需求优化资源利用率。对于较简单的任务,可以禁用思维链推理以节省计算能力,而对于更复杂的问题,可以启用它以利用模型的全部推理潜力。
这些增强功能使 8B 模型在指令遵循基准测试中的性能显著提高,超越了以前的版本。通过创新的“推理扩展”方法,IBM 已经证明,即使是这个相对较小的模型,也可以在数学推理基准测试中有效地与更大的系统竞争。这突出了更小、优化的模型在特定领域提供出色性能的潜力。
安全性和细微差别:Granite Guardian 更新
Granite Guardian 安全模型旨在监控和减轻与 AI 生成内容相关的潜在风险,也进行了重大更新。这些模型的尺寸减少了 30%,同时保持了其性能水平。这种优化有助于提高效率并减少资源消耗。
此外,这些模型现在包含一个称为“口头置信度”的功能。此功能通过承认安全监控中的不确定性程度,提供了更细致的风险评估。模型不再简单地提供安全/不安全的二元分类,而是可以表达对其评估的不同置信度,为用户提供更具信息性和透明度的评估。
TinyTimeMixers:用于战略规划的长期预测
除了 Granite 更新之外,IBM 还发布了下一代 TinyTimeMixers 模型。这些模型非常小,包含少于 1000 万个参数——只是业内许多其他模型大小的一小部分。尽管尺寸紧凑,但这些专用模型能够预测未来两年的时间序列数据。
此功能对于一系列业务应用特别有价值,包括:
- 财务趋势分析: 预测市场走势并识别投资机会。
- 供应链规划: 优化库存水平并预测需求波动。
- 零售库存管理: 确保充足的库存水平以满足客户需求,同时最大限度地减少浪费。
这些应用都依赖于基于长期预测做出明智决策的能力,这使得 TinyTimeMixers 模型成为战略业务规划的强大工具。
解决现实世界的业务限制
在 Granite 模型中切换推理能力的功能直接解决了 AI 实施中的一个实际挑战。逐步推理方法虽然强大,但需要大量的计算能力,而这并不总是必要的。通过使此功能成为可选功能,IBM 使组织能够降低简单任务的计算成本,同时保留更复杂问题的高级推理选项。
这种方法反映了对现实世界业务限制的深刻理解,在这些限制中,效率和成本效益通常与原始性能一样重要。IBM 专注于提供可根据特定业务需求量身定制的实用解决方案,这是在日益拥挤的 AI 市场中的一个关键区别。
获得认可:实际影响的证据
IBM 开发更小、更专业模型的战略似乎正在引起市场的共鸣。之前的 Granite 3.1 8B 模型最近在 Salesforce 客户关系管理 (CRM) 的 LLM 基准测试中取得了优异的性能。该基准测试专门用于评估 LLM 在与 CRM 相关的任务(例如客户交互分析和个性化内容生成)上的性能。
Granite 3.1 8B 模型在该基准测试中的出色表现表明,更小、更专业的模型确实可以有效地满足特定的业务需求。这进一步证明了 IBM 的方法不仅在理论上是合理的,而且在实践中也是可行的。
专注于效率、集成和实际影响
IBM AI 研究副总裁 Sriram Raghavan 简洁地总结了该公司的理念:“AI 的下一个时代是关于效率、集成和实际影响——企业可以在不花费过多计算费用的情况下实现强大的结果。IBM 最新的 Granite 开发专注于开放解决方案,这表明在使 AI 更易于访问、更具成本效益和对现代企业更有价值方面又向前迈进了一步。”
这一声明概括了 IBM 致力于开发不仅技术先进,而且实用、可访问且符合企业实际需求的 AI 解决方案。对开放解决方案的关注进一步强调了 IBM 致力于促进 AI 社区内的协作和创新。重点正在从简单地构建最大的模型转向创建能够提供实际价值并使企业能够实现其战略目标的 AI 工具。