Sarvam AI是一家位于班加罗尔的初创公司,最近推出了一款突破性的240亿参数大型语言模型 (LLM),该模型经过精心设计,擅长印度语言并能处理复杂的推理任务,包括数学和编程。这款名为Sarvam-M(“M”代表 Mistral)的创新模型代表了开放权重混合模型领域的重大进步。它建立在 Mistral Small 的基础上,Mistral Small 是一种紧凑但功能强大的开源语言模型,并通过专门的训练和优化技术增强了其功能。
Sarvam-M:语言建模的混合方法
Sarvam-M 因其混合方法而脱颖而出,它结合了开源基础的优势和专有的增强功能。这种设计理念使 Sarvam AI 能够利用围绕 Mistral Small 模型的集体知识和社区支持,同时针对印度市场的特定需求对其进行定制。模型的架构和训练方法是理解其性能和能力的关键。
监督微调:精确度和准确性
为了提高模型的准确性和精确度,Sarvam AI 采用了一种细致的监督微调过程。这包括在精心策划的示例数据集上训练模型,该数据集专门设计用于提高其在各种任务中的性能。通过将模型暴露于各种场景并为其提供清晰、标记的数据,监督微调过程使 Sarvam-M 能够学习数据中复杂的模式和关系,从而产生更准确和可靠的输出。
通过可验证奖励进行强化学习:决策能力
除了监督微调之外,Sarvam AI 还结合了通过可验证奖励进行强化学习,以增强模型的决策能力。这项技术包括训练模型从与明确、可衡量的目标相关的反馈中学习,例如正确解决数学问题。通过奖励模型实现这些目标,强化学习过程鼓励模型做出更好的决策并随着时间的推移优化其性能。这种方法对于需要复杂推理和解决问题技巧的任务特别有效。
针对实时使用进行优化:效率和响应能力
认识到实时性能的重要性,Sarvam AI 精心优化了 Sarvam-M,以便在生成答案时(尤其是在实时使用期间)能够更高效和准确地响应。这包括微调模型的架构和算法,以最大限度地减少延迟和最大限度地提高吞吐量,确保用户能够及时收到与其查询相关的响应。优化工作侧重于减少计算开销并提高模型处理并发请求的能力,使其适合在高需求环境中部署。
基准性能:设定新标准
Sarvam AI 声称 Sarvam-M 为印度语言以及数学和编程任务中同等规模的模型设立了新基准,这一说法得到了广泛的基准数据的支持。该初创公司对模型在各种标准基准上的性能进行了严格评估,将其结果与其他最先进的模型进行了比较。这些评估的结果表明 Sarvam-M 在几个关键领域取得了显著改进。
印度语言基准:平均性能提升 20%
根据 SarvamAI 发布的博客文章,Sarvam-M 比基础模型有了重大改进,在印度语言基准上的平均性能提升了 20%。这一显著的进步突显了监督微调过程在提高模型对印度语言的理解和生成方面的有效性。该模型处理这些语言的细微差别和复杂性的能力对于其在印度市场的采用和使用至关重要。用于评估性能的特定基准包括文本分类、问题解答和机器翻译等任务,涵盖了各种语言挑战。
数学任务:平均性能提升 21.6%
除了印度语言之外,Sarvam-M 在数学任务上也表现出令人印象深刻的性能提升,平均提升了 21.6%。准确性和解决问题能力的显著提高突显了通过可验证奖励进行强化学习技术在增强模型的推理能力方面的有效性。该模型解决数学问题的能力对于其在金融建模、科学研究和数据分析等领域的应用至关重要。用于评估数学任务性能的基准包括来自各个领域的问题,例如代数、微积分和统计学。评估模型不仅要提供正确的答案,还要展示其推理过程并证明其解决方案的合理性。
编程测试:平均性能提升 17.6%
Sarvam-M 在编程测试中的表现同样值得注意,平均提升了 17.6%。这种改进反映了模型理解和生成各种编程语言代码的能力,使其成为软件开发人员和工程师的宝贵工具。该模型在编程方面的熟练程度对于其在代码生成、错误检测和自动测试等领域的应用至关重要。用于评估编程测试性能的基准包括代码完成、代码修复和从自然语言描述生成代码等任务。评估模型生成在语法上正确且在语义上有意义的代码(可以满足给定要求)的能力。
组合任务:卓越的性能
该模型在结合了印度语言和数学的任务中表现得更好,这说明了它的多功能性以及处理需要语言和推理技能的复杂场景的能力。例如,在使用罗马化的印度语言的GSM-8K基准测试中,它实现了86%的改进。这种显著的改进突显了该模型利用其对印度语言和数学概念的知识来解决具有挑战性的问题的能力。 GSM-8K基准是被广泛使用的数据集,用于测试模型解决以自然语言表达的小学数学问题的能力。该模型在此基准测试中的表现证明了它理解问题陈述、识别相关信息以及应用适当的数学运算以得出正确解决方案的能力。 Sarvam-M 实现的 86% 的改进证明了其先进的推理能力以及处理复杂、多方面的任务的能力。
与其他模型的比较:Sarvam-M 保持了自己的优势
Sarvam AI 的博客文章将 Sarvam-M 与其他突出的语言模型进行了比较,强调了其具有竞争力的性能。这种比较分析提供了对模型优势和劣势的宝贵见解,使用户可以就其对特定需求的适用性做出明智的决策。该博客文章强调了 Sarvam-M 在大多数基准测试中优于 Llama-2 7B,并且与更大的密集模型(如 Llama-3 70B)以及在明显更多的token上预训练的模型(如 Gemma 27B)相当。这些比较突显了 Sarvam-M 训练方法的效率以及其以相对较小的参数大小实现有竞争力性能的能力。以更少的参数实现可比的性能转化为更低的计算成本和更快的推理速度,使 Sarvam-M 成为对许多用户来说更实用和更容易获得的解决方案。
英语知识型基准:有改进空间
尽管 Sarvam-M 在印度语言和推理任务方面表现出色,但 Sarvam AI 承认 Sarvam-M 在 MMLU 等英语知识型基准方面仍需要改进。在这些基准测试中,Sarvam-M 的性能比基线模型低约 1 个百分点。这种性能的略微下降表明,模型的训练数据可能偏向于印度语言和推理任务,从而导致对英语知识的理解略弱。但是,Sarvam AI 正在积极努力通过将更多英语语言数据纳入模型的训练集以及通过微调模型的架构来更好地处理英语知识型任务来解决此问题。该公司致力于在英语语言基准上实现与其他最先进模型的平价,确保 Sarvam-M 成为一种通用且具有全球竞争力的语言模型。
多功能性和应用:广泛的可能性
Sarvam-M 具有多功能性,旨在支持广泛的应用,包括会话代理、翻译和教育工具。它理解和生成印度语言并具有推理能力的能力使其成为在印度市场运营的企业和组织的宝贵资产。
会话代理:改善客户服务
Sarvam-M 可用于驱动会话代理,这些代理可以用客户的母语与他们互动,提供个性化和高效的客户服务。这些代理可以处理各种任务,例如回答常见问题、提供产品信息和解决客户投诉。通过让客户以他们喜欢的语言进行交流,Sarvam-M 可以提高客户满意度和忠诚度。由 Sarvam-M 驱动的会话代理可以部署在各种平台上,例如网站、移动应用和消息传递平台,为客户提供无缝和便捷的通信体验。
翻译:打破语言障碍
Sarvam-M 的翻译功能可用于打破语言障碍,促进说不同语言的人们之间的交流。该模型可以在英语和各种印度语言之间翻译文本和语音,使企业能够将其业务范围扩展到新市场,并使个人能够与来自不同文化背景的人们建立联系。由 Sarvam-M 驱动的翻译服务可以集成到各种应用中,例如文档翻译工具、网站翻译插件和实时翻译应用,为用户提供无缝且准确的翻译功能。
教育工具:个性化的学习体验
Sarvam-M 可用于开发教育工具,这些工具为所有年龄段的学生提供个性化的学习体验。该模型可以生成定制的学习材料、提供学生作业的反馈并回答学生的问题。通过根据每个学生的个人需求和学习方式定制学习体验,Sarvam-M 可以提高学生的参与度和学业成绩。由 Sarvam-M 驱动的教育工具可以部署在各种平台上,例如在线学习平台、移动应用和交互式教科书,让学生可以随时随地访问个性化的学习资源。
访问和可用性:赋予开发者权力
Sarvam AI 已经让开发者和研究人员可以轻松访问 Sarvam-M,从而促进了 AI 社区内的创新和协作。该模型可在 Hugging Face 上下载,Hugging Face 是一个流行的共享和访问开源 AI 模型的平台。开发者还可以在 Sarvam AI 的 Playground 上测试该模型,这是一个基于 Web 的界面,允许用户试验模型的功能并探索其潜在的应用。此外,Sarvam AI 还提供 API,允许开发者将 Sarvam-M 集成到他们自己的应用和服务中。通过提供对模型及其相关工具的轻松访问,Sarvam AI 正在使开发者能够构建利用 AI 力量的创新解决方案。
未来计划:在印度建立一个主权的 AI 生态系统
Sarvam AI 计划定期发布模型,作为其在印度建立主权 AI 生态系统努力的一部分。该模型是该系列贡献中的第一个。该公司致力于开发和部署符合印度人民的需求和价值观的 AI 技术。通过培育强大的国内 AI 产业,Sarvam AI 旨在减少印度对外国技术的依赖,并促进经济增长和社会发展。该公司的愿景是创建一个既具有创新性又具有包容性的 AI 生态系统,确保所有印度人都能获得 AI 的好处。
4 月下旬,印度政府选择了 Sarvam 来构建该国的主权 LLM,作为 IndiaAI Mission 的一部分,这是一项旨在加强新兴技术领域国内能力的国家努力。这一选择突显了政府对 Sarvam AI 实现其在印度建立主权 AI 生态系统愿景的能力的信心。IndiaAI Mission 是一项全面的倡议,旨在促进 AI 领域的研发、促进创新和创业,并创建一支熟练的劳动力来支持 AI 产业。通过与 Sarvam AI 合作,政府正在朝着实现其目标并确立印度作为 AI 全球领导者的地位迈出重要一步。