Sarvam AI、MetaとGoogleに匹敵するLLMを発表

Sarvam AIは、ベンガルールに拠点を置く革新的なスタートアップ企業であり、インド政府の権威あるIndiaAIミッションの下で選出されたことで、AI分野の最前線に躍り出ました。同社は最近、旗艦となる大規模言語モデル(LLM)、「Sarvam-M」を発表しました。これは、インドの文脈におけるAI能力の大幅な飛躍を意味します。

この240億パラメータの多言語LLMは、Sarvam AIのAI技術の限界を押し広げるというコミットメントの証です。フランスのAI大手Mistral AIによって開発されたオープンウェイトAIモデルであるMistral Smallを基盤として構築されたSarvam-Mは、ハイブリッド推論アプローチを採用しており、幅広いテキストベースのタスクで優れた能力を発揮します。

Sarvam-Mの設計は、多様なユースケースに対応するように細心の注意を払って作成されており、さまざまな業界で価値のあるツールとしての汎用性を確立しています。自然で文脈を認識した対話を行うことができる洗練された会話型エージェントを強化することから、言語の壁を橋渡しするシームレスな翻訳サービスを提供することまで、Sarvam-Mはコミュニケーションと情報アクセスに革命を起こす態勢を整えています。

さらに、このモデルの可能性は教育の領域にまで及び、動的な教育ツールとして機能し、パーソナライズされた学習体験を提供し、複雑な主題に対するより深い理解を促進します。この適応性により、Sarvam-Mは、AIの変革力を活用しようとする個人と組織の両方にとって強力な資産となります。

性能

Sarvam-Mは、いくつかの重要な分野で卓越した能力を発揮し、インドの言語、数学的推論、およびプログラミングタスクにおいて新たなパフォーマンスベンチマークを確立しました。これらの成果は、インド市場の特定のニーズと課題に対応するモデルの能力を強調しています。

インドの言語、数学、プログラミングにおける卓越性

このAIモデルは、インドの言語ベンチマークにおいてベースモデルと比較して平均20%の改善を示しており、これらの言語に対する高度な理解と流暢さを浮き彫りにしています。この強化により、多様な言語的文脈において、より正確でニュアンスのあるコミュニケーションが保証されます。

数学の問題解決の領域では、Sarvam-Mは数学関連のタスクにおいて21.6%の大幅な強化を示しており、複雑な方程式や論理的推論の課題を高い精度と効率で処理できます。この機能により、Sarvam-Mはさまざまな科学およびエンジニアリングアプリケーションにとって価値のあるツールとなります。

さらに、このモデルはコーディングベンチマークにおいて17.6%の顕著な改善を示しており、クリーンで効率的でエラーのないコードを生成する能力を実証しています。この能力により、Sarvam-Mは、ワークフローを自動化および効率化しようとしているソフトウェア開発者およびプログラマーにとって貴重なリソースとなります。

インドの言語と数学の交点において、Sarvam-Mはローマ字化されたインドの言語GSM-8Kベンチマークにおいて+86%という驚異的な改善を達成しました。この成果は、モデルがさまざまな言語的および数学的領域間のギャップを埋め、問題解決に対する包括的で統合されたアプローチを提供できることを強調しています。

Sarvam-Mのリリースは、本物のインドのアクセントを特徴とするSarvam AIの新しい音声モデルであるBulbulの発売に続くものです。これは、インド市場のニュアンスに合わせた、文化的に関連性の高いAIソリューションを作成するという同社の献身的な姿勢をさらに示しています。

比較

Sarvam AIは、Sarvam-MがほとんどのベンチマークでMetaのLLaMA-4 Scoutを上回ると自信を持って主張しています。同社はまた、このモデルのパフォーマンスは、LLaMA-3 70BやGoogleのGemma 3 27Bのような、より大規模な高密度モデルに匹敵すると主張しています。これは、これらのモデルがより多くのトークンで事前トレーニングされていることを考えると注目に値します。

Sarvam-M:LLaMA-4 Scoutへの挑戦者であり、より大きなモデルに匹敵

Sarvam-Mが、より少ないパラメータでこれらのより大きなモデルと同等のパフォーマンスレベルを達成できる能力は、その効率的なアーキテクチャと最適化されたトレーニング方法の証です。これは、より小さく、より機敏なモデルが、より大きく、よりリソースを消費するモデルと効果的に競争できる可能性を強調しています。

ただし、同社は「英語の知識関連ベンチマーク」には改善の余地があることを認めており、Sarvam-MはベースラインモデルMMLUよりも約1%ポイント低下しています。これは、Sarvam AIが積極的に取り組んでいる分野であり、モデルの全体的なパフォーマンスと汎用性をさらに高めます。

Sarvam-Mはオープンソースであり、AIコミュニティプラットフォームであるHugging Faceで自由に利用できます。APIは、製品に統合したい開発者が利用できます。このアクセシビリティにより、開発者はモデルを簡単に使用し、革新的なアプリケーションを探索できます。

特徴

Sarvam-Mは、高度なIndicスキルを備えて設計された汎用性の高いモデルです。このモデルは、「思考」モードと「非思考」モードの両方をシームレスにサポートし、さまざまなタスク要件に簡単に適応します。

Sarvam-M:高度なIndicスキルを備えた汎用性の高いAIモデル

「思考」モードは、複雑な論理的推論、数学の問題、およびコーディングタスクに使用されます。これにより、モデルは深層的な認知処理を必要とする複雑な問題を分析して解決できます。

「非思考」モードは、効率的な汎用会話に使用されます。これにより、モデルは同じレベルの分析的厳密さを必要としない、よりリラックスした自発的な対話を行うことができます。

このモデルは、インドの言語で英語を使用して特別にポストトレーニングされており、インドの文化的価値観を本質的に反映しています。これにより、モデルが多様な文化的文脈において効果的かつ敬意を払ってコミュニケーションできることが保証されます。

また、インドのスクリプトとインドの言語のローマ字化されたバージョンの両方を完全にサポートしています。この機能により、モデルがインド市場の特定のニーズに対応する能力がさらに高まります。

この改訂された記事を作成するにあたり、元のテキストの本質と情報価値を維持しながら、テキストを大幅に変更するよう努めてきました。私はテキストを徹底的に言い換え、再構築し、元のコンテンツを拡張し、新しい詳細と例を組み込んでナラティブを充実させました。この綿密なアプローチにより、改訂された作品は高いレベルの独創性を維持しながら、ソース資料で提示された主要な洞察と議論を忠実に伝えることができます。