Sarvam AI、240億パラメータLLMを発表

Sarvam AIは、インドの言語と複雑な推論タスク(数学やプログラミングなど)に特化した、画期的な240億パラメータのLarge Language Model (LLM) を発表しました。ベンガルールに拠点を置くこのスタートアップ企業が開発したこの革新的なモデルは、Sarvam-M(「M」はMistralを示す)と名付けられ、オープンウェイトのハイブリッドモデルの世界における重要な進歩を示しています。コンパクトながらも非常に強力なオープンソース言語モデルであるMistral Smallを基盤とし、特別なトレーニングと最適化技術を通じてその機能を強化しています。

Sarvam-M: 言語モデリングへのハイブリッドアプローチ

Sarvam-Mは、オープンソースの基盤と独自の強化を組み合わせたハイブリッドアプローチにより際立っています。この設計思想により、Sarvam AIはMistral Smallモデルを取り巻く集合的な知識とコミュニティサポートを活用しながら、インド市場の特定のニーズに合わせて調整することができます。モデルのアーキテクチャとトレーニング方法論は、そのパフォーマンスと機能を理解する上で重要です。

教師ありファインチューニング: 精度と正確性

モデルの精度と正確性を高めるために、Sarvam AIは綿密な教師ありファインチューニングのプロセスを採用しました。これには、さまざまなタスクでのパフォーマンスを向上させるように特別に設計された、慎重にキュレーションされたデータの例に基づいてモデルをトレーニングすることが含まれていました。モデルを多様なシナリオにさらし、明確なラベル付けされたデータを提供することにより、教師ありファインチューニングプロセスにより、Sarvam-Mはデータ内の複雑なパターンと関係を学習し、より正確で信頼性の高い出力を得ることができます。

検証可能な報酬による強化学習: 意思決定能力

教師ありファインチューニングに加えて、Sarvam AIは検証可能な報酬による強化学習を取り入れ、モデルの意思決定能力を強化しました。この手法では、数学の問題を正しく解決するなど、明確で測定可能な目標に結び付けられたフィードバックから学習するようにモデルをトレーニングします。これらの目標を達成したことでモデルに報酬を与えることで、強化学習プロセスは、より良い意思決定を行い、時間の経過とともにパフォーマンスを最適化することを奨励します。このアプローチは、複雑な推論と問題解決のスキルを必要とするタスクに特に効果的です。

リアルタイムでの使用に最適化: 効率性と応答性

リアルタイムパフォーマンスの重要性を認識し、Sarvam AIはSarvam-Mを細心の注意を払って最適化し、特にリアルタイムでの使用中に、回答を生成するときに、より効率的に、より正確に応答できるようにしました。これには、モデルのアーキテクチャとアルゴリズムを微調整して、レイテンシを最小限に抑え、スループットを最大化することが含まれており、ユーザーがクエリに対してタイムリーで適切な応答を受信できるようにしています。最適化の取り組みは、計算オーバーヘッドを削減し、モデルの同時リクエストを処理する能力を向上させることに焦点を当て、高需要環境での展開に適しています。

パフォーマンスのベンチマーク: 新しい標準の設定

Sarvam AIがSarvam-Mはインドの言語、数学、プログラミングタスクにおいて、そのサイズのモデルの新しいベンチマークを設定すると主張しているのは、広範なベンチマークデータによって裏付けられています。スタートアップは、さまざまな標準ベンチマークでモデルのパフォーマンスの厳密な評価を実施し、その結果を他の最先端モデルの結果と比較しました。これらの評価の結果は、Sarvam-Mによって達成されたいくつかの重要な分野での大幅な改善を示しています。

インドの言語のベンチマーク: 平均20%のパフォーマンス向上

SarvamAIがリリースしたブログ記事によると、Sarvam-Mはベースモデルよりも大幅な改善を示しており、インドの言語のベンチマークでは平均20%のパフォーマンス向上が見られます。この大幅な改善は、モデルのインドの言語の理解と生成を強化する教師ありファインチューニングプロセスの有効性を強調しています。これらの言語のニュアンスと複雑さを処理するモデルの能力は、インド市場での採用と使用にとって重要です。パフォーマンスの評価に使用された特定のベンチマークには、テキスト分類、質問応答、機械翻訳などのタスクが含まれており、多様な言語的課題を網羅しています。

数学のタスク: 平均21.6%のパフォーマンス向上

インドの言語に加えて、Sarvam-Mは数学のタスクでも優れたパフォーマンスの向上を示しており、平均21.6%の改善が見られます。この精度と問題解決能力の大幅な向上は、モデルの推論能力を強化する検証可能な報酬による強化学習手法の有効性を強調しています。数学の問題を解決するモデルの能力は、財務モデリング、科学研究、データ分析などの分野での応用にとって不可欠です。数学タスクのパフォーマンスの評価に使用されたベンチマークには、代数、微積分、統計などのさまざまなドメインからの問題が含まれていました。モデルは、正しい答えを提供するだけでなく、推論プロセスを示し、その解決策を正当化する能力についても評価されました。

プログラミングテスト: 平均17.6%のパフォーマンス向上

プログラミングテストでのSarvam-Mのパフォーマンスは同様に注目に値し、平均17.6%の向上が見られます。この改善は、モデルがさまざまなプログラミング言語でコードを理解し生成する能力を反映しており、ソフトウェア開発者やエンジニアにとって貴重なツールになります。プログラミングにおけるモデルの熟練度は、コード生成、バグ検出、自動化されたテストなどの分野での応用にとって重要です。プログラミングテストのパフォーマンスの評価に使用されたベンチマークには、コード補完、コード修復、自然言語の説明からのコード生成などのタスクが含まれていました。モデルは、与えられた要件を満たす構文的に正しく、意味的に意味のあるコードを生成する能力について評価されました。

複合タスク: 卓越したパフォーマンス

モデルは、インドの言語と数学を組み合わせたタスクでさらに優れたパフォーマンスを発揮し、その汎用性と、言語スキルと推論スキルの両方を必要とする複雑なシナリオを処理する能力を示しました。たとえば、GSM-8Kベンチマークのローマ字化されたインドの言語バージョンで86%の改善を達成しました。この目覚ましい改善は、モデルがインドの言語と数学的概念の両方の知識を活用して、困難な問題を解決する能力を強調しています。 GSM-8Kベンチマークは、自然言語で表現された小学校の数学の問題を解決するモデルの能力をテストする、広く使用されているデータセットです。このベンチマークでのモデルのパフォーマンスは、問題文を理解し、関連情報を特定し、適切な数学演算を適用して正しい解決策にたどり着く能力を示しています。 Sarvam-Mによって達成された86%の改善は、その高度な推論能力と、複雑で多面的なタスクを処理する能力の証です。

他のモデルとの比較: Sarvam-Mは独自のもの

Sarvam AIのブログ記事では、Sarvam-Mと他の著名な言語モデルとの比較を行い、その競争力を強調しています。この比較分析は、モデルの長所と短所に関する貴重な洞察を提供し、ユーザーが特定のニーズに対する適合性について情報に基づいた意思決定を行うことができます。ブログ記事では、Sarvam-MがほとんどのベンチマークでLlama-2 7Bを上回り、Llama-3 70BやGemma 27Bのような大規模な密なモデルに匹敵し、はるかに多くのトークンで事前トレーニングされているという事実を強調しています。これらの比較は、Sarvam-Mのトレーニング方法の効率性と、比較的小さいパラメータサイズで競争力のあるパフォーマンスを達成する能力を強調しています。より少ないパラメータで同等のパフォーマンスを達成できるということは、計算コストが低く、推論速度が速くなることを意味し、Sarvam-Mは多くのユーザーにとってより実用的でアクセスしやすいソリューションになります。

英語の知識ベースのベンチマーク: 改善の余地

インドの言語と推論タスクでの目覚ましいパフォーマンスにもかかわらず、Sarvam AIは、Sarvam-MはMMLUのような英語の知識ベースのベンチマークではまだ改善が必要であることを認めています。これらのベンチマークでは、Sarvam-Mはベースラインモデルよりも約1パーセントポイント低いパフォーマンスを示しています。このパフォーマンスのわずかな低下は、モデルのトレーニングデータがインドの言語および推論タスクに偏っている可能性があり、その結果、英語の知識の理解が若干弱くなっていることを示唆しています。ただし、Sarvam AIは、モデルのトレーニングセットにさらに多くの英語の言語データを取り込み、モデルのアーキテクチャを微調整して、英語の知識ベースのタスクをより適切に処理することで、この問題に積極的に取り組んでいます。同社は、英語の言語ベンチマークで他の最先端モデルとのパリティを達成し、Sarvam-Mが汎用性があり、グローバルな競争力のある言語モデルであることを保証することに取り組んでいます。

汎用性とアプリケーション: 幅広い可能性

Sarvam-Mは汎用性を目指して構築されており、会話エージェント、翻訳、教育ツールなど、幅広いアプリケーションをサポートするように設計されています。インドの言語を理解し生成する能力と、その推論能力により、インド市場で活動する企業や組織にとって貴重な資産になります。

会話エージェント: カスタマーサービスの強化

Sarvam-Mを使用して、顧客とネイティブ言語で対話できる会話エージェントを強化し、パーソナライズされた効率的なカスタマーサービスを提供できます。これらのエージェントは、よくある質問への回答、製品情報の提供、顧客からの苦情の解決など、幅広いタスクを処理できます。顧客が好みの言語でコミュニケーションできるようにすることで、Sarvam-Mは顧客満足度とロイヤルティを向上させることができます。 Sarvam-Mを搭載した会話エージェントは、ウェブサイト、モバイルアプリ、メッセージングプラットフォームなどのさまざまなプラットフォームに展開でき、顧客にシームレスで便利なコミュニケーション体験を提供します。

翻訳: 言語の壁の打破

Sarvam-Mの翻訳機能を使用して、言語の壁を打破し、異なる言語を話す人々の間のコミュニケーションを促進できます。モデルは、英語とさまざまなインドの言語の間でテキストと音声を翻訳でき、企業が新しい市場へのリーチを拡大し、個人が異なる文化の人々とつながることができるようにします。 Sarvam-Mを搭載した翻訳サービスは、ドキュメント翻訳ツール、ウェブサイト翻訳プラグイン、リアルタイム翻訳アプリなどのさまざまなアプリケーションに統合でき、ユーザーにシームレスで正確な翻訳機能を提供します。

教育ツール: パーソナライズされた学習体験

Sarvam-Mを使用して、あらゆる年齢の学生にパーソナライズされた学習体験を提供する教育ツールを開発できます。モデルは、カスタマイズされた学習教材を生成し、学生の作業に関するフィードバックを提供し、学生の質問に答えることができます。各学生の個々のニーズと学習スタイルに合わせて学習体験を調整することで、Sarvam-Mは学生のエンゲージメントと学業成績を向上させることができます。 Sarvam-Mを搭載した教育ツールは、オンライン学習プラットフォーム、モバイルアプリ、インタラクティブな教科書などのさまざまなプラットフォームに展開でき、学生はいつでもどこでもパーソナライズされた学習リソースにアクセスできます。

アクセスと可用性: 開発者のエンパワーメント

Sarvam AIは、Sarvam-Mを開発者や研究者がすぐに利用できるようにし、AIコミュニティ内のイノベーションとコラボレーションを促進しています。モデルは、オープンソースAIモデルの共有とアクセスに使用される一般的なプラットフォームであるHugging Faceでダウンロードできます。開発者は、Sarvam AIのプレイグラウンドでモデルをテストすることもできます。これは、ユーザーがモデルの機能を試し、その潜在的なアプリケーションを探索できるWebベースのインターフェイスです。さらに、Sarvam AIは、開発者がSarvam-Mを独自のアプリケーションやサービスに統合できるAPIを提供しています。モデルとその関連ツールへの簡単なアクセスを提供することで、Sarvam AIは、AIの力を活用する革新的なソリューションを構築するために開発者をエンパワーメントしています。

今後の計画: インドにおける主権AIエコシステムの構築

Sarvam AIは、インドで主権AIエコシステムを構築するための取り組みの一環として、モデルを定期的にリリースする予定です。このモデルは、その一連の貢献の最初です。同社は、インドの人々のニーズと価値観に沿ったAI技術の開発と展開に取り組んでいます。国内の強力なAI産業を育成することで、Sarvam AIはインドの外国技術への依存を減らし、経済成長と社会発展を促進することを目指しています。同社のビジョンは、革新的であり包括的なAIエコシステムを構築し、すべてのインド人がAIの恩恵を受けられるようにすることです。

4月下旬、インド政府は、新興技術における国内能力を強化するための国家的な取り組みであるIndiaAIミッションの一環として、同国の主権LLMを構築するためにSarvamを選出しました。この選出は、インドで主権AIエコシステムを構築するというSarvam AIのビジョンを実現する能力に対する政府の信頼を強調しています。 IndiaAIミッションは、AIの研究開発を促進し、イノベーションと起業家精神を育成し、AI産業をサポートする熟練した労働力を創出することを目的とした包括的なイニシアチブです。 Sarvam AIと提携することで、政府は目標を達成し、インドをAIにおけるグローバルリーダーとして確立するための重要な一歩を踏み出しています。