Tag: Fine-Tuning

Sarvam AI、MetaとGoogleに匹敵するLLMを発表

インドのSarvam AIが、MetaやGoogleに対抗する、インド言語に特化した最先端LLM「Sarvam-M」を発表。その性能、特徴、競合モデルとの比較を詳しく解説します。

Sarvam AI、MetaとGoogleに匹敵するLLMを発表

SK Telecom A.X 4.0:言語モデルの詳細

SK Telecomがひっそりと発表した大規模言語モデルA.X 4.0の詳細な分析。韓国語に特化した最適化と、今後の展開、倫理的考慮事項について解説します。

SK Telecom A.X 4.0:言語モデルの詳細

DMind-1:Web3向けオープンソースLLM発表

DMindがWeb3用に最適化されたオープンソースLLM、DMind-1を発表。AlibabaのQwen3-32Bを基に、ブロックチェーン、DeFi、NFTなど9つのカテゴリでSOTAを達成。低コストで高性能を実現。

DMind-1:Web3向けオープンソースLLM発表

アリババ、AI学習コスト90%削減技術を発表

AlibabaがAI学習コストを90%削減するZEROSEARCHを発表。API不要で検索操作をシミュレートし、ドキュメント品質とコスト問題を解決。AI開発競争に革新をもたらす可能性。

アリババ、AI学習コスト90%削減技術を発表

上海Goku、DeepSeekに挑戦?AI新手法

上海のクオンツファンドGokuが、DeepSeekに対抗する可能性のある革新的なAI学習手法を発表。中国のAI技術の進歩を示すか。

上海Goku、DeepSeekに挑戦?AI新手法

Mistral Medium 3:企業向け言語モデル

Mistral AIが、コスト効率、高性能、柔軟な展開オプションを備えた企業向け言語モデルMistral Medium 3を発表。導入事例、市場の反応、競合状況を解説します。

Mistral Medium 3:企業向け言語モデル

NVIDIAの革新:Llama Nemotron UltraとParakeet

NVIDIAのJoey Conway氏が、LLMとASRの最新モデル、Llama Nemotron UltraとParakeetについて語ります。

NVIDIAの革新:Llama Nemotron UltraとParakeet

Microsoft Phi-4 Reasoning Plus: 強化学習が躍進

MicrosoftのPhi-4 Reasoning Plusは強化学習を用いて、高精度な推論を実現。大規模モデルに匹敵する性能を示す。

Microsoft Phi-4 Reasoning Plus: 強化学習が躍進

Google Gemmaモデル:1.5億DL突破

GoogleのGemma AIモデルが1.5億ダウンロードを突破。開発者と研究者の間で人気が高まっています。Hugging Faceでの7万以上のバリアントの作成がモデルの汎用性を示しています。Llamaとの比較、ライセンスの問題、今後の展望について詳しく解説します。

Google Gemmaモデル:1.5億DL突破

LLMツール活用を革新: Nemotron-Tool-N1の強化学習

Nemotron-Tool-N1は、強化学習を用いた革新的なLLMツール活用アプローチを提供し、既存の手法を凌駕する性能をBFCLとAPI-Bankで実証しました。

LLMツール活用を革新: Nemotron-Tool-N1の強化学習