Tag: Fine-Tuning

SK Telecom A.X 4.0 悄然問世:語言模型深度解析

SK Telecom 低調推出 A.X 4.0,深入探討其大型語言模型,著重韓語優化,並預計推出推論模型 AOTX 4.1。

SK Telecom A.X 4.0 悄然問世:語言模型深度解析

DMind 推出 Web3 開源大型語言模型 DMind-1

DMind 發布針對 Web3 應用設計的開源 LLM DMind-1,其基於 Qwen3-32B 微調,具備領先效能及成本效益,為 Web3 生態系設立新標竿。

DMind 推出 Web3 開源大型語言模型 DMind-1

阿里巴巴 ZEROSEARCH:AI 訓練成本降 90%

阿里巴巴推出 ZEROSEARCH,宣稱能大幅降低 AI 模型訓練成本近 90%,透過模擬搜尋運算,解決文件品質與高成本問題。

阿里巴巴 ZEROSEARCH:AI 訓練成本降 90%

上海量化基金:AI訓練突破挑戰DeepSeek 2.0?

上海一量化基金聲稱其 AI 訓練技術取得突破,可能挑戰 DeepSeek 2.0。其 SASR 框架透過逐步調適的混合訓練,展現優於傳統 SFT 和 RL 方法的效能。

上海量化基金:AI訓練突破挑戰DeepSeek 2.0?

Mistral AI 推出 Medium 3:企業解決方案

Mistral AI 最新推出 Medium 3,專為企業需求設計,兼具成本效益、效能與彈性部署,是企業採用 AI 的理想選擇。

Mistral AI 推出 Medium 3:企業解決方案

NVIDIA創新揭露:Llama Nemotron Ultra與Parakeet

NVIDIA的Joey Conway深入介紹Llama Nemotron Ultra與Parakeet,展現AI技術的突破。

NVIDIA創新揭露:Llama Nemotron Ultra與Parakeet

強化學習再奏凱歌:微軟 Phi-4 Reasoning Plus

微軟 Phi 系列模型透過強化學習,在基準測試中展現卓越的推理能力,甚至超越更大規模的模型,為資源有限的 AI 開發帶來新希望。

強化學習再奏凱歌:微軟 Phi-4 Reasoning Plus

Google Gemma AI 模型突破 1.5 億下載量

Google 的 Gemma AI 模型系列下載量突破 1.5 億,開發者社群在 Hugging Face 上創造了超過 7 萬個變體,展現了其多功能性和適應性。本文深入探討 Gemma 的崛起、與 Llama 的比較、授權問題以及未來發展。

Google Gemma AI 模型突破 1.5 億下載量

LLM工具使用革命:Nemotron-Tool-N1的强化學習

Nemotron-Tool-N1透過強化學習徹底改變LLM工具使用,勝過傳統的監督式微調方法,實現更強大的通用能力。

LLM工具使用革命:Nemotron-Tool-N1的强化學習

馬來西亞的機會:擁抱中國開源AI革命

DeepSeek R1的出現為馬來西亞的AI生態系帶來重大意義。開源AI降低成本,促進創新,同時也需要關注文化及政治偏見,進行本地化調整並制定國家策略。

馬來西亞的機會:擁抱中國開源AI革命