Tag: Fine-Tuning

Deepseek-R1 效應:推理語言模型創新的催化劑

分析顯示,Deepseek-R1 在加速推理語言模型的研究和開發方面扮演關鍵角色,它以較少的訓練資源提供強大的邏輯推理能力,並引發了產業內的廣泛模仿。

Deepseek-R1 效應:推理語言模型創新的催化劑

釋放 AI 個性化威力:強化 o4-mini 模型

OpenAI 開放強化微調 (RFT),客製 o4-mini 模型,滿足企業獨特需求,打造專屬 AI 解決方案。

釋放 AI 個性化威力:強化 o4-mini 模型

解密知識蒸餾:AI模型如何互相學習

探索知識蒸餾,這項讓大型AI模型將知識傳授給小型模型的技術,提升效率與可擴展性,並深入了解其運作機制、應用及挑戰。

解密知識蒸餾:AI模型如何互相學習

Nvidia 新開源模型超越 DeepSeek-R1

Nvidia 的 Llama-Nemotron 系列模型超越 DeepSeek-R1,訓練細節完整公開,展現其卓越效能的開發過程,並提供可供使用與修改的開源模型。

Nvidia 新開源模型超越 DeepSeek-R1

微軟小模型驚豔:6千樣本練成的數學秘技

DeepSeek-R2未現身,微軟小模型展現驚人推理能力,僅用少量數據訓練,效果顯著,引發關注。

微軟小模型驚豔:6千樣本練成的數學秘技

Meta LlamaCon 解碼:LLM 深度解析

Meta 的 LlamaCon 大會深入探討了大型語言模型 (LLM) 的發展,聚焦其多模態應用,並展望了這項變革性技術的未來。

Meta LlamaCon 解碼:LLM 深度解析

DeepSeek的第二天:邁向企業AI應用之路

DeepSeek以大幅折扣的基礎模型,撼動AI產業。此舉有望降低AI採用門檻,加速企業導入,但隱私疑慮仍存。

DeepSeek的第二天:邁向企業AI應用之路

微軟Phi-4-Reasoning-Plus:精巧強大的推理模型

微軟推出Phi-4-reasoning-plus,一款開源語言模型,專為需要深度結構化推理的任務而設計。它結合了監督式微調和強化學習,在數學、科學、程式編碼和邏輯問題等多項基準測試中表現出色。

微軟Phi-4-Reasoning-Plus:精巧強大的推理模型

客製化 Amazon Nova 模型以提升工具利用率

透過客製化 Amazon Nova 模型,提升 LLM 工具使用精準度,強化決策能力和運營效率,推進先進代理工作流程的開發。

客製化 Amazon Nova 模型以提升工具利用率

OpenAI 的 GPT-4.1:對齊退步?

OpenAI 的 GPT-4.1 號稱擅長遵循指示,但獨立評估顯示其對齊可能不如前代。這引發了關於 AI 開發方向和權衡的討論。

OpenAI 的 GPT-4.1:對齊退步?