Tag: Fine-Tuning

OpenAI 的 GPT-4.1:對齊退步?

OpenAI 的 GPT-4.1 號稱擅長遵循指示,但獨立評估顯示其對齊可能不如前代。這引發了關於 AI 開發方向和權衡的討論。

OpenAI 的 GPT-4.1:對齊退步?

OpenAI GPT-4.1:隱憂更勝以往?

OpenAI發布GPT-4.1,聲稱指令遵循表現出色,但獨立測試顯示其一致性不如前代產品,引發研究人員對其安全性的擔憂。

OpenAI GPT-4.1:隱憂更勝以往?

小型AI模型將獲企業青睞:通用LLM的轉變

Gartner分析顯示,企業將轉向更小、更專注的AI模型,以優化資源並降低成本。

小型AI模型將獲企業青睞:通用LLM的轉變

解鎖生物奧秘:擴展單細胞分析語言模型

C2S-Scale 是一系列開源大型語言模型,用於「讀取」和「寫入」單細胞生物數據,將基因表達譜轉換為機器可理解的語言,促進生物研究。

解鎖生物奧秘:擴展單細胞分析語言模型

在Mac上本機執行DeepSeek等LLM

在Mac上本機執行LLM,如DeepSeek,提升隱私、效能與控制。探索優勢、需求與步驟。

在Mac上本機執行DeepSeek等LLM

探索前沿:利用 Hugging Face 發現與理解 AI 模型

AI 發展迅速,追蹤新模型極具挑戰。Hugging Face 作為關鍵平台,簡化了 AI 模型(尤其是對話代理和語言模型)的發現、存取與理解過程,成為研究者與開發者的重要指南。

探索前沿:利用 Hugging Face 發現與理解 AI 模型

解鎖領域專長:大型語言模型的微調、合併與能力湧現

探索如何透過微調(CPT、SFT、DPO、ORPO)與模型合併(特別是 SLERP)技術,使 Llama、Mistral 等大型語言模型適應材料科學等專業領域,並探討能力湧現現象與模型規模的影響。

解鎖領域專長:大型語言模型的微調、合併與能力湧現

以子之矛:Gemini微調功能助長AI攻擊

研究人員發現利用Google Gemini微調功能的新方法,可自動化生成高效的提示注入攻擊,針對Gemini等閉源模型,繞過傳統的手動試誤,揭示了AI工具被用於攻擊自身的風險。

以子之矛:Gemini微調功能助長AI攻擊

Mistral AI 加碼:新開源挑戰者撼動 AI 既有勢力

巴黎新創 Mistral AI 推出開源模型 Mistral Small 3.1,挑戰 Google Gemma 3 與 OpenAI GPT-4o Mini 等專有系統。此舉突顯開源與封閉 AI 之爭,提供強大效能與高可及性,可能重塑 AI 策略。

Mistral AI 加碼:新開源挑戰者撼動 AI 既有勢力

Gemma 微調:實務考量與應用

深入探討大型語言模型 (LLM) 微調的優勢、限制與實際應用案例,特別是在處理專有程式碼和文件時,微調如何成為 RAG 的有效替代方案。

Gemma 微調:實務考量與應用