Sopra Steria 攜手 Mistral AI 推尖端 AI
Sopra Steria 與 Mistral AI 策略聯盟,為歐洲大型企業和公共管理部門提供客製化、可部署於主權雲端基礎設施的生成式 AI 解決方案,確保資料主權與安全性,並加速 AI 應用。
Sopra Steria 與 Mistral AI 策略聯盟,為歐洲大型企業和公共管理部門提供客製化、可部署於主權雲端基礎設施的生成式 AI 解決方案,確保資料主權與安全性,並加速 AI 應用。
XAi 的 Grok 聊天機器人現已推出 Android 版本,為使用者帶來全新的互動式 AI 體驗。Grok 不僅能回答問題,還能提出問題,深入探索,成為強大的研究和創意工具。
Anthropic 推出的 Claude 3.7 Sonnet 模型,獨特之處在於其「混合推理」能力。此創新方法使模型能夠在快速、直覺的回應與徹底、分析的思維之間無縫切換,展現更像人類的認知過程。
面對西方監管壓力、國內阿里巴巴的強勢競爭,以及OpenAI、Google等國際巨頭的夾擊,中國AI公司DeepSeek加速推出R2模型,力求在激烈的AI競賽中突圍。
Elon Musk 的 xAI 為其 Grok 3 模型推出了一個名為「狂放」的無審查語音互動模式。 此舉引發了科技界的關注和爭議,高級訂閱者可以使用此模式,讓聊天機器人參與許多競爭對手認為過於冒險的對話。
微軟推出 Phi-4-multimodal 和 Phi-4-mini,為小型語言模型 (SLM) 系列帶來重大躍進。這些模型旨在為開發人員提供尖端的 AI 功能,重塑應用程式開發的格局,實現更強大、高效且安全的 AI 體驗。
X-IL 是一個模組化框架 專為現代模仿學習設計 透過整合先進技術如 Mamba 和 xLSTM 實現了卓越的機器人控制性能
Moonshot AI 研究人員引入 Muon 和 Moonlight,透過高效訓練技術優化大型語言模型。研究重點在於提升效率和穩定性,降低計算成本,並開源研究成果,促進大型語言模型領域的發展。
Moonshot AI 的 Kimi 近期發表了「Muon 可擴展 LLM 訓練」技術報告,並推出「月光」混合專家模型 (MoE),擁有 300 億和 1600 億參數。此模型採用 Muon 架構,以 57 兆個 token 訓練,在提升效能的同時,大幅降低浮點運算次數 (FLOPs),突破帕累托效率的界限。
儘管大量資源投入訓練大型語言模型,但如何有效地將這些模型整合到實用應用中,仍然是一大挑戰。