圖靈測試的中年危機:AI是否已智勝基準?
數十年來,圖靈測試一直是衡量人工智能的標竿,但備受爭議。近期研究顯示,GPT-4.5 在模仿人類對話方面表現出色,甚至超越真人,引發對測試本身及 AGI 的重新評估。這或許更多地揭示了人類的假設,而非機器的真正智能。
數十年來,圖靈測試一直是衡量人工智能的標竿,但備受爭議。近期研究顯示,GPT-4.5 在模仿人類對話方面表現出色,甚至超越真人,引發對測試本身及 AGI 的重新評估。這或許更多地揭示了人類的假設,而非機器的真正智能。
全球科技巨頭競逐 AI 霸權,阿里巴巴集團準備推出其大型語言模型 Qwen 3。此舉凸顯其加速創新的決心,以及在生成式 AI 競賽中保持領先地位的戰略意義,對其雲端、電商業務至關重要。
比較 Google 免費的 Gemini 2.5 與出人意料的 DeepSeek,透過九項不同挑戰(創意、推理、編碼等)揭示各自優劣。
Google推出先進AI模型Gemini 2.5 Pro,顯著提升機器推理能力。此舉旨在推動AI理解與解決複雜問題,鞏固其技術領先地位,並為更自主的AI代理奠定基礎。
Google 發布 Gemini 2.5 Pro,標榜顯著提升的 AI 推理能力。此'實驗性'模型現已免費向公眾開放,雖有速率限制,但標誌著尖端 AI 技術普及化的重要一步。其擁有百萬 token 上下文窗口,並在基準測試中表現優異。
OpenAI 獲 400 億美元融資,估值達 3000 億美元,由 SoftBank 領投。儘管前景看好,但其高估值因虧損及來自 Anthropic、xAI、Meta 和中國企業的激烈競爭而面臨審視。未來取決於商業成功(目標年收 1000 億美元)或突破性進展,同時需應對反壟斷和財務壓力等風險。
OpenAI 確認獲得創紀錄的400億美元融資,估值達3000億美元,並計劃發布多年來首個具備先進推理能力的'開放權重'語言模型,平衡專有創新與社群參與。
Elon Musk 的 AI 公司 xAI 斥巨資在孟菲斯建造超級電腦設施,號稱'運算超級工廠'。儘管初期建設成本超 4 億美元,並計劃部署 100 萬個 GPU,但該項目面臨嚴峻電力短缺,僅獲批 150 MW 電網電力(申請 300 MW),可能限制其最終規模。
Google 向 Gemini 應用程式用戶推出實驗性 Gemini 2.5 Pro,擴大頂尖 AI 模型使用範圍。此舉旨在收集回饋並提升競爭力,但未來是否維持免費尚不明朗。此模型強調推理能力,並擁有百萬 token 上下文窗口。
Google 發布其'最智能'模型 Gemini 2.5 Pro,初期實驗版即登頂 LMArena 排行榜,現已透過 Gemini 網頁介面向公眾開放(有限制)。此舉加劇了與 OpenAI、Anthropic 的 AI 競爭,展示 Google 引領行業的決心。