OpenAI 推出進階音訊模型,強化語音助理功能
OpenAI 發表全新音訊模型,透過 API 提供,顯著提升語音助理的效能與多功能性。這些模型包含語音轉文字和文字轉語音功能,在準確性、可靠性皆大幅躍進,特別是在處理口音、背景噪音和語速變化等複雜音訊環境時,展現出色的效果。
OpenAI 發表全新音訊模型,透過 API 提供,顯著提升語音助理的效能與多功能性。這些模型包含語音轉文字和文字轉語音功能,在準確性、可靠性皆大幅躍進,特別是在處理口音、背景噪音和語速變化等複雜音訊環境時,展現出色的效果。
騰訊控股正積極擴張,主要透過對人工智慧(AI)領域的戰略投資。公司採用雙管齊下的策略,結合外部開發的 DeepSeek 模型和自家專有的元寶模型,為在 AI 產業中取得領先地位奠定基礎。
騰訊推出自研深度思維模型混元T1,具備快速反應、長文本處理能力及具競爭力的價格。其解碼速度是同行的兩倍,擅長處理複雜指令及減少幻覺,在多項基準測試中表現優異,採用創新的 Hybrid-Mamba-Transformer 架構。
利用 Amazon Bedrock 上的 Anthropic's Claude 模型,自動索引和標記技術文件,簡化科學公式和數據視覺化的處理,並以全面的 metadata 建立 Amazon Bedrock Knowledge Bases。
隨著美國收緊對中國的技術出口,Nvidia 和 AMD 等美國科技巨頭正積極轉向培育中國人工智慧 (AI) 市場。DeepSeek 作為迅速崛起的 AI 平台,正推動這些公司加速推出為其量身定制的 AI 半導體和軟體服務。
Elon Musk 旗下的人工智慧公司 xAI 收購了專注於 AI 影片生成的 Hotshot,展現其進軍多模態 AI 領域的雄心,目標不僅是超越文字模型,更要整合影片、音訊、圖像和文字等多種數據,打造更全面、更強大的 AI 系統。
在 Amazon SageMaker Unified Studio 中,利用 Amazon Bedrock 輕鬆創建能與公司系統互動的生成式 AI 代理,自動化工作流程並提升效率。
政府消息人士稱,X可能需要對其AI工具Grok生成的內容負責。這引發了對AI生成內容責任歸屬以及印度'資訊科技法'第79條的爭議。
限制外國AI技術,看似保護國家安全,實則可能扼殺創新、削弱網路防禦。本文探討AI鎖國政策的潛在負面影響,主張採取更開放、審慎的做法,平衡安全與發展。
大型語言模型 (LLM) 的激增引發了全球對版權法的激烈爭辯。核心問題是:AI 公司是否應被授予無限制地使用受版權保護的材料進行訓練,還是應優先考慮內容創作者的權利?這場爭議涉及多個國家、司法管轄區和利益相關者。