GPT-4o 的新畫布:將圖像直接織入對話
OpenAI 將圖像生成功能深度整合至 GPT-4o,讓用戶能在單一對話流中無縫創建和修改圖像,實現文字與視覺的緊密結合。此功能強調易用性、迭代細化及安全考量。
OpenAI 將圖像生成功能深度整合至 GPT-4o,讓用戶能在單一對話流中無縫創建和修改圖像,實現文字與視覺的緊密結合。此功能強調易用性、迭代細化及安全考量。
OpenAI 將原生圖像生成整合至 GPT-4o,允許透過對話創建資訊圖表、漫畫、UI 等多樣視覺內容,無需外部工具,提升 AI 助理的多功能性。
OpenAI 的 GPT-4o 模型推出重大圖像生成升級,透過自然語言對話實現互動式、漸進式的視覺創作。它改善了文字渲染,支援圖像修改與整合,並能處理更複雜的多物件場景,同時也承認存在改進空間。
微軟為 Microsoft 365 Copilot 推出專為'深度研究'設計的新工具 Researcher 與 Analyst,挑戰 OpenAI、Google 等對手。此舉旨在將 AI 從簡單問答轉變為複雜分析夥伴,利用 M365 生態系統數據,但仍需克服準確性挑戰。
據Artificial Analysis報導,來自中國的開源權重 (open-weights) 模型DeepSeek V3,在特定非推理 (non-reasoning) 任務上超越GPT-4.5等知名對手。此發展不僅改變排名,更因其開源特性挑戰了主流專有模型,引發關注。
小型語言模型 (SLM) 正迅速崛起,受 Edge AI、模型壓縮及企業需求驅動,為資源受限環境提供高效 AI 方案,重塑市場格局並帶來新的競爭策略。
OpenAI 將其最新圖像生成技術整合至 ChatGPT-4o,從新奇轉向實用性與情境關聯性。此功能橫跨所有 ChatGPT 層級,旨在讓創建圖表、標誌等客製化視覺內容如同輸入查詢般自然,成為日常溝通與設計的得力助手。
OpenAI 強化 ChatGPT 視覺能力,引入對話式圖像編輯、提升圖像內文字生成、增強構圖控制。此舉旨在將 ChatGPT 打造成多模態創意夥伴,應對激烈競爭。新功能將透過 GPT-4o 向免費及付費用戶推出,並納入 API。
舊照片的深褐色調與灰階捕捉了凝結的瞬間,卻缺乏原始的生動感。圖像著色旨在為這些記憶注入色彩,將黑白肖像變為全彩窗口。此過程長期吸引藝術家與歷史學家。如今,在深度學習推動下,自動著色正達到前所未有的成果。
ADL調查揭示,Meta的Llama、OpenAI的ChatGPT、Anthropic的Claude及Google的Gemini等頂尖AI系統,存在針對猶太人與Israel的可衡量偏見。此發現引發對這些強大工具可靠性及其對公眾認知的潛在影響的迫切質疑。