归档：2025/2 | zh-CN | 4/4

xAI是否谎报Grok3的基准测试成绩

xAI的Grok 3基准测试结果呈现方式引发争议。争议核心在于透明度和评估AI模型方式。基准测试虽有用，但应配合更全面的评估，包括真实世界性能、伦理和可解释性，以构建真正有益的AI。

2025-02-23

# Chatbot # Grok # xAI

xAI是否谎报Grok3的基准测试成绩

百川M1专注医疗的大语言模型系列

百川M1是专为医疗领域打造的大型语言模型系列，基于20万亿token数据训练，旨在提升模型在医疗方面的能力，弥补通用模型在专业领域的不足，为医疗保健行业带来AI驱动的革新。

2025-02-22

# LLM # AIGC # Baichuan

百川M1专注医疗的大语言模型系列

OpenAI新模型或将发布GPT5紧随其后

OpenAI或将发布GPT-4.5，GPT-5也已在路上。新模型可能具备更强的推理能力，甚至接近AGI，但仍需谨慎看待。竞争对手的出现也给OpenAI带来了压力。

2025-02-21

# OpenAI # GPT # AGI

OpenAI新模型或将发布GPT5紧随其后

AI竞争：Meta开源 vs 安全至上

Meta的LlamaCon拥抱开源AI。 OpenAI前CTO启动Thinking Machines Lab，专注于AI对齐和安全。两种方法反映了AI社区对可访问性与控制的辩论。

2025-02-20

# AGI # Llama # Meta

AI竞争：Meta开源 vs 安全至上

xAI发布Grok 3：AI能力显著飞跃

埃隆·马斯克的xAI发布了最新的AI模型Grok 3，标志着其AI开发的重大进展。Grok 3旨在与OpenAI的GPT-4o和Google的Gemini竞争，提升了视觉信息处理和问题解答能力。Grok 3还驱动着X平台上的各种功能，并采用了大规模数据中心和强大的计算能力进行训练，力求在性能上超越现有模型。

2025-02-19

# AGI # Grok # xAI

xAI发布Grok 3：AI能力显著飞跃