最热门AI模型:能力与应用
自2024年以来发布的AI模型概述,包括其功能、用例和访问方式。本文将持续更新,以反映该领域的最新进展。重点关注OpenAI、Anthropic、xAI、Google和Meta等公司的产品。
自2024年以来发布的AI模型概述,包括其功能、用例和访问方式。本文将持续更新,以反映该领域的最新进展。重点关注OpenAI、Anthropic、xAI、Google和Meta等公司的产品。
阿里巴巴发布名为 I2VGen-XL 的开源 AI 视频生成模型套件,包含文本生成视频和图像生成视频模型,性能卓越,可在消费级 GPU 上运行,推动 AI 视频创作领域发展。
DeepSeek,一家中国初创公司,发布了开源模型DeepSeek-R1,声称在数学、编码和自然语言推理方面可与OpenAI等巨头的模型媲美,同时大幅降低资源消耗,引发业界轰动。
微软推出全新AI模型Phi-4-multimodal,可直接在设备上处理语音、视觉和文本,计算需求远低于前代。标志着生成式AI从小语言模型 (SLM) 发展,可在资源有限的设备上高效运行。
微软发布Phi-4系列AI模型,该系列模型在体积更小的情况下,实现了文本、图像和语音处理的卓越性能,重新定义了AI效率。'Mixture of LoRAs' 技术是其核心创新,Phi-4在多个基准测试中表现出色,并在实际应用中展现了巨大潜力。
DeepSeek模型推动AI芯片变革,RISC-V开源架构迎来机遇。阿里达摩院玄铁C930服务器级CPU发布,'高性能+AI'双引擎,引领RISC-V生态发展,或成AI时代原生算力架构。
Rokid,一家中国AR设备制造商,凭借其AI驱动的眼镜引起轰动。这些眼镜不仅仅是未来概念,更是AI如何融入可穿戴技术,实现实际应用的切实一步。其与阿里巴巴Qwen大语言模型的无缝集成,实现了轻量级设备中的高级AI功能。
Sopra Steria 与 Mistral AI 建立战略联盟,为欧洲大型企业和公共管理部门提供量身定制的、可工业化部署的主权生成式 AI 解决方案,强调数据主权和安全性。
Moonshot AI研究人员介绍了Muon和Moonlight,通过高效训练技术优化大规模语言模型。重点关注解决现有优化器(如AdamW)的可扩展性挑战,提高训练效率和稳定性,降低计算成本,并在各种基准测试中展示卓越性能。
月之暗面Kimi发布“月光”混合专家模型,包含300亿和1600亿参数版本。该模型基于Muon架构,使用57万亿token训练,提升性能的同时减少计算量,实现帕累托效率的突破。