AI革命:微软1位LLM赋能日常CPU高效生成式AI
微软研究院推出BitNet b1.58 2B4T,一款采用'1位'权重原生训练的大型语言模型,突破传统LLM的内存、能耗和延迟瓶颈,为资源受限环境下的高效AI应用带来革新。
微软研究院推出BitNet b1.58 2B4T,一款采用'1位'权重原生训练的大型语言模型,突破传统LLM的内存、能耗和延迟瓶颈,为资源受限环境下的高效AI应用带来革新。
Nvidia推出NeMo微服务,加速AI Agent部署,赋能开发者构建智能自动化解决方案,提升企业生产力。
Nvidia NeMo微服务旨在帮助企业构建和管理AI Agent,从而实现任务自动化,整合现有应用,并保持信息更新,提升AI投资回报。
OpenAI计划于2025年初夏发布'开放'AI推理模型,力图在开放AI领域占据领先地位。此举标志着该公司在AI开发中拥抱开源原则的重大转变。
OpenAI发布GPT-4.1,声称其擅长遵守指令。然而,独立评估表明,它可能不如前代可靠。缺乏技术报告引发了担忧,独立调查揭示了潜在的对齐问题,促使人们呼吁谨慎对待AI的发展。
OpenAI发布的GPT-4.1在指令遵循方面表现出色,但独立测试表明其一致性不如前代产品,引发研究人员的担忧。
RAGEN是一种新的AI Agent训练和评估框架,旨在提高其可靠性和适应性,适用于实际的企业级应用。它采用强化学习方法StarPO,克服了'回声陷阱'问题,并提供了开源工具。
A2A支付、移动钱包和科技巨头推动全球数字支付变革。嵌入式金融和加密货币等创新技术将在未来五年内重塑支付格局。
通过 Project G-Assist,为 GeForce RTX AI PC 定制插件,释放个性化 AI 潜力。开发者可构建自定义命令,连接外部工具,打造专属 AI 工作流程。
Veeam通过集成模型上下文协议(MCP),革新数据管理,使备份数据可用于AI应用,安全高效地释放数据价值,赋能智能决策和负责任的AI创新。