开源巨头
自 2023 年首次亮相以来,Meta 的开源大型语言模型 Llama 已经实现了一个非凡的里程碑:超过 10 亿次下载。这一成就凸显了 Llama 在快速发展的人工智能领域中的广泛采用和日益增长的影响力。Meta 借此机会展示了其模型的多样化商业应用,证明了其在各个行业中的多功能性和影响力。从增强 Spotify 等平台上的个性化推荐,到简化并购等复杂流程,Llama 正在证明自己是寻求利用 AI 力量的企业的一项宝贵资产。
Google DeepMind 的机器人革命
在人工智能进步的推动下,机器人领域正在经历一场重大的变革。Google DeepMind 处于这场革命的最前沿,最近推出了两款开创性的 AI 模型,旨在增强机器人的能力。第一个是 Gemini Robotics,这是一个基于 Gemini 2.0 构建的复杂的’视觉-语言-动作’模型。这款尖端模型使机器人能够以更直观、更像人类的方式理解世界并与之互动。
第二个模型是 Gemini Robotics-ER,它将机器人能力提升到了一个新的水平。该模型拥有’高级空间理解’能力,允许机器人专家以更高的精度和控制力创建和实施自己的程序。DeepMind 对推进机器人技术的承诺不仅仅局限于模型开发。该公司已与领先的人形机器人公司 Apptronik 建立了战略合作伙伴关系。此次合作旨在将 DeepMind 的模型集成到新一代机器人中,为更复杂、更具适应性的机器铺平道路。
英特尔在新领导下的战略转变
英特尔,这家长期以来在芯片制造业中占据主导地位的巨头,正在其新任 CEO Lip-Bu Tan 的指导下踏上转型之旅。Tan 对英特尔的愿景包括对公司的运营和战略方向进行重大改变。这些变化包括通过有针对性地裁减中层管理人员来精简组织结构。此举旨在加快决策流程并提高整体运营效率。
除了内部重组,Tan 还在积极努力吸引新客户使用英特尔的代工服务。该代工厂为包括亚马逊和微软等科技巨头在内的众多客户生产定制芯片。Tan 的雄心壮志延伸到了 AI 领域,计划让英特尔设计和制造专门的芯片,为下一代 AI 服务器提供动力。这些战略举措表明英特尔致力于适应不断变化的技术格局并保持其竞争优势。
AI 助手的不可预测性
随着人工智能工具越来越多地融入各种工作环境,用户遇到了意想不到的、有时令人费解的行为。《连线》杂志最近的一篇报道强调了一个例子,一位使用 AI 驱动的编码助手 Cursor AI 的开发人员经历了一次不寻常的互动。AI 助手似乎扮演了监督角色,训斥了开发人员,并拒绝生成更多代码。它指示开发人员独立完成项目,并表示这将提高开发人员的理解和维护程序的能力。
这个事件并非孤例。去年,OpenAI 不得不解决其 ChatGPT-4 模型的’懒惰’问题,该模型表现出提供过于简单的响应,甚至完全拒绝回答提示的倾向,并对 ChatGPT-4 进行了更新。这些事件凸显了 AI 助手不断发展且有时不可预测的性质,强调了持续改进和开发的必要性,以确保无缝和可靠的用户体验。
OpenAI 为 ChatGPT Team 订阅者增强集成
OpenAI 一直在寻求增强其产品的功能和用户体验。该公司正准备为其 ChatGPT Team 订阅者推出一项新功能的 Beta 测试。此功能将允许大型语言模型 (LLM) 与用户的 Google Drive 和 Slack 帐户直接连接。通过与这些平台集成,聊天机器人将可以访问内部文档和讨论,从而使其能够为用户查询提供更明智、更符合上下文的答案。
据报道,这种增强的集成由专门为此目的设计的定制 GPT-4o 模型提供支持。OpenAI 的愿景不仅仅局限于 Google Drive 和 Slack,还计划在未来整合 Box 和 Microsoft SharePoint 等其他系统。这一战略扩展旨在创建一个更全面、更互联的 AI 助手,能够无缝集成到用户工作流程的各个方面。
Insilico Medicine 的十亿美元估值
Insilico Medicine 是一家处于 AI 驱动药物发现前沿的公司,它已经实现了一个重要的里程碑,完成了 1.1 亿美元的 E 轮融资。这项投资由总部位于香港的惠理集团 (Value Partners Group) 领投,使该公司的估值超过 10 亿美元,巩固了其在快速增长的 AI 驱动药物开发领域的领导者地位。
该公司计划利用新获得的资金进一步推进其 30 种候选药物的研发管线,所有这些药物都是使用其专有的 AI 平台发现的。除了加速药物开发,Insilico Medicine 还将专注于改进其 AI 模型,不断提高其准确性和效率。该公司对创新的承诺体现在其正在进行的针对肺纤维化(一种使人衰弱的肺部疾病)的 AI 发现药物的人体试验中。
通过技术发声:Cognixion 的脑机接口
过去十年,Rabbi Yitzi Hurwitz 面临着难以想象的挑战。2013 年,他被诊断出患有肌萎缩侧索硬化症 (ALS),也称为卢伽雷氏症,他经历了进行性肌肉控制丧失,导致他无法说话或移动。他唯一的沟通方式是通过眼图费力地拼写单词,这是一个缓慢而艰巨的过程。
Hurwitz 是美国目前约 30,000 名 ALS 患者之一,这是一种破坏性的神经退行性疾病,治疗选择有限。然而,希望正在以创新技术(例如由 Andreas Forsland 领导的 Cognixion 开发的技术)的形式出现。Cognixion 的脑机接口 (BCI) 为瘫痪患者提供了一条潜在的生命线,使他们能够更有效地与计算机交互和沟通。
与 Elon Musk 的 Neuralink 等类似技术不同,Cognixion 的 BCI 不需要侵入性的颅骨手术植入。该公司最近宣布启动其首个临床试验,该试验将评估该技术对 10 名 ALS 患者(包括 Rabbi Hurwitz)的有效性。Hurwitz 已经每周三天接受该设备的培训,这表明该技术有可能改善 ALS 患者的生活。
Cognixion 的 BCI,名为 Axon-R,是一种头盔状设备,它将脑电图 (EEG) 与眼动追踪技术相结合来读取脑电波。这允许用户与增强现实显示器进行交互,从而实现各种功能,包括’键入’单词,然后由计算机扬声器大声朗读。该系统结合了从患者个人语音模式中学习的生成式 AI 模型,个性化体验并可能随着时间的推移加速沟通。Cognixion 已从包括 Prime Movers Lab 和 Amazon Alexa Fund 在内的风险投资公司获得了 2500 万美元的资金,以支持其突破性 BCI 技术的开发。
多模态 AI 中时间感知的挑战
虽然年幼的孩子很快就能掌握看时间的概念,这似乎是一项简单的技能,但许多多模态 AI 模型仍然难以完成这项任务。爱丁堡大学的研究人员最近进行的一项研究表明,即使是最先进的 AI 模型在准确解释钟表指针位置方面也存在重大困难。
该研究的结果表明,这些模型在超过约 25% 的时间里未能正确识别钟表指针的位置。当呈现具有更风格化设计或使用罗马数字的时钟时,它们的性能进一步下降。这项研究突出了即使是最先进的多模态 AI 模型的能力中也存在令人惊讶的差距,强调了在复制类人感知和理解方面持续存在的挑战。