AMD 借助 GAIA 项目为设备端 AI 开辟新航道 | zh-CN

人工智能的格局正在经历一场重大的变革。多年来，复杂 AI 模型，特别是大型语言模型 (LLM) 的巨大计算需求，使其运行主要局限于庞大数据中心里强大且耗能的服务器。访问通常需要通过互联网发送查询，并等待远程处理的响应。然而，在处理器技术的进步以及对数据隐私和延迟日益增长的担忧推动下，向本地化计算的转变势头强劲。半导体领域的强大参与者 Advanced Micro Devices (AMD) 正积极拥抱这一趋势，寻求让用户能够直接在个人电脑上利用生成式 AI 的能力。该公司在这一领域的最新举措是一个名为 GAIA 的开源项目，这个名字颇具趣味，是 ‘Generative AI Is Awesome’（生成式 AI 真棒）的首字母缩写。

开启本地化 AI 处理的新纪元

在本地运行生成式 AI 模型的吸引力是多方面的。首先，它解决了日益增长的隐私担忧。当数据在用户自己的设备上处理时，就不再需要将潜在的敏感信息传输给第三方服务器，从而提供了一种本质上更安全的操作模式。其次，本地执行可以显著降低延迟；当计算密集型工作发生在距离用户界面仅几毫米的地方，而不是可能跨越大陆传输时，输入和输出之间的延迟被最小化了。第三，它使访问民主化。虽然基于云的 AI 通常涉及订阅费或使用限制，但设备端处理利用的是用户已经拥有的硬件，这可能降低了试验和使用 AI 工具的门槛。

认识到这一潜力，AMD 一直在战略性地将专为 AI 工作负载设计的专用处理核心集成到其处理器架构中。这些努力的成果在其最新的 Ryzen AI 300 系列处理器中显而易见，这些处理器配备了增强的神经处理单元 (Neural Processing Units, NPU)。这些 NPU 经过精心设计，用于处理机器学习任务中常见的特定类型的数学运算，与传统 CPU 核心相比，其效率（无论是在速度还是功耗方面）都显著提高。正是这种专用硬件，AMD 希望通过其 GAIA 项目为普通用户解锁。AMD 的 AI 开发者支持经理 Victoria Godsoe 强调了这一目标，她表示 GAIA ‘利用 Ryzen AI 神经处理单元 (NPU) 的强大功能来运行私有和本地的大型语言模型 (LLM)’。她进一步强调了其优势：’这种集成可以实现更快、更高效的处理——即更低的功耗——同时确保您的数据本地化和安全。’

引入 GAIA：简化设备端 LLM 部署

GAIA 作为 AMD 对以下问题的回答而出现：用户如何才能轻松利用其配备新 Ryzen AI 的机器的 NPU 功能来运行复杂的 AI 模型？作为一个开源应用程序，GAIA 提供了一个简化的界面，专门用于在配备最新 AMD 硬件的 Windows PC 上直接部署小型 LLM 并与之交互。该项目有意识地建立在现有的开源框架之上，特别提到了 Lemonade 作为基础，展示了在更广泛的开发社区内的协作精神。

GAIA 的核心功能是抽象掉通常与设置和运行 LLM 相关的大部分复杂性。用户面对的是一个更易于使用的环境，该环境从底层开始就针对 AMD 的 Ryzen AI 架构进行了优化。这种优化至关重要；它确保软件有效利用 NPU，最大限度地提高性能并最小化能耗足迹。虽然主要目标是具有强大 NPU 的 Ryzen AI 300 系列，但 AMD 并未完全排除使用较旧或不同硬件配置的用户。

该项目支持流行且相对紧凑的 LLM 系列，包括基于广泛使用的 Llama 和 Phi 架构的模型。这些模型虽然可能不具备像 GPT-4 这样的巨头的规模，但对于各种设备端任务来说却非常强大。AMD 提出了潜在的应用场景，从能够进行自然对话的交互式聊天机器人到更复杂的推理任务，展示了为 GAIA 驱动的本地 AI 所设想的多功能性。

探索 GAIA 的能力：Agent 与混合动力

为了展示实际应用并使该技术立即可用，GAIA 附带了一系列预定义的 ‘agent’，每个 agent 都针对特定功能进行了定制：

Chaty: 顾名思义，此 agent 提供对话式 AI 体验，充当用于一般交互和对话的聊天机器人。它利用底层 LLM 生成类人文本响应的能力。
Clip: 此 agent 专注于问答任务。值得注意的是，它结合了检索增强生成 (Retrieval-Augmented Generation, RAG) 功能，使其能够潜在地从外部来源（如 YouTube 脚本）获取信息，以提供更明智或与上下文更相关的答案。这种 RAG 功能显著增强了 agent 超越 LLM 初始训练数据的知识库。
Joker: 另一个基于 RAG 的 agent，Joker 专门用于幽默，任务是生成笑话。这展示了本地 LLM 在专业化、创造性应用方面的潜力。
Simple Prompt Completion: 这提供了一条更直接通往基础 LLM 的途径，允许用户输入提示并接收直接的补全，而没有其他 agent 的对话或特定任务层。它作为直接模型交互的基本界面。

这些 agent 的执行，特别是模型生成响应的推理过程，主要由兼容的 Ryzen AI 300 系列芯片上的 NPU 处理。这确保了高效、低功耗的操作。然而，AMD 还为某些受支持的模型引入了一种更高级的 ‘混合’ 模式。这种创新方法动态地将处理器的集成图形处理单元 (iGPU) 与 NPU 一起使用。通过利用 iGPU 的并行处理能力，这种混合模式可以为要求苛刻的 AI 任务提供显著的性能提升，为用户提供了一种超越 NPU 单独所能实现的加速推理的方法。

认识到硬件环境的多样性，AMD 还提供了一个备选方案。存在一个仅依赖 CPU 核心进行计算的 GAIA 变体。虽然比 NPU 或混合模式慢得多且功耗效率低，但这个仅使用 CPU 的版本确保了更广泛的可访问性，允许没有最新 Ryzen AI 硬件的用户也能体验 GAIA，尽管会有效能上的损失。

战略定位与开源优势

GAIA 的推出可以放在竞争激烈的半导体市场，特别是涉及 AI 加速的更广泛背景下看待。在相当长的一段时间里，NVIDIA 在 AI 领域享有主导地位，这很大程度上归功于其强大的 GPU 和成熟的 CUDA (Compute Unified Device Architecture) 软件生态系统，后者已成为高性能机器学习的事实标准。在消费级硬件上高效运行较大型模型的需求，常常引导开发者和爱好者转向 NVIDIA 的产品。

AMD 的 GAIA 计划，加上 Ryzen AI 芯片中的专用 NPU 硬件，代表了挑战这一主导地位的战略举措，尤其是在笔记本电脑和台式机上设备端 AI 这个新兴市场。通过提供一个易于使用、经过优化且开源的工具，AMD 旨在围绕其自身的 AI 硬件能力构建一个生态系统，使 Ryzen AI 平台对那些对本地 AI 执行感兴趣的开发者和最终用户更具吸引力。对 NPU 优化的明确关注使其区别于以 GPU 为中心的方法，并突显了专用神经处理器在特定 AI 任务中固有的能效优势。

决定在宽松的 MIT 开源许可证下发布 GAIA 也具有重要的战略意义。它邀请全球开发者社区进行协作和贡献。这种方法可以加速项目的开发，促成新功能和模型的集成，并培养一个对 AMD 的 AI 平台投入的社区。AMD 明确欢迎针对错误修复和功能增强的拉取请求 (pull requests)，表明其致力于通过集体努力来发展 GAIA。开源降低了开发者进行实验、集成以及可能在 GAIA 框架之上构建商业应用的门槛，进一步刺激了围绕 Ryzen AI 的生态系统。

虽然当前版本侧重于适合设备端执行的较小 LLM，但 GAIA 奠定的基础可能为随着 NPU 技术的不断进步支持更复杂的模型和应用铺平道路。它代表了 AMD 的明确意图：成为个人化、本地化人工智能时代的主要力量，提供必要的硬件和易于使用的软件工具，将 AI 能力安全、高效地直接带到用户手中。’Generative AI Is Awesome’ 这个名称，虽然可能不太正式，但强调了该公司在这个快速发展的技术前沿的热情和雄心。

更新于 2025-03-26

# LLM # Agent # AMD