人工智能(AI)创新领域的不断发展推动了日益复杂的大型语言模型(LLMs)的开发。 虽然这些模型在各个领域都展现出令人印象深刻的能力,但与其训练和部署相关的环境后果在很大程度上仍然不为人知。 开发 AI 模型的公司热衷于分享基准测试的性能数据,但往往避而不谈环境影响。 最近的研究揭示了与这些强大的 AI 工具相关的、经常被忽视的能源、水和碳成本。
评估环境影响的新基准
为了量化 AI 对环境的影响,来自罗德岛大学、普罗维登斯学院和突尼斯大学的研究团队引入了一种感知基础设施的 AI 推理基准。 这项研究发表在康奈尔大学的预印本服务器 arXiv 上,它为 AI 的生态影响提供了更精确的评估。 该基准结合了公共 API 延迟数据以及底层 GPU 和区域电网组成的信息,以计算 30 个主流 AI 模型每次提示的环境足迹。 这种综合方法考虑了能源消耗、用水量和碳排放,最终得出一个“生态效率”分数。
罗德岛大学助理教授 Abdeltawab Hendawi 解释了这项研究的动机:“我们开始考虑根据环境资源、水、能源和碳足迹来比较这些模型。” 研究结果揭示了不同 AI 模型在环境影响方面的显着差异。
能源消耗差异:OpenAI、DeepSeek和Anthropic
该研究强调了领先 AI 模型在能源消耗方面的显着差异。 OpenAI 的 o3 模型和 DeepSeek 的主要推理模型每次扩展响应消耗超过 33 瓦时 (Wh)。 这与 OpenAI 较小的 GPT-4.1 nano 形成鲜明对比,后者所需的能量减少了 70 多倍。 Anthropic 的 Claude-3.7 Sonnet 成为该研究中最具生态效率的模型。
研究人员强调了硬件在决定 AI 模型环境影响方面的关键作用。 例如,使用较旧 A100 GPU 的 GPT-4o mini 比使用更先进 H100 芯片的较大 GPT-4o 每次查询消耗更多的能量。 这凸显了利用尖端硬件来最大限度地减少 AI 环境足迹的重要性。
查询长度的环境代价
该研究揭示了查询长度与环境影响之间的直接相关性。 较长的查询总是导致更大的资源消耗。 即使是看似微不足道的、简短的提示也会增加整体环境负担。 单个简短的 GPT-4o 提示会消耗大约 0.43 瓦时的能量。 研究人员估计,按照 OpenAI 预测的每天 7 亿次 GPT-4o 调用量计算,每年的总能耗可能在 392 到 463 吉瓦时 (GWh) 之间。 换句话说,这足以每年为 35,000 户美国家庭供电。
AI 采用的累积影响
该研究强调,个人用户对 AI 的采用可能会迅速升级为巨大的环境成本。 罗德岛大学的研究员兼该研究的主要作者 Nidhal Jegham 解释说,“每年使用 ChatGPT-4o 消耗的水量相当于 120 万人每年的饮用水需求。” Jegham 警告说,虽然单个消息或提示的环境影响似乎微不足道,“但一旦你扩大规模,尤其是在 AI 在各个指标中扩展的幅度如此之大的情况下,它确实正在成为一个日益严重的问题。”
深入研究环境影响指标
为了充分理解该研究发现的含义,更详细地检查用于评估 AI 模型的环境指标至关重要。 以下部分提供了关键指标的分解:
能源消耗
能源消耗是衡量运行 AI 模型所需电力的基本指标。 该研究以每次查询的瓦时 (Wh) 量化能源消耗,从而可以直接比较不同模型的能源效率。 尽量减少能源消耗对于减少碳足迹和 AI 的整体环境影响至关重要。
影响能源消耗的因素:
- 模型大小和复杂性: 较大和更复杂的模型通常比更小、更简单的模型需要更多的能量才能运行。
- 硬件效率: 用于运行 AI 模型的 GPU 和其他硬件组件在能源消耗中起着重要作用。 更先进和节能的硬件可以大大减少 AI 的能源足迹。
- 查询长度和复杂性: 较长和更复杂的查询通常需要更多的计算资源,因此消耗更多的能量。
- 优化技术: 各种优化技术,例如模型压缩和量化,可以减少 AI 模型的能量消耗,而不会牺牲准确性。
用水量
用水量是 AI 环境影响中经常被忽视的一个方面。 数据中心(容纳运行 AI 模型的服务器)需要大量的水来冷却。 该研究根据数据中心的能源消耗以及为这些数据中心供电的区域电网的用水强度来估算用水量。
影响用水量的因素:
- 冷却需求: 数据中心产生大量的热量,需要冷却系统来维持最佳运行温度。 水通常用作冷却剂,无论是直接还是间接通过冷却塔。
- 电网用水强度: 电网的用水强度是指发电单位所需的用水量。 高度依赖使用水进行冷却的热电厂的电网具有较高的用水强度。
- 数据中心位置: 位于干旱地区或缺水地区的数据中心会加剧 AI 的环境影响。
碳排放
碳排放是气候变化的主要驱动因素。 该研究基于 AI 模型的能源消耗和区域电网的碳强度来计算碳排放量。 碳强度是指每单位发电量排放的二氧化碳量。
影响碳排放的因素:
- 能源: 用于为数据中心供电的能源类型对碳排放有重大影响。 可再生能源,例如太阳能和风能,比煤炭和天然气等化石燃料的碳强度低得多。
- 电网碳强度: 电网的碳强度因用于发电的能源组合而异。 可再生能源比例较高的地区碳强度较低。
- 能源效率: 减少能源消耗是降低碳排放的最有效方法。
影响和建议
该研究的发现对 AI 开发人员、政策制定者和最终用户具有重大意义。 AI 对环境的影响不可忽略,需要随着 AI 技术的不断发展和普及而认真考虑。
对 AI 开发人员的建议:
- 优先考虑能源效率: AI 开发人员在设计和训练 AI 模型时应优先考虑能源效率。 这包括使用更小的模型、优化代码和利用高效硬件。
- 探索可再生能源: AI 公司应探索用可再生能源为其数据中心供电的机会。 这可以显着减少 AI 的碳足迹。
- 投资节水: 数据中心应投资节水技术,以最大限度地减少用水量。 这包括使用闭环冷却系统和雨水收集。
- 透明度和报告: AI 公司应公开其模型的环境影响,并报告关键指标,例如能源消耗、用水量和碳排放。
对政策制定者的建议:
- 激励绿色 AI: 政策制定者应通过税收抵免、补贴和其他激励措施来激励绿色 AI 技术的开发和部署。
- 监管数据中心能源消耗: 政策制定者应监管数据中心能源消耗,以确保数据中心尽可能高效地运行。
- 推广可再生能源应用: 政策制定者应推广可再生能源的应用,以降低电网的碳强度。
- 支持研发: 政策制定者应支持对可以减少 AI 环境影响的新技术进行研发。
对最终用户的建议:
- 注意 AI 使用: 最终用户应注意他们对 AI 的使用,并避免不必要或无意义的查询。
- 选择环保的 AI 模型: 如果可能,最终用户应选择已知更节能的 AI 模型。
- 支持可持续 AI 实践: 最终用户可以通过选择来自致力于环境责任的公司的 AI 产品和服务来支持可持续 AI 实践。
未来的研究方向
该研究强调需要进一步研究 AI 对环境的影响。 未来的研究应侧重于以下领域:
- 生命周期评估: 对 AI 模型进行全面的生命周期评估,从开发到处置,以识别所有潜在的环境影响。
- 训练的影响: 调查训练 AI 模型对环境的影响,这可能明显高于推理的影响。
- AI 对其他行业的影响: 检查 AI 对经济其他行业(例如运输和制造业)的影响,以了解 AI 应用的总体环境后果。
- 开发新指标: 开发新指标来评估 AI 的环境影响,例如考虑 AI 硬件中蕴含的能源和材料的指标。
结论
大型语言模型的 Environmental impact 是一个复杂且多方面的论题,需要仔细考虑。 本研究的发现为与流行 AI 工具相关的能源、水和碳本钱提供了有价值的见解。 通过了解这些本钱,AI 开发人员、政策制定者和最终用户可以采取步骤来最大限度地减少 AI 的环境足迹,并确保以可持续的方式开发和部署 AI 技术。 随着 AI 越来越融入我们的生活,至关重要的是优先考虑可持续性,并共同努力创造一个 AI 在不损害环境的情况下造福社会的未来。