揭示大型語言模型的環境足跡

人工智慧(AI)創新的無情追求,推動了日益複雜的大型語言模型(LLMs)的發展。 儘管這些模型在各個領域展現出令人印象深刻的能力,但與其訓練和部署相關的環境後果在很大程度上仍然被忽視。 開發 AI 模型的公司很樂意分享 benchmark 上的效能數據,但往往避談環境影響。 最近的研究揭示了與這些強大的 AI 工具相關的、經常被忽視的能源、水和碳成本。

評估環境影響的新基準

為了量化 AI 的環境影響,羅德島大學、普羅維登斯學院和突尼斯大學的一個研究團隊推出了一個基礎設施感知的 AI 推理基準。 這項研究可在康奈爾大學的 preprint server arXiv 上找到,它更精確地評估了 AI 的生態影響。 該基準結合了公共 API 延遲數據以及關於底層 GPU 和區域電網組成的資訊,以計算 30 種主流 AI 模型每次提示的環境足跡。 這種全面的方法考慮了能源消耗、用水量和碳排放,最終得出一個「生態效率」評分。

羅德島大學助理教授 Abdeltawab Hendawi 解釋了這項研究的動機:「我們開始考慮在環境資源、用水、能源和碳足跡方面比較這些模型。」 研究結果揭示了不同 AI 模型在環境影響方面的顯著差異。

能源消耗的差異:OpenAI、DeepSeek 和 Anthropic

該研究強調了領先 AI 模型之間在能源消耗方面的顯著差異。 OpenAI 的 o3 模型和 DeepSeek 的主要推理模型,對於單個擴展回應,消耗超過 33 瓦時(Wh)。 這與 OpenAI 較小的 GPT-4.1 nano 形成鮮明對比,後者所需的能源少 70 多倍。 Anthropic 的 Claude-3.7 Sonnet 成為研究中生態效率最高的模型。

研究人員強調了硬體在決定 AI 模型環境影響方面的重要作用。 例如,使用較舊 A100 GPU 的 GPT-4o mini,每次查詢消耗的能量比使用更先進 H100 晶片的較大 GPT-4o 更多。 這突顯了利用尖端硬體來最大限度地減少 AI 環境足跡的重要性。

查詢長度的環境代價

該研究揭示了查詢長度與環境影響之間的直接關聯。 較長的查詢總是會導致更大的資源消耗。 即使是看似微不足道的簡短提示,也會增加總體的環境負擔。 單個簡短的 GPT-4o 提示消耗約 0.43 瓦時的能量。 研究人員估計,按照 OpenAI 預計每天 7 億次 GPT-4o 呼叫量計算,每年的總能源消耗可能在 392 到 463 吉瓦時(GWh)之間。 從這個角度來看,這足夠為每年 35,000 個美國家庭供電。

AI 普及的累積影響

該研究強調,個別使用者對 AI 的採用可以迅速升級為巨大的環境成本。 羅德島大學的研究員兼該研究的主要作者 Nidhal Jegham 解釋說:「每年使用 ChatGPT-4o 消耗的水量與每年 120 萬人的飲用水需求量一樣多。」 Jegham 警告說,雖然單個訊息或提示的環境影響似乎微不足道,「但一旦你擴大規模,特別是 AI 在各個指數中的擴張速度,這確實正在成為一個日益嚴重的問題。」

更深入地探討環境影響指標

為了充分理解研究結果的含義,更詳細地檢查用於評估 AI 模型的環境指標至關重要。 以下各節提供了關鍵指標的細分:

能源消耗

能源消耗是衡量操作 AI 模型所需電力的基本指標。 該研究以每次查詢的瓦時(Wh)量化能源消耗,可以直接比較不同模型的能源效率。 盡量減少能源消耗對於減少碳足跡和 AI 的總體環境影響至關重要。

影響能源消耗的因素:

  • 模型大小和複雜性: 較大且更複雜的模型通常比更小、更簡單的模型需要更多的能量才能運行。
  • 硬體效率: 用於運行 AI 模型的 GPU 和其他硬體元件在能源消耗中起著重要作用。 更先進和節能的硬體可以大大減少 AI 的能源足跡。
  • 查詢長度和複雜性: 較長且更複雜的查詢通常需要更多的計算資源,因此消耗更多的能量。
  • 最佳化技術: 各種最佳化技術,例如模型壓縮和量化,可以在不犧牲準確性的情況下減少 AI 模型的能源消耗。

用水量

用水量是 AI 環境影響中經常被忽視的一個方面。 數據中心容納運行 AI 模型的伺服器,需要大量的水來冷卻。 該研究根據數據中心的能源消耗量和為這些數據中心供電的區域電網的用水強度估算用水量。

影響用水量的因素:

  • 冷卻需求: 數據中心產生大量的熱量,需要冷卻系統來維持最佳運作溫度。 水通常用作冷卻劑,可以直接或間接地通過冷卻塔。
  • 電網用水強度: 電網的用水強度是指產生一個單位電力所需的水量。 高度依賴使用水來冷卻的熱電廠的電網具有較高的用水強度。
  • 數據中心位置: 位於乾旱地區或存在缺水問題地區的數據中心可能會加劇 AI 的環境影響。

碳排放

碳排放是造成氣候變遷的主要原因。 該研究根據 AI 模型的能源消耗量和區域電網的碳強度計算碳排放量。 碳強度是指每產生一個單位電力所排放的二氧化碳量。

影響碳排放的因素:

  • 能源來源: 為數據中心供電的能源類型對碳排放有重大影響。 太陽能和風能等可再生能源的碳強度遠低於煤炭和天然氣等化石燃料。
  • 電網碳強度: 電網的碳強度因用於發電的能源組合而異。 可再生能源比例較高的地區具有較低的碳強度。
  • 能源效率: 減少能源消耗是降低碳排放最有效的方法。

影響和建議

該研究的結果對 AI 開發人員、政策制定者和最終用戶具有重大意義。 AI 的環境影響不容忽視,並且需要隨著 AI 技術的不斷發展和普及而仔細考慮。

對 AI 開發人員的建議:

  • 優先考慮能源效率: AI 開發人員在設計和訓練 AI 模型時應優先考慮能源效率。 這包括使用較小的模型、優化程式碼以及利用高效硬體。
  • 探索可再生能源: AI 公司應探索利用可再生能源為其數據中心供電的機會。 這可以顯著減少 AI 的碳足跡。
  • 投資於節約用水: 數據中心應投資於節約用水技術,以最大限度地減少用水量。 這包括使用閉環冷卻系統和雨水收集。
  • 透明度和報告: AI 公司應對其模型對環境的影響保持透明,並報告關鍵指標,例如能源消耗、用水量和碳排放。

對政策制定者的建議:

  • 激勵綠色 AI: 政策制定者應通過稅收抵免、補貼和其他激勵措施,激勵綠色 AI 技術的開發和部署。
  • 監管數據中心能源消耗: 政策制定者應監管數據中心能源消耗,以確保數據中心盡可能高效地運作。
  • 促進可再生能源的採用: 政策制定者應促進可再生能源的採用,以降低電網的碳強度。
  • 支持研發: 政策制定者應支持對新技術的研究和開發,以減少 AI 對環境的影響。

對最終用戶的建議:

  • 注意 AI 的使用: 最終用戶應注意他們對 AI 的使用,並避免不必要或輕率的查詢。
  • 選擇環保的 AI 模型: 如果可能,最終用戶應選擇已知更節能的 AI 模型。
  • 支持永續的 AI 實踐: 最終用戶可以通過選擇致力於環境責任的公司的 AI 產品和服務來支持永續的 AI 實踐。

未來研究方向

該研究強調需要進一步研究 AI 對環境的影響。 未來的研究應集中在以下領域:

  • 生命週期評估: 對 AI 模型進行全面的生命週期評估,從開發到處置,以識別所有潛在的環境影響。
  • 訓練的影響: 調查訓練 AI 模型對環境的影響,這可能遠高於推理的影響。
  • AI 對其他產業的影響: 檢查 AI 對經濟中其他產業(例如運輸和製造業)的影響,以了解 AI 普及的總體環境後果。
  • 開發新指標: 開發新指標來評估 AI 對環境的影響,例如考慮 AI 硬體中的隱含能源和材料的指標。

結論

LLMs 對環境的影響是一個複雜且多面向的問題,需要仔細考慮。 這項研究的結果為與流行的 AI 工具相關的能源、水和碳成本提供了寶貴的見解。 通過了解這些成本,AI 開發人員、政策制定者和最終用戶可以採取措施來最大限度地減少 AI 的環境足跡,並確保以永續的方式開發和部署 AI 技術。 隨著 AI 越來越融入我們的生活,優先考慮永續性並共同努力創造一個 AI 使社會受益而不損害環境的未來至關重要。