Phân tích Tác động Môi trường của Mô hình Ngôn ngữ

Sự theo đuổi không ngừng đổi mới trí tuệ nhân tạo (AI) đã dẫn đến sự phát triển của các mô hình ngôn ngữ lớn (LLMs) ngày càng tinh vi. Mặc dù các mô hình này thể hiện những khả năng ấn tượng trong nhiều lĩnh vực khác nhau, nhưng những hậu quả về môi trường liên quan đến việc đào tạo và triển khai chúng phần lớn vẫn còn bị che khuất. Các công ty phát triển các mô hình AI sẵn sàng chia sẻ dữ liệu hiệu suất trên các điểm chuẩn, nhưng có xu hướng tránh tác động môi trường. Nghiên cứu gần đây làm sáng tỏ các chi phí năng lượng, nước và carbon thường bị bỏ qua liên quan đến các công cụ AI mạnh mẽ này.

Một Tiêu Chuẩn Mới để Đánh Giá Tác Động Môi Trường

Trong nhiệm vụ định lượng tác động môi trường của AI, một nhóm các nhà nghiên cứu từ Đại học Rhode Island, Providence College và Đại học Tunis đã giới thiệu một tiêu chuẩn nhận biết cơ sở hạ tầng để suy luận AI. Nghiên cứu này, có sẵn trên máy chủ bản in trước arXiv của Đại học Cornell, cung cấp một đánh giá chính xác hơn về các tác động sinh thái của AI. Điểm chuẩn kết hợp dữ liệu độ trễ API công khai với thông tin về GPU cơ bản và thành phần lưới điện khu vực để tính toán dấu chân môi trường trên mỗi lời nhắc cho 30 mô hình AI chính thống. Cách tiếp cận toàn diện này xem xét mức tiêu thụ năng lượng, sử dụng nước và phát thải carbon, lên đến đỉnh điểm trong một điểm số "hiệu quả sinh thái".

Abdeltawab Hendawi, trợ lý giáo sư tại Đại học Rhode Island, giải thích động lực đằng sau nghiên cứu: "Chúng tôi bắt đầu nghĩ về việc so sánh các mô hình này về mặt tài nguyên môi trường, nước, năng lượng và dấu chân carbon." Các phát hiện cho thấy sự khác biệt đáng kể về tác động môi trường của các mô hình AI khác nhau.

Sự Khác Biệt trong Tiêu Thụ Năng Lượng: OpenAI, DeepSeek và Anthropic

Nghiên cứu nêu bật sự khác biệt đáng kể về mức tiêu thụ năng lượng giữa các mô hình AI hàng đầu. Mô hình o3 của OpenAI và mô hình lý luận chính của DeepSeek tiêu thụ hơn 33 watt-giờ (Wh) cho một phản hồi mở rộng duy nhất. Điều này tương phản mạnh mẽ với GPT-4.1 nano nhỏ hơn của OpenAI, mô hình này yêu cầu năng lượng ít hơn hơn 70 lần. Claude-3.7 Sonnet của Anthropic nổi lên như mô hình hiệu quả sinh thái nhất trong nghiên cứu.

Các nhà nghiên cứu nhấn mạnh vai trò quan trọng của phần cứng trong việc xác định tác động môi trường của các mô hình AI. Ví dụ, GPT-4o mini, sử dụng GPU A100 cũ hơn, tiêu thụ nhiều năng lượng hơn cho mỗi truy vấn so với GPT-4o lớn hơn, hoạt động trên các chip H100 tiên tiến hơn. Điều này nhấn mạnh tầm quan trọng của việc tận dụng phần cứng tiên tiến để giảm thiểu dấu chân môi trường của AI.

Tổn Thất Môi Trường của Độ Dài Truy Vấn

Nghiên cứu tiết lộ mối tương quan trực tiếp giữa độ dài truy vấn và tác động môi trường. Các truy vấn dài hơn luôn dẫn đến tiêu thụ tài nguyên lớn hơn. Ngay cả các lời nhắc ngắn, dường như không đáng kể, cũng góp phần vào gánh nặng môi trường tổng thể. Một lời nhắc GPT-4o ngắn gọn duy nhất tiêu thụ khoảng 0,43 Wh năng lượng. Các nhà nghiên cứu ước tính rằng với 700 triệu cuộc gọi GPT-4o dự kiến mỗi ngày của OpenAI, tổng mức tiêu thụ năng lượng hàng năm có thể dao động từ 392 đến 463 gigawatt-giờ (GWh). Để đưa điều này vào viễn cảnh, thì lượng năng lượng đó đủ để cung cấp năng lượng cho khoảng 35.000 ngôi nhà ở Mỹ hàng năm.

Tác Động Tích Lũy của Việc Áp Dụng AI

Nghiên cứu nhấn mạnh rằng việc áp dụng AI của người dùng cá nhân có thể nhanh chóng leo thang thành chi phí môi trường đáng kể. Nidhal Jegham, một nhà nghiên cứu tại Đại học Rhode Island và là tác giả chính của nghiên cứu, giải thích rằng "Việc sử dụng ChatGPT-4o hàng năm tiêu thụ lượng nước bằng nhu cầu uống nước của 1,2 triệu người hàng năm." Jegham cảnh báo rằng mặc dù tác động môi trường của một tin nhắn hoặc lời nhắc duy nhất dường như không đáng kể, "một khi bạn mở rộng nó, đặc biệt là mức độ AI đang mở rộng trên các chỉ số, nó thực sự đang trở thành một vấn đề ngày càng gia tăng."

Đi Sâu Hơn vào Các Số Liệu Tác Động Môi Trường

Để đánh giá đầy đủ ý nghĩa của các phát hiện của nghiên cứu, một cuộc kiểm tra chi tiết hơn về các số liệu môi trường được sử dụng để đánh giá các mô hình AI là điều cần thiết. Các phần sau đây cung cấp một phân tích về các số liệu chính:

Tiêu Thụ Năng Lượng

Tiêu thụ năng lượng là một thước đo cơ bản về năng lượng điện cần thiết để vận hành các mô hình AI. Nghiên cứu định lượng mức tiêu thụ năng lượng theo watt-giờ (Wh) trên mỗi truy vấn, cho phép so sánh trực tiếp hiệu quả năng lượng của các mô hình khác nhau. Giảm thiểu mức tiêu thụ năng lượng là rất quan trọng để giảm dấu chân carbon và tác động môi trường tổng thể của AI.

Các Yếu Tố Ảnh Hưởng Đến Tiêu Thụ Năng Lượng:

  • Kích Thước và Độ Phức Tạp của Mô Hình: Các mô hình lớn hơn và phức tạp hơn thường yêu cầu nhiều năng lượng hơn để hoạt động so với các mô hình nhỏ hơn, đơn giản hơn.
  • Hiệu Quả Phần Cứng: GPU và các thành phần phần cứng khác được sử dụng để chạy các mô hình AI đóng một vai trò quan trọng trong việc tiêu thụ năng lượng. Phần cứng tiên tiến và tiết kiệm năng lượng hơn có thể giảm đáng kể dấu chân năng lượng của AI.
  • Độ Dài và Độ Phức Tạp của Truy Vấn: Các truy vấn dài hơn và phức tạp hơn thường yêu cầu nhiều tài nguyên tính toán hơn và do đó tiêu thụ nhiều năng lượng hơn.
  • Kỹ Thuật Tối Ưu Hóa: Các kỹ thuật tối ưu hóa khác nhau, chẳng hạn như nén và lượng tử hóa mô hình, có thể làm giảm mức tiêu thụ năng lượng của các mô hình AI mà không làm giảm độ chính xác.

Sử Dụng Nước

Sử dụng nước là một khía cạnh thường bị bỏ qua về tác động môi trường của AI. Các trung tâm dữ liệu, nơi chứa các máy chủ chạy các mô hình AI, yêu cầu một lượng nước đáng kể để làm mát. Nghiên cứu ước tính việc sử dụng nước dựa trên mức tiêu thụ năng lượng của các trung tâm dữ liệu và cường độ nước của lưới điện khu vực cung cấp điện cho các trung tâm dữ liệu đó.

Các Yếu Tố Ảnh Hưởng Đến Sử Dụng Nước:

  • Yêu Cầu Làm Mát: Các trung tâm dữ liệu tạo ra nhiệt đáng kể và yêu cầu hệ thống làm mát để duy trì nhiệt độ hoạt động tối ưu. Nước thường được sử dụng làm chất làm mát, trực tiếp hoặc gián tiếp thông qua các tháp giải nhiệt.
  • Cường Độ Nước của Lưới Điện: Cường độ nước của lưới điện đề cập đến lượng nước cần thiết để tạo ra một đơn vị điện. Lưới điện phụ thuộc nhiều vào các nhà máy điện nhiệt, sử dụng nước để làm mát, có cường độ nước cao hơn.
  • Vị Trí Trung Tâm Dữ Liệu: Các trung tâm dữ liệu nằm ở các khu vực khô cằn hoặc các khu vực có vấn đề khan hiếm nước có thể làm trầm trọng thêm tác động môi trường của AI.

Phát Thải Carbon

Phát thải carbon là động lực chính của biến đổi khí hậu. Nghiên cứu tính toán lượng khí thải carbon dựa trên mức tiêu thụ năng lượng của các mô hình AI và cường độ carbon của lưới điện khu vực. Cường độ carbon đề cập đến lượng carbon dioxide thải ra trên mỗi đơn vị điện được tạo ra.

Các Yếu Tố Ảnh Hưởng Đến Phát Thải Carbon:

  • Nguồn Năng Lượng: Loại năng lượng được sử dụng để cung cấp năng lượng cho các trung tâm dữ liệu có tác động đáng kể đến lượng khí thải carbon. Các nguồn năng lượng tái tạo, chẳng hạn như năng lượng mặt trời và năng lượng gió, có cường độ carbon thấp hơn nhiều so với nhiên liệu hóa thạch như than đá và khí đốt tự nhiên.
  • Cường Độ Carbon của Lưới Điện: Cường độ carbon của lưới điện thay đổi tùy thuộc vào sự kết hợp của các nguồn năng lượng được sử dụng để tạo ra điện. Các khu vực có tỷ lệ nguồn năng lượng tái tạo cao hơn có cường độ carbon thấp hơn.
  • Hiệu Quả Năng Lượng: Giảm tiêu thụ năng lượng là cách hiệu quả nhất để giảm lượng khí thải carbon.

Ý Nghĩa và Khuyến Nghị

Các phát hiện của nghiên cứu có ý nghĩa quan trọng đối với các nhà phát triển AI, các nhà hoạch định chính sách và người dùng cuối. Tác động môi trường của AI không phải là không đáng kể và cần được xem xét cẩn thận khi công nghệ AI tiếp tục phát triển và lan rộng.

Khuyến Nghị cho Các Nhà Phát Triển AI:

  • Ưu Tiên Hiệu Quả Năng Lượng: Các nhà phát triển AI nên ưu tiên hiệu quả năng lượng khi thiết kế và đào tạo các mô hình AI. Điều này bao gồm việc sử dụng các mô hình nhỏ hơn, tối ưu hóa mã và tận dụng phần cứng hiệu quả.
  • Khám Phá Các Nguồn Năng Lượng Tái Tạo: Các công ty AI nên khám phá các cơ hội để cung cấp năng lượng cho các trung tâm dữ liệu của họ bằng các nguồn năng lượng tái tạo. Điều này có thể làm giảm đáng kể dấu chân carbon của AI.
  • Đầu Tư vào Bảo Tồn Nước: Các trung tâm dữ liệu nên đầu tư vào các công nghệ bảo tồn nước để giảm thiểu việc sử dụng nước. Điều này bao gồm việc sử dụng hệ thống làm mát vòng kín và thu gom nước mưa.
  • Tính Minh Bạch và Báo Cáo: Các công ty AI nên minh bạch về tác động môi trường của mô hình của họ và báo cáo các số liệu chính như tiêu thụ năng lượng, sử dụng nước và phát thải carbon.

Khuyến Nghị cho Các Nhà Hoạch Định Chính Sách:

  • Khuyến Khích AI Xanh: Các nhà hoạch định chính sách nên khuyến khích sự phát triển và triển khai các công nghệ AI xanh thông qua tín dụng thuế, trợ cấp và các ưu đãi khác.
  • Điều Chỉnh Mức Tiêu Thụ Năng Lượng của Trung Tâm Dữ Liệu: Các nhà hoạch định chính sách nên điều chỉnh mức tiêu thụ năng lượng của trung tâm dữ liệu để đảm bảo rằng các trung tâm dữ liệu đang hoạt động hiệu quả nhất có thể.
  • Thúc Đẩy Việc Áp Dụng Năng Lượng Tái Tạo: Các nhà hoạch định chính sách nên thúc đẩy việc áp dụng các nguồn năng lượng tái tạo để giảm cường độ carbon của lưới điện.
  • Hỗ Trợ Nghiên Cứu và Phát Triển: Các nhà hoạch định chính sách nên hỗ trợ nghiên cứu và phát triển các công nghệ mới có thể làm giảm tác động môi trường của AI.

Khuyến Nghị cho Người Dùng Cuối:

  • Hãy Chú Ý Đến Việc Sử Dụng AI: Người dùng cuối nên chú ý đến việc sử dụng AI của họ và tránh các truy vấn không cần thiết hoặc phù phiếm.
  • Chọn Các Mô Hình AI Thân Thiện Với Môi Trường: Khi có thể, người dùng cuối nên chọn các mô hình AI được biết là tiết kiệm năng lượng hơn.
  • Hỗ Trợ Các Thực Hành AI Bền Vững: Người dùng cuối có thể hỗ trợ các thực hành AI bền vững bằng cách chọn các sản phẩm và dịch vụ AI từ các công ty cam kết trách nhiệm với môi trường.

Hướng Nghiên Cứu Trong Tương Lai

Nghiên cứu nhấn mạnh sự cần thiết phải nghiên cứu thêm về tác động môi trường của AI. Nghiên cứu trong tương lai nên tập trung vào các lĩnh vực sau:

  • Đánh Giá Vòng Đời: Thực hiện đánh giá vòng đời toàn diện về các mô hình AI, từ phát triển đến thải bỏ, để xác định tất cả các tác động môi trường tiềm năng.
  • Tác Động của Đào Tạo: Điều tra tác động môi trường của việc đào tạo các mô hình AI, có thể cao hơn đáng kể so với tác động của suy luận.
  • Tác Động của AI trong Các Lĩnh Vực Khác: Kiểm tra tác động của AI trong các lĩnh vực khác của nền kinh tế, chẳng hạn như vận tải và sản xuất, để hiểu những hậu quả môi trường tổng thể của việc áp dụng AI.
  • Phát Triển Các Số Liệu Mới: Phát triển các số liệu mới để đánh giá tác động môi trường của AI, chẳng hạn như các số liệu tính đến năng lượng và vật liệu chứa trong phần cứng AI.

Kết Luận

Tác động môi trường của LLMs là một vấn đề phức tạp và nhiều mặt đòi hỏi sự xem xét cẩn thận. Các phát hiện của nghiên cứu này cung cấp những hiểu biết có giá trị về chi phí năng lượng, nước và carbon liên quan đến các công cụ AI phổ biến. Bằng cách hiểu những chi phí này, các nhà phát triển AI, các nhà hoạch định chính sách và người dùng cuối có thể thực hiện các bước để giảm thiểu dấu chân môi trường của AI và đảm bảo rằng công nghệ AI được phát triển và triển khai một cách bền vững. Khi AI ngày càng tích hợp vào cuộc sống của chúng ta, điều quan trọng là phải ưu tiên tính bền vững và cùng nhau tạo ra một tương lai nơi AI mang lại lợi ích cho xã hội mà không gây hại cho môi trường.