Jejak Alam Sekitar Model Bahasa Besar

Perlumbaan tanpa henti dalam inovasi kecerdasan buatan (AI) telah membawa kepada pembangunan model bahasa besar (LLM) yang semakin canggih. Walaupun model-model ini mempamerkan kemampuan yang mengagumkan dalam pelbagai bidang, kesan alam sekitar yang berkaitan dengan latihan dan penggunaan mereka sebahagian besarnya kekal tersembunyi. Syarikat-syarikat yang membangunkan model AI bersedia berkongsi data prestasi pada penanda aras, tetapi cenderung untuk mengelakkan impak alam sekitar. Penyelidikan baru-baru ini memberi penerangan tentang kos tenaga, air, dan karbon yang sering diabaikan yang berkaitan dengan alat AI yang berkuasa ini.

Penanda Aras Baharu untuk Menilai Impak Alam Sekitar

Dalam usaha untuk mengukur impak alam sekitar AI, satu pasukan penyelidik dari University of Rhode Island, Providence College, dan University of Tunis telah memperkenalkan penanda aras yang menyedari infrastruktur untuk inferens AI. Kajian ini, yang tersedia di pelayan pracetak Universiti Cornell, arXiv, menawarkan penilaian yang lebih tepat tentang kesan ekologi AI. Penanda aras menggabungkan data kependaman API awam dengan maklumat tentang GPU asas dan komposisi grid kuasa serantau untuk mengira jejak alam sekitar bagi setiap gesaan untuk 30 model AI arus perdana. Pendekatan komprehensif ini mempertimbangkan penggunaan tenaga, penggunaan air, dan pelepasan karbon, yang memuncak dalam skor "kecekapan eko".

Abdeltawab Hendawi, penolong profesor di University of Rhode Island, menjelaskan motivasi di sebalik kajian itu: "Kami mula berfikir tentang membandingkan model-model ini dari segi sumber alam sekitar, air, tenaga, dan jejak karbon." Penemuan itu mendedahkan perbezaan yang ketara dalam impak alam sekitar model AI yang berbeza.

Perbezaan dalam Penggunaan Tenaga: OpenAI, DeepSeek, dan Anthropic

Kajian itu menyoroti perbezaan besar dalam penggunaan tenaga antara model AI terkemuka. Model o3 OpenAI dan model penaakulan utama DeepSeek menggunakan lebih daripada 33 jam watt (Wh) untuk satu respons yang panjang. Ini sangat berbeza dengan GPT-4.1 nano OpenAI yang lebih kecil, yang memerlukan tenaga 70 kali ganda lebih rendah. Claude-3.7 Sonnet Anthropic muncul sebagai model paling cekap eko dalam kajian itu.

Para penyelidik menekankan peranan penting perkakasan dalam menentukan impak alam sekitar model AI. Sebagai contoh, GPT-4o mini, yang menggunakan GPU A100 yang lebih lama, menggunakan lebih banyak tenaga setiap pertanyaan daripada GPT-4o yang lebih besar, yang beroperasi pada cip H100 yang lebih maju. Ini menggariskan kepentingan memanfaatkan perkakasan yang canggih untuk meminimumkan jejak alam sekitar AI.

Kesan Alam Sekitar Panjang Pertanyaan

Kajian itu mendedahkan korelasi langsung antara panjang pertanyaan dan impak alam sekitar. Pertanyaan yang lebih panjang semestinya membawa kepada penggunaan sumber yang lebih besar. Malah gesaan pendek yang nampaknya tidak penting menyumbang kepada beban alam sekitar keseluruhan. Satu gesaan GPT-4o ringkas menggunakan kira-kira 0.43 Wh tenaga. Para penyelidik menganggarkan bahawa pada OpenAI yang diunjurkan 700 juta panggilan GPT-4o setiap hari, jumlah penggunaan tenaga tahunan boleh berkisar antara 392 hingga 463 gigawatt-jam (GWh). Untuk meletakkan ini dalam perspektif, itu tenaga yang mencukupi untuk memberi kuasa kepada antara 35,000 buah rumah tangga Amerika setiap tahun.

Impak Kumulatif Penggunaan AI

Kajian itu menekankan bahawa penggunaan AI oleh pengguna individu boleh dengan cepat meningkat menjadi kos alam sekitar yang besar. Nidhal Jegham, seorang penyelidik di University of Rhode Island dan pengarang utama kajian itu, menjelaskan bahawa "Menggunakan ChatGPT-4o setiap tahun menggunakan air yang sama seperti keperluan minum 1.2 juta orang setiap tahun." Jegham memberi amaran bahawa walaupun impak alam sekitar satu mesej atau gesaan kelihatan kecil, "apabila anda meningkatkannya, terutamanya sejauh mana AI berkembang di seluruh indeks, ia benar-benar menjadi isu yang semakin meningkat."

Menyelami Lebih Dalam Metrik Impak Alam Sekitar

Untuk menghargai sepenuhnya implikasi penemuan kajian ini, pemeriksaan yang lebih terperinci tentang metrik alam sekitar yang digunakan untuk menilai model AI adalah penting. Bahagian berikut memberikan pecahan metrik utama:

Penggunaan Tenaga

Penggunaan tenaga ialah ukuran asas kuasa elektrik yang diperlukan untuk mengendalikan model AI. Kajian itu mengukur penggunaan tenaga dalam jam watt (Wh) setiap pertanyaan, yang membolehkan perbandingan langsung kecekapan tenaga model yang berbeza. Meminimumkan penggunaan tenaga adalah penting untuk mengurangkan jejak karbon dan impak alam sekitar keseluruhan AI.

Faktor-faktor yang Mempengaruhi Penggunaan Tenaga:

  • Saiz dan Kerumitan Model: Model yang lebih besar dan lebih kompleks biasanya memerlukan lebih banyak tenaga untuk beroperasi daripada model yang lebih kecil dan lebih ringkas.
  • Kecekapan Perkakasan: GPU dan komponen perkakasan lain yang digunakan untuk menjalankan model AI memainkan peranan penting dalam penggunaan tenaga. Perkakasan yang lebih maju dan cekap tenaga boleh mengurangkan jejak tenaga AI dengan ketara.
  • Panjang dan Kerumitan Pertanyaan: Pertanyaan yang lebih panjang dan lebih kompleks secara amnya memerlukan lebih banyak sumber pengkomputeran dan dengan itu menggunakan lebih banyak tenaga.
  • Teknik Pengoptimuman: Pelbagai teknik pengoptimuman, seperti pemampatan model dan kuantisasi, boleh mengurangkan penggunaan tenaga model AI tanpa mengorbankan ketepatan.

Penggunaan Air

Penggunaan air ialah aspek impak alam sekitar AI yang sering diabaikan. Pusat data, yang menempatkan pelayan yang menjalankan model AI, memerlukan sejumlah besar air untuk penyejukan. Kajian itu menganggarkan penggunaan air berdasarkan penggunaan tenaga pusat data dan keamatan air grid kuasa serantau yang membekalkan elektrik ke pusat data tersebut.

Faktor-faktor yang Mempengaruhi Penggunaan Air:

  • Keperluan Penyejukan: Pusat data menjana haba yang ketara dan memerlukan sistem penyejukan untuk mengekalkan suhu operasi yang optimum. Air sering digunakan sebagai penyejuk, sama ada secara langsung atau tidak langsung melalui menara penyejuk.
  • Keamatan Air Grid Kuasa: Keamatan air grid kuasa merujuk kepada jumlah air yang diperlukan untuk menjana satu unit elektrik. Grid kuasa yang sangat bergantung pada loji kuasa termoelektrik, yang menggunakan air untuk penyejukan, mempunyai keamatan air yang lebih tinggi.
  • Lokasi Pusat Data: Pusat data yang terletak di kawasan gersang atau kawasan dengan isu kekurangan air boleh memburukkan lagi impak alam sekitar AI.

Pelepasan Karbon

Pelepasan karbon ialah pemacu utama perubahan iklim. Kajian itu mengira pelepasan karbon berdasarkan penggunaan tenaga model AI dan keamatan karbon grid kuasa serantau. Keamatan karbon merujuk kepada jumlah karbon dioksida yang dikeluarkan setiap unit elektrik yang dijana.

Faktor-faktor yang Mempengaruhi Pelepasan Karbon:

  • Sumber Tenaga: Jenis tenaga yang digunakan untuk memberi kuasa kepada pusat data mempunyai impak yang ketara terhadap pelepasan karbon. Sumber tenaga boleh diperbaharui, seperti tenaga solar dan angin, mempunyai keamatan karbon yang jauh lebih rendah daripada bahan api fosil seperti arang batu dan gas asli.
  • Keamatan Karbon Grid Kuasa: Keamatan karbon grid kuasa berbeza-beza bergantung pada campuran sumber tenaga yang digunakan untuk menjana elektrik. Kawasan dengan perkadaran sumber tenaga boleh diperbaharui yang lebih tinggi mempunyai keamatan karbon yang lebih rendah.
  • Kecekapan Tenaga: Mengurangkan penggunaan tenaga ialah cara paling berkesan untuk menurunkan pelepasan karbon.

Implikasi dan Cadangan

Penemuan kajian itu mempunyai implikasi yang ketara untuk pembangun AI, penggubal dasar, dan pengguna akhir. Impak alam sekitar AI tidak boleh diabaikan dan perlu dipertimbangkan dengan teliti kerana teknologi AI terus maju dan berkembang biak.

Cadangan untuk Pembangun AI:

  • Utamakan Kecekapan Tenaga: Pembangun AI harus mengutamakan kecekapan tenaga apabila mereka bentuk dan melatih model AI. Ini termasuk menggunakan model yang lebih kecil, mengoptimumkan kod, dan memanfaatkan perkakasan yang cekap.
  • Terokai Sumber Tenaga Boleh Diperbaharui: Syarikat AI harus meneroka peluang untuk memberi kuasa kepada pusat data mereka dengan sumber tenaga boleh diperbaharui. Ini boleh mengurangkan jejak karbon AI dengan ketara.
  • Melabur dalam Pemuliharaan Air: Pusat data harus melabur dalam teknologi pemuliharaan air untuk meminimumkan penggunaan air. Ini termasuk menggunakan sistem penyejukan gelung tertutup dan penuaian air hujan.
  • Ketelusan dan Pelaporan: Syarikat AI harus telus tentang impak alam sekitar model mereka dan melaporkan metrik utama seperti penggunaan tenaga, penggunaan air, dan pelepasan karbon.

Cadangan untuk Penggubal Dasar:

  • Memberi Insentif kepada AI Hijau: Penggubal dasar harus memberi insentif kepada pembangunan dan penggunaan teknologi AI hijau melalui kredit cukai, subsidi, dan insentif lain.
  • Mengawal Selia Penggunaan Tenaga Pusat Data: Penggubal dasar harus mengawal selia penggunaan tenaga pusat data untuk memastikan bahawa pusat data beroperasi secekap mungkin.
  • Menggalakkan Penggunaan Tenaga Boleh Diperbaharui: Penggubal dasar harus menggalakkan penggunaan sumber tenaga boleh diperbaharui untuk mengurangkan keamatan karbon grid kuasa.
  • Menyokong Penyelidikan dan Pembangunan: Penggubal dasar harus menyokong penyelidikan dan pembangunan ke dalam teknologi baharu yang boleh mengurangkan impak alam sekitar AI.

Cadangan untuk Pengguna Akhir:

  • Berhati-hati dengan Penggunaan AI: Pengguna akhir harus berhati-hati dengan penggunaan AI mereka dan mengelakkan pertanyaan yang tidak perlu atau remeh.
  • Pilih Model AI Mesra Alam: Apabila mungkin, pengguna akhir harus memilih model AI yang diketahui lebih cekap tenaga.
  • Menyokong Amalan AI Mampan: Pengguna akhir boleh menyokong amalan AI mampan dengan memilih produk dan perkhidmatan AI daripada syarikat yang komited terhadap tanggungjawab alam sekitar.

Hala Tuju Penyelidikan Masa Depan

Kajian itu menyoroti keperluan untuk penyelidikan lanjut mengenai impak alam sekitar AI. Penyelidikan masa depan harus memberi tumpuan kepada bidang berikut:

  • Penilaian Kitaran Hayat: Menjalankan penilaian kitaran hayat yang komprehensif terhadap model AI, daripada pembangunan hingga pelupusan, untuk mengenal pasti semua potensi impak alam sekitar.
  • Impak Latihan: Menyiasat impak alam sekitar latihan