Fajar Kilang AI: Keniscayaan 12,000 Tahun

Dalam bidang kecerdasan buatan (AI), konteks memerintah dengan mutlak. Prinsip ini mencerminkan kecerdasan manusia, yang menunjukkan kerelevanannya kepada AI, memandangkan penciptaan kita terhadapnya dalam imej kita sendiri.

Pada masa ini, kita melihat syarikat seperti NVIDIA memperjuangkan kilang AI – pada dasarnya, superkomputer yang memproses petabait data untuk menyampaikan respons yang cerdas – sebagai cara baru untuk memangkin perubahan ketara dalam ekonomi dan budaya global.

Tetapi bagaimana kita sampai ke tahap ini? Jawapannya, seperti biasa, terletak pada satu siri kemajuan berperingkat.

Sebelum menyelidiki butiran khusus kilang AI dan implikasinya untuk masa depan perniagaan dan masyarakat, mari kita tetapkan beberapa konteks asas.

Revolusi Neolitik: Menyemai Benih Inovasi

Kira-kira 12,000 tahun lalu, nenek moyang kita beralih daripada nomad pemburu-pengumpul kepada petani menetap, menanam tumbuhan dan menternak haiwan untuk sara hidup. Pertanian, atau perladangan, mewakili kilang makanan asas, bergantung pada cahaya matahari, air dan udara untuk pertumbuhan tumbuhan dan haiwan. Istilah ‘firma’, yang menandakan pembayaran sewa tetap untuk penanaman tanah pada zaman pertengahan, menjadi sinonim dengan pertanian.

Pertanian memerlukan struktur sosial hierarki untuk operasi perladangan yang cekap. Penulisan muncul sebagai alat pentadbiran, memudahkan penjejakan input dan output dalam kilang makanan ini dan mewujudkan peraturan masyarakat. Lama kelamaan, penulisan berkembang untuk merangkumi pelbagai domain dan kekal sebagai cara yang ampuh untuk menyampaikan maklumat yang kompleks.

Dari saat kita menukar busur dan tombak untuk cangkul, garu dan bajak, dan menulis glif simbolik pertama dalam tanah liat atau batu, kemunculan AI, dan seterusnya, kilang AI, menjadi tidak dapat dielakkan. Ia hanyalah soal masa.

Revolusi Perindustrian: Membentuk Laluan ke Pengeluaran Besar-Besaran

Selama beribu tahun, manusia mengasah kemahiran pertanian mereka, menghasilkan lebihan yang memupuk kemunculan kelas pedagang – individu yang terlibat dalam membuat barangan untuk orang lain, atau ‘pembuatan’, yang berasal dari bahasa Latin ‘kerja dengan tangan’. Ini membawa kepada pembangunan wang, medium pertukaran yang mempercepatkan barter dan mengubahnya menjadi ekonomi moden. Globalisasi menghubungkan ekonomi serantau dan nasional berikutan Zaman Penerokaan.

Gelombang globalisasi seterusnya membentuk semula pertanian dan pembuatan. Anjakan penting dalam kilang, pusat gempa pembuatan standard, melibatkan pembahagian proses pengeluaran kepada langkah-langkah diskret untuk meningkatkan kelajuan dan kebolehulangan. Revolusi Perindustrian ini bertepatan dengan Pencerahan, yang dicirikan oleh kadar celik huruf yang melambung tinggi kerana kilang memerlukan pekerja yang berpendidikan untuk memaksimumkan kecekapan dan meminimumkan pembaziran. Pendidikan menjadi satu keperluan, memupuk pengiktirafan hak, hak harta persendirian, kebebasan beragama, keselamatan, ucapan dan hak untuk perbicaraan yang cepat.

Prinsip-prinsip ini, terbukti dengan sendirinya pada abad ke-21, berhutang genesisnya kepada abad ke-18.

Kilang membawa pembuatan ke dalam rumah, menggunakan wap dan elektrik untuk menggerakkan barisan pemasangan dan teknik pembuatan yang ramping. Ini membolehkan pengeluaran barangan pada harga yang berpatutan, meningkatkan taraf hidup dan memupuk pertumbuhan kelas menengah, mendorong pengembangan ekonomi melebihi keupayaan masyarakat pertanian.

Revolusi AI: Data sebagai Sempadan Baru

Kemunculan Internet menghubungkan individu dan menjana sumber baharu: data, sedia untuk analisis yang berwawasan.

Revolusi AI bergantung pada pendigitalan sejumlah besar teks, imej, video dan audio, ditambah pula dengan kuasa pengkomputeran yang berpatutan untuk memproses data ini. Data besar, apabila digabungkan dengan GPU selari besar-besaran dan lebar jalur memori yang tinggi, membolehkan penciptaan rangkaian saraf yang mengekod pemahaman kita tentang dunia, dengan itu membolehkan kecerdasan buatan.

Pada dasarnya, data besar menyediakan bahan mentah untuk algoritma AI yang berjalan pada enjin GPU untuk membina rangkaian saraf berfungsi.

Elemen-elemen ini mesti berkumpul serentak. Pada tahun 1980-an, penyelidik memiliki algoritma rangkaian saraf tetapi kekurangan sumber pengkomputeran dan data untuk melaksanakannya. Akibatnya, AI kekal sebahagian besarnya bersifat teori sehingga ketiga-tiga syarat ini dipenuhi.

Kilang AI: Transformasi Literal

Istilah ‘kilang AI’ bukan sekadar metafora tetapi penerangan yang tepat tentang superkomputer AI moden yang beroperasi dalam persekitaran komersial. Ia secara asasnya mengubah pengkomputeran korporat dan analisis data – sintesis data kepada maklumat yang boleh diambil tindakan.

Kilang AI adalah tidak dapat dielakkan seperti revolusi pertanian, di mana usaha kolektif memastikan pengeluaran makanan. Perubahan sosial dan budaya yang terhasil daripada revolusi ini memberikan masa lapang kepada manusia untuk renungan dan inovasi. Kini, mesin boleh mengakses dan memproses keseluruhan pengetahuan manusia, membolehkan carian perbualan dan aplikasi terbalik algoritma AI untuk menjana data baharu dalam pelbagai format.

Perniagaan dan individu akan mempunyai akses kepada kilang AI, sama ada secara langsung atau melalui pengaturan perkongsian masa. Kilang AI ini akan menjana idea, visi baharu dan memperkuatkan keupayaan kreatif individu.

Potensi transformatif kilang AI adalah merangkumi segala-galanya. Chatbot, pembangun enjin pengiraan selari untuk latihan dan inferens model, dan pencipta model seperti OpenAI, Anthropic, Google dan Mistral bersetuju bahawa AI akan membentuk semula setiap aspek kehidupan kita. Walaupun terdapat perselisihan faham global mengenai pelbagai isu, kesan transformatif AI diiktiraf secara universal.

Wawasan dan Tindakan Pembuatan

Kilang AI mempunyai dua fungsi utama. Yang pertama ialah melatih model asas, menghasilkan pandangan untuk perniagaan dan peningkatan peribadi. Fungsi kedua, dan lebih penting, melibatkan memasukkan data dan soalan baharu ke dalam model ini untuk membuat kesimpulan jawapan baharu, menjana token baharu dan mendorong tindakan.

Sebahagian besar perbincangan mengenai AI telah tertumpu pada melatih model asas yang sentiasa berkembang, yang menawarkan beratus-ratus bilion hingga trilion parameter dan set data yang besar. Kiraan token menunjukkan keluasan pengetahuan, manakala parameter mencerminkan kedalaman pemahaman. Kiraan parameter yang lebih kecil dipadankan dengan set token yang lebih besar menghasilkan jawapan yang lebih cepat dan ringkas. Sebaliknya, kiraan parameter yang lebih besar dan set token yang lebih kecil memberikan pandangan yang lebih bernuansa ke dalam domain yang terhad. Model penaakulan rantai pemikiran, yang bersifat multimodal, menggabungkan model khusus untuk mempertimbangkan output yang mendorong input lain, menjana jawapan yang komprehensif.

Kilang AI menggunakan semua kandungan yang dicipta oleh manusia dan data sintetik yang dijana oleh model AI sebagai bahan mentah. Wawasan yang diperoleh daripada data ini digunakan oleh manusia dan ejen AI untuk mendorong tindakan. Daripada bekerja di kilang, individu memanfaatkannya, menambah kemahiran mereka dengan pengetahuan dan kelajuan model AI untuk mencapai hasil yang lebih banyak, lebih baik dan lebih pantas.

Menurut Jensen Huang, pengasas bersama dan Ketua Pegawai Eksekutif NVIDIA, ‘Dunia sedang berlumba-lumba untuk membina kilang AI berskala besar yang canggih.’ Menubuhkan kilang AI ialah pencapaian kejuruteraan yang luar biasa, memerlukan sumber, tenaga kerja dan bahan yang besar.

Membina kilang AI memerlukan pelaburan modal yang ketara. Konfigurasi tipikal terdiri daripada NVIDIA DGX SuperPOD berdasarkan berbilang rak sistem DGX, yang menampilkan GPU, CPU, interkoneksi berkelajuan tinggi dan storan.

Dengan banyak sistem DGX, SuperPOD memberikan prestasi yang ketara, menawarkan kapasiti dan lebar jalur memori yang besar. Prestasi boleh ditingkatkan dengan menambahkan lebih banyak sistem.

Rangka tindakan NVIDIA yang lain untuk kilang AI berpusat pada platform NVIDIA GB200 NVL72, sistem skala rak yang menyepadukan GPU, CPU, DPU, SuperNIC, NVLink dan NVSwitch, dan rangkaian berkelajuan tinggi. Platform ini menawarkan domain memori GPU berkongsi yang lebih besar untuk model AI dan ketumpatan pengiraan yang lebih tinggi, yang memerlukan penyejukan cecair.

GB200 NVL72, yang dihantar dalam volum penuh, mewakili sistem kendiri yang mampu membina model dan menjana data dalam pelbagai format.

GB200 NVL72 terdiri daripada nod pelayan MGX yang menampilkan CPU NVIDIA Grace yang dipadankan dengan GPU Blackwell. Dua daripada nod pelayan ini membentuk dulang pengiraan dalam rak NVL72, dengan lapan belas dulang pengiraan menempatkan banyak GPU dan CPU.

Sistem skala rak GB200 NVL72 menggabungkan CPU Grace dengan GPU Blackwell, yang saling bersambung melalui sambungan NVLink berkelajuan tinggi. Port NVLink dan cip NVSwitch menghubungkan semua GPU dalam konfigurasi memori kongsi, sesuai untuk latihan model asas dan inferens rantai pemikiran.

Fabrik NVLink, yang difasilitasi oleh sembilan dulang suis NVLink, membolehkan akses kepada semua dies GPU sebagai GPU bersatu untuk aplikasi AI.

Sistem GB200 NVL72 menampilkan banyak teras Arm untuk pemprosesan hos dan kuasa pemprosesan titik terapung yang besar. Sistem GB200 NVL72 menawarkan memori HBM3e yang ketara yang dilampirkan pada GPU, dengan lebar jalur agregat yang tinggi. CPU Grace menampilkan memori LPDDR5X, boleh diakses melalui NVLink.

NVIDIA GB200 NVL72 mencerminkan kesan transformatif System/360 pada pemprosesan transaksi dalam talian, perbezaan utama ialah kebolehskalaan NVL72 melalui interkoneksi InfiniBand.

Konfigurasi DGX SuperPOD berdasarkan sistem skala rak NVL72 memerlukan kuasa yang besar tetapi memberikan kuasa pengkomputeran dan kapasiti memori yang besar merentasi berbilang rak pengiraan. Prestasi boleh ditingkatkan dengan menambahkan lebih banyak rak.

Ketumpatan pengiraan rak NVL72 memerlukan penyejukan cecair khusus dan infrastruktur pusat data, yang mewakili kembali kepada amalan lalu di mana mesin yang disejukkan air memaksimumkan prestasi.

Kilang AI akan memerlukan kuasa pengkomputeran yang jauh lebih banyak kerana inferens menjadi penting kepada pelbagai aplikasi, terutamanya dengan peralihan ke arah model penaakulan rantai pemikiran.

KilangAI merangkumi bukan sahaja perkakasan tetapi juga sistem dan perisian pembangunan.

Sistem DGX GB200 dan superkomputer AI DGX SuperPOD memerlukan pengurusan dan pemodelan, yang difasilitasi oleh alatan seperti NVIDIA Mission Control, yang menyusun beban kerja AI dan memulihkan pekerjaan secara automatik. Mission Control memantau kesihatan sistem dan mengoptimumkan penggunaan kuasa.

NVIDIA AI Enterprise, suite perisian sistem, termasuk perpustakaan, model dan rangka kerja yang dioptimumkan untuk GPU dan rangkaian NVIDIA. Tindanan kilang AI juga menampilkan NVIDIA Dynamo, rangka kerja sumber terbuka untuk menjalankan inferens merentasi infrastruktur NVLink dan DGX SuperPOD. DGX Expert Service and Support membantu pelanggan dalam melaksanakan teknologi ini, mengurangkan masa kepada token pertama. NVIDIA menawarkan rangka tindakan kilang AI untuk persekitaran ‘kembar digital’ Omniversenya untuk mensimulasikan dan mengoptimumkan reka bentuk pusat data.

Aspek penting kilang AI ialah perubahan dalam pemikiran yang mereka hasilkan, dengan NVIDIA mengutamakan ruang kepala untuk pertumbuhan sistem.

Menurut Gilad Shainer, naib presiden kanan rangkaian di NVIDIA, ‘Menjana token kini sama dengan menjana pendapatan untuk banyak syarikat.’ Pusat data berkembang daripada pusat kos kepada aset produktif.

Dan itu, akhirnya, adalah intipati membina kilang.