Fajar Pabrik AI: Keniscayaan 12.000 Tahun

Dalam bidang kecerdasan buatan (AI), konteks memegang peranan yang sangat penting. Prinsip ini mencerminkan kecerdasan manusia, yang menunjukkan relevansinya dengan AI, mengingat penciptaan AI oleh kita yang menyerupai diri kita sendiri.

Saat ini, kita melihat perusahaan seperti NVIDIA yang mendukung pabrik AI – pada dasarnya, superkomputer yang memproses petabyte data untuk memberikan respons cerdas – sebagai cara baru untuk mengkatalisasi perubahan signifikan dalam ekonomi dan budaya global.

Namun, bagaimana kita sampai pada titik ini? Jawabannya, seperti biasa, terletak pada serangkaian kemajuan bertahap.

Sebelum membahas spesifik pabrik AI dan implikasinya bagi masa depan bisnis dan masyarakat, mari kita tetapkan beberapa konteks dasar.

Revolusi Neolitikum: Menabur Benih Inovasi

Sekitar 12.000 tahun yang lalu, nenek moyang kita beralih dari pemburu-pengumpul nomaden menjadi petani menetap, membudidayakan tanaman dan memelihara hewan untuk makanan. Pertanian, atau bercocok tanam, merupakan pabrik makanan dasar, yang mengandalkan sinar matahari, air, dan udara untuk pertumbuhan tanaman dan hewan. Istilah “firma,” yang menunjukkan pembayaran sewa tetap untuk budidaya tanah di zaman abad pertengahan, menjadi identik dengan pertanian.

Pertanian membutuhkan struktur sosial hierarkis untuk operasi pertanian yang efisien. Tulisan muncul sebagai alat administratif, memfasilitasi pelacakan input dan output di dalam pabrik makanan ini dan menetapkan aturan masyarakat. Seiring waktu, tulisan berkembang untuk mencakup beragam domain dan tetap menjadi sarana yang ampuh untuk menyampaikan informasi yang kompleks.

Sejak saat kita menukar busur dan tombak dengan cangkul, garu, dan bajak, dan menuliskan glyph simbolis pertama di tanah liat atau batu, munculnya AI, dan akibatnya, pabrik AI, menjadi tak terhindarkan. Itu hanyalah masalah waktu.

Revolusi Industri: Membangun Jalan Menuju Produksi Massal

Selama ribuan tahun, umat manusia mengasah keterampilan pertaniannya, menghasilkan surplus yang mendorong munculnya kelas pedagang – individu yang terlibat dalam membuat barang untuk orang lain, atau “manufaktur,” yang berasal dari bahasa Latin “sebuah karya dengan tangan.” Ini menyebabkan pengembangan uang, media pertukaran yang mempercepat barter dan mengubahnya menjadi ekonomi modern. Globalisasi menghubungkan ekonomi regional dan nasional setelah Era Penjelajahan.

Gelombang globalisasi berikutnya membentuk kembali pertanian dan manufaktur. Pergeseran penting di pabrik, pusat dari manufaktur standar, melibatkan pembagian proses produksi menjadi langkah-langkah diskrit untuk meningkatkan kecepatan dan pengulangan. Revolusi Industri ini bertepatan dengan Pencerahan, yang ditandai dengan meningkatnya angka melek huruf karena pabrik membutuhkan pekerja terdidik untuk memaksimalkan efisiensi dan meminimalkan limbah. Pendidikan menjadi kebutuhan, mendorong pengakuan hak pilih, hak milik pribadi, kebebasan beragama, keselamatan, berbicara, dan hak untuk pengadilan yang cepat.

Prinsip-prinsip ini, yang jelas dengan sendirinya di abad ke-21, berutang asal-usulnya pada abad ke-18.

Pabrik membawa manufaktur ke dalam ruangan, menggunakan uap dan listrik untuk menggerakkan jalur perakitan dan teknik manufaktur ramping. Ini memungkinkan produksi barang dengan harga terjangkau, meningkatkan standar hidup dan mendorong pertumbuhan kelas menengah, mendorong ekspansi ekonomi di luar kemampuan masyarakat pertanian.

Revolusi AI: Data Sebagai Batas Baru

Munculnya Internet menghubungkan individu dan menghasilkan sumber daya baru: data, yang matang untuk analisis mendalam.

Revolusi AI bergantung pada digitalisasi sejumlah besar teks, gambar, video, dan audio, ditambah dengan daya komputasi yang terjangkau untuk memproses data ini. Data besar, ketika dikombinasikan dengan GPU paralel besar-besaran dan bandwidth memori tinggi, memungkinkan pembuatan jaringan saraf yang menyandikan pemahaman kita tentang dunia, sehingga memungkinkan kecerdasan buatan.

Pada dasarnya, data besar menyediakan bahan mentah untuk algoritma AI yang berjalan pada mesin GPU untuk membangun jaringan saraf fungsional.

Elemen-elemen ini harus menyatu secara bersamaan. Pada 1980-an, para peneliti memiliki algoritma jaringan saraf tetapi kekurangan sumber daya komputasi dan data untuk menerapkannya. Akibatnya, AI sebagian besar tetap teoritis sampai ketiga kondisi ini terpenuhi.

Pabrik AI: Transformasi Literal

Istilah “pabrik AI” bukan sekadar metafora tetapi deskriptor yang tepat dari superkomputer AI modern yang beroperasi dalam lingkungan komersial. Ini secara fundamental mengubah komputasi perusahaan dan analisis data – sintesis data menjadi informasi yang dapat ditindaklanjuti.

Pabrik AI sama tak terhindarkannya dengan revolusi pertanian, di mana upaya kolektif memastikan produksi pangan. Pergeseran sosial dan budaya yang dihasilkan dari revolusi ini memberi umat manusia waktu luang untuk perenungan dan inovasi. Sekarang, mesin dapat mengakses dan memproses seluruh pengetahuan manusia, memungkinkan pencarian percakapan dan penerapan terbalik algoritma AI untuk menghasilkan data baru dalam berbagai format.

Bisnis dan individu akan memiliki akses ke pabrik AI, baik secara langsung atau melalui pengaturan berbagi waktu. Pabrik AI ini akan menghasilkan ide, visi baru, dan memperkuat kemampuan kreatif individu.

Potensi transformatif pabrik AI mencakup segalanya. Chatbot, pengembang mesin komputasi paralel untuk pelatihan dan inferensi model, dan pembuat model seperti OpenAI, Anthropic, Google, dan Mistral setuju bahwa AI akan membentuk kembali setiap aspek kehidupan kita. Terlepas dari ketidaksepakatan global tentang berbagai masalah, dampak transformatif AI diakui secara universal.

Membuat Wawasan dan Aksi

Pabrik AI melayani dua fungsi utama. Yang pertama adalah untuk melatih model dasar, menghasilkan wawasan untuk peningkatan bisnis dan pribadi. Fungsi kedua, dan lebih signifikan, melibatkan pemberian data dan pertanyaan baru ke dalam model ini untuk menyimpulkan jawaban baru, menghasilkan token baru, dan mendorong tindakan.

Sebagian besar diskusi seputar AI telah berpusat pada pelatihan model dasar yang terus berkembang, membual ratusan miliar hingga triliunan parameter dan dataset yang luas. Jumlah token menunjukkan luasnya pengetahuan, sementara parameter mencerminkan kedalaman pemahaman. Jumlah parameter yang lebih kecil dipasangkan dengan set token yang lebih besar menghasilkan jawaban yang lebih cepat dan lebih sederhana. Sebaliknya, jumlah parameter yang lebih besar dan set token yang lebih kecil memberikan wawasan yang lebih bernuansa ke dalam domain terbatas. Model penalaran rantai-pemikiran, yang bersifat multimodal, menggabungkan model khusus untuk mempertimbangkan output yang mendorong input lain, menghasilkan jawaban yang komprehensif.

Pabrik AI memanfaatkan semua konten yang dibuat oleh manusia dan data sintetis yang dihasilkan oleh model AI sebagai bahan mentah. Wawasan yang diperoleh dari data ini dimanfaatkan oleh manusia dan agen AI untuk mendorong tindakan. Alih-alih bekerja di pabrik, individu memanfaatkannya, menambah keterampilan mereka dengan pengetahuan dan kecepatan model AI untuk mencapai hasil yang lebih banyak, lebih baik, dan lebih cepat.

Menurut Jensen Huang, salah satu pendiri dan CEO NVIDIA, “Dunia berlomba-lomba untuk membangun pabrik AI skala besar yang canggih.” Membangun pabrik AI adalah prestasi rekayasa yang luar biasa, membutuhkan sumber daya, tenaga kerja, dan material yang besar.

Membangun pabrik AI memerlukan investasi modal yang signifikan. Konfigurasi tipikal terdiri dari NVIDIA DGX SuperPOD berdasarkan beberapa rak sistem DGX, yang menampilkan GPU, CPU, interkoneksi berkecepatan tinggi, dan penyimpanan.

Dengan banyak sistem DGX, SuperPOD memberikan kinerja yang substansial, membual kapasitas memori dan bandwidth yang cukup besar. Kinerja dapat ditingkatkan dengan menambahkan lebih banyak sistem.

Cetak biru NVIDIA lainnya untuk pabrik AI berpusat pada platform NVIDIA GB200 NVL72, sistem skala rak yang mengintegrasikan GPU, CPU, DPU, SuperNIC, NVLink dan NVSwitch, dan jaringan berkecepatan tinggi. Platform ini menawarkan domain memori GPU bersama yang lebih besar untuk model AI dan kepadatan komputasi yang lebih tinggi, yang membutuhkan pendinginan cair.

GB200 NVL72, yang dikirim dalam volume penuh, mewakili sistem mandiri yang mampu membangun model dan menghasilkan data dalam berbagai format.

GB200 NVL72 terdiri dari node server MGX yang menampilkan CPU NVIDIA Grace yang dipasangkan dengan GPU Blackwell. Dua dari node server ini membentuk baki komputasi di dalam rak NVL72, dengan delapan belas baki komputasi yang menampung banyak GPU dan CPU.

Sistem skala rak GB200 NVL72 menggabungkan CPU Grace dengan GPU Blackwell, yang saling terhubung melalui koneksi NVLink berkecepatan tinggi. Port NVLink dan chip NVSwitch menghubungkan semua GPU dalam konfigurasi memori bersama, ideal untuk pelatihan model dasar dan inferensi rantai-pemikiran.

Fabric NVLink, difasilitasi oleh sembilan baki switch NVLink, memungkinkan akses ke semua die GPU sebagai GPU terpadu untuk aplikasi AI.

Sistem GB200 NVL72 menampilkan banyak inti Arm untuk pemrosesan host dan daya pemrosesan floating-point yang substansial. Sistem GB200 NVL72 membual memori HBM3e yang signifikan yang terpasang pada GPU, dengan bandwidth agregat tinggi. CPU Grace menampilkan memori LPDDR5X, yang dapat diakses melalui NVLink.

NVIDIA GB200 NVL72 mencerminkan dampak transformatif dari System/360 pada pemrosesan transaksi online, perbedaan utama adalah skalabilitas NVL72 melalui interkoneksi InfiniBand.

Konfigurasi DGX SuperPOD berdasarkan sistem skala rak NVL72 membutuhkan daya yang cukup besar tetapi memberikan daya komputasi dan kapasitas memori yang sangat besar di beberapa rak komputasi. Kinerja dapat ditingkatkan dengan menambahkan lebih banyak rak.

Kepadatan komputasi rak NVL72 membutuhkan pendinginan cair khusus dan infrastruktur pusat data, yang mewakili kembalinya praktik masa lalu di mana mesin berpendingin air memaksimalkan kinerja.

Pabrik AI akan membutuhkan daya komputasi yang jauh lebih besar karena inferensi menjadi integral dengan beragam aplikasi, terutama dengan pergeseran menuju model penalaran rantai-pemikiran.

Pabrik AI mencakup tidak hanya perangkat keras tetapi juga sistem dan perangkat lunak pengembangan.

Sistem DGX GB200 dan superkomputer AI DGX SuperPOD memerlukan manajemen dan pemodelan, yang difasilitasi oleh alat seperti NVIDIA Mission Control, yang mengatur beban kerja AI dan secara otomatis memulihkan pekerjaan. Mission Control memantau kesehatan sistem dan mengoptimalkan konsumsi daya.

NVIDIA AI Enterprise, rangkaian perangkat lunak sistem, mencakup pustaka, model, dan kerangka kerja yang dioptimalkan untuk GPU dan jaringan NVIDIA. Tumpukan pabrik AI juga menampilkan NVIDIA Dynamo, kerangka kerja sumber terbuka untuk menjalankan inferensi di seluruh infrastruktur NVLink dan DGX SuperPOD. DGX Expert Service and Support membantu pelanggan dalam menerapkan teknologi ini, mengurangi waktu ke token pertama. NVIDIA menawarkan cetak biru pabrik AI untuk lingkungan “kembaran digital” Omniverse-nya untuk mensimulasikan dan mengoptimalkan desain pusat data.

Aspek penting dari pabrik AI adalah pergeseran pemikiran yang mereka timbulkan, dengan NVIDIA memprioritaskan ruang kepala untuk pertumbuhan sistem.

Menurut Gilad Shainer, wakil presiden senior jaringan di NVIDIA, “Menghasilkan token sekarang sama dengan menghasilkan pendapatan bagi banyak perusahaan.” Pusat data berkembang dari pusat biaya menjadi aset produktif.

Dan itu, pada akhirnya, adalah esensi dari membangun pabrik.