Gema Masa Depan Lalu: AI Meta Bangkit di Windows 98

Dalam benturan era teknologi yang menarik, sebuah narasi telah muncul yang menjembatani masa-masa awal komputasi rumahan yang meluas dengan kecerdasan buatan mutakhir. Marc Andreessen, seorang tokoh terkemuka di dunia teknologi dan salah satu pendiri firma modal ventura berpengaruh Andreessen Horowitz, baru-baru ini menyoroti sebuah prestasi luar biasa: versi ringkas model kecerdasan buatan Llama milik Meta berhasil dioperasikan pada komputer yang menjalankan sistem operasi Windows 98 yang terhormat, dilengkapi dengan hanya 128 megabyte RAM. Pengungkapan ini berfungsi sebagai pengingat kuat akan potensi teknologi dan menimbulkan pertanyaan menarik tentang lintasan historis komputasi.

Gagasan menjalankan AI canggih, bahkan yang diperkecil sekalipun, pada perangkat keras yang berasal lebih dari seperempat abad yang lalu tampak hampir paradoks. AI generatif modern, teknologi yang mendukung alat seperti ChatGPT dan Copilot milik Microsoft sendiri, biasanya dikaitkan dengan prosesor yang kuat, alokasi memori yang besar, dan seringkali, infrastruktur berbasis cloud. Microsoft sendiri telah banyak berinvestasi dalam mengintegrasikan kemampuan AI, terutama asisten Copilot-nya, secara mendalam ke dalam sistem operasi terbarunya, Windows 11, dan generasi baru perangkat keras yang dijuluki Copilot+ PCs, yang dirancang secara eksplisit dengan mempertimbangkan beban kerja AI. Kontras ini membuat eksperimen Windows 98 semakin mencolok. Ini menantang asumsi kita tentang sumber daya yang benar-benar diperlukan untuk fungsi AI tertentu dan menawarkan sekilas ke dalam garis waktu teknologi alternatif.

Membangkitkan Masa Lalu: Upaya Hercules di Balik Eksperimen

Meskipun Andreessen membawa perhatian yang lebih luas pada pencapaian ini, kerja keras teknis tampaknya berasal dari pekerjaan sebelumnya, terutama oleh tim di Exo Labs. Perjalanan mereka untuk membujuk AI modern ke mesin kuno seperti itu jauh dari mudah; itu adalah latihan dalam arkeologi digital dan pemecahan masalah kreatif, menyoroti perbedaan besar antara komputasi saat itu dan sekarang.

Rintangan pertama melibatkan logistik dasar dan kompatibilitas perangkat keras. Menemukan perangkat keras fungsional dari era Windows 98 sudah cukup menantang. Tetapi selain hanya menyalakan mesin, tim membutuhkan periferal. Antarmuka USB modern, yang ada di mana-mana saat ini, bukanlah standar pada masa kejayaan Windows 98. Hal ini mengharuskan pencarian perangkat input yang kompatibel menggunakan konektor PS/2 yang lebih tua – keyboard dan mouse yang mungkin belum pernah ditemui oleh banyak penggemar teknologi muda.

Setelah penyiapan fisik ditangani, hambatan signifikan berikutnya adalah transfer data. Bagaimana Anda mendapatkan file model AI dan alat pengembangan yang diperlukan ke mesin yang tidak memiliki opsi konektivitas modern seperti port USB berkecepatan tinggi atau integrasi jaringan yang mulus? Ini kemungkinan melibatkan penggunaan metode yang lebih tua dan lebih lambat, mungkin membakar file ke CD atau memanfaatkan protokol jaringan terbatas pada waktu itu, mengubah penyalinan file sederhana menjadi proses yang berpotensimemakan waktu.

Tantangan teknis inti, bagaimanapun, terletak pada mengkompilasi kode modern untuk lingkungan kuno. Model AI, berdasarkan arsitektur Llama Meta, dibangun menggunakan praktik dan bahasa pemrograman kontemporer. Membuat kode ini dapat dimengerti dan dapat dieksekusi oleh Windows 98 memerlukan kompiler – program yang menerjemahkan kode sumber ke dalam bahasa mesin – yang dapat berjalan pada sistem operasi lama dan menangani kompleksitas kode AI.

Exo Labs awalnya beralih ke Borland C++ 5.02, yang merupakan bagian dari sejarah perangkat lunak – kombinasi lingkungan pengembangan terintegrasi (IDE) dan kompiler berusia 26 tahun yang berjalan secara native di Windows 98. Pilihan ini mewakili jembatan potensial antara basis kode modern dan sistem operasi kuno. Namun, jalannya penuh dengan komplikasi. Kerumitan standar dan pustaka C++ modern terbukti sulit untuk disesuaikan dengan kemampuan dan keterbatasan kompiler Borland dan lingkungan Windows 98. Masalah kompatibilitas muncul, memaksa tim untuk berputar haluan.

Solusi mereka melibatkan kemunduran ke versi bahasa pemrograman C yang lebih tua. Meskipun C adalah bahasa dasar dan pendahulu C++, menggunakan standar C yang lebih tua berarti mengorbankan beberapa abstraksi tingkat tinggi dan kemudahan C++. Ini membutuhkan proses pengkodean yang lebih melelahkan, mengelola elemen secara manual seperti fungsi dan variabel yang ditangani C++ dengan lebih elegan. Kemajuan tak terhindarkan lebih lambat, menuntut perhatian cermat terhadap detail untuk menghindari kesalahan yang mungkin tidak mudah ditangkap oleh alat pengembangan yang lebih tua.

Pemerasan Memori: Menjinakkan Llama untuk Sumber Daya Terbatas

Mungkin kendala yang paling menakutkan adalah Random Access Memory (RAM) yang sangat terbatas. Mesin target hanya memiliki 128 megabyte RAM. Untuk memberikan perspektif, smartphone modern secara rutin dikirimkan dengan 8, 12, atau bahkan 16 gigabyte RAM (satu gigabyte kira-kira 1000 megabyte). PC kelas atas yang dirancang untuk bermain game atau pekerjaan profesional sering kali menampilkan 32GB, 64GB, atau lebih. Menjalankan aplikasi kompleks seperti model AI dalam jejak memori sekecil itu mirip dengan melakukan operasi rumit di lemari sapu.

Keluarga model Llama Meta, meskipun secara umum dianggap lebih hemat sumber daya daripada raksasa seperti GPT-4 OpenAI, masih mencakup versi dengan miliaran parameter. Arsitektur Llama 2, misalnya, mencakup model yang berskala hingga 70 miliar parameter. Model yang lebih besar ini menuntut daya komputasi yang signifikan dan, yang terpenting, sejumlah besar memori untuk memuat bobot model dan mengelola perhitungan yang terlibat dalam pemrosesan informasi dan menghasilkan respons. Model Llama 2 standar sama sekali tidak akan mampu berjalan dalam batasan 128MB.

Oleh karena itu, keberhasilan eksperimen bergantung pada penggunaan atau pengembangan iterasi arsitektur Llama yang sangat dioptimalkan dan jauh lebih kecil. Versi khusus ini harus disesuaikan secara spesifik untuk berfungsi di bawah keterbatasan perangkat keras yang parah. Ini kemungkinan melibatkan teknik seperti kuantisasi model (mengurangi presisi angka yang digunakan dalam perhitungan model) dan pemangkasan (menghapus bagian jaringan saraf yang kurang penting) untuk secara drastis mengecilkan jejak memori dan komputasinya. Exo Labs membuat versi adaptasi mereka tersedia di GitHub, menampilkan modifikasi spesifik yang diperlukan.

AI mungil ini, berjalan pada perangkat keras kuno, tidak akan memiliki pengetahuan luas atau kemampuan percakapan bernuansa seperti sepupunya yang lebih besar dan dijalankan di cloud. Kemampuannya akan dibatasi. Namun, fakta bahwa ia bisa berjalan dan melakukan tugas generatif dasar merupakan pencapaian teknis yang signifikan. Ini menunjukkan bahwa konsep inti model bahasa besar dapat, pada prinsipnya, diperkecil secara dramatis, bahkan jika utilitas praktis terbatas pada ekstrem seperti itu.

Provokasi Andreessen: Garis Waktu yang Hilang untuk Komputasi Percakapan?

Marc Andreessen memanfaatkan demonstrasi teknis ini untuk membuat poin yang lebih luas dan lebih provokatif tentang sejarah dan potensi masa depan komputasi. Refleksinya bukan hanya tentang keingintahuan teknis menjalankan perangkat lunak baru pada perangkat keras lama; itu adalah perenungan tentang kemungkinan sejarah alternatif interaksi manusia-komputer.

Dia mengartikulasikan ini dengan menyatakan bahwa keberhasilan operasi Llama pada PC Dell berusia 26 tahun menyiratkan peluang yang terlewatkan selama beberapa dekade. ‘Semua PC lama itu secara harfiah bisa saja pintar selama ini,’ Andreessen berpendapat. ‘Kita bisa saja berbicara dengan komputer kita selama 30 tahun sekarang.’

Pernyataan ini mengundang kita untuk membayangkan dunia di mana lintasan pengembangan AI bertemu secara berbeda dengan munculnya komputasi personal. Alih-alih PC utamanya menjadi alat untuk perhitungan, pembuatan dokumen, dan akhirnya, mengakses internet, mungkin mereka bisa berevolusi menjadi mitra percakapan jauh lebih awal. Gambaran yang dimunculkan adalah pengguna berinteraksi dengan mesin Windows 95, 98, atau bahkan lebih awal melalui bahasa alami, mengajukan pertanyaan, mendapatkan bantuan, dan terlibat dalam dialog dengan cara yang baru menjadi kenyataan arus utama dengan munculnya asisten digital modern dan LLM canggih.

Tentu saja, ini adalah lompatan kontrafaktual yang signifikan. AI generatif, seperti yang kita pahami saat ini, dengan ketergantungannya pada kumpulan data masif, arsitektur jaringan saraf yang canggih (seperti arsitektur Transformer yang mendasari model Llama dan GPT), dan kekuatan komputasi yang sangat besar untuk pelatihan, adalah fenomena yang relatif baru. Penelitian AI tahun 1980-an dan 1990-an, meskipun ambisius, berfokus pada paradigma yang berbeda, seperti sistem pakar dan penalaran simbolik. Perangkat keras pada era itu, meskipun mampu menjalankan Llama versi ringkas yang didemonstrasikan oleh Exo Labs, memiliki kekuatan yang jauh lebih rendah daripada sistem saat ini, dan kumpulan data digital yang luas yang diperlukan untuk melatih model generatif yang mumpuni sama sekali tidak ada dalam bentuk yang dapat diakses.

Andreessen mengakui konteks ini, mencatat optimisme ledakan AI tahun 1980-an: ‘Banyak orang pintar di tahun 80-an berpikir semua ini akan terjadi saat itu.’ Era itu melihat investasi dan penelitian yang signifikan dalam kecerdasan buatan, tetapi akhirnya mengarah pada ‘musim dingin AI’ – periode pengurangan dana dan minat ketika teknologi gagal memenuhi janji-janjinya yang paling ambisius. Keterbatasan dalam kekuatan komputasi, ketersediaan data, dan pendekatan algoritmik sangat mendalam.

Oleh karena itu, komentar Andreessen mungkin paling baik dipahami bukan sebagai klaim literal bahwa AI canggih yang mirip manusia dapat dilakukan pada perangkat keras tahun 1990-an seperti yang kita alami sekarang, melainkan sebagai eksperimen pemikiran. Ini menyoroti potensi yang mungkin telah terbuka jika prioritas penelitian, terobosan algoritmik, dan pengembangan perangkat keras mengikuti jalur yang berbeda. Ini menggarisbawahi gagasan bahwa blok bangunan untuk beberapa bentuk interaksi cerdas mungkin secara teknis dapat dicapai, bahkan jika hasilnya akan jauh lebih sederhana daripada AI saat ini.

Mengkontraskan Era: Dari Mimpi Dial-Up ke Realitas yang Diresapi AI

Eksperimen Windows 98 berfungsi sebagai titik kontras yang tajam dengan lanskap integrasi AI saat ini. Saat ini, AI dengan cepat bergerak dari layanan yang berpusat pada cloud menjadi tertanam secara mendalam di dalam sistem operasi dan bahkan perangkat keras itu sendiri.

Dorongan Microsoft dengan Copilot dan Copilot+ PCs mencontohkan tren ini. Windows 11 menampilkan banyak titik masuk untuk Copilot, menawarkan bantuan AI untuk tugas-tugas mulai dari meringkas dokumen dan menyusun email hingga menghasilkan gambar dan menyesuaikan pengaturan sistem. Spesifikasi Copilot+ PC yang baru mengamanatkan penyertaan Neural Processing Unit (NPU) – silikon khusus yang dirancang untuk mempercepat komputasi AI secara efisien. Ini menandakan pergeseran mendasar di mana pemrosesan AI menjadi fungsi inti dari komputer pribadi, ditangani secara lokal daripada hanya mengandalkan server jarak jauh.

Pendekatan modern ini mengasumsikan, dan memanfaatkan, sumber daya yang melimpah. Copilot+ PCs memerlukan minimal 16GB RAM dan penyimpanan solid-state cepat, spesifikasi yang jauh melebihi 128MB sederhana dari mesin Windows 98. Model AI yang digunakan, meskipun dioptimalkan untuk eksekusi sisi klien, jauh lebih kompleks dan mampu daripada versi Llama mini yang digunakan dalam eksperimen. Mereka mendapat manfaat dari penyempurnaan algoritmik selama puluhan tahun, kumpulan data pelatihan masif, dan perangkat keras yang secara khusus dirancang untuk kebutuhan mereka.

Kontras tersebut menerangi beberapa poin:

  1. Optimasi Perangkat Lunak vs. Bloat: Eksperimen Exo Labs adalah bukti optimasi ekstrem, memaksa algoritma modern ke dalam lingkungan yang sangat terbatas. Ini secara implisit mengkritik kecenderungan perangkat lunak modern untuk mengasumsikan sumber daya perangkat keras yang terus meningkat, terkadang menyebabkan inefisiensi atau ‘bloat’.
  2. Evolusi Perangkat Keras: Perbedaan besar dalam kekuatan komputasi dan memori antara PC tipikal tahun 1998 dan Copilot+ PC tahun 2024 sangat mengejutkan, mewakili beberapa generasi Hukum Moore dan inovasi arsitektur.
  3. Aksesibilitas Data: Pelatihan LLM modern bergantung pada kumpulan data skala internet yang tak terbayangkan di era Windows 98. Alam semesta digital saat itu terlalu kecil dan terputus-putus.
  4. Terobosan Algoritmik: Pengembangan arsitektur seperti model Transformer pada tahun 2017 adalah momen penting, memungkinkan penskalaan dan kinerja yang terlihat pada AI generatif saat ini. Pendekatan AI sebelumnya memiliki keterbatasan mendasar.

Sementara Andreessen memimpikan komputer yang bisa bicara 30 tahun lalu, kenyataannya adalah bahwa pertemuan kekuatan perangkat keras, ketersediaan data, dan inovasi algoritmik yang diperlukan untuk pengalaman AI saat ini baru terjadi jauh lebih baru.

Apa Artinya Semua Ini? Refleksi di Luar Nostalgia

Apakah keberhasilan penerapan model Llama di Windows 98 hanyalah peretasan cerdas, aksi nostalgia bagi penggemar teknologi? Atau apakah itu memiliki signifikansi yang lebih dalam? Ini bisa dibilang melayani beberapa tujuan:

  • Mendemonstrasikan Skalabilitas Ekstrem: Ini membuktikan bahwa prinsip-prinsip dasar di balik model bahasa besar dapat diadaptasi untuk beroperasi di bawah batasan sumber daya yang sangat ketat. Ini memiliki implikasi potensial untuk menyebarkan AI pada sistem tertanam berdaya rendah, perangkat IoT, atau perangkat keras lama yang masih digunakan di berbagai belahan dunia.
  • Menyoroti Kekuatan Kendala: Bekerja dalam keterbatasan yang parah seringkali memaksa inovasi dan efisiensi. Tim Exo Labs harus menemukan solusi kreatif dan mengoptimalkan tanpa henti, keterampilan yang berharga bahkan di lingkungan yang kaya sumber daya.
  • Menantang Asumsi: Ini mendorong refleksi tentang apakah semua kekuatan komputasi dan memori yang digunakan oleh aplikasi modern benar-benar diperlukan untuk nilai yang mereka berikan. Bisakah beberapa perangkat lunak menjadi lebih ramping dan lebih efisien?
  • Mengilustrasikan Kontingensi Jalur Teknologi: Sejarah jarang mengikuti garis lurus. Fakta bahwa beberapa AI rudimenter mungkin dimungkinkan pada perangkat keras yang lebih tua menggarisbawahi bagaimana pilihan yang berbeda, arah penelitian, atau bahkan penemuan kebetulan bisa membawa kita ke jalur teknologi yang berbeda.

Eksperimen ini tidak menulis ulang sejarah, juga tidak berarti bahwa pengalaman AI canggih tahun 2024 entah bagaimana dapat dicapai pada tahun 1998. Kesenjangan dalam teknologi pendukung – kekuatan pemrosesan, memori, data, algoritma – tetap sangat besar. Namun, ini memberikan titik data yang menarik, bukti kecerdikan rekayasa, dan katalis untuk merenungkan jalan berliku kemajuan teknologi. Ini mengingatkan kita bahwa keterbatasan kemarin terkadang dapat diatasi dengan pengetahuan hari ini, menghasilkan hasil yang mengejutkan dan mendorong kita untuk mempertimbangkan kembali apa yang mungkin terjadi, baik sekarang maupun di masa depan. Hantu di mesin tua itu berbisik bukan hanya tentang apa yang telah terjadi, tetapi mungkin juga tentang potensi yang belum tergali yang berada dalam kesederhanaan dan efisiensi.