Gema Masa Depan Lalu: AI Meta Bangkit di Windows 98

Dalam satu pertembungan era teknologi yang menarik, sebuah naratif telah muncul yang menghubungkan hari-hari awal pengkomputeran rumah yang meluas dengan kecanggihan terkini kecerdasan buatan. Marc Andreessen, seorang tokoh terkemuka dalam dunia teknologi dan pengasas bersama firma modal teroka berpengaruh Andreessen Horowitz, baru-baru ini mengetengahkan satu pencapaian luar biasa: versi kompak model kecerdasan buatan Llama Meta berjaya dikendalikan pada komputer yang menjalankan sistem operasi Windows 98 yang dihormati, dilengkapi dengan hanya 128 megabait RAM. Pendedahan ini berfungsi sebagai peringatan kuat tentang potensi teknologi dan menimbulkan persoalan menarik tentang trajektori sejarah pengkomputeran.

Gagasan untuk menjalankan AI yang canggih, walaupun versi yang dikecilkan, pada perkakasan yang berusia lebih suku abad kelihatan hampir paradoks. AI generatif moden, teknologi yang menggerakkan alat seperti ChatGPT dan Copilot Microsoft sendiri, biasanya dikaitkan dengan pemproses yang berkuasa, peruntukan memori yang besar, dan selalunya, infrastruktur berasaskan awan. Microsoft sendiri telah banyak melabur dalam mengintegrasikan keupayaan AI, terutamanya pembantu Copilotnya, secara mendalam ke dalam sistem operasi terkininya, Windows 11, dan generasi baru perkakasan yang digelar Copilot+ PCs, yang direka secara eksplisit dengan mengambil kira beban kerja AI. Kontras ini menjadikan eksperimen Windows 98 lebih menarik. Ia mencabar anggapan kita tentang sumber yang benar-benar diperlukan untuk fungsi AI tertentu dan menawarkan gambaran sekilas tentang garis masa teknologi alternatif.

Menghidupkan Semula Masa Lalu: Usaha Herculean Di Sebalik Eksperimen

Walaupun Andreessen membawa perhatian yang lebih luas kepada pencapaian ini, kerja teknikal yang berat nampaknya berpunca daripada kerja awal, terutamanya oleh pasukan di Exo Labs. Perjalanan mereka untuk memujuk AI moden ke mesin vintaj sedemikian jauh dari mudah; ia adalah satu latihan dalam arkeologi digital dan penyelesaian masalah kreatif, menonjolkan perbezaan besar antara pengkomputeran dahulu dan sekarang.

Halangan pertama melibatkan logistik asas dan keserasian perkakasan. Mencari perkakasan berfungsi dari era Windows 98 sudah cukup mencabar. Tetapi selain daripada hanya menghidupkan mesin, pasukan itu memerlukan peranti persisian. Antara muka USB moden, yang ada di mana-mana hari ini, bukanlah kelengkapan standard pada zaman kegemilangan Windows 98. Ini memerlukan pencarian peranti input yang serasi menggunakan penyambung PS/2 yang lebih lama – papan kekunci dan tetikus yang mungkin tidak pernah ditemui oleh ramai peminat teknologi muda.

Sebaik sahaja persediaan fizikal ditangani, halangan penting seterusnya ialah pemindahan data. Bagaimana anda mendapatkan fail model AI dan alat pembangunan yang diperlukan ke mesin yang kekurangan pilihan sambungan moden seperti port USB berkelajuan tinggi atau integrasi rangkaian yang lancar? Ini mungkin melibatkan penggunaan kaedah yang lebih lama dan perlahan, mungkin membakar fail ke CD atau menggunakan protokol rangkaian terhad pada masa itu, mengubah salinan fail mudah menjadi proses yang berpotensi memakan masa.

Cabaran teknikal teras, bagaimanapun, terletak pada mengkompil kod moden untuk persekitaran kuno. Model AI, berdasarkan seni bina Llama Meta, dibina menggunakan amalan dan bahasa pengaturcaraan kontemporari. Menjadikan kod ini difahami dan boleh dilaksanakan oleh Windows 98 memerlukan pengkompil – program yang menterjemahkan kod sumber ke dalam bahasa mesin – yang boleh berjalan pada sistem operasi lama dan mengendalikan kerumitan kod AI.

Exo Labs pada mulanya beralih kepada Borland C++ 5.02, yang juga merupakan sebahagian daripada sejarah perisian – gabungan persekitaran pembangunan bersepadu (IDE) dan pengkompil berusia 26 tahun yang berjalan secara asli pada Windows 98. Pilihan ini mewakili jambatan berpotensi antara pangkalan kod moden dan sistem operasi vintaj. Walau bagaimanapun, laluan itu penuh dengan komplikasi. Kerumitan standard dan perpustakaan C++ moden terbukti sukar untuk diselaraskan dengan keupayaan dan batasan pengkompil Borland dan persekitaran Windows 98. Isu keserasian timbul, memaksa pasukan untuk beralih arah.

Penyelesaian mereka melibatkan kembali kepada versi bahasa pengaturcaraan C yang lebih lama. Walaupun C adalah bahasa asas dan pendahulu kepada C++, menggunakan standard C yang lebih lama bermakna mengorbankan beberapa abstraksi peringkat tinggi dan kemudahan C++. Ini memerlukan proses pengekodan yang lebih sukar, menguruskan elemen secara manual seperti fungsi dan pembolehubah yang dikendalikan oleh C++ dengan lebih elegan. Kemajuan tidak dapat dielakkan menjadi lebih perlahan, menuntut perhatian yang teliti terhadap perincian untuk mengelakkan ralat yang mungkin tidak mudah dikesan oleh alat pembangunan yang lebih lama.

Tekanan Memori: Menjinakkan Llama untuk Sumber Terhad

Mungkin kekangan yang paling menakutkan ialah Memori Akses Rawak (RAM) yang sangat terhad. Mesin sasaran hanya mempunyai 128 megabait RAM. Untuk meletakkannya dalam perspektif, telefon pintar moden secara rutin dihantar dengan 8, 12, atau bahkan 16 gigabait RAM (satu gigabait adalah kira-kira 1000 megabait). PC mewah yang direka untuk permainan atau kerja profesional selalunya menampilkan 32GB, 64GB, atau lebih. Menjalankan aplikasi kompleks seperti model AI dalam jejak memori yang begitu kecil adalah seperti melakukan pembedahan rumit di dalam almari penyapu.

Keluarga model Llama Meta, walaupun secara amnya dianggap lebih cekap sumber berbanding gergasi seperti GPT-4 OpenAI, masih merangkumi versi dengan berbilion parameter. Seni bina Llama 2, misalnya, termasuk model yang berskala sehingga 70 bilion parameter. Model yang lebih besar ini menuntut kuasa pengkomputeran yang ketara dan, yang penting, jumlah memori yang besar untuk memuatkan pemberat model dan menguruskan pengiraan yang terlibat dalam memproses maklumat dan menjana respons. Model Llama 2 standard sama sekali tidak akan mampu berjalan dalam kekangan 128MB.

Oleh itu, kejayaan eksperimen bergantung pada penggunaan atau pembangunan iterasi seni bina Llama yang sangat dioptimumkan dan jauh lebih kecil. Versi khusus ini perlu disesuaikan secara khusus untuk berfungsi di bawah batasan perkakasan yang teruk. Ia mungkin melibatkan teknik seperti kuantisasi model (mengurangkan ketepatan nombor yang digunakan dalam pengiraan model) dan pemangkasan (membuang bahagian rangkaian neural yang kurang penting) untuk mengecilkan jejak memori dan pengkomputerannya secara drastik. Exo Labs menyediakan versi mereka yang telah diadaptasi di GitHub, mempamerkan pengubahsuaian khusus yang diperlukan.

AI kecil ini, yang berjalan pada perkakasan kuno, tidak akan memiliki pengetahuan luas atau kebolehan perbualan bernuansa seperti sepupunya yang lebih besar dan dijalankan di awan. Keupayaannya akan terhad. Namun, hakikat bahawa ia boleh berjalan dan melakukan tugas generatif asas mewakili pencapaian teknikal yang signifikan. Ia menunjukkan bahawa konsep teras model bahasa besar boleh, pada prinsipnya, dikecilkan secara dramatik, walaupun utiliti praktikal terhad pada tahap ekstrem sedemikian.

Provokasi Andreessen: Garis Masa yang Hilang untuk Pengkomputeran Perbualan?

Marc Andreessen memanfaatkan demonstrasi teknikal ini untuk membuat pandangan yang lebih luas dan lebih provokatif tentang sejarah dan potensi masa depan pengkomputeran. Refleksinya bukan sekadar tentang rasa ingin tahu teknikal menjalankan perisian baru pada perkakasan lama; ia adalah renungan tentang kemungkinan sejarah alternatif interaksi manusia-komputer.

Beliau menyatakannya dengan mencadangkan bahawa operasi Llama yang berjaya pada PC Dell berusia 26 tahun membayangkan peluang yang terlepas selama beberapa dekad. “Semua PC lama itu secara literal boleh menjadi pintar selama ini,” kata Andreessen. “Kita boleh berbual dengan komputer kita selama 30 tahun sekarang.”

Kenyataan ini menjemput kita untuk membayangkan dunia di mana trajektori pembangunan AI bertemu secara berbeza dengan kebangkitan pengkomputeran peribadi. Daripada PC terutamanya menjadi alat untuk pengiraan, penciptaan dokumen, dan akhirnya, mengakses internet, mungkin ia boleh berkembang menjadi rakan perbualan lebih awal. Imej yang dibayangkan ialah pengguna berinteraksi dengan mesin Windows 95, 98, atau bahkan lebih awal mereka melalui bahasa semula jadi, bertanya soalan, mendapatkan bantuan, dan terlibat dalam dialog dengan cara yang hanya menjadi realiti arus perdana dengan kemunculan pembantu digital moden dan LLM yang canggih.

Sudah tentu, ini adalah lonjakan kontrafaktual yang signifikan. AI generatif, seperti yang kita fahami hari ini, dengan pergantungannya pada set data besar-besaran, seni bina rangkaian neural yang canggih (seperti seni bina Transformer yang mendasari model Llama dan GPT), dan kuasa pengkomputeran yang besar untuk latihan, adalah fenomena yang agak baru. Penyelidikan AI pada tahun 1980-an dan 1990-an, walaupun bercita-cita tinggi, memberi tumpuan kepada paradigma yang berbeza, seperti sistem pakar dan penaakulan simbolik. Perkakasan pada era itu, walaupun mampu menjalankan Llama yang dilucutkan seperti yang ditunjukkan oleh Exo Labs, adalah beberapa magnitud kurang berkuasa berbanding sistem hari ini, dan set data digital yang luas yang diperlukan untuk melatih model generatif yang berkebolehan semata-mata tidak wujud dalam bentuk yang boleh diakses.

Andreessen mengakui konteks ini, mencatat optimisme ledakan AI tahun 1980-an: “Ramai orang pintar pada tahun 80-an fikir semua ini akan berlaku ketika itu.” Era itu menyaksikan pelaburan dan penyelidikan yang signifikan dalam kecerdasan buatan, tetapi ia akhirnya membawa kepada “musim sejuk AI” – tempoh pengurangan pembiayaan dan minat apabila teknologi gagal memenuhi janji-janjinya yang paling bercita-cita tinggi. Batasan dalam kuasa pengkomputeran, ketersediaan data, dan pendekatan algoritma adalah mendalam.

Oleh itu, komen Andreessen mungkin paling baik difahami bukan sebagai dakwaan literal bahawa AI yang canggih dan seperti manusia boleh dilaksanakan pada perkakasan tahun 1990-an seperti yang kita alami sekarang, tetapi sebagai eksperimen pemikiran. Ia menonjolkan potensi yang mungkin telah dibuka jika keutamaan penyelidikan, penemuan algoritma, dan pembangunan perkakasan telah mengikuti laluan yang berbeza. Ia menggariskan idea bahawa blok binaan untuk beberapa bentuk interaksi pintar mungkin secara teknikal boleh dicapai, walaupun hasilnya akan jauh lebih mudah daripada AI hari ini.

Membandingkan Era: Dari Impian Dial-Up kepada Realiti Berinfusi AI

Eksperimen Windows 98 berfungsi sebagai titik kontras yang ketara kepada landskap semasa integrasi AI. Hari ini, AI bergerak pantas daripada perkhidmatan berpusatkan awan kepada tertanam secara mendalam dalam sistem operasi dan bahkan perkakasan itu sendiri.

Dorongan Microsoft dengan Copilot dan Copilot+ PCs mencontohkan trend ini. Windows 11 menampilkan banyak titik masuk untuk Copilot, menawarkan bantuan AI untuk tugas-tugas mulai dari meringkaskan dokumen dan merangka e-mel hingga menjana imej dan melaraskan tetapan sistem. Spesifikasi Copilot+ PC yang baru mewajibkan kemasukan Unit Pemprosesan Neural (NPU) – silikon khusus yang direka untuk mempercepatkan pengiraan AI dengan cekap. Ini menandakan peralihan asas di mana pemprosesan AI menjadi fungsi teras komputer peribadi, dikendalikan secara tempatan dan bukannya hanya bergantung pada pelayan jauh.

Pendekatan moden ini menganggap, dan memanfaatkan, sumber yang melimpah. Copilot+ PCs memerlukan sekurang-kurangnya 16GB RAM dan storan keadaan pepejal yang pantas, spesifikasi yang jauh melebihi 128MB yang sederhana pada mesin Windows 98. Model AI yang digunakan, walaupun dioptimumkan untuk pelaksanaan di sisi klien, jauh lebih kompleks dan berkebolehan daripada versi Llama mini yang digunakan dalam eksperimen. Mereka mendapat manfaat daripada dekad penambahbaikan algoritma, set data latihan besar-besaran, dan perkakasan yang direka khusus untuk keperluan mereka.

Kontras ini menerangkan beberapa perkara:

  1. Pengoptimuman Perisian lwn. Bloat: Eksperimen Exo Labs adalah bukti pengoptimuman ekstrem, memaksa algoritma moden ke dalam persekitaran yang sangat terhad. Ia secara tersirat mengkritik kecenderungan perisian moden untuk menganggap sumber perkakasan yang sentiasa meningkat, kadang-kadang membawa kepada ketidakcekapan atau “bloat.”
  2. Evolusi Perkakasan: Perbezaan semata-mata dalam kuasa pengkomputeran dan memori antara PC biasa 1998 dan Copilot+ PC 2024 adalah mengejutkan, mewakili pelbagai generasi Hukum Moore dan inovasi seni bina.
  3. Kebolehcapaian Data: Latihan LLM moden bergantung pada set data berskala internet yang tidak dapat dibayangkan pada era Windows 98. Alam semesta digital terlalu kecil dan terputus hubungan ketika itu.
  4. Penemuan Algoritma: Pembangunan seni bina seperti model Transformer pada tahun 2017 adalah detik penting, membolehkan penskalaan dan prestasi yang dilihat dalam AI generatif hari ini. Pendekatan AI terdahulu mempunyai batasan asas.

Walaupun Andreessen mengimpikan komputer bercakap 30 tahun yang lalu, realitinya ialah pertemuan kuasa perkakasan, ketersediaan data, dan inovasi algoritma yang diperlukan untuk pengalaman AI hari ini hanya berlaku jauh lebih baru-baru ini.

Apa Maksud Semua Ini? Refleksi Melangkaui Nostalgia

Adakah kejayaan penggunaan model Llama pada Windows 98 hanyalah satu penggodaman pintar, satu aksi nostalgia untuk peminat teknologi? Atau adakah ia mempunyai kepentingan yang lebih mendalam? Ia boleh dikatakan mempunyai beberapa tujuan:

  • Menunjukkan Skalabiliti Ekstrem: Ia membuktikan bahawa prinsip asas di sebalik model bahasa besar boleh disesuaikan untuk beroperasi di bawah kekangan sumber yang sangat ketat. Ini mempunyai implikasi berpotensi untuk menggunakan AI pada sistem terbenam berkuasa rendah, peranti IoT, atau perkakasan lama yang masih digunakan di pelbagai bahagian dunia.
  • Menonjolkan Kuasa Kekangan: Bekerja dalam batasan yang teruk sering memaksa inovasi dan kecekapan. Pasukan Exo Labs terpaksa mencari penyelesaian kreatif dan mengoptimumkan tanpa belas kasihan, kemahiran yang berharga walaupun dalam persekitaran yang kaya dengan sumber.
  • Mencabar Anggapan: Ia mendorong refleksi sama ada semua kuasa pengkomputeran dan memori yang digunakan oleh aplikasi moden semestinya diperlukan untuk nilai yang mereka berikan. Bolehkah sesetengah perisian menjadi lebih ramping dan cekap?
  • Menggambarkan Kontingensi Laluan Teknologi: Sejarah jarang mengikuti garis lurus. Fakta bahawa beberapa AI asas mungkin boleh dilakukan pada perkakasan lama menggariskan bagaimana pilihan yang berbeza, arah penyelidikan, atau bahkan penemuan kebetulan boleh membawa kita ke laluan teknologi yang berbeza.

Eksperimen ini tidak menulis semula sejarah, dan ia juga tidak bermakna bahawa pengalaman AI canggih tahun 2024 entah bagaimana boleh dicapai pada tahun 1998. Jurang dalam teknologi pemboleh – kuasa pemprosesan, memori, data, algoritma – kekal besar. Walau bagaimanapun, ia menyediakan titik data yang menarik, bukti kepintaran kejuruteraan, dan pemangkin untuk merenung jalan berliku kemajuan teknologi. Ia mengingatkan kita bahawa batasan semalam kadang-kadang boleh diatasi dengan pengetahuan hari ini, menghasilkan keputusan yang mengejutkan dan mendorong kita untuk mempertimbangkan semula apa yang mungkin, baik sekarang mahupun di masa depan. Hantu dalam mesin lama berbisik bukan sahaja tentang apa yang telah berlalu, tetapi mungkin juga tentang potensi yang belum diterokai yang terdapat dalam kesederhanaan dan kecekapan.