Landskap kecerdasan buatan sedang mengalami transformasi yang ketara. Selama bertahun-tahun, permintaan pengkomputeran yang besar bagi model AI yang canggih, terutamanya model bahasa besar (LLM), mengikat operasinya terutamanya kepada pelayan yang berkuasa dan intensif tenaga yang tersimpan di pusat data yang luas. Akses biasanya melibatkan penghantaran pertanyaan melalui internet dan menunggu respons yang diproses dari jauh. Walau bagaimanapun, peralihan yang menarik ke arah pengkomputeran setempat semakin mendapat momentum, didorong oleh kemajuan dalam teknologi pemproses dan kebimbangan yang semakin meningkat tentang privasi data dan kependaman. Advanced Micro Devices (AMD), pemain hebat dalam arena semikonduktor, secara aktif menerima trend ini, berusaha untuk memperkasakan pengguna memanfaatkan keupayaan AI generatif secara langsung pada komputer peribadi mereka. Inisiatif terkini syarikat dalam domain ini ialah projek sumber terbuka yang dinamakan GAIA, akronim untuk ‘Generative AI Is Awesome’.
Memulakan Era Pemprosesan AI Setempat
Daya tarikan menjalankan model AI generatif secara tempatan adalah pelbagai aspek. Pertama, ia menangani kebimbangan privasi yang semakin meningkat. Apabila data diproses pada peranti pengguna sendiri, keperluan untuk menghantar maklumat yang berpotensi sensitif kepada pelayan pihak ketiga dihapuskan, menawarkan paradigma operasi yang sememangnya lebih selamat. Kedua, pelaksanaan tempatan boleh mengurangkan kependaman dengan ketara; kelewatan antara input dan output diminimumkan apabila kerja berat pengkomputeran berlaku hanya beberapa milimeter dari antara muka pengguna, bukannya berpotensi merentasi benua. Ketiga, ia mendemokrasikan akses. Walaupun AI berasaskan awan sering melibatkan yuran langganan atau had penggunaan, pemprosesan pada peranti memanfaatkan perkakasan yang sudah dimiliki pengguna, berpotensi menurunkan halangan masuk untuk bereksperimen dan menggunakan alat AI.
Menyedari potensi ini, AMD telah secara strategik mengintegrasikan teras pemprosesan khusus yang direka secara eksplisit untuk beban kerja AI ke dalam seni bina pemprosesnya. Kemuncak usaha ini terbukti dalam pemproses siri Ryzen AI 300 terbaru mereka, yang menampilkan Unit Pemprosesan Neural (NPU) yang dipertingkatkan. NPU ini direka bentuk untuk mengendalikan jenis operasi matematik tertentu yang lazim dalam tugas pembelajaran mesin, melakukannya dengan kecekapan yang jauh lebih besar – dari segi kelajuan dan penggunaan kuasa – berbanding teras CPU tradisional. Perkakasan khusus inilah yang AMD sasarkan untuk dibuka kunci bagi pengguna arus perdana melalui projek GAIAnya. Victoria Godsoe, Pengurus Pembolehan Pembangun AI AMD, menekankan matlamat ini, menyatakan bahawa GAIA ‘memanfaatkan kuasa Unit Pemprosesan Neural (NPU) Ryzen AI untuk menjalankan model bahasa besar (LLM) peribadi dan tempatan.’ Beliau seterusnya menonjolkan faedahnya: ‘Integrasi ini membolehkan pemprosesan yang lebih pantas, lebih cekap — iaitu kuasa yang lebih rendah — sambil memastikan data anda kekal tempatan dan selamat.’
Memperkenalkan GAIA: Memudahkan Penggunaan LLM Pada Peranti
GAIA muncul sebagai jawapan AMD kepada persoalan: Bagaimana pengguna boleh dengan mudah memanfaatkan keupayaan NPU mesin berkuasa Ryzen AI baharu mereka untuk menjalankan model AI yang canggih? Dipersembahkan sebagai aplikasi sumber terbuka, GAIA menyediakan antara muka yang diperkemas khusus untuk menggunakan dan berinteraksi dengan LLM berskala kecil secara langsung pada PC Windows yang dilengkapi dengan perkakasan AMD terkini. Projek ini secara sedar dibina di atas rangka kerja sumber terbuka sedia ada, terutamanya memetik Lemonade sebagai asas, menunjukkan semangat kerjasama dalam komuniti pembangunan yang lebih luas.
Fungsi teras GAIA adalah untuk mengabstrakkan kebanyakan kerumitan yang biasanya dikaitkan dengan penyediaan dan pengendalian LLM. Pengguna dipersembahkan dengan persekitaran yang lebih mudah didekati, dioptimumkan dari bawah ke atas untuk seni bina Ryzen AI AMD. Pengoptimuman ini penting; ia memastikan perisian menggunakan NPU secara berkesan, memaksimumkan prestasi dan meminimumkan jejak tenaga. Walaupun sasaran utama ialah siri Ryzen AI 300 dengan NPUnya yang hebat, AMD tidak mengecualikan sepenuhnya pengguna konfigurasi perkakasan yang lebih lama atau berbeza.
Projek ini menyokong keluarga LLM yang popular dan agak padat, termasuk model berdasarkan seni bina Llama dan Phi yang boleh diakses secara meluas. Model-model ini, walaupun mungkin tidak memiliki skala gergasi seperti GPT-4, sangat berkebolehan untuk pelbagai tugas pada peranti. AMD mencadangkan kes penggunaan berpotensi daripada chatbot interaktif yang mampu melakukan perbualan semula jadi kepada tugasan penaakulan yang lebih kompleks, menunjukkan kepelbagaian yang dibayangkan untuk AI tempatan berkuasa GAIA.
Meneroka Keupayaan GAIA: Ejen dan Kuasa Hibrid
Untuk mempamerkan aplikasi praktikal dan menjadikan teknologi itu berguna serta-merta, GAIA disertakan dengan pilihan ‘ejen’ pra-takrif, setiap satu disesuaikan untuk fungsi tertentu:
- Chaty: Seperti namanya, ejen ini menyediakan pengalaman AI perbualan, bertindak sebagai chatbot untuk interaksi dan dialog umum. Ia memanfaatkan keupayaan LLM asas untuk menjana respons teks seperti manusia.
- Clip: Ejen ini memberi tumpuan kepada tugas menjawab soalan. Terutama, ia menggabungkan keupayaan Penjanaan Diperkaya Pengambilan (RAG), membolehkannya berpotensi mengambil maklumat daripada sumber luaran seperti transkrip YouTube untuk memberikan jawapan yang lebih termaklum atau relevan secara kontekstual. Fungsi RAG ini meningkatkan pangkalan pengetahuan ejen dengan ketara melangkaui data latihan awal LLM.
- Joker: Satu lagi ejen berasaskan RAG, Joker direka khusus untuk humor, ditugaskan untuk menjana jenaka. Ini menunjukkan potensi untuk aplikasi khusus dan kreatif LLM tempatan.
- Simple Prompt Completion: Ini menawarkan talian yang lebih terus kepada LLM asas, membolehkan pengguna memasukkan gesaan dan menerima pelengkapan terus tanpa lapisan perbualan atau khusus tugas ejen lain. Ia berfungsi sebagai antara muka asas untuk interaksi model langsung.
Pelaksanaan ejen-ejen ini, khususnya proses inferens di mana model menjana respons, dikendalikan terutamanya oleh NPU pada cip siri Ryzen AI 300 yang serasi. Ini memastikan operasi yang cekap dan berkuasa rendah. Walau bagaimanapun, AMD juga telah menggabungkan mod ‘hibrid’ yang lebih maju untuk model tertentu yang disokong. Pendekatan inovatif ini secara dinamik melibatkan unit pemprosesan grafik bersepadu (iGPU) pemproses bersama NPU. Dengan memanfaatkan kuasa pemprosesan selari iGPU, mod hibrid ini boleh memberikan peningkatan prestasi yang ketara untuk tugas AI yang menuntut, menawarkan pengguna cara untuk mempercepatkan inferens melebihi apa yang boleh dicapai oleh NPU sahaja.
Menyedari landskap perkakasan yang pelbagai, AMD juga menyediakan pilihan sandaran. Varian GAIA wujud yang bergantung semata-mata pada teras CPU untuk pengkomputeran. Walaupun jauh lebih perlahan dan kurang cekap kuasa berbanding mod NPU atau hibrid, versi CPU sahaja ini memastikan kebolehcapaian yang lebih luas, membolehkan pengguna tanpa perkakasan Ryzen AI terkini untuk bereksperimen dengan GAIA, walaupun dengan penalti prestasi.
Kedudukan Strategik dan Kelebihan Sumber Terbuka
Pelancaran GAIA boleh dilihat dalam konteks pasaran semikonduktor yang kompetitif yang lebih luas, terutamanya berkaitan pecutan AI. Untuk tempoh yang agak lama, NVIDIA telah menikmati kedudukan dominan dalam ruang AI, sebahagian besarnya disebabkan oleh GPUnya yang berkuasa dan ekosistem perisian CUDA (Compute Unified Device Architecture) yang matang, yang telah menjadi standard de facto untuk pembelajaran mesin berprestasi tinggi. Menjalankan model yang lebih besar dengan cekap pada perkakasan pengguna sering mengarahkan pembangun dan peminat ke arah tawaran NVIDIA.
Inisiatif GAIA AMD, ditambah dengan perkakasan NPU khusus dalam cip Ryzen AI, mewakili langkah strategik untuk mencabar penguasaan ini, terutamanya dalam pasaran yang sedang berkembang untuk AI pada peranti pada komputer riba dan desktop. Dengan menyediakan alat yang mudah digunakan, dioptimumkan dan sumber terbuka, AMD bertujuan untuk membina ekosistem di sekitar keupayaan perkakasan AI sendiri, menjadikan platform Ryzen AI lebih menarik kepada pembangun dan pengguna akhir yang berminat dalam pelaksanaan AI tempatan. Fokus eksplisit pada pengoptimuman NPU membezakannya daripada pendekatan berpusatkan GPU dan menonjolkan faedah kecekapan kuasa yang wujud dalam pemproses neural khusus untuk tugas AI tertentu.
Keputusan untuk mengeluarkan GAIA di bawah lesen sumber terbuka MIT yang permisif juga penting secara strategik. Ia menjemput kerjasama dan sumbangan daripada komuniti pembangun global. Pendekatan ini boleh mempercepatkan pembangunan projek, membawa kepada penyepaduan ciri dan model baharu, dan memupuk komuniti yang melabur dalam platform AI AMD. AMD secara eksplisit mengalu-alukan permintaan tarik (pull request) untuk pembetulan pepijat dan penambahbaikan ciri, menandakan komitmen untuk mengembangkan GAIA melalui usaha kolektif. Sumber terbuka menurunkan halangan bagi pembangun untuk bereksperimen, menyepadukan, dan berpotensi membina aplikasi komersial di atas rangka kerja GAIA, seterusnya merangsang ekosistem di sekitar Ryzen AI.
Walaupun lelaran semasa memberi tumpuan kepada LLM yang lebih kecil yang sesuai untuk pelaksanaan pada peranti, asas yang diletakkan oleh GAIA boleh membuka jalan untuk menyokong model dan aplikasi yang lebih kompleks apabila teknologi NPU terus maju. Ia mewakili pernyataan niat yang jelas daripada AMD: untuk menjadi kuasa utama dalam era kecerdasan buatan peribadi dan setempat, menyediakan perkakasan dan alat perisian yang boleh diakses yang diperlukan untuk membawa keupayaan AI secara langsung ke tangan pengguna, dengan selamat dan cekap. Nama jolokan ‘Generative AI Is Awesome’, walaupun mungkin tidak formal, menggarisbawahi semangat dan cita-cita syarikat dalam sempadan teknologi yang berkembang pesat ini.