Lanskap kecerdasan buatan sedang mengalami transformasi signifikan. Selama bertahun-tahun, tuntutan komputasi yang sangat besar dari model AI canggih, terutama large language models (LLMs), mengikat operasinya terutama pada server yang kuat dan boros energi yang tersimpan di pusat data yang luas. Akses biasanya melibatkan pengiriman kueri melalui internet dan menunggu respons yang diproses dari jarak jauh. Namun, pergeseran menarik menuju komputasi lokal semakin mendapatkan momentum, didorong oleh kemajuan teknologi prosesor dan meningkatnya kekhawatiran tentang privasi data dan latensi. Advanced Micro Devices (AMD), pemain tangguh di arena semikonduktor, secara aktif merangkul tren ini, berusaha memberdayakan pengguna untuk memanfaatkan kemampuan AI generatif langsung di komputer pribadi mereka. Inisiatif terbaru perusahaan dalam domain ini adalah proyek sumber terbuka yang diberi nama menarik GAIA, akronim untuk ‘Generative AI Is Awesome’.
Memasuki Era Pemrosesan AI Lokal
Daya tarik menjalankan model AI generatif secara lokal memiliki banyak segi. Pertama, ini mengatasi kekhawatiran privasi yang berkembang. Ketika data diproses di perangkat pengguna sendiri, kebutuhan untuk mengirimkan informasi yang berpotensi sensitif ke server pihak ketiga dihilangkan, menawarkan paradigma operasional yang secara inheren lebih aman. Kedua, eksekusi lokal dapat secara signifikan mengurangi latensi; penundaan antara input dan output diminimalkan ketika pekerjaan komputasi berat terjadi hanya beberapa milimeter dari antarmuka pengguna, daripada berpotensi melintasi benua. Ketiga, ini mendemokratisasi akses. Sementara AI berbasis cloud seringkali melibatkan biaya berlangganan atau batas penggunaan, pemrosesan di perangkat memanfaatkan perangkat keras yang sudah dimiliki pengguna, berpotensi menurunkan hambatan masuk untuk bereksperimen dan memanfaatkan alat AI.
Menyadari potensi ini, AMD telah secara strategis mengintegrasikan inti pemrosesan khusus yang dirancang secara eksplisit untuk beban kerja AI ke dalam arsitektur prosesornya. Puncak dari upaya ini terbukti dalam prosesor seri Ryzen AI 300 terbaru mereka, yang menampilkan Neural Processing Units (NPUs) yang ditingkatkan. NPU ini direkayasa untuk menangani jenis operasi matematika spesifik yang lazim dalam tugas pembelajaran mesin, melakukannya dengan efisiensi yang jauh lebih besar – baik dalam hal kecepatan maupun konsumsi daya – dibandingkan dengan inti CPU tradisional. Perangkat keras khusus inilah yang ingin dibuka oleh AMD untuk pengguna mainstream melalui proyek GAIA-nya. Victoria Godsoe, AI Developer Enablement Manager AMD, menekankan tujuan ini, menyatakan bahwa GAIA ‘memanfaatkan kekuatan Ryzen AI Neural Processing Unit (NPU) untuk menjalankan large language models (LLMs) pribadi dan lokal’. Dia lebih lanjut menyoroti manfaatnya: ‘Integrasi ini memungkinkan pemrosesan yang lebih cepat, lebih efisien — yaitu daya yang lebih rendah — sambil menjaga data Anda tetap lokal dan aman’.
Memperkenalkan GAIA: Menyederhanakan Penerapan LLM di Perangkat
GAIA muncul sebagai jawaban AMD atas pertanyaan: Bagaimana pengguna dapat dengan mudah memanfaatkan kemampuan NPU dari mesin bertenaga Ryzen AI baru mereka untuk menjalankan model AI canggih? Disajikan sebagai aplikasi sumber terbuka, GAIA menyediakan antarmuka yang disederhanakan yang secara khusus disesuaikan untuk menerapkan dan berinteraksi dengan LLM skala kecil secara langsung di PC Windows yang dilengkapi dengan perangkat keras AMD terbaru. Proyek ini secara sadar dibangun di atas kerangka kerja sumber terbuka yang ada, terutama mengutip Lemonade sebagai fondasi, menunjukkan semangat kolaboratif dalam komunitas pengembangan yang lebih luas.
Fungsi inti GAIA adalah untuk mengabstraksi sebagian besar kompleksitas yang biasanya terkait dengan pengaturan dan menjalankan LLM. Pengguna disajikan dengan lingkungan yang lebih mudah didekati, dioptimalkan dari awal untuk arsitektur Ryzen AI AMD. Optimalisasi ini sangat penting; ini memastikan bahwa perangkat lunak secara efektif memanfaatkan NPU, memaksimalkan kinerja dan meminimalkan jejak energi. Sementara target utamanya adalah seri Ryzen AI 300 dengan NPU-nya yang kuat, AMD belum sepenuhnya mengecualikan pengguna konfigurasi perangkat keras yang lebih tua atau berbeda.
Proyek ini mendukung keluarga LLM yang populer dan relatif ringkas, termasuk model berdasarkan arsitektur Llama dan Phi yang dapat diakses secara luas. Model-model ini, meskipun mungkin tidak memiliki skala raksasa seperti GPT-4, sangat mampu untuk berbagai tugas di perangkat. AMD menyarankan kasus penggunaan potensial mulai dari chatbot interaktif yang mampu melakukan percakapan alami hingga tugas penalaran yang lebih kompleks, menunjukkan keserbagunaan yang dibayangkan untuk AI lokal bertenaga GAIA.
Menjelajahi Kemampuan GAIA: Agen dan Kekuatan Hibrida
Untuk menampilkan aplikasi praktis dan membuat teknologi segera berguna, GAIA dilengkapi dengan pilihan ‘agen’ yang telah ditentukan sebelumnya, masing-masing disesuaikan untuk fungsi tertentu:
- Chaty: Seperti namanya, agen ini memberikan pengalaman AI percakapan, bertindak sebagai chatbot untuk interaksi dan dialog umum. Ini memanfaatkan kemampuan LLM yang mendasarinya untuk menghasilkan respons teks seperti manusia.
- Clip: Agen ini berfokus pada tugas menjawab pertanyaan. Khususnya, ia menggabungkan kemampuan Retrieval-Augmented Generation (RAG), memungkinkannya untuk berpotensi mengambil informasi dari sumber eksternal seperti transkrip YouTube untuk memberikan jawaban yang lebih terinformasi atau relevan secara kontekstual. Fungsionalitas RAG ini secara signifikan meningkatkan basis pengetahuan agen di luar data pelatihan awal LLM.
- Joker: Agen berbasis RAG lainnya, Joker secara khusus dirancang untuk humor, ditugaskan untuk menghasilkan lelucon. Ini menunjukkan potensi untuk aplikasi khusus dan kreatif dari LLM lokal.
- Simple Prompt Completion: Ini menawarkan jalur yang lebih langsung ke LLM dasar, memungkinkan pengguna untuk memasukkan prompt dan menerima penyelesaian langsung tanpa lapisan percakapan atau tugas-spesifik dari agen lain. Ini berfungsi sebagai antarmuka fundamental untuk interaksi model langsung.
Eksekusi agen-agen ini, khususnya proses inferensi di mana model menghasilkan respons, terutama ditangani oleh NPU pada chip seri Ryzen AI 300 yang kompatibel. Ini memastikan operasi yang efisien dan berdaya rendah. Namun, AMD juga telah memasukkan mode ‘hybrid’ yang lebih canggih untuk model tertentu yang didukung. Pendekatan inovatif ini secara dinamis melibatkan unit pemrosesan grafis terintegrasi (iGPU) prosesor bersama NPU. Dengan memanfaatkan kekuatan pemrosesan paralel iGPU, mode hybrid ini dapat memberikan peningkatan kinerja yang signifikan untuk tugas AI yang menuntut, menawarkan cara kepada pengguna untuk mempercepat inferensi di luar apa yang dapat dicapai oleh NPU saja.
Menyadari lanskap perangkat keras yang beragam, AMD juga menyediakan opsi fallback. Varian GAIA ada yang hanya mengandalkan inti CPU untuk komputasi. Meskipun secara signifikan lebih lambat dan kurang hemat daya daripada mode NPU atau hybrid, versi khusus CPU ini memastikan aksesibilitas yang lebih luas, memungkinkan pengguna tanpa perangkat keras Ryzen AI terbaru untuk bereksperimen dengan GAIA, meskipun dengan penalti kinerja.
Posisi Strategis dan Keuntungan Sumber Terbuka
Peluncuran GAIA dapat dilihat dalam konteks yang lebih luas dari pasar semikonduktor yang kompetitif, terutama mengenai akselerasi AI. Untuk periode yang cukup lama, NVIDIA telah menikmati posisi dominan di ruang AI, sebagian besar karena GPU-nya yang kuat dan ekosistem perangkat lunak CUDA (Compute Unified Device Architecture) yang matang, yang telah menjadi standar de facto untuk pembelajaran mesin berkinerja tinggi. Menjalankan model yang lebih besar secara efisien pada perangkat keras konsumen seringkali mengarahkan pengembang dan penggemar ke penawaran NVIDIA.
Inisiatif GAIA AMD, ditambah dengan perangkat keras NPU khusus dalam chip Ryzen AI, mewakili langkah strategis untuk menantang dominasi ini, terutama di pasar yang sedang berkembang untuk AI di perangkat pada laptop dan desktop. Dengan menyediakan alat yang mudah digunakan, dioptimalkan, dan sumber terbuka, AMD bertujuan untuk membangun ekosistem di sekitar kemampuan perangkat keras AI-nya sendiri, membuat platform Ryzen AI lebih menarik bagi pengembang dan pengguna akhir yang tertarik pada eksekusi AI lokal. Fokus eksplisit pada optimalisasi NPU membedakannya dari pendekatan yang berpusat pada GPU dan menyoroti manfaat efisiensi daya yang melekat pada prosesor neural khusus untuk tugas AI tertentu.
Keputusan untuk merilis GAIA di bawah lisensi sumber terbuka MIT yang permisif juga signifikan secara strategis. Ini mengundang kolaborasi dan kontribusi dari komunitas pengembang global. Pendekatan ini dapat mempercepat pengembangan proyek, mengarah pada integrasi fitur dan model baru, dan membina komunitas yang berinvestasi dalam platform AI AMD. AMD secara eksplisit menyambut pull request untuk perbaikan bug dan peningkatan fitur, menandakan komitmen untuk mengembangkan GAIA melalui upaya kolektif. Sumber terbuka menurunkan hambatan bagi pengembang untuk bereksperimen, mengintegrasikan, dan berpotensi membangun aplikasi komersial di atas kerangka kerja GAIA, yang selanjutnya merangsang ekosistem di sekitar Ryzen AI.
Meskipun iterasi saat ini berfokus pada LLM yang lebih kecil yang cocok untuk eksekusi di perangkat, fondasi yang diletakkan oleh GAIA dapat membuka jalan untuk mendukung model dan aplikasi yang lebih kompleks seiring kemajuan teknologi NPU. Ini mewakili pernyataan niat yang jelas dari AMD: untuk menjadi kekuatan utama di era kecerdasan buatan pribadi yang terlokalisasi, menyediakan perangkat keras dan alat perangkat lunak yang dapat diakses yang diperlukan untuk membawa kemampuan AI langsung ke tangan pengguna, secara aman dan efisien. Nama ‘Generative AI Is Awesome’, meskipun mungkin informal, menggarisbawahi antusiasme dan ambisi perusahaan di perbatasan teknologi yang berkembang pesat ini.