Kebangkitan RISC-V sebagai Seni Bina Pengkomputeran Natif AI
Populariti DeepSeek yang meledak baru-baru ini telah memberi kesan yang besar dalam industri AI, dan impaknya melangkaui bidang kecerdasan buatan sahaja. Industri semikonduktor, khususnya, telah memberi perhatian. Semasa Tahun Baru Cina, Xuantie Akademi DAMO Alibaba mengumumkan penyesuaian model penyulingan siri DeepSeek-R1, mempamerkan momentum kukuh seni bina set arahan sumber terbuka yang baru muncul, RISC-V, dalam domain AI.
Pada Persidangan Ekosistem Xuantie RISC-V baru-baru ini, berita menarik muncul: RISC-V telah mencapai kejayaan dalam kedua-dua pengkomputeran berprestasi tinggi dan AI. Xuantie C930, CPU gred pelayan pertama daripada Akademi DAMO, akan mula dihantar bulan depan. Kuasa pengkomputeran AI yang dipertingkatkan dengan ketara mempercepatkan penggunaan ekosistem RISC-V ‘prestasi tinggi + AI’ yang komprehensif.
Mungkinkah seni bina pengkomputeran sumber terbuka RISC-V menjadi rakan kongsi yang ideal untuk AI sumber terbuka?
Transformasi Model AI Mendorong Inovasi dalam Seni Bina Pengkomputeran
Seorang pakar berpengalaman dalam industri cip menjelaskan bahawa impak DeepSeek dirasai bukan sahaja dalam kalangan AI tetapi juga secara mendalam dalam industri cip. DeepSeek, melalui reka bentuknya yang sangat optimum, telah mengurangkan kos latihan dan inferens model bahasa besar secara drastik. Peralihan ini telah mengubah keseimbangan kuasa pengkomputeran, memori, dan antara sambungan sedia ada, mewujudkan peluang ketara untuk kejayaan dalam seni bina pengkomputeran.
Secara tradisinya, model AI yang besar, disebabkan oleh keperluan pengkomputeran dan memori yang intensif, lebih sesuai untuk digunakan di awan dan bukannya pada peranti pinggir. Walau bagaimanapun, kemunculan DeepSeek telah mencabar pergantungan ini pada kuasa pengkomputeran yang tinggi. Dengan mengurangkan kedua-dua kos latihan dan inferens, ia membuka jalan untuk model besar beralih dari awan ke pinggir.
Secara khusus, permintaan pengkomputeran DeepSeek yang berkurangan menjadikan penggunaan mesin tunggal boleh dilaksanakan, meningkatkan keserasiannya dengan peranti pinggir dan akhir. Memandangkan AI berusaha untuk menembusi pelbagai industri dan senario, keperluan untuk beralih dari awan ke pinggir menjadi semakin kritikal. Peralihan ini perlu untuk memenuhi pelbagai keperluan seperti keselamatan data, penyesuaian peribadi dan penggunaan peribadi.
Dapat diramalkan bahawa, dengan penggunaan meluas teknologi DeepSeek, landskap cip AI akan mengalami transformasi. Daripada pengkomputeran selari berskala besar yang bergantung pada infrastruktur awan, cip AI berkembang ke arah reka bentuk yang pelbagai, cekap dan berkuasa rendah yang mampu beroperasi secara bebas pada peranti pinggir.
Ini telah mendorong ramai dalam industri untuk merenung: seni bina pengkomputeran apakah yang paling sesuai untuk AI?
GPU, dengan keupayaan pemprosesan selarinya, mungkin bukan satu-satunya penyelesaian. Pengkomputeran bersiri (pengkomputeran tujuan umum) juga muncul sebagai asas yang berdaya maju untuk pengiraan AI. Pengalaman industri menunjukkan bahawa DeepSeek mempamerkan keserasian yang baik dengan pelbagai sistem pengkomputeran. Keupayaannya untuk digunakan dengan cepat dan melaksanakan inferens yang berkesan pada CPU telah membawa CPU kembali menjadi tumpuan. Berbanding dengan GPU khusus, CPU menawarkan kelebihan serba boleh, penjadualan yang dipermudahkan, pengurangan ketara dalam keperluan kuasa pengkomputeran, dan faedah pengkomputeran homogen.
Antara CPU, bintang yang semakin meningkat, RISC-V, menarik perhatian yang ketara.
Semasa Tahun Baru Cina, Akademi DAMO menyesuaikan model penyulingan siri DeepSeek-R1 pada cip yang dikuasakan oleh pemproses RISC-V Xuantie C920. Keseluruhan proses mengambil masa hanya satu jam, menunjukkan pengalaman yang pantas dan lancar. Ini menandakan bahawa model siri DeepSeek boleh digunakan dan dijalankan dengan lancar pada rangkaian penuh platform CPU Xuantie dan peranti akhir AI lain yang dilengkapi dengan cip seni bina RISC-V.
Keunggulan RISC-V berpunca daripada beberapa faktor. Pertama, sebagai seni bina set arahan yang baru muncul, ia membezakan dirinya daripada model pelesenan tertutup atau berbayar x86 dan ARM dengan menerima pendekatan sumber terbuka. Semangat sumber terbuka ini sejajar secara semula jadi dengan AI. Sifat terbukanya telah menarik penyertaan lebih 1,000 syarikat di seluruh dunia, memupuk pertumbuhan pesat dalam ekosistemnya, daripada reka bentuk perkakasan kepada rantaian alat perisian. Menurut Yayasan Antarabangsa RISC-V, lebih daripada 80 produk cip RISC-V yang berbeza telah memasuki pasaran.
Kedua, RISC-V menawarkan fleksibiliti dan skalabiliti yang luar biasa. Ia membolehkan pembangun menyesuaikan set arahan mengikut keperluan khusus. Sifat modular set arahannya membolehkan penyesuaian untuk senario aplikasi yang berbeza, tahap fleksibiliti yang tiada tandingan oleh seni bina tradisional.
Secara teknikal, RISC-V juga sangat sesuai untuk jenis pengkomputeran AI baharu. Sambungan vektornya (V-extension) boleh mengendalikan operasi selari berskala besar dengan berkesan, memenuhi permintaan kecekapan pengiraan AI. Seni bina terbuka RISC-V boleh berfungsi secara sinergi dengan modul pecutan perkakasan untuk meningkatkan kecekapan pelaksanaan tugas AI. Melalui integrasi mendalam dengan algoritma AI, seni bina RISC-V boleh digunakan untuk mereka bentuk unit pecutan perkakasan khusus, mengoptimumkan prestasi untuk model AI tertentu.
Oleh itu, ramai pakar berpengalaman dalam industri cip menjangkakan bahawa RISC-V akan menjadi seni bina pengkomputeran natif era AI.
Pada Persidangan Ekosistem Xuantie RISC-V ketiga yang dihoskan oleh Akademi DAMO Alibaba, jangkaan ini akhirnya menjadi kenyataan.
CPU Gred Pelayan Pertama Xuantie Sedia untuk Penghantaran: Gabungan Prestasi Tinggi dan AI
Pada persidangan itu, Ni Guangnan, seorang ahli akademik Akademi Kejuruteraan China, menyatakan, ‘Sumber terbuka RISC-V bukan sahaja inovasi teknologi tetapi juga transformasi global yang akan mempengaruhi masa depan seni bina pengkomputeran.’ Sebagai seni bina set arahan cip ‘lahir sumber terbuka,’ RISC-V telah menunjukkan prestasi yang luar biasa dalam kitaran industri semikonduktor ini. Ia telah mempercepatkan kemajuannya daripada sistem terbenam kepada senario kompleks seperti pengkomputeran berprestasi tinggi, menawarkan pilihan baharu untuk kuasa pengkomputeran AI.
Antara 25 piawaian yang diluluskan oleh Yayasan Antarabangsa RISC-V pada tahun 2024, lebih separuh daripadanya berkaitan dengan prestasi tinggi atau AI. Lu Dai, Pengerusi Lembaga Pengarah Yayasan Antarabangsa RISC-V, menyatakan pada persidangan itu bahawa salah satu kemajuan paling menarik dalam set arahan RISC-V ialah sambungan Matriks, yang akan mendorong RISC-V untuk menjadi kuasa yang hebat dalam bidang AI.
Diramalkan bahawa menjelang 2030, bahagian pasaran keseluruhan RISC-V akan mencapai 20%, dengan bahagiannya dalam pemecut AI berpotensi melebihi 50%.
Pada persidangan itu, Akademi DAMO melancarkan pemproses perdana generasi akan datang, dan pemproses gred pelayan pertama, C930.
C930 mencapai penanda aras kuasa pengkomputeran tujuan umum 15/GHz dalam ujian penanda aras SPECint2006. Apakah maksudnya ini? Ahli akademik Ni Guangnan menegaskan bahawa untuk RISC-V benar-benar memasuki pasaran pengkomputeran berprestasi tinggi, ia mesti mencapai skor prestasi tinggi melebihi 15 dalam ujian perisian SPECint 2006. Oleh itu, C930 mewakili langkah penting untuk RISC-V.
Tambahan pula, C930 dilengkapi dengan enjin dwi: RVV1.0 512-bit dan Matriks 8 TOPS. Ini menyepadukan kuasa pengkomputeran berprestasi tinggi tujuan umum dengan kuasa pengkomputeran AI secara asli. Ia juga menyediakan antara muka sambungan DSA terbuka untuk menyokong lebih banyak keperluan ciri.
Pada masa yang sama, Akademi DAMO mendedahkan rancangan pembangunannya untuk ahli baharu keluarga pemproses Xuantie, termasuk C908X, R908A, dan XL200, terus berkembang ke arah seperti pecutan AI, aplikasi automotif dan antara sambungan berkelajuan tinggi. Secara khusus, C908X diletakkan sebagai pemproses AI khusus pertama Xuantie, menyokong sambungan vektor RVV1.0 lebar bit data ultra panjang 4096-bit. R908A disasarkan pada keperluan kebolehpercayaan tinggi cip gred automotif. XL200 akan menyediakan antara sambungan koheren berbilang kelompok yang lebih besar dan berprestasi lebih tinggi.
Untuk melengkapkan keupayaan pemproses Xuantie, Akademi DAMO juga telah melancarkan tiga SDK Xuantie berdasarkan tiga sistem pengendalian arus perdana: Linux, Android dan RTOS. SDK ini menyepadukan secara menyeluruh keupayaan perisian terkumpul Xuantie selama bertahun-tahun, menyediakannya kepada industri dengan cara yang lebih lengkap, mudah dan stabil. Antaranya, SDK Linux Xuantie menawarkan set subsistem yang kaya, termasuk virtualisasi Hypervisor, rangka kerja keselamatan CoVE, rangka kerja AI Xuantie dan perpustakaan pengendali berprestasi tinggi, memudahkan pembangunan RISC-V dalam senario berprestasi tinggi dan AI.
Sambil membangunkan teknologi perkakasan dan perisian berprestasi tinggi, Xuantie juga secara aktif memacu inovasi kolaboratif di kalangan rakan kongsi industri huluan dan hiliran, mempercepatkan penggunaan ekosistem RISC-V ‘prestasi tinggi + AI’ yang komprehensif.
Dedikasi Alibaba: RISC-V Xuantie Menerajui Komuniti Sumber Terbuka Antarabangsa
Bagi mereka yang tidak biasa dengan Xuantie, berikut ialah pengenalan ringkas.
Pada tahun 2018, Alibaba menubuhkan jenama Xuantie, memfokuskan pada arah RISC-V. Setahun kemudian, pemproses pertama, C910, muncul sebagai pemproses RISC-V yang paling berkuasa pada masa itu. Sejak itu, Xuantie telah menjadi peneraju dalam ekosistem RISC-V antarabangsa dan salah satu penyumbang China terbesar kepada komuniti sumber terbuka antarabangsa. Ia kini memegang jawatan pengerusi atau naib pengerusi dalam jawatankuasa teknikal yayasan dan lebih daripada 10 jawatankuasa kecil teknikal, secara aktif mempromosikan penyeragaman teknologi berkaitan AI.
Sejak 2019, Xuantie telah melancarkan 13 pemproses RISC-V, meliputi pelbagai senario seperti prestasi tinggi, kecekapan tenaga tinggi dan penggunaan kuasa yang rendah. Ini termasuk:
- Siri C (Pengkomputeran): Terutamanya menyasarkan pelayan mewah, pengkomputeran pinggir mewah dan IPC gred industri/pengguna.
- Siri E (Terbenam): Terutamanya digunakan dalam MPU mewah dan pelbagai MCU.
- Siri R (Kebolehpercayaan & Masa Nyata): Menyasarkan SSD mewah, komunikasi, kawalan industri mewah, automotif dan senario lain.
- XT-Link: IP antara sambungan berbilang kelompok CPU.
Sehingga kini, penghantaran pemproses Xuantie telah melebihi 4 bilion unit, menjadikannya salah satu siri produk pemproses yang paling berpengaruh dan peneraju pasaran dalam bidang RISC-V domestik.
Sepanjang pembangunannya, Xuantie secara konsisten menolak sempadan prestasi RISC-V, berusaha untuk prestasi yang lebih tinggi. Pada masa yang sama, ia secara aktif menerima AI, bertujuan untuk menubuhkan RISC-V sebagai seni bina pengkomputeran AI natif.
Pada peringkat teknologi seni bina set arahan, memanfaatkan keterbukaan dan fleksibiliti unggul seni bina RISC-V, Xuantie telah lama menyesuaikan sambungan set arahan untuk aplikasi AI. Set arahan sambungan Matriks yang dicadangkan dan pengoptimuman pengendali teras GEMM untuk model besar boleh mempercepatkan inferens dan latihan AI, meningkatkan kecekapan tenaga AI pada peranti pinggir.
Dari segi pemproses, Xuantie C907 adalah yang pertama melaksanakan sambungan Matriks, mencapai pecutan 15x berbanding penyelesaian tradisional. C920 yang dinaik taraf menyokong teknologi Vektor 1.0 dan Vektor Kripto, meningkatkan prestasi GEMM sebanyak lebih 7x dan prestasi pengendali Transformer sebanyak lebih 17x. Pemproses perdana terkini, C930, menampilkan kedua-dua enjin vektor dan matriks, meletakkannya sebagai rakan kongsi yang menjanjikan untuk model AI besar pada peranti pinggir.
Pada peringkat tindanan perisian, Xuantie telah mencipta platform perkakasan dan perisian tindanan penuh AI RISC-V hujung ke hujung. Platform ini menyediakan pengeluar cip dengan infrastruktur pengkomputeran AI yang cekap dan tujuan umum, membentuk reka bentuk saluran paip yang berorientasikan keperluan perniagaan, benar-benar membolehkan pengoptimuman yang mudah dan mendalam daripada reka bentuk perkakasan asas kepada rantaian alat perisian lapisan atas. Platform ini telah digunakan pada produk terminal seperti kad transkod video awan, kotak pengkomputeran pinggir AI dan komputer riba RISC-V.
Sebagai tambahan kepada teknologinya sendiri, pasukan RISC-V Akademi DAMO secara konsisten melibatkan rakan kongsi industri huluan dan hiliran untuk meningkatkan ekosistem ‘prestasi tinggi + AI’ RISC-V.
Pada persidangan tahun lepas, komputer riba sumber terbuka RISC-V ‘Ruyi BOOK Jia Chen Edition’ membuat penampilan mengejut, menunjukkan operasi perisian komersial besar yang stabil dan lancar. Tahun ini, Institut Perisian, Akademi Sains China, memperkenalkan lagi ‘Ruyi BOOK Yi Si Edition,’ robot pintar, PC AI dan aplikasi berprestasi tinggi RISC-V yang lain.
Antaranya, prototaip PC AI berdasarkan C920 telah berjaya menjalankan model sumber terbuka seperti Llama, Qwen dan DeepSeek, menyokong aplikasi AI seperti pembantu peribadi AI, pengaturcaraan AI dan pengecaman visual. Ini menunjukkan ‘rantaian penuh AI sumber terbuka’ yang lengkap daripada seni bina perkakasan sumber terbuka kepada sistem pengendalian sumber terbuka dan model AI sumber terbuka, sambil turut mengurangkan penggunaan tenaga pengkomputeran unit sebanyak 30%.
Tambahan pula, Xuantie telah bekerjasama dengan rakan kongsi untuk membina penyelesaian praktikal seperti penyelesaian codec video RISC-V dan penyelesaian desktop awan. Untuk menyokong aplikasi dalam lebih banyak industri, Xuantie juga telah menggunakan kuasa pengkomputeran RISC-V dalam PC semua-dalam-satu, AI kawalan industri, robot dan bidang lain.
Ahli akademik Ni Guangnan menyatakan bahawa pelaburan dan inovasi pragmatik Xuantie adalah daya penggerak penting untuk pembangunan sihat ekosistem RISC-V.
Masa Depan Sumber Terbuka
Kejayaan DeepSeek adalah bukti kuasa sumber terbuka. Seni bina set arahan sumber terbuka RISC-V, sejak penubuhannya lebih sedekad lalu, telah mencatatkan laluan pembangunan yang berbeza daripada model x86 tertutup dan ARM berlesen. Ia telah memberikan industri peluang untuk menginovasi seni bina dengan cara yang lebih ringkas dan terbuka, mendapat pengiktirafan yang semakin meningkat.
Ia muncul sebagai calon terbaik untuk seni bina natif era AI. Di satu pihak, RISC-V, dengan komitmennya terhadap keterbukaan dan evolusi berterusan, boleh mengikuti perubahan pesat dalam AI. Sebaliknya, kebolehlanjutan kukuh RISC-V membolehkannya serasi dengan ekosistem seni bina sedia ada melalui pemindahan dan penyesuaian, sambil turut berfungsi sebagai seni bina natif untuk menyokong senario yang baru muncul.
Seperti yang dikatakan oleh Guo Songliu, ketua RISC-V di Institut Perisian, Akademi Sains China: ‘Tindanan perisian AI masih berkembang pesat. Sebagai yang paling fleksibel dan terbuka daripada tiga seni bina set arahan arus perdana, RISC-V sudah pasti yang paling sesuai untuk kadar inovasi teknologi dalam era AI.’