Sự trỗi dậy của RISC-V như một kiến trúc điện toán gốc AI
Sự phổ biến bùng nổ gần đây của DeepSeek đã tạo ra những làn sóng trong ngành công nghiệp AI, và tác động của nó không chỉ dừng lại ở lĩnh vực trí tuệ nhân tạo. Ngành công nghiệp bán dẫn, đặc biệt, đã chú ý. Trong dịp Tết Nguyên Đán, Xuantie của Học viện DAMO thuộc Alibaba đã công bố việc điều chỉnh mô hình chưng cất DeepSeek-R1, thể hiện động lực mạnh mẽ của kiến trúc tập lệnh mã nguồn mở mới nổi, RISC-V, trong lĩnh vực AI.
Tại Hội nghị Hệ sinh thái RISC-V Xuantie gần đây, tin tức thú vị đã xuất hiện: RISC-V đã đạt được những đột phá trong cả điện toán hiệu năng cao và AI. Xuantie C930, CPU cấp máy chủ đầu tiên của Học viện DAMO, dự kiến sẽ bắt đầu giao hàng vào tháng tới. Sức mạnh tính toán AI được tăng cường đáng kể của nó giúp tăng tốc việc triển khai hệ sinh thái RISC-V ‘hiệu suất cao + AI’ toàn diện.
Liệu kiến trúc điện toán mã nguồn mở RISC-V có phải là đối tác lý tưởng cho AI mã nguồn mở?
Chuyển đổi mô hình AI thúc đẩy đổi mới trong kiến trúc điện toán
Một chuyên gia dày dạn kinh nghiệm trong ngành công nghiệp chip giải thích rằng tác động của DeepSeek không chỉ được cảm nhận trong giới AI mà còn sâu sắc trong ngành công nghiệp chip. DeepSeek, thông qua thiết kế được tối ưu hóa cao, đã giảm đáng kể chi phí đào tạo và suy luận của các mô hình ngôn ngữ lớn. Sự thay đổi này đã làm thay đổi đáng kể sự cân bằng hiện có về sức mạnh tính toán, bộ nhớ và kết nối, tạo ra những cơ hội đáng kể cho những đột phá trong kiến trúc điện toán.
Theo truyền thống, các mô hình AI lớn, do yêu cầu tính toán và bộ nhớ chuyên sâu, phù hợp hơn để triển khai trên đám mây hơn là trên các thiết bị biên. Tuy nhiên, sự xuất hiện của DeepSeek đã thách thức sự phụ thuộc vào sức mạnh tính toán cao này. Bằng cách giảm cả chi phí đào tạo và suy luận, nó đang mở đường cho các mô hình lớn chuyển đổi từ đám mây sang biên.
Cụ thể, nhu cầu tính toán giảm của DeepSeek giúp việc triển khai trên một máy duy nhất trở nên khả thi, tăng cường khả năng tương thích với các thiết bị biên và thiết bị đầu cuối. Khi AI tìm cách thâm nhập vào các ngành và kịch bản khác nhau, nhu cầu di chuyển từ đám mây sang biên ngày càng trở nên quan trọng. Sự thay đổi này là cần thiết để đáp ứng các nhu cầu đa dạng như bảo mật dữ liệu, tùy chỉnh cá nhân hóa và triển khai riêng tư.
Có thể thấy trước rằng, với việc áp dụng rộng rãi công nghệ DeepSeek, bối cảnh chip AI sẽ trải qua một sự chuyển đổi. Từ tính toán song song quy mô lớn dựa vào cơ sở hạ tầng đám mây, chip AI đang phát triển theo hướng thiết kế đa dạng, hiệu quả và tiết kiệm điện năng có khả năng hoạt động độc lập trên các thiết bị biên.
Điều này đã khiến nhiều người trong ngành phải suy nghĩ: kiến trúc điện toán nào phù hợp nhất cho AI?
GPU, với khả năng xử lý song song, có thể không phải là giải pháp duy nhất. Tính toán nối tiếp (tính toán đa năng) cũng đang nổi lên như một nền tảng khả thi cho tính toán AI. Kinh nghiệm trong ngành chứng minh rằng DeepSeek thể hiện khả năng tương thích tốt với các hệ thống điện toán khác nhau. Khả năng được triển khai nhanh chóng và thực hiện suy luận hiệu quả trên CPU đã đưa CPU trở lại ánh đèn sân khấu. So với GPU chuyên dụng, CPU có lợi thế về tính linh hoạt, đơn giản hóa việc lập lịch, giảm đáng kể yêu cầu về sức mạnh tính toán và lợi ích của tính toán đồng nhất.
Trong số các CPU, ngôi sao đang lên, RISC-V, đang thu hút sự chú ý đáng kể.
Trong dịp Tết Nguyên Đán, Học viện DAMO đã điều chỉnh mô hình chưng cất DeepSeek-R1 trên một con chip được trang bị bộ xử lý RISC-V Xuantie C920. Toàn bộ quá trình chỉ mất một giờ, thể hiện trải nghiệm nhanh chóng và liền mạch. Điều này có nghĩa là các mô hình dòng DeepSeek có thể được triển khai và chạy trơn tru trên toàn bộ các nền tảng CPU Xuantie và các thiết bị đầu cuối AI khác được trang bị chip kiến trúc RISC-V.
Sự nổi bật của RISC-V bắt nguồn từ một số yếu tố. Thứ nhất, là một kiến trúc tập lệnh mới nổi, nó khác biệt với các mô hình cấp phép đóng hoặc trả phí của x86 và ARM bằng cách áp dụng phương pháp tiếp cận mã nguồn mở. Tinh thần mã nguồn mở này phù hợp một cách tự nhiên với AI. Bản chất mở của nó đã thu hút sự tham gia của hơn 1.000 công ty trên toàn thế giới, thúc đẩy sự phát triển nhanh chóng trong hệ sinh thái của nó, từ thiết kế phần cứng đến chuỗi công cụ phần mềm. Theo RISC-V International Foundation, hơn 80 sản phẩm chip RISC-V khác nhau đã gia nhập thị trường.
Thứ hai, RISC-V cung cấp tính linh hoạt và khả năng mở rộng vượt trội. Nó cho phép các nhà phát triển tùy chỉnh tập lệnh theo nhu cầu cụ thể. Bản chất mô-đun của tập lệnh cho phép tùy chỉnh cho các kịch bản ứng dụng khác nhau, một mức độ linh hoạt mà các kiến trúc truyền thống không thể sánh được.
Về mặt kỹ thuật, RISC-V cũng rất phù hợp cho các loại hình tính toán AI mới. Phần mở rộng vectơ (V-extension) của nó có thể xử lý hiệu quả các hoạt động song song quy mô lớn, đáp ứng nhu cầu hiệu quả của tính toán AI. Kiến trúc mở của RISC-V có thể hoạt động phối hợp với các mô-đun tăng tốc phần cứng để nâng cao hiệu quả thực hiện các tác vụ AI. Thông qua tích hợp sâu với các thuật toán AI, kiến trúc RISC-V có thể được sử dụng để thiết kế các đơn vị tăng tốc phần cứng chuyên dụng, tối ưu hóa hiệu suất cho các mô hình AI cụ thể.
Do đó, nhiều chuyên gia dày dạn kinh nghiệm trong ngành công nghiệp chip dự đoán rằng RISC-V sẽ trở thành kiến trúc điện toán gốc của kỷ nguyên AI.
Tại Hội nghị Hệ sinh thái RISC-V Xuantie lần thứ ba do Học viện DAMO của Alibaba tổ chức, kỳ vọng này cuối cùng đã thành hiện thực.
CPU cấp máy chủ đầu tiên của Xuantie chuẩn bị giao hàng: Sự kết hợp giữa hiệu suất cao và AI
Tại hội nghị, Ni Guangnan, một viện sĩ của Học viện Kỹ thuật Trung Quốc, tuyên bố, ‘RISC-V mã nguồn mở không chỉ là một sự đổi mới công nghệ mà còn là một sự chuyển đổi toàn cầu sẽ ảnh hưởng đến tương lai của kiến trúc điện toán.’ Là một kiến trúc tập lệnh chip ‘sinh ra mã nguồn mở’, RISC-V đã thể hiện hiệu suất vượt trội trong chu kỳ ngành công nghiệp bán dẫn này. Nó đã tăng tốc tiến độ từ các hệ thống nhúng sang các kịch bản phức tạp như điện toán hiệu năng cao, cung cấp một tùy chọn mới cho sức mạnh tính toán AI.
Trong số 25 tiêu chuẩn được RISC-V International Foundation phê duyệt vào năm 2024, hơn một nửa có liên quan đến hiệu suất cao hoặc AI. Lu Dai, Chủ tịch Hội đồng Quản trị của RISC-V International Foundation, tuyên bố tại hội nghị rằng một trong những tiến bộ thú vị nhất trong tập lệnh RISC-V là phần mở rộng Matrix, sẽ thúc đẩy RISC-V trở thành một thế lực đáng gờm trong lĩnh vực AI.
Người ta dự đoán rằng đến năm 2030, tổng thị phần của RISC-V sẽ đạt 20%, với thị phần trong các bộ tăng tốc AI có khả năng vượt quá 50%.
Tại hội nghị, Học viện DAMO đã công bố bộ xử lý hàng đầu thế hệ tiếp theo và bộ xử lý cấp máy chủ đầu tiên, C930.
C930 đạt được điểm chuẩn sức mạnh tính toán đa năng là 15/GHz trong bài kiểm tra điểm chuẩn SPECint2006. Điều này có ý nghĩa gì? Viện sĩ Ni Guangnan chỉ ra rằng để RISC-V thực sự gia nhập thị trường điện toán hiệu năng cao, nó phải đạt được điểm hiệu suất cao vượt quá 15 trong bài kiểm tra phần mềm SPECint 2006. Do đó, C930 đại diện cho một bước tiến quan trọng đối với RISC-V.
Hơn nữa, C930 được trang bị động cơ kép: RVV1.0 512 bit và 8 TOPS Matrix. Điều này tích hợp sức mạnh tính toán hiệu suất cao đa năng với sức mạnh tính toán AI một cách tự nhiên. Nó cũng cung cấp giao diện mở rộng DSA mở để hỗ trợ nhiều yêu cầu tính năng hơn.
Đồng thời, Học viện DAMO đã tiết lộ kế hoạch phát triển cho các thành viên mới của dòng bộ xử lý Xuantie, bao gồm C908X, R908A và XL200, tiếp tục phát triển theo các hướng như tăng tốc AI, ứng dụng ô tô và kết nối tốc độ cao. Cụ thể, C908X được định vị là bộ xử lý AI chuyên dụng đầu tiên của Xuantie, hỗ trợ phần mở rộng vectơ RVV1.0 độ rộng bit dữ liệu cực dài 4096 bit. R908A nhắm đến các yêu cầu độ tin cậy cao của chip cấp ô tô. XL200 sẽ cung cấp kết nối liên cụm đa cụm quy mô lớn hơn, hiệu suất cao hơn.
Để bổ sung cho khả năng của bộ xử lý Xuantie, Học viện DAMO cũng đã ra mắt ba SDK Xuantie dựa trên ba hệ điều hành chính: Linux, Android và RTOS. Các SDK này tích hợp toàn diện các khả năng phần mềm tích lũy của Xuantie trong những năm qua, cung cấp chúng cho ngành công nghiệp một cách đầy đủ, tiện lợi và ổn định hơn. Trong số đó, Xuantie Linux SDK cung cấp một tập hợp phong phú các hệ thống con, bao gồm ảo hóa Hypervisor, khung bảo mật CoVE, khung AI Xuantie và thư viện toán tử hiệu suất cao, tạo điều kiện cho sự phát triển của RISC-V trong các kịch bản hiệu suất cao và AI.
Trong khi phát triển các công nghệ phần cứng và phần mềm hiệu suất cao, Xuantie cũng đang tích cực thúc đẩy sự đổi mới hợp tác giữa các đối tác trong ngành thượng nguồn và hạ nguồn, tăng tốc việc triển khai hệ sinh thái RISC-V ‘hiệu suất cao + AI’ toàn diện.
Sự cống hiến của Alibaba: RISC-V Xuantie dẫn đầu cộng đồng mã nguồn mở quốc tế
Đối với những người không quen thuộc với Xuantie, đây là phần giới thiệu ngắn gọn.
Năm 2018, Alibaba thành lập thương hiệu Xuantie, tập trung vào hướng RISC-V. Một năm sau, bộ xử lý đầu tiên, C910, xuất hiện như bộ xử lý RISC-V mạnh nhất vào thời điểm đó. Kể từ đó, Xuantie đã là công ty hàng đầu trong hệ sinh thái RISC-V quốc tế và là một trong những công ty đóng góp lớn nhất của Trung Quốc cho cộng đồng mã nguồn mở quốc tế. Nó hiện đang giữ các vị trí chủ tịch hoặc phó chủ tịch trong ủy ban kỹ thuật của tổ chức và hơn 10 tiểu ban kỹ thuật, tích cực thúc đẩy việc tiêu chuẩn hóa các công nghệ liên quan đến AI.
Kể từ năm 2019, Xuantie đã ra mắt 13 bộ xử lý RISC-V, bao gồm các kịch bản khác nhau như hiệu suất cao, hiệu quả năng lượng cao và tiêu thụ điện năng thấp. Chúng bao gồm:
- Dòng C (Computing): Chủ yếu nhắm mục tiêu các máy chủ cao cấp, điện toán biên cao cấp và IPC cấp công nghiệp/tiêu dùng.
- Dòng E (Embedded): Chủ yếu được sử dụng trong các MPU cao cấp và các MCU khác nhau.
- Dòng R (Reliability & Realtime):Nhắm mục tiêu các SSD cao cấp, truyền thông, điều khiển công nghiệp cao cấp, ô tô và các kịch bản khác.
- XT-Link: Một IP kết nối liên cụm đa cụm CPU.
Đến nay, các lô hàng bộ xử lý Xuantie đã vượt quá 4 tỷ chiếc, khiến nó trở thành một trong những dòng sản phẩm bộ xử lý có ảnh hưởng và dẫn đầu thị trường nhất trong lĩnh vực RISC-V trong nước.
Trong suốt quá trình phát triển, Xuantie đã liên tục đẩy các ranh giới hiệu suất của RISC-V, phấn đấu cho hiệu suất ngày càng cao hơn. Đồng thời, nó đã tích cực đón nhận AI, nhằm mục đích thiết lập RISC-V như một kiến trúc điện toán AI gốc.
Ở cấp độ công nghệ kiến trúc tập lệnh, tận dụng tính mở và tính linh hoạt vượt trội của kiến trúc RISC-V, Xuantie từ lâu đã tùy chỉnh các phần mở rộng tập lệnh cho các ứng dụng AI. Tập lệnh mở rộng Matrix được đề xuất và tối ưu hóa toán tử lõi GEMM cho các mô hình lớn có thể tăng tốc suy luận và đào tạo AI, cải thiện hiệu quả năng lượng của AI trên các thiết bị biên.
Về bộ xử lý, Xuantie C907 là sản phẩm đầu tiên triển khai phần mở rộng Matrix, đạt được tốc độ tăng gấp 15 lần so với các giải pháp truyền thống. C920 được nâng cấp hỗ trợ các công nghệ Vector 1.0 và Vector Crypto, cải thiện hiệu suất GEMM hơn 7 lần và hiệu suất toán tử Transformer hơn 17 lần. Bộ xử lý hàng đầu mới nhất, C930, có cả động cơ vectơ và ma trận, định vị nó như một đối tác đầy hứa hẹn cho các mô hình AI lớn trên các thiết bị biên.
Ở cấp độ ngăn xếp phần mềm, Xuantie đã tạo ra một nền tảng phần cứng và phần mềm AI RISC-V đầu cuối. Nền tảng này cung cấp cho các nhà sản xuất chip một cơ sở hạ tầng điện toán AI hiệu quả, đa năng, tạo thành một thiết kế đường ống hướng đến nhu cầu kinh doanh, thực sự cho phép tối ưu hóa sâu và thuận tiện từ thiết kế phần cứng cơ bản đến chuỗi công cụ phần mềm lớp trên. Nền tảng này đã được áp dụng cho các sản phẩm đầu cuối như thẻ chuyển mã video đám mây, hộp điện toán biên AI và máy tính xách tay RISC-V.
Ngoài công nghệ của riêng mình, nhóm RISC-V của Học viện DAMO đã liên tục hợp tác với các đối tác trong ngành thượng nguồn và hạ nguồn để nâng cao hệ sinh thái ‘hiệu suất cao + AI’ của RISC-V.
Tại hội nghị năm ngoái, máy tính xách tay mã nguồn mở RISC-V ‘Ruyi BOOK Jia Chen Edition’ đã xuất hiện bất ngờ, thể hiện hoạt động ổn định và trơn tru của phần mềm thương mại lớn. Năm nay, Viện Phần mềm, Viện Hàn lâm Khoa học Trung Quốc, tiếp tục giới thiệu ‘Ruyi BOOK Yi Si Edition’, robot thông minh, AI PC và các ứng dụng hiệu suất cao RISC-V khác.
Trong số đó, nguyên mẫu AI PC dựa trên C920 đã chạy thành công các mô hình mã nguồn mở như Llama, Qwen và DeepSeek, hỗ trợ các ứng dụng AI như trợ lý cá nhân AI, lập trình AI và nhận dạng hình ảnh. Điều này thể hiện một ‘chuỗi đầy đủ AI mã nguồn mở’ hoàn chỉnh từ kiến trúc phần cứng mã nguồn mở đến hệ điều hành mã nguồn mở và mô hình AI mã nguồn mở, đồng thời giảm 30% mức tiêu thụ năng lượng tính toán đơn vị.
Hơn nữa, Xuantie đã hợp tác với các đối tác để xây dựng các giải pháp thực tế như giải pháp codec video RISC-V và giải pháp máy tính để bàn đám mây. Để hỗ trợ các ứng dụng trong nhiều ngành công nghiệp hơn, Xuantie cũng đã triển khai sức mạnh tính toán RISC-V trong PC tất cả trong một, AI điều khiển công nghiệp, robot và các lĩnh vực khác.
Viện sĩ Ni Guangnan tuyên bố rằng sự đầu tư và đổi mới thực dụng của Xuantie là động lực quan trọng cho sự phát triển lành mạnh của hệ sinh thái RISC-V.
Tương lai của mã nguồn mở
Thành công của DeepSeek là một minh chứng cho sức mạnh của mã nguồn mở. Kiến trúc tập lệnh mã nguồn mở RISC-V, kể từ khi ra đời hơn một thập kỷ trước, đã vạch ra một con đường phát triển khác với mô hình x86 đóng và mô hình ARM được cấp phép. Nó đã mang đến cho ngành công nghiệp một cơ hội để đổi mới kiến trúc một cách ngắn gọn và cởi mở hơn, ngày càng được công nhận.
Nó đang nổi lên như ứng cử viên tốt nhất cho kiến trúc gốc của kỷ nguyên AI. Một mặt, RISC-V, với cam kết cởi mở và phát triển liên tục, có thể theo kịp những thay đổi nhanh chóng trong AI. Mặt khác, khả năng mở rộng mạnh mẽ của RISC-V cho phép nó tương thích với các hệ sinh thái kiến trúc hiện có thông qua việc chuyển đổi và điều chỉnh, đồng thời đóng vai trò là kiến trúc gốc để hỗ trợ các kịch bản mới nổi.
Như Guo Songliu, người đứng đầu RISC-V tại Viện Phần mềm, Viện Hàn lâm Khoa học Trung Quốc, cho biết: ‘Ngăn xếp phần mềm AI vẫn đang phát triển nhanh chóng. Là kiến trúc tập lệnh linh hoạt và mở nhất trong ba kiến trúc tập lệnh chính, RISC-V chắc chắn là phù hợp nhất với tốc độ đổi mới công nghệ trong kỷ nguyên AI.’