ظهور RISC-V به عنوان یک معماری محاسباتی بومی هوش مصنوعی
محبوبیت انفجاری اخیر DeepSeek موجهایی را در سراسر صنعت هوش مصنوعی ایجاد کرده است و تأثیر آن فراتر از قلمرو هوش مصنوعی است. صنعت نیمههادی، بهویژه، به این موضوع توجه کرده است. در طول سال نو چینی، آکادمی Xuantie DAMO علیبابا، سازگاری مدل تقطیر سری DeepSeek-R1 را اعلام کرد که نشاندهنده حرکت قوی معماری مجموعه دستورالعمل متنباز نوظهور، RISC-V، در حوزه هوش مصنوعی است.
در کنفرانس اخیر اکوسیستم Xuantie RISC-V، اخبار هیجانانگیزی منتشر شد: RISC-V در محاسبات با کارایی بالا و هوش مصنوعی به پیشرفتهایی دست یافته است. Xuantie C930، اولین CPU درجه سرور از آکادمی DAMO، قرار است ماه آینده تحویل داده شود. قدرت محاسباتی هوش مصنوعی بهطور قابلتوجهی افزایشیافته آن، استقرار یک اکوسیستم جامع RISC-V ‘با کارایی بالا + هوش مصنوعی’ را تسریع میکند.
آیا معماری محاسباتی متنباز RISC-V میتواند شریک ایدهآل برای هوش مصنوعی متنباز باشد؟
تحول مدل هوش مصنوعی، نوآوری در معماری محاسباتی را تقویت میکند
یک متخصص باتجربه در صنعت تراشه توضیح داد که تأثیر DeepSeek نه تنها در محافل هوش مصنوعی، بلکه بهطور عمیق در صنعت تراشه نیز احساس میشود. DeepSeek، از طریق طراحی بسیار بهینهشده خود، هزینههای آموزش و استنتاج مدلهای بزرگ زبانی را به شدت کاهش داده است. این تغییر، تعادل موجود قدرت محاسباتی، حافظه و اتصال متقابل را به طرز چشمگیری تغییر داده و فرصتهای مهمی را برای پیشرفت در معماری محاسباتی ایجاد کرده است.
بهطور سنتی، مدلهای بزرگ هوش مصنوعی، به دلیل نیازهای محاسباتی و حافظه فشرده، برای استقرار در ابر به جای دستگاههای لبه مناسبتر بودند. با این حال، ورود DeepSeek این اتکا به قدرت محاسباتی بالا را به چالش کشیده است. با کاهش هزینههای آموزش و استنتاج، راه را برای انتقال مدلهای بزرگ از ابر به لبه هموار میکند.
بهطور خاص، کاهش نیازهای محاسباتی DeepSeek، استقرار تکماشینی را امکانپذیر میسازد و سازگاری آن را با دستگاههای لبه و انتهایی افزایش میدهد. از آنجایی که هوش مصنوعی به دنبال نفوذ در صنایع و سناریوهای مختلف است، نیاز به حرکت از ابر به لبه بهطور فزایندهای حیاتی میشود. این تغییر برای پاسخگویی به نیازهای متنوعی مانند امنیت دادهها، سفارشیسازی شخصیشده و استقرار خصوصی ضروری است.
قابل پیشبینی است که با پذیرش گسترده فناوری DeepSeek، چشمانداز تراشههای هوش مصنوعی دستخوش تحول خواهد شد. از محاسبات موازی در مقیاس بزرگ که به زیرساختهای ابری متکی هستند، تراشههای هوش مصنوعی به سمت طراحیهای متنوع، کارآمد و کممصرف که قادر به عملکرد مستقل در دستگاههای لبه هستند، در حال تکامل هستند.
این امر باعث شده است که بسیاری در این صنعت به این فکر کنند: چه معماری محاسباتی برای هوش مصنوعی مناسبتر است؟
GPUها، با قابلیتهای پردازش موازی خود، ممکن است تنها راهحل نباشند. محاسبات سریال (محاسبات همهمنظوره) نیز به عنوان یک پایه مناسب برای محاسبات هوش مصنوعی در حال ظهور است. تجربه صنعت نشان میدهد که DeepSeek سازگاری خوبی با سیستمهای محاسباتی مختلف نشان میدهد. توانایی آن برای استقرار سریع و انجام استنتاج موثر بر روی CPUها، CPUها را دوباره به کانون توجه بازگردانده است. در مقایسه با GPUهای تخصصی، CPUها مزیت همهکاره بودن، زمانبندی سادهشده، کاهش قابلتوجه نیازهای قدرت محاسباتی و مزایای محاسبات همگن را ارائه میدهند.
در میان CPUها، ستاره در حال ظهور، RISC-V، توجه قابلتوجهی را به خود جلب میکند.
در طول سال نو چینی، آکادمی DAMO مدل تقطیر سری DeepSeek-R1 را بر روی تراشهای که توسط پردازنده RISC-V Xuantie C920 تغذیه میشود، تطبیق داد. کل فرآیند تنها یک ساعت طول کشید و تجربهای سریع و بدون درز را نشان داد. این نشان میدهد که مدلهای سری DeepSeek میتوانند بهطور روان در طیف کاملی از پلتفرمهای CPU Xuantie و سایر دستگاههای انتهایی هوش مصنوعی مجهز به تراشههای معماری RISC-V مستقر و اجرا شوند.
برجستگی RISC-V از چندین عامل ناشی میشود. اولاً، به عنوان یک معماری مجموعه دستورالعمل نوظهور، خود را از مدلهای مجوز بسته یا پولی x86 و ARM با پذیرش یک رویکرد متنباز متمایز میکند. این روحیه متنباز بهطور طبیعی با هوش مصنوعی همسو میشود. ماهیت باز آن، مشارکت بیش از 1000 شرکت در سراسر جهان را به خود جلب کرده است و رشد سریع اکوسیستم آن، از طراحی سختافزار تا زنجیرههای ابزار نرمافزار را تقویت میکند. طبق بنیاد بینالمللی RISC-V، بیش از 80 محصول تراشه RISC-V مختلف وارد بازار شدهاند.
ثانیاً، RISC-V انعطافپذیری و مقیاسپذیری قابلتوجهی را ارائه میدهد. این به توسعهدهندگان اجازه میدهد تا مجموعه دستورالعملها را با توجه به نیازهای خاص سفارشی کنند. ماهیت ماژولار مجموعه دستورالعملهای آن، امکان سفارشیسازی برای سناریوهای کاربردی مختلف را فراهم میکند، سطحی از انعطافپذیری که با معماریهای سنتی بینظیر است.
از نظر فنی، RISC-V برای انواع جدید محاسبات هوش مصنوعی نیز مناسب است. افزونه برداری آن (V-extension) میتواند بهطور موثر عملیات موازی در مقیاس بزرگ را انجام دهد و نیازهای کارایی محاسبات هوش مصنوعی را برآورده کند. معماری باز RISC-V میتواند با ماژولهای شتابدهنده سختافزاری برای افزایش کارایی اجرای وظایف هوش مصنوعی کار کند. از طریق ادغام عمیق با الگوریتمهای هوش مصنوعی، معماری RISC-V میتواند برای طراحی واحدهای شتابدهنده سختافزاری اختصاصی، بهینهسازی عملکرد برای مدلهای خاص هوش مصنوعی استفاده شود.
بنابراین، بسیاری از کارشناسان باتجربه در صنعت تراشه پیشبینی میکنند که RISC-V به معماری محاسباتی بومی عصر هوش مصنوعی تبدیل خواهد شد.
در سومین کنفرانس اکوسیستم Xuantie RISC-V که توسط آکادمی DAMO علیبابا برگزار شد، این انتظار سرانجام به واقعیت پیوست.
اولین CPU درجه سرور Xuantie برای تحویل: ترکیبی از عملکرد بالا و هوش مصنوعی
در این کنفرانس، نی گوانگنان، یکی از اعضای آکادمی مهندسی چین، اظهار داشت: “RISC-V متنباز نه تنها یک نوآوری تکنولوژیکی است، بلکه یک تحول جهانی است که آینده معماری محاسباتی را تحت تأثیر قرار خواهد داد.” RISC-V به عنوان یک معماری مجموعه دستورالعمل تراشه که “متنباز متولد شده است”، عملکرد قابلتوجهی را در این چرخه صنعت نیمههادی نشان داده است. این پیشرفت خود را از سیستمهای تعبیهشده به سناریوهای پیچیده مانند محاسبات با کارایی بالا تسریع کرده است و گزینه جدیدی را برای قدرت محاسباتی هوش مصنوعی ارائه میدهد.
در میان 25 استاندارد تایید شده توسط بنیاد بینالمللی RISC-V در سال 2024، بیش از نیمی از آنها مربوط به عملکرد بالا یا هوش مصنوعی هستند. لو دای، رئیس هیئت مدیره بنیاد بینالمللی RISC-V، در این کنفرانس اظهار داشت که یکی از هیجانانگیزترین پیشرفتها در مجموعه دستورالعمل RISC-V، افزونه Matrix است که RISC-V را به نیرویی قدرتمند در زمینه هوش مصنوعی تبدیل خواهد کرد.
پیشبینی میشود که تا سال 2030، سهم کلی بازار RISC-V به 20 درصد برسد و سهم آن در شتابدهندههای هوش مصنوعی ممکن است از 50 درصد فراتر رود.
در این کنفرانس، آکادمی DAMO از پردازنده پرچمدار نسل بعدی خود و اولین پردازنده درجه سرور، C930 رونمایی کرد.
C930 در بنچمارک SPECint2006 به معیار قدرت محاسباتی همهمنظوره 15/GHz دست مییابد. این به چه معناست؟ آکادمیسین نی گوانگنان اشاره کرد که برای اینکه RISC-V واقعاً وارد بازار محاسبات با کارایی بالا شود، باید در نرمافزار تست SPECint 2006 به امتیاز عملکرد بالایی بیش از 15 دست یابد. بنابراین، C930 یک گام مهم برای RISC-V است.
علاوه بر این، C930 به دو موتور مجهز شده است: RVV1.0 512 بیتی و 8 TOPS Matrix. این قدرت محاسباتی همهمنظوره با کارایی بالا را با قدرت محاسباتی هوش مصنوعی بهطور بومی ادغام میکند. همچنین یک رابط افزونه DSA باز برای پشتیبانی از الزامات ویژگیهای بیشتر فراهم میکند.
همزمان، آکادمی DAMO برنامههای توسعه خود را برای اعضای جدید خانواده پردازندههای Xuantie، از جمله C908X، R908A و XL200، فاش کرد که به تکامل در جهتهایی مانند شتاب هوش مصنوعی، کاربردهای خودرو و اتصال متقابل با سرعت بالا ادامه میدهند. بهطور خاص، C908X به عنوان اولین پردازنده اختصاصی هوش مصنوعی Xuantie، با پشتیبانی از افزونه برداری RVV1.0 با پهنای بیت داده فوقالعاده طولانی 4096 بیت، قرار گرفته است. R908A برای الزامات قابلیت اطمینان بالای تراشههای درجه خودرو هدفگذاری شده است. XL200 اتصال متقابل چند خوشهای در مقیاس بزرگتر و با کارایی بالاتر را فراهم میکند.
برای تکمیل قابلیتهای پردازندههای Xuantie، آکادمی DAMO همچنین سه SDK Xuantie را بر اساس سه سیستمعامل اصلی: Linux، Android و RTOS راهاندازی کرده است. این SDKها بهطور جامع قابلیتهای نرمافزاری انباشتهشده Xuantie را در طول سالها ادغام میکنند و آنها را به شیوهای کاملتر، راحتتر و پایدارتر در اختیار صنعت قرار میدهند. در میان آنها، Xuantie Linux SDK مجموعه غنی از زیرسیستمها، از جمله مجازیسازی Hypervisor، چارچوب امنیتی CoVE، چارچوب Xuantie AI و کتابخانههای اپراتور با کارایی بالا را ارائه میدهد که توسعه RISC-V را در سناریوهای با کارایی بالا و هوش مصنوعی تسهیل میکند.
Xuantie ضمن توسعه فناوریهای سختافزاری و نرمافزاری با کارایی بالا، بهطور فعال نوآوری مشترک را در میان شرکای صنعتی بالادستی و پاییندستی هدایت میکند و استقرار یک اکوسیستم جامع RISC-V ‘با کارایی بالا + هوش مصنوعی’ را تسریع میکند.
تعهد علیبابا: RISC-V Xuantie جامعه بینالمللی متنباز را رهبری میکند
برای کسانی که با Xuantie آشنا نیستند، در اینجا یک معرفی مختصر ارائه میشود.
در سال 2018، علیبابا برند Xuantie را تأسیس کرد که بر جهت RISC-V تمرکز داشت. یک سال بعد، اولینپردازنده، C910، به عنوان قدرتمندترین پردازنده RISC-V در آن زمان ظاهر شد. از آن زمان، Xuantie پیشرو در اکوسیستم بینالمللی RISC-V و یکی از بزرگترین مشارکتکنندگان چینی در جامعه بینالمللی متنباز بوده است. در حال حاضر دارای سمتهای رئیس یا نایب رئیس در کمیته فنی بنیاد و بیش از 10 کمیته فرعی فنی است و بهطور فعال استانداردسازی فناوریهای مرتبط با هوش مصنوعی را ترویج میکند.
از سال 2019، Xuantie 13 پردازنده RISC-V را راهاندازی کرده است که سناریوهای مختلفی مانند عملکرد بالا، راندمان انرژی بالا و مصرف کم انرژی را پوشش میدهد. اینها شامل:
- سری C (محاسبات): عمدتاً سرورهای پیشرفته، محاسبات لبه پیشرفته و IPCهای صنعتی/مصرفی را هدف قرار میدهد.
- سری E (تعبیهشده): عمدتاً در MPUهای پیشرفته و MCUهای مختلف استفاده میشود.
- سری R (قابلیت اطمینان و بیدرنگ): SSDهای پیشرفته، ارتباطات، کنترل صنعتی پیشرفته، خودرو و سایر سناریوها را هدف قرار میدهد.
- XT-Link: یک IP اتصال متقابل چند خوشهای CPU.
تا به امروز، محمولههای پردازنده Xuantie از 4 میلیارد واحد فراتر رفته است و آن را به یکی از تاثیرگذارترین و پیشروترین سری محصولات پردازنده در زمینه داخلی RISC-V تبدیل کرده است.
در طول توسعه خود، Xuantie بهطور مداوم مرزهای عملکرد RISC-V را جابجا کرده و برای عملکرد بالاتر تلاش کرده است. همزمان، بهطور فعال هوش مصنوعی را پذیرفته است و هدف آن ایجاد RISC-V به عنوان یک معماری محاسباتی بومی هوش مصنوعی است.
در سطح فناوری معماری مجموعه دستورالعمل، با استفاده از باز بودن و انعطافپذیری برتر معماری RISC-V، Xuantie مدتهاست که افزونههای مجموعه دستورالعمل را برای کاربردهای هوش مصنوعی سفارشی کرده است. مجموعه دستورالعمل افزونه Matrix پیشنهادی آن و بهینهسازی اپراتور هسته GEMM برای مدلهای بزرگ میتواند استنتاج و آموزش هوش مصنوعی را تسریع کند و بازده انرژی هوش مصنوعی را در دستگاههای لبه بهبود بخشد.
از نظر پردازندهها، Xuantie C907 اولین کسی بود که افزونه Matrix را پیادهسازی کرد و به سرعت 15 برابری در مقایسه با راهحلهای سنتی دست یافت. C920 ارتقا یافته از فناوریهای Vector 1.0 و Vector Crypto پشتیبانی میکند و عملکرد GEMM را بیش از 7 برابر و عملکرد اپراتور Transformer را بیش از 17 برابر بهبود میبخشد. آخرین پردازنده پرچمدار، C930، دارای دو موتور برداری و ماتریسی است که آن را به عنوان یک شریک امیدوارکننده برای مدلهای بزرگ هوش مصنوعی در دستگاههای لبه قرار میدهد.
در سطح پشته نرمافزار، Xuantie یک پلتفرم نرمافزاری و سختافزاری هوش مصنوعی RISC-V سرتاسری ایجاد کرده است. این پلتفرم یک زیرساخت محاسباتی هوش مصنوعی همهمنظوره و کارآمد را در اختیار تولیدکنندگان تراشه قرار میدهد و یک طراحی خط لوله را با جهتگیری به سمت نیازهای تجاری تشکیل میدهد و واقعاً بهینهسازی راحت و عمیق را از طراحی سختافزار زیربنایی تا زنجیرههای ابزار نرمافزار لایه بالایی امکانپذیر میکند. این پلتفرم در محصولات ترمینال مانند کارتهای کدگذاری مجدد ویدئو ابری، جعبههای محاسبات لبه هوش مصنوعی و لپتاپهای RISC-V اعمال شده است.
علاوه بر فناوری خود، تیم RISC-V آکادمی DAMO بهطور مداوم با شرکای صنعتی بالادستی و پاییندستی برای تقویت اکوسیستم ‘با کارایی بالا + هوش مصنوعی’ RISC-V همکاری کرده است.
در کنفرانس سال گذشته، لپتاپ متنباز RISC-V ‘Ruyi BOOK Jia Chen Edition’ بهطور غافلگیرکنندهای ظاهر شد و عملکرد پایدار و روان نرمافزارهای تجاری بزرگ را نشان داد. امسال، موسسه نرمافزار، آکادمی علوم چین، ‘Ruyi BOOK Yi Si Edition’، رباتهای هوشمند، رایانههای شخصی هوش مصنوعی و سایر برنامههای کاربردی با کارایی بالا RISC-V را معرفی کرد.
در میان آنها، نمونه اولیه رایانه شخصی هوش مصنوعی مبتنی بر C920 با موفقیت مدلهای متنباز مانند Llama، Qwen و DeepSeek را اجرا کرده است و از برنامههای کاربردی هوش مصنوعی مانند دستیار شخصی هوش مصنوعی، برنامهنویسی هوش مصنوعی و تشخیص بصری پشتیبانی میکند. این یک ‘زنجیره کامل هوش مصنوعی متنباز’ را از معماری سختافزار متنباز تا سیستمعاملهای متنباز و مدلهای هوش مصنوعی متنباز نشان میدهد، در حالی که مصرف انرژی محاسباتی واحد را نیز 30 درصد کاهش میدهد.
علاوه بر این، Xuantie با شرکا برای ساخت راهحلهای عملی مانند راهحلهای کدک ویدئویی RISC-V و راهحلهای دسکتاپ ابری همکاری کرده است. برای پشتیبانی از برنامههای کاربردی در صنایع بیشتر، Xuantie همچنین قدرت محاسباتی RISC-V را در رایانههای شخصی همهکاره، هوش مصنوعی کنترل صنعتی، رباتها و سایر زمینهها مستقر کرده است.
آکادمیسین نی گوانگنان اظهار داشت که سرمایهگذاری و نوآوری عملگرایانه Xuantie نیروهای محرکه حیاتی برای توسعه سالم اکوسیستم RISC-V هستند.
آینده متنباز
موفقیت DeepSeek گواهی بر قدرت متنباز است. معماری مجموعه دستورالعمل متنباز RISC-V، از زمان پیدایش خود در بیش از یک دهه پیش، مسیر توسعه متفاوتی را از x86 بسته و مدلهای ARM دارای مجوز ترسیم کرده است. این به صنعت فرصتی برای نوآوری معماریها به شیوهای مختصرتر و بازتر ارائه کرده است و به طور فزایندهای به رسمیت شناخته میشود.
این در حال ظهور به عنوان بهترین کاندید برای معماری بومی عصر هوش مصنوعی است. از یک سو، RISC-V، با تعهد خود به باز بودن و تکامل مداوم، میتواند با تغییرات سریع در هوش مصنوعی همگام شود. از سوی دیگر، قابلیت توسعه قوی RISC-V به آن اجازه میدهد تا از طریق پورت کردن و تطبیق با اکوسیستمهای معماری موجود سازگار باشد، در حالی که به عنوان یک معماری بومی برای پشتیبانی از سناریوهای نوظهور نیز عمل میکند.
همانطور که Guo Songliu، رئیس RISC-V در موسسه نرمافزار، آکادمی علوم چین، گفت: “پشته نرمافزار هوش مصنوعی هنوز به سرعت در حال تکامل است. RISC-V به عنوان انعطافپذیرترین و بازترین معماری از بین سه معماری مجموعه دستورالعمل اصلی، بدون شک مناسبترین معماری برای سرعت نوآوری تکنولوژیکی در عصر هوش مصنوعی است.”