AMD و مسیر جدید هوش مصنوعی روی دستگاه با پروژه GAIA

چشم‌انداز هوش مصنوعی در حال تحولی چشمگیر است. سال‌ها، نیازهای محاسباتی عظیم مدل‌های پیچیده هوش مصنوعی، به‌ویژه مدل‌های زبان بزرگ (LLMs)، عملکرد آن‌ها را عمدتاً به سرورهای قدرتمند و پرمصرف انرژی که در مراکز داده وسیع پنهان شده‌اند، محدود می‌کرد. دسترسی معمولاً شامل ارسال پرس‌وجوها از طریق اینترنت و انتظار برای پاسخ‌های پردازش‌شده از راه دور بود. با این حال، یک تغییر قانع‌کننده به سمت محاسبات محلی، ناشی از پیشرفت در فناوری پردازنده و نگرانی‌های فزاینده در مورد حریم خصوصی داده‌ها و تأخیر، در حال شتاب گرفتن است. Advanced Micro Devices (AMD)، بازیگری قدرتمند در عرصه نیمه‌هادی‌ها، فعالانه این روند را پذیرفته و به دنبال توانمندسازی کاربران برای بهره‌برداری از قابلیت‌های هوش مصنوعی مولد مستقیماً بر روی رایانه‌های شخصی‌شان است. آخرین ابتکار این شرکت در این حوزه، یک پروژه متن‌باز با نام جذاب GAIA است که مخفف ‘Generative AI Is Awesome’ (هوش مصنوعی مولد عالی است) می‌باشد.

آغازگر دوران پردازش محلی هوش مصنوعی

جذابیت اجرای مدل‌های هوش مصنوعی مولد به صورت محلی چندوجهی است. اولاً، به نگرانی‌های فزاینده در مورد حریم خصوصی پاسخ می‌دهد. هنگامی که داده‌ها بر روی دستگاه خود کاربر پردازش می‌شوند، نیاز به انتقال اطلاعات بالقوه حساس به سرورهای شخص ثالث از بین می‌رود و یک پارادایم عملیاتی ذاتاً امن‌تر ارائه می‌دهد. ثانیاً، اجرای محلی می‌تواند تأخیر را به میزان قابل توجهی کاهش دهد؛ تأخیر بین ورودی و خروجی زمانی به حداقل می‌رسد که بار سنگین محاسباتی تنها چند میلی‌متر دورتر از رابط کاربری انجام شود، نه اینکه به‌طور بالقوه قاره‌ها را طی کند. ثالثاً، دسترسی را دموکراتیزه می‌کند. در حالی که هوش مصنوعی مبتنی بر ابر اغلب شامل هزینه‌های اشتراک یا محدودیت‌های استفاده است، پردازش روی دستگاه از سخت‌افزاری که کاربر قبلاً مالک آن است استفاده می‌کند و به‌طور بالقوه مانع ورود برای آزمایش و استفاده از ابزارهای هوش مصنوعی را کاهش می‌دهد.

AMD با درک این پتانسیل، به‌طور استراتژیک هسته‌های پردازشی تخصصی را که صراحتاً برای بارهای کاری هوش مصنوعی طراحی شده‌اند، در معماری‌های پردازنده خود ادغام کرده است. اوج این تلاش‌ها در آخرین پردازنده‌های سری Ryzen AI 300 آن‌ها مشهود است که دارای واحدهای پردازش عصبی (NPUs) پیشرفته هستند. این NPUها برای مدیریت انواع خاصی از عملیات ریاضی رایج در وظایف یادگیری ماشین مهندسی شده‌اند و این کار را با کارایی بسیار بیشتر - هم از نظر سرعت و هم از نظر مصرف انرژی - در مقایسه با هسته‌های CPU سنتی انجام می‌دهند. دقیقاً همین سخت‌افزار اختصاصی است که AMD قصد دارد از طریق پروژه GAIA خود برای کاربران عادی باز کند. Victoria Godsoe، مدیر توانمندسازی توسعه‌دهندگان هوش مصنوعی AMD، بر این هدف تأکید کرد و اظهار داشت که GAIA ‘از قدرت واحد پردازش عصبی (NPU) Ryzen AI برای اجرای مدل‌های زبان بزرگ (LLMs) خصوصی و محلی بهره می‌برد.’ او همچنین مزایا را برجسته کرد: ‘این ادغام امکان پردازش سریع‌تر و کارآمدتر - یعنی توان کمتر - را فراهم می‌کند و در عین حال داده‌های شما را محلی و امن نگه می‌دارد.’

معرفی GAIA: ساده‌سازی استقرار LLM روی دستگاه

GAIA به عنوان پاسخ AMD به این سؤال مطرح می‌شود: چگونه کاربران می‌توانند به راحتی از قابلیت‌های NPU ماشین‌های جدید مجهز به Ryzen AI خود برای اجرای مدل‌های پیچیده هوش مصنوعی استفاده کنند؟ GAIA که به عنوان یک برنامه متن‌باز ارائه شده است، یک رابط کاربری ساده‌سازی شده را فراهم می‌کند که به‌طور خاص برای استقرار و تعامل با LLMهای مقیاس کوچک مستقیماً بر روی رایانه‌های شخصی ویندوزی مجهز به آخرین سخت‌افزار AMD طراحی شده است. این پروژه آگاهانه بر اساس چارچوب‌های متن‌باز موجود، به‌ویژه با ذکر Lemonade به عنوان پایه، بنا شده است و روحیه همکاری را در جامعه توسعه‌دهندگان گسترده‌تر نشان می‌دهد.

عملکرد اصلی GAIA این است که بسیاری از پیچیدگی‌های معمول مرتبط با راه‌اندازی و اجرای LLMها را پنهان کند. به کاربران یک محیط قابل دسترس‌تر ارائه می‌شود که از ابتدا برای معماری Ryzen AI AMD بهینه‌سازی شده است. این بهینه‌سازی حیاتی است؛ تضمین می‌کند که نرم‌افزار به‌طور مؤثر از NPU استفاده می‌کند، عملکرد را به حداکثر می‌رساند و ردپای انرژی را به حداقل می‌رساند. در حالی که هدف اصلی سری Ryzen AI 300 با NPU قدرتمند آن است، AMD کاربران پیکربندی‌های سخت‌افزاری قدیمی‌تر یا متفاوت را کاملاً مستثنی نکرده است.

این پروژه از خانواده‌های LLM محبوب و نسبتاً فشرده، از جمله مدل‌های مبتنی بر معماری‌های Llama و Phi که به‌طور گسترده در دسترس هستند، پشتیبانی می‌کند. این مدل‌ها، اگرچه شاید مقیاس غول‌هایی مانند GPT-4 را نداشته باشند، برای انواع وظایف روی دستگاه به‌طور قابل توجهی توانمند هستند. AMD موارد استفاده بالقوه‌ای از چت‌بات‌های تعاملی قادر به مکالمه طبیعی گرفته تا تکالیف استدلالی پیچیده‌تر را پیشنهاد می‌کند و تطبیق‌پذیری پیش‌بینی شده برای هوش مصنوعی محلی مبتنی بر GAIA را نشان می‌دهد.

کاوش در قابلیت‌های GAIA: Agentها و قدرت ترکیبی

برای نمایش کاربردهای عملی و مفید ساختن فوری فناوری، GAIA با مجموعه‌ای از ‘agent’های از پیش تعریف شده عرضه می‌شود که هر کدام برای یک عملکرد خاص طراحی شده‌اند:

  • Chaty: همانطور که از نامش پیداست، این agent یک تجربه هوش مصنوعی مکالمه‌ای را فراهم می‌کند و به عنوان یک چت‌بات برای تعامل و گفتگوی عمومی عمل می‌کند. این از توانایی LLM زیربنایی برای تولید پاسخ‌های متنی شبیه به انسان بهره می‌برد.
  • Clip: این agent بر روی وظایف پرسش و پاسخ تمرکز دارد. قابل ذکر است که قابلیت‌های Retrieval-Augmented Generation (RAG) را در خود جای داده است که به آن امکان می‌دهد به‌طور بالقوه اطلاعات را از منابع خارجی مانند رونوشت‌های YouTube برای ارائه پاسخ‌های آگاهانه‌تر یا مرتبط‌تر با زمینه بازیابی کند. این عملکرد RAG به‌طور قابل توجهی پایگاه دانش agent را فراتر از داده‌های آموزشی اولیه LLM افزایش می‌دهد.
  • Joker: یک agent دیگر مبتنی بر RAG، Joker به‌طور خاص برای طنز طراحی شده است و وظیفه تولید جوک را بر عهده دارد. این پتانسیل کاربردهای تخصصی و خلاقانه LLMهای محلی را نشان می‌دهد.
  • Simple Prompt Completion: این یک خط مستقیم‌تر به LLM پایه ارائه می‌دهد و به کاربران امکان می‌دهد تا اعلان‌ها را وارد کرده و تکمیل‌های ساده را بدون لایه‌های مکالمه‌ای یا وظیفه‌محور سایر agentها دریافت کنند. این به عنوان یک رابط اساسی برای تعامل مستقیم با مدل عمل می‌کند.

اجرای این agentها، به‌ویژه فرآیند استنتاج که در آن مدل پاسخ‌ها را تولید می‌کند، عمدتاً توسط NPU در تراشه‌های سازگار سری Ryzen AI 300 انجام می‌شود. این امر عملکرد کارآمد و کم‌مصرف را تضمین می‌کند. با این حال، AMD همچنین یک حالت ‘ترکیبی’ پیشرفته‌تر را برای برخی مدل‌های پشتیبانی شده گنجانده است. این رویکرد نوآورانه به‌طور پویا واحد پردازش گرافیکی یکپارچه پردازنده (iGPU) را در کنار NPU درگیر می‌کند. با بهره‌گیری از قدرت پردازش موازی iGPU، این حالت ترکیبی می‌تواند افزایش عملکرد قابل توجهی را برای وظایف هوش مصنوعی پرتقاضا ارائه دهد و به کاربران راهی برای تسریع استنتاج فراتر از آنچه NPU به تنهایی می‌تواند به دست آورد، ارائه می‌دهد.

AMD با درک چشم‌انداز متنوع سخت‌افزاری، یک گزینه جایگزین نیز ارائه می‌دهد. نسخه‌ای از GAIA وجود دارد که صرفاً به هسته‌های CPU برای محاسبات متکی است. اگرچه به‌طور قابل توجهی کندتر و کم‌مصرف‌تر از حالت‌های NPU یا ترکیبی است، این نسخه فقط CPU دسترسی گسترده‌تری را تضمین می‌کند و به کاربرانی که آخرین سخت‌افزار Ryzen AI را ندارند اجازه می‌دهد تا با GAIA آزمایش کنند، البته با جریمه عملکرد.

موقعیت‌یابی استراتژیک و مزیت متن‌باز

راه‌اندازی GAIA را می‌توان در چارچوب گسترده‌تر بازار رقابتی نیمه‌هادی‌ها، به‌ویژه در مورد شتاب‌دهی هوش مصنوعی، مشاهده کرد. برای مدت زمان قابل توجهی، NVIDIA از موقعیت غالبی در فضای هوش مصنوعی برخوردار بوده است، عمدتاً به دلیل GPUهای قدرتمند و اکوسیستم نرم‌افزاری بالغ CUDA (Compute Unified Device Architecture) که به یک استاندارد بالفعل برای یادگیری ماشین با کارایی بالا تبدیل شده است. اجرای کارآمد مدل‌های بزرگتر بر روی سخت‌افزار مصرف‌کننده اغلب توسعه‌دهندگان و علاقه‌مندان را به سمت محصولات NVIDIA سوق می‌داد.

ابتکار GAIA AMD، همراه با سخت‌افزار NPU اختصاصی در تراشه‌های Ryzen AI، نشان‌دهنده یک حرکت استراتژیک برای به چالش کشیدن این سلطه است، به‌ویژه در بازار رو به رشد هوش مصنوعی روی دستگاه در لپ‌تاپ‌ها و دسکتاپ‌ها. AMD با ارائه ابزاری آسان برای استفاده، بهینه‌سازی شده و متن‌باز، قصد دارد اکوسیستمی را پیرامون قابلیت‌های سخت‌افزاری هوش مصنوعی خود بسازد و پلتفرم‌های Ryzen AI را برای توسعه‌دهندگان و کاربران نهایی علاقه‌مند به اجرای محلی هوش مصنوعی جذاب‌تر کند. تمرکز صریح بر بهینه‌سازی NPU آن را از رویکردهای متمرکز بر GPU متمایز می‌کند و مزایای بهره‌وری انرژی ذاتی پردازنده‌های عصبی اختصاصی برای وظایف خاص هوش مصنوعی را برجسته می‌سازد.

تصمیم برای انتشار GAIA تحت مجوز متن‌باز مجاز MIT نیز از نظر استراتژیک قابل توجه است. این امر همکاری و مشارکت جامعه جهانی توسعه‌دهندگان را دعوت می‌کند. این رویکرد می‌تواند توسعه پروژه را تسریع کند، منجر به ادغام ویژگی‌ها و مدل‌های جدید شود و جامعه‌ای را که در پلتفرم هوش مصنوعی AMD سرمایه‌گذاری کرده است، پرورش دهد. AMD صراحتاً از pull requestها برای رفع اشکال و بهبود ویژگی‌ها استقبال می‌کند و تعهد خود را به تکامل GAIA از طریق تلاش جمعی نشان می‌دهد. متن‌باز کردن مانع را برای توسعه‌دهندگان برای آزمایش، ادغام و به‌طور بالقوه ساخت برنامه‌های تجاری بر روی چارچوب GAIA کاهش می‌دهد و اکوسیستم پیرامون Ryzen AI را بیشتر تحریک می‌کند.

در حالی که تکرار فعلی بر روی LLMهای کوچکتر مناسب برای اجرای روی دستگاه تمرکز دارد، بنیادی که توسط GAIA گذاشته شده است می‌تواند راه را برای پشتیبانی از مدل‌ها و برنامه‌های پیچیده‌تر با ادامه پیشرفت فناوری NPU هموار کند. این نشان‌دهنده بیانیه روشنی از قصد AMD است: تبدیل شدن به یک نیروی اصلی در عصر هوش مصنوعی شخصی و محلی، با ارائه سخت‌افزار و ابزارهای نرم‌افزاری قابل دسترس لازم برای آوردن قابلیت‌های هوش مصنوعی مستقیماً به دست کاربران، به صورت ایمن و کارآمد. نام مستعار ‘Generative AI Is Awesome’، اگرچه شاید غیررسمی باشد، بر اشتیاق و جاه‌طلبی این شرکت در این مرز فناوری به سرعت در حال تحول تأکید می‌کند.