در کنفرانسی بینالمللی، یک صندوق معاملاتی کمی واقع در شانگهای، روشی نوین برای آموزش هوش مصنوعی ارائه داده است که میتواند پیشرفتی چشمگیر در این حوزه باشد. این روش، که در مقالهای تحقیقاتی به کنفرانس معتبر سیستمهای پردازش اطلاعات عصبی (NeurIPS) ارائه شده است، میتواند با اثربخشی روشهای آموزش هوش مصنوعی سازمانهای برجستهای مانند DeepSeek و OpenAI رقابت کند یا حتا از آنها پیشی بگیرد. این اقدام، مشابه مسیر DeepSeek است که به دلیل پیشرفتهایش در الگوریتمهای هوش مصنوعی، توجه زیادی را به خود جلب کرد.
رمزگشایی چارچوب آموزش SASR Goku
شرکت Shanghai Goku Technologies، که در سال 2015 تأسیس شده است، چارچوب آموزش هوش مصنوعی جدیدی به نام SASR یا آموزش ترکیبی تطبیقی گام به گام را معرفی کرده است. هدف از این رویکرد، پرداختن به محدودیتهای روشهای رایج مانند تنظیم دقیق نظارت شده (SFT) و یادگیری تقویتی (RL) است. Goku ادعا میکند که SASR، با الهام از نحوه توسعه مهارتهای استدلال در انسان، مسیری تطبیقیتر و کارآمدتر برای ساخت مدلهای پیشرفته هوش مصنوعی ارائه میدهد.
SFT و RL به عنوان سنگ بنای فرآیند آموزش هوش مصنوعی در نظر گرفته میشوند و توسط غولهای صنعتی مانند OpenAI و DeepSeek مورد استفاده قرار میگیرند. DeepSeek به طور صریح بر نقش حیاتی این تکنیکها در بهینهسازی عملکرد مدل V3 خود، که در ماه دسامبر منتشر شد و علاقه قابل توجهی را در بخش فناوری برانگیخت، تأکید کرده است.
بر اساس مقاله تحقیقاتی Goku، که با همکاری محققانی از دانشگاه Shanghai Jiao Tong و شرکت تابعه جدید هوش مصنوعی آن، Shanghai AllMind Artificial Intelligence Technology، نوشته شده است، SASR عملکرد بهتری نسبت به روشهای SFT، RL و روشهای آموزش ترکیبی ایستا نشان میدهد. تیم Goku در مقاله تحقیقاتی خود اظهار داشت: "نتایج تجربی نشان میدهد که SASR از روشهای SFT، RL و روشهای آموزش ترکیبی ایستا عملکرد بهتری دارد."
پیامدهای پیشرفت Goku
گزارش شده است که پیشرفت Goku در آموزش هوش مصنوعی، پیشرفت مداوم چین در زمینه هوش مصنوعی را برجسته میکند. این موضوع به طور بالقوه محدودیتهای سیاستهای فعلی دولت ایالات متحده را، که هدف آن جلوگیری از پیشرفت هوش مصنوعی چین از طریق محدودیتهای سختافزاری است، نشان میدهد. Jensen Huang، مدیرعامل Nvidia، اخیراً در مورد اثربخشی درک شده این محدودیتها اظهار نظر کرده و گفته است که "چین 50 درصد از توسعه دهندگان هوش مصنوعی جهان را در اختیار دارد."
DeepSeek، یک استارتاپ هوش مصنوعی چینی که از صندوق پوشش ریسک High-Flyer ظهور کرده است، به دلیل نمایش پتانسیل چین برای رهبری هوش مصنوعی از طریق الگوریتمهای پیشرفته و یکپارچهسازی سختافزار و نرمافزار، به طور گستردهای شناخته شده است.
نقش AllMind در استراتژی هوش مصنوعی Goku
تأسیس AllMind، همزمان با انتشار تحقیقات Goku، نشاندهنده یک اقدام استراتژیک برای اختصاص منابع به تحقیق و توسعه هوش مصنوعی است. سوابق ثبتی کسب و کار چین نشان میدهد که AllMind در همان روزی که Goku تحقیقات خود را منتشر کرد، به طور رسمی ثبت شد.
Wang Xiao، بنیانگذار Goku و نماینده قانونی AllMind، اظهار داشته است که این نهاد جدید برای کشف مرزهای جدید هوش مصنوعی ایجاد شده است. این امر منعکس کننده رویکردی است که High-Flyer در پیش گرفت و DeepSeek را به عنوان یک نهاد جداگانه در سال 2023 تأسیس کرد.
بر اساس اطلاعات موجود در وبسایت رسمی Goku، تا پایان سال گذشته، Goku بیش از 15 میلیارد یوان (تقریباً 2.1 میلیارد دلار آمریکا) دارایی داخلی و بینالمللی را با استفاده از استراتژیهای مبتنی بر هوش مصنوعی مدیریت میکرد.
بررسی عمیقتر SASR: چارچوب آموزش ترکیبی تطبیقی گام به گام
چارچوب SASR Goku جایگزینی جالب در چشمانداز آموزش مدل هوش مصنوعی ارائه میدهد. برای درک واقعی تأثیر بالقوه آن، درک دقیقتری از اجزا و عملکرد آن ضروری است.
جنبه "گام به گام" SASR به معنای یک فرآیند آموزش چند مرحلهای است که در آن مدل هوش مصنوعی تحت پالایش تکراری قرار میگیرد. هر مرحله احتمالاً شامل اهداف خاصی است و از دادههای آموزشی متمایزی برای پرورش تواناییهای خاص در مدل استفاده میکند. این رویکرد مرحلهای میتواند مزایایی مانند کاهش چالشهای آموزش مدلهای پیچیده از ابتدا و امکان بهینهسازی متناسب در هر مرحله را ارائه دهد.
عنصر "تطبیقی" نشان میدهد که فرآیند آموزش ایستا نیست بلکه به طور پویا به عملکرد و ویژگیهای مدل پاسخ میدهد. این انطباقپذیری میتواند شامل تنظیم ابرپارامترها، تغییر توزیع دادههای آموزشی یا وزندهی پویا به سهم اهداف مختلف آموزشی باشد. یک فرآیند تطبیقی به هوش مصنوعی اجازه میدهد تا مؤثرتر یاد بگیرد و بهبود یابد.
ماهیت "هیبریدی" SASR نشان میدهد که عناصر روشهای آموزشی مختلف را ترکیب میکند. این جنبه حیاتی است زیرا نقاط قوت و ضعفی در SFT و RL وجود دارد. ترکیبی از روشها مدل را قادر میسازد تا از مزایای هر رویکرد استفاده کند و در عین حال محدودیتهای آن را برطرف کند. با ادغام این سه ویژگی، SARS از نظر تئوری به توسعه منطق و استدلال بهتر تنظیم شده است.
مقایسه SASR با روشهای سنتی
تنظیم دقیق نظارت شده (SFT) به طور سنتی بر مجموعه دادههای بزرگ و برچسبگذاری شده تکیه دارد که در آن مدل هوش مصنوعی یاد میگیرد ورودیها را به خروجیهای مورد نظر نگاشت کند. یادگیری تقویتی (RL) شامل آموزش مدل از طریق آزمون و خطا، پاداش دادن یا جریمه کردن اقدامات برای به حداکثر رساندن یک هدف خاص است.
SASR تلاش میکند تا این دو را ادغام کند و در عین حال بر محدودیتهای هر روش غلبه کند. به عنوان مثال، SFT میتواند به شدت وابسته به کیفیت و جامعیت دادههای برچسبگذاری شده باشد. در بسیاری از سناریوهای دنیای واقعی، به دست آوردن دادههای کافی و دقیق میتواند هم زمانبر و هم پرهزینه باشد. RL، در حالی که نیازی به دادههای برچسبگذاری شده ندارد، میتواند ناپایدار باشد و مستعد هک کردن پاداش باشد. هک کردن پاداش زمانی رخ میدهد که مدل هوش مصنوعی راههای ناخواستهای را برای به حداکثر رساندن پاداش خود کشف میکند، که به طور بالقوه منجر به رفتار ناخواسته میشود.
چارچوب Goku این امکان را دارد که نسبت به محدودیتهای SFT و RL یک پیشرفت باشد. با این حال، آزمایشهای بیشتر و مداوم برای تأیید نتایج اولیهای که در مقاله شرکت مستند شده است، مورد نیاز است.
نوآوری الگوریتمی و محدودیتهای سختافزاری
خبر چارچوب SASR Goku به ویژه در بستر روابط فناوری ایالات متحده و چین مرتبط است. مدتی است که دولت ایالات متحده تلاش کرده است تا با محدود کردن دسترسی به سختافزار محاسباتی پیشرفته، به ویژه GPU های پیشرفته از شرکتهایی مانند Nvidia، از صعود چین در حوزه هوش مصنوعی جلوگیری کند. ایده پشت این محدودیتها این است که محدود کردن دسترسی چین به سختافزار قدرتمند باعث کند شدن تلاشهای توسعه هوش مصنوعی آنها میشود.
با این حال، نظرات Jensen Huang، مدیرعامل Nvidia و پیشرفتهایی که از آزمایشگاههای هوش مصنوعی چین ظهور میکند، نشان میدهد که این سیاستها ممکن است به اندازه مورد نظر مؤثر نباشند. Huang به طور مشهوری خاطرنشان کرده است که چین بخش قابل توجهی از استعدادهای توسعه دهندگان هوش مصنوعی جهان را در اختیار دارد و محدود کردن دسترسی به سختافزار ممکن است آنها را به یافتن راه حلهای جایگزین تشویق کند.
ادعای Goku مبنی بر پیشرفت هوش مصنوعی نشان میدهد که نوآوری الگوریتمی میتواند به طور بالقوه محدودیتهای سختافزاری را، حداقل تا حدی، جبران کند. اگر محققان چینی بتوانند الگوریتمهای آموزشی کارآمدتریتوسعه دهند، ممکن است بتوانند با سختافزار کمتر قدرتمند به عملکرد هوش مصنوعی قابل مقایسه دست یابند. این میتواند پیامدهای مهمی برای چشمانداز جهانی هوش مصنوعی داشته باشد، زیرا نشان میدهد که چین ممکن است بتواند علیرغم محدودیتهای مداوم به پیشرفت قابلیتهای هوش مصنوعی خود ادامه دهد.
این بدان معنا نیست که سختافزار نامربوط است. GPU های پیشرفته هنوز برای آموزش مدلهای هوش مصنوعی پیشرفته حیاتی هستند و دسترسی به آخرین سختافزار بدون شک یک مزیت رقابتی قابل توجه ارائه میدهد. با این حال، کار Goku اهمیت سرمایهگذاری در هر دو سختافزار و نرمافزار را نشان میدهد و اینکه پیشرفت در یک حوزه میتواند به طور بالقوه محدودیتها در حوزه دیگر را جبران کند.
ظهور هوش مصنوعی چین: فراتر از DeepSeek
ظهور DeepSeek به عنوان یک بازیگر برجسته در عرصه هوش مصنوعی، کاتالیزوری بوده است و عزم چین برای تبدیل شدن به یک رهبر جهانی در این فناوری تحولآفرین را نشان میدهد. با این حال، DeepSeek فقط یک نمونه است و ظهور Goku، با چارچوب آموزش SASR خود، قدرت و نوآوری فزاینده در اکوسیستم هوش مصنوعی چین را بیشتر نشان میدهد.
چندین عامل به این شتاب کمک میکنند. اول، چین یک مجموعه داده عظیم دارد که برای آموزش مدلهای هوش مصنوعی ضروری است. با جمعیت زیاد و پذیرش گسترده فناوریهای دیجیتال، شرکتهای چینی به مجموعهدادههای عظیمی دسترسی دارند که میتوان از آنها برای توسعه و اصلاح الگوریتمهای هوش مصنوعی خود استفاده کرد.
دوم، چین تأکید زیادی بر آموزش STEM دارد و تعداد زیادی مهندس و دانشمند با استعداد تولید میکند. این امر نیروی کار بسیار ماهری را ایجاد کرده است که قادر به هدایت نوآوری در هوش مصنوعی و زمینههای مرتبط است.
سوم، دولت چین هوش مصنوعی را به یک اولویت استراتژیک تبدیل کرده است و بودجه و حمایت قابل توجهی برای تحقیق و توسعه ارائه میکند. این امر یک محیط بارور برای استارتاپهای هوش مصنوعی ایجاد کرده و همکاری بین دانشگاه و صنعت را تقویت کرده است.
در نهایت، شرکتهای چینی اغلب مایلند رویکردی عملگرایانهتر و ریسکپذیرتر در قبال نوآوری اتخاذ کنند، که به آنها امکان میدهد به سرعت حرکت کنند و ایدههای جدید را آزمایش کنند.
در نتیجه این عوامل، چین به سرعت از نظر قابلیتهای هوش مصنوعی به ایالات متحده میرسد. در حالی که ایالات متحده هنوز در زمینههای خاصی مانند تحقیقات بنیادی و سختافزار پیشرفته پیشتاز است، چین در زمینههایی مانند دید رایانهای، پردازش زبان طبیعی و رباتیک پیشرفتهای چشمگیری دارد.
ظهور شرکتهایی مانند Goku و DeepSeek نشان میدهد که چین در موقعیت خوبی برای ادامه صعود خود در حوزه هوش مصنوعی در سالهای آینده قرار دارد.
Shanghai Goku Technologies: شرکتی پشت این نوآوری
Shanghai Goku Technologies یک صندوق معاملات کمی است که در سال 2015 تأسیس شده است. این شرکت داراییهای قابل توجهی را با استفاده از استراتژیهای مبتنی بر هوش مصنوعی مدیریت میکند. مأموریت اعلام شده این شرکت "ترکیب فناوری و تحلیل بنیادی" برای ارائه بازدهی بهتر برای مشتریان خود است. Goku علاوه بر تجارت اصلی خود در مدیریت دارایی، تعهد خود را به پیشبرد مرزهای تحقیقات هوش مصنوعی نشان داده است. AllMind Artificial Intelligence Technology، شرکت تابعه هوش مصنوعی، نشاندهنده یک اقدام استراتژیک برای رسمی کردن و تسریع تلاشهای تحقیق در زمینه هوش مصنوعی است.
جزئیات مربوط به ساختار داخلی و پویایی عملیاتی شرکت نسبتاً کم است. با این حال، اظهارات عمومی و فعالیتهای اخیر آن بینشی در مورد رویکرد آن ارائه میدهد. شعار این شرکت، که به معنای "منطق و حقیقت تنها اصولی هستند که ما از آنها پیروی میکنیم"، منعکس کننده یک فرهنگ مبتنی بر داده و تحلیلی است. سرمایهگذاری در تحقیق و توسعه هوش مصنوعی نشاندهنده یک دیدگاه بلندمدت و آگاهی از پتانسیل تحولآفرین هوش مصنوعی است، نه تنها در بخش مالی بلکه در صنایع مختلف. به احتمال زیاد Goku قصد دارد از بینشهای حاصل از تحقیقات هوش مصنوعی برای بهبود استراتژیهای معاملاتی خود و کسب یک مزیت رقابتی در بازار استفاده کند.