ادعای جسورانه یک صندوق شانگهای: پیشرفت آموزش هوش مصنوعی

در کنفرانسی بین‌المللی، یک صندوق معاملاتی کمی واقع در شانگهای، روشی نوین برای آموزش هوش مصنوعی ارائه داده است که می‌تواند پیشرفتی چشمگیر در این حوزه باشد. این روش، که در مقاله‌ای تحقیقاتی به کنفرانس معتبر سیستم‌های پردازش اطلاعات عصبی (NeurIPS) ارائه شده است، می‌تواند با اثربخشی روش‌های آموزش هوش مصنوعی سازمان‌های برجسته‌ای مانند DeepSeek و OpenAI رقابت کند یا حتا از آن‌ها پیشی بگیرد. این اقدام، مشابه مسیر DeepSeek است که به دلیل پیشرفت‌هایش در الگوریتم‌های هوش مصنوعی، توجه زیادی را به خود جلب کرد.

رمزگشایی چارچوب آموزش SASR Goku

شرکت Shanghai Goku Technologies، که در سال 2015 تأسیس شده است، چارچوب آموزش هوش مصنوعی جدیدی به نام SASR یا آموزش ترکیبی تطبیقی گام به گام را معرفی کرده است. هدف از این رویکرد، پرداختن به محدودیت‌های روش‌های رایج مانند تنظیم دقیق نظارت شده (SFT) و یادگیری تقویتی (RL) است. Goku ادعا می‌کند که SASR، با الهام از نحوه توسعه مهارت‌های استدلال در انسان، مسیری تطبیقی‌تر و کارآمدتر برای ساخت مدل‌های پیشرفته هوش مصنوعی ارائه می‌دهد.

SFT و RL به عنوان سنگ بنای فرآیند آموزش هوش مصنوعی در نظر گرفته می‌شوند و توسط غول‌های صنعتی مانند OpenAI و DeepSeek مورد استفاده قرار می‌گیرند. DeepSeek به طور صریح بر نقش حیاتی این تکنیک‌ها در بهینه‌سازی عملکرد مدل V3 خود، که در ماه دسامبر منتشر شد و علاقه قابل توجهی را در بخش فناوری برانگیخت، تأکید کرده است.

بر اساس مقاله تحقیقاتی Goku، که با همکاری محققانی از دانشگاه Shanghai Jiao Tong و شرکت تابعه جدید هوش مصنوعی آن، Shanghai AllMind Artificial Intelligence Technology، نوشته شده است، SASR عملکرد بهتری نسبت به روش‌های SFT، RL و روش‌های آموزش ترکیبی ایستا نشان می‌دهد. تیم Goku در مقاله تحقیقاتی خود اظهار داشت: "نتایج تجربی نشان می‌دهد که SASR از روش‌های SFT، RL و روش‌های آموزش ترکیبی ایستا عملکرد بهتری دارد."

پیامدهای پیشرفت Goku

گزارش شده است که پیشرفت Goku در آموزش هوش مصنوعی، پیشرفت مداوم چین در زمینه هوش مصنوعی را برجسته می‌کند. این موضوع به طور بالقوه محدودیت‌های سیاست‌های فعلی دولت ایالات متحده را، که هدف آن جلوگیری از پیشرفت هوش مصنوعی چین از طریق محدودیت‌های سخت‌افزاری است، نشان می‌دهد. Jensen Huang، مدیرعامل Nvidia، اخیراً در مورد اثربخشی درک شده این محدودیت‌ها اظهار نظر کرده و گفته است که "چین 50 درصد از توسعه دهندگان هوش مصنوعی جهان را در اختیار دارد."

DeepSeek، یک استارتاپ هوش مصنوعی چینی که از صندوق پوشش ریسک High-Flyer ظهور کرده است، به دلیل نمایش پتانسیل چین برای رهبری هوش مصنوعی از طریق الگوریتم‌های پیشرفته و یکپارچه‌سازی سخت‌افزار و نرم‌افزار، به طور گسترده‌ای شناخته شده است.

نقش AllMind در استراتژی هوش مصنوعی Goku

تأسیس AllMind، همزمان با انتشار تحقیقات Goku، نشان‌دهنده یک اقدام استراتژیک برای اختصاص منابع به تحقیق و توسعه هوش مصنوعی است. سوابق ثبتی کسب و کار چین نشان می‌دهد که AllMind در همان روزی که Goku تحقیقات خود را منتشر کرد، به طور رسمی ثبت شد.

Wang Xiao، بنیانگذار Goku و نماینده قانونی AllMind، اظهار داشته است که این نهاد جدید برای کشف مرزهای جدید هوش مصنوعی ایجاد شده است. این امر منعکس کننده رویکردی است که High-Flyer در پیش گرفت و DeepSeek را به عنوان یک نهاد جداگانه در سال 2023 تأسیس کرد.

بر اساس اطلاعات موجود در وب‌سایت رسمی Goku، تا پایان سال گذشته، Goku بیش از 15 میلیارد یوان (تقریباً 2.1 میلیارد دلار آمریکا) دارایی داخلی و بین‌المللی را با استفاده از استراتژی‌های مبتنی بر هوش مصنوعی مدیریت می‌کرد.

بررسی عمیق‌تر SASR: چارچوب آموزش ترکیبی تطبیقی گام به گام

چارچوب SASR Goku جایگزینی جالب در چشم‌انداز آموزش مدل هوش مصنوعی ارائه می‌دهد. برای درک واقعی تأثیر بالقوه آن، درک دقیق‌تری از اجزا و عملکرد آن ضروری است.

جنبه "گام به گام" SASR به معنای یک فرآیند آموزش چند مرحله‌ای است که در آن مدل هوش مصنوعی تحت پالایش تکراری قرار می‌گیرد. هر مرحله احتمالاً شامل اهداف خاصی است و از داده‌های آموزشی متمایزی برای پرورش توانایی‌های خاص در مدل استفاده می‌کند. این رویکرد مرحله‌ای می‌تواند مزایایی مانند کاهش چالش‌های آموزش مدل‌های پیچیده از ابتدا و امکان بهینه‌سازی متناسب در هر مرحله را ارائه دهد.

عنصر "تطبیقی" نشان می‌دهد که فرآیند آموزش ایستا نیست بلکه به طور پویا به عملکرد و ویژگی‌های مدل پاسخ می‌دهد. این انطباق‌پذیری می‌تواند شامل تنظیم ابرپارامترها، تغییر توزیع داده‌های آموزشی یا وزن‌دهی پویا به سهم اهداف مختلف آموزشی باشد. یک فرآیند تطبیقی به هوش مصنوعی اجازه می‌دهد تا مؤثرتر یاد بگیرد و بهبود یابد.

ماهیت "هیبریدی" SASR نشان می‌دهد که عناصر روش‌های آموزشی مختلف را ترکیب می‌کند. این جنبه حیاتی است زیرا نقاط قوت و ضعفی در SFT و RL وجود دارد. ترکیبی از روش‌ها مدل را قادر می‌سازد تا از مزایای هر رویکرد استفاده کند و در عین حال محدودیت‌های آن را برطرف کند. با ادغام این سه ویژگی، SARS از نظر تئوری به توسعه منطق و استدلال بهتر تنظیم شده است.

مقایسه SASR با روش‌های سنتی

تنظیم دقیق نظارت شده (SFT) به طور سنتی بر مجموعه داده‌های بزرگ و برچسب‌گذاری شده تکیه دارد که در آن مدل هوش مصنوعی یاد می‌گیرد ورودی‌ها را به خروجی‌های مورد نظر نگاشت کند. یادگیری تقویتی (RL) شامل آموزش مدل از طریق آزمون و خطا، پاداش دادن یا جریمه کردن اقدامات برای به حداکثر رساندن یک هدف خاص است.

SASR تلاش می‌کند تا این دو را ادغام کند و در عین حال بر محدودیت‌های هر روش غلبه کند. به عنوان مثال، SFT می‌تواند به شدت وابسته به کیفیت و جامعیت داده‌های برچسب‌گذاری شده باشد. در بسیاری از سناریوهای دنیای واقعی، به دست آوردن داده‌های کافی و دقیق می‌تواند هم زمان‌بر و هم پرهزینه باشد. RL، در حالی که نیازی به داده‌های برچسب‌گذاری شده ندارد، می‌تواند ناپایدار باشد و مستعد هک کردن پاداش باشد. هک کردن پاداش زمانی رخ می‌دهد که مدل هوش مصنوعی راه‌های ناخواسته‌ای را برای به حداکثر رساندن پاداش خود کشف می‌کند، که به طور بالقوه منجر به رفتار ناخواسته می‌شود.

چارچوب Goku این امکان را دارد که نسبت به محدودیت‌های SFT و RL یک پیشرفت باشد. با این حال، آزمایش‌های بیشتر و مداوم برای تأیید نتایج اولیه‌ای که در مقاله شرکت مستند شده است، مورد نیاز است.

نوآوری الگوریتمی و محدودیت‌های سخت‌افزاری

خبر چارچوب SASR Goku به ویژه در بستر روابط فناوری ایالات متحده و چین مرتبط است. مدتی است که دولت ایالات متحده تلاش کرده است تا با محدود کردن دسترسی به سخت‌افزار محاسباتی پیشرفته، به ویژه GPU های پیشرفته از شرکت‌هایی مانند Nvidia، از صعود چین در حوزه هوش مصنوعی جلوگیری کند. ایده پشت این محدودیت‌ها این است که محدود کردن دسترسی چین به سخت‌افزار قدرتمند باعث کند شدن تلاش‌های توسعه هوش مصنوعی آن‌ها می‌شود.

با این حال، نظرات Jensen Huang، مدیرعامل Nvidia و پیشرفت‌هایی که از آزمایشگاه‌های هوش مصنوعی چین ظهور می‌کند، نشان می‌دهد که این سیاست‌ها ممکن است به اندازه مورد نظر مؤثر نباشند. Huang به طور مشهوری خاطرنشان کرده است که چین بخش قابل توجهی از استعدادهای توسعه دهندگان هوش مصنوعی جهان را در اختیار دارد و محدود کردن دسترسی به سخت‌افزار ممکن است آن‌ها را به یافتن راه حل‌های جایگزین تشویق کند.

ادعای Goku مبنی بر پیشرفت هوش مصنوعی نشان می‌دهد که نوآوری الگوریتمی می‌تواند به طور بالقوه محدودیت‌های سخت‌افزاری را، حداقل تا حدی، جبران کند. اگر محققان چینی بتوانند الگوریتم‌های آموزشی کارآمدتریتوسعه دهند، ممکن است بتوانند با سخت‌افزار کمتر قدرتمند به عملکرد هوش مصنوعی قابل مقایسه دست یابند. این می‌تواند پیامدهای مهمی برای چشم‌انداز جهانی هوش مصنوعی داشته باشد، زیرا نشان می‌دهد که چین ممکن است بتواند علی‌رغم محدودیت‌های مداوم به پیشرفت قابلیت‌های هوش مصنوعی خود ادامه دهد.

این بدان معنا نیست که سخت‌افزار نامربوط است. GPU های پیشرفته هنوز برای آموزش مدل‌های هوش مصنوعی پیشرفته حیاتی هستند و دسترسی به آخرین سخت‌افزار بدون شک یک مزیت رقابتی قابل توجه ارائه می‌دهد. با این حال، کار Goku اهمیت سرمایه‌گذاری در هر دو سخت‌افزار و نرم‌افزار را نشان می‌دهد و اینکه پیشرفت در یک حوزه می‌تواند به طور بالقوه محدودیت‌ها در حوزه دیگر را جبران کند.

ظهور هوش مصنوعی چین: فراتر از DeepSeek

ظهور DeepSeek به عنوان یک بازیگر برجسته در عرصه هوش مصنوعی، کاتالیزوری بوده است و عزم چین برای تبدیل شدن به یک رهبر جهانی در این فناوری تحول‌آفرین را نشان می‌دهد. با این حال، DeepSeek فقط یک نمونه است و ظهور Goku، با چارچوب آموزش SASR خود، قدرت و نوآوری فزاینده در اکوسیستم هوش مصنوعی چین را بیشتر نشان می‌دهد.

چندین عامل به این شتاب کمک می‌کنند. اول، چین یک مجموعه داده عظیم دارد که برای آموزش مدل‌های هوش مصنوعی ضروری است. با جمعیت زیاد و پذیرش گسترده فناوری‌های دیجیتال، شرکت‌های چینی به مجموعه‌داده‌های عظیمی دسترسی دارند که می‌توان از آن‌ها برای توسعه و اصلاح الگوریتم‌های هوش مصنوعی خود استفاده کرد.

دوم، چین تأکید زیادی بر آموزش STEM دارد و تعداد زیادی مهندس و دانشمند با استعداد تولید می‌کند. این امر نیروی کار بسیار ماهری را ایجاد کرده است که قادر به هدایت نوآوری در هوش مصنوعی و زمینه‌های مرتبط است.

سوم، دولت چین هوش مصنوعی را به یک اولویت استراتژیک تبدیل کرده است و بودجه و حمایت قابل توجهی برای تحقیق و توسعه ارائه می‌کند. این امر یک محیط بارور برای استارتاپ‌های هوش مصنوعی ایجاد کرده و همکاری بین دانشگاه و صنعت را تقویت کرده است.

در نهایت، شرکت‌های چینی اغلب مایلند رویکردی عمل‌گرایانه‌تر و ریسک‌پذیرتر در قبال نوآوری اتخاذ کنند، که به آن‌ها امکان می‌دهد به سرعت حرکت کنند و ایده‌های جدید را آزمایش کنند.

در نتیجه این عوامل، چین به سرعت از نظر قابلیت‌های هوش مصنوعی به ایالات متحده می‌رسد. در حالی که ایالات متحده هنوز در زمینه‌های خاصی مانند تحقیقات بنیادی و سخت‌افزار پیشرفته پیشتاز است، چین در زمینه‌هایی مانند دید رایانه‌ای، پردازش زبان طبیعی و رباتیک پیشرفت‌های چشمگیری دارد.

ظهور شرکت‌هایی مانند Goku و DeepSeek نشان می‌دهد که چین در موقعیت خوبی برای ادامه صعود خود در حوزه هوش مصنوعی در سال‌های آینده قرار دارد.

Shanghai Goku Technologies: شرکتی پشت این نوآوری

Shanghai Goku Technologies یک صندوق معاملات کمی است که در سال 2015 تأسیس شده است. این شرکت دارایی‌های قابل توجهی را با استفاده از استراتژی‌های مبتنی بر هوش مصنوعی مدیریت می‌کند. مأموریت اعلام شده این شرکت "ترکیب فناوری و تحلیل بنیادی" برای ارائه بازدهی بهتر برای مشتریان خود است. Goku علاوه بر تجارت اصلی خود در مدیریت دارایی، تعهد خود را به پیشبرد مرزهای تحقیقات هوش مصنوعی نشان داده است. AllMind Artificial Intelligence Technology، شرکت تابعه هوش مصنوعی، نشان‌دهنده یک اقدام استراتژیک برای رسمی کردن و تسریع تلاش‌های تحقیق در زمینه هوش مصنوعی است.

جزئیات مربوط به ساختار داخلی و پویایی عملیاتی شرکت نسبتاً کم است. با این حال، اظهارات عمومی و فعالیت‌های اخیر آن بینشی در مورد رویکرد آن ارائه می‌دهد. شعار این شرکت، که به معنای "منطق و حقیقت تنها اصولی هستند که ما از آن‌ها پیروی می‌کنیم"، منعکس کننده یک فرهنگ مبتنی بر داده و تحلیلی است. سرمایه‌گذاری در تحقیق و توسعه هوش مصنوعی نشان‌دهنده یک دیدگاه بلندمدت و آگاهی از پتانسیل تحول‌آفرین هوش مصنوعی است، نه تنها در بخش مالی بلکه در صنایع مختلف. به احتمال زیاد Goku قصد دارد از بینش‌های حاصل از تحقیقات هوش مصنوعی برای بهبود استراتژی‌های معاملاتی خود و کسب یک مزیت رقابتی در بازار استفاده کند.