در عرصه پر تب و تاب مدلهای پایه هوش مصنوعی (AI)، رقابت جهانی به اوج خود رسیده است. ایلان ماسک، مدیرعامل تسلا و بنیانگذار xAI، اخیراً از انتشار قریبالوقوع مدل Grok 3.5 شرکت خود خبر داده است. این اعلامیه تنها چند ساعت پس از آن صورت گرفت که گروه هلدینگ علیبابا مدلهای جدید Qwen3 خود را معرفی کرد و موجی از هیجان را در بین توسعهدهندگان و ناظران صنعت ایجاد کرد. این رونمایی همزمان، بر رقابت فزاینده بین چین و ایالات متحده در حوزه حیاتی توسعه هوش مصنوعی تأکید میکند.
Qwen3 علیبابا: نسل جدیدی از مدلهای هوش مصنوعی
Qwen3 علیبابا نشاندهنده نسل سوم خانواده مدلهای هوش مصنوعی Qwen است. این تکرار جدید شامل چندین نسخه است که هر کدام با تعداد متفاوتی از پارامترها متمایز میشوند. پارامترها اساساً متغیرهایی هستند که یک مدل هوش مصنوعی برای یادگیری یک کار از آنها استفاده میکند؛ هرچه تعداد پارامترها بیشتر باشد، مدل میتواند وظایف پیچیدهتری را انجام دهد.
به گفته علیبابا، بزرگترین مدل Qwen3، با داشتن 235 میلیارد پارامتر چشمگیر، عملکرد برتری را در مقایسه با DeepSeek-R1 و مدلهای استدلالی o1 OpenAI نشان داده است. این ادعا نشان میدهد که Qwen3 دارای قابلیتهای پیشرفتهای در زمینههایی مانند استنتاج منطقی، حل مسئله و تصمیمگیری است.
علاوه بر این، علیبابا بر کارایی مدلهای Qwen3 تأکید میکند. گزارش شده است که سادهترین نسخه، با 600 میلیون پارامتر، قادر است روی یک تلفن هوشمند اجرا شود. اگر این موضوع صحت داشته باشد، نشاندهنده یک پیشرفت قابل توجه است که برنامههای کاربردی هوش مصنوعی پیچیده را در دستگاههای تلفن همراه بدون تکیه بر پردازش مبتنی بر ابر امکانپذیر میکند. این پتانسیل برای پردازش هوش مصنوعی روی دستگاه میتواند برنامههای کاربردی مختلف، از ترجمه زبان در زمان واقعی گرفته تا تشخیص تصویر پیشرفته، را متحول کند.
Grok 3.5: پاسخ ماسک به چالش هوش مصنوعی
اندکی پس از اعلامیه Qwen3 علیبابا، ایلان ماسک در شبکههای اجتماعی اعلام کرد که استارتاپ او، xAI، به زودی یک نسخه بتای اولیه از Grok 3.5 را برای مشترکین SuperGrok منتشر خواهد کرد. مشترکین SuperGrok کسانی هستند که برای دسترسی ممتاز به ربات چت Grok هزینه پرداخت میکنند، و این نشان میدهد که این نسخه جدید در ابتدا برای گروه منتخبی از کاربران در نظر گرفته شده است.
ماسک بر توانایی فنی Grok 3.5 تأکید کرد و اظهار داشت که این “اولین هوش مصنوعی است که میتواند، برای مثال، به سؤالات فنی مربوط به موتورهای موشک یا الکتروشیمی به طور دقیق پاسخ دهد”. این نشان میدهد که Grok 3.5 بر روی مجموعهدادههای تخصصی آموزش داده شده است و درک عمیقی از اصول پیچیده علمی و مهندسی دارد. این تمرکز بر دقت فنی میتواند Grok 3.5 را به عنوان یک ابزار ارزشمند برای محققان، مهندسان و هر کسی که به پاسخهای قابل اعتماد برای سؤالات فنی پیچیده نیاز دارد، قرار دهد.
تشدید رقابت هوش مصنوعی: کارایی و عملکرد
به طور گستردهای تصور میشود که راهاندازی DeepSeek-R1 در ژانویه، آغاز مسابقه هوش مصنوعی تجدید شدهای است که با یک برنامه انتشار تسریع شده از مدلهای جدید مشخص میشود. یکی از جنبههای کلیدی این مسابقه، تأکید بر بهرهوری انرژی است. با قدرتمندتر شدن مدلهای هوش مصنوعی، مصرف انرژی آنها به طور چشمگیری افزایش مییابد و نگرانیهایی را در مورد پایداری و هزینه ایجاد میکند. بنابراین، صنعت به طور فعال به دنبال راههایی برای توسعه مدلهایی است که عملکرد بالایی ارائه میدهند و در عین حال ردپای زیستمحیطی خود را به حداقل میرسانند.
مدلهای DeepSeek که به دلیل هزینه کم و عملکرد بالا شناخته میشوند، زنگ خطری برای توسعهدهندگان آمریکایی بودند. این مدلها نشان دادند که صنعت هوش مصنوعی چین به سرعت در حال رسیدن است و ایالات متحده نمیتواند از خود راضی باشد. ظهور DeepSeek شرکتهای آمریکایی را مجبور کرد تا استراتژیهای خود را دوباره ارزیابی کنند و تلاشهای توسعه خود را تسریع بخشند.
مهارت رو به رشد هوش مصنوعی چین
علاوه بر علیبابا، سایر شرکتهای بزرگ فناوری چینی، از جمله بایدو، بایتدنس و هلدینگ تنسنت، اخیراً مدلهای هوش مصنوعی پایه خود را بهروزرسانی کردهاند. این بهروزرسانیها این مدلها را به عملکرد مدلهای پیشرو آمریکایی مانند Gemini 2.5 Pro گوگل، o3 و o4 OpenAI و Llama 4 متا پلتفرم نزدیکتر کرده یا حتی با آنها برابر کرده است. این پیشرفت گسترده در چندین شرکت چینی، تعهد این کشور به تبدیل شدن به یک رهبر جهانی در هوش مصنوعی را برجسته میکند.
گزارش اخیر دانشگاه استنفورد نیز این روند را تأیید میکند و نتیجه میگیرد که چین شکاف خود را با ایالات متحده در تولید مدلهای هوش مصنوعی پیشرفته به طور قابل توجهی کاهش داده است. این گزارش پیشرفت سریع محققان و مهندسان چینی و همچنین افزایش دسترسی به منابع برای توسعه هوش مصنوعی در چین را برجسته میکند.
علاوه بر این، مدلهای متنباز چین در بین توسعهدهندگان و کاربران در سراسر جهان مورد توجه قابل توجهی قرار گرفتهاند. به عنوان مثال، Qwen علیبابا به بزرگترین اکوسیستم هوش مصنوعی متنباز جهان تبدیل شده است که بیش از 100000 مدل مشتق دارد. این پذیرش گسترده نشاندهنده محبوبیت و سودمندی Qwen در بین توسعهدهندگان است که از آن برای ساخت طیف گستردهای از برنامههای کاربردی مجهز به هوش مصنوعی استفاده میکنند. موفقیت Qwen حتی از مدلهای مبتنی بر Llama متا نیز فراتر رفته است و تأثیر جهانی فناوری هوش مصنوعی چین را نشان میدهد.
سرعت سریع نوآوری
انتشار Qwen3 توسط علیبابا تنها سه ماه پس از راهاندازی Qwen2.5-Max، نمونهای از سرعت باورنکردنی است که شرکتهای فناوری با آن در زمینه هوش مصنوعی مولد از یکدیگر پیشی میگیرند. هوش مصنوعی مولد به مدلهای هوش مصنوعی اشاره دارد که میتوانند محتوای جدیدی مانند متن، تصویر و صدا تولید کنند. پیشرفتهای سریع در این زمینه ناشی از رقابت شدید و تمایل به ایجاد ابزارهای هوش مصنوعی پیشرفتهتر و مفیدتر است.
در همین حال، DeepSeek موضوع گمانهزنیهای زیادی در مورد مدل استدلال R2 نسل بعدی خود بوده است. انتظار پیرامون R2 بر تمرکز صنعت بر توسعه مدلهای هوش مصنوعی که میتوانند وظایف استدلال پیچیده مانند حل مسئله، تصمیمگیری و اکتشاف علمی را انجام دهند، تأکید میکند.
تلاش برای هوش مصنوعی عمومی
تیم Qwen، بخشی از واحد Alibaba Cloud، این مدل جدید را گامی مهم در جهت دستیابی به هوش مصنوعی عمومی (AGI) میداند. AGI سطح فرضی از هوش مصنوعی است که با هوش انسان مطابقت دارد یا از آن فراتر میرود. این هدف نهایی بسیاری از محققان هوش مصنوعی است و به عنوان یک تغییر دهنده بازی بالقوه برای جامعه تلقی میشود.
دستیابی به AGI مستلزم این است که مدلهای هوش مصنوعی دارای طیف گستردهای از تواناییهای شناختی، از جمله استدلال، حل مسئله، یادگیری و خلاقیت باشند. در حالی که AGI یک هدف دور از دسترس باقی میماند، پیشرفتهای حاصل شده در زمینههایی مانند پردازش زبان طبیعی، بینایی کامپیوتر و یادگیری تقویتی به تدریج آن را به واقعیت نزدیکتر میکند.
مدلهای متنباز: یک مزیت استراتژیک
ناتان لمبرت، محقق مؤسسه آلن برای هوش مصنوعی مستقر در ایالات متحده، پیشنهاد میکند که مدلهای متنباز مانند Qwen3 و DeepSeek-R1 میتوانند “موثرترین راه برای شرکتهای چینی برای به دست آوردن سهم بازار در ایالات متحده باشند”. شرکتهای چینی با ارائه رایگان مدلهای خود، میتوانند پذیرش آنها را توسط توسعهدهندگان و کاربران آمریکایی تشویق کنند و از این طریق نفوذ خود را در اکوسیستم هوش مصنوعی ایالات متحده افزایش دهند.
لمبرت در ادامه استدلال میکند که این “شرکتهای چینی با وزن باز، کار فوقالعادهای در اعمال قدرت نرم بر اکوسیستم هوش مصنوعی آمریکایی انجام میدهند”. قدرت نرم به توانایی تأثیرگذاری بر دیگران از طریق ابزارهای فرهنگی یا ایدئولوژیک، به جای نیروی نظامی یا اقتصادی اشاره دارد. شرکتهای چینی با ارائه دسترسی به فناوری پیشرفته هوش مصنوعی، میتوانند روابطی با توسعهدهندگان و کاربران آمریکایی ایجاد کنند، همکاری را تقویت کنند و به طور بالقوه آینده توسعه هوش مصنوعی را شکل دهند.
لمبرت نتیجه میگیرد که “همه ما میتوانیم از نظر فناوری از آنها بهرهمند شویم”. این احساس بر پتانسیل همکاری بینالمللی در توسعه هوش مصنوعی تأکید میکند. کشورها با به اشتراک گذاشتن دانش و منابع، میتوانند سرعت نوآوری را تسریع بخشند و فناوریهای هوش مصنوعی را ایجاد کنند که به نفع همه بشریت باشد.
آینده هوش مصنوعی: یک چشمانداز مشارکتی و رقابتی
چشمانداز کنونی توسعه هوش مصنوعی با هر دو رقابت شدید و افزایش همکاری مشخص میشود. شرکتها در حال مسابقه برای توسعه مدلهای هوش مصنوعی قدرتمندتر و کارآمدتر هستند، اما همچنین به اهمیت به اشتراک گذاشتن دانش و منابع برای تسریع پیشرفت پی میبرند.
ظهور مدلهای هوش مصنوعی متنباز گواهی بر این روحیه مشارکتی است. شرکتها با ارائه رایگان مدلهای خود، میتوانند نوآوری را تشویق کنند و یک جامعه جهانی از توسعهدهندگان هوش مصنوعی را تقویت کنند. این رویکرد مشارکتی میتواند منجر به پیشرفت سریعتر و توسعه فناوریهای هوش مصنوعی شود که برای جامعه مفیدتر هستند.
با این حال، رقابت برای تسلط بر هوش مصنوعی همچنان شدید است. کشورها به شدت در تحقیق و توسعه هوش مصنوعی سرمایهگذاری میکنند و شرکتها برای سهم بازار در صنعت هوش مصنوعی با رشد سریع رقابت میکنند. این رقابت باعث نوآوری میشود و مرزهای آنچه با هوش مصنوعی امکانپذیر است را جابجا میکند.
آینده هوش مصنوعی احتمالاً توسط یک تعامل پیچیده از رقابت و همکاری شکل خواهد گرفت. شرکتها و کشورها به رقابت برای تسلط بر هوش مصنوعی ادامه خواهند داد، اما همچنین به اهمیت همکاری برای مقابله با چالشها و فرصتهای ارائه شده توسط این فناوری متحول کننده پی خواهند برد. نتیجه نهایی به این بستگی دارد که چگونه میتوانیم این نیروهای متضاد را متعادل کنیم و اطمینان حاصل کنیم که هوش مصنوعی به گونهای توسعه یافته و مورد استفاده قرار میگیرد که به نفع همه بشریت باشد.
رقابت بین Grok 3.5 و Qwen3 تنها یک نمونه از رقابت شدید و نوآوری سریعی است که در حال حاضر چشمانداز هوش مصنوعی را تعریف میکند. همانطور که فناوری هوش مصنوعی به تکامل خود ادامه میدهد، میتوانیم انتظار داشته باشیم که در سالهای آینده شاهد پیشرفتهای شگفتانگیزتری باشیم. کلید موفقیت این خواهد بود که هم رقابت و هم همکاری را در آغوش بگیریم و اطمینان حاصل کنیم که هوش مصنوعی به روشی مسئولانه و اخلاقی توسعه یافته و مورد استفاده قرار میگیرد.