چشمانداز هوش مصنوعی، که زمانی به نظر میرسید تحت سلطه تعداد انگشتشماری از غولهای Silicon Valley مانند OpenAI، Google، Meta و Microsoft قرار دارد، در حال تجربه تحولی شگفتانگیز است. در حالی که این بازیگران تثبیتشده به رقابت پرمخاطره توسعه خود ادامه میدهند و اغلب پیشرفتهترین قابلیتهای خود را پشت دیوارهای پرداخت اشتراکی قرار میدهند، یک جریان مخالف قدرتمند در حال شتاب گرفتن است. موج جدیدی از رقبا، بهویژه از مراکز نوآوری در چین، نشان میدهند که هوش مصنوعی پیشرفته لزوماً نیازمند هزینههای گزاف یا محرمانگی انحصاری نیست. شرکتهایی مانند DeepSeek، Alibaba و Baidu در حال قدم گذاشتن به صحنه جهانی هستند و از مدلهای قدرتمندی دفاع میکنند که اغلب به عنوان جایگزینهای متنباز یا کمهزینه ارائه میشوند، که اساساً مدلهای تجاری غالب را به چالش میکشند و امکانات را برای توسعهدهندگان و کاربران در سراسر جهان گسترش میدهند.
این پویایی نوظهور چیزی بیش از ورود رقبای جدید به عرصه رقابت است؛ این نشاندهنده یک تغییر بالقوه در فلسفه زیربنایی توسعه و دسترسی به هوش مصنوعی است. تصمیم این بازیگران جدیدتر برای انتشار مدلهای پیچیده تحت مجوزهای سهلگیرانه، که کد زیربنایی را به راحتی در پلتفرمهایی مانند GitHub و Hugging Face در دسترس قرار میدهد، در تضاد کامل با رویکرد اغلب غیرشفاف و باغ بسته مورد علاقه برخی غولهای غربی قرار دارد. این گشودگی نه تنها دسترسی به ابزارهای قدرتمند را دموکراتیزه میکند، بلکه اکوسیستم پر جنب و جوشی را پرورش میدهد که در آن توسعهدهندگان میتوانند آزادانه آزمایش کنند، سفارشیسازی کنند و بر روی این مدلهای بنیادی بنا کنند، که به طور بالقوه نوآوری را با سرعتی بیسابقه شتاب میبخشد. بیایید به سه نمونه برجسته که این حرکت را رهبری میکنند بپردازیم و ریشهها، قابلیتها و پیامدهای استراتژیهای باز آنها را بررسی کنیم.
DeepSeek: تازهوارد چابک که ساختار موجود را میلرزاند
شرکت تحقیقاتی فناوری پایه هوش مصنوعی Hangzhou DeepSeek، که تحت نام مختصرتر DeepSeek فعالیت میکند، با سرعت و تأثیر قابل توجهی وارد صحنه بینالمللی هوش مصنوعی شد. DeepSeek، اگرچه یک نهاد نسبتاً جوان است که رسماً در آوریل 2023 به عنوان شاخهای از شرکت معاملات کمی High-Flyer Quant تأسیس شد، به سرعت به دلیل توسعه مدلهای هوش مصنوعی که با مدلهای غولهای صنعتی با چرخههای توسعه بسیار طولانیتر و بودجههای قابل توجه بزرگتر رقابت میکردند و در برخی معیارها گزارش شده که از آنها پیشی گرفتهاند، توجه را به خود جلب کرد. این توانایی برای دستیابی به عملکرد رقابتی با کارایی ظاهراً بیشتر، موجهایی را در این بخش ایجاد کرد.
چرخه تکرار سریع این شرکت قابل توجه است. با شروع از DeepSeek-LLM اولیه خود، به سرعت مدلهای تخصصی مانند DeepSeek-Math را دنبال کرد. اعلام DeepSeek V2 و متعاقباً DeepSeek V3 در اواخر سال 2024، مسیر بلندپروازانه این شرکت را نشان داد. با این حال، رونمایی از مدلهای استدلالی آن، DeepSeek-R1 و DeepSeek-R1-Zero، در ژانویه 2025 بود که واقعاً تخیل صنعت را به خود جلب کرد و مسلماً نقطه عطفی را رقم زد. این مدلها مقایسههای مستقیم و اغلب مطلوبی را با سری پیشرفته GPT-4 OpenAI و مدل پیشبینیشده ‘o1’ آن برانگیختند و بحثهای قابل توجهی را در مورد وضعیت پیشرفته در استدلال هوش مصنوعی ایجاد کردند. این معرفی صرفاً آکادمیک نبود؛ گزارش شده است که بر قیمت سهام رقبا تأثیر گذاشته، باعث ارزیابی مجدد استراتژیک در آزمایشگاههای هوش مصنوعی تثبیتشده شده و حتی بحثهایی را در میان نهادهای دولتی در مورد پیامدهای چنین هوش مصنوعی قدرتمند و قابل دسترسی که از بازیگران جدید جهانی سرچشمه میگیرد، برانگیخته است.
DeepSeek از آنچه استراتژی “وزن باز” (open weight) مینامد برای بسیاری از مدلهای خود استفاده میکند و آنها را تحت مجوز سهلگیرانه MIT License منتشر میکند. در حالی که این ممکن است در دقیقترین تعریف با 100٪ متنباز بودن برابر نباشد (زیرا جنبههای خاصی از دادههای آموزشی یا روششناسی ممکن است اختصاصی باقی بماند)، درجه قابل توجهی از گشودگی را نشان میدهد. نکته مهم این است که وزنهای مدل – پارامترهایی که دانش آموختهشده مدل را در بر میگیرند – در دسترس قرار میگیرند. این به توسعهدهندگان اجازه میدهد تا مدلها را از مخازنی مانند GitHub و Hugging Face دانلود کنند و آنها را قادر میسازد تا مدلها را به صورت محلی اجرا کنند، آنها را برای وظایف خاص تنظیم دقیق کنند، آنها را در برنامههای منحصر به فرد ادغام کنند یا به سادگی معماری آنها را مطالعه کنند. این سطح از دسترسی با تعامل صرف از طریق یک API محدود یا یک رابط وب بسته، فاصله زیادی دارد.
از دیدگاه کاربر، DeepSeek عمدتاً به عنوان یک ابزار هوش مصنوعی به سبک چتبات ظاهر میشود که از طریق یک رابط وب و برنامههای تلفن همراه اختصاصی برای هر دو پلتفرم iOS و Android قابل دسترسی است. نفوذ رو به رشد آن با لیست رو به رشدی از مشارکتها بیشتر مشهود است. فناوری DeepSeek توسط بازیگران اصلی فناوری، از جمله Lenovo، Tencent، Alibaba و Baidu، در حال ادغام یا بررسی است که کاربرد بالقوه آن را در اکوسیستمهای سختافزاری و نرمافزاری متنوع نشان میدهد. ظهور DeepSeek بر یک موضوع کلیدی تأکید میکند: پیشرفتهای قابل توجه هوش مصنوعی دیگر حوزه انحصاری آزمایشگاههای تحقیقاتی قدیمی نیست و توسعه کارآمد همراه با گشودگی استراتژیک میتواند به سرعت چشمانداز رقابتی را تغییر دهد.
Qwen از Alibaba: گشودگی در مقیاس بزرگ از یک غول تجارت الکترونیک
در حالی که DeepSeek نماینده استارتاپ چابکی است که وضعیت موجود را به چالش میکشد، Alibaba Qwen (Tongyi Qianwen) نشاندهنده استقبال استراتژیک از گشودگی توسط یکی از بزرگترین شرکتهای فناوری چین و در واقع جهان است. Alibaba، که به خاطر امپراتوری گسترده تجارت الکترونیک، خدمات رایانش ابری و سرمایهگذاریهای فناورانه متنوع خود مشهور است، با منابع و جاهطلبی قابل توجهی وارد رقابت هوش مصنوعی مولد شد. خانواده مدلهای زبان بزرگ Qwen به سرعت خود را در میان پیشروترین پیشنهادات متنباز در سطح جهان تثبیت کرد.
این سفر با انتشار نسخه بتا در آوریل 2023 آغاز شد و به سرعت در جامعه هوش مصنوعی محبوبیت پیدا کرد زیرا Alibaba به تدریج مدلهای مختلفی را تحت مجوزهای متنباز در طول آن سال منتشر کرد. این تعهد به گشودگی تا حد زیادی با تکرارهای بعدی ادامه یافته است. در حالی که برخی نسخههای بسیار تخصصی یا حساس از نظر تجاری ممکن است مجوزهای متفاوتی داشته باشند، مدلهای اصلی در سری Qwen، از جمله Qwen 2، سری چندوجهی Qwen-VL (که هم متن و هم تصویر را پردازش میکند)، Qwen-Audio و Qwen2-Math با گرایش ریاضیاتی، اغلب تحت مجوزهای سهلگیرانهای مانند Apache 2.0 License در دسترس قرار گرفتهاند. این امکان استفاده تجاری و تحقیقاتی گسترده را فراهم میکند و پذیرش را بیشتر تقویت میکند. مانند DeepSeek، این مدلها به راحتی از طریق پلتفرمهایی مانند GitHub و Hugging Face در دسترس جامعه جهانی توسعهدهندگان قرار دارند.
Alibaba از قرار دادن مستقیم مدلهای خود در برابر بهترینهای صنعت ابایی نداشته است. اعلام Qwen 2.5-Max در ژانویه 2025 و Qwen2.5-VL چندوجهی در مارس 2025 با ادعاهای جسورانهای همراه بود و آنها را به عنوان دارای قابلیتهایی فراتر یا رقیب مدلهای برجستهای مانند GPT-4o OpenAI، V3 DeepSeek و Llama-3.1-405B قدرتمند Meta معرفی کرد. در حالی که نتایج بنچمارک میتواند تابع تفسیر و ارزیابی وظایف خاص باشد، توسعه مداوم و موضعگیری رقابتی بر قصد جدی Alibaba در حوزه هوش مصنوعی تأکید میکند.
جالب اینجاست که مدل اولیه Qwen به میراث خود اذعان داشت و تا حدی بر اساس مدل زبان بزرگ بنیادی Llama از Meta بود – که خود یک انتشار متنباز برجسته بود که فعالیت زیادی را در این زمینه کاتالیز کرد. با این حال، Alibaba به طور قابل توجهی این بنیاد را اصلاح کرده و بر روی آن بنا نهاده است و معماریها و روشهای آموزشی منحصر به فرد خود را برای نسلهای بعدی Qwen توسعه داده است. این تکامل یک الگوی رایج در دنیای متنباز را برجسته میکند: ساختن بر روی کارهای موجود برای ایجاد قابلیتهای جدید و پیشرفته.
تأثیر استراتژی باز Qwen شاید به بهترین وجه با آمار خیرهکنندهای که ذکر شده نشان داده شود: گزارش شده است که بیش از 90,000 مدل مستقل بر اساس کد متنباز Qwen توسعه یافته است. این رقم گویای قدرت انتشار باز است. این نشاندهنده یک اکوسیستم پر رونق است که در آن محققان، استارتاپها و توسعهدهندگان فردی از کار بنیادی Alibaba برای ایجاد ابزارهای تخصصی، انجام آزمایشهای جدید و پیش بردن مرزهای هوش مصنوعی در جهات مختلف استفاده میکنند. برای کاربران نهایی، Qwen معمولاً از طریق یک رابط چتبات آشنا قابل دسترسی است که در وب و از طریق برنامههای تلفن همراه در iOS و Android در دسترس است. رویکرد Alibaba نشان میدهد که حتی غولهای فناوری نیز میتوانند به طور استراتژیک از متنباز برای پرورش نوآوری، ایجاد جامعه و رقابت مؤثر در صحنه جهانی هوش مصنوعی استفاده کنند.
Ernie از Baidu: یک تغییر استراتژیک از یک غول جستجو
Baidu، که اغلب به دلیل تسلط خود در بازار موتورهای جستجو به عنوان Google چین شناخته میشود، نوع متفاوتی از میراث را به رقابت هوش مصنوعی میآورد. برخلاف DeepSeek یا حتی فشار نسبتاً اخیر Alibaba در زمینه مدلهای زبان بزرگ (LLM)، Baidu سالهاست که عمیقاً در تحقیقات هوش مصنوعی، بهویژه در پردازش زبان طبیعی، درگیر بوده است. تبار مدل ERNIE (Enhanced Representation through Knowledge Integration) آن به سال 2019 بازمیگردد، که پیش از شور و شوق انتشار عمومی ناشی از ChatGPT بود.
فشار عمومی هوش مصنوعی مولد با انتشار Ernie 3.0 LLM در مارس 2023 و سپس Ernie 3.5 در ژوئن 2023 به طور جدی آغاز شد. در ابتدا، Baidu رویکرد لایهبندی شده متعارفتری را اتخاذ کرد، شبیه به برخی همتایان غربی. Ernie 4.0 پیشرفتهتر، که در اکتبر 2023 منتشر شد، عمدتاً برای محصولات مبتنی بر اشتراک Baidu رزرو شده بود، در حالی که Ernie 3.5 توانمند، نسخه رایگان چتبات آن را که به عنوان Ernie Bot شناخته میشود، تأمین میکرد.
با این حال، پویایی رقابتی در صنعت هوش مصنوعی، که با پیشرفتهای سریع رقبا (هم داخلی و هم بینالمللی) و افزایش قابلیت دوام استراتژیهای متنباز مشخص میشود، همراه با کاهش بالقوه هزینههای تولید مدل، به نظر میرسد که باعث یک چرخش استراتژیک قابل توجه شده است. Baidu سیگنال یک تغییر قاطع به سمت گشودگی بیشتر را داد. در حالی که مدلهای فعلی Ernie که خدمات اصلی آن را تأمین میکنند در ابتدا متنباز نبودند، این شرکت برنامههایی را برای تغییر چشمگیر این مسیر اعلام کرد.
انتشار Ernie 4.5 LLM و یک مدل استدلالی اختصاصی، Ernie X1، در اواسط مارس 2025، بلافاصله مقایسههایی را با GPT-4.5 OpenAI و R1 DeepSeek به ترتیب برانگیخت و Baidu را محکم در ردیف بالای ارائهدهندگان مدل هوش مصنوعی قرار داد. نکته مهم، در کنار این ادعاهای عملکرد، Baidu یک نقشه راه روشن به سمت گشودگی را اعلام کرد. این شرکت قصد خود را برای متنباز کردن مدلهای اصلی خود از 30 ژوئن اعلام کرد. علاوه بر این، اعلام کرد که چتبات Ernie Bot آن از اول آوریل برای همه کاربران رایگان خواهد شد و مانع اشتراک قبلی برای دسترسی به تواناترین هوش مصنوعی مکالمهای خود را حذف میکند. با نگاه به آینده، Baidu همچنین اشاره کرده است که تکرار اصلی بعدی آن، Ernie 5، که در نیمه دوم سال 2025 انتظار میرود، به طور مشابه فلسفه متنباز و رایگان برای استفاده را در پیش خواهد گرفت.
این جهتگیری مجدد استراتژیک توسط بازیگری با جایگاه Baidu بسیار قابل توجه است. این نشاندهنده این شناخت است که گشودگی ممکن است به یک ضرورت رقابتی تبدیل شود، نه فقط یک مسیر جایگزین. Baidu با در دسترس قرار دادن رایگان مدلهای پیشرفته خود، میتواند جامعه توسعهدهندگان را پرورش دهد، نوآوری را در اطراف پلتفرم خود تحریک کند و به طور بالقوه سهم قابل توجهی از ذهن کاربران را که به دنبال ابزارهای هوش مصنوعی قدرتمند و بدون محدودیت هستند، به دست آورد.
مانند رقبای خود، رابط کاربری اصلی برای Ernie یک چتبات است که از طریق وب و برنامههای تلفن همراه (iOS و Android) قابل دسترسی است. قابلیتهای Ernie همچنین راه خود را به محصولات مصرفی ملموس پیدا کردهاند، به ویژه با ادغام در ویژگیهای هوش مصنوعی نسخه بینالمللی سری گوشیهای هوشمند Samsung Galaxy S24. این ادغام نمونهای عینی از چگونگی حرکت این مدلهای زبان پیشرفته فراتر از آزمایشگاههای تحقیقاتی و رابطهای وب به دستگاههایی است که میلیونها نفر روزانه از آنها استفاده میکنند. استراتژی در حال تحول Baidu بر سیالیت چشمانداز هوش مصنوعی تأکید میکند، جایی که حتی غولهای تثبیتشده نیز در پاسخ به پیشرفت فناوری و تغییر انتظارات بازار، رویکردهای خود را تطبیق میدهند.
پیمایش در جهان در حال گسترش هوش مصنوعی
ظهور مدلهای هوش مصنوعی قدرتمند و قابل دسترس از DeepSeek، Alibaba و Baidu چیزی بیش از افزایش رقابت برای بازیگران تثبیتشده مانند OpenAI و Google را نشان میدهد. این نشاندهنده گسترش اساسی انتخاب و فرصت برای طیف متنوعی از کاربران و توسعهدهندگان است. در دسترس بودن این مدلها، اغلب تحت مجوزهای متنباز سهلگیرانه یا “وزن باز”، مانع ورود به نوآوری را به طور قابل توجهی کاهش میدهد. کسبوکارهای کوچک، توسعهدهندگان فردی، محققان و دانشجویان اکنون میتوانند به قابلیتهای هوش مصنوعی دسترسی پیدا کرده و از آنها استفاده کنند که قبلاً به شرکتهای بزرگ یا سطوح اشتراک گرانقیمت محدود بود.
این تکثیر چندین روند مثبت را تقویت میکند:
- سفارشیسازی: توسعهدهندگان میتوانند این مدلهای باز را بر روی مجموعه دادههای خاص تنظیم دقیق کنند تا ابزارهای هوش مصنوعی بسیار تخصصی متناسب با صنایع خاص یا وظایف منحصر به فرد ایجاد کنند و فراتر از راهحلهای عمومی و یکسان حرکت کنند.
- آزمایش: توانایی دانلود و اصلاح وزنهای مدل امکان کاوش عمیقتر در معماریها و قابلیتهای هوش مصنوعی را فراهم میکند و تحقیقات آکادمیک و نوآوری مردمی را پرورش میدهد.
- کاهش هزینه: برای کاربران و سازمانهایی که از هزینههای اشتراک مکرر خسته شدهاند، این جایگزینهای رایگان یا کمهزینه عملکرد قدرتمندی را بدون بار مالی مرتبط ارائه میدهند و به طور بالقوه دسترسی به ابزارهای هوش مصنوعی افزایشدهنده بهرهوری را دموکراتیزه میکنند.
- رشد اکوسیستم: دسترسی از طریق پلتفرمهایی مانند GitHub و Hugging Face جوامع پر جنب و جوشی را در اطراف این مدلها پرورش میدهد و منابع مشترک، پشتیبانی و فرصتهای توسعه مشترک را ارائه میدهد.
با این حال، پیمایش در این جهان گسترشیافته نیازمند بررسی دقیق است. انتخاب یک مدل هوش مصنوعی چیزی بیش از مقایسه معیارهای عملکرد را شامل میشود. عواملی مانند کیفیت و در دسترس بودن مستندات، پاسخگویی جامعه توسعهدهندگان، نقاط قوت و ضعف خاص یک مدل (به عنوان مثال، مهارت کدنویسی در مقابل نوشتن خلاقانه در مقابل درک چندوجهی) و منابع محاسباتی مورد نیاز برای اجرای مؤثر یا تنظیم دقیق مدل، همگی عناصر حیاتی در فرآیند تصمیمگیری هستند. در حالی که پلتفرمهای ابری منابع مقیاسپذیری را ارائه میدهند، پتانسیل اجرای مدلهای قدرتمند به صورت محلی بر روی سختافزار توانمند، یک پیشنهاد جذاب است که توسط برخی از انتشارات باز امکانپذیر شده است.
علاوه بر این، ظهور این جایگزینهای قدرتمند به ناچار سؤالات استراتژیکی را برای بازیگران فعلی ایجاد میکند. آیا فشار ناشی از مدلهای متنباز با کیفیت بالا، غولهای هوش مصنوعی غربی را مجبور به اتخاذ استراتژیهای بازتر خواهد کرد، شاید با انتشار مدلهای قدیمیتر یا ارائه سطوح رایگان سخاوتمندانهتر؟ یا اینکه آنها بر ویژگیهای اختصاصی، قفل شدن در اکوسیستم و راهحلهای متمرکز بر شرکتها برای حفظ برتری خود تأکید خواهند کرد؟ تعامل رقابتی پویا و دائماً در حال تحول است.
بعد ژئوپلیتیکی نیز پیچیدگی را میافزاید، زیرا توسعه قابلیتهای هوش مصنوعی پیشرفته در خارج از مراکز سنتی غربی، پیامدهای بلندمدت قابل توجهی برای رهبری فناوری و استانداردهای جهانی دارد. همانطور که این ابزارهای قدرتمند به طور گستردهتری توزیع میشوند، بحثها پیرامون توسعه مسئولانه هوش مصنوعی، دستورالعملهای اخلاقی و سوء استفاده بالقوه نیز در بین همه بازیگران، صرف نظر از منشأ یا مدل صدور مجوز آنها، به طور فزایندهای مرتبط میشود. رقابت هوش مصنوعی بدون شک گسترش یافته است و چشماندازی غنیتر، پیچیدهتر و در نهایت در دسترستر از همیشه ارائه میدهد. چالش و فرصت اکنون در مهار مسئولانه و مؤثر این پتانسیل گسترشیافته نهفته است.