فراتر از اشتراک: جایگزین‌های قدرتمند هوش مصنوعی متن‌باز

چشم‌انداز هوش مصنوعی، که زمانی به نظر می‌رسید تحت سلطه تعداد انگشت‌شماری از غول‌های Silicon Valley مانند OpenAI، Google، Meta و Microsoft قرار دارد، در حال تجربه تحولی شگفت‌انگیز است. در حالی که این بازیگران تثبیت‌شده به رقابت پرمخاطره توسعه خود ادامه می‌دهند و اغلب پیشرفته‌ترین قابلیت‌های خود را پشت دیوارهای پرداخت اشتراکی قرار می‌دهند، یک جریان مخالف قدرتمند در حال شتاب گرفتن است. موج جدیدی از رقبا، به‌ویژه از مراکز نوآوری در چین، نشان می‌دهند که هوش مصنوعی پیشرفته لزوماً نیازمند هزینه‌های گزاف یا محرمانگی انحصاری نیست. شرکت‌هایی مانند DeepSeek، Alibaba و Baidu در حال قدم گذاشتن به صحنه جهانی هستند و از مدل‌های قدرتمندی دفاع می‌کنند که اغلب به عنوان جایگزین‌های متن‌باز یا کم‌هزینه ارائه می‌شوند، که اساساً مدل‌های تجاری غالب را به چالش می‌کشند و امکانات را برای توسعه‌دهندگان و کاربران در سراسر جهان گسترش می‌دهند.

این پویایی نوظهور چیزی بیش از ورود رقبای جدید به عرصه رقابت است؛ این نشان‌دهنده یک تغییر بالقوه در فلسفه زیربنایی توسعه و دسترسی به هوش مصنوعی است. تصمیم این بازیگران جدیدتر برای انتشار مدل‌های پیچیده تحت مجوزهای سهل‌گیرانه، که کد زیربنایی را به راحتی در پلتفرم‌هایی مانند GitHub و Hugging Face در دسترس قرار می‌دهد، در تضاد کامل با رویکرد اغلب غیرشفاف و باغ بسته مورد علاقه برخی غول‌های غربی قرار دارد. این گشودگی نه تنها دسترسی به ابزارهای قدرتمند را دموکراتیزه می‌کند، بلکه اکوسیستم پر جنب و جوشی را پرورش می‌دهد که در آن توسعه‌دهندگان می‌توانند آزادانه آزمایش کنند، سفارشی‌سازی کنند و بر روی این مدل‌های بنیادی بنا کنند، که به طور بالقوه نوآوری را با سرعتی بی‌سابقه شتاب می‌بخشد. بیایید به سه نمونه برجسته که این حرکت را رهبری می‌کنند بپردازیم و ریشه‌ها، قابلیت‌ها و پیامدهای استراتژی‌های باز آنها را بررسی کنیم.

DeepSeek: تازه‌وارد چابک که ساختار موجود را می‌لرزاند

شرکت تحقیقاتی فناوری پایه هوش مصنوعی Hangzhou DeepSeek، که تحت نام مختصرتر DeepSeek فعالیت می‌کند، با سرعت و تأثیر قابل توجهی وارد صحنه بین‌المللی هوش مصنوعی شد. DeepSeek، اگرچه یک نهاد نسبتاً جوان است که رسماً در آوریل 2023 به عنوان شاخه‌ای از شرکت معاملات کمی High-Flyer Quant تأسیس شد، به سرعت به دلیل توسعه مدل‌های هوش مصنوعی که با مدل‌های غول‌های صنعتی با چرخه‌های توسعه بسیار طولانی‌تر و بودجه‌های قابل توجه بزرگتر رقابت می‌کردند و در برخی معیارها گزارش شده که از آنها پیشی گرفته‌اند، توجه را به خود جلب کرد. این توانایی برای دستیابی به عملکرد رقابتی با کارایی ظاهراً بیشتر، موج‌هایی را در این بخش ایجاد کرد.

چرخه تکرار سریع این شرکت قابل توجه است. با شروع از DeepSeek-LLM اولیه خود، به سرعت مدل‌های تخصصی مانند DeepSeek-Math را دنبال کرد. اعلام DeepSeek V2 و متعاقباً DeepSeek V3 در اواخر سال 2024، مسیر بلندپروازانه این شرکت را نشان داد. با این حال، رونمایی از مدل‌های استدلالی آن، DeepSeek-R1 و DeepSeek-R1-Zero، در ژانویه 2025 بود که واقعاً تخیل صنعت را به خود جلب کرد و مسلماً نقطه عطفی را رقم زد. این مدل‌ها مقایسه‌های مستقیم و اغلب مطلوبی را با سری پیشرفته GPT-4 OpenAI و مدل پیش‌بینی‌شده ‘o1’ آن برانگیختند و بحث‌های قابل توجهی را در مورد وضعیت پیشرفته در استدلال هوش مصنوعی ایجاد کردند. این معرفی صرفاً آکادمیک نبود؛ گزارش شده است که بر قیمت سهام رقبا تأثیر گذاشته، باعث ارزیابی مجدد استراتژیک در آزمایشگاه‌های هوش مصنوعی تثبیت‌شده شده و حتی بحث‌هایی را در میان نهادهای دولتی در مورد پیامدهای چنین هوش مصنوعی قدرتمند و قابل دسترسی که از بازیگران جدید جهانی سرچشمه می‌گیرد، برانگیخته است.

DeepSeek از آنچه استراتژی “وزن باز” (open weight) می‌نامد برای بسیاری از مدل‌های خود استفاده می‌کند و آنها را تحت مجوز سهل‌گیرانه MIT License منتشر می‌کند. در حالی که این ممکن است در دقیق‌ترین تعریف با 100٪ متن‌باز بودن برابر نباشد (زیرا جنبه‌های خاصی از داده‌های آموزشی یا روش‌شناسی ممکن است اختصاصی باقی بماند)، درجه قابل توجهی از گشودگی را نشان می‌دهد. نکته مهم این است که وزن‌های مدل – پارامترهایی که دانش آموخته‌شده مدل را در بر می‌گیرند – در دسترس قرار می‌گیرند. این به توسعه‌دهندگان اجازه می‌دهد تا مدل‌ها را از مخازنی مانند GitHub و Hugging Face دانلود کنند و آنها را قادر می‌سازد تا مدل‌ها را به صورت محلی اجرا کنند، آنها را برای وظایف خاص تنظیم دقیق کنند، آنها را در برنامه‌های منحصر به فرد ادغام کنند یا به سادگی معماری آنها را مطالعه کنند. این سطح از دسترسی با تعامل صرف از طریق یک API محدود یا یک رابط وب بسته، فاصله زیادی دارد.

از دیدگاه کاربر، DeepSeek عمدتاً به عنوان یک ابزار هوش مصنوعی به سبک چت‌بات ظاهر می‌شود که از طریق یک رابط وب و برنامه‌های تلفن همراه اختصاصی برای هر دو پلتفرم iOS و Android قابل دسترسی است. نفوذ رو به رشد آن با لیست رو به رشدی از مشارکت‌ها بیشتر مشهود است. فناوری DeepSeek توسط بازیگران اصلی فناوری، از جمله Lenovo، Tencent، Alibaba و Baidu، در حال ادغام یا بررسی است که کاربرد بالقوه آن را در اکوسیستم‌های سخت‌افزاری و نرم‌افزاری متنوع نشان می‌دهد. ظهور DeepSeek بر یک موضوع کلیدی تأکید می‌کند: پیشرفت‌های قابل توجه هوش مصنوعی دیگر حوزه انحصاری آزمایشگاه‌های تحقیقاتی قدیمی نیست و توسعه کارآمد همراه با گشودگی استراتژیک می‌تواند به سرعت چشم‌انداز رقابتی را تغییر دهد.

Qwen از Alibaba: گشودگی در مقیاس بزرگ از یک غول تجارت الکترونیک

در حالی که DeepSeek نماینده استارتاپ چابکی است که وضعیت موجود را به چالش می‌کشد، Alibaba Qwen (Tongyi Qianwen) نشان‌دهنده استقبال استراتژیک از گشودگی توسط یکی از بزرگترین شرکت‌های فناوری چین و در واقع جهان است. Alibaba، که به خاطر امپراتوری گسترده تجارت الکترونیک، خدمات رایانش ابری و سرمایه‌گذاری‌های فناورانه متنوع خود مشهور است، با منابع و جاه‌طلبی قابل توجهی وارد رقابت هوش مصنوعی مولد شد. خانواده مدل‌های زبان بزرگ Qwen به سرعت خود را در میان پیشروترین پیشنهادات متن‌باز در سطح جهان تثبیت کرد.

این سفر با انتشار نسخه بتا در آوریل 2023 آغاز شد و به سرعت در جامعه هوش مصنوعی محبوبیت پیدا کرد زیرا Alibaba به تدریج مدل‌های مختلفی را تحت مجوزهای متن‌باز در طول آن سال منتشر کرد. این تعهد به گشودگی تا حد زیادی با تکرارهای بعدی ادامه یافته است. در حالی که برخی نسخه‌های بسیار تخصصی یا حساس از نظر تجاری ممکن است مجوزهای متفاوتی داشته باشند، مدل‌های اصلی در سری Qwen، از جمله Qwen 2، سری چندوجهی Qwen-VL (که هم متن و هم تصویر را پردازش می‌کند)، Qwen-Audio و Qwen2-Math با گرایش ریاضیاتی، اغلب تحت مجوزهای سهل‌گیرانه‌ای مانند Apache 2.0 License در دسترس قرار گرفته‌اند. این امکان استفاده تجاری و تحقیقاتی گسترده را فراهم می‌کند و پذیرش را بیشتر تقویت می‌کند. مانند DeepSeek، این مدل‌ها به راحتی از طریق پلتفرم‌هایی مانند GitHub و Hugging Face در دسترس جامعه جهانی توسعه‌دهندگان قرار دارند.

Alibaba از قرار دادن مستقیم مدل‌های خود در برابر بهترین‌های صنعت ابایی نداشته است. اعلام Qwen 2.5-Max در ژانویه 2025 و Qwen2.5-VL چندوجهی در مارس 2025 با ادعاهای جسورانه‌ای همراه بود و آنها را به عنوان دارای قابلیت‌هایی فراتر یا رقیب مدل‌های برجسته‌ای مانند GPT-4o OpenAI، V3 DeepSeek و Llama-3.1-405B قدرتمند Meta معرفی کرد. در حالی که نتایج بنچمارک می‌تواند تابع تفسیر و ارزیابی وظایف خاص باشد، توسعه مداوم و موضع‌گیری رقابتی بر قصد جدی Alibaba در حوزه هوش مصنوعی تأکید می‌کند.

جالب اینجاست که مدل اولیه Qwen به میراث خود اذعان داشت و تا حدی بر اساس مدل زبان بزرگ بنیادی Llama از Meta بود – که خود یک انتشار متن‌باز برجسته بود که فعالیت زیادی را در این زمینه کاتالیز کرد. با این حال، Alibaba به طور قابل توجهی این بنیاد را اصلاح کرده و بر روی آن بنا نهاده است و معماری‌ها و روش‌های آموزشی منحصر به فرد خود را برای نسل‌های بعدی Qwen توسعه داده است. این تکامل یک الگوی رایج در دنیای متن‌باز را برجسته می‌کند: ساختن بر روی کارهای موجود برای ایجاد قابلیت‌های جدید و پیشرفته.

تأثیر استراتژی باز Qwen شاید به بهترین وجه با آمار خیره‌کننده‌ای که ذکر شده نشان داده شود: گزارش شده است که بیش از 90,000 مدل مستقل بر اساس کد متن‌باز Qwen توسعه یافته است. این رقم گویای قدرت انتشار باز است. این نشان‌دهنده یک اکوسیستم پر رونق است که در آن محققان، استارتاپ‌ها و توسعه‌دهندگان فردی از کار بنیادی Alibaba برای ایجاد ابزارهای تخصصی، انجام آزمایش‌های جدید و پیش بردن مرزهای هوش مصنوعی در جهات مختلف استفاده می‌کنند. برای کاربران نهایی، Qwen معمولاً از طریق یک رابط چت‌بات آشنا قابل دسترسی است که در وب و از طریق برنامه‌های تلفن همراه در iOS و Android در دسترس است. رویکرد Alibaba نشان می‌دهد که حتی غول‌های فناوری نیز می‌توانند به طور استراتژیک از متن‌باز برای پرورش نوآوری، ایجاد جامعه و رقابت مؤثر در صحنه جهانی هوش مصنوعی استفاده کنند.

Ernie از Baidu: یک تغییر استراتژیک از یک غول جستجو

Baidu، که اغلب به دلیل تسلط خود در بازار موتورهای جستجو به عنوان Google چین شناخته می‌شود، نوع متفاوتی از میراث را به رقابت هوش مصنوعی می‌آورد. برخلاف DeepSeek یا حتی فشار نسبتاً اخیر Alibaba در زمینه مدل‌های زبان بزرگ (LLM)، Baidu سال‌هاست که عمیقاً در تحقیقات هوش مصنوعی، به‌ویژه در پردازش زبان طبیعی، درگیر بوده است. تبار مدل ERNIE (Enhanced Representation through Knowledge Integration) آن به سال 2019 بازمی‌گردد، که پیش از شور و شوق انتشار عمومی ناشی از ChatGPT بود.

فشار عمومی هوش مصنوعی مولد با انتشار Ernie 3.0 LLM در مارس 2023 و سپس Ernie 3.5 در ژوئن 2023 به طور جدی آغاز شد. در ابتدا، Baidu رویکرد لایه‌بندی شده متعارف‌تری را اتخاذ کرد، شبیه به برخی همتایان غربی. Ernie 4.0 پیشرفته‌تر، که در اکتبر 2023 منتشر شد، عمدتاً برای محصولات مبتنی بر اشتراک Baidu رزرو شده بود، در حالی که Ernie 3.5 توانمند، نسخه رایگان چت‌بات آن را که به عنوان Ernie Bot شناخته می‌شود، تأمین می‌کرد.

با این حال، پویایی رقابتی در صنعت هوش مصنوعی، که با پیشرفت‌های سریع رقبا (هم داخلی و هم بین‌المللی) و افزایش قابلیت دوام استراتژی‌های متن‌باز مشخص می‌شود، همراه با کاهش بالقوه هزینه‌های تولید مدل، به نظر می‌رسد که باعث یک چرخش استراتژیک قابل توجه شده است. Baidu سیگنال یک تغییر قاطع به سمت گشودگی بیشتر را داد. در حالی که مدل‌های فعلی Ernie که خدمات اصلی آن را تأمین می‌کنند در ابتدا متن‌باز نبودند، این شرکت برنامه‌هایی را برای تغییر چشمگیر این مسیر اعلام کرد.

انتشار Ernie 4.5 LLM و یک مدل استدلالی اختصاصی، Ernie X1، در اواسط مارس 2025، بلافاصله مقایسه‌هایی را با GPT-4.5 OpenAI و R1 DeepSeek به ترتیب برانگیخت و Baidu را محکم در ردیف بالای ارائه‌دهندگان مدل هوش مصنوعی قرار داد. نکته مهم، در کنار این ادعاهای عملکرد، Baidu یک نقشه راه روشن به سمت گشودگی را اعلام کرد. این شرکت قصد خود را برای متن‌باز کردن مدل‌های اصلی خود از 30 ژوئن اعلام کرد. علاوه بر این، اعلام کرد که چت‌بات Ernie Bot آن از اول آوریل برای همه کاربران رایگان خواهد شد و مانع اشتراک قبلی برای دسترسی به تواناترین هوش مصنوعی مکالمه‌ای خود را حذف می‌کند. با نگاه به آینده، Baidu همچنین اشاره کرده است که تکرار اصلی بعدی آن، Ernie 5، که در نیمه دوم سال 2025 انتظار می‌رود، به طور مشابه فلسفه متن‌باز و رایگان برای استفاده را در پیش خواهد گرفت.

این جهت‌گیری مجدد استراتژیک توسط بازیگری با جایگاه Baidu بسیار قابل توجه است. این نشان‌دهنده این شناخت است که گشودگی ممکن است به یک ضرورت رقابتی تبدیل شود، نه فقط یک مسیر جایگزین. Baidu با در دسترس قرار دادن رایگان مدل‌های پیشرفته خود، می‌تواند جامعه توسعه‌دهندگان را پرورش دهد، نوآوری را در اطراف پلتفرم خود تحریک کند و به طور بالقوه سهم قابل توجهی از ذهن کاربران را که به دنبال ابزارهای هوش مصنوعی قدرتمند و بدون محدودیت هستند، به دست آورد.

مانند رقبای خود، رابط کاربری اصلی برای Ernie یک چت‌بات است که از طریق وب و برنامه‌های تلفن همراه (iOS و Android) قابل دسترسی است. قابلیت‌های Ernie همچنین راه خود را به محصولات مصرفی ملموس پیدا کرده‌اند، به ویژه با ادغام در ویژگی‌های هوش مصنوعی نسخه بین‌المللی سری گوشی‌های هوشمند Samsung Galaxy S24. این ادغام نمونه‌ای عینی از چگونگی حرکت این مدل‌های زبان پیشرفته فراتر از آزمایشگاه‌های تحقیقاتی و رابط‌های وب به دستگاه‌هایی است که میلیون‌ها نفر روزانه از آنها استفاده می‌کنند. استراتژی در حال تحول Baidu بر سیالیت چشم‌انداز هوش مصنوعی تأکید می‌کند، جایی که حتی غول‌های تثبیت‌شده نیز در پاسخ به پیشرفت فناوری و تغییر انتظارات بازار، رویکردهای خود را تطبیق می‌دهند.

پیمایش در جهان در حال گسترش هوش مصنوعی

ظهور مدل‌های هوش مصنوعی قدرتمند و قابل دسترس از DeepSeek، Alibaba و Baidu چیزی بیش از افزایش رقابت برای بازیگران تثبیت‌شده مانند OpenAI و Google را نشان می‌دهد. این نشان‌دهنده گسترش اساسی انتخاب و فرصت برای طیف متنوعی از کاربران و توسعه‌دهندگان است. در دسترس بودن این مدل‌ها، اغلب تحت مجوزهای متن‌باز سهل‌گیرانه یا “وزن باز”، مانع ورود به نوآوری را به طور قابل توجهی کاهش می‌دهد. کسب‌وکارهای کوچک، توسعه‌دهندگان فردی، محققان و دانشجویان اکنون می‌توانند به قابلیت‌های هوش مصنوعی دسترسی پیدا کرده و از آنها استفاده کنند که قبلاً به شرکت‌های بزرگ یا سطوح اشتراک گران‌قیمت محدود بود.

این تکثیر چندین روند مثبت را تقویت می‌کند:

  • سفارشی‌سازی: توسعه‌دهندگان می‌توانند این مدل‌های باز را بر روی مجموعه داده‌های خاص تنظیم دقیق کنند تا ابزارهای هوش مصنوعی بسیار تخصصی متناسب با صنایع خاص یا وظایف منحصر به فرد ایجاد کنند و فراتر از راه‌حل‌های عمومی و یکسان حرکت کنند.
  • آزمایش: توانایی دانلود و اصلاح وزن‌های مدل امکان کاوش عمیق‌تر در معماری‌ها و قابلیت‌های هوش مصنوعی را فراهم می‌کند و تحقیقات آکادمیک و نوآوری مردمی را پرورش می‌دهد.
  • کاهش هزینه: برای کاربران و سازمان‌هایی که از هزینه‌های اشتراک مکرر خسته شده‌اند، این جایگزین‌های رایگان یا کم‌هزینه عملکرد قدرتمندی را بدون بار مالی مرتبط ارائه می‌دهند و به طور بالقوه دسترسی به ابزارهای هوش مصنوعی افزایش‌دهنده بهره‌وری را دموکراتیزه می‌کنند.
  • رشد اکوسیستم: دسترسی از طریق پلتفرم‌هایی مانند GitHub و Hugging Face جوامع پر جنب و جوشی را در اطراف این مدل‌ها پرورش می‌دهد و منابع مشترک، پشتیبانی و فرصت‌های توسعه مشترک را ارائه می‌دهد.

با این حال، پیمایش در این جهان گسترش‌یافته نیازمند بررسی دقیق است. انتخاب یک مدل هوش مصنوعی چیزی بیش از مقایسه معیارهای عملکرد را شامل می‌شود. عواملی مانند کیفیت و در دسترس بودن مستندات، پاسخگویی جامعه توسعه‌دهندگان، نقاط قوت و ضعف خاص یک مدل (به عنوان مثال، مهارت کدنویسی در مقابل نوشتن خلاقانه در مقابل درک چندوجهی) و منابع محاسباتی مورد نیاز برای اجرای مؤثر یا تنظیم دقیق مدل، همگی عناصر حیاتی در فرآیند تصمیم‌گیری هستند. در حالی که پلتفرم‌های ابری منابع مقیاس‌پذیری را ارائه می‌دهند، پتانسیل اجرای مدل‌های قدرتمند به صورت محلی بر روی سخت‌افزار توانمند، یک پیشنهاد جذاب است که توسط برخی از انتشارات باز امکان‌پذیر شده است.

علاوه بر این، ظهور این جایگزین‌های قدرتمند به ناچار سؤالات استراتژیکی را برای بازیگران فعلی ایجاد می‌کند. آیا فشار ناشی از مدل‌های متن‌باز با کیفیت بالا، غول‌های هوش مصنوعی غربی را مجبور به اتخاذ استراتژی‌های بازتر خواهد کرد، شاید با انتشار مدل‌های قدیمی‌تر یا ارائه سطوح رایگان سخاوتمندانه‌تر؟ یا اینکه آنها بر ویژگی‌های اختصاصی، قفل شدن در اکوسیستم و راه‌حل‌های متمرکز بر شرکت‌ها برای حفظ برتری خود تأکید خواهند کرد؟ تعامل رقابتی پویا و دائماً در حال تحول است.

بعد ژئوپلیتیکی نیز پیچیدگی را می‌افزاید، زیرا توسعه قابلیت‌های هوش مصنوعی پیشرفته در خارج از مراکز سنتی غربی، پیامدهای بلندمدت قابل توجهی برای رهبری فناوری و استانداردهای جهانی دارد. همانطور که این ابزارهای قدرتمند به طور گسترده‌تری توزیع می‌شوند، بحث‌ها پیرامون توسعه مسئولانه هوش مصنوعی، دستورالعمل‌های اخلاقی و سوء استفاده بالقوه نیز در بین همه بازیگران، صرف نظر از منشأ یا مدل صدور مجوز آنها، به طور فزاینده‌ای مرتبط می‌شود. رقابت هوش مصنوعی بدون شک گسترش یافته است و چشم‌اندازی غنی‌تر، پیچیده‌تر و در نهایت در دسترس‌تر از همیشه ارائه می‌دهد. چالش و فرصت اکنون در مهار مسئولانه و مؤثر این پتانسیل گسترش‌یافته نهفته است.