Meta به تازگی جدیدترین تکرارهای مدل هوش مصنوعی (AI) Llama خود را معرفی کرده است که نشان دهنده یک گام مهم رو به جلو در تعهد مداوم این شرکت به نوآوری هوش مصنوعی است. از جمله پیشنهادات جدید، Llama 4 Scout و Llama 4 Maverick هستند که Meta آنها را “مدلهای چندوجهی” نامیده است و بر ظرفیت آنها برای پردازش و تعامل با اشکال مختلف رسانه فراتر از متن صرف تأکید دارد.
علاوه بر این، Meta از Llama 4 Behemoth رونمایی کرد که به عنوان یکی از هوشمندترین LLMهای جهان معرفی شده و قرار است به عنوان یک معلم برای مدلهای تازه منتشر شده عمل کند.
این اطلاعیه بر سرمایهگذاریهای قابل توجه Meta در هوش مصنوعی در طول دو سال گذشته تأکید میکند. مارک زاکربرگ، مدیرعامل، به طور علنی اعلام کرده است که قصد دارد در سال 2025 تا 65 میلیارد دلار برای افزایش بیشتر قابلیتهای هوش مصنوعی این شرکت اختصاص دهد. جاهطلبیهای Meta فراتر از دامنه رسانههای اجتماعی آن است و به دنبال بررسی اشتراکهای ممتاز بالقوه برای دستیار هوش مصنوعی خود، Meta AI، برای انجام کارهایی مانند رزرو و ایجاد ویدیو است.
تلاش منبع باز OpenAI
در تحولات موازی، OpenAI گزارش شده است که در نظر دارد یک نسخه منبع باز از LLM خود را منتشر کند که انحرافی از رویههای اخیر آن است. این حرکت به کاربران آزادی استفاده، اصلاح و توزیع مدل را بدون متحمل شدن هزینههای مجوز میدهد. OpenAI به دنبال دریافت ورودی جامعه از توسعه دهندگان، محققان و عموم مردم برای بهینه سازی سودمندی مدل است.
پیش بینی می شود مدل منبع باز ظرف چند ماه آینده راه اندازی شود. آخرین باری که OpenAI از اصول منبع باز استقبال کرد، در سال 2019 با GPT-2 LLM بود. جدیدترین LLM آن GPT-4.5 است. OpenAI پس از تامین یک میلیارد دلار سرمایه گذاری از مایکروسافت، به سمت مدل های اختصاصی تغییر جهت داد و یک اتحاد نزدیک برای پیشبرد توسعه مدل هوش مصنوعی تشکیل داد. مایکروسافت از آن زمان تاکنون بیش از 13 میلیارد دلار در OpenAI سرمایه گذاری کرده است و مدل های OpenAI منحصراً برای مشتریان خدمات ابری Azure مایکروسافت در دسترس است.
Llama متا، LLM Mistral و DeepSeek از جمله مدلهای منبع باز هستند که اخیراً محبوبیت زیادی کسب کردهاند. زاکربرگ در Threads اشاره کرد که Llama 1 میلیارد بار دانلود شده است. Llama در سال 2023 راه اندازی شد.
مدل هوش مصنوعی “Behemoth” متا با تاخیر مواجه است
با این حال، گزارش شده است که Meta انتشار “Behemoth” را به تاخیر می اندازد، که در ابتدا قرار بود در تابستان راه اندازی شود، و زودترین زمان ممکن برای انتشار اکنون برای پاییز پیش بینی شده است. منابع نشان می دهند که پیشرفت مدل به اندازه کافی “قابل توجه” نبوده است که انتشار در ماه ژوئن را توجیه کند و این نشان دهنده تاخیر از کنفرانس توسعه دهندگان Meta است.
این تاخیر سایه ای بر انتشار خانواده Llama از مدل های زبان بزرگ می اندازد. وال استریت ژورنال می گوید که آنها به دلیل سرعت انتشارشان مورد تحسین قرار گرفته اند. Llama در توانمندسازی توسعه دهندگان در شرکت های کوچکتر، سازمان های غیرانتفاعی و موسسات دانشگاهی نقش مهمی داشته است. این یک جایگزین برای مدل های بسته و اختصاصی است که توسط شرکت هایی مانند OpenAI، گوگل و آمازون ارائه می شود.
تاثیر تاخیر Behemoth بر شرکت های بزرگتر کمتر مشهود است، زیرا آنها اغلب به مدل های اختصاصی مبتنی بر ابر متکی هستند. حتی اگر شرکت های کوچکتر بتوانند مدل های منبع باز Llama را سفارشی کنند، به خدمات استقرار اضافی نیاز دارند که Meta ارائه نمی دهد. استفاده Meta از Llama در جهت ارتقای ابزارهای رسانه های اجتماعی خود است و به زاکربرگ اجازه می دهد تا کنترل مسیر هوش مصنوعی خود را حفظ کند.
یک عامل مهم در پس این تاخیر این است که آیا مدل پیشرفت های کافی قابل توجهی را برای تضمین راه اندازی عمومی نشان می دهد یا خیر.
ضرورت نوآوری
در دنیای پرشتاب صنعت فناوری، نسخه های جدید باید پیشرفت های ملموس را برای توجیه معرفی خود نشان دهند. در LlamaCon، Meta دو مدل کوچکتر Llama 4 را به نمایش گذاشت که هر کدام قابلیت های چشمگیری دارند:
- Maverick دارای 400 میلیارد پارامتر کل با پنجره متنی 1 میلیون توکن (750،000 کلمه) است.
- Scout دارای 109 میلیارد پارامتر و یک پنجره متنی 10 میلیون توکن (7.5 میلیون کلمه) است.
Behemoth در ابتدا برای انتشار همزمان برنامه ریزی شده بود و دارای 2 تریلیون پارامتر بود.
به گفته وال استریت ژورنال، Meta به دلیل سرمایهگذاریهای مداوم خود در هوش مصنوعی، از تیم Llama 4 خود بیصبر است. در سال 2024، این شرکت تا 72 میلیارد دلار در هزینههای سرمایهای اختصاص داده است که بیشتر آن به سمت توسعه هوش مصنوعی هدایت میشود.
نگرانی های رو به رشد
زاکربرگ و سایر مدیران ارشد هنوز تاریخ انتشار قطعی برای Behemoth اعلام نکرده اند. خودی ها می ترسند که عملکرد آن نتواند انتظارات تعیین شده توسط اظهارات عمومی Meta را برآورده کند.
منابع نشان می دهند که نارضایتی فزاینده ای در بین رهبری متا از پیشرفت های حاصل شده توسط تیم توسعه دهنده مدل های Llama 4 وجود دارد. این امر منجر به بحث در مورد تغییرات احتمالی در رهبری گروه محصول هوش مصنوعی آن شده است.
Meta Behemoth را به عنوان یک سیستم بسیار توانمند معرفی کرده است که در معیارهای خاص از رقبایی مانند OpenAI، گوگل و Anthropic پیشی می گیرد. چالش های داخلی کارایی آن را مختل کرده است، همانطور که توسط کسانی که با توسعه آن آشنا هستند ادعا می شود.
OpenAI نیز با تاخیرهایی مواجه شده است. مدل اصلی بعدی آنها، GPT-5، در ابتدا قرار بود در اواسط سال 2024 منتشر شود. وال استریت ژورنال در ماه دسامبر گزارش داد که توسعه از برنامه عقب افتاده است.
در ماه فوریه، سام آلتمن، مدیرعامل OpenAI، گفت که مدل موقت GPT-4.5 خواهد بود، در حالی که GPT-5 هنوز چند ماه با آن فاصله دارد.
علل احتمالی توقف پیشرفت
عوامل متعددی ممکن است به کاهش سرعت توسعه مدل هوش مصنوعی کمک کنند، از جمله:
کاهش دادههای با کیفیت بالا
مدل های زبانی بزرگ برای آموزش به مقادیر زیادی داده نیاز دارند و آینه ای از وسعت بی پایان اینترنت هستند. آنها ممکن است در حال فرسایش منابع داده در دسترس عموم باشند در حالی که با مسئولیت های قانونی مربوط به حق چاپ مواجه هستند.
این امر OpenAI، گوگل و مایکروسافت را بر آن داشته است تا از حفظ حق خود برای آموزش بر روی مطالب دارای حق چاپ حمایت کنند.
OpenAI اشاره کرد که دولت می تواند آزادی آمریکایی ها برای یادگیری از هوش مصنوعی را تضمین کند و از دست دادن رهبری هوش مصنوعی به PRC [جمهوری خلق چین] با حفظ توانایی مدل های هوش مصنوعی آمریکایی برای یادگیری از مطالب دارای حق چاپ جلوگیری کند.
موانع الگوریتمی
این باور که افزایش اندازه مدل، استفاده از محاسبات بیشتر و آموزش بر روی داده های بیشتر پیشرفت های قابل توجهی را به همراه خواهد داشت، اشتباه ثابت شده است. بلومبرگ می گوید که بازدهی نزولی وجود داشته است و باعث شده است برخی بگویند که قوانین مقیاس گذاری در حال کند شدن هستند.