انتشار مدل Meta Llama 4 در OCI Generative AI

خدمات زیرساخت ابری اوراکل (OCI) Generative AI یک عضو جدید هیجان‌انگیز را پذیرا شده است: خانواده مدل‌های Meta Llama 4 ، شامل مدل‌های Scout و Maverick. این مدل‌ها معماری تخصصی ترکیب خبرگان (MoE) را در خود جای داده‌اند که به طور چشمگیری قدرت پردازش و کارایی را افزایش می‌دهد. آنها به طور ویژه‌ای بهینه شده‌اند تا در زمینه‌های مختلف از جمله درک چندوجهی، وظایف چند زبانه، تولید کد و فراخوانی ابزارها عملکرد فوق‌العاده‌ای داشته باشند و بتوانند سیستم‌های عامل پیشرفته را هدایت کنند.

در حال حاضر، این مدل‌ها در نسخه انتشار عمومی (GA) در مناطق زیر در دسترس هستند:

  • به صورت درخواستی: ORD (شیکاگو)
  • خوشه هوش مصنوعی اختصاصی: ORD (شیکاگو)، GRU (گوارولوس)، LHR (لندن)، KIK (کیکویو)

ویژگی‌های اصلی خانواده Llama 4

قابلیت‌های چندوجهی: شکستن مرزهای انواع داده

Llama 4 Scout و Maverick صرفاً مدل‌های زبانی نیستند، بلکه استادان واقعی چندوجهی هستند. آنها قادرند انواع مختلف داده‌ها، از جمله متن و تصویر، را به طور ذاتی پردازش و یکپارچه کنند و در نتیجه برنامه‌های کاربردی هوش مصنوعی غنی‌تر و جامع‌تری را ارائه دهند. می‌توانید سیستمی از هوش مصنوعی را تصور کنید که قادر است همزمان یک توصیف متنی و یک تصویر مرتبط را درک کند، در نتیجه زمینه را بهتر درک کرده و تصمیمات آگاهانه‌تری بگیرد. این قابلیت چندوجهی امکانات جدیدی را برای وظایفی مانند تولید زیرنویس تصویر و پرسش و پاسخ تصویری باز می‌کند.

پشتیبانی چند زبانه: ارتباط بدون مرز

یکی دیگر از ویژگی‌های برجسته خانواده Llama 4 قابلیت پشتیبانی چند زبانه قوی آن است. این مدل‌ها بر روی مجموعه داده‌ای شامل 200 زبان آموزش داده شده‌اند و برای 12 زبان اصلی (عربی، انگلیسی، فرانسوی، آلمانی، هندی، اندونزیایی، ایتالیایی، پرتغالی، اسپانیایی، تاگالوگ، تایلندی و ویتنامی) تنظیم دقیق شده‌اند. این بدان معناست که آنها می‌توانند متن را به چندین زبان درک و تولید کنند، در نتیجه درها را به روی برنامه‌های کاربردی در سراسر جهان باز می‌کنند. شایان ذکر است که عملکرد درک تصویر در حال حاضر فقط از زبان انگلیسی پشتیبانی می‌کند.

توسعه کارآمد: ردپای کوچک‌تر GPU

برای توسعه‌دهندگان، Llama 4 Scout با هدف دستیابی به دسترسی بیشتر طراحی شده است. این مدل می‌تواند به طور کارآمد بر روی ردپای کوچک‌تر GPU اجرا شود، که آن را به انتخابی ایده‌آل برای محیط‌های دارای منابع محدود تبدیل می‌کند. این بدان معناست که حتی بدون تجهیزات سخت‌افزاری قدرتمند، توسعه‌دهندگان می‌توانند از قابلیت‌های قدرتمند Llama 4 Scout برای تسریع توسعه و استقرار برنامه‌های کاربردی هوش مصنوعی استفاده کنند.

مدل‌های متن‌باز: توانمندسازی جامعه

Meta رویکردی باز را انتخاب کرده است و این دو مدل را تحت توافقنامه مجوز انجمن Llama 4 منتشر کرده است. این بدان معناست که توسعه‌دهندگان می‌توانند آزادانه آنها را تنظیم دقیق و مستقر کنند، فقط کافی است از شرایط مجوز خاص تبعیت کنند. این مدل باز می‌تواند نوآوری و همکاری را در جامعه هوش مصنوعی ترویج کند و به افراد بیشتری امکان می‌دهد در توسعه و کاربرد فناوری هوش مصنوعی شرکت کنند.

تاریخ قطع دانش

لازم به ذکر است که تاریخ قطع دانش مدل‌های Llama 4 اوت 2024 است. این بدان معناست که آنها ممکن است نتوانند اطلاعات به‌روز در مورد رویدادها یا اطلاعاتی را که پس از این تاریخ رخ داده‌اند، ارائه دهند.

نکته مهم: سیاست استفاده قابل قبول Llama استفاده از آن در داخل اتحادیه اروپا (EU) را محدود می‌کند.

Llama 4 Scout: قهرمان سبک وزن

معماری: طراحی هوشمندانه پارامتر

Llama 4 Scout از یک طراحی معماری هوشمندانه استفاده می‌کند که تنها 17 میلیارد پارامتر را از مجموعاً حدود 109 میلیارد پارامتر فعال می‌کند. این طراحی از ترکیبی از 16 متخصص استفاده می‌کند و در نتیجه تعادل خوبی بین عملکرد و کارایی ایجاد می‌کند. Scout با فعال کردن تنها بخشی از پارامترها، می‌تواند به طور قابل توجهی نیازهای محاسباتی را کاهش دهد و امکان اجرای آن را در محیط‌های دارای منابع محدود فراهم کند.

پنجره متنی: توانایی پردازش متن طولانی

Llama 4 Scout از طول متن تا 10 میلیون توکن پشتیبانی می‌کند (به چند GPU نیاز دارد). با این حال، در زمان انتشار عمومی (GA)، سرویس OCI Generative AI از طول متن 192 هزار توکن پشتیبانی خواهد کرد. حتی پنجره متنی 192 هزار هم برای پردازش متون نسبتاً طولانی مانند فصل‌های کتاب‌ها یا گزارش‌های تفصیلی کافی است.

استقرار: کوچک اما قدرتمند

یکی از اهداف طراحی Llama 4 Scout اجرای کارآمد بر روی ردپای کوچک‌تر GPU است. این امر آن را به انتخابی ایده‌آل برای انواع سناریوهای استقرار، از جمله دستگاه‌های لبه‌ای و محیط‌های ابری دارای منابع محدود تبدیل می‌کند.

عملکرد: پیشی گرفتن از رقبا

Llama 4 Scout در چندین محک عملکردی عالی داشته است و از مدل‌هایی مانند Gemma 3 گوگل و Mistral 3.1 پیشی گرفته است. این امر ثابت می‌کند که Scout در عملکرد از قابلیت‌های برجسته‌ای برخوردار است و آن را به ابزاری قدرتمند برای انواع وظایف هوش مصنوعی تبدیل می‌کند.

Llama 4 Maverick: قهرمان سنگین وزن

معماری: مقیاس بزرگ‌تر، قدرت بیشتر

در مقایسه با Scout، Llama 4 Maverick از مقیاس معماری بزرگ‌تری استفاده می‌کند. این مدل نیز 17 میلیارد پارامتر را فعال می‌کند، اما این کار در چارچوبی بزرگ‌تر با مجموعاً حدود 400 میلیارد پارامتر انجام می‌شود و از 128 متخصص استفاده می‌کند. این مقیاس بزرگ‌تر به Maverick توانایی‌های بیشتری می‌بخشد و امکان عملکرد عالی در وظایف پیچیده‌تر هوش مصنوعی را فراهم می‌کند.

پنجره متنی: حافظه فوق‌العاده طولانی

Llama 4 Maverick از طول متن تا 1 میلیون توکن پشتیبانی می‌کند. در زمان انتشار عمومی (GA)، استقرار OCI از طول متن 512 هزار توکن پشتیبانی خواهد کرد. چنین پنجره متنی طولانی به Maverick امکان می‌دهد متون بسیار پیچیده مانند کتاب‌های کامل یا مجموعه‌ای از چندین سند را پردازش کند.

استقرار: به فضای بیشتری نیاز دارد

به دلیل مقیاس بزرگ‌تر، Llama 4 Maverick به فضای استقرار بیشتری نسبت به Scout نیاز دارد. در زمان GA، استقرار Maverick بر روی OCI تقریباً به دو برابر فضای Scout نیاز دارد.

عملکرد: رقابت با مدل‌های برتر

در وظایف تولید کد و استنتاج، عملکرد Llama 4 Maverick می‌تواند با مدل‌های برتر مانند GPT-4o و DeepSeek-V3 OpenAI رقابت کند. این امر نشان می‌دهد که Maverick در زمینه هوش مصنوعی جایگاه پیشرویی دارد.

در مجموع، خانواده Llama 4 نشان‌دهنده پیشرفت چشمگیری در توسعه مدل‌های هوش مصنوعی است. آنها در عملکرد، تطبیق‌پذیری و دسترسی پیشرفت‌های چشمگیری داشته‌اند و پشتیبانی قدرتمندی را برای انواع سناریوهای کاربردی ارائه می‌دهند.

اکنون مشتریان OCI می‌توانند به راحتی از این مدل‌های قدرتمند استفاده کنند، بدون اینکه نگران پیچیدگی‌های مدیریت زیرساخت باشند. آنها می‌توانند از طریق رابط چت، API یا نقاط پایانی اختصاصی به این مدل‌ها دسترسی داشته باشند و در نتیجه روند توسعه و استقرار برنامه‌های کاربردی هوش مصنوعی را ساده‌تر کنند.

انتشار مدل‌های Llama 4 نشان‌دهنده ورود خدمات OCI Generative AI به عصر جدیدی است. OCI با ارائه این مدل‌های پیشرفته، به مشتریان کمک می‌کند تا پتانسیل کامل هوش مصنوعی را رها کرده و نوآوری را در صنایع مختلف هدایت کنند.