خدمات زیرساخت ابری اوراکل (OCI) Generative AI یک عضو جدید هیجانانگیز را پذیرا شده است: خانواده مدلهای Meta Llama 4 ، شامل مدلهای Scout و Maverick. این مدلها معماری تخصصی ترکیب خبرگان (MoE) را در خود جای دادهاند که به طور چشمگیری قدرت پردازش و کارایی را افزایش میدهد. آنها به طور ویژهای بهینه شدهاند تا در زمینههای مختلف از جمله درک چندوجهی، وظایف چند زبانه، تولید کد و فراخوانی ابزارها عملکرد فوقالعادهای داشته باشند و بتوانند سیستمهای عامل پیشرفته را هدایت کنند.
در حال حاضر، این مدلها در نسخه انتشار عمومی (GA) در مناطق زیر در دسترس هستند:
- به صورت درخواستی: ORD (شیکاگو)
- خوشه هوش مصنوعی اختصاصی: ORD (شیکاگو)، GRU (گوارولوس)، LHR (لندن)، KIK (کیکویو)
ویژگیهای اصلی خانواده Llama 4
قابلیتهای چندوجهی: شکستن مرزهای انواع داده
Llama 4 Scout و Maverick صرفاً مدلهای زبانی نیستند، بلکه استادان واقعی چندوجهی هستند. آنها قادرند انواع مختلف دادهها، از جمله متن و تصویر، را به طور ذاتی پردازش و یکپارچه کنند و در نتیجه برنامههای کاربردی هوش مصنوعی غنیتر و جامعتری را ارائه دهند. میتوانید سیستمی از هوش مصنوعی را تصور کنید که قادر است همزمان یک توصیف متنی و یک تصویر مرتبط را درک کند، در نتیجه زمینه را بهتر درک کرده و تصمیمات آگاهانهتری بگیرد. این قابلیت چندوجهی امکانات جدیدی را برای وظایفی مانند تولید زیرنویس تصویر و پرسش و پاسخ تصویری باز میکند.
پشتیبانی چند زبانه: ارتباط بدون مرز
یکی دیگر از ویژگیهای برجسته خانواده Llama 4 قابلیت پشتیبانی چند زبانه قوی آن است. این مدلها بر روی مجموعه دادهای شامل 200 زبان آموزش داده شدهاند و برای 12 زبان اصلی (عربی، انگلیسی، فرانسوی، آلمانی، هندی، اندونزیایی، ایتالیایی، پرتغالی، اسپانیایی، تاگالوگ، تایلندی و ویتنامی) تنظیم دقیق شدهاند. این بدان معناست که آنها میتوانند متن را به چندین زبان درک و تولید کنند، در نتیجه درها را به روی برنامههای کاربردی در سراسر جهان باز میکنند. شایان ذکر است که عملکرد درک تصویر در حال حاضر فقط از زبان انگلیسی پشتیبانی میکند.
توسعه کارآمد: ردپای کوچکتر GPU
برای توسعهدهندگان، Llama 4 Scout با هدف دستیابی به دسترسی بیشتر طراحی شده است. این مدل میتواند به طور کارآمد بر روی ردپای کوچکتر GPU اجرا شود، که آن را به انتخابی ایدهآل برای محیطهای دارای منابع محدود تبدیل میکند. این بدان معناست که حتی بدون تجهیزات سختافزاری قدرتمند، توسعهدهندگان میتوانند از قابلیتهای قدرتمند Llama 4 Scout برای تسریع توسعه و استقرار برنامههای کاربردی هوش مصنوعی استفاده کنند.
مدلهای متنباز: توانمندسازی جامعه
Meta رویکردی باز را انتخاب کرده است و این دو مدل را تحت توافقنامه مجوز انجمن Llama 4 منتشر کرده است. این بدان معناست که توسعهدهندگان میتوانند آزادانه آنها را تنظیم دقیق و مستقر کنند، فقط کافی است از شرایط مجوز خاص تبعیت کنند. این مدل باز میتواند نوآوری و همکاری را در جامعه هوش مصنوعی ترویج کند و به افراد بیشتری امکان میدهد در توسعه و کاربرد فناوری هوش مصنوعی شرکت کنند.
تاریخ قطع دانش
لازم به ذکر است که تاریخ قطع دانش مدلهای Llama 4 اوت 2024 است. این بدان معناست که آنها ممکن است نتوانند اطلاعات بهروز در مورد رویدادها یا اطلاعاتی را که پس از این تاریخ رخ دادهاند، ارائه دهند.
نکته مهم: سیاست استفاده قابل قبول Llama استفاده از آن در داخل اتحادیه اروپا (EU) را محدود میکند.
Llama 4 Scout: قهرمان سبک وزن
معماری: طراحی هوشمندانه پارامتر
Llama 4 Scout از یک طراحی معماری هوشمندانه استفاده میکند که تنها 17 میلیارد پارامتر را از مجموعاً حدود 109 میلیارد پارامتر فعال میکند. این طراحی از ترکیبی از 16 متخصص استفاده میکند و در نتیجه تعادل خوبی بین عملکرد و کارایی ایجاد میکند. Scout با فعال کردن تنها بخشی از پارامترها، میتواند به طور قابل توجهی نیازهای محاسباتی را کاهش دهد و امکان اجرای آن را در محیطهای دارای منابع محدود فراهم کند.
پنجره متنی: توانایی پردازش متن طولانی
Llama 4 Scout از طول متن تا 10 میلیون توکن پشتیبانی میکند (به چند GPU نیاز دارد). با این حال، در زمان انتشار عمومی (GA)، سرویس OCI Generative AI از طول متن 192 هزار توکن پشتیبانی خواهد کرد. حتی پنجره متنی 192 هزار هم برای پردازش متون نسبتاً طولانی مانند فصلهای کتابها یا گزارشهای تفصیلی کافی است.
استقرار: کوچک اما قدرتمند
یکی از اهداف طراحی Llama 4 Scout اجرای کارآمد بر روی ردپای کوچکتر GPU است. این امر آن را به انتخابی ایدهآل برای انواع سناریوهای استقرار، از جمله دستگاههای لبهای و محیطهای ابری دارای منابع محدود تبدیل میکند.
عملکرد: پیشی گرفتن از رقبا
Llama 4 Scout در چندین محک عملکردی عالی داشته است و از مدلهایی مانند Gemma 3 گوگل و Mistral 3.1 پیشی گرفته است. این امر ثابت میکند که Scout در عملکرد از قابلیتهای برجستهای برخوردار است و آن را به ابزاری قدرتمند برای انواع وظایف هوش مصنوعی تبدیل میکند.
Llama 4 Maverick: قهرمان سنگین وزن
معماری: مقیاس بزرگتر، قدرت بیشتر
در مقایسه با Scout، Llama 4 Maverick از مقیاس معماری بزرگتری استفاده میکند. این مدل نیز 17 میلیارد پارامتر را فعال میکند، اما این کار در چارچوبی بزرگتر با مجموعاً حدود 400 میلیارد پارامتر انجام میشود و از 128 متخصص استفاده میکند. این مقیاس بزرگتر به Maverick تواناییهای بیشتری میبخشد و امکان عملکرد عالی در وظایف پیچیدهتر هوش مصنوعی را فراهم میکند.
پنجره متنی: حافظه فوقالعاده طولانی
Llama 4 Maverick از طول متن تا 1 میلیون توکن پشتیبانی میکند. در زمان انتشار عمومی (GA)، استقرار OCI از طول متن 512 هزار توکن پشتیبانی خواهد کرد. چنین پنجره متنی طولانی به Maverick امکان میدهد متون بسیار پیچیده مانند کتابهای کامل یا مجموعهای از چندین سند را پردازش کند.
استقرار: به فضای بیشتری نیاز دارد
به دلیل مقیاس بزرگتر، Llama 4 Maverick به فضای استقرار بیشتری نسبت به Scout نیاز دارد. در زمان GA، استقرار Maverick بر روی OCI تقریباً به دو برابر فضای Scout نیاز دارد.
عملکرد: رقابت با مدلهای برتر
در وظایف تولید کد و استنتاج، عملکرد Llama 4 Maverick میتواند با مدلهای برتر مانند GPT-4o و DeepSeek-V3 OpenAI رقابت کند. این امر نشان میدهد که Maverick در زمینه هوش مصنوعی جایگاه پیشرویی دارد.
در مجموع، خانواده Llama 4 نشاندهنده پیشرفت چشمگیری در توسعه مدلهای هوش مصنوعی است. آنها در عملکرد، تطبیقپذیری و دسترسی پیشرفتهای چشمگیری داشتهاند و پشتیبانی قدرتمندی را برای انواع سناریوهای کاربردی ارائه میدهند.
اکنون مشتریان OCI میتوانند به راحتی از این مدلهای قدرتمند استفاده کنند، بدون اینکه نگران پیچیدگیهای مدیریت زیرساخت باشند. آنها میتوانند از طریق رابط چت، API یا نقاط پایانی اختصاصی به این مدلها دسترسی داشته باشند و در نتیجه روند توسعه و استقرار برنامههای کاربردی هوش مصنوعی را سادهتر کنند.
انتشار مدلهای Llama 4 نشاندهنده ورود خدمات OCI Generative AI به عصر جدیدی است. OCI با ارائه این مدلهای پیشرفته، به مشتریان کمک میکند تا پتانسیل کامل هوش مصنوعی را رها کرده و نوآوری را در صنایع مختلف هدایت کنند.