Meta’nın Llama’sı, başlangıçta LLaMA (Large Language Model Meta AI) olarak biliniyordu ve Şubat 2023’te piyasaya sürülerek Meta’nın büyük dil modelleri (LLM’ler) dünyasına girişini işaret etti. Temmuz 2023’te Llama 2’nin piyasaya sürülmesi, Meta’nın açık izinli bir lisans benimsemesi, erişimi demokratikleştirmesi ve yaygın olarak benimsenmesini teşvik etmesi nedeniyle oyunun kurallarını değiştirdi. Sürekli iyileştirme ve çoklu yinelemeler yoluyla Llama, yeteneklerini istikrarlı bir şekilde geliştirerek OpenAI, Anthropic ve Google gibi endüstri devleri arasındaki konumunu sağlamlaştırdı.
Llama ailesi, 5 Nisan 2025’te Llama 4 model ailesinin tanıtılmasıyla daha da genişledi ve aynı zamanda Llama 4 sürüsü olarak da biliniyor ve çok modlu LLM’lerin yeni bir çağını müjdeliyor.
Meta Llama 4 Nedir?
Meta Llama 4, LLM teknolojisinde önemli bir sıçramayı temsil ediyor ve metin, resim ve video verilerini işleyip yorumlamasını sağlayan çok modlu yeteneklere sahip. Bu dördüncü nesil model, dünyanın dört bir yanından çok sayıda dili destekleyerek dil engellerini aşıyor.
Llama 4 modellerindeki önemli bir yenilik, Llama ailesi için bir ilk olan uzmanlar karışımı mimarisinin benimsenmesidir. Bu mimari, her bir girdi belirteci için toplam parametrelerin yalnızca bir alt kümesini dinamik olarak etkinleştirerek güç ve verimlilik arasında uyumlu bir denge sağlıyor.
Llama 4 topluluk lisansı resmi olarak Açık Kaynak Girişimi onaylı bir lisans olarak tanınmasa da Meta, Llama 4 modellerini açık kaynak olarak nitelendiriyor. Lisans, belirli sınırlamalara tabi olarak Llama 4 modellerine ücretsiz kullanım ve değiştirme hakları veriyor. Nisan 2025 itibarıyla sınır, 700 milyon aylık kullanıcıyla sınırlandırıldı ve bunun ötesinde ticari bir lisans gerekiyor.
Llama 4 serisi üç ana sürümden oluşuyor: Scout, Maverick ve Behemoth. Scout ve Maverick aynı anda piyasaya sürüldü, Behemoth ise geliştirme aşamasında kalmaya devam ediyor. Bu modeller, özelliklerinde önemli ölçüde farklılık gösteriyor:
- Llama 4 Scout: 17 milyar aktif parametre, 16 uzman, 109 milyar toplam parametre, 10 milyon belirteçlik bir bağlam penceresi ve Ağustos 2024’lük bir bilgi kesintisi içeriyor.
- Llama 4 Maverick: Ayrıca 17 milyar aktif parametreye sahip, ancak 128 uzman, 400 milyar toplam parametre, 1 milyon belirteçlik bir bağlam penceresi ve Scout ile aynı bilgi kesintisine sahip.
- Llama 4 Behemoth: Üçünün en güçlüsü, 288 milyar aktif parametre, 16 uzman, 2 trilyon toplam parametre ve belirtilmemiş bir bağlam penceresi ve bilgi kesintisi ile.
Meta Llama 4’ün Yetenekleri
Meta Llama 4 modelleri, aşağıdakiler de dahil olmak üzere çeşitli uygulamaların kilidini açıyor:
- Yerel Çok Modluluk: Metni, resimleri ve videoyu aynı anda anlama yeteneği. Bu, modelin çeşitli bilgi kaynaklarından bağlam ve anlam çıkarmasını sağlıyor.
- İçerik Özetleme: Llama 4 modelleri, çeşitli içerik türlerinden bilgileri verimli bir şekilde yoğunlaştırabiliyor; bu, çok modlu anlayışın önemli bir yönü. Örneğin, model bir videoyu analiz edebilir, önemli sahneleri çıkarabilir ve içeriğin kısa bir özetini oluşturabilir.
- Uzun Bağlam İşleme: Llama 4 Scout, geniş 10 milyon belirteçlik bağlam penceresi sayesinde önemli miktarda bilgiyi işlemek için özel olarak tasarlandı. Bu yetenek, kapsamlı araştırma makalelerini analiz etmek veya uzun belgeleri işlemek gibi görevler için çok değerli.
- Çok Dilli Modluluk: Tüm Llama 4 modelleri, metin işleme için çok çeşitli dilleri destekleyerek çok dilli yeterlilik sergiliyor: Arapça, İngilizce, Fransızca, Almanca, Hintçe, Endonezyaca, İtalyanca, Portekizce, İspanyolca, Tagalog, Tayca ve Vietnamca. Ancak, görüntü anlama şu anda İngilizce ile sınırlı.
- Metin Üretimi: Llama 4 modelleri, yaratıcı yazma çabaları da dahil olmak üzere tutarlı ve bağlamsal olarak alakalı metinler üretmede başarılıdır. Model, çeşitli yazı stillerine uyum sağlayabilir ve insan kalitesinde metinler üretebilir.
- Gelişmiş Muhakeme: Bu modeller, karmaşık bilimsel ve matematiksel problemleri çözme kapasitesine sahip. Karmaşık mantığı deşifre edebilir ve doğru sonuçlara ulaşabilirler.
- Kod Üretimi: Llama 4, uygulama kodunu anlayıp üretebilir ve geliştiricilere iş akışlarını kolaylaştırmada yardımcı olabilir. Model, kod parçacıkları, tamamlanmış işlevler ve hatta tüm uygulamalar geliştirebilir.
- Temel Model İşlevselliği: Açık bir model olarak Llama 4, türev modellerin geliştirilmesi için temel bir unsur görevi görüyor. Araştırmacılar ve geliştiriciler, özel uygulamalar oluşturmak için mevcut yeteneklerinden yararlanarak Llama 4’ü belirli görevler için ince ayarlayabilirler.
Meta Llama 4’ün Eğitim Metodolojisi
Meta, dördüncü nesil Llama ailesi LLM’lerini eğitmek için doğruluğu ve performansı önceki sürümlere göre artırmayı amaçlayan bir dizi gelişmiş teknik kullandı. Bu teknikler şunları içeriyordu:
- Eğitim Verileri: Herhangi bir LLM’nin temel taşı eğitim verileridir ve Meta, daha fazla verinin daha iyi performans anlamına geldiğini kabul etti. Bu amaçla, Llama 4, Llama 3’ü eğitmek için kullanılan veri miktarının iki katı olan 30 trilyondan fazla belirteç üzerinde eğitildi.
- Erken Füzyon Çok Modluluğu: Llama 4 serisi, metin ve görüntü belirteçlerini birleşik bir modelde entegre eden "erken füzyon" yaklaşımını benimsedi. Meta’ya göre bu yaklaşım, ayrı kodlayıcılara ve kod çözücülere duyulan ihtiyacı ortadan kaldırarak görsel ve metinsel bilgiler arasında daha doğal bir anlayışı teşvik ediyor.
- Hiperparametre Optimizasyonu: Bu teknik, daha güvenilir ve tutarlı eğitim sonuçları elde etmek için katman başına öğrenme oranları gibi kritik model hiperparametrelerinin ince ayarlanmasını içeriyor. Meta, bu parametreleri optimize ederek Llama 4’ün genel kararlılığını ve performansını artırabildi.
- iRoPE Mimarisi: Konumsal gömme olmadan serpiştirilmiş dikkat katmanları mimarisi veya iRoPE mimarisi, eğitim sırasında uzun dizilerin işlenmesini geliştiriyor ve Llama 4 Scout’ta 10 milyon belirteçlik bağlam penceresini kolaylaştırıyor. Bu mimari, modelin girdi dizisinin uzak bölümlerinden bilgi tutmasını sağlayarak daha uzun ve daha karmaşık belgeleri işlemesini sağlıyor.
- MetaCLIP Vizyon Kodlayıcı: Yeni Meta vizyon kodlayıcı, görüntüleri belirteç temsillerine çevirerek gelişmiş çok modlu anlayışa yol açıyor. Bu kodlayıcı, Llama 4’ün görsel bilgileri etkili bir şekilde işlemesini ve yorumlamasını sağlıyor.
- KEÇİ Güvenlik Eğitimi: Meta, LLM güvenlik açıklarını belirlemek ve model güvenliğini artırmak için eğitim boyunca Üretken Saldırgan Ajan Test Cihazı’nı (KEÇİ) uyguladı. Bu teknik, modelin zararlı veya önyargılı içerik oluşturma riskini azaltmaya yardımcı oluyor.
Llama Modellerinin Evrimi
Kasım 2022’de ChatGPT’nin çığır açan lansmanının ardından, sektördeki şirketler LLM pazarında bir yer edinmek için yarıştı. Meta, ilk Llama modellerini 2023’ün başlarında, ancak kısıtlı erişimle tanıtarak ilk yanıt verenler arasındaydı. 2023’ün ortalarında Llama 2’nin piyasaya sürülmesiyle başlayarak, sonraki tüm modeller açık lisanslar altında kullanıma sunuldu.
- Llama 1: İlk Llama modeli, Şubat 2023’te sınırlı erişimle piyasaya sürüldü.
- Llama 2: Temmuz 2023’te açık lisanslı ilk Llama modeli olarak piyasaya sürülen Llama 2, ücretsiz erişim ve kullanım sundu. Bu yineleme, çeşitli hesaplama ihtiyaçlarına hitap eden 7B, 13B ve 70B parametre sürümlerini içeriyordu.
- Llama 3: Llama 3 modelleri, Nisan 2024’te başlangıçta 8B ve 70B parametre sürümleriyle piyasaya sürüldü.
- Llama 3.1: Temmuz 2024’te piyasaya sürülen Llama 3.1, LLM yeteneklerinin sınırlarını zorlayarak 405B parametreli bir model ekledi.
- Llama 3.2: Meta’nın ilk tam çok modlu LLM’si olan bu model, Ekim 2024’te piyasaya sürüldü ve Llama ailesinin evriminde önemli bir kilometre taşını işaret etti.
- Llama 3.3: Meta, Aralık 2024’teki lansmanında, Llama 3.3’ün 70B varyantının, daha az işlem kaynağı gerektirirken, 3.1’in 405B varyantıyla aynı performansı sunduğunu iddia etti ve sürekli optimizasyon çabalarını sergiledi.
Llama 4’ün Diğer Modellerle Karşılaştırılması
Üretken yapay zeka ortamı, OpenAI’nin GPT-4o’su, Google Gemini 2.0 ve DeepSeek dahil olmak üzere çeşitli açık kaynak projeleri gibi öne çıkan oyuncularla giderek daha rekabetçi hale geliyor.
Llama 4’ün performansı, aşağıdakiler de dahil olmak üzere çeşitli kıyaslamalar kullanılarak değerlendirilebilir:
- MMMU (Massive Multi-discipline Multimodal Understanding): Görüntü muhakeme yeteneklerini değerlendirir.
- LiveCodeBench: Kodlama yeterliliğini değerlendirir.
- GPQA Diamond (Graduate-Level Google-Proof Q&A Diamond): Muhakeme ve bilgiyi ölçer.
Bu kıyaslamalarda daha yüksek puanlar daha iyi performansı gösterir.
Llama 4 Maverick | Gemini 2.0 Flash | GPT-4o | |
---|---|---|---|
MMMU görüntü muhakemesi | 73.4 | 71.7 | 69.1 |
LiveCodeBench | 43.4 | 34.05 | 32.3 |
GPQA Diamond | 69.8 | 60.1 | 53.6 |
Bu kıyaslamalar, Llama 4 Maverick’in görüntü muhakemesi, kodlama ve genel bilgi alanlarındaki güçlü yönlerini vurgulayarak onu LLM arenasında güçlü bir rakip olarak konumlandırıyor.
Llama 4’e Erişim
Meta Llama 4 Maverick ve Scout, çeşitli kanallar aracılığıyla kolayca erişilebilir:
- Llama.com: Scout ve Maverick’i doğrudan Meta tarafından işletilen llama.com web sitesinden ücretsiz olarak indirin.
- Meta.ai: Meta.ai web arayüzü, Llama 4’e tarayıcı tabanlı erişim sağlayarak kullanıcıların herhangi bir yerel kurulum gerektirmeden modelle etkileşim kurmasına olanak tanıyor.
- Hugging Face: Llama 4’e ayrıca makine öğrenimi modellerini paylaşmak ve keşfetmek için popüler bir platform olan https://huggingface.co/meta-llama adresinden de erişilebilir.
- Meta AI Uygulaması: Llama 4, Meta’nın çeşitli platformlarda ses veya metin yoluyla erişilebilen AI sanal asistanına güç veriyor. Kullanıcılar, metin özetleme, içerik oluşturma ve soruları yanıtlama gibi görevleri gerçekleştirmek için asistandan yararlanabilirler.