Meta, yapay zeka (AI) inovasyonuna olan sürekli bağlılığında önemli bir adımı işaret ederek, Llama yapay zeka modelinin en son yinelemelerini tanıttı. Yeni sunulanlar arasında, Meta’nın “çok modlu modeller” olarak adlandırdığı ve salt metnin ötesinde çeşitli medya biçimlerini işleme ve etkileşim kurma kapasitelerini vurgulayan Llama 4 Scout ve Llama 4 Maverick yer alıyor.
Ek olarak, Meta, küresel olarak en akıllı LLM’lerden biri olarak konumlandırılan ve yeni piyasaya sürülen modeller için bir öğretmen olarak hizmet etmesi amaçlanan Llama 4 Behemoth’u tanıttı.
Bu duyuru, Meta’nın son iki yılda AI’ya yaptığı önemli yatırımların altını çiziyor. CEO Mark Zuckerberg, şirketin AI yeteneklerini daha da geliştirmek için 2025’te 65 milyar dolara kadar kaynak ayırma niyetini kamuoyuna açıkladı. Meta’nın hırsları, sosyal medya alanının ötesine geçerek, rezervasyon yapma ve video oluşturma gibi görevleri yerine getirmek için AI asistanı Meta AI için potansiyel premium abonelikleri araştırıyor.
OpenAI’nin Açık Kaynak Girişimi
Paralel gelişmelerde, OpenAI’nin son uygulamalarından bir sapma olarak, LLM’sinin açık kaynaklı bir versiyonunu yayınlamayı düşündüğü bildiriliyor. Bu hamle, kullanıcılara lisans ücreti ödemeden modeli kullanma, değiştirme ve dağıtma özgürlüğü verecektir. OpenAI, modelin faydasını optimize etmek için geliştiricilerden, araştırmacılardan ve daha geniş kamuoyundan topluluk girdisi istiyor.
Açık kaynaklı modelin birkaç ay içinde piyasaya sürülmesi bekleniyor. OpenAI’nin açık kaynak ilkelerini benimsediği son zaman, 2019’da GPT-2 LLM’si ileydi. En son LLM’si GPT-4.5’tir. OpenAI, Microsoft’tan bir milyar dolarlık yatırım alarak, AI model geliştirmeyi ilerletmek için yakın bir ittifak kurduktan sonra tescilli modellere yöneldi. Microsoft o zamandan beri OpenAI’ye 13 milyar doların üzerinde yatırım yaptı ve OpenAI’nin modelleri Microsoft’un Azure bulut hizmetleri müşterilerine özel oldu.
Meta’nın Llama’sı, Mistral’in LLM’si ve DeepSeek, son zamanlarda popülerlik kazanan açık kaynaklı modellerden bazılarıdır. Zuckerberg, Threads’de Llama’nın 1 milyar kez indirildiğini belirtti. Llama 2023’te piyasaya sürüldü.
Meta’nın “Behemoth” AI Modelinde Gecikmeler
Ancak, Meta’nın başlangıçta yaz için planlanan “Behemoth”un piyasaya sürülmesini ertelediği bildiriliyor ve en erken olası sürüm şimdi sonbahar için öngörülüyor. Kaynaklar, modelin ilerlemesinin bir Haziran sürümünü haklı çıkaracak kadar “önemli” olmadığını ve Meta’nın geliştirici konferansından bu yana bir gecikmeyi temsil ettiğini öne sürüyor.
Gecikme, Meta’nın Llama amiral gemisi büyük dil modelleri ailesinin piyasaya sürülmesinin üzerine bir gölge düşürüyor. Wall Street Journal, bunların yayınlanma hızı nedeniyle övüldüğünü söylüyor. Llama, daha küçük şirketler, kar amacı gütmeyen kuruluşlar ve akademik kurumlar içindeki geliştiricileri güçlendirmede etkili oldu. OpenAI, Google ve Amazon gibi şirketler tarafından sunulan kapalı, tescilli modellere bir alternatiftir.
Behemoth’un gecikmesinin daha büyük şirketler üzerindeki etkisi daha az belirgindir, çünkü bunlar genellikle bulut tabanlı tescilli modellere güvenirler. Daha küçük şirketler açık kaynaklı Llama modellerini özelleştirebilse de, Meta’nın sunmadığı ek dağıtım hizmetleri gerektirirler. Meta’nın Llama’yı kullanması, Zuckerberg’in AI yörüngesi üzerindeki kontrolünü sürdürmesine olanak tanıyarak, kendi sosyal medya araçlarını geliştirmeye yöneliktir.
Gecikmenin arkasındaki önemli bir faktör, modelin halka açık bir lansmanı haklı çıkaracak kadar önemli gelişmeler gösterip göstermediğidir.
İnovasyonun Zorunluluğu
Teknoloji endüstrisinin hızlı tempolu dünyasında, yeni sürümler tanıtımlarını haklı çıkarmak için somut gelişmeler göstermelidir. LlamaCon’da Meta, her biri etkileyici yeteneklere sahip iki küçük Llama 4 modeli sergiledi:
- Maverick, 1 milyon token bağlam penceresiyle (750.000 kelime) toplam 400 milyar parametreye sahiptir.
- Scout, 10 milyon token bağlam penceresiyle (7,5 milyon kelime) 109 milyar parametreye sahiptir.
Behemoth başlangıçta eş zamanlı olarak piyasaya sürülmek üzereydi ve 2 trilyon parametre içeriyordu.
Wall Street Journal’a göre Meta, Llama 4 ekibine sürekli AI yatırımları nedeniyle sabırsızlanıyor. Şirket 2024’te 72 milyar dolara kadar sermaye harcaması ayırdı ve bunun çoğu AI geliştirmesine yönlendirildi.
Artan Endişeler
Zuckerberg ve diğer üst düzey yöneticiler henüz Behemoth için kesin bir yayın tarihi açıklamadılar. İçeridekiler, Meta’nın kamuoyuna yaptığı açıklamalarla belirlenen beklentileri karşılamayabileceğinden korkuyorlar.
Kaynaklar, Meta’nın liderliğinin Llama 4 modellerini geliştiren ekibin kaydettiği ilerlemeden duyduğu memnuniyetsizliğin arttığını gösteriyor. Bu, AI ürün grubu içinde olası liderlik değişiklikleri hakkında tartışmalara yol açtı.
Meta, Behemoth’u OpenAI, Google ve Anthropic gibi rakipleri belirli kıyaslamalarda geride bırakan oldukça yetenekli bir sistem olarak lanse etti. Gelişimine aşina olanların iddia ettiği gibi, iç zorluklar verimliliğini engelledi.
OpenAI de gecikmelerle karşılaştı. Bir sonraki büyük modeli olan GPT-5’in başlangıçta 2024 ortasında piyasaya sürülmesi planlanıyordu. Wall Street Journal, Aralık ayında geliştirmenin programın gerisinde kaldığını bildirdi.
Şubat ayında, OpenAI CEO’su Sam Altman, ara modelin GPT-4.5 olacağını, GPT-5’in ise aylar uzakta olduğunu söyledi.
Duraksayan İlerlemenin Olası Nedenleri
AI model geliştirmedeki yavaşlamaya çeşitli faktörler katkıda bulunabilir, bunlar arasında:
Azalan Yüksek Kaliteli Veri
Büyük dil modelleri, internetin geniş alanını yansıtan eğitim için büyük miktarda veri gerektirir. Telif hakkıyla ilgili yasal yükümlülüklerle karşı karşıyayken, kamuya açık veri kaynaklarını tüketiyor olabilirler.
Bu, OpenAI, Google ve Microsoft’un telif hakkıyla korunan materyal üzerinde eğitim alma haklarının korunmasını savunmalarına yol açtı.
OpenAI, hükümetin Amerikalıların AI’dan öğrenme özgürlüğünü güvence altına alabileceğini ve Amerikan AI modellerinin telif hakkıyla korunan materyalden öğrenme yeteneğini koruyarak AI liderliğini ÇHC’ye [Çin Halk Cumhuriyeti] kaybetmekten kaçınabileceğini belirtti.
Algoritmik Engeller
Model boyutunu artırmanın, daha fazla işlem kullanmanın ve daha fazla veri üzerinde eğitim almanın kayda değer gelişmeler üreteceği inancı yanlışlanmıştır. Bloomberg, azalan getiriler olduğunu ve bazılarının ölçekleme yasalarının yavaşladığını söylemesine neden olduğunu söylüyor.