Büyük Dil Modelleri (LLM) dünyası, Google’ın öne çıkan bir oyuncu haline gelmesi ve Meta ile OpenAI’nin önemli zorluklarla karşılaşmasıyla önemli bir dönüşüme tanık oldu. Başlangıçta, OpenAI, çığır açan GPT modelleriyle alana hakim oldu ve LLM performansı için yeni ölçütler belirledi. Meta da etkileyici yeteneklere sahip ve kamuya açık kodlarının kısıtlanmamış kullanımına, değiştirilmesine ve dağıtımına izin veren açık ağırlıklı modeller sunarak önemli bir konuma geldi.
Ancak, bu erken dönemdeki hakimiyet, Google da dahil olmak üzere diğer teknoloji devlerini yakalama oyunu oynamaya bıraktı. Google’ın LLM’lerin temelini oluşturan transformatör mimarisi üzerine 2017 tarihli önemli araştırmasına rağmen, şirketin ilk çabaları 2023’te Bard’ın geniş çapta eleştirilen lansmanı tarafından gölgede bırakıldı.
Son zamanlarda, Google’dan gelen güçlü yeni LLM’lerin piyasaya sürülmesiyle, Meta ve OpenAI’nin yaşadığı aksiliklerle birlikte rüzgarlar tersine döndü. Bu değişim, LLM dünyasının dinamiklerini önemli ölçüde değiştirdi.
Meta’nın Llama 4’ü: Bir Hata mı?
Meta’nın 5 Nisan Cumartesi günü Llama 4’ü beklenmedik bir şekilde piyasaya sürmesi, sektörde şaşkınlık yarattı.
Büyük bir modeli hafta sonu piyasaya sürme kararı alışılmadık olarak algılandı ve bu da olumsuz bir tepkiye yol açtı ve duyuruyu sonraki haftanın haber akışı arasında gölgede bıraktı.
Llama 4, multimodal yetenekleri (görüntüleri, sesi ve diğer modaliteleri işleme) ve değişen boyut ve güçlü yönlere sahip üç versiyonda (Llama 4 Behemoth, Maverick ve Scout) bulunması dahil olmak üzere belirli güçlü yönlere sahip olsa da, piyasaya sürülmesi eleştirilerle karşılandı. Özellikle Llama 4 Scout versiyonu, 10 milyon jetona kadar önemli bir bağlam penceresine sahipti ve modelin tek bir oturumda büyük miktarda metni işlemesini ve oluşturmasını sağlıyordu.
Ancak, LMArena adlı, kullanıcı oylarına göre LLM’leri sıralayan bir platformda Meta’nın sıralama yaklaşımıyla ilgili tutarsızlıklar ortaya çıktığında modelin aldığı tepki kötüleşti. Sıralamalar için kullanılan belirli Llama 4 modelinin, genel halka sunulan modelden farklı olduğu keşfedildi. LMArena, Meta’nın ‘insan tercihini optimize etmek için özelleştirilmiş bir model’ sağladığını belirtti.
Ayrıca, Meta’nın Llama 4 Scout’un 10 milyon jetonluk bağlam penceresiyle ilgili iddiaları şüpheyle karşılandı. Bu rakamın teknik doğruluğuna rağmen, kıyaslamalar Llama 4’ün uzun bağlam performansında rakip modellerin gerisinde kaldığını ortaya koydu.
Endişelere ek olarak, Meta bir Llama 4 ‘muhakeme’ veya ‘düşünme’ modeli yayınlamaktan kaçındı ve daha küçük varyantları alıkoydu, ancak şirket bir muhakeme modelinin yolda olduğunu belirtti.
AI danışmanlık firması Gradient Flow’un kurucusu Ben Lorica, Meta’nın tüm bileşenlerin tam olarak hazır olduğu daha sistematik bir yayın standardından saptığını belirtti. Bu, Meta’nın muhakeme modeli ve daha küçük versiyonlar gibi temel unsurlardan yoksun olsa bile yeni bir modeli sergilemek için istekli olabileceğini gösteriyor.
OpenAI’nin GPT-4.5’i: Erken Bir Geri Çekilme
OpenAI de son aylarda zorluklarla karşılaştı.
27 Şubat’ta bir araştırma önizlemesi olarak tanıtılan GPT-4.5, şirketin ‘sohbet için en büyük ve en iyi modeli’ olarak lanse edildi. OpenAI’nin kıyaslamaları, GPT-4.5’in genel olarak öncülü GPT-4o’dan daha iyi performans gösterdiğini gösterdi.
Ancak, modelin fiyatlandırma yapısı eleştirilere yol açtı. OpenAI, API erişim fiyatını milyon çıktı jetonu başına 150 ABD Doları olarak belirledi; bu, GPT-4o’nun milyon jeton başına 10 ABD Doları olan fiyatına kıyasla şaşırtıcı bir 15 kat artış. API, geliştiricilerin OpenAI modellerini uygulamalarına ve hizmetlerine entegre etmelerini sağlar.
Life Architect’te AI danışmanı ve analisti olan Alan D. Thompson, GPT-4.5’in muhtemelen 2025’in ilk çeyreğinde piyasaya sürülen yaklaşık 5,4 trilyon parametreye sahip en büyük geleneksel LLM olduğunu tahmin etti. Bu kadar büyük bir ölçeğin, mevcut donanım sınırlamaları göz önüne alındığında haklı çıkarılmasının zor olduğunu ve geniş bir kullanıcı tabanına hizmet etmede önemli zorluklar yarattığını savundu.
14 Nisan’da OpenAI, GPT-4.5 erişimini API aracılığıyla üç aydan kısa bir süre sonra durdurma kararı aldığını duyurdu. GPT-4.5 erişilebilir durumda kalacak olsa da, ChatGPT arayüzü aracılığıyla ChatGPT kullanıcılarıyla sınırlı olacaktır.
Bu duyuru, milyon jeton başına 8 ABD Doları fiyatlandırılan daha ekonomik bir model olan GPT-4.1’in tanıtımıyla aynı zamana denk geldi. OpenAI’nin kıyaslamaları, GPT-4.1’in genel olarak GPT-4.5 kadar yetenekli olmadığını, ancak belirli kodlama kıyaslamalarında üstün performans sergilediğini gösteriyor.
OpenAI ayrıca yakın zamanda özellikle güçlü kıyaslama performansı sergileyen o3 modeliyle birlikte yeni muhakeme modelleri olan o3 ve o4-mini’yi yayınladı. Ancak, o3’e API erişiminin milyon çıktı jetonu başına 40 ABD Doları olarak fiyatlandırılması nedeniyle maliyet endişe kaynağı olmaya devam ediyor.
Google’ın Yükselişi: Fırsattan Yararlanma
Llama 4 ve ChatGPT-4.5’in karışık tepkisi, rakiplerin yararlanması için bir fırsat yarattı ve onlar da bu fırsattan yararlandılar.
Meta’nın sorunlu Llama 4 lansmanının, geliştiricilerin DeepSeek-V3, Google’ın Gemma’sı ve Alibaba’nın Qwen2.5’i gibi alternatifleri benimsemelerini engellemesi pek olası değil. 2024’ün sonlarında tanıtılan bu LLM’ler, LMArena ve HuggingFace lider tablolarında tercih edilen açık ağırlıklı modeller haline geldi. Popüler kıyaslamalarda Llama 4’e rakip oluyor veya onu aşıyor, uygun fiyatlı API erişimi sunuyor ve bazı durumlarda tüketici sınıfı donanımlarda indirilip kullanılabiliyor.
Ancak, dikkatleri gerçekten çeken Google’ın en son LLM’si Gemini 2.5 Pro oldu.
25 Mart’ta piyasaya sürülen Google Gemini 2.5 Pro, görevler üzerinde akıl yürütmek için kendi kendini yönlendirmeyi kullanan GPT-o1 ve DeepSeek-R1’e benzer bir ‘düşünme modeli’. Gemini 2.5 Pro çok modlu, bir milyon jetonluk bir bağlam penceresine sahip ve derinlemesine araştırmayı destekliyor.
Gemini 2.5, SimpleBench’te (16 Nisan’da bu pozisyonu OpenAI’nin o3’üne bırakmasına rağmen) ve Artificial Analysis’in birleşik AI Intelligence Index’inde ilk sırayı alarak hızla kıyaslama zaferleri elde etti. Gemini 2.5 Pro şu anda LMArena’da ilk sırada yer alıyor. 14 Nisan itibarıyla Google modelleri, LMArena’da ilk 10 sıranın 5’ini işgal ediyordu; buna Gemini 2.5 Pro, Gemini 2.0’ın üç varyantı ve Gemma 3-27B dahil.
Etkileyici performansının ötesinde, Google aynı zamanda bir fiyat lideri. Google Gemini 2.5 şu anda Google’ın Gemini uygulaması ve Google’ın AI Studio web sitesi aracılığıyla ücretsiz olarak kullanılabiliyor. Google’ın API fiyatlandırması da rekabetçi; Gemini 2.5 Pro, milyon çıktı jetonu başına 10 ABD Doları ve Gemini 2.0 Flash ise sadece milyon jeton başına 40 sente fiyatlandırılıyor.
Lorica, yüksek hacimli muhakeme görevleri için genellikle DeepSeek-R1 veya Google Gemini’yi tercih ettiğini, OpenAI modellerini kullanmanın ise fiyatlandırmanın daha dikkatli bir şekilde değerlendirilmesini gerektirdiğini belirtiyor.
Meta ve OpenAI’nin çöküşün eşiğinde olması gerekmiyor, OpenAI, bildirildiğine göre bir milyar kullanıcısı olan ChatGPT’nin popülaritesinden yararlanıyor. Bununla birlikte, Gemini’nin güçlü sıralamaları ve kıyaslama performansı, LLM dünyasında şu anda Google’ı destekleyen bir değişime işaret ediyor.