Gemini’nin Tanıtımı: Google’ın Yeni Nesil Yapay Zeka Ailesi
Gemini, Google’ın yeni nesil yapay zeka modellerine yönelik iddialı bir girişimidir. Google’ın önde gelen yapay zeka araştırma laboratuvarları DeepMind ve Google Research’ün ortak çabalarıyla geliştirilen Gemini, tek bir varlık değil, her biri belirli görevler ve performans seviyeleri için uyarlanmış bir model ailesidir. Bu aile şunları içerir:
- Gemini Ultra: Ailenin en ağırı, önemli hesaplama gücü gerektiren son derece karmaşık görevler için tasarlanmıştır. (Şu anda mevcut değil)
- Gemini Pro: Ultra’dan daha küçük, ancak çok çeşitli görevleri yerine getirebilen sağlam bir model. En son sürümü olan Gemini 2.0 Pro, şu anda Google’ın amiral gemisi konumundadır.
- Gemini Flash: Hız ve verimliliğe öncelik veren, Pro’nun “damıtılmış” bir versiyonu.
- Gemini Flash-Lite: Gemini Flash’ın biraz daha küçültülmüş ve daha hızlı bir versiyonu.
- Gemini Flash Thinking: “Muhakeme” yeteneklerini sergileyen bir model.
- Gemini Nano: Cihazlarda çevrimdışı çalışma için tasarlanmış, Nano-1 ve biraz daha güçlü Nano-2 olmak üzere iki kompakt modelden oluşur.
Tüm Gemini modellerinin belirleyici bir özelliği, doğuştan gelen çok modlu olmalarıdır. Google’ın LaMDA’sı gibi yalnızca metin verileri üzerinde eğitilmiş modellerin aksine, Gemini modelleri çeşitli veri türlerini işleme ve analiz etme konusunda ustadır. Halka açık, özel ve lisanslı ses, resim, video, kod tabanları ve birden çok dilde metin içeren geniş bir veri kümesi üzerinde eğitilmişlerdir.
Bu çok modlu yapı, Gemini’nin yalnızca metin içeren modellerin sınırlamalarını aşmasını sağlar. LaMDA metin tabanlı girdi ve çıktı ile sınırlıyken, Gemini modelleri, özellikle Flash ve Pro’nun daha yeni sürümleri, metnin yanı sıra yerel olarak resim ve ses üretebilir.
Bununla birlikte, yapay zeka modellerini genellikle veri sahiplerinin açık izni olmadan kamuya açık veriler üzerinde eğitmenin etik ve yasal sonuçları karmaşık bir konu olmaya devam ediyor. Google, belirli Google Cloud müşterilerini olası davalardan korumak için bir yapay zeka tazminat politikası sunsa da, bu politikanın sınırlamaları vardır. Kullanıcılar, özellikle Gemini’yi ticari amaçlarla kullanmayı düşünenler dikkatli olmalıdır.
Gemini Uygulamaları ve Gemini Modelleri: Farkı Anlamak
Gemini modelleri ile web ve mobil platformlarda (eski adıyla Bard) bulunan Gemini uygulamaları arasında ayrım yapmak çok önemlidir.
Gemini uygulamaları, çeşitli Gemini modellerine bağlanan ve kullanıcı dostu, sohbet robotu benzeri bir arayüz sunan istemciler olarak işlev görür. Google’ın üretken yapay zeka yetenekleriyle etkileşim kurmak için ön uç görevi görürler.
Android cihazlarda Gemini uygulaması, Google Asistan uygulamasının yerini alır. iOS’ta, Google ve Google Arama uygulamaları Gemini istemcileri olarak görev yapar.
Android kullanıcıları, ekranda görüntülenen içerik hakkında, örneğin bir YouTube videosu hakkında soru sormak için bir Gemini katmanını çağırabilir. Bu katman, desteklenen bir akıllı telefonun güç düğmesine basılı tutularak veya “Hey Google” sesli komutu kullanılarak tetiklenir.
Gemini uygulamaları çok yönlüdür, resimleri, sesli komutları ve metni girdi olarak kabul eder. Doğrudan yüklenen veya Google Drive’dan içe aktarılan PDF’ler gibi dosyaları işleyebilir ve resimler oluşturabilirler. Kullanıcı aynı Google Hesabında oturum açmışsa, mobilde Gemini uygulamalarıyla başlatılan konuşmalar web’deki Gemini ile sorunsuz bir şekilde senkronize edilir.
Gemini Advanced: Üstün Yapay Zeka Özelliklerinin Kilidini Açma
Gemini uygulamaları, Gemini modellerinin gücünden yararlanmanın tek yolu değildir. Google, Gmail ve Google Dokümanlar dahil olmak üzere temel uygulamalarına ve hizmetlerine Gemini destekli özellikleri aşamalı olarak entegre ediyor.
Bu yeteneklerden tam olarak yararlanmak için kullanıcıların genellikle Google One AI Premium Planına ihtiyacı vardır. Teknik olarak Google One’ın bir bileşeni olan bu plan, ayda 20 ABD dolarıdır ve Dokümanlar, Haritalar, Slaytlar, E-Tablolar, Drive ve Meet gibi Google Workspace uygulamalarında Gemini’ye erişim sağlar. Ayrıca, Gemini uygulamalarında Google’ın daha gelişmiş Gemini modellerine erişim sağlayan “Gemini Advanced”ın kilidini açar.
Gemini Advanced kullanıcıları, yeni özelliklere ve modellere öncelikli erişim, Python kodunu doğrudan Gemini içinde yürütme ve değiştirme yeteneği ve Google’ın PDF’leri yapay zeka tarafından oluşturulan podcast’lere dönüştürme aracı olan NotebookLM için genişletilmiş sınırlar gibi ek avantajlardan yararlanır. Gemini Advanced’e eklenen yeni bir özellik, kullanıcı tercihlerini saklayan ve Gemini’nin mevcut etkileşimler için bağlam sağlayarak geçmiş konuşmalara başvurmasını sağlayan bir bellek özelliğidir.
Gemini Advanced’e özel en ilgi çekici özelliklerden biri “Derin Araştırma”dır. Bu özellik, ayrıntılı özetler oluşturmak için gelişmiş muhakeme yeteneklerine sahip Gemini modellerinden yararlanır. “Mutfağımı nasıl yeniden tasarlamalıyım?” gibi bir isteme yanıt olarak, Derin Araştırma çok adımlı bir araştırma planı formüle eder, web’i tarar ve kapsamlı bir yanıt derler.
Gmail içinde Gemini, e-postalar oluşturabilen ve mesaj dizilerini özetleyebilen bir yan panelde bulunur. Dokümanlar’da içerik yazma, iyileştirme ve beyin fırtınası yapmaya yardımcı olan benzer bir panel görünür. Slaytlar’da Gemini, slaytlar ve özel resimler oluşturur. Google E-Tablolar’da veri izleme, düzenleme ve formül oluşturmaya yardımcı olur.
Gemini’nin varlığı, yerel işletmeler hakkındaki incelemeleri toplayıp öneriler sunduğu ve yabancı bir şehri ziyaret etmek için gezi planı önerileri gibi Google Haritalar’a kadar uzanır. Sohbet robotunun yetenekleri ayrıca, dosyaları ve klasörleri özetleyebildiği ve projeler hakkında kısa bilgiler sağlayabildiği Drive’ı da kapsar.
Gemini, yakın zamanda Google’ın Chrome tarayıcısına bir yapay zeka yazma aracı olarak entegre edildi. Bu araç, tamamen yeni içerik oluşturmak veya mevcut metni yeniden yazmak için kullanılabilir ve mevcut web sayfasının bağlamını dikkate alarak özel öneriler sunar.
Bu temel uygulamaların ötesinde, Gemini’nin izleri Google’ın veritabanı ürünlerinde, bulut güvenlik araçlarında ve uygulama geliştirme platformlarında (Firebase ve Project IDX dahil) bulunabilir. Ayrıca Google Fotoğraflar (doğal dil arama sorguları), YouTube (video fikri beyin fırtınası) ve Meet (altyazı çevirisi) gibi uygulamalardaki özellikleri de destekler.
Google’ın kod tamamlama ve oluşturma için yapay zeka destekli araç paketi olan Code Assist (eski adıyla Geliştiriciler için Duet AI), hesaplama açısından yoğun görevler için Gemini’ye güvenir. Benzer şekilde, Google’ın Tehdit İstihbaratında Gemini gibi güvenlik ürünleri, potansiyel olarak kötü amaçlı kodu analiz etmek ve tehditler ve tehlike göstergeleri için doğal dil aramalarını kolaylaştırmak için Gemini’yi kullanır.
Gemini Uzantıları ve Gems: Yapay Zeka Deneyimini Kişiselleştirme
Gemini Advanced kullanıcıları, hem masaüstü hem de mobil platformlarda erişilebilen, Gemini modelleri tarafından desteklenen özel sohbet robotları olan “Gems” oluşturma olanağına sahiptir. Gems, “Sen benim koşu koçumsun. Bana günlük bir koşu planı ver” gibi doğal dil açıklamalarından oluşturulabilir ve diğer kullanıcılarla paylaşılabilir veya gizli tutulabilir.
Gemini uygulamaları, “Gemini uzantıları” aracılığıyla çeşitli Google hizmetleriyle entegre olabilir. Bu uzantılar, Gemini’nin Drive, Gmail, YouTube ve diğer hizmetlerle etkileşim kurmasını sağlayarak “Son üç e-postamı özetleyebilir misin?” gibi sorgulara yanıt vermesini sağlar.
Gemini Live: Derinlemesine Sesli Konuşmalar Yapma
“Gemini Live”, kullanıcıların Gemini ile ayrıntılı sesli konuşmalar yapmasına olanak tanıyan sürükleyici bir deneyim sunar. Bu özellik, mobil cihazlardaki Gemini uygulamalarında ve telefon kilitliyken bile erişilebilen Pixel Buds Pro 2’de mevcuttur.
Gemini Live ile kullanıcılar, açıklayıcı sorular sormak için konuşurken Gemini’nin sözünü kesebilir ve sohbet robotu gerçek zamanlı olarak konuşma kalıplarına uyum sağlar. Live ayrıca, etkinlik hazırlığı, beyin fırtınası ve diğer görevlerde yardımcı olan sanal bir koç olarak işlev görmek üzere tasarlanmıştır. Örneğin, Live bir iş görüşmesi sırasında vurgulanacak becerileri önerebilir ve topluluk önünde konuşma ipuçları sağlayabilir.
Gençler için Gemini: Öğrenciler için Özel Olarak Tasarlanmış Bir Yapay Zeka Deneyimi
Google, genç öğrenciler için özel olarak tasarlanmış özel bir Gemini deneyimi sunar.
Gençlere yönelik bu Gemini sürümü, özelleştirilmiş bir ilk katılım süreci ve bir yapay zeka okuryazarlığı kılavuzu dahil olmak üzere “ek politikalar ve korumalar” içerir. Bu değişiklikler dışında, Gemini’nin web’deki bilgileri çapraz referans alarak doğruluğunu doğrulayan “çift kontrol” özelliği de dahil olmak üzere standart Gemini deneyimine çok benzer.
Gemini Modellerinin Yeteneklerini Keşfetme
Gemini modellerinin çok modlu yapısı, konuşma transkripsiyonundan gerçek zamanlı görüntü ve video altyazılamaya kadar çok çeşitli görevleri yerine getirmelerini sağlar. Bu yeteneklerin çoğu zaten Google’ın ürünlerine dahil edilmiştir ve yakın gelecekte daha fazla gelişme vaat edilmektedir.
Bununla birlikte, Google’ın rakipleri gibi, kodlanmış önyargılar ve bilgi uydurma eğilimi (halüsinasyonlar) gibi üretken yapay zeka teknolojisiyle ilişkili bazı doğal zorlukları tam olarak ele almadığını kabul etmek önemlidir. Bu sınırlamalar, özellikle kritik uygulamalar için Gemini’nin kullanımını değerlendirirken dikkate alınmalıdır.
Gemini Pro’nun Yeteneği
Google, en son Pro modeli olan Gemini 2.0 Pro’nun kodlama ve karmaşık istemleri işleme konusunda en gelişmiş teklifini temsil ettiğini iddia ediyor. 2.0 Pro, programlama, muhakeme, matematik ve olgusal doğruluğu değerlendiren kıyaslamalarda selefi Gemini 1.5 Pro’yu geride bırakıyor.
Google’ın Vertex AI platformunda geliştiriciler, ince ayar veya “topraklama” yoluyla Gemini Pro’yu belirli bağlamlar ve kullanım durumları için özelleştirebilir. Örneğin, Pro (diğer Gemini modelleriyle birlikte), Moody’s, Thomson Reuters, ZoomInfo ve MSCI gibi üçüncü taraf sağlayıcılardan gelen verileri kullanmaya veya daha geniş bilgi tabanı yerine kurumsal veri kümelerinden veya Google Arama’dan bilgi almaya yönlendirilebilir. Gemini Pro ayrıca, arka ofis iş akışlarını otomatikleştirmek gibi belirli eylemleri gerçekleştirmek için harici, üçüncü taraf API’lere bağlanabilir.
Google’ın AI Studio platformu, Pro ile yapılandırılmış sohbet istemleri oluşturmak için şablonlar sağlar. Geliştiriciler, modelin yaratıcı aralığını kontrol edebilir, ton ve stile rehberlik etmek için örnekler sağlayabilir ve Pro’nun güvenlik ayarlarında ince ayar yapabilir.
Gemini Flash: Hafif Verimlilik ve Gemini Flash Thinking’in Muhakeme Yetenekleri
Gemini 2.0 Flash, Google aramasını ve diğer harici API’leri kullanabilir. Daha küçük olmasına rağmen, kodlama ve görüntü analizini ölçen kıyaslamalarda bazı daha büyük 1.5 modellerinden daha iyi performans gösterir. Gemini Pro’nun bir türevi olarak Flash, dar, yüksek frekanslı üretken yapay zeka görevlerini hedefleyerek verimlilik için tasarlanmıştır.
Google, Flash’ın özetleme, sohbet uygulamaları, resim ve video altyazılama ve uzun belgelerden ve tablolardan veri çıkarma gibi uygulamalar için uygunluğunu vurguluyor. Bu arada, Google’a göre, Flash’ın daha kompakt bir yinelemesi olan Gemini 2.0 Flash-Lite, aynı fiyatı ve hızı korurken performansta Gemini 1.5 Flash’ı geride bırakıyor.
Geçen yılın Aralık ayında Google, “muhakeme” yetenekleriyle donatılmış Gemini 2.0 Flash’ın “düşünen” bir varyantını tanıttı. Bu yapay zeka modeli, bir yanıt vermeden önce bir sorunu geriye doğru çözmek için birkaç saniye harcar ve potansiyel olarak güvenilirliğini artırır.
Gemini Nano: Cihaz Üzerinde Yapay Zeka Gücü
Gemini Nano, görevleri uzak bir sunucuya gönderme ihtiyacını ortadan kaldırarak doğrudan uyumlu cihazlarda çalışmak üzere tasarlanmış, Gemini’nin oldukça kompakt bir sürümüdür. Şu anda Nano, Pixel 8 Pro, Pixel 8, Pixel 9 Pro, Pixel 9 ve Samsung Galaxy S24’te Kaydedicide Özetle ve Gboard’da Akıllı Yanıtla dahil olmak üzere çeşitli özellikleri destekliyor.
Kullanıcıların ses kaydetmesini ve yazıya dökmesini sağlayan Kaydedici uygulaması, kaydedilen konuşmalar, röportajlar, sunumlar ve diğer ses parçacıkları için Gemini destekli bir özetleme özelliği içerir. Bu özetler, bir ağ bağlantısı olmasa bile oluşturulur ve gizlilik adına, işlem sırasında kullanıcının cihazından hiçbir veri ayrılmaz.
Nano ayrıca, Google’ın klavye değişimi olan Gboard’da, Akıllı Yanıtla’yı desteklediği yerde de yerini bulur. Bu özellik, WhatsApp gibi mesajlaşma uygulamalarında yanıtlar önererek konuşmaları kolaylaştırır.
Android’in gelecekteki bir yinelemesi, telefon görüşmeleri sırasında kullanıcıları potansiyel dolandırıcılıklara karşı uyarmak için Nano’dan yararlanacak şekilde ayarlanmıştır. Pixel telefonlardaki yeni hava durumu uygulaması, kişiselleştirilmiş hava durumu raporları oluşturmak için Gemini Nano’yu kullanır. Ek olarak, Google’ın erişilebilirlik hizmeti olan TalkBack, görme engelli kullanıcılar için nesnelerin işitsel açıklamalarını oluşturmak için Nano’yu kullanır.
Gemini Ultra: Geri Dönüşünü Bekliyor
Gemini Ultra son aylarda spot ışıklarından nispeten uzaktı. Model şu anda Gemini uygulamalarında mevcut değil ve Google’ın Gemini API fiyatlandırma sayfasında listelenmiyor. Ancak bu, Google’ın gelecekte Ultra’yı yeniden tanıtma olasılığını ortadan kaldırmaz.
Gemini Modelleri için Fiyatlandırma Yapısı
Gemini 1.5 Pro, 1.5 Flash, 2.0 Flash ve 2.0 Flash-Lite, uygulamalar ve hizmetler geliştirmek için Google’ın Gemini API’si aracılığıyla erişilebilir. Kullandıkça öde esasına göre çalışırlar. 225 Şubat itibarıyla eklentiler hariç temel fiyatlandırma aşağıdaki gibidir:
- Gemini 1.5 Pro: 1 milyon girdi jetonu başına 1,25 ABD doları (128K jetona kadar olan istemler için) veya 1 milyon girdi jetonu başına 2,50 ABD doları (128K jetondan uzun istemler için); 1 milyon çıktı jetonu başına 5 ABD doları (128K jetona kadar olan istemler için) veya 1 milyon çıktı jetonu başına 10 ABD doları (128K jetondan uzun istemler için)
- Gemini 1.5 Flash: 1 milyon girdi jetonu başına 7,5 sent (128K jetona kadar olan istemler için), 1 milyon girdi jetonu başına 15 sent (128K jetondan uzun istemler için), 1 milyon çıktı jetonu başına 30 sent (128K jetona kadar olan istemler için), 1 milyon çıktı jetonu başına 60 sent (128K jetondan uzun istemler için)
- Gemini 2.0 Flash: 1 milyon girdi jetonu başına 10 sent, 1 milyon çıktı jetonu başına 40 sent. Ses için, 1 milyon girdi jetonu başına 70 sent.
- Gemini 2.0 Flash-Lite: 1 milyon girdi jetonu başına 7,5 sent, 1 milyon çıktı jetonu başına 30 sent.
Jetonlar, “fantastik” kelimesindeki “fan”, “tas” ve “tic” heceleri gibi ham verilerin bölünmüş birimlerini temsil eder. Bir milyon jeton kabaca 750.000 kelimeye eşdeğerdir. “Girdi”, modele beslenen jetonları ifade ederken, “çıktı” model tarafından üretilen jetonları ifade eder.
2.0 Pro için fiyatlandırma henüz açıklanmadı ve Nano erken erişimde kalmaya devam ediyor.
Gemini’nin iPhone’a Potansiyel Gelişi
Gemini’nin iPhone’larla entegrasyonu olasılığı belirgin bir olasılıktır.
Apple, Apple Intelligence paketindeki çeşitli özellikler için potansiyel olarak Gemini ve diğer üçüncü taraf modellerini kullanmak için görüşmelerde bulunduğunu belirtti. WWDC 2024’teki bir açılış konuşmasının ardından Apple SVP Craig Federighi, Gemini dahil olmak üzere modellerle işbirliği yapma planlarını doğruladı, ancak daha fazla ayrıntı vermekten kaçındı.