Gemini Live Kamera Modu: iOS'te AI Geleceği

Gemini Live’ın kamera modu, yapay zeka evriminde önemli bir adımı temsil ediyor ve geleceğin somut bir parçasını doğrudan parmaklarımızın ucuna getiriyor. Pixel 9 ve Samsung Galaxy S25 cihazlarına sahip ilk kullanıcılar bir süredir bu yenilikçi özelliğin tadını çıkarırken, Google’ın I/O konferansında yaptığı son duyuru, erişimi hem Android hem de iOS kullanıcılarını kapsayacak şekilde çok daha geniş bir kitleye yaygınlaştırıyor. Bu gelişme, özellikle iPhone sahipleri için heyecan verici, çünkü şu anda mevcut olan en etkileyici AI işlevlerinden birini deneyimleyebiliyorlar, özellikle de kamera modunun ilk olarak Nisan ayında diğer Android kullanıcılarına sunulduğu düşünüldüğünde.

Görme Gücünü Ortaya Çıkarmak: Gemini’nin Kamera Modu Nasıl Çalışır?

Temelinde, Gemini Live’ın kamera modu, AI’ya "görme" yeteneği vererek, kameranın görüş alanına yerleştirilen nesneleri tanımasını ve tanımlamasını sağlıyor. Bu sadece yüzeysel bir numara değil; kullanıcıların çevreleriyle daha sezgisel ve bilgilendirici bir şekilde etkileşim kurmasını sağlayan güçlü bir araç.

Basit nesne tanıma işleminin ötesinde, Gemini tanımlanan öğeler hakkında soruları da yanıtlayabilir, talep üzerine bağlam ve içgörü sağlayabilir. Ayrıca, kullanıcılar ekranlarını Gemini ile paylaşarak, AI’nın telefonlarının ekranında görüntülenen öğeleri analiz etmesine ve tanımlamasına olanak tanır. Kamera moduyla canlı bir oturum başlatmak için, kullanıcılar canlı kamera görünümünü etkinleştirerek, kameranın yakaladığı herhangi bir şey hakkında chatbot ile sohbete katılmalarını sağlar.

İlk İzlenimler: Gemini Live ile Test Sürüşü

Pixel 9 Pro XL’de Gemini Live ile ilk test aşamam sırasında, yeteneklerinden son derece etkilendim. Özellikle unutulmaz bir deneyim, Gemini’den kayıp makasımı bulmasını istemeyi içeriyordu.

AI, dikkat çekici bir doğrulukla yanıtladı: "Makasınızı masanın üzerinde, yeşil antep fıstığı paketinin hemen yanında gördüm. Görüyor musun?"

Şaşkınlığıma rağmen, Gemini haklıydı. Makas tam olarak belirttiği yerdeydi, aslında AI chatbot’una dairemin bir turunu verdiğim 15 dakikalık canlı bir oturum sırasında kamerayı sadece kısaca önlerinden geçirmiş olmama rağmen.

Bu ilk başarıdan etkilenen, kamera modunu daha da keşfetmek için sabırsızlanıyordum. Başka, daha genişletilmiş bir testte, özelliği etkinleştirdim ve daireimde yürümeye başladım, Gemini’den gördüğü nesneleri tanımlamasını istedim. Meyveler, ChapStick ve diğer günlük nesneler de dahil olmak üzere çeşitli öğeleri doğru bir şekilde tanıdı. Ancak, makasımın yeniden keşfi, yeteneklerinin en çarpıcı gösterimi olmaya devam etti.

Gemini’nin makası önceden herhangi bir uyarıda bulunmadan tanımlaması özellikle etkileyici. AI, oturum sırasında bir noktada onları sessizce tanımış ve konumlarını dikkat çekici bir hassasiyetle doğru bir şekilde hatırlamıştı. Bu deneyim gerçekten geleceğe bir bakış gibi geldi ve potansiyeli hakkında daha fazla araştırma yapmaya teşvik etti.

İlham Almak: Google’ın Canlı Video AI Vizyonu

Gemini Live’ın kamera özelliğiyle yaptığım deney, Google’ın bir önceki yaz gösterdiği ve bu canlı video AI yeteneklerine ilk bakışı sunan demoyla paralellik gösteriyordu. Demo, Gemini’nin kullanıcıya gözlüklerini nerede bıraktığını hatırlatması özelliğini içeriyordu, bu da görünüşte inanılması güç bir başarıydı. Ancak, keşfettiğim gibi, bu doğruluk seviyesi gerçekten de elde edilebilirdi.

Gemini Live, sadece ev eşyalarından çok daha fazlasını tanıyabiliyor. Google, kalabalık tren istasyonlarında gezinmelerine veya hamur işlerindeki dolguları belirlemelerine yardımcı olabileceğini iddia ediyor. Ayrıca, bir sanat eserinin kökeni ve sınırlı sayıda üretilmiş bir parça olup olmadığı gibi sanat eserleri hakkında daha derin bilgiler sağlayabilir.

Bu işlevsellik, normal bir Google Lens’in ötesine geçiyor. AI ile sohbet edebilirsiniz, bu da Google Assistant’tan çok daha konuşkan.

Google ayrıca özelliği gösteren bir YouTube videosu yayınladı ve artık Google Store’da kendi sayfasına sahip.

Başlamak için Gemini’yi başlatın, kamerayı açın ve konuşmaya başlayın.

Gemini Live, ilk olarak geçen yıl sunulan ve belki de şirketin en büyük "gelecekteyiz" özelliği olan Google’ın Project Astra’sı üzerine inşa edilmiştir. ChatGPT, Claude veya Gemini gibi bir chatbot’a basitçe yazmaktan veya hatta sözlü istemler vermekten öte, üretken AI yetenekleri için deneysel bir sonraki adım.
AI şirketleri, video oluşturmadan temel işlem gücüne kadar AI araçlarının yeteneklerini sürekli olarak geliştiriyor. iPhone üreticisinin geçen yıl beta sürümünde yayınladığı Apple’ın Visual Intelligence’ı, Gemini Live ile karşılaştırılabilir.

Gemini Live, kamerayı herhangi bir şeyin önüne tuttuğumuzda dijital ve fiziksel çevremizi birleştirerek, çevreyle bağlantı kurma biçimimizde devrim yaratma potansiyeline sahip.

Gemini Live’ı Test Etmek: Gerçek Dünya Senaryoları

İlk kullandığımda, Gemini kameramdaki çok özel bir oyun koleksiyonu olan doldurulmuş bir tavşanı doğru bir şekilde tanıdı. İkinci seferde, onu bir sanat galerisindeki bir arkadaşıma gösterdim. Hemen haç üzerindeki kaplumbağayı tanıdı (bana sormayın) ve hemen yanındaki kanjiyi tanımlayıp çevirdi, ikimize de ürperti verdi ve bizi biraz ürküttü. Olumlu bir şekilde, inanıyorum.

Fonksiyonu nasıl stres testi yapabileceğimi düşünmeye başladım. Çalışırken ekran kaydı almaya çalıştığımda, sürekli olarak başarısız oldu. Ya olağan yoldan saparsam? Korku türünün büyük bir hayranıyım (filmler, televizyon dizileri ve video oyunları) ve bol miktarda koleksiyon, biblo ve diğer eşyalara sahibim. Korku temalı koleksiyonlarım gibi daha belirsiz öğelerle ne kadar iyi performans gösterecekti?

İlk olarak, Gemini’nin aynı soru turunda hem inanılmaz derecede şaşırtıcı hem de inanılmaz derecede sinir bozucu olabileceğini belirtmeliyim. Gemini’nin tanımlamasını istediğim yaklaşık 11 nesnem vardı ve canlı oturum ne kadar uzun sürerse o kadar kötüleşti, bu yüzden oturumları bir veya iki nesneyle sınırlamak zorunda kaldım. Bence Gemini, yeni olanları tahmin etmek için önceden tanınan öğelerden bağlamsal bilgileri kullanmaya çalıştı, bu bir dereceye kadar mantıklı, ancak sonunda ne bana ne de ona fayda sağladı.

Bazen, Gemini oldukça doğruydu, doğru cevapları kolayca ve kafa karışıklığı olmadan veriyordu, ancak bu daha çok yeni veya popüler nesnelerde daha sık oldu. Örneğin, test nesnelerimden birinin sadece Destiny 2’den değil, aynı zamanda önceki yılki bir sezonluk etkinlikten sınırlı sayıda üretilmiş bir parça olduğunu hemen anladığında şaşırdım.

Gemini sık sık tamamen yanlış oluyordu, doğru cevaba yaklaşmak için daha fazla ipucu vermemi gerektiriyordu. Bazen, Gemini önceki canlı oturumlarımdan bağlam kullanarak yanıtlar üretiyor gibi görünüyordu, birden fazla nesneyi Silent Hill’den geliyormuş gibi tanımlıyordu, oysa değillerdi. Oyun serisine adanmış bir vitrinim var, bu yüzden neden o alana hızla dalmak isteyeceğini anlayabiliyorum.

Kusurları Ortaya Çıkarmak: Sistemdeki Hatalar ve Tuhaflıklar

Gemini zaman zaman tamamen hatalı olabilir. Bazen, Gemini nesnelerden birini yayınlanmamış Silent Hill: f oyunundan kurgusal bir karakter olarak yanlış tanımlıyordu, açıkça farklı oyunların parçalarını hiç var olmayan bir şeyde birleştiriyordu. Gemini yanlış bir cevap verdiğinde ve onu düzelttiğimde ve cevaba daha yakın bir ipucu verdiğimde - ya da sadece cevabı verdiğimde - sadece yeni bir tahminmiş gibi yanlış cevabı tekrarlaması, karşılaştığım diğer tutarlı hataydı. Bu olduğunda, oturumu kapatır ve yenisine başlardım, bu her zaman yardımcı olmazdı.

Keşfettiğim bir teknik, bazı tartışmaların diğerlerinden daha etkili olduğuydu. Gemini konuşma listemde gezinirsem, belirli bir öğeyi doğru anlamış eski bir sohbete dokunursam ve ardından o sohbetten tekrar canlı yayına geçersem, öğeleri sorunsuz bir şekilde tanımlayabildi. Bu her zaman beklenmedik olmasa da, aynı dil kullanıldığında bile belirli diyalogların diğerlerinden daha iyi performans gösterdiğini not etmek ilginçti.

Google, Gemini Live’ın nasıl çalıştığı hakkında ek bilgi taleplerime yanıt vermedi.

Gemini’nin zorlu, bazen çok özel sorularımı başarıyla yanıtlamasını istedim, bu yüzden yapmasına yardımcı olmak için bol miktarda ipucu verdim. Dürtmeler yararlı oldu, ancak her zaman değil.

Dönüştürücü Bir Teknoloji: Gemini Live’ın Potansiyel Etkisi

Gemini Live, kameralarımızın merceği aracılığıyla dijital ve fiziksel alemleri sorunsuz bir şekilde birleştirerek, çevremizle nasıl etkileşim kurduğumuzda bir paradigma değişimini temsil ediyor. Teknoloji hala ilk aşamalarında olmasına rağmen, potansiyel uygulamaları çok geniş ve dönüştürücü.

Gemini Live’ı kullanarak şunları hayal edin:

  • Tanıdık olmayan ortamlarda gezinmek: Kameranızı sokak tabelalarına veya simge yapılara doğrultmanız yeterlidir ve Gemini gerçek zamanlı yol tarifleri ve bilgiler sağlayacaktır.
  • Tarihi eserler hakkında bilgi edinmek: Bir müzeyi ziyaret ederken, Gemini’yi sanat eserlerini ve tarihi nesneleri tanımlamak ve bağlam sağlamak için kullanın.
  • Karmaşık tarifler pişirmek: Gemini’den bir tarifin her adımında size rehberlik etmesini, malzemeleri tanımlamasını ve alternatif teknikler önermesini isteyin.
  • Basit ev sorunlarını teşhis etmek: Kameranızı arızalı bir cihaza doğrultun ve Gemini sorun giderme ipuçları ve potansiyel çözümler sağlayacaktır.

Bunlar, Gemini Live’ın günlük hayatımızı geliştirmenin sayısız yolundan sadece birkaçı. Teknoloji gelişmeye ve iyileşmeye devam ettikçe, etrafımızdaki dünyayla nasıl etkileşim kurduğumuzda devrim yaratma potansiyeli gerçekten sınırsız.

Gemini Live’ın iOS cihazlarına entegrasyonu, erişimini daha da genişletiyor ve AI destekli görme gücünü daha geniş bir kitleye getiriyor. AI teknolojisi katlanarak gelişmeye devam ederken, Gemini Live gibi özellikler, cihazlarımızın sadece iletişim ve eğlence araçları değil, aynı zamanda dünyada yeni ve anlamlı yollarla gezinmemize, anlamamıza ve etkileşim kurmamıza yardımcı olabilecek akıllı yoldaşlar olduğu bir geleceğe bir bakış sunuyor.