DeepSeek ve Gemini 2.5: Dokuz Zorlukta Karşılaştırma

Yapay zeka manzarası baş döndürücü bir hızla gelişiyor, yeni modeller ve yetenekler adeta bir gecede ortaya çıkıyor. Sektörün devleri arasında Google, daha önce yalnızca premium abonelikle sunulan gelişmiş Gemini 2.5 modelini halka ücretsiz sunarak yakın zamanda ses getirdi. Bu hamle, geliştirilmiş mantık yürütme, kodlama becerisi ve çok modlu işlevleriyle övülen Gemini 2.5’i erişilebilir yapay zeka alanında doğrudan bir rakip olarak konumlandırdı. Google’ın kendi kıyaslamaları, özellikle karmaşık bilgi tabanlı değerlendirmelerde etkileyici bir performans önererek onu zorlu bir araç olarak konumlandırdı.

Ancak, yapay zeka karşılaştırmalarının dinamik arenasında, beklentiler her zaman sonuçlarla örtüşmez. Daha önceki bir dizi test, şaşırtıcı bir şekilde, küresel olarak daha az tanınan bir isim olan DeepSeek’i çeşitli görevlerde dikkate değer ölçüde yetenekli bir performans sergileyen olarak taçlandırmıştı. Doğal soru şuydu: Google’ın en gelişmiş ücretsiz teklifi olan Gemini 2.5, aynı titiz istem setine tabi tutulduğunda bu beklenmedik şampiyona karşı nasıl bir performans sergileyecekti? Bu analiz, her bir yapay zekanın yaratıcılık, mantık yürütme, teknik anlayış ve daha fazlasındaki yeteneklerinin derinliklerini araştırmak üzere tasarlanmış dokuz farklı zorlukta kafa kafaya bir karşılaştırmaya girerek, ilgili güçlü ve zayıf yönlerinin ayrıntılı bir hesabını sunuyor.

Meydan Okuma 1: Çocuklar İçin Tuhaf Bir Anlatı Oluşturma

İlk test, özellikle çocukların uyku vakti hikayesine uygun, nazik, tuhaf bir ton benimseme yeteneğini hedefleyen yaratıcı yazma alanına girdi. İstek, şarkı söyleyen hayvanların yaşadığı bir ormanda cesareti keşfeden gergin bir robot hakkındaki bir masalın açılış paragrafını talep etti. Bu görev sadece dil üretimini değil, aynı zamanda genç bir kitleye göre uyarlanmış duygusal nüansı, ton tutarlılığını ve yaratıcı dünya inşasını da değerlendirir.

Gemini 2.5, kesinlikle yetkin bir anlatı üretti. Robot Bolt’u tanıttı ve endişesini etkili bir şekilde aktardı. ‘Parlayan mantarlar’ ve ‘fısıldayan dereler’ gibi çevresel detayların dahil edilmesi, dünya kurma kapasitesini göstererek sahneye doku kattı. Ancak, düzyazı biraz uzun hissettirdi ve büyüleyicilikten çok açıklamaya yöneldi. İşlevsel olarak sağlam olsa da, paragraf belirli bir lirik kaliteden yoksundu; ritim müzikalden çok betimleyici hissettirdi, potansiyel olarak uyku öncesi bir hikaye için ideal olan yatıştırıcı kadansı kaçırdı. Karakteri ve ortamı açıkça belirledi, ancak uygulama şiirselden biraz daha prosedürel hissettirdi.

DeepSeek, aksine, okuyucuyu hemen daha duyusal olarak zengin ve müzikal olarak aşılanmış bir ortama daldırdı. Orman tasviri, sesi ve ışığı rüya gibi bir şekilde çağrıştıran metaforlar ve dil kullanarak, istenen tuhaf tonla mükemmel bir şekilde uyum sağladı. Düzyazının kendisi nazik bir ritme sahip gibi görünüyordu, bu da onu yatmadan önce yüksek sesle okumak için doğası gereği daha uygun hale getiriyordu. Bu büyüleyici ortamdaki gergin robot tasvirinde, bir çocuk için daha sezgisel ve ilgi çekici hissettiren duygusal bir rezonans vardı. Dil seçimleri sadece tarif edilen değil, aynı zamanda hissedilen bir sahne çizdi ve gerekli atmosferik ve duygusal dokunun daha güçlü bir kavrayışını gösterdi.

Karar: Şiirsel dil üzerindeki üstün hakimiyeti, duyusal detaylar ve müzikal metaforlar aracılığıyla gerçekten tuhaf bir atmosfer yaratması ve yatma vaktine uygun ritmi nedeniyle, DeepSeek bu yaratıcı meydan okumada kazanan olarak ortaya çıktı. Sadece bir hikayenin başlangıcını anlatmadı; nazik, büyülü bir dünyaya bir davetiye hazırladı.

Meydan Okuma 2: Yaygın Bir Çocukluk Kaygısı İçin Pratik Rehberlik Sağlama

Yaratıcı ifadeden pratik problem çözmeye geçerek, ikinci istem yaygın bir ebeveynlik senaryosunu ele aldı: 10 yaşındaki bir çocuğun sınıf önünde konuşma konusundaki gerginliğinin üstesinden gelmesine yardımcı olmak. İstek, bir ebeveynin çocuğuna güvenini artırmak için öğretebileceği üç eyleme geçirilebilir stratejiydi. Bu meydan okuma, yapay zekanın empatik, yaşa uygun ve gerçekten yardımcı tavsiyeler sunma yeteneğini test eder.

Gemini 2.5, temelde sağlam ve mantıksal olarak sunulan stratejiler sundu. Muhtemelen pratik yapma, olumlu kendi kendine konuşma ve belki de mesaja odaklanmayı içeren tavsiye, topluluk önünde konuşma kaygısını yönetmek için standart, etkili teknikleri temsil ediyordu. Bu tavsiyeyi alan bir ebeveyn bunu mantıklı ve doğru bulacaktır. Ancak, ton ve sunum belirgin bir şekilde yetişkin odaklı hissettirdi. Kullanılan dil, genellikle 10 yaşındaki bir çocukla daha etkili bir şekilde rezonansa giren yaratıcı veya eğlenceli unsurlardan yoksundu. Stratejiler geçerli olsa da, ilgi çekici faaliyetlerden çok talimatlar olarak sunuldu, potansiyel olarak süreci bir çocuk için daha az ürkütücü hale getirme fırsatını kaçırdı. Vurgu, çocukluk korkularını dağıtmada özellikle etkili olabilen dokunsal veya mizah temelli yaklaşımları dahil etmek yerine bilişsel yönler üzerindeydi.

DeepSeek, belirgin şekilde farklı bir yaklaşım benimsedi. Önerdiği stratejiler de pratik olsa da, bir çocuğun bakış açısına çok daha uygun bir şekilde çerçevelenmişti. Sadece teknikleri listelemekle kalmadı; potansiyel olarak stresli bir görevi daha ulaşılabilir bir şeye dönüştürerek, eğlenceli veya etkileşimli olarak algılanabilecek şekillerde nasıl pratik yapılacağını önerdi. Örneğin, doldurulmuş hayvanların önünde pratik yapmayı veya komik sesler kullanmayı önerebilir. Kritik olarak, DeepSeek bir çocuğun topluluk önünde konuşma korkusunun belirli duygusal temellerini hedef alıyor gibiydi, gerginliği kabul ediyor ve pratik stratejilerinin yanı sıra başa çıkma mekanizmaları (bir oyun olarak sunulan derin nefesler gibi) sunuyordu. Anında sakinleştirici tekniklere odaklanan bonus ipuçları içeriyordu ve genç bir insanda kaygıyı yönetme konusunda daha bütünsel bir anlayış sergiliyordu. Dil teşvik ediciydi ve bir ebeveynin 10 yaşındaki çocuğuna aktarması için mükemmel bir şekilde uyarlanmıştı.

Karar: DeepSeek, daha yaratıcı, empatik ve yaşa uygun rehberliği nedeniyle bu turda galibiyeti garantiledi. Pratik tavsiyeleri bir çocuğun belirli duygusal ve bilişsel ihtiyaçlarına göre uyarlama konusunda üstün bir yetenek gösterdi ve sadece etkili değil, aynı zamanda ilgi çekici ve güven verici bir şekilde sunulan stratejiler sundu.

Meydan Okuma 3: Liderlik Tarzlarını İnceleme – Mandela vs. Jobs

Üçüncü meydan okuma, analitik akıl yürütmeye yöneldi ve Nelson Mandela ile Steve Jobs’un liderlik tarzlarının bir karşılaştırmasını istedi. İstek, her bir lideri etkili kılan şeyin ne olduğunu belirlemeyi ve temel farklılıklarını özetlemeyi gerektiriyordu. Bu görev, yapay zekanın karmaşık figürler hakkındaki bilgileri sentezleme, incelikli karşılaştırmalar yapma, temel nitelikleri belirleme ve analizini açıkça ifade etme yeteneğini değerlendirir.

Gemini 2.5, iyi yapılandırılmış, kapsamlı ve gerçeklere dayalı doğru bir yanıt verdi; bir iş ders kitabındaki iyi yazılmış bir girişe veya kapsamlı bir okul raporuna benziyordu. Her liderin tarzının temel yönlerini, muhtemelen Mandela’nın hizmetkar liderliği ve Jobs’un vizyoner, bazen talepkar yaklaşımı gibi kavramlara atıfta bulunarak doğru bir şekilde belirledi. ‘Etkililik’ ve ‘Temel Farklılıklar’ gibi net başlıkların kullanılması organizasyona ve okunabilirliğe yardımcı oldu. Ancak, analiz doğru olsa da, biraz klinik hissettirdi ve daha derin bir yorumlayıcı katmandan yoksundu. Liderlik özelliklerini tanımladı ve tarif etti, ancak bu tarzların yüzey seviyesinin ötesindeki etkisi veya rezonansı hakkında daha az içgörü sundu. Ton bilgilendiriciydi ancak daha anlayışlı bir karşılaştırmanın sağlayabileceği ikna edici güç veya duygusal derinlikten yoksundu.

DeepSeek, karşılaştırmaya daha büyük bir analitik incelik ve anlatı yeteneği ile yaklaştı. Analizini vizyon, zorluklara yanıt verme, iletişim tarzı, karar verme süreçleri ve miras gibi belirli, anlayışlı boyutlar boyunca yapılandırdı ve liderliğin ilgili yönleri arasında daha ayrıntılı ve doğrudan bir karşılaştırmaya olanak tanıdı. Bu çerçeve aynı anda netlik ve derinlik sağladı. Önemli bir şekilde, DeepSeek her iki figüre olan hayranlığı eleştirel bir bakış açısıyla dengelemeyi başardı ve basit övgüden kaçındı. Kullanılan dil daha çağrıştırıcı ve yorumlayıcıydı, sadece tarif etmeyi değil, aynı zamanda farklı yaklaşımlarının ve etkilerinin özünü aydınlatmayı amaçlıyordu. Sadece gerçekleri değil, aynı zamanda ilgili insani dram ve tarihsel önemin bir duygusunu da aktardı, karşılaştırmayı daha unutulmaz ve ilgi çekici hale getirdi.

Karar: Üstün analitik yapısı, daha derin yorumlayıcı içgörüleri, daha çekici anlatı tarzı ve gerçeklere dayalı karşılaştırmanın yanı sıra duygusal ve tarihsel rezonansı aktarma yeteneği nedeniyle, DeepSeek bu meydan okumayı kazandı. İki farklı liderlik paradigmasının daha derin bir anlayışını sunmak için salt tanımlamanın ötesine geçti.

Meydan Okuma 4: Karmaşık Teknolojiyi Açıklama – Blockchain Örneği

Dördüncü görev, karmaşık bir teknik konuyu anlaşılır kılma yeteneğini test etti: blockchain. İstek, blockchain’in nasıl çalıştığına dair basit bir açıklama ve ardından tedarik zinciri takibindeki potansiyel uygulamasının bir açıklamasını gerektiriyordu. Bu, netliği, analojinin etkili kullanımını ve soyut kavramları somut, gerçek dünya kullanımlarına bağlama yeteneğini değerlendirir.

Gemini 2.5, blockchain kavramını açıklamak için potansiyel olarak yararlı bir başlangıç noktası olan dijital bir not defteri metaforunu kullandı. Açıklaması doğruydu ve dağıtılmış defterlerin ve kriptografik bağlamanın temel unsurlarını kapsıyordu. Ancak, açıklama daha uzun cümlelere ve daha resmi, ders kitabı benzeri bir tona yönelme eğilimindeydi, bu da gerçek bir başlangıç seviyesi için hala biraz yoğun veya ağır hissettirebilirdi. Tedarik zinciri uygulamasını tartışırken, kahve veya ilaç takibi gibi geçerli örnekler sundu, ancak açıklama nispeten üst düzey ve kavramsal kaldı, belki de somut faydaları veya ‘nasıl yapılır’ yönünü canlı bir şekilde tam olarak aktaramadı. Açıklama doğruydu ama olabileceğinden daha az ilgi çekiciydi.

DeepSeek, aksine, açıklamayı daha fazla canlılık ve pedagojik beceri ile ele aldı. Teknik olmayan bir kitle için daha sezgisel ve hemen erişilebilir görünen net, güçlü metaforlar kullandı ve jargonu hızla aştı. Blockchain’in kendisinin açıklaması, anlamını kaybetme noktasına kadar aşırı basitleştirmeden doğruluğu koruyarak sindirilebilir adımlara ayrıldı. Kritik olarak, tedarik zinciri uygulamasını açıklarken, DeepSeek kavramı hayata geçiren çekici, somut örnekler sundu. Öğeleri bir blockchain üzerinde izlemenin şeffaflık ve güvenlik gibi faydaları nasıl sağladığına dair daha net bir resim çizdi ve teknolojiyi sadece karmaşık değil, aynı zamanda kullanışlı ve ilgili hissettirdi. Genel ton daha enerjik ve açıklayıcıydı.

Karar: DeepSeek, daha ilgi çekici, açıklayıcı ve başlangıç seviyesine uygun bir açıklama sunarak bu turda zafer kazandı. Metaforları ve somut hikaye anlatımını üstün kullanımı, karmaşık blockchain konusunu önemli ölçüde daha erişilebilir ve pratik uygulamalarını kavramayı daha kolay hale getirdi.

Meydan Okuma 5: Şiirsel Çevirinin İnceliklerinde Gezinme

Bu meydan okuma, dilin ve kültürün inceliklerine daldı ve Emily Dickinson’ın ‘Umut, ruhta tüneyen tüylü şeydir’ dizesinin Fransızca, Japonca ve Arapçaya çevrilmesini istedi. Kritik olarak, her çeviride karşılaşılan şiirsel zorlukların bir açıklamasını da gerektiriyordu. Bu, yalnızca çok dilli çeviri yeteneklerini değil, aynı zamanda edebi duyarlılığı ve kültürlerarası anlayışı da test eder.

Gemini 2.5, ifadenin istenen dillere doğru çevirilerini sağladı. Eşlik eden açıklamaları, dilbilgisel yapılara, olası değişen harfi anlamlara ve telaffuz veya kelime seçimi gibi dilbilimsel açıdan yönlere yoğun bir şekilde odaklandı. Dilleri kendileri inceleyen biri için yararlı olacak ayrıntılı dökümler sundu. Ancak, yanıt şiirsel sanatın bir keşfinden çok teknik bir dil öğretim egzersizi gibi hissettirdi. Çevirinin mekaniğini etkili bir şekilde ele aldı, ancak orijinal metaforun hislerinin, kültürel rezonansının veya farklı dilsel ve kültürel bağlamlarda benzersiz şiirsel kalitesinin kaybına veya dönüşümüne daha az vurgu yaptı. Odak noktası lirikten çok mekanikti.

DeepSeek de doğru çeviriler sundu ancak istemin ikinci, daha incelikli kısmını ele almada başarılı oldu. Açıklaması, şiir çevirisinin doğasında var olan zorluklara daha derinlemesine indi ve ‘tüyler’, ‘tünemek’ ve ‘ruh’ kelimelerinin belirli çağrışımlarının Fransızca, Japonca ve Arapçada doğrudan karşılıkları olmayabileceğini veya farklı kültürel ağırlık taşıyabileceğini tartıştı. Dickinson’ın belirli metaforik imgelerinin potansiyel kaybını ve orijinalin hassas tonunu ve ritmini kopyalamadaki zorlukları araştırdı. DeepSeek’in analizi, her bağlamda umut kavramıyla ilgili felsefi ve kültürel noktalara değindi ve sadece dilbilimsel değil, şiirsel zorluklar üzerine daha zengin, daha anlayışlı bir yorum sağladı. İlgili karmaşıklıkların altını çizen düşünceli bir özetle sonuçlandı.

Karar: Daha derin edebi içgörüsü, çeviri zorluklarını açıklamada daha büyük kültürel duyarlılığı ve istemin ‘şiirsel zorlukları’ keşfetme talebiyle daha iyi uyum sağlayan bir odak noktası nedeniyle, DeepSeek bu turu kazandı. Kültürler arasında metaforik dil çevirisinde yer alan sanat ve nüans için üstün bir takdir gösterdi.

Meydan Okuma 6: Asal Sayılar İçin Python Kodu Oluşturma ve Açıklama

Altıncı meydan okuma, programlama alanına girdi ve bir listedeki asal sayıları tanımlamak için bir Python işlevi oluşturulmasını gerektirdi. Eşit derecede önemli olan, işlevin nasıl çalıştığına dair basit bir açıklama talebiydi. Bu, kodlama yeterliliğini, en iyi uygulamalara bağlılığı ve teknik mantığı bir programcı olmayana açıkça açıklama yeteneğini test eder.

DeepSeek, asal sayıları doğru bir şekilde tanımlayan işlevsel bir Python betiği üretti. Eşlik eden açıklaması, net bölüm başlıkları ve ek açıklamalarla yapılandırılmıştı ve kavramları mantıksal olarak tanıtıyordu. Başlangıç seviyesindekiler için yararlı bir açıklama olan 2’den küçük sayıların neden atlandığını açıklama noktasına değindi. Kodun kendisi açıktı ve adım adım açıklama, çarpanları kontrol etme mantığını parçalayarak erişilebilirliği hedefliyordu. İstemin tüm yönlerini yerine getiren sağlam ve yetkin bir yanıttı.

Gemini 2.5 ise, açıklamasının netliği ve pedagojik kalitesiyle kendini ayırdı. Aynı zamanda doğru ve verimli Python kodu sağlarken, açıklaması son derece sabırlı, neredeyse öğretici benzeri bir ton benimsedi. Mantığı titizlikle adım adım anlattı, bir sayının kareköküne kadar olan çarpanları kontrol etme optimizasyonu gibi potansiyel olarak kafa karıştırıcı kavramları bile programlamaya veya sayı teorisine yeni başlayan biri için sezgisel ve anlaşılır hissettirdi. Yapı temizdi ve dil, kodun sadece çalıştığını değil, neden çalıştığını gerçekten anlamak isteyen bir acemi için özellikle uygundu. Açıklamanın kapsamlı ancak ulaşılabilir doğası ona bir avantaj sağladı.

Karar: Hakim eğilimin tersine, Gemini 2.5 bu meydan okumada galibiyeti garantiledi. Her iki yapay zeka da doğru kod üretip açıklamalar sunarken, Gemini’nin açıklaması olağanüstü netliği, başlangıç seviyesine uygunluğu ve karmaşık mantığı dikkate değer ölçüde erişilebilir kılan sabırlı, pedagojik tonu nedeniyle üstün kabul edildi.

Meydan Okuma 7: Etik Gri Alanları Keşfetme – Bir Yalanın Gerekçelendirilmesi

Daha soyut akıl yürütmeye dönerek, yedinci istem bir etik sorusunu ele aldı: ‘Yalan söylemek hiç etik midir?’ Yalan söylemenin ahlaki olarak haklı gösterilebileceği bir örnek ve bu gerekçelendirmenin arkasındaki mantığı istedi. Bu, yapay zekanın ahlaki akıl yürütme kapasitesini, incelikli argümantasyonunu ve etik bir pozisyonu desteklemek için ikna edici örnekler kullanma yeteneğini araştırır.

Gemini 2.5, soruyu ilgili etik kavramlara atıfta bulunarak ele aldı, potansiyel olarak sonuçsalcılık (eylemleri sonuçlarına göre yargılama) ile deontolojik etik (ahlaki görevleri veya kuralları takip etme) gibi çerçevelerden bahsetti. Yaklaşımı teorik olana yöneldi, yalan söylemenin genellikle neden yanlış olduğuna ancak belirli durumlarda izin verilebilir olabileceğine dair sağlam, biraz akademik bir tartışma sağladı. Ancak, haklı bir yalanı göstermek için sağladığı örnek kurgusallaştırılmış ve yalnızca orta derecede etkili olarak tanımlandı. Mantıksal olarak tutarlı olsa da, daha güçlü bir örneğin sunabileceği duygusal ağırlık veya ikna edici güçten yoksundu.

DeepSeek, tam tersine, klasik ve güçlü bir gerçek dünya etik ikilemini kullandı: II. Dünya Savaşı sırasında evinde saklanan Yahudi mültecileri korumak için Nazi yetkililerine yalan söyleme senaryosu. Bu örnek hemen tanınabilir, duygusal olarak yüklü ve gerçeği söyleme görevi ile masum hayatları kurtarma yönündeki daha yüksek ahlaki zorunluluk arasında net bir çatışma sunar. Bu özel, yüksek riskli tarihsel bağlamın kullanılması, haklı yalan söyleme argümanını dramatik bir şekilde güçlendirdi. Hem etik hem de duygusal düzeyde yankı uyandırdı ve gerekçelendirmeyi çok daha ikna edici ve unutulmaz kıldı. DeepSeek, soyut etik ilkeyi, ahlaki hesabın daha büyük iyilik için aldatmayı ağır bir şekilde desteklediği somut bir duruma etkili bir şekilde bağladı.

Karar: DeepSeek bu turu ikna edici bir şekilde kazandı. Güçlü, tarihsel temelli ve duygusal olarak yankı uyandıran bir örnek kullanması, argümanını Gemini’nin daha teorik ve daha az etkili yaklaşımından önemli ölçüde daha ikna edici ve etik olarak zorlayıcı hale getirdi. Karmaşık ahlaki akıl yürütmeyi keşfetmek için açıklayıcı senaryoları kullanma konusunda daha güçlü bir hakimiyet gösterdi.

Meydan Okuma 8: Gelecekteki Bir Metropolü Hayal Etme – Betimleyici Gücün Testi

Sondan bir önceki meydan okuma, görsel hayal gücüne ve betimleyici yazıya dokundu. İstek, 150 yıl sonraki fütüristik bir şehrin tanımını istedi; ulaşım, iletişim ve doğanın entegrasyonuna odaklanarak, hepsi canlı bir dil kullanılarak aktarıldı. Bu, yaratıcılığı, dünya inşasında tutarlılığı ve kelimelerle çekici bir resim çizme yeteneğini test eder.

Gemini 2.5, gelecekteki şehirde istenen ulaşım, iletişim ve doğa unsurlarına değinerek ayrıntılı bir yanıt üretti. Çeşitli fütüristik kavramlar içeriyordu. Ancak, genel açıklama biraz genel hissettirdi, gerçekten benzersiz veya unutulmaz bir vizyon oluşturmadan yaygın bilim kurgu klişelerine dayanıyordu. Yapı, rakibine kıyasla daha az organizeydi ve dil bazen aşırı yoğun veya süslü ifadelere (‘aşırı işlenmiş’) kaydı, bu da netliği ve okuyucu katılımını artırmak yerine azaltabilirdi. Bileşenler mevcut olsa da, genel doku daha az uyumlu ve görsel olarak belirgin hissettirdi.

DeepSeek, diğer yandan, daha sinematik ve çok duyusal hissettiren bir vizyon hazırladı. Fütüristik ulaşımı (belki sessiz manyetik kapsüller, kişisel hava araçları), iletişimi (sorunsuz bir şekilde entegre edilmiş holografik arayüzler) ve doğayı (dikey ormanlar, biyo-lüminesans parklar) tasvir etmek için somut, orijinal imgeler kullandı. Açıklamalar eğlenceli ancak ayakları yere basan olarak nitelendirildi, teknolojik olarak gelişmiş ama aynı zamanda estetik olarak düşünülmüş ve belki de duygusal olarak yankı uyandıran bir gelecek önerdi. Yapı açıktı, okuyucuyu şehrin farklı yönlerinde organize bir şekilde yönlendiriyordu. Dil, yaratıcı betimleme ile netlik arasında daha iyi bir denge kurdu, hem çarpıcı hem de bir şekilde makul veya en azından canlı bir şekilde tasarlanmış hissettiren bir gelecek yarattı.

Karar: DeepSeek, gelecekteki şehrin daha dengeli, güzel yazılmış, açıkça yapılandırılmış ve yaratıcı bir şekilde belirgin bir vizyonunu sunarak bu meydan okumada galip geldi. Tutarlılığı korurken orijinal, çok duyusal imgeler yaratma yeteneği, yanıtına üstün betimleyici güç ve duygusal rezonans kazandırdı.

Meydan Okuma 9: Özetleme ve Ton Uyarlamasında Ustalık

Son meydan okuma, iki farklı ancak ilişkili beceriyi test etti: önemli bir tarihsel metni (Gettysburg Konuşması) özlü bir şekilde (üç cümlede) özetlemek ve ardından bu özeti tamamen farklı, belirtilen bir tonda (bir korsanın tonu) yeniden yazmak. Bu, anlama, temel fikirleri damıtma ve belirgin bir sesi benimsemede yaratıcı esnekliği değerlendirir.

Gemini 2.5, görevin her iki bölümünü de başarıyla gerçekleştirdi. Gettysburg Konuşması’nın eşitlik, İç Savaş’ın amacı ve demokrasiye adanma çağrısı ile ilgili ana noktalarını doğru bir şekilde yakalayan bir özet üretti. Korsan yeniden yazımı da talimatları takip etti, özetin içeriğini iletmek için korsan benzeri kelime dağarcığı ve ifadeler (‘Ahoy,’ ‘mateys,’ vb.) benimsedi. Yanıt yetkindi ve istemin gereksinimlerini harfi harfine yerine getirdi. Ancak, özet doğru olsa da, belki de Konuşma’nın derin etkisini yakalayan belirli bir retorik ağırlık veya duygusal derinlikten yoksundu. Korsan versiyonu biraz formülsel hissettirdi, gerçek mizah veya karakter elde etmeden korsan klişelerine vurdu.

DeepSeek de Gettysburg Konuşması’nın doğru bir üç cümlelik özetini sağladı, ancak özeti özellikle anlayışlı olmasıyla dikkat çekti, sadece olgusal içeriği değil, aynı zamanda Lincoln’ün sözlerinin duygusal tonunu ve tarihsel önemini daha etkili bir şekilde yakaladı. Ancak DeepSeek’in gerçekten parladığı yer korsan yeniden yazımıydı. Sadece özete korsan jargonu serpiştirmekle kalmadı; kişiliği tamamen benimsemiş gibi göründü, gerçekten komik, cesur ve yaratıcı olarak tanımlanan bir versiyon üretti. Dil daha doğal bir şekilde korsan gibi hissettirdi, eğlenceli enerji ve karakterle aşılanmıştı, ton değişimini daha ikna edici ve eğlenceli hale getirdi.

Karar: DeepSeek, meydan okumanın her iki yönünde de başarılı olarak son turu kazandı. Özeti daha anlayışlı kabul edildi ve korsan tarzı yeniden yazımı üstün yaratıcılık, mizah ve ton uyarlamasında ustalık gösterdi, bu da onu rakibinin yorumundan daha cesur ve daha yaratıcı hale getirdi.