Manus: Bir Kıvılcım mı, Çin'in Yapay Zeka Geleceği mi?

Heyecanın Anatomisi: Manus’u Anlamak

Manus’un ortaya çıkışı boşlukta gerçekleşmedi. Raporlar, platformun sıfırdan bir yaratım olmadığını, daha çok mevcut ve ince ayarlı yapay zeka modellerinden örülmüş karmaşık bir doku olduğunu gösteriyor. Platformun, Anthropic’in Claude’u ve Alibaba’nın Qwen’i gibi modellerin yeteneklerinden yararlandığı ve bunları araştırma raporu oluşturmadan karmaşık finansal belgelerin analizine kadar çeşitli görevler için kullandığı bildiriliyor.

Ancak, Manus’un arkasındaki Çinli şirket The Butterfly Effect, web sitesinde çok daha iddialı bir tablo çiziyor. Platformun, emlak edinimi ve video oyunu programlama gibi birbirinden çok farklı alanlarda yetenekli olduğu iddia ediliyor – bu iddialar ilk bakışta fantastik sınırlara yaklaşıyor gibi görünüyor.

Cesur İddialar ve Viral Videolar: Algının Gücü

Manus’un araştırma lideri Yichao ‘Peak’ Ji, X’te (eski adıyla Twitter) viral olan bir videoda heyecanı daha da körükledi. Ji, Manus’u, OpenAI’in deep research’ü ve Operator’ı da dahil olmak üzere mevcut ajanvari araçlara üstün bir alternatif olarak konumlandırdı. Ji, Manus’un, genel yapay zeka asistanlarını değerlendirmek için yaygın olarak kullanılan bir kıyaslama olan GAIA’da deep research’ü geride bıraktığını iddia etti. Bu kıyaslama, bir yapay zekanın web’de gezinerek, yazılımla etkileşim kurarak ve daha fazlasını yaparak gerçek dünya görevlerini gerçekleştirme yeteneğini inceler.

Ji videoda, ‘[Manus] sadece başka bir sohbet robotu veya iş akışı değil,’ dedi. ‘Kavram ve uygulama arasındaki boşluğu dolduran tamamen otonom bir ajan […]. Bunu insan-makine işbirliğinin bir sonraki paradigması olarak görüyoruz.’ Bunlar gerçekten cesur iddialar ve platformun viral şöhrete hızla yükselmesine önemli ölçüde katkıda bulundular.

Gerçeklik Kontrolü: Kullanıcı Deneyimleri Farklı Bir Resim Çiziyor

Manus’un mimarları ve bazı etkili sesler onu övmüş olsa da, ilk kullanıcı deneyimleri daha az gurur verici bir hikaye anlatıyor. Platformun iddia edilen yetenekleri üzerinde şüphe gölgesi düşüren aksaklıklar, sınırlamalar ve düpedüz başarısızlık raporları ortaya çıkmaya başladı.

Yapay zeka girişimi Pleias’ın kurucu ortağı Alexander Doria, X’te Manus ile yaşadığı pek de parlak olmayan deneyimini paylaştı. Testleri sırasında sinir bozucu bir hata mesajı ve sonsuz döngü yağmuruyla karşılaştı. Diğer kullanıcılar da bu endişeleri yineleyerek Manus’un olgusal hatalara yatkınlığına, tutarsız alıntı uygulamalarına ve çevrimiçi olarak kolayca bulunabilen bilgileri gözden kaçırma eğilimine dikkat çekti.

Kişisel Deneyimler: Hayal Kırıklığının İlk Elden Anlatımı

Manus’u test etme girişimlerim de benzer şekilde hayal kırıklığı yaratan sonuçlar verdi. Teslimat alanım içindeki yüksek puanlı bir fast food restoranından kızarmış tavuklu sandviç sipariş etmek gibi görünüşte basit bir istekle başladım. On dakikalık bir beklemeden sonra platform çöktü. İkinci bir deneme, kriterlerime uyan bir menü öğesi verdi, ancak Manus siparişi tamamlayamadı ve hatta bir ödeme bağlantısı bile sağlayamadı.

Yılmadan, Manus’a yakındaki bir restoranda bir kişilik masa ayırtma görevini verdim. Birkaç dakika sonra yine başarısızlık yaşandı. Son olarak, platformu Naruto’dan ilham alan bir dövüş oyunu yapmaya zorladım. Yarım saatlik işlemin ardından bir hata verdi ve deneyimimi fiilen sonlandırdı.

Şirketin Yanıtı: Büyüme Sancılarını Kabul Etmek

TechCrunch’a verilen bir açıklamada, bir Manus sözcüsü platformun mevcut sınırlamalarını kabul etti:

‘Küçük bir ekip olarak odak noktamız Manus’u geliştirmeye devam etmek ve kullanıcıların sorunları çözmelerine gerçekten yardımcı olan yapay zeka ajanları yapmak […]. Mevcut kapalı betanın birincil amacı, sistemin çeşitli bölümlerini stres testine tabi tutmak ve sorunları belirlemektir. Herkes tarafından paylaşılan değerli bilgiler için minnettarız.’

Bu açıklama, sorunları kabul ederken, aynı zamanda platformun erken erişim niteliğini de vurguluyor. Mevcut sürümün, yaygın kullanıma hazır, cilalı bir üründen çok bir stres testi olduğunu gösteriyor.

Abartı Döngüsü: Ayrıcalık, Yanlış Bilgi ve Ulusal Gurur

Manus, mevcut haliyle, açıkça kusurluysa, neden bu kadar yoğun ilgi gördü? Bu fenomene birkaç faktör katkıda bulundu:

  • Ayrıcalık: Davetiyelerin sınırlı sayıda olması, bir ayrıcalık havası yaratarak talebi ve merakı artırdı.
  • Medya İlgisi: Çin medya kuruluşları, Manus’u önemli bir yapay zeka atılımı olarak göstermekte gecikmedi ve QQ News gibi yayınlar onu ‘yerli ürünlerin gururu’ olarak selamladı.
  • Sosyal Medya Etkisi: Sosyal medyadaki yapay zeka fenomenleri, zaman zaman Manus’un yetenekleri hakkında yanlış bilgilerin yayılmasında önemli bir rol oynadı. Manus’un birden fazla akıllı telefon uygulamasında sorunsuz bir şekilde etkileşim kurduğunu gösteren ve geniş çapta dolaşan bir videonun daha sonra Ji tarafından yanlış bir temsil olduğu doğrulandı.
  • DeepSeek ile Karşılaştırmalar: X’teki bazı etkili yapay zeka hesapları, Manus ile başka bir Çin yapay zeka şirketi olan DeepSeek arasında karşılaştırmalar yaptı. Ancak bu karşılaştırmalar tamamen doğru değil. DeepSeek’in aksine, The Butterfly Effect herhangi bir tescilli model geliştirmedi. Ayrıca, DeepSeek teknolojilerinin çoğunu açık kaynaklı hale getirirken, Manus şimdilik kapalı bir sistem olarak kalıyor.

Bir Tutam Tuz: Erken Erişim ve Gelecek Potansiyeli

Manus’un şu anda gelişimin çok erken bir aşamasında olduğunu yinelemek çok önemli. The Butterfly Effect, hesaplama kapasitesini ölçeklendirmek ve bildirilen sorunları gidermek için aktif olarak çalıştığını iddia ediyor. Ancak, şu an itibariyle Manus, teknolojik gerçekliği aşan abartının güçlü bir örneği olarak hizmet ediyor. Platformun, kendisi için belirlediği yüksek beklentileri karşılayacak şekilde gelişip gelişemeyeceği henüz belli değil. Potansiyel şüphesiz var, ancak bu potansiyeli gerçekleştirme yolu zorluklarla dolu görünüyor. Mevcut yineleme, viral videolarda ve tanıtım materyallerinde tasvir edilen kesintisiz, otonom ajandan çok uzak. Arzu ve uygulama arasındaki boşluk hala çok büyük.