İlk Sarsıntı: DeepSeek ve Verimlilik Serabı
Çinli DeepSeek AI’ın bu yılın başlarında ortaya çıkışı, teknoloji yatırım dünyasında şok dalgaları yarattı. Görünüşte çığır açan yaklaşımı, önemli ölçüde daha düşük hesaplama yüküyle güçlü yapay zeka vaat ederek anında spekülasyonlara yol açtı. Hızla bir anlatı oluştu: Belki de özel çiplerin ve sistemlerin devasa alımlarını karakterize eden yapay zeka altyapısının amansız, maliyetli genişlemesi yavaşlamak üzereydi. Piyasa, maliyet etkin yapay zekanın yeni bir çağının beklenen harcama patlamasını önemli ölçüde azaltabileceği inancını yansıtarak tepki verdi.
Ancak, sektörün önde gelen isimlerinin yakın zamanda yaptığı üst düzey bir toplantıdan elde edilen bilgiler, çarpıcı biçimde farklı bir tablo çiziyor. Bloomberg Intelligence tarafından New York’ta düzenlenen bir üretken yapay zeka konferansı, yalnızca potansiyel maliyet tasarruflarına odaklanan ilk yorumun daha büyük resmi kaçırdığını öne sürdü. Etkinlik, bir harcama yavaşlamasına işaret etmekten çok, neredeyse doyumsuz bir daha fazla yapay zeka kapasitesi açlığını vurguladı. Konsensüs, kesinti yapmakla ilgili değildi; menünün daha ucuz olmasını umutsuzca dilerken bile, akıllı sistemlere yönelik katlanarak artan bir iştahı nasıl besleyeceğini bulmakla ilgiliydi.
Sahadan Sesler: Doymak Bilmez Bir Kapasite İştahı
Geliştiricileri, stratejistleri ve yatırımcıları bir araya getiren gün boyu süren etkinlikteki tartışmalar, sürekli olarak anıtsal yatırımı yönlendiren artan talep temasına geri döndü. Bloomberg Intelligence’ın kıdemli teknoloji analisti ve etkinliğin organizatörlerinden Mandeep Singh, hakim olan duyarlılığı kısaca özetledi. Çok sayıda panel ve uzman tartışmasını yansıtan Singh, evrensel bir nakarata dikkat çekti: katılan hiç kimse yeterli yapay zeka kapasitesine sahip olduğunu hissetmiyordu. Ezici duygu, çok fazla şeye sahip olmak değil, daha fazlasına ihtiyaç duymaktı.
Singh’in kritik bir şekilde eklediği gibi, hızla genişleyen teknoloji sektörlerinde yaygın bir korku olan ‘altyapı balonu’ hayaleti, konuşmalarda dikkate değer bir şekilde yoktu. Odak noktası, tüm endüstrinin karşı karşıya olduğu temel zorluk üzerinde kaldı. Singh’in meslektaşı ve Bloomberg Intelligence’ın BT hizmetleri ve yazılım kıdemli analisti Anurag Rana, bunu en önemli soru olarak çerçeveledi: ‘Bu [yapay zeka altyapısı inşası] döngüsünün neresindeyiz?’
Bu devasa inşaatın tam aşamasını belirlemenin zor kaldığını kabul ederken (‘Kimse kesin olarak bilmiyor’, diye itiraf etti Rana), DeepSeek fenomeni şüphesiz bakış açılarını değiştirdi. Önemli yapay zeka iş yüklerinin potansiyel olarak daha ekonomik bir şekilde ele alınabileceğine dair güçlü bir umut dozu aşıladı. ‘DeepSeek birçok insanı sarstı’, diye gözlemledi Rana. Çıkarım açıktı: Eğer sofistike yapay zeka modelleri gerçekten daha az talepkar donanımda verimli bir şekilde çalışabiliyorsa, belki de büyük teknoloji oyuncularını içeren konsorsiyumlar tarafından planlandığı söylenen yüz milyarlarca dolarlık girişimler gibi devasa projeler yeniden değerlendirilebilir veya farklı şekilde ölçeklenebilirdi.
Rana’ya göre sektör genelinde yankılanan rüya, yapay zeka operasyonel maliyetlerinin, özellikle de inference (eğitilmiş modellerin tahminler veya içerik ürettiği aşama) için, son on yılda bulut bilişim depolamasında tanık olunan dramatik düşüş eğilimini takip etmesidir. Amazon Web Services (AWS) gibi platformlarda büyük miktarda veri depolamanın ekonomisinin yaklaşık sekiz yıl içinde nasıl önemli ölçüde iyileştiğini hatırlattı. ‘Maliyet eğrisindeki bu düşüş… ekonomi iyiydi’, dedi. ‘Ve herkesin umduğu şey bu, inference tarafında… eğer eğri bu seviyeye düşerse, aman tanrım, yapay zekanın benimsenme oranı… muhteşem olacak.’ Singh de aynı fikirdeydi ve DeepSeek’in gelişinin temel olarak ‘herkesin verimliliğe ulaşma konusundaki zihniyetini değiştirdiğini’ belirtti.
Verimliliğe duyulan bu özlem, konferans oturumları boyunca elle tutulur düzeydeydi. Çok sayıda panel, kurumsal yapay zeka projelerini kavramsal aşamalardan canlı üretime taşımanın pratik yönlerini ele alırken, paralel bir tartışma sürekli olarak bu yapay zeka modellerini dağıtma ve çalıştırmayla ilişkili maliyetleri düşürmenin kritik ihtiyacını vurguladı. Amaç açık: Yapay zekayı daha geniş bir uygulama ve kullanıcı yelpazesi için ekonomik olarak uygulanabilir hale getirerek erişimi demokratikleştirmek. Bloomberg’in kendi baş teknoloji uzmanı Shawn Edwards, DeepSeek’in mutlaka tam bir sürpriz olmadığını, daha ziyade evrensel bir arzunun güçlü bir örneği olduğunu öne sürdü. ‘Bana düşündürdüğü şey, bir sihirli değnek sallayıp bu modellerin inanılmaz derecede verimli çalışmasını sağlayabilseydiniz harika olurdu’, dedi ve bu dileği sadece belirli bir atılıma değil, tüm yapay zeka modelleri yelpazesine genişletti.
Yayılma Prensibi: Hesaplama Talebini Ateşlemek
Uzmanların verimlilik arayışına rağmen yapay zeka altyapısına sürekli ve önemli yatırımlar beklemelerinin temel nedenlerinden biri, yapay zeka modellerinin salt yayılmasıdır. New York konferansı boyunca tekrarlanan bir tema, tüm görevleri yerine getirebilecek tek, monolitik bir yapay zeka modeli fikrinden kesin bir şekilde uzaklaşılmasıydı.
- Bir Aile Meselesi: Bloomberg’den Edwards’ın dediği gibi, ‘Bir model ailesi kullanıyoruz. En iyi model diye bir şey yok.’ Bu, farklı yapay zeka mimarilerinin farklı görevlerde - dil üretimi, veri analizi, görüntü tanıma, kod tamamlama vb. - üstün olduğu anlayışının arttığını yansıtıyor.
- Kurumsal Özelleştirme: Panelistler, büyük, genel amaçlı ‘foundation’ veya ‘frontier’ modellerinin büyük yapay zeka laboratuvarları tarafından geliştirilmeye ve iyileştirilmeye devam edeceği konusunda büyük ölçüde hemfikirdi, ancak işletmeler içindeki asıl eylemin potansiyel olarak yüzlerce hatta binlerce özelleşmiş yapay zeka modelini dağıtmayı içerdiği konusunda anlaştılar.
- Fine-Tuning ve Şirkete Özel Veri: Bu kurumsal modellerin çoğu, fine-tuning adı verilen bir süreçle temel modellerden uyarlanacaktır. Bu, önceden eğitilmiş bir sinir ağının bir şirketin özel, genellikle tescilli verileri üzerinde yeniden eğitilmesini içerir. Bu, yapay zekanın benzersiz iş bağlamlarını, terminolojisini ve müşteri etkileşimlerini anlamasını sağlayarak genel bir modelin sunabileceğinden çok daha alakalı ve değerli sonuçlar verir.
- Geliştirmeyi Demokratikleştirme: Veri bilimi platformu Dataiku’yu temsil eden Jed Dougherty, kurumsal AI agents için ‘modeller arasında seçme özgürlüğü’ ihtiyacını vurguladı. Şirketlere yapay zeka araçları üzerinde kontrol, oluşturma yetenekleri ve denetlenebilirlik vermenin önemini vurguladı. ‘Bu şeyleri inşa edecek araçları insanların eline vermek istiyoruz’, diye iddia etti Dougherty. ‘Tüm ajanları on doktoralı kişinin inşa etmesini istemiyoruz.’ Geliştirmede daha geniş erişilebilirliğe yönelik bu dürtü, bu dağıtılmış oluşturma çabalarını desteklemek için daha fazla temel altyapıya ihtiyaç duyulduğunu ima ediyor.
- Markaya Özgü Yapay Zeka: Yaratıcı endüstriler mükemmel bir örnek sunuyor. Adobe’de yeni iş girişimlerine liderlik eden Hannah Elsakr, özel modeller üzerine bahis oynama stratejilerini önemli bir farklılaştırıcı olarak açıkladı. ‘Markanız için yeni bir reklam kampanyasına yardımcı olabilecek özel model uzantıları eğitebiliriz’, diyerek yapay zekanın belirli marka estetiğini ve mesajlaşmasını sürdürmek için nasıl uyarlanabileceğini gösterdi.
Modellerin çeşitlendirilmesinin ötesinde, kurumsal iş akışları içinde AI agents‘ın artan dağıtımı, işlem talebinin bir başka önemli itici gücüdür. Bu ajanlar sadece pasif araçlar olarak değil, aynı zamanda çok adımlı görevleri yürütebilen aktif katılımcılar olarak tasavvur ediliyor.
Microsoft’un Copilot Studio ajanları ve otomasyon çabalarına başkanlık eden Ray Smith, kullanıcıların Copilot gibi birleşikbir arayüz aracılığıyla potansiyel olarak yüzlerce özel ajanla etkileşime gireceği bir gelecek öngördü. ‘Bütün bir süreci tek bir ajana sıkıştırmayacaksınız, onu parçalara ayıracaksınız’, diye açıkladı. Bu ajanların, önerdiği gibi, esasen programlamanın ‘yeni dünyasındaki uygulamalar’ olduğunu söyledi. Vizyon, kullanıcıların sadece hedeflerini belirtmeleri - ‘ne başarmak istediğimizi söyleyin’ - ve ajanın gerekli adımları düzenlemesidir. ‘Ajanik uygulamalar sadece yeni bir iş akışı şeklidir’, dedi Smith ve bu vizyonu gerçekleştirmenin teknolojik olasılık meselesinden (‘hepsi teknolojik olarak mümkün’) çok ‘onu inşa etme hızımızla’ ilgili olduğunu vurguladı.
AI agents’ı günlük organizasyonel süreçlere daha derinden yerleştirme yönündeki bu baskı, maliyet azaltma ve verimli dağıtım üzerindeki baskıyı daha da yoğunlaştırıyor. Mikroişlemci devi ARM Holdings’in ürün yönetimi başkanı James McNiven, zorluğu erişilebilirlik açısından çerçeveledi. ‘Erişimi giderek daha fazla cihaza nasıl sağlarız?’ diye düşündü. Modellerin belirli görevlerde neredeyse ‘doktora düzeyinde’ yetenekler elde ettiğini gözlemleyerek, yıllar önce gelişmekte olan ülkelere mobil ödeme sistemleri getirmenin dönüştürücü etkisiyle bir paralellik kurdu. Temel soru hala geçerli: ‘Bu [yapay zeka yeteneğini] bu yeteneği kullanabilecek insanlara nasıl ulaştırırız?’ Sofistike AI agents’ı geniş bir işgücü kesimine asistan olarak hazır bulundurmak, yalnızca akıllı yazılımı değil, aynı zamanda verimli donanımı ve kaçınılmaz olarak, hesaplama başına verimlilik artsa bile daha fazla temel altyapı yatırımını gerektirir.
Ölçeklendirme Engelleri: Silikon, Güç ve Bulut Devleri
En yaygın kullanılan, genel temel modeller bile baş döndürücü bir hızla çoğalıyor ve mevcut altyapı üzerinde muazzam bir baskı oluşturuyor. Amazon Web Services (AWS) için bilgi işlem ve ağı denetleyen Dave Brown, platformlarının tek başına müşterilere yaklaşık 1.800 farklı yapay zeka modeline erişim sunduğunu açıkladı. AWS’nin bu güçlü araçları çalıştırmanın ‘maliyetini düşürmek için çok şey yapmaya’ yoğun bir şekilde odaklandığını vurguladı.
AWS gibi bulut sağlayıcıları için önemli bir strateji, kendi özel silikonlarını geliştirmeyi içerir. Brown, AWS tarafından tasarlanan çiplerin, örneğin yapay zeka eğitimi için optimize edilmiş Trainium işlemcilerinin artan kullanımını vurgulayarak, ‘AWS, diğer şirketlerin işlemcilerinden daha fazla kendi işlemcilerimizi kullanıyor’ dedi. Özel, şirket içi donanıma yönelik bu hamle, performans ve maliyet üzerinde kontrolü ele geçirmeyi, Nvidia, AMD ve Intel gibi genel amaçlı çip tedarikçilerine olan bağımlılığı azaltmayı amaçlıyor. Bu çabalara rağmen, Brown temel gerçeği açıkça kabul etti: ‘Maliyet daha düşük olsaydı müşteriler daha fazlasını yapardı.’ Talep tavanı şu anda potansiyel uygulama eksikliğinden çok bütçe kısıtlamaları tarafından tanımlanıyor.
Önde gelen yapay zeka geliştiricilerinin gerektirdiği kaynakların ölçeği muazzamdır. Brown, AWS’nin sofistike Claude dil modelleri ailesinin yaratıcıları olan Anthropic ile günlük işbirliğine dikkat çekti. Anthropic’in uygulama programlama arayüzleri başkanı Michael Gerstenhaber, Brown ile birlikte konuşurken, modern yapay zekanın, özellikle karmaşık akıl yürütme veya ‘düşünme’ için tasarlanmış modellerin hesaplama yoğunluğuna işaret etti. Bu modeller genellikle cevapları için ayrıntılı adım adım açıklamalar üretir ve önemli işlem gücü tüketir. ‘Düşünen modeller çok fazla kapasitenin kullanılmasına neden oluyor’, dedi Gerstenhaber.
Anthropic, ‘prompt caching’ (kaynak tasarrufu için önceki etkileşimlerden hesaplamaları depolama ve yeniden kullanma) gibi optimizasyon teknikleri üzerinde AWS ile aktif olarak çalışırken, temel donanım gereksinimi muazzam olmaya devam ediyor. Gerstenhaber, Anthropic’in mevcut model paketini çalıştırmak için ‘yüz binlerce accelerator’a’ - özel yapay zeka çipleri - ‘birçok veri merkezine dağıtılmış’ olarak ihtiyaç duyduğunu açıkça belirtti. Bu, yalnızca büyük bir yapay zeka oyuncusunun temelini oluşturan hesaplama kaynaklarının salt ölçeği hakkında somut bir fikir veriyor.
Geniş silikon filolarını tedarik etme ve yönetme zorluğunu artıran bir diğer faktör de yapay zeka ile ilişkili artan enerji tüketimidir. Brown bunu kritik ve hızla artan bir endişe olarak vurguladı. Yoğun yapay zeka iş yüklerini destekleyen mevcut veri merkezleri zaten yüzlerce megawatt cinsinden ölçülen güç tüketiyor. Tahminler, gelecekteki gereksinimlerin kaçınılmaz olarak gigawatt aralığına - büyük enerji santrallerinin çıktısı - tırmanacağını gösteriyor. ‘Tükettiği güç’, diye uyardı Brown yapay zekaya atıfta bulunarak, ‘büyük ve birçok veri merkezindeki ayak izi büyük.’ Bu artan enerji talebi, yalnızca muazzam operasyonel maliyetler değil, aynı zamanda yeni nesil yapay zeka altyapısının yerleştirilmesi ve güçlendirilmesi için önemli çevresel ve lojistik zorluklar da sunuyor.
Ekonomik Belirsizlik: Büyüme Planları Üzerindeki Gölge
Teknolojik gelişmeler ve gelişen kullanım senaryoları tarafından yönlendirilen iyimser görünüme rağmen, yapay zeka yatırımı için tüm projeksiyonların üzerinde önemli bir değişken beliriyor: daha geniş ekonomik iklim. Bloomberg Intelligence konferansı sona ererken, katılımcılar zaten beklenenden daha kapsamlı olarak algılanan yeni açıklanan küresel tarife paketlerinden kaynaklanan piyasa tedirginliklerini gözlemliyorlardı.
Bu, iddialı teknolojik yol haritalarının makroekonomik ters rüzgarlar tarafından hızla kesintiye uğratılabileceğinin güçlü bir hatırlatıcısı olarak hizmet ediyor. Bloomberg’den Rana, yapay zeka harcamalarının başlangıçta bir şekilde yalıtılmış olabileceği konusunda uyardı, ancak sunucular ve yapay zeka ile ilgili olmayan depolama gibi kurumsal BT yatırımının geleneksel alanlarının ekonomik bir daralmadaki ilk kayıplar olabileceğini belirtti. ‘Odaklandığımız diğer büyük şey, yapay zeka dışı teknoloji harcamaları’, dedi ve özellikle yapay zeka bütçelerini dikkate almadan önce bile, kazanç sezonuna giren büyük teknoloji hizmet sağlayıcıları üzerindeki potansiyel etki konusunda endişelerini dile getirdi.
Ancak, yapay zekanın benzersiz bir şekilde dirençli olabileceğine dair yaygın bir teori var. Rana, büyük şirketlerdeki Finans Direktörlerinin (CFO’lar), ekonomik belirsizlik veya hatta bir durgunluk nedeniyle bütçe kısıtlamalarıyla karşı karşıya kaldıklarında, yapay zeka girişimlerine öncelik vermeyi seçebileceklerini öne sürdü. Gelecekteki rekabet gücü için kritik olarak algılanan stratejik yapay zeka yatırımlarını korumak için potansiyel olarak daha az kritik alanlardan fon kaydırabilirler.
Yine de, bu iyimser görüş garanti olmaktan uzaktır. Rana’ya göre nihai test, büyük şirketlerin, artan ekonomik belirsizlik karşısında, özellikle yapay zeka veri merkezleri inşa etmek için agresif sermaye harcaması hedeflerini sürdürüp sürdürmeyecekleri olacaktır. Kritik soru hala geçerli: ‘’Biliyor musunuz? Çok belirsiz’ diyecekler mi?’ Cevap, yapay zeka altyapısı harcamalarının arkasındaki durdurulamaz gibi görünen ivmenin amansız tırmanışına devam edip etmeyeceğini veya küresel ekonomik gerçekler tarafından dikte edilen beklenmedik bir duraklamayla karşılaşıp karşılaşmayacağını belirleyecektir.