DeepSeek, küresel AI sohbetlerinde nispeten bilinirlikten bir odak noktasına hızla yükselen bir isim olarak, teknoloji ve finans sektörlerinde yoğun tartışmalara ve spekülasyonlara yol açtı. Bu gelişen gücün arkasındaki Çinli AI laboratuvarı, yerleşik düzeni bozarak analistleri ABD’nin AI yarışındaki sürdürülebilirliği ve mevcut AI çip talebinin uzun vadeli uygulanabilirliği hakkında sorgulamaya sevk etti. Peki DeepSeek’i mevcut önemine iten temel faktörler nelerdir?
DeepSeek’in Doğuşu: Hedge Fonundan AI Laboratuvarına
DeepSeek’in kökenleri, nicel finans dünyasıyla derinden iç içedir. Veriye dayalı ticaret kararları almada AI’yı kullanmasıyla ünlü bir Çin hedge fonu olan High-Flyer Capital Management tarafından desteklenmektedir.
Zhejiang Üniversitesi’ndeki öğrenciliği sırasında ticarette tecrübesi olan bir AI meraklısı olan Liang Wenfeng, 2015 yılında High-Flyer’ı kurdu. 2019’da, finansal uygulamalar için AI algoritmaları geliştirmeye ve uygulamaya özel olarak odaklanan bir hedge fonu olarak High-Flyer Capital Management’ı başlattı.
2023’te High-Flyer, DeepSeek’i temel finansal işinden bağımsız olarak faaliyet gösteren özel bir AI araştırma laboratuvarı olarak geliştirdi. Daha sonra, High-Flyer’ın kilit bir yatırımcı olmasıyla, laboratuvar DeepSeek adını koruyarak ayrı bir tüzel kişiliğe dönüştürüldü.
DeepSeek, başlangıcından itibaren model eğitimini kolaylaştırmak için kendi veri merkezi kümelerini kurmaya öncelik verdi. Ancak, Çin’de faaliyet gösteren diğer AI şirketlerine benzer şekilde, DeepSeek de ABD’nin gelişmiş donanımlara yönelik ihracat kısıtlamaları nedeniyle zorluklarla karşılaştı. Sonuç olarak, şirket daha yeni modellerini eğitmek için, ABD şirketlerinin kolayca erişebildiği H100 çiplerinin daha az güçlü bir varyantı olan Nvidia H800 çiplerini kullanmak zorunda kaldı.
DeepSeek’in teknik ekibi, gençliği ve dinamizmiyle bilinir. Şirket, önde gelen Çin üniversitelerinden doktoralı AI araştırmacılarını aktif olarak işe alıyor. Dahası, The New York Times’ın bildirdiğine göre, DeepSeek teknolojisinin geniş bir konu yelpazesini etkili bir şekilde anlayabilmesini ve hitap edebilmesini sağlamak için bilgisayar bilimi uzmanlığı olmayanlar da dahil olmak üzere çeşitli geçmişlerden bireyleri istihdam ediyor.
DeepSeek’in AI Modelleri: Statükoya Meydan Okuma
DeepSeek, ilk model paketini (DeepSeek Coder, DeepSeek LLM ve DeepSeek Chat) Kasım 2023’te tanıttı. Ancak, AI endüstrisinin dikkatini gerçekten çeken, ilkbaharda yeni nesil DeepSeek-V2 model ailesinin piyasaya sürülmesi oldu.
Hem metni hem de görüntüleri analiz edebilen çok yönlü bir sistem olan DeepSeek-V2, çeşitli AI kıyaslamalarında etkileyici bir performans sergiledi. Özellikle, bu performansı o sırada mevcut olan rakip modellere kıyasla önemli ölçüde daha düşük bir maliyetle elde etti. Bu, ByteDance ve Alibaba da dahil olmak üzere DeepSeek’in yerli rakiplerini bazı modellerinin fiyatlarını düşürmeye ve diğerlerini tamamen ücretsiz sunmaya yöneltti.
DeepSeek V3, Meta’nın Llama’sı gibi hem indirilebilir, açık kaynaklı modellere hem de yalnızca API’ler aracılığıyla erişilebilen OpenAI’nin GPT-4o’su gibi "kapalı" modellere kıyasla üstün performans sergiledi.
Aynı derecede dikkat çekici olan DeepSeek’in R1 "akıl yürütme" modelidir. Ocak ayında başlatılan DeepSeek, R1’in temel kıyaslamalarda OpenAI’nin o1 modeliyle karşılaştırılabilir bir performans sergilediğini iddia ediyor.
Bir akıl yürütme modeli olarak R1, standart modellerle ilişkili yaygın tuzaklardan bazılarını azaltan kendi kendini kontrol mekanizmalarını içeriyor. Akıl yürütme modellerinin çözümlere ulaşması biraz daha uzun işlem süreleri (saniyelerden dakikalara kadar) gerektirebilirken, fizik, bilim ve matematik gibi alanlarda daha fazla güvenilirlik sergileme eğilimindedirler.
Ancak, R1 ve DeepSeek V3 dahil olmak üzere DeepSeek’in modelleri, yanıtlarının "temel sosyalist değerlerle" uyumlu olmasını sağlayan Çin’in internet düzenleyicisinin gözetimine tabidir. Örneğin, DeepSeek’in chatbot uygulamasında R1, Tiananmen Meydanı veya Tayvan’ın özerkliği ile ilgili soruları yanıtlamayacaktır.
Mart ayında DeepSeek’in web sitesi trafiği 16,5 milyon ziyareti aştı. Similarweb editörü David Carr’a göre, Şubat ayına kıyasla trafikte %25’lik bir düşüşe rağmen, DeepSeek günlük ziyaretler açısından ikinci sırada yer aldı. Ancak, bu rakam hala Mart ayında 500 milyon haftalık aktif kullanıcıyı aşan ChatGPT ile karşılaştırıldığında sönük kalıyor.
AI Ortamına Yıkıcı Bir Yaklaşım
DeepSeek’in iş modeli biraz gizemli kalmaya devam ediyor. Şirket, ürün ve hizmetlerini piyasa değerinin önemli ölçüde altında fiyatlandırıyor ve hatta bazılarını ücretsiz sunuyor. Dahası, risk sermayesi şirketlerinden önemli ilgi görmesine rağmen dış finansmana direndi.
DeepSeek, aşırı maliyet rekabetçiliğini verimlilikteki atılımlara bağlıyor. Ancak, bazı uzmanlar şirket tarafından sağlanan rakamların doğruluğunu sorguladılar.
Ne olursa olsun, geliştiriciler DeepSeek’in modellerini benimsediler, bunlar geleneksel anlamda açık kaynaklı olmasa da, ticari kullanıma izin veren izin verici lisanslar altında mevcuttur. Hugging Face CEO’su Clem Delangue’a göre, platformdaki geliştiriciler R1’in 500’den fazla türev modelini oluşturdular ve toplam 2,5 milyon indirme topladılar.
DeepSeek’in daha büyük, daha köklü rakiplere karşı başarısı hem "AI’yı altüst etmek" hem de "abartılı" olarak tanımlandı. Şirketin başarıları kısmen Nvidia’nın hisse senedi fiyatında Ocak ayında %18’lik bir düşüşe neden oldu ve OpenAI CEO’su Sam Altman’dan halka açık bir yanıt aldı. Reuters’in bildirdiğine göre, Mart ayında ABD Ticaret Bakanlığı büroları DeepSeek’i hükümet cihazlarında yasakladı.
Microsoft, DeepSeek’i kuruluşlar için AI hizmetlerini birleştiren bir platform olan Azure AI Foundry hizmetine entegre etti. Meta’nın ilk çeyrek kazanç çağrısı sırasında CEO Mark Zuckerberg, DeepSeek’in Meta’nın AI harcamaları üzerindeki potansiyel etkisi sorulduğunda, AI altyapısına yapılan yatırımların şirket için "stratejik bir avantaj" olmaya devam edeceğini belirtti. Mart ayında OpenAI, DeepSeek’i "devlet sübvansiyonlu" ve "devlet kontrollü" olarak etiketledi ve ABD hükümetinin modellerini yasaklamayı düşünmesini tavsiye etti.
Nvidia’nın dördüncü çeyrek kazanç çağrısı sırasında CEO Jensen Huang, DeepSeek’in "mükemmel yenilikçiliğini" vurgulayarak, akıl yürütme modellerinin Nvidia’ya fayda sağlayacak şekilde önemli ölçüde daha fazla işlem gücü gerektirdiğini belirtti.
Tersine, Güney Kore ve New York eyaleti de dahil olmak üzere bazı şirketler, ülkeler ve hükümetler DeepSeek’in hükümet cihazlarında kullanımını yasakladı.
Mayıs ayında Microsoft Başkan Yardımcısı ve Başkanı Brad Smith, Senato’da Microsoft çalışanlarının veri güvenliği ve potansiyel propaganda konusundaki endişeler nedeniyle DeepSeek’i kullanmasının yasak olduğunu ifade etti.
DeepSeek’in Belirsiz Geleceği
DeepSeek’in gelecekteki yörüngesi belirsizliğini koruyor. Daha fazla model iyileştirmesi beklenirken, ABD hükümeti algılanan zararlı yabancı etkiden giderek daha fazla endişe duyuyor gibi görünüyor. Mart ayında The Wall Street Journal, ABD’nin DeepSeek’i hükümet cihazlarında yasaklamasının muhtemel olduğunu bildirdi.
DeepSeek’in hızlı yükselişi, rekabet dinamiklerinin ve yıkıcı yenilik potansiyelinin yeniden değerlendirilmesine yol açarak AI endüstrisinin temellerini tartışmasız bir şekilde sarstı. Artan inceleme ve düzenleyici zorluklar karşısında mevcut ivmesini sürdürüp sürdüremeyeceği henüz görülmedi. Önümüzdeki yıllar, DeepSeek’in küresel AI ortamı üzerindeki uzun vadeli etkisini belirlemede çok önemli olacak. Teknolojik ilerleme, jeopolitik değerlendirmeler ve etik kaygıların karmaşık etkileşiminde gezinme yeteneği nihayetinde mirasını tanımlayacaktır. AI dünyası yakından izleyecek.
DeepSeek hikayesi, yapay zekanın hızla gelişen dünyasında yeni oyuncuların hızla ortaya çıkabileceğini ve yerleşik düzene meydan okuyabileceğini hatırlatıyor. Şirketin yenilikçi teknoloji ve geleneksel iş modellerini bozma isteğiyle yönlendirilen başarısı, sektörün dikkatini çekmeye zorladı. DeepSeek gelişmeye ve erişimini genişletmeye devam ettikçe, AI’nın geleceğini şekillendirmede şüphesiz önemli bir rol oynayacaktır.