Çin’deki yapay zeka teknolojisinin hızlı evrimi, birçok startup için hem heyecan hem de belirsizlik getirdi. Bir zamanlar hırslı hedeflerle dolu olan bazı şirketler, rekabetçi ve kaynak yoğun bir pazarın acı gerçekleriyle yüzleşerek stratejilerini yeniden ayarlıyor.
Büyük Vizyonlardan Stratejik Dönüşlere
Çin’in ‘Yapay Zeka Küçük Kaplanları’ndan biri olan Baichuan Intelligent’ın CEO’sundan gelen son bir iç mektup, şirketin ikinci yıl dönümünü işaret etti ve stratejik bir değişimi vurguladı. Odak noktası daraltılarak tıbbi uygulamalara öncelik verilecekti. Bu, OpenAI’ye benzer, yenilikçi uygulamalarla tamamlanmış çığır açan bir temel model yaratma yönündeki ilk misyonuyla tam bir tezat oluşturuyordu.
Benzer şekilde, bir başka ‘Küçük Kaplan’ olan 01.AI’nın kurucusu Li Kaifu, Ocak ayında şirketinin ‘küçük ama güzel’ bir yaklaşımı benimseyeceğini duyurdu. Bu, AGI’nin gelişini hızlandırmak için bir AI 2.0 platformu oluşturma konusundaki büyük vizyondan önemli bir sapmaydı.
Bu stratejik geri çekilmeler, bazı gözlemcilerin bu ‘Küçük Kaplanların’ giderek ‘hasta kedilere’ benzediğini öne sürmesiyle spekülasyonlara yol açtı. Sürekli değişimle işaretlenmiş bir ortamda, bu şirketler geleceklerini nasıl güvence altına alabilir?
Bu soruyu yanıtlamak için Zhiwei’deki editör ekibi, büyük model teknolojisi uzmanları, finans ve sağlık alanındaki yapay zeka uzmanları ve önde gelen şirketlerden yapay zeka teknoloji uzmanları dahil olmak üzere çeşitli uzmanlardan görüş aldı.
DeepSeek Etkisi ve Değişen Stratejiler
Piyasanın altını üstüne getiren bir model olan DeepSeek’in patlayıcı popülaritesinin ardından yapay zeka ortamı önemli ölçüde değişti. Heybetli bir savaşçı gibi, DeepSeek de ortamı bozarak birçok yapay zeka şirketini pozisyonlarını yeniden değerlendirmeye ve farklı yollar izlemeye zorladı.
Ancak, bu dönüşüm birçok kişinin fark ettiğinden bile daha önce başlamıştı. Büyük model teknolojisi uzmanı Wang Wenguang’a göre, bazı Çinli yapay zeka şirketleri, DeepSeek V3 ve R1’in piyasaya sürülmesinden önce bile büyük model eğitiminin peşini bırakmaya başlamıştı. Maliyetler çok yüksekti ve bu şirketler DeepSeek V2.5 ve Alibaba’nın Qwen 70B’si gibi serbestçe kullanılabilen ve açık kaynaklı alternatiflerle rekabet edemeyeceklerini düşünüyorlardı.
Bir yapay zeka teknolojisi hizmeti girişiminden bir uzman olan Liang He, ‘Küçük Kaplanların’ çoğunun 2024’ün ortalarında hala büyük modeller eğitiyor olmasına rağmen, yatırımlarının zaten önemli ölçüde azaldığını ekledi. Ocak 2025’te DeepSeek R1’in piyasaya sürülmesiyle, birçok küçük şirket ayak uyduramayacaklarını fark etti.
Bu ani değişim, ‘Küçük Kaplanlar’ için büyük bir yön değişikliğine neden olarak, AGI geliştirmesinden daha özel yaklaşımlara doğru kaydı.
Baichuan ve 01.AI, sırasıyla tıbbi yapay zeka ve endüstriyel uygulamalara odaklanarak büyük modellerin ön eğitimini bıraktılar. MiniMax, B2B operasyonlarını azaltıyor ve C-end video oluşturma ve diğer uygulamalarla denizaşırı pazarlara odaklanıyor. Zhipu, Moonshot AI ve StepUp hala açık kaynak topluluğunda aktifler, ancak DeepSeek R1’den daha iyi performans gösteren yeni bir model üretmediler. Zhipu, hayatta kalmasını sağlayan önemli miktarda fon ve hükümet-girişim ortaklıkları sağladı. Moonshot AI’nın ana ürünü Kimi’nin konumu Yuanbao tarafından tehdit edildi ve bu da konumunu giderek daha garip hale getirdi.
Genel olarak, ‘Küçük Kaplanlar’ giderek B2B SaaS pazarıyla birleşiyor, ki bu da bazıları tarafından ‘hayal gücü olmayan’ olarak kabul ediliyor.
B2B Pazarının Cazibesi ve Sınırlamaları
01.AI yakın zamanda DeepSeek’i çeşitli endüstriler için tek elden bir kurumsal büyük model platformu oluşturmak üzere tamamen entegre etme niyetini açıkladı. Ancak, bu hamle şüpheyle karşılandı.
Bir finansal yapay zeka uzmanı olan Jiang Shao, 01.AI’nın geleceğinin, geniş odağı, DeepSeek’in ortaya çıkmasının ardından teknolojik rekabet gücünün olmaması ve sınırlı ticarileştirme yetenekleri nedeniyle belirsiz olduğuna inanıyor.
Wang Wenguang da bu görüşü yineleyerek, tek elden büyük model platformuna giriş için teknik engelin nispeten düşük olduğunu belirtti.
Wang, yaklaşık altı ay içinde bağımsız olarak böyle bir platform geliştirme ve kişisel kanallar aracılığıyla satma deneyimini paylaştı. Bir şirket olarak bu üründen kar elde etmenin zor olduğunu, ancak solo bir girişim olarak karlı olabileceğini savundu.
Wang, büyük model hizmetleri sunan ancak teknik bir platformu olmayan çeşitli B2B şirketleriyle işbirliği yapıyor. Platformunu lisans başına yaklaşık 40.000 ila 50.000 yuan gibi düşük bir maliyetle sağlıyor ve bu da daha büyük şirketlerin çok altında.
Platformu KAF (Bilgi Tabanlı Ajan Fabrikası), büyük model ve Ajan uygulamaları sunmak için bilgi grafiklerini, vektör veritabanlarını ve arama motorlarını kullanıyor. Kullanıcıların istem ve model yönetimi yoluyla kod yazmadan özel bilgi asistanları veya Ajanlar oluşturmasını sağlıyor. Wang, pazarda benzer platformların yaygınlığına dikkat çekerek, kopyalamayı kolaylaştırıyor.
Wang’a göre, bir B2B büyük model uygulaması geliştirmek isteyen bir şirket, küçük bir yetenekli birey ekibi işe alarak veya harici bir yapay zeka şirketiyle ortaklık kurarak hızlı bir şekilde bir ürün oluşturabilir. Bu yaklaşım, büyük bir modeli eğitmekten önemli ölçüde daha ucuzdur.
Platform modeline ek olarak, entegre çözümler donanım, yazılım ve yürütme ortamları sağlayarak kullanıma hazır işlevsellik sunar. Ping An Insurance’da teknoloji platformu grubunun başkanı Zhang Sensen, entegre çözümlerin özellikle sınırlı teknik dağıtım yeteneklerine sahip hükümet ve eğitim kurumları arasında geçerli bir pazarı olduğuna inanıyor. Bu çözümler, veri güvenliği, gizlilik uyumluluğu ve donanım-yazılım optimizasyonu gibi faydalar sunarak kullanım kolaylığına ve teknik özerkliğe öncelik verir. Ayrıca, kısıtlamaları atlayarak ve verimliliği artırarak yerli üretilen çipler kullanabilirler. Maliyete duyarlı ve yatırım getirisine odaklanan şirketler, daha uzun yaşam döngüleri nedeniyle entegre çözümleri cazip bulabilirler.
Yerli SaaS pazarı, tarihsel olarak yüksek özelleştirme gereksinimleri, genel ve homojenize edilmiş ürünler, yoğun rekabet, düşük fiyatlandırma stratejileri ve kısa vadeli para kazanmaya odaklanma gibi zorluklarla karşı karşıya kalmıştır. Bu pazardaki müşteriler genellikle düşük düzeyde dijitalleşmeye ve ödeme isteksizliğine sahiptir.
Buna karşılık, uluslararası SaaS pazarı uzmanlaşmaya vurgu yapar; şirketler belirli alanlara yoğunlaşır ve daha fazla ödeme isteğine sahip büyük ve orta ölçekli müşterilere derinlemesine hizmetler sunar.
Büyük model alanı bu eğilimleri yansıtmaktadır. Uluslararası SaaS pazarındaki son olaylar bunu göstermektedir:
- Şubat 2025’te MongoDB, katıştırma ve yeniden sıralama modellerine odaklanan 17 aylık bir yapay zeka startup’ı olan Voyage AI’yi 220 milyon dolara satın aldı.
- 2024’te Amazon, iki yıllık bir AI Ajan startup’ı olan Adept ile bir teknoloji lisanslama anlaşması duyurdu ve bazı Adept üyeleri Amazon’un AGI ekibine katıldı.
Bu startup’lar, büyük model teknolojisi içinde belirli bir nişe odaklanarak başarıya ulaştı. Bu tür örnekler Çin’de nadirdir. Birçok küçük ve orta ölçekli işletme, daha büyük şirketlerin alanlarına girmesine karşı sürekli olarak tetikte olmalıdır.
Wang Wenguang, B2B pazarındaki kapsamlı deneyiminden yararlanarak, acımasız gerçeklerini anlattı. Tek elden platformlar için büyük bir pazar olmasına rağmen, parçalı olduğunu belirtti. Daha düşük işletme maliyetlerine sahip daha küçük şirketler, rekabetçi fiyatlandırma sunarak daha büyük şirketlerin altında fiyat verebilir. Bu, uygulama hizmetlerinin fiyatını düşürür. Büyük şirketler bile diğer startup’lardan ve geleneksel entegratörlerden rekabetle karşı karşıyadır. Büyük şirketlerin kendi büyük modelleri ve marka avantajları olabilir, ancak benzer B2B iş stratejileriyle karşı karşıyadırlar.
Wang’ın belirttiği gibi, ‘Ben de DeepSeek kullanıyorum ve diğer birçok şirket de DeepSeek kullanıyor, bu yüzden bir farklılaşma yok. Çin’de çok sayıda bulut satıcısı var, bu yüzden en az o kadar rakip olacak. Yerli B2B pazarı her zaman böyle olmuştur; hayatta kalmak için ya güçlü bağlantılara, iyi hizmete ya da düşük fiyatlara sahip olmanız gerekir.’
Liang He, 01.AI’nın mevcut seçimleri ve gelecekteki beklentileri hakkında özlü bir değerlendirme sundu:
- Li Kaifu’nun 01.AI’nın işini tamamen B2B uygulamalarına kaydırma ve tek elden bir kurumsal büyük model platformunu tanıtma kararı ticari olarak sağlam, ancak yoğun rekabete yol açacaktır.
- 01.AI’nın daha büyük şirketlerden daha düşük fiyatlı büyük model ürünleri sunma ihtiyacı, uygulama katmanında benzersiz avantajlarının olmamasının bir sonucudur.
- 01.AI’nın B2B’ye geçişi, bir hayal gücü kaybını ve daha az ‘seksi’ projelerin işaretidir. Bu, 2017’deki yapay zekanın önceki dalgasından birçok bilgisayarlı görme şirketinin kaderine benziyor.
- 01.AI, denizaşırı pazarları keşfederse fırsatları olabilir.
01.AI ile karşılaştırıldığında, Baichuan’ın geleceği hakkındaki görüşler daha az kötümser.
Ancak, Baichuan’ın tıbbi alana girişi, özellikle verilerde benzersiz avantajlardan yoksundur.
Jiang Shao, Baichuan’ın tıbba geçişinin sadece hayatta kalmanın bir yolu olduğunu söyledi. Ancak, 01.AI ile karşılaştırıldığında, Baichuan en azından bir niş pazara girmeye çalışıyor.
Zhang Sensen, tıbbi verileri olan şirketlerin tıbbi büyük modeller geliştirmesi konusunda teknoloji şirketlerinden daha iyimser olduğunu belirtti. Bu, endüstriye özel bir büyük model oluşturmak isteyen herhangi bir şirket için geçerlidir. Tıbbi büyük modeller oluşturmanın temel zorluğu, modelin kendisinde değil, verilerdedir. Çin’de, DeepSeek’i kendi kullanımları için ince ayar yapabilen birçok mükemmel hastane var.
Tıbbi veriler nasıl etkili bir şekilde elde edilebilir? Jiang Shao, yapay zeka teknolojisi startup’larının verilerde avantajlara sahip olmadığını söyledi. Tıbbi büyük modeller oluşturmak için, halihazırda hastanelere BT hizmetleri sağlayan şirketlerle işbirliği yapmaları gerekebilir.
Bildirildiğine göre, ‘Küçük Kaplanlardan’ biri, doktor alışverişlerinden üretilen çok sayıda vakayı kullanarak modeller eğitmek için büyük bir yerli doktor alışveriş forumuyla özel olarak ortaklık kurdu.
Niş pazarlara ilişkin daha iyimser bir bakış açısına ek olarak, endüstri uzmanları Baichuan’ın kurucusu Wang Xiaochuan için umutları var.
Liang He, Wang Xiaochuan’ın tıpta uzmanlaşmada başarılı olup olmamasının, bir idealin peşinde mi koşmak yoksa para mı kazanmak istediğine bağlı olduğuna inanıyor. Wang’ın, çığır açan tıbbi yapay zeka araştırma sonuçları yaratarak bir idealin peşinde koşmaya daha meyilli olduğuna inanıyor.
Wang Wenguang, bu pazarın modasının geçtiğini vurguladı. Kısa vadeli ticarileştirme hedefleniyorsa, tıbbi alanın da genel B2B pazarına benzer şekilde oldukça rekabetçi olduğunu belirtti. Birçok şirket, tıbbi uygulamalar için bilgi grafiklerini, vektör aramalarını ve büyük modelleri kullanabilir.
Zhiwei’nin tıbbi yapay zeka uzmanlarıyla yaptığı görüşmelere göre, tıbbi araştırmanın kendisinde önemli bilgi boşlukları var ve yeni bilgiler hızla artıyor. Bu nedenle, tıbbi temel araştırmalar yapmak için büyük modeller kullanmak için önemli bir potansiyel var. Örneğin, protein yapısı tahmini için AlphaFold modeli, Meis Medical’a göre biyoyinelenebilir malzemeler geliştirmek ve genetik araştırmaları ilerletmek dahil olmak üzere araştırmayı hızlandırmak için dünya çapında 1,8 milyondan fazla bilim insanı tarafından kullanılmıştır.
Bir idealin peşinde koşmak veya para kazanmanın yanı sıra, tıbbi yapay zeka startup’ı genel bir tıbbi büyük model oluşturup oluşturmama sorusuyla da karşı karşıya.
Zhang Sensen, yerli pazarda genel tıbbi büyük modellerde bir atılım olmadığını, bunun temel olarak büyük ölçekli veri toplama ve uygulama için güçlü tıbbi ekipmanlara bağımlılıktan kaynaklandığını belirtti. Çin’deki birçok tıbbi tesis yaygın olarak popüler hale gelmedi ve bu da yapay zekanın doğru teşhisler koymasını zorlaştırıyor. Ancak, Mayo Clinic gibi bazı güçlü hastaneler kendi büyük modellerini başlatmayı keşfetmeye başladı. Kısa vadede kar fırsatları görmek zor olsa da, bu tür büyük modellerin uzun vadede tıp endüstrisi üzerinde derin bir etkisi olabilir.
Tıp endüstrisi ayrıca, özellikle ekipmanın yetersiz olduğu ve yapay zekanın geleneksel teşhis yöntemlerinin yerini tamamen alamadığı yerli pazarda, tam otomatik teşhis zorluğuyla da karşı karşıyadır. Özellikle uzak bölgelerde yaygın tıbbi ekipman eksikliği, tıbbi teknolojiyi tamamen kapsamayı zorlaştırıyor ve bu da tam otomatik teşhisi önemli bir zorluk haline getiriyor.
Tıp endüstrisinin katı lisanslama ve uyumluluk gereksinimleri vardır ve büyük modeller tıbbi alana girerken uyumluluk sorunlarını ele almalıdır. Gelecekteki C-end tıbbi hizmetleri, özellikle genç nesiller için teşhis ve tedavi verimliliğini artırmak amacıyla doktorların tekniklerini ve yapay zekayı birleştirebilir.
Son olarak, yerli B2B pazarının özelliklerini dikkate almadan bile, büyük model uygulamalarındaki rekabet, To B pazarında hayatta kalmayı zorlaştırıyor. Wang Wenguang, büyük model To B ürünleri için tasarım modelleri hala keşfedilirken, sonunda birleşeceklerini belirtti. Bu sadece Çin’de değil, aynı zamanda OpenAI, Anthropic ve Google gibi Silikon Vadisi teknoloji şirketlerinde de geçerlidir. Modellerin performansında önemli bir fark olmadığı sürece, bu pazarda para kazanmak imkansızdır ve sonunda herkes aynı seviyede olacaktır.
Bu nedenle DeepSeek R1’in en büyük etkisi Çin’de değil, özellikle Silikon Vadisiteknoloji şirketleri üzerinde yurt dışında olmuştur. ABD borsası, R1’in piyasaya sürülmesinden sonra yüksek oynaklık yaşamaya ve ardından düşmeye başladı. Temel mantık basittir: Silikon Vadisi’nin büyük modelleri Çin tarafından yakalandı. Onları aşmamakla birlikte, aradaki farkı genişletememe, bu kadar yüksek değerlemeleri desteklemeyi imkansız hale getirdi ve hisse senedi fiyatlarında düşüşe yol açtı.
Elbette, To B pazarının müşteri çekmesinin başka bir yolu daha var: açık kaynak. Açık kaynak için birincil kar modelleri arasında, açık kaynak teknolojisine dayalı kurumsal düzeyde danışmanlık ve eğitim gibi ücretli düzeyde işlevler, bulut barındırma ve katma değerli hizmetler sağlamak yer alır.
Açık kaynaklı büyük modellerin en doğrudan etkisi, teknolojinin popülerleşmesini teşvik etmektir. Zhang Sensen, DeepSeek’in açık kaynağının şirketlerin büyük modelleri uygulamasını önemli ölçüde hızlandırdığını belirtti. Üst yönetim, büyük modellerin uygulamasını çok destekliyor. Büyük modeller pratik uygulamalarda, özellikle insan müdahalesini azaltmada ve verimliliği artırmada iyi performans gösterdiğinden, destek artmaya devam edecektir.
En iyi veri kalitesine sahip endüstri olarak finans sektörü, her zaman yapay zeka alanında zengin teknik birikime sahip olmuştur ve hızlı bir şekilde ayak uydurabilir. DeepSeek’ten bağımsız olarak, finans yapay zeka teknolojisini uygulayacaktır. Ancak, DeepSeek ile yapay zeka sadece finans sektörünün temel işletmelerini etkinleştirmekle kalmayacak, aynı zamanda daha önce yapılması zor olan günlük ofis görevlerinde ve operasyonlarda da kullanılacaktır.
Operasyonlar eskiden çok maliyetliydi. Örneğin, kök neden analizi daha önce geleneksel operasyon izleme ve AIOps’nin yanı sıra küçük modellerin eğitilmesini gerektiriyordu. Şimdi, DeepSeek, izleme, alarmlar, self-servis analiz ve izlenebilirlik, otomatik işleme ve kararlılık iyileştirme için uygulama planları oluşturmak için bilgi tabanlarıyla birlikte kullanılabilir ve AIOps’den daha esnektir.
Ek olarak, yapay zekanın operasyon kapsamı daha geniş hale geldi ve etkileşim ve girişime daha fazla dikkat ediliyor. Girişim, yapay zekanın proaktif olarak operasyonlar gerçekleştirmesine izin vermek anlamına gelir. Kurallara, insanlara veya hatta kişisel deneyime güvenmekten uzaklaşarak, insan deneyiminin seviyesinin operasyon yeteneklerinin seviyesini belirlediği durumlarda, daha hafif yapay zeka modelleri artık bunu doğrudan başarmak için kullanılabilir.
DeepSeek’in halüsinasyon oranı hala yüksek olsa da, diğer benzer modellerden önemli ölçüde farklı olmasa bile, akıl yürütme ve pratik uygulama yetenekleri halüsinasyonların olumsuz etkilerini dengeleyebilir. Bu sorun, RAG ve diğer ilgili teknolojiler kullanılarak ince ayar ve optimizasyon yoluyla kademeli olarak iyileştirilecektir.
Alibaba’nın büyük model teknolojisi uzmanı Gao Peng, DeepSeek’in etkisinin büyük ve küçük şirketler için farklılık gösterdiğine inanıyor:
Alibaba tarafından dahili olarak kullanılan büyük modeller her zaman sektördeki en gelişmiş modeller olmuştur, bu nedenle DeepSeek’in ortaya çıkması önemli bir etkiye sahip olmamıştır. Alibaba, DeepSeek’i performans değerlendirmesi ve karşılaştırması için kullanır ve daha çok teknik bir ilham kaynağı sağlar. DeepSeek’in Akıl Yürütme’deki uygulaması nispeten hızlıdır ve teknik detaylar daha yaygındır. DeepSeek de Qianwen’den etkilenmiştir.
Buna karşılık, DeepSeek’in küçük ve orta ölçekli şirketler üzerinde daha büyük bir etkisi vardır, çünkü daha önce düşük maliyetli, özel dağıtım sağlarken DeepSeek’in etkisini elde edebilecek bir model yoktu. DeepSeek’in piyasaya sürülmesinden sonra, birçok DeepSeek entegre makinesi satan şirket ortaya çıktı. Ancak, DeepSeek, belirli standartlara bağlı olarak birçok açık kaynaklı model entegre makinesine kıyasla en ucuzu değildir.
Her durumda, yerli açık kaynaklı büyük model şu anda gelişiyor ve küresel olarak rekabet edebilir. Ancak, Ping An Insurance’ın büyük modelleri uygulamasına dayanarak, Zhang Sensen, açık kaynaklı büyük modellerin hala aşılmaz sınırlamalara sahip olduğuna inanıyor:
Bizim için DeepSeek öncelikle büyük bir maliyet avantajına sahip. Yetenekler açısından, muhakeme, genelleme yeteneği ve bağlamsal anlayış açısından operasyon senaryolarında diğer modellerden daha iyi olabilir. Ancak, DeepSeek finansal risk kontrolü gibi daha karmaşık senaryolarda iyi performans göstermiyor. Bunun nedeni, daha ayrıntılı ince ayar veya hatta diğer modellerle birlikte optimizasyonun gerekli olmasıdır. Bu nedenle, model performansını daha da iyileştirmek için belirli uygulama senaryolarına dayalı hedeflenen ince ayar gereklidir.
Ping An’ın kendi geliştirdiği büyük modeller iki katmana ayrılmıştır: altta yatan temel büyük model ve bankacılık, sigorta ve diğer işletmelerden sorumlu alan modelleri. Dahili olarak kullanılan büyük modeller, özellikle finans ve tıp gibi belirli alanlarda daha doğru olduğu profesyonel bilgi alanında DeepSeek’ten daha iyi performans gösteriyor. Ancak, DeepSeek’in akıl yürütme yeteneğinde hala güçlü bir avantajı var. Bazı senaryolarda, çalıştırılıp çalıştırılamayacağını görmek için DeepSeek’i küçük ölçekli bir girişim için kullanmak istiyoruz.
Alibaba Qianwen, Baidu Wenxin ve Zhipu ChatGLM ile DeepSeek arasında bu konuda önemli bir fark yok. Karar, bu modellerin akıl yürütme yeteneği ve bilgi tabanı yapısında DeepSeek’ten önemli bir farkı olmaması gerçeğine dayanıyor.
Genel olarak, açık kaynaklı büyük modellerin etkisi şu anda sınırlı ve aralarındaki rekabetin hızı yoğun.
To C Pazarının Tehlikeleri
To B pazarında rekabet şiddetli olsa da, bu To C rotasının daha fazla umut sunduğu anlamına gelmiyor.
Büyük modeller için To C pazarındaki rekabet de çok şiddetli, ancak To B pazarından çok farklı.
Pazar ortamı sürekli değişiyor.
To C’nin para kazanması zor.
En popüler uygulamalar mutlaka en fazla geliri elde etmiyor. Örneğin, ChatGPT en yüksek gelire sahip, ancak OpenAI hala yılda 5 milyar dolar kaybediyor, ChatGPT’nin birçok ‘kopyası’ muhtemelen hızlı karlılığa ulaşmıştır; DeepSeek popüler hale geldikten sonra, taklitçiler ve sahtekarlar akın etti.
Endüstri uzmanlarıyla Zhiwei’nin iletişimi genellikle büyük üreticilerin büyük bir hayatta kalma baskısı getireceğine inanıyor.
Jiang Shao, tüketici pazarında ‘Küçük Kaplanların’ en iyi performans göstereninin Moonshot AI’nın Kimi olduğunu belirtti. Ancak şimdi, Tencent’in Yuanbao’su birinci, DeepSeek ikinci ve Doubao üçüncü sırada. İlk üç şirket pazar payının çoğunu neredeyse işgal ediyor. Tencent’in Yuanbao’su WeChat ekosisteminin yardımıyla çok sayıda müşteri trafiği kazandı, DeepSeek ise teknolojik yeniliği ve birden fazla senaryodaki mükemmel performansıyla öne çıktı.
Liang He, Kimi’nin büyük model teknolojisinin rakiplerinden çok farklı olmadığını, bu nedenle sadece ücretsiz olabileceğini, bu da Moonshot’un ticarileştirmesini çok zorlaştırdığını belirtti. Bir To C uygulaması olarak, Yuanbao ve Doubao’dan nerede farklı olduğu belli değil. Dahası, Doubao, Byte’ın diğer işletmeleri tarafından desteklenebilir ve Yuanbao, Tencent’in diğer işletmeleri tarafından desteklenebilir. Bu uygulamaları desteklemek için 100 milyar yatırım yapabilirler.
Jiang Shao, C-end kullanıcılarının ürün kullanım kolaylığı ile daha fazla ilgilendiğini ve Tencent ve Byte’ın bu konuda daha iyi olduğunu ekledi. Elbette, Alibaba’nın da fırsatları var. Alibaba, kısa video platformunda Douyin’in yerini almayı hedefleyen sohbet ve etkileşim için yapay zeka kullanan ‘AI Dinleme’ adlı bir uygulama geliştiriyor. Douyin, yüksek kaliteli içerik oluşturmak için çok sayıda içerik oluşturucuyu çekse de, yapay zeka sohbet uygulamaları daha kişiselleştirilmiş ve etkileşimli deneyimler sağlayarak kullanıcı gruplarını çekme potansiyeline sahiptir. İkisi arasındaki fark, içerik oluşturma ve etkileşimde yatmaktadır. Alibaba bunu başarabilirse, masaları çevirme şansı da var, ancak Tencent’in de aynısını yapıp yapmayacağını söylemek zor.
MiniMax ile ilgili olarak, endüstri görüşleri biraz farklılık gösteriyor.
Liang He, MiniMax’in Conch AI’sının şu anda iyi kar ettiğine inanıyor. Kendi yolunu buldu, ancak bu yolun MiniMax’in değerlemesini yeterince artırmasına izin verip vermeyeceği henüz bilinmiyor. Uygulama yönelimi nedeniyle, MiniMax DeepSeek çıktıktan sonra daha rahat. DeepSeek’in modellerini kullanırlarsa, modelin araştırma ve geliştirme maliyetlerinden tasarruf edecekler ve uygulamaları para kazanmaya devam edebilir, hatta daha da fazla.
Jiang Shao, MiniMax’in daha sonra popüler bir APP oluşturabilirse şansı olduğuna, ancak Alibaba’nın onu aşabileceğine ve önce popüler bir APP oluşturabileceğine inanıyor, bu yüzden MiniMax’in bir şansı olsa bile, olasılık yüksek değil.
Sonuçta, ürün farklılaşması hala C-end uygulamaları için atılım noktasıdır.
a16z’nin son raporu ‘En İyi 100 Gen AI Tüketici Uygulaması’na göre, düşük kullanımlı birçok uygulama aslında daha iyi gelir elde ediyor. Bitki tanımlama ve beslenme gibi kötü çok yönlülüğe sahip bazı ürünler, genel ürünlerden daha fazla ödeme yapan kullanıcı çekiyor.
Genel yapay zeka ürünlerini farklılaştırmak zordur. Kullanıcıların ödeme istekliliği düşük, kar döngüsü uzun, bu yüzden büyük şirketler hayatta kalamaz.
Ve farklılaşma dikey olarak yeterince derin değilse, temel büyük model tarafından kapasite yükseltmeleri yoluyla içselleştirilmesi de kolaydır. Örneğin, GPT-4o’nun son zamanlardaki görüntü oluşturma yetenekleri, Midjourney gibi metinden görüntüye başlangıçlara boyutsal bir azalma darbesi getirdi. Bu kapsama yeteneği genellikle rastgele ve öngörülemezdir, atasözünün dediği gibi, ‘Sizi yok etmek sizinle ilgisi yok’.
Rakiplerin piksel düzeyinde taklidi ve temel büyük modellerin hızlı yükseltilmesi, C-end yapay zeka başlangıçlarının manzarasının neredeyse her zaman sadece kısa bir süre için korunmasını sağlar.
Son derece düşük bir vuruş olma olasılığını nasıl yakalayacağına gelince, endüstri uzmanları oybirliğiyle ‘takip edilecek temel olarak hiçbir deneyim olmadığına’ inanıyor.
‘Küçük Kaplanlar’ bugünün çıkmazına girdiler, büyük ölçüde temel büyük modele çok fazla yatırım yaptılar ve bu yolda hayatta kalmak ve başarılı olmak için gereken insan gücünü, mali kaynakları ve maddi kaynakları hafife aldılar, bu da uygulama yolunda farklılaşmayı zorlaştırdı.
Şimdi, ‘Küçük Kaplanlar’ AGI’ye saldırmaya giderek daha az kararlı ve Li Kaifu, gelecekte sadece DeepSeek, Ali ve Byte’ın yerli temel büyük modelde kalacağını kamuoyuna açıkladı.
Bu konuda, Zhiwei ile iletişim kuran endüstri uzmanları bu görüşe temelde katılıyor.
Jiang Shao, büyük model teknolojisi üzerinde hala çok çalışan yapay zeka başlangıçlarının temelde ölmesi gerektiğini söyledi. En umut verici olan kesinlikle DeepSeek, ikincisi Alibaba ve üçüncüsü ByteDance. İlk sırada yer alacak olanın trafiğin %50-%80’ini alması bekleniyor ve son iki sırada yer alanlar trafiğin %10’unu alabilir. Çekirdek, önce kimin AGI yapacağı ve nihai kazananın kim olacağıdır.
DeepSeek şu anda büyük modeller alanında en rekabetçi olanıdır ve teknolojik yeniliği ve pratik uygulamalardaki performansı kusursuzdur. Alibaba ve ByteDance da özellikle platformlar arası uygulamalarda ve veri kaynaklarında güçlü bir rekabet gücüne sahiptir. Sıralama, temel teknolojide, bilgi işlem gücünde, veri kaynaklarında ve pratik uygulamalarda her şirketin yenilik yeteneklerine dayanmaktadır.
Zhipu ve Kimi ekipleri, temel modelin yeteneklerini geliştirmeye devam etmenin geleceği olduğuna kesinlikle inanıyor. Buna karşılık, pazar talebindeki değişiklikler ve uygulama senaryolarının çeşitlendirilmesiyle, temel modeli basitçe güçlendirmenin yolunun sınırlı olabileceğine ve daha esnek ve uyarlanabilir model geliştirme yollarının pazarda daha rekabetçi olabileceğine inanıyorum.
Büyük model teknolojisindeki rekabet son derece şiddetli ve büyük yatırımlara sahip şirketlerin sonunda rekabet gücünü korumak için yenilik, bilgi işlem, veri ve optimizasyonda net atılımlara sahip olması gerekiyor. Teknolojik ilerlemeye ayak uyduramayan veya pazar talebini karşılayamayan diğer şirketler yavaş yavaş ortadan kaldırılacaktır.
Liang He, gelecekte sadece DeepSeek, Ali ve Byte’ın yerli temel büyük model şirketinde kalacağını, bunun da bu üçünün araştırma ve geliştirmeye süper kaynaklar yatırma gücüne ve kararlılığına sahip olmasına dayandığını söyledi. Byte için büyük modeller için fırsatı kaçırmak imkansız, aksi takdirde genel olarak büyük bir etkisi olacak. Ve DeepSeek’in teknolojisinin Byte için çok fazla engeli olmayacak, ancak DeepSeek’in şu anda Ar-Ge verimliliğinde daha büyük bir avantajı var. Alibaba’nın Qianwen açık kaynak modeli kendisi yüksek bir seviyede. DeepSeek popüler hale gelmeden önce, Qianwen ve Llama temelde birbirini kovalıyordu. Alibaba için Qianwen modeli para kazanamayabilir, ancak ilgili bulut işletmeleri para kazanabilir ve Byte benzerdir ve Douyin ve diğer Uygulamaların deneyimini sürekli olarak optimize etmek için büyük model teknolojisini kullanmaya devam edebilir. Yapay zeka başlangıçları için modelin kendisi para kazanmazsa, hayatta kalmanın köküne dokunur.
Wang Wenguang, DeepSeek’in avantajının esas olarak teknolojik idealizmde yattığını söyledi. Bahar Şenliği’nden önceki ve sonraki iki veya üç ay içinde DeepSeek’in trafiği çok büyüktü. Ticarileştirmek isteseydi, yakında dünyada zirveye ulaşacak ve Doubao gibi diğer büyük modellerin hiç şansı olmayacaktı. DeepSeek, son açık kaynak haftasında altyapı ile ilgili optimizasyon yöntemlerini açık kaynaklı hale getirmediği sürece, gelecekte bundan para kazanmaya güvenebilir, böylece başkalarının şansı olmaz. DeepSeek finanse edilmedi ve yatırımcılardan etkilenmesi gerekmiyor. Teknolojik idealizm ve yetenek en büyük engellerdir. OpenAI ile karşılaştırıldığında, OpenAI’nin şimdi görebileceği sonuçlar temelde Altman ve Ilya arasındaki anlaşmazlıktan önceki araştırma sonuçlarıdır. En azından yenilik noktaları belirlendi. Şimdi, orijinal idealist ekibin ayrılmasından sonra, OpenAI’nin kendisinde neredeyse hiç yenilik yok. Şu anda, OpenAI’nin yeniliği daha çok Deep Research gibi uygulama düzeyinde. Uygulama düzeyinde yeniliğin hiçbir engeli yoktur, bu yüzden rakiplerle rekabet etmek zorundadır.
Büyük bir fabrika yapay zeka teknolojisi uzmanı olan Wang Mu, Zhiwei’ye para, yetenek ve donanım olmadığı sürece, büyük modellerin ön eğitimine çaba harcamaya gerek olmadığını söyledi. DeepSeek’in 2021 gibi erken bir tarihte 10.000 kartlık bir kümesi vardı ve parası yok. Buna karşılık, diğer küçük ve orta ölçekli şirketler bu koşulu zar zor bir araya getirebilir.
Gao Peng, yapay zeka başlangıçlarının hayatta kalmak için hala uygulamalara yönelmesi gerektiğini belirtti. Bir veya iki yıl önce böyle düşünüyordum ve şimdi yönelmek için çok geç olabilir. Bir sonraki elenecek yapay zeka şirketleri, temel büyük modeller yapanlar olacak. Büyük model eğitimi aslında çok karmaşık ayrıntılara sahip ve deneyim birikimine çok bağımlı. Transformer mimarisinin iç detayları genellikle iyi anlaşılıyor, ancak açık kaynaklı veya kapalı kaynaklı modellerin makaleleri temelde verilerin nasıl hazırlandığını, veri ayrıntılarının neler olduğunu, veri ölçeğinin ne kadar büyük olduğunu ve veri kalitesinin ne kadar iyi olduğunu söylemiyor. Sektörde birleşik bir standart yok.
Açık kaynaklı açık yarı her zaman büyük model yolunda tipik bir uygulamadır. Şu anda, kodu, ağırlıkları, veri kümelerini ve eğitim sürecini tamamen açıklayacak çok az büyük model var. En iyi bilinenler OLMo, BLOOM vb.
Ancak, uygulamalara dönmek bile hayatta kalabilir mi? To B yolu ve To C yolunun önceki analizinden, yapay zeka başlangıçlarının uygulamalarda kendi endüstri engellerini oluşturması neredeyse zordur. Bu konuda Gao Peng, kendi endüstri engellerinizi oluşturmanın anahtarının hangi verilere sahip olduğunuzda yattığını belirtti. Modeller herkes tarafından kullanılabilir. Veriler iki yönlüdür: biri girişimcinin alan deneyimi, diğeri ise eldeki veriler.
Kurumsal kültür açısından, Gao Peng, temel büyük modellerin araştırılması ve geliştirilmesinin deneysel ve mühendislik sıkı çalışma ruhu gerektirdiğine inanıyor. “Daha önce uzun süre boyunca, birçok yerli yapay zeka başlangıcı çok yüksek profilliydi. Teknoloji yaparken, önce düşük profilli bir şekilde yapmalı ve ardından yüksek profilli bir şekilde tanıtmalısınız. Bazı ekipler daha çok akademiden oluşuyor, ancak akademideki insanlar bazen teknolojiyi çok teorik olarak inceliyor. Yetenek veya ekip açısından, büyük bir model ekibinin başarısı esas olarak patronun büyük modelleri anlayıp anlamadığına bağlıdır. Patron büyük model teknolojisini anlamıyorsa veya sebat etme inancına sahip değilse, çünkü para kazanmıyor, hiç işe yaramaz. DeepSeek’in başarısı daha çok yukarıdan aşağıya bir organizasyon moduna dayanıyor. Patron teknik detayları çok iyi anlıyor ve herkesi birlikte yapmaya yönlendiriyor. Bu modele uyan çok az yerli model var.”
Sektörün yerli temel büyük modelin nihai kazanan tahmini konusundaki hararetli tartışmasıyla ilgili olarak Gao Peng, bu kararın çok erken olduğuna inanıyor. “Rekabete katılabilecek oyuncuların teknik yollarında çok fazla fark olmayacak. Sadece Transformer mimarisini takip edin ve ayrıntılı optimizasyon yapın. Mamba ve RWKV’nin de umudu var. Önemli olan işleri istikrarlı bir şekilde yapmaktır ve zaman her şeyi kanıtlayacaktır. Nihai kazanan ve ilk üçü söylemek kolay değil. Büyük model teknoloji yığını çok karmaşık bir şey ve sessizce bir şey yapan ama zamanı henüz gelmemiş birçok insan olup olmadığını kim bilebilir.”
Model kazananının yargılanmasının zor olduğu mevcut durumda, veriler en önemli hendek haline geldi. Sequoia Capital’de bir ortak olan Konstantine Buhler, OpenAI’nin ChatGPT’de yaptığı bir hatanın, geri bildirim döngüsünde daha yüksek kaliteli veriler sağlayabilecek ve daha derin bir hendek oluşturabilecek yanıtları düzenlemeye izin vermemek olduğunu söyledi.
Verilerin