Ant, Çin Çipleriyle Yapay Zekayı Geliştiriyor

Ant’ın Yapay Zeka Modeli Eğitimine Yenilikçi Yaklaşımı

Jack Ma tarafından desteklenen fintech devi Ant Group, Çin yapımı yarı iletkenlerden yararlanarak yapay zekada önemli bir atılım gerçekleştirdi. Bu yenilikçi yaklaşım, şirketin yapay zeka modellerini eğitmek için teknikler geliştirmesini sağlayarak maliyetlerde %20’lik dikkate değer bir azalma sağladı. Konuyla ilgili bilgi sahibi kaynaklar, Ant’ın, bağlı kuruluşu Alibaba Group Holding Ltd. ve Huawei Technologies Co.’nun da dahil olduğu yerli çipleri, Mixture of Experts (MoE) makine öğrenimi yaklaşımını kullanarak modelleri eğitmek için kullandığını ortaya koydu.

Ant tarafından elde edilen sonuçlar, ABD tarafından Çin’e ihracatı kısıtlanan güçlü bir işlemci olan H800 gibi Nvidia Corp. çipleri kullanılarak elde edilenlerle karşılaştırılabilirdi. Ant, yapay zeka geliştirme için Nvidia’yı kullanmaya devam ederken, en son modelleri için Advanced Micro Devices Inc. (AMD) ve Çin çipleri de dahil olmak üzere alternatiflere giderek daha fazla güveniyor.

Yapay Zeka Yarışına Giriş: Çin ve ABD

Ant’ın yapay zeka modeli geliştirme alanına girmesi, onu Çinli ve ABD’li şirketler arasındaki hararetli bir rekabetin tam ortasına yerleştiriyor. Bu yarış, DeepSeek’in, milyarlarca yatırım yapan OpenAI ve Alphabet Inc.’s Google gibi sektör devlerinin katlandığı maliyetin çok altında, son derece yetenekli modelleri eğitme potansiyelini göstermesinden bu yana yoğunlaştı. Ant’ın başarısı, Çinli şirketlerin en gelişmiş Nvidia yarı iletkenlerine yerel kaynaklı alternatifler kullanma konusundaki kararlılığının altını çiziyor.

Uygun Maliyetli Yapay Zeka Çıkarımının Vaadi

Ant tarafından bu ay yayınlanan araştırma makalesi, modellerinin potansiyelini vurgulayarak, Meta Platforms Inc.’e kıyasla belirli kıyaslamalarda üstün performans iddia ediyor, ancak bu iddialar Bloomberg News tarafından bağımsız olarak doğrulanmadı. Bununla birlikte, Ant’ın platformları reklamı yapıldığı gibi performans gösterirse, Çin yapay zeka gelişiminde önemli bir ilerlemeyi temsil edebilirler. Bunun başlıca nedeni, yapay zeka hizmetlerini destekleme süreci olan çıkarım maliyetini önemli ölçüde azaltma yetenekleridir.

Mixture of Experts: Yapay Zekada Oyun Değiştirici

Şirketler yapay zekaya önemli kaynaklar ayırdıkça, MoE modelleri popüler ve verimli bir yaklaşım olarak öne çıktı. Google ve Hangzhou merkezli startup DeepSeek gibi şirketler tarafından kullanılan bu teknik, görevleri daha küçük veri kümelerine bölmeyi içeriyor. Bu, her biri bir işin belirli bir bölümüne odaklanan ve böylece genel süreci optimize eden bir uzman ekibine sahip olmaya benziyor.

GPU Darboğazının Aşılması

Geleneksel olarak, MoE modellerinin eğitimi, Nvidia tarafından üretilen grafik işleme birimleri (GPU’lar) gibi yüksek performanslı çiplere büyük ölçüde dayanıyordu. Bu çiplerin engelleyici maliyeti, birçok küçük firma için büyük bir engel olmuştur ve MoE modellerinin yaygın olarak benimsenmesini sınırlamıştır. Ancak Ant, büyük dil modellerini (LLM’ler) daha verimli bir şekilde eğitmek için yöntemler üzerinde özenle çalışıyor ve bu kısıtlamayı etkili bir şekilde ortadan kaldırıyor. ‘Premium GPU’lar olmadan bir modeli ölçeklendirme’ hedefini belirleyen araştırma makalelerinin başlığı, bu amacı açıkça yansıtıyor.

Nvidia’nın Hakimiyetine Meydan Okumak

Ant’ın yaklaşımı, Nvidia’nın CEO’su Jensen Huang tarafından savunulan hakim stratejiye doğrudan meydan okuyor. Huang, DeepSeek’in R1’i gibi daha verimli modellerin ortaya çıkmasıyla bile hesaplama talebinin artmaya devam edeceğini sürekli olarak savundu. Şirketlerin maliyetleri düşürmek için daha ucuz çipler yerine, daha yüksek gelir elde etmek için daha iyi çiplere ihtiyaç duyacağına inanıyor. Sonuç olarak, Nvidia, gelişmiş işlem çekirdekleri, transistörler ve artırılmış bellek kapasitesine sahip büyük GPU’lar inşa etmeye odaklanmaya devam etti.

Maliyet Tasarruflarının Sayısallaştırılması

Ant, optimize edilmiş yaklaşımının maliyet etkinliğini göstermek için somut rakamlar sağlamıştır. Şirket, yüksek performanslı donanım kullanarak 1 trilyon token eğitmenin yaklaşık 6,35 milyon yuan’a (880.000 $) mal olacağını belirtti. Ancak, daha düşük özellikli donanım ve optimize edilmiş tekniklerini kullanan Ant, bu maliyeti 5,1 milyon yuan’a düşürebilir. Tokenler, bir modelin dünya hakkında bilgi edinmek ve kullanıcı sorgularına ilgili yanıtlar sağlamak için işlediği bilgi birimlerini temsil eder.

Endüstriyel Çözümler için Yapay Zeka Atılımlarından Yararlanma

Ant, sağlık ve finans gibi sektörler için endüstriyel yapay zeka çözümleri geliştirmek için özellikle Ling-Plus ve Ling-Lite olmak üzere büyük dil modellerindeki son gelişmelerinden yararlanmayı planlıyor. Bu modeller, belirli endüstri ihtiyaçlarını karşılamak ve özel çözümler sunmak için tasarlanmıştır.

Sağlık Hizmetlerinde Genişleyen Yapay Zeka Uygulamaları

Ant’ın sağlık hizmetlerine olan bağlılığı, Çin çevrimiçi platformu Haodf.com’u yapay zeka hizmetlerine entegre etmesinde açıkça görülmektedir. AI Doctor Assistant’ın oluşturulması yoluyla Ant, Haodf’un 290.000 doktordan oluşan geniş ağını tıbbi kayıt yönetimi gibi görevlerde yardımcı olarak desteklemeyi amaçlamaktadır. Yapay zekanın bu uygulaması, sağlık hizmetlerinde verimliliği ve doğruluğu önemli ölçüde artırma potansiyeline sahiptir.

Günlük Yaşam için Yapay Zeka Destekli Yardım

Sağlık hizmetlerinin ötesinde, Ant ayrıca Zhixiaobao adlı bir yapay zeka ‘yaşam asistanı’ uygulaması ve Maxiaocai adlı bir finansal danışmanlık yapay zeka hizmeti geliştirdi. Bu uygulamalar, Ant’ın yapay zekayı günlük yaşamın çeşitli yönlerine entegre etme ve kullanıcılara kişiselleştirilmiş ve akıllı yardım sağlama tutkusunu göstermektedir.

Performans Kıyaslaması: Ling Modelleri ve Rakipleri

Araştırma makalesinde Ant, Ling-Lite modelinin, İngilizce dil anlayışı için önemli bir kıyaslamada Meta’nın Llama modellerinden birinden daha iyi performans gösterdiğini iddia ediyor. Ayrıca, hem Ling-Lite hem de Ling-Plus modelleri, Çince dil kıyaslamalarında DeepSeek’in eşdeğerlerine kıyasla üstün performans gösterdi. Bu, Ant’ın yapay zeka alanındaki rekabetçi konumunu vurgulamaktadır.

Pekin merkezli yapay zeka çözüm sağlayıcısı Shengshang Tech Co.’nun baş teknoloji sorumlusu Robin Yu’nun yerinde bir şekilde belirttiği gibi, “Dünyanın en iyi kung fu ustasını yenmek için bir saldırı noktası bulursanız, yine de onları yendiğinizi söyleyebilirsiniz, bu yüzden gerçek dünya uygulaması önemlidir.”

İşbirliği ve İnovasyon için Açık Kaynak

Ant, Ling modellerini açık kaynaklı hale getirerek yapay zeka topluluğu içinde işbirliğini ve yeniliği teşvik etti. Ling-Lite, modelin performansını kontrol eden ayarlanabilir ayarlar olan 16,8 milyar parametreden oluşur. Öte yandan Ling-Plus, önemli ölçüde daha büyük 290 milyar parametreye sahiptir ve onu daha büyük dil modelleri arasına yerleştirir. Bağlam sağlamak gerekirse, uzmanlar ChatGPT’nin GPT-4.5’inin yaklaşık 1,8 trilyon parametreye sahip olduğunu, DeepSeek-R1’in ise 671 milyar parametreye sahip olduğunu tahmin ediyor.

Model Eğitimindeki Zorlukların Ele Alınması

Ant’ın bu modelleri geliştirme yolculuğu zorluklardan yoksun değildi. Şirket, eğitimin belirli alanlarında, özellikle kararlılık konusunda zorluklarla karşılaştı. Donanımda veya modelin yapısında yapılan küçük değişiklikler bile, modellerin hata oranındaki dalgalanmalar da dahil olmak üzere sorunlara yol açabilir. Bu, gelişmiş yapay zeka modellerini eğitmenin karmaşıklığını ve hassasiyetini vurgulamaktadır.

Sağlık Hizmetlerinde Gerçek Dünya Dağıtımı

Ant’ın pratik uygulamalara olan bağlılığı, sağlık hizmetlerine odaklı büyük model makinelerini dağıtmasıyla daha da kanıtlanmıştır. Bu makineler şu anda Pekin ve Şanghay gibi büyük şehirlerde yedi hastane ve sağlık hizmeti sağlayıcısı tarafından kullanılmaktadır. Büyük model, tıbbi danışmanlık hizmetleri sağlamak için DeepSeek R1, Alibaba’nın Qwen’i ve Ant’ın kendi LLM’sinden yararlanır.

Gelişmiş Sağlık Hizmetleri için Yapay Zeka Temsilcileri

Büyük model makinelerine ek olarak, Ant iki tıbbi yapay zeka temsilcisi tanıttı: Angel ve Yibaoer. Angel halihazırda 1.000’den fazla tıbbi tesise hizmet verirken, Yibaoer tıbbi sigorta hizmetleri için destek sağlıyor. Ayrıca, Ant geçen yılın Eylül ayında Alipay ödeme uygulaması içinde AI Healthcare Manager hizmetini başlatarak sağlık sektöründeki erişimini daha da genişletti. Bu girişimler, Ant’ın sağlık hizmetlerini dönüştürmek ve iyileştirmek için yapay zekadan yararlanma konusundaki kararlılığını göstermektedir.