Çin’in yapay zeka alanındaki, özellikle DeepSeek-R1’in piyasaya sürülmesiyle kaydettiği son ilerlemeler küresel çapta dikkat çekerken, Tayvan farklı bir rota çiziyor; bu rota, kendine özgü kültürel kimliğini ve demokratik değerlerini yansıtan dil modellerinin geliştirilmesine öncelik veriyor. Bu girişim, otoriter rejimlerden etkilenen AI sistemlerine karşı bir denge oluşturmayı amaçlıyor.
DeepSeek Meydan Okuması
DeepSeek-R1’in Ocak ayında tanıtılması, teknoloji camiasında önemli bir ilgi uyandırdı. Baidu’nun Ernie’si ve ByteDance’in Doubao’su gibi önceki Çince dil modelleri, Çince dil uygulamalarında, matematikte ve kodlamada umut vaat etti, ancak daha zayıf İngilizce yeterliliği ve kısıtlı erişilebilirlik ile sınırlıydı. Bununla birlikte DeepSeek-R1, uluslararası alanda tanınan ilk Çin LLM’si olarak önemli bir kilometre taşı oldu.
DeepSeek-R1’in en dikkat çekici yönlerinden biri, bildirildiğine göre düşük geliştirme maliyetiydi. İddiaya göre eğitilmesi 100 milyon ABD dolarının üzerinde bir maliyeti olan OpenAI’ın GPT-4o’sunun aksine, DeepSeek araştırmacıları chatbot’larının sadece 5,6 milyon ABD dolarına geliştirildiğini iddia etti. Verimlilik anlatısını daha da körükleyen DeepSeek mühendisleri, R1 modelini GPT-4o veya Anthropic’in Claude’u gibi modellerde kullanılan en üst düzey çipler yerine Nvidia H800 gibi orta sınıf CPU’lar kullanarak eğitti. ABD’nin Çin’e yüksek performanslı çip ihracatına getirdiği kısıtlamalara rağmen, DeepSeek-R1, 256 sunucuya yayılmış sadece 2.048 işlemci kullanarak diğer önde gelen botlardan daha iyi performans göstermeyi başardı.
Bu olağanüstü verimlilik ve daha düşük geliştirme maliyeti, büyük ölçüde geliştiricilerin performansı ince ayar yapmasına ve donanım kullanımını en üst düzeye çıkarmasına olanak tanıyan montaj benzeri bir dil olan PTX dahil olmak üzere gelişmiş programlama tekniklerine atfedildi.
Piyasaya sürülmesinden kısa bir süre sonra DeepSeek-R1 uygulaması, ABD Apple App Store’un ücretsiz indirme sıralamasında zirveye yükselerek ChatGPT, TikTok ve Meta’nın sosyal medya platformlarını geride bıraktı. Nasdaq’ta bir düşüş yaşandı ve DeepSeek-R1’in piyasaya sürülmesinin ardından Nvidia’nın hisseleri düştü.
DeepSeek’in İddialarını Sorgulamak
İlk coşkuya rağmen, birçok gözlemci DeepSeek’in LLM’si ile ilgili iddialarının geçerliliği hakkında sorular gündeme getirdi. Analistler, belirtilen rakamların muhtemelen yalnızca bilgi işlem maliyetlerini hesaba kattığını, altyapı, donanım ve insan kaynağı giderlerini hariç tuttuğunu veya düşük gösterdiğini öne sürdü.
Taipei merkezli üretken AI ve bulut oyun hizmeti sağlayıcısı Ubitus’un kurucusu ve CEO’su Wesley Kuo, bildirilenin aksine gerçek maliyetin muhtemelen çok daha yüksek olduğunu belirterek bu endişeleri yineledi. Nvidia’nın desteğiyle Ubitus, geleneksel Çince karakterler kullanan yerelleştirilmiş bir LLM olan Project TAME’yi destekledi. H100 CPU’ları ve oyun verileri sağladılar. Ubitus ayrıca, Asus ile işbirliği içinde Tayvan’ın en büyük yeşil enerjiyle çalışan AI süper bilgisayar hizmet merkezini kurmak için Foxlink ve Shinfox Energy ile işbirliği yaparak Ubilink.AI’yı kurdu.
Kuo, şirketin oyun, turizm ve perakende gibi sektörlerde Japon hükümeti de dahil olmak üzere hükümetler için LLM uygulamaları ve modelleri geliştirme konusundaki rolünü vurgularken, AI’nın iş gücü kıtlığını ve yaşlanan nüfusu ele alma potansiyelini vurguluyor.
Veri Bütünlüğü Endişeleri
Kuo, DeepSeek’in model damıtma yoluyla veri elde etmiş olabileceği konusunda OpenAI ve Microsoft ile aynı görüşte. Bu süreç, daha büyük modellerin çıktılarını taklit etmek için daha küçük dil modellerinin eğitilmesini içerir. OpenAI ve Microsoft, DeepSeek’in gelişimini kolaylaştırmak için OpenAI’ın uygulama programlama arayüzünü kullandığını iddia ediyor.
Kuo, DeepSeek’in OpenAI’den veri elde ettiğini ve şirketin verimlilikle ilgili iddiaları hakkında yanlış anlaşılmalar olduğunu savunuyor. DeepSeek-R1’in 670 milyar parametresiyle Meta AI’nın Llama 3.1 405B’sinden önemli ölçüde daha büyük olduğunu belirtiyor. Parametreler, bir modelin tahminlerde bulunmak için eğitim sırasında öğrendiği dahili sayısal değerlerdir. Kuo ayrıca DeepSeek’in modellerinin Llama 3.1’den damıtılmış olabileceğini öne sürüyor.
Bu itirazların ötesinde, DeepSeek-R1’in yetenekleriyle ilgili endişeler de ortaya çıktı. Uzmanlar, selefleri gibi R1’in de özel, göreve özgü işlevlerde mükemmel olduğunu, ancak genel amaçlı performansta GPT-4o sürümlerinin gerisinde kaldığını öne sürüyor.
DeepSeek’in modellerinin en büyük sınırlaması, bilgilere ücretsiz erişim üzerindeki kısıtlamadır. Kullanıcılar, hassas siyasi konularla ilgili soruların kaçamak yanıtlarla karşılandığını keşfetti. Sincan’daki Uygur azınlığı ve Tayvan gibi konularda DeepSeek’in yanıtları, Çin Komünist Partisi’nin resmi pozisyonlarını yansıtıyor. Araştırmalar, DeepSeek’in çıktılarının önemli bir bölümünün demokrasi, insan hakları ve Çin’in tartışmalı egemenlik iddialarıyla ilgili bilgileri bastırmak için sansürlendiğini gösteriyor.
Tayvan’ın Alternatifi: TAIDE ve Ötesi
Buna karşılık, TAME gibi Tayvan tarafından geliştirilen LLM’ler, Sinosphere içinde DeepSeek’e alternatif olarak ortaya çıktı. Ulusal Uygulamalı Araştırma Enstitüsü tarafından Haziran 2023’te başlatılan Trustworthy AI Dialogue Engine (TAIDE), Tayvan’ın sosyal, kültürel ve dilbilimsel normlarına uygun bir model geliştirmeyi amaçlıyor.
TAIDE üzerindeki çalışmalar durmuş gibi görünse de, Project TAME için önemli bir ölçüt görevi gördü. Çeşitli kuruluşlardan fon alan Ulusal Tayvan Üniversitesi’ndeki Machine Intelligence and Understanding Laboratory (MiuLab) tarafından geliştirilen TAME, 500 milyar belirteç üzerinde eğitildi. Üniversite giriş, baro ve geleneksel Çin tıbbı sınavlarında daha yüksek puanlar alarak GPT-4o da dahil olmak üzere rakiplerinden 39 değerlendirmede daha iyi performans gösterdi.
TAME’in hedeflerinden biri yerel kültürü tanıtmaktır. Yerel dil yeteneklerinin kilidini açmak önemli bir adımdır. Kuo, Whisper tabanlı Tayvanlı bir ses LLM’sinin geliştirilmesinden bahsediyor ve bunun sözlü Tayvancayı anlamada olumlu sonuçlar elde ettiğini belirtiyor. Hakka dil tanımayı geliştirmek için çalışmalar devam ediyor.
Bu çabalar, bu dillerin yaygın olduğu bölgelerdeki kurumlar tarafından memnuniyetle karşılandı. Modeli yerli dil tanımada eğitmek için de çabalar var, ancak sınırlı veri bir engel olmaya devam ediyor. Bir AI’yı yeni bir dil öğrenmesi için eğitmek, metinle eşleştirilmiş önemli miktarda ses kaydı gerektirir.
Hükümet arşivlerindeki tarihi verilere erişmek başka bir fırsat sunuyor. Ancak bazı veriler telif hakkıyla korunuyor. Yapay genel zekanın ortaya çıkışı, tehlike altında olan ve soyu tükenmiş dillerin yeniden canlandırılmasına yardımcı olma potansiyeli sunuyor.
Yapay Zeka Egemenliği Arayışı
Dil ve kültürün kesişimi, Tayvan kimliğini güçlendirmenin, Tayvan’ın anlatısını iletmenin ve bilgi ortamını korumanın bir yolu olarak AI egemenliğinin önemini vurguluyor.
Sektör danışmanı ve Market Intelligence & Consulting Institute (MIC) direktörü Julian Chu, LLM modellerinde ve eğitim verilerinde önyargı potansiyelini vurguluyor. Geleneksel karakterler kullanırken bile LLM çıktılarının Çin Halk Cumhuriyeti’nin tarzını yansıtabileceğini ve Tayvan kültürünü yakalayamayabileceğini belirtiyor. Amaç, Tayvanlı şirketlerin LLM’leri eğitmek ve AI egemenliğini inşa etmek için Tayvan dili veya verilerini kullanmasıdır.
Chu, bir diğer umut verici Tayvan LLM’si olarak Formosa Foundation Model’den (FFM-Llama2) bahsediyor. Eylül 2023’te Taiwan Web Service tarafından piyasaya sürülen model, AI’yı demokratikleştirmeyi amaçladı. Foxconn ayrıca Mart ayında LLM’si FoxBrain’i piyasaya sürdü. Ancak bazı yorumcular büyük şirketlerin LLM’lere yönelik girişimlerine şüpheyle yaklaşıyor.
TAME’yi geliştiren MiuLab ekibinin bir üyesi olan Lin Yen-ting, Tayvan ile ilgili bilgi ortamındaki boşluğu ele alma ihtiyacını vurguluyor. DeepSeek-R1 ve diğer Çin LLM’lerinin Tayvan hakkında çarpıtılmış bir görüş sunduğunu belirtiyor. ABD tarafından geliştirilen modeller de bazen Tayvan’ı yanlış temsil edebiliyor. Açık kaynaklı modeller Tayvan’a öncelik vermeyebilir ve eğitim verilerine Çin hakimdir.
Bu nedenle Tayvan içeriğini seçici olarak dahil etmek ve modele yeniden eğitmek önemlidir. Bu proaktif yaklaşım, Tayvan’ın benzersiz kültürel ve dilbilimsel manzarasının dijital alanda doğru bir şekilde temsil edilmesini sağlayarak ulusal kimlik duygusunu teşvik ediyor ve küresel AI gelişiminin karşısında farklı mirasını koruyor. Tayvan kimliğini korumaya yönelik bu adanmışlık, ada ülkesinin benzersiz kültürünün ve değerlerinin baskın anlatılar tarafından gölgede bırakılmamasını sağlıyor.
Bu girişimde doğasında var olan zorluklar önemli. Gerçekten temsil edici bir AI modeli oluşturmak, yerel içerikten oluşan geniş veri kümelerine erişim ve doğal dil işleme uzmanlığı da dahil olmak üzere önemli bir kaynak yatırımı gerektiriyor. Ayrıca, yanlış bilgilendirme ve önyargılı bilgilere karşı koyma konusundaki devam eden ihtiyaç, sürekli bir iyileştirme ve uyum süreci gerektiriyor.
Bu zorluklara rağmen, Tayvan’ın AI egemenliğine olan bağlılığı sarsılmaz olmaya devam ediyor. TAME ve diğer yerelleştirilmiş LLM’lerin geliştirilmesi, yapay zekanın geleceğinin adanın benzersiz kültürel kimliğini, demokratik değerlerini ve dünyadaki farklı yerini koruma konusundaki sarsılmaz bağlılığını yansıtmasını sağlamaya yönelik önemli bir adımı temsil ediyor. Tayvan, AI egemenliğine öncelik vererek yalnızca kültürel mirasını korumakla kalmıyor, aynı zamanda teknolojik ilerlemenin kültürel kimliğin ve demokratik ilkelerin korunmasıyla uyumlu olabileceğini göstererek küresel AI ortamında önemli bir oyuncu olarak konumunu da sağlamlaştırıyor.
Yolculuğa Devam Etmek
Tam AI egemenliğine giden yolculuk devam ediyor. Zorlukların üstesinden gelmek ve bu girişimlerin uzun vadeli başarısını sağlamak için daha fazla araştırma, geliştirme ve işbirliği çok önemlidir. Tayvan, AI egemenliğine öncelik vermeye devam ederek benzersiz kültürel kimliğini ve demokratik değerlerini gerçekten yansıtan bir dijital manzara yaratabilir ve giderek birbirine bağlı bir dünyada farklı yerlerini korumaya çalışan diğer uluslara örnek teşkil edebilir.