Mengejar Kedaulatan AI: Respons Taiwan terhadap DeepSeek | ms

Walaupun kemajuan China baru-baru ini dalam kecerdasan buatan, terutamanya dengan pelancaran DeepSeek-R1, telah menarik perhatian global, Taiwan sedang mencartakan haluan yang berbeza, satu yang mengutamakan pembangunan model bahasa yang mencerminkan identiti budaya dan nilai-nilai demokratiknya yang unik. Usaha ini bertujuan untuk mewujudkan pengimbang kepada sistem AI yang dipengaruhi oleh rejim autoritarian.

Cabaran DeepSeek

Pembukaan DeepSeek-R1 pada bulan Januari mencetuskan minat yang besar dalam komuniti teknologi. Model bahasa Cina sebelumnya, seperti Ernie Baidu dan Doubao ByteDance, menunjukkan janji dalam aplikasi bahasa Cina, matematik, dan pengekodan, tetapi dihadkan oleh kecekapan bahasa Inggeris yang lebih lemah dan kebolehcapaian terhad. DeepSeek-R1, bagaimanapun, menandakan satu pencapaian penting sebagai LLM Cina pertama yang mendapat pengiktirafan antarabangsa.

Salah satu aspek yang paling ketara dari DeepSeek-R1 adalah kos pembangunannya yang dilaporkan rendah. Berbeza dengan GPT-4o OpenAI, yang didakwa menelan belanja lebih daripada AS$100 juta untuk dilatih, para penyelidik DeepSeek mendakwa chatbot mereka dibangunkan dengan hanya AS$5.6 juta. Lebih jauh lagi mendorong naratif kecekapan, jurutera DeepSeek melatih model R1 menggunakan CPU kelas pertengahan seperti Nvidia H800, dan bukannya cip peringkat atas yang digunakan dalam model seperti GPT-4o atau Claude Anthropic. Walaupun terdapat sekatan A.S. ke atas pengeksportan cip berprestasi tinggi ke China, DeepSeek-R1 berjaya mengatasi bot terkemuka lain dengan hanya menggunakan 2,048 pemproses yang tersebar di 256 pelayan.

Kecekapan yang luar biasa dan kos pembangunan yang lebih rendah ini sebahagian besarnya disebabkan oleh teknik pengaturcaraan yang canggih, termasuk PTX, bahasa seperti pemasangan yang membolehkan pembangun memperhalusi prestasi dan memaksimumkan penggunaan perkakasan.

Tidak lama selepas dikeluarkan, aplikasi DeepSeek-R1 melonjak ke bahagian atas ranking muat turun percuma Apple App Store A.S., mengatasi ChatGPT, TikTok, dan platform media sosial Meta. Nasdaq mengalami penurunan, dan saham Nvidia menjunam berikutan debut DeepSeek-R1.

Mempersoalkan Tuntutan DeepSeek

Walaupun terdapat semangat awal, banyak pemerhati telah membangkitkan persoalan mengenai kesahihan tuntutan DeepSeek mengenai LLMnya. Penganalisis telah mencadangkan bahawa angka yang dinyatakan mungkin hanya mengambil kira kos pengkomputeran, sambil mengecualikan atau mengecilkan infrastruktur, perkakasan, dan perbelanjaan sumber manusia.

Wesley Kuo, pengasas dan CEO Ubitus, penyedia perkhidmatan permainan awan dan AI generatif yang berpangkalan di Taipei, menyuarakan kebimbangan ini, menyatakan bahawa kos sebenar mungkin jauh lebih tinggi daripada apa yang dilaporkan. Ubitus, dengan sokongan daripada Nvidia, menyokong Projek TAME, LLM setempat yang menggunakan aksara Cina tradisional. Mereka menyediakan CPU H100 dan data permainan. Ubitus juga bekerjasama dengan Foxlink dan Shinfox Energy untuk menubuhkan Ubilink.AI, membina pusat perkhidmatan superkomputer AI berkuasa tenaga hijau terbesar di Taiwan dengan kerjasama Asus.

Kuo menekankan penglibatan syarikat dalam membangunkan aplikasi dan model LLM untuk kerajaan, termasuk kerajaan Jepun, merentasi sektor seperti permainan, pelancongan, dan peruncitan, menyoroti potensi AI untuk menangani kekurangan buruh dan populasi yang semakin tua.

Kebimbangan Integriti Data

Kuo selaras dengan OpenAI dan Microsoft dalam mencadangkan bahawa DeepSeek mungkin telah memperoleh data melalui penyulingan model. Proses ini melibatkan melatih model bahasa yang lebih kecil untuk meniru output model yang lebih besar. OpenAI dan Microsoft mendakwa bahawa DeepSeek menggunakan antara muka pengaturcaraan aplikasi OpenAI untuk memudahkan pembangunannya.

Kuo menegaskan bahawa DeepSeek memperoleh data daripada OpenAI dan terdapat salah faham mengenai tuntutan syarikat tentang kecekapan. Beliau menegaskan bahawa DeepSeek-R1, dengan 670 bilion parameternya, jauh lebih besar daripada Llama 3.1 405B Meta AI. Parameter adalah nilai angka dalaman yang dipelajari oleh model semasa latihan untuk membuat ramalan. Kuo juga mencadangkan bahawa model DeepSeek mungkin telah disuling daripada Llama 3.1.

Selain daripada bantahan ini, kebimbangan juga telah timbul mengenai keupayaan DeepSeek-R1. Pakar mencadangkan bahawa, seperti pendahulunya, R1 cemerlang dalam fungsi khusus tugas tetapi ketinggalan di belakang versi GPT-4o dalam prestasi tujuan am.

Batasan utama model DeepSeek adalah sekatan ke atas akses percuma kepada maklumat. Pengguna mendapati bahawa pertanyaan mengenai topik politik sensitif disambut dengan jawapan yang mengelak. Mengenai topik seperti status minoriti Uyghur Xinjiang dan Taiwan, jawapan DeepSeek mencerminkan pendirian rasmi Parti Komunis China. Penyelidikan mencadangkan bahawa sebahagian besar output DeepSeek ditapis untuk menyekat maklumat yang berkaitan dengan demokrasi, hak asasi manusia, dan tuntutan kedaulatan China yang dipertikaikan.

Alternatif Taiwan: TAIDE dan Seterusnya

Sebagai tindak balas, LLM yang dibangunkan di Taiwan, seperti TAME, telah muncul sebagai alternatif kepada DeepSeek dalam Sinosphere. Enjin Dialog AI yang Boleh Dipercayai (TAIDE), yang dilancarkan pada Jun 2023 oleh Institut Penyelidikan Gunaan Negara, bertujuan untuk membangunkan model yang selaras dengan norma sosial, budaya, dan linguistik Taiwan.

Walaupun kerja-kerja TAIDE nampaknya terhenti, ia berfungsi sebagai penanda aras penting untuk Projek TAME. TAME, yang dibangunkan oleh Makmal Kecerdasan Mesin dan Pemahaman (MiuLab) di Universiti Kebangsaan Taiwan, dengan pembiayaan daripada pelbagai organisasi, telah dilatih pada 500 bilion token. Ia mengatasi pesaing, termasuk GPT-4o, merentasi 39 penilaian, mencapai skor yang lebih tinggi pada peperiksaan kemasukan universiti, bar, dan perubatan tradisional Cina.

Salah satu objektif TAME adalah untuk mempromosikan budaya tempatan. Membuka kunci keupayaan bahasa tempatan adalah langkah penting. Kuo menyebut pembangunan LLM suara Taiwan berdasarkan Whisper, yang telah mencapai hasil positif dalam memahami lisan Taiwan. Usaha sedang dijalankan untuk membangunkan pengecaman bahasa Hakka.

Usaha ini telah diterima baik oleh institusi di wilayah di mana bahasa ini lazim. Terdapat juga usaha untuk melatih model dalam pengecaman bahasa asli, tetapi data terhad kekal sebagai halangan. Melatih AI untuk mempelajari bahasa baharu memerlukan sejumlah besar rakaman suara yang dipadankan dengan teks.

Mengakses data sejarah dalam arkib kerajaan memberikan peluang lain. Walau bagaimanapun, sesetengah data dilindungi oleh hak cipta. Kemunculan kecerdasan umum buatan menawarkan potensi untuk membantu dalam memulihkan bahasa yang terancam dan pupus.

Pengejaran Kedaulatan AI

Persimpangan bahasa dan budaya menggariskan kepentingan kedaulatan AI sebagai cara untuk mengukuhkan identiti Taiwan, menyampaikan naratif Taiwan, dan melindungi persekitaran maklumatnya.

Julian Chu, perunding industri dan pengarah di Institut Perundingan & Perisikan Pasaran (MIC), menekankan potensi berat sebelah dalam model LLM dan data latihan. Beliau menyatakan bahawa walaupun menggunakan aksara tradisional, output LLM boleh mencerminkan gaya Republik Rakyat China dan gagal untuk menangkap budaya Taiwan. Matlamatnya adalah untuk syarikat-syarikat Taiwan menggunakan bahasa atau data Taiwan untuk melatih LLM dan membina kedaulatan AI.

Chu menyebut Model Yayasan Formosa (FFM-Llama2) sebagai LLM Taiwan yang menjanjikan yang lain. Dikeluarkan pada September 2023 oleh Perkhidmatan Web Taiwan, ia bertujuan untuk mendemokrasikan AI. Foxconn juga melancarkan LLMnya, FoxBrain, pada bulan Mac. Walau bagaimanapun, sesetengah pengulas kekal ragu-ragu terhadap usaha syarikat besar ke dalam LLM.

Lin Yen-ting, ahli pasukan MiuLab yang membangunkan TAME, menekankan keperluan untuk menangani jurang dalam persekitaran maklumat mengenai Taiwan. Beliau menyatakan bahawa DeepSeek-R1 dan LLM Cina yang lain membentangkan pandangan yang herot tentang Taiwan. Model yang dibangunkan di A.S. juga kadangkala boleh menyalahgambarkan Taiwan. Model sumber terbuka mungkin tidak mengutamakan Taiwan, dan data latihan didominasi oleh China.

Oleh itu, adalah penting untuk memilih untuk memasukkan kandungan Taiwan dan melatih semula ke dalam model. Pendekatan proaktif ini memastikan bahawa landskap budaya dan linguistik Taiwan yang unik diwakili dengan tepat dalam alam digital, memupuk rasa identiti negara dan memelihara warisannya yang berbeza dalam menghadapi pembangunan AI global. Dedikasi untuk memelihara identiti Taiwan ini memastikan bahawa budaya dan nilai unik negara pulau itu tidak dibayangi oleh naratif dominan.

Cabaran yang wujud dalam usaha ini adalah besar. Membina model AI yang benar-benar mewakili memerlukan pelaburan sumber yang ketara, termasuk akses kepada set data yang besar kandungan setempat dan kepakaran dalam pemprosesan bahasa semula jadi. Tambahan pula, keperluan berterusan untuk menentang maklumat salah dan maklumat berat sebelah memerlukan proses penambahbaikan dan penyesuaian yang berterusan.

Di sebalik cabaran ini, komitmen Taiwan terhadap kedaulatan AI tetap teguh. Pembangunan TAME dan LLM setempat lain mewakili langkah penting ke arah memastikan bahawa masa depan kecerdasan buatan mencerminkan identiti budaya unik pulau itu, nilai-nilai demokrasi, dan komitmen yang tidak berbelah bahagi untuk memelihara tempatnya yang berbeza di dunia. Dengan mengutamakan kedaulatan AI, Taiwan bukan sahaja melindungi warisan budayanya tetapi juga meletakkan dirinya sebagai pemain utama dalam landskap AI global, menunjukkan bahawa kemajuan teknologi boleh diselaraskan dengan pemeliharaan identiti budaya dan prinsip demokrasi.

Meneruskan Perjalanan

Perjalanan ke arah kedaulatan AI yang lengkap sedang berterusan. Penyelidikan, pembangunan, dan kerjasama lanjut adalah penting untuk mengatasi cabaran dan memastikan kejayaan jangka panjang inisiatif ini. Dengan terus mengutamakan kedaulatan AI, Taiwan boleh mewujudkan landskap digital yang benar-benar mencerminkan identiti budaya dan nilai-nilai demokratiknya yang unik, menetapkan contoh untuk negara-negara lain yang berusaha untuk mengekalkan tempat mereka yang berbeza dalam dunia yang semakin saling berkaitan.

dikemaskinikan pada 2025-05-09

# Chatbot # Llama # DeepSeek