Pendekatan Inovatif Ant dalam Latihan Model AI
Ant Group, gergasi fintech yang disokong oleh Jack Ma, telah mencapai kejayaan penting dalam kecerdasan buatan (AI) dengan memanfaatkan semikonduktor buatan China. Pendekatan inovatif ini telah membolehkan syarikat itu membangunkan teknik untuk melatih model AI, menghasilkan pengurangan kos yang luar biasa sebanyak 20%. Sumber yang mengetahui perkara itu mendedahkan bahawa Ant menggunakan cip domestik, termasuk dari sekutunya Alibaba Group Holding Ltd. dan Huawei Technologies Co., untuk melatih model menggunakan pendekatan pembelajaran mesin Mixture of Experts (MoE).
Hasil yang dicapai oleh Ant adalah setanding dengan yang diperoleh menggunakan cip Nvidia Corp., seperti H800, pemproses berkuasa yang dihadkan eksportnya ke China oleh A.S. Walaupun Ant terus menggunakan Nvidia untuk pembangunan AI, ia semakin bergantung pada alternatif, termasuk Advanced Micro Devices Inc. (AMD) dan cip China, untuk model terbarunya.
Memasuki Perlumbaan AI: China lwn. A.S.
Usaha Ant dalam pembangunan model AI meletakkannya tepat di tengah-tengah persaingan sengit antara syarikat China dan A.S. Perlumbaan ini telah dipergiatkan sejak DeepSeek menunjukkan potensi melatih model yang sangat berkemampuan pada sebahagian kecil daripada kos yang ditanggung oleh gergasi industri seperti OpenAI dan Alphabet Inc.’s Google, yang telah melabur berbilion-bilion. Pencapaian Ant menggariskan keazaman syarikat China untuk menggunakan alternatif sumber tempatan kepada semikonduktor Nvidia yang paling canggih.
Janji Inferens AI yang Berkesan Kos
Kertas penyelidikan yang diterbitkan oleh Ant bulan ini menyerlahkan potensi modelnya, mendakwa prestasi unggul dalam penanda aras tertentu berbanding Meta Platforms Inc., walaupun dakwaan ini belum disahkan secara bebas oleh Bloomberg News. Walau bagaimanapun, jika platform Ant berfungsi seperti yang diiklankan, ia boleh mewakili kemajuan ketara dalam pembangunan kecerdasan buatan China. Ini terutamanya disebabkan oleh keupayaan mereka untuk mengurangkan kos inferens secara drastik, iaitu proses menyokong perkhidmatan AI.
Mixture of Experts: Pengubah Permainan dalam AI
Memandangkan syarikat mencurahkan sumber yang besar ke dalam AI, model MoE telah mendapat tempat sebagai pendekatan yang popular dan cekap. Teknik ini, yang digunakan oleh syarikat seperti Google dan syarikat permulaan yang berpangkalan di Hangzhou, DeepSeek, melibatkan pembahagian tugas kepada set data yang lebih kecil. Ini adalah sama dengan mempunyai pasukan pakar, masing-masing memfokuskan pada segmen tertentu sesuatu kerja, dengan itu mengoptimumkan keseluruhan proses.
Mengatasi Kesesakan GPU
Secara tradisinya, latihan model MoE sangat bergantung pada cip berprestasi tinggi, seperti unit pemprosesan grafik (GPU) yang dikeluarkan oleh Nvidia. Kos larangan cip ini telah menjadi halangan utama bagi banyak firma kecil, mengehadkan penggunaan meluas model MoE. Ant, bagaimanapun, telah gigih berusaha untuk melatih model bahasa besar (LLM) dengan lebih cekap, dengan berkesan menghapuskan kekangan ini. Tajuk kertas penyelidikan mereka, yang menetapkan matlamat untuk menskalakan model ‘tanpa GPU premium,’ jelas mencerminkan objektif ini.
Mencabar Penguasaan Nvidia
Pendekatan Ant secara langsung mencabar strategi lazim yang disokong oleh Ketua Pegawai Eksekutif Nvidia, Jensen Huang. Huang secara konsisten berhujah bahawa permintaan pengiraan akan terus berkembang, walaupun dengan kemunculan model yang lebih cekap seperti R1 DeepSeek. Beliau percaya bahawa syarikat akan memerlukan cip yang lebih baik untuk menjana hasil yang lebih tinggi, dan bukannya yang lebih murah untuk mengurangkan kos. Akibatnya, Nvidia mengekalkan tumpuannya untuk membina GPU besar dengan teras pemprosesan yang dipertingkatkan, transistor dan kapasiti memori yang ditingkatkan.
Mengukur Penjimatan Kos
Ant telah menyediakan angka konkrit untuk menunjukkan keberkesanan kos pendekatan optimumnya. Syarikat itu menyatakan bahawa melatih 1 trilion token menggunakan perkakasan berprestasi tinggi akan menelan kos kira-kira 6.35 juta yuan ($880,000). Walau bagaimanapun, dengan menggunakan perkakasan spesifikasi yang lebih rendah dan teknik optimumnya, Ant boleh mengurangkan kos ini kepada 5.1 juta yuan. Token mewakili unit maklumat yang diproses oleh model untuk belajar tentang dunia dan memberikan respons yang relevan kepada pertanyaan pengguna.
Memanfaatkan Kejayaan AI untuk Penyelesaian Industri
Ant merancang untuk memanfaatkan kemajuan terbarunya dalam model bahasa besar, khususnya Ling-Plus dan Ling-Lite, untuk membangunkan penyelesaian AI industri untuk sektor seperti penjagaan kesihatan dan kewangan. Model ini direka untuk menangani keperluan industri tertentu dan menyediakan penyelesaian yang disesuaikan.
Memperluas Aplikasi AI dalam Penjagaan Kesihatan
Komitmen Ant terhadap penjagaan kesihatan terbukti dalam penyepaduan platform dalam talian China Haodf.com ke dalam perkhidmatan kecerdasan buatannya. Melalui penciptaan AI Doctor Assistant, Ant berhasrat untuk menyokong rangkaian luas Haodf yang terdiri daripada 290,000 doktor dengan membantu tugas seperti pengurusan rekod perubatan. Aplikasi AI ini berpotensi untuk meningkatkan kecekapan dan ketepatan dalam penyampaian penjagaan kesihatan dengan ketara.
Bantuan Dikuasakan AI untuk Kehidupan Seharian
Selain penjagaan kesihatan, Ant juga telah membangunkan aplikasi ‘pembantu kehidupan’ AI yang dipanggil Zhixiaobao dan perkhidmatan nasihat kewangan AI bernama Maxiaocai. Aplikasi ini menunjukkan cita-cita Ant untuk menyepadukan AI ke dalam pelbagai aspek kehidupan seharian, menyediakan pengguna dengan bantuan yang diperibadikan dan pintar.
Penanda Aras Prestasi: Model Ling lwn. Pesaing
Dalam kertas penyelidikannya, Ant mendakwa bahawa model Ling-Lite mengatasi salah satu model Llama Meta dalam penanda aras utama untuk pemahaman bahasa Inggeris. Tambahan pula, kedua-dua model Ling-Lite dan Ling-Plus menunjukkan prestasi unggul berbanding setara DeepSeek pada penanda aras bahasa Cina. Ini menyerlahkan kedudukan kompetitif Ant dalam landskap AI.
Seperti yang dinyatakan oleh Robin Yu, ketua pegawai teknologi penyedia penyelesaian AI yang berpangkalan di Beijing, Shengshang Tech Co., “Jika anda menemui satu titik serangan untuk mengalahkan master kung fu terbaik dunia, anda masih boleh mengatakan anda mengalahkan mereka, itulah sebabnya aplikasi dunia sebenar adalah penting.”
Sumber Terbuka untuk Kerjasama dan Inovasi
Ant telah menjadikan model Ling sumber terbuka, memupuk kerjasama dan inovasi dalam komuniti AI. Ling-Lite terdiri daripada 16.8 bilion parameter, iaitu tetapan boleh laras yang mengawal prestasi model. Ling-Plus, sebaliknya, mempunyai 290 bilion parameter yang jauh lebih besar, meletakkannya antara model bahasa yang lebih besar. Untuk memberikan konteks, pakar menganggarkan bahawa GPT-4.5 ChatGPT mempunyai kira-kira 1.8 trilion parameter, manakala DeepSeek-R1 mempunyai 671 bilion.
Menangani Cabaran dalam Latihan Model
Perjalanan Ant dalam membangunkan model ini tidak sunyi daripada cabaran. Syarikat itu menghadapi kesukaran dalam bidang latihan tertentu, terutamanya mengenai kestabilan. Malah perubahan kecil dalam perkakasan atau struktur model boleh membawa kepada isu, termasuk turun naik dalam kadar ralat model. Ini menggariskan kerumitan dan sensitiviti yang terlibat dalam melatih model AI lanjutan.
Penggunaan Dunia Sebenar dalam Penjagaan Kesihatan
Komitmen Ant terhadap aplikasi praktikal ditunjukkan lagi oleh penggunaan mesin model besar yang memfokuskan penjagaan kesihatan. Mesin ini kini digunakan oleh tujuh hospital dan penyedia penjagaan kesihatan di bandar utama seperti Beijing dan Shanghai. Model besar itu memanfaatkan DeepSeek R1, Qwen Alibaba, dan LLM Ant sendiri untuk menyediakan perkhidmatan perundingan perubatan.
Ejen AI untuk Perkhidmatan Penjagaan Kesihatan yang Dipertingkatkan
Sebagai tambahan kepada mesin model besar, Ant telah memperkenalkan dua ejen AI perubatan: Angel dan Yibaoer. Angel telah berkhidmat di lebih 1,000 kemudahan perubatan, manakala Yibaoer menyediakan sokongan untuk perkhidmatan insurans perubatan. Tambahan pula, pada bulan September tahun sebelumnya, Ant melancarkan perkhidmatan Pengurus Penjagaan Kesihatan AI dalam aplikasi pembayaran Alipaynya, seterusnya mengembangkan jangkauannya dalam sektor penjagaan kesihatan. Inisiatif ini menunjukkan dedikasi Ant untuk memanfaatkan AI untuk mengubah dan menambah baik penyampaian penjagaan kesihatan.