Dalam arena pembangunan kecerdasan buatan (AI) yang penuh persaingan, akses kepada teknologi semikonduktor terkini sering menentukan kadar inovasi. Bagi gergasi teknologi China, akses ini menjadi semakin kompleks, dibentuk oleh ketegangan geopolitik dan kawalan eksport ketat yang dikenakan oleh Amerika Syarikat. Di tengah-tengah landskap yang mencabar ini, Ant Group, kuasa besar fintech yang bersekutu dengan Alibaba, sedang merintis laluan tersendiri. Syarikat ini secara strategik menggunakan campuran semikonduktor heterogen, yang diperoleh daripada pembekal Amerika dan domestik, untuk menggerakkan cita-cita AI mereka, terutamanya memberi tumpuan kepada peningkatan kecekapan dan keberkesanan kos latihan model AI yang canggih.
Pendekatan yang diperhitungkan ini lebih daripada sekadar penyelesaian teknikal; ia mewakili penyesuaian strategik yang asas. Dengan sengaja mengintegrasikan cip daripada pelbagai pengeluar, termasuk alternatif tempatan, Ant Group bertujuan untuk mengurangkan risiko yang berkaitan dengan gangguan rantaian bekalan dan mengurangkan kebergantungannya pada mana-mana vendor tunggal, terutamanya yang tertakluk kepada sekatan perdagangan antarabangsa. Kepelbagaian ini penting untuk memastikan kesinambungan dan daya tahan saluran penyelidikan dan pembangunan AI mereka. Objektif terasnya adalah dua kali ganda: mengekalkan momentum dalam inovasi AI sambil mengoptimumkan kos besar yang biasanya dikaitkan dengan latihan model berskala besar.
Kuasa Pengkhususan: Menerima Mixture of Experts (MoE)
Pusat kepada strategi perkakasan Ant Group ialah penerimaan seni bina AI termaju yang dikenali sebagai Mixture of Experts (MoE). Teknik ini mewakili penolakan yang signifikan daripada model AI monolitik tradisional, di mana satu rangkaian neural besar tunggal cuba mempelajari dan mengendalikan semua aspek tugas yang diberikan. Pendekatan MoE, sebaliknya, menggunakan struktur yang lebih teragih dan khusus. Ia berfungsi seperti jawatankuasa pakar dan bukannya seorang generalis tunggal.
Bayangkan masalah kompleks yang memerlukan pengetahuan pelbagai. Daripada bergantung pada seorang polimat, anda mengumpulkan satu pasukan: seorang ahli matematik, seorang ahli bahasa, seorang ahli sejarah, dan mungkin seorang ahli fizik. ‘Rangkaian pengawal’ (gating network) bertindak sebagai penghantar, menganalisis tugas atau titik data yang masuk dan secara bijak mengarahkannya ke model ‘pakar’ yang paling sesuai dalam sistem yang lebih besar. Setiap model pakar dilatih untuk cemerlang pada jenis input atau sub-tugas tertentu. Contohnya, dalam model bahasa, seorang pakar mungkin pakar dalam memahami jargon teknikal, seorang lagi dalam gaya penulisan kreatif, dan yang ketiga dalam dialog perbualan.
Kelebihan utama reka bentuk modular ini terletak pada kecekapan pengiraannya. Semasa latihan atau inferens (apabila model membuat ramalan), hanya model pakar yang relevan dan rangkaian pengawal diaktifkan untuk input tertentu. Pengiraan terpilih ini berbeza secara ketara dengan model padat di mana keseluruhan rangkaian, dengan berbilion atau bahkan trilion parameternya, mesti dilibatkan untuk setiap pengiraan tunggal. Akibatnya, model MoE boleh mencapai prestasi yang setanding atau bahkan lebih unggul daripada rakan sejawatnya yang padat sambil memerlukan kuasa pengiraan yang jauh lebih sedikit dan, oleh itu, kurang tenaga.
Ant Group telah memanfaatkan kelebihan seni bina ini dengan berkesan. Penyelidikan dalaman dan aplikasi praktikal telah menunjukkan bahawa MoE membolehkan syarikat mencapai hasil latihan yang mantap walaupun menggunakan perkakasan yang kurang berkuasa, lebih mudah didapati, atau kos lebih rendah. Menurut penemuan yang dikongsi oleh syarikat itu, pelaksanaan strategik MoE ini telah membolehkan pengurangan kos pengkomputeran sebanyak 20% yang ketara yang berkaitan dengan latihan model AI mereka. Pengoptimuman kos ini bukan sekadar penjimatan tambahan; ia adalah pemboleh strategik, membolehkan Ant meneruskan projek AI yang bercita-cita tinggi tanpa semestinya bergantung semata-mata pada unit pemprosesan grafik (GPU) peringkat teratas yang paling mahal yang semakin sukar diperoleh oleh firma China. Keuntungan kecekapan ini secara langsung menangani kekangan perkakasan yang dikenakan oleh persekitaran luaran.
Tenunan Silikon: Portfolio Perkakasan Ant
Pelaksanaan praktikal strategi Ant Group melibatkan navigasi landskap semikonduktor yang kompleks. Infrastruktur latihan AI syarikat dilaporkan dikuasakan oleh pelbagai jenis cip, mencerminkan komitmennya terhadap fleksibiliti dan daya tahan. Ini termasuk silikon yang direka bentuk secara dalaman oleh sekutunya, Alibaba, kemungkinan merujuk kepada cip yang dibangunkan oleh unit semikonduktor T-Head Alibaba. Tambahan pula, Ant menggabungkan cip daripada Huawei, satu lagi gergasi teknologi China yang telah banyak melabur dalam membangunkan pemecut AI sendiri (seperti siri Ascend) sebagai tindak balas kepada sekatan AS.
Walaupun Ant Group secara sejarah menggunakan GPU berprestasi tinggi daripada Nvidia, peneraju pasaran latihan AI yang tidak dapat dipertikaikan, kawalan eksport AS yang berkembang telah memerlukan peralihan. Peraturan ini secara khusus mengehadkan penjualan pemecut AI paling canggih kepada entiti China, dengan alasan kebimbangan keselamatan negara. Walaupun Nvidia masih boleh membekalkan cip spesifikasi rendah ke pasaran China, Ant Group nampaknya secara aktif meluaskan pangkalan pembekalnya untuk mengimbangi akses terhad kepada produk Nvidia peringkat teratas.
Kepelbagaian ini menonjolkan cip daripada Advanced Micro Devices (AMD). AMD telah muncul sebagai pesaing penting kepada Nvidia dalam ruang pengkomputeran berprestasi tinggi dan AI, menawarkan GPU berkuasa yang memberikan alternatif yang berdaya maju untuk beban kerja tertentu. Dengan menggabungkan perkakasan AMD bersama pilihan domestik daripada Alibaba dan Huawei, Ant membina persekitaran pengkomputeran heterogen. Pendekatan campur-dan-padan ini, walaupun berpotensi menambah kerumitan dalam pengoptimuman perisian dan pengurusan beban kerja, memberikan fleksibiliti yang penting. Ia membolehkan syarikat menyesuaikan penggunaan perkakasannya berdasarkan ketersediaan, kos, dan permintaan pengiraan khusus model dan tugas AI yang berbeza, dengan itu mengatasi kesesakan yang disebabkan oleh pergantungan pada satu sumber tunggal yang terhad.
Latar belakang strategi ini ialah jaringan rumit kawalan eksport AS. Langkah-langkah ini telah diperketatkan secara progresif, bertujuan untuk membendung kemajuan China dalam pembuatan semikonduktor termaju dan pembangunan AI. Walaupun pada mulanya tertumpu pada cip paling canggih mutlak, sekatan telah berkembang, memberi kesan kepada rangkaian perkakasan dan peralatan pembuatan semikonduktor yang lebih luas. Nvidia, sebagai contoh, terpaksa mencipta versi khusus berprestasi rendah bagi cip AI utamanya (seperti A800 dan H800, yang berasal daripada A100 dan H100) untuk pasaran China bagi mematuhi peraturan ini. Strategi Ant untuk menerima alternatif daripada AMD dan pemain domestik adalah tindak balas pragmatik langsung terhadap tekanan kawal selia ini, menunjukkan usaha untuk mengekalkan daya saing AI dalam kekangan yang diberikan.
AI dalam Tindakan: Mentransformasi Perkhidmatan Penjagaan Kesihatan
Kemajuan Ant Group dalam kecekapan AI bukan sekadar latihan teori; ia sedang diterjemahkan secara aktif ke dalam aplikasi dunia nyata, dengan tumpuan ketara pada sektor penjagaan kesihatan. Syarikat itu baru-baru ini melancarkan peningkatan ketara kepada penyelesaian AI yang disesuaikan untuk penjagaan kesihatan, menekankan kesan praktikal strategi teknologi asasnya.
Keupayaan AI yang dinaik taraf ini dilaporkan sudah digunakan di beberapa institusi penjagaan kesihatan terkemuka di bandar-bandar utama China, termasuk Beijing, Shanghai, Hangzhou (ibu pejabat Ant), dan Ningbo. Tujuh hospital utama dan organisasi penjagaan kesihatan memanfaatkan AI Ant untuk menambah baik pelbagai aspek operasi dan penjagaan pesakit mereka.
Asas model AI penjagaan kesihatan Ant itu sendiri adalah contoh inovasi kolaboratif dan memanfaatkan kekuatan teknologi yang pelbagai. Ia dibina berdasarkan gabungan model bahasa besar (LLM) yang berkuasa:
- Model R1 dan V3 DeepSeek: DeepSeek ialah firma penyelidikan AI China yang terkenal kerana membangunkan model sumber terbuka yang berkebolehan, sering mencapai penanda aras prestasi yang kukuh.
- Qwen Alibaba: Ini ialah keluarga model bahasa besar proprietari yang dibangunkan oleh sekutu Ant, Alibaba, meliputi pelbagai saiz dan keupayaan.
- Model BaiLing Ant sendiri: Ini menunjukkan usaha dalaman Ant Group dalam membangunkan model AI yang ditempah khas mengikut keperluan khususnya, kemungkinan menggabungkan data dan kepakaran kewangan dan berpotensi khusus penjagaan kesihatan.
Asas pelbagai model ini membolehkan penyelesaian AI penjagaan kesihatan memanfaatkan asas pengetahuan dan keupayaan yang luas. Menurut Ant Group, sistem ini mahir dalam menangani pertanyaan mengenai pelbagai topik perubatan, berpotensi berfungsi sebagai alat yang berharga untuk kedua-dua profesional penjagaan kesihatan yang mencari maklumat pantas dan pesakit yang mencari pengetahuan perubatan umum (walaupun penentuan peranan yang teliti berbanding nasihat perubatan profesional adalah penting).
Selain daripada mendapatkan semula maklumat, syarikat menyatakan bahawa model AI direka untuk meningkatkan perkhidmatan pesakit. Walaupun butiran khusus sedang muncul, ini boleh merangkumi pelbagai aplikasi, seperti:
- Triaj Pintar: Membantu dalam mengutamakan keperluan pesakit berdasarkan gejala yang diterangkan.
- Penjadualan dan Pengurusan Janji Temu: Mengautomasikan dan mengoptimumkan proses tempahan.
- Susulan Selepas Discaj: Menyediakan peringatan automatik atau memeriksa kemajuan pemulihan pesakit.
- Sokongan Pentadbiran: Membantu kakitangan penjagaan kesihatan dengan dokumentasi, ringkasan, atau tugas kemasukan data, membebaskan masa untuk penjagaan pesakit secara langsung.
Penempatan di hospital utama menandakan langkah kritikal dalam mengesahkan utiliti teknologi dan menavigasi kerumitan domain penjagaan kesihatan, yang melibatkan keperluan ketat untuk ketepatan, kebolehpercayaan, dan privasi data.
Merangka Haluan Melangkaui GPU Premium
Memandang ke hadapan, strategi Ant Group kelihatan sejajar dengan cita-cita yang lebih luas dalam industri teknologi China: untuk mencapai prestasi AI terkini tanpa bergantung semata-mata pada GPU yang paling canggih, yang sering dihadkan. Syarikat itu dilaporkan merancang untuk mencontohi laluan yang diambil oleh organisasi seperti DeepSeek, memberi tumpuan kepada kaedah untuk meningkatkan skala model AI berprestasi tinggi ‘tanpa GPU premium’.
Cita-cita ini menandakan kepercayaan bahawa inovasi seni bina (seperti MoE), pengoptimuman perisian, dan penggunaan pintar perkakasan yang pelbagai, yang berpotensi kurang berkuasa, secara kolektif dapat merapatkan jurang prestasi yang dicipta oleh akses terhad kepada silikon peringkat teratas. Ia adalah strategi yang lahir sebahagiannya daripada keperluan kerana kawalan eksport, tetapi ia juga mencerminkan laluan yang berpotensi mampan ke arah pembangunan AI yang lebih kos efektif dan demokratik.
Mencapai matlamat ini melibatkan penerokaan pelbagai laluan selain daripada MoE semata-mata:
- Kecekapan Algoritma: Membangunkan algoritma AI baharu yang memerlukan kurang kuasa pengiraan untuk latihan dan inferens.
- Teknik Pengoptimuman Model: Menggunakan kaedah seperti kuantisasi (mengurangkan ketepatan nombor yang digunakan dalam pengiraan) dan pemangkasan (membuang bahagian rangkaian neural yang berlebihan) untuk menjadikan model lebih kecil dan lebih pantas tanpa kehilangan prestasi yang ketara.
- Rangka Kerja Perisian: Mencipta perisian canggih yang boleh mengurus dan mengagihkan beban kerja AI dengan cekap merentasi persekitaran perkakasan heterogen, memaksimumkan penggunaan sumber pengkomputeran yang tersedia.
- Perkakasan Domestik Khusus: Pelaburan berterusan dan penggunaan pemecut AI yang dibangunkan oleh syarikat China seperti Huawei (Ascend), Alibaba (T-Head), dan berpotensi lain, yang direka khusus untuk tugas AI.
Usaha Ant Group dalam laluan ini, bersama-sama dengan pihak lain dalam ekosistem teknologi China, boleh membawa implikasi yang signifikan. Jika berjaya, ia boleh menunjukkan bahawa kepimpinan dalam AI tidak semata-mata bergantung pada akses kepada cip terpantas mutlak, tetapi juga bergantung pada inovasi dalam perisian, seni bina, dan pengoptimuman peringkat sistem. Ia mewakili usaha yang gigih untuk membina keupayaan AI yang berdaya tahan dan berdikari, menavigasi kerumitan landskap teknologi global semasa melalui kepelbagaian strategik dan inovasi tanpa henti. Integrasi semikonduktor AS dan China, yang dioptimumkan melalui teknik seperti MoE dan diterapkan pada sektor kritikal seperti penjagaan kesihatan, mempamerkan pendekatan pragmatik dan adaptif untuk mengekalkan kemajuan AI di bawah tekanan.