Dalam arena pengembangan kecerdasan buatan (AI) yang penuh pertaruhan, akses ke teknologi semikonduktor mutakhir sering kali menentukan laju inovasi. Bagi raksasa teknologi Tiongkok, akses ini menjadi semakin kompleks, dibentuk oleh ketegangan geopolitik dan kontrol ekspor ketat yang diberlakukan oleh Amerika Serikat (US). Di tengah lanskap yang menantang ini, Ant Group, perusahaan fintech yang berafiliasi dengan Alibaba, sedang menempuh jalur yang berbeda. Perusahaan ini secara strategis menerapkan campuran semikonduktor heterogen, yang bersumber dari pemasok Amerika dan domestik, untuk mendukung ambisi AI-nya, terutama berfokus pada peningkatan efisiensi dan efektivitas biaya pelatihan model AI yang canggih.
Pendekatan yang diperhitungkan ini lebih dari sekadar solusi teknis; ini mewakili adaptasi strategis yang fundamental. Dengan sengaja mengintegrasikan chip dari berbagai produsen, termasuk alternatif buatan dalam negeri, Ant Group bertujuan untuk memitigasi risiko yang terkait dengan gangguan rantai pasokan dan mengurangi ketergantungannya pada satu vendor tunggal, terutama yang tunduk pada pembatasan perdagangan internasional. Diversifikasi ini sangat penting untuk memastikan kelangsungan dan ketahanan jalur penelitian dan pengembangan AI-nya. Tujuan utamanya ada dua: mempertahankan momentum dalam inovasi AI sambil secara bersamaan mengoptimalkan biaya substansial yang biasanya terkait dengan pelatihan model skala besar.
Kekuatan Spesialisasi: Merangkul Mixture of Experts (MoE)
Inti dari strategi perangkat keras Ant Group adalah adopsi arsitektur AI canggih yang dikenal sebagai Mixture of Experts (MoE). Teknik ini mewakili perubahan signifikan dari model AI monolitik tradisional, di mana satu jaringan neural masif tunggal mencoba mempelajari dan menangani semua aspek dari tugas yang diberikan. Pendekatan MoE, sebaliknya, menggunakan struktur yang lebih terdistribusi dan terspesialisasi. Ini berfungsi seperti komite spesialis daripada seorang generalis tunggal.
Bayangkan sebuah masalah kompleks yang membutuhkan pengetahuan beragam. Alih-alih mengandalkan satu orang polymath, Anda membentuk tim: seorang matematikawan, seorang ahli bahasa, seorang sejarawan, dan mungkin seorang fisikawan. Sebuah ‘gating network’ bertindak sebagai dispatcher, menganalisis tugas atau titik data yang masuk dan secara cerdas mengarahkannya ke model ‘ahli’ yang paling sesuai dalam sistem yang lebih besar. Setiap model ahli dilatih untuk unggul pada jenis input atau sub-tugas tertentu. Misalnya, dalam model bahasa, satu ahli mungkin berspesialisasi dalam memahami jargon teknis, yang lain dalam gaya penulisan kreatif, dan yang ketiga dalam dialog percakapan.
Keuntungan utama dari desain modular ini terletak pada efisiensi komputasinya. Selama pelatihan atau inferensi (ketika model membuat prediksi), hanya model ahli yang relevan dan gating network yang diaktifkan untuk input tertentu. Komputasi selektif ini sangat kontras dengan model padat (dense models) di mana seluruh jaringan, dengan miliaran atau bahkan triliunan parameternya, harus dilibatkan untuk setiap perhitungan tunggal. Akibatnya, model MoE dapat mencapai kinerja yang sebanding atau bahkan lebih unggul dari rekan-rekan padatnya sambil membutuhkan daya komputasi yang jauh lebih sedikit dan, oleh karena itu, lebih sedikit energi.
Ant Group telah memanfaatkan keunggulan arsitektur ini secara efektif. Penelitian internal dan aplikasi praktis telah menunjukkan bahwa MoE memungkinkan perusahaan mencapai hasil pelatihan yang kuat bahkan ketika menggunakan perangkat keras yang kurang bertenaga, lebih mudah tersedia, atau berbiaya lebih rendah. Menurut temuan yang dibagikan oleh perusahaan, implementasi strategis MoE ini telah memungkinkan pengurangan biaya komputasi sebesar 20% yang signifikan terkait dengan pelatihan model AI-nya. Optimalisasi biaya ini bukan sekadar penghematan tambahan; ini adalah pendorong strategis, memungkinkan Ant untuk mengejar proyek AI ambisius tanpa harus bergantung sepenuhnya pada unit pemrosesan grafis (GPU) tingkat atas yang paling mahal yang semakin sulit diperoleh perusahaan Tiongkok. Peningkatan efisiensi ini secara langsung mengatasi kendala perangkat keras yang diberlakukan oleh lingkungan eksternal.
Permadani Silikon: Portofolio Perangkat Keras Ant
Implementasi praktis dari strategi Ant Group melibatkan navigasi lanskap semikonduktor yang kompleks. Infrastruktur pelatihan AI perusahaan dilaporkan didukung oleh beragam chip, mencerminkan komitmennya terhadap fleksibilitas dan ketahanan. Ini termasuk silikon yang dirancang sendiri oleh afiliasinya, Alibaba, kemungkinan merujuk pada chip yang dikembangkan oleh unit semikonduktor T-Head milik Alibaba. Selain itu, Ant menggabungkan chip dari Huawei, raksasa teknologi Tiongkok lainnya yang telah banyak berinvestasi dalam mengembangkan akselerator AI sendiri (seperti seri Ascend) sebagai tanggapan atas sanksi US.
Meskipun Ant Group secara historis menggunakan GPU berkinerja tinggi dari Nvidia, pemimpin tak terbantahkan di pasar pelatihan AI, kontrol ekspor US yang berkembang telah mengharuskan adanya pergeseran. Peraturan ini secara khusus membatasi penjualan akselerator AI paling canggih ke entitas Tiongkok, dengan alasan masalah keamanan nasional. Meskipun Nvidia masih dapat memasok chip dengan spesifikasi lebih rendah ke pasar Tiongkok, Ant Group tampaknya secara aktif memperluas basis pemasoknya untuk mengkompensasi akses terbatas ke produk Nvidia tingkat atas.
Diversifikasi ini secara menonjol menampilkan chip dari Advanced Micro Devices (AMD). AMD telah muncul sebagai pesaing signifikan bagi Nvidia di ruang komputasi kinerja tinggi dan AI, menawarkan GPU yang kuat yang menyajikan alternatif yang layak untuk beban kerja tertentu. Dengan menggabungkan perangkat keras AMD bersama opsi domestik dari Alibaba dan Huawei, Ant membangun lingkungan komputasi heterogen. Pendekatan campur-padu ini, meskipun berpotensi menambah kompleksitas dalam optimalisasi perangkat lunak dan manajemen beban kerja, memberikan fleksibilitas krusial. Ini memungkinkan perusahaan untuk menyesuaikan penggunaan perangkat kerasnya berdasarkan ketersediaan, biaya, dan tuntutan komputasi spesifik dari model dan tugas AI yang berbeda, sehingga menghindari hambatan yang disebabkan oleh ketergantungan pada satu sumber tunggal yang dibatasi.
Latar belakang strategi ini adalah jaringan rumit kontrol ekspor US. Langkah-langkah ini telah diperketat secara progresif, bertujuan untuk mengekang kemajuan Tiongkok dalam manufaktur semikonduktor canggih dan pengembangan AI. Meskipun awalnya berfokus pada chip kelas paling atas, pembatasan telah berkembang, memengaruhi jangkauan perangkat keras dan peralatan manufaktur semikonduktor yang lebih luas. Nvidia, misalnya, harus membuat versi spesifik berkinerja lebih rendah dari chip AI andalannya (seperti A800 dan H800, turunan dari A100 dan H100) untuk pasar Tiongkok agar mematuhi peraturan ini. Strategi Ant untuk merangkul alternatif dari AMD dan pemain domestik adalah respons pragmatis langsung terhadap tekanan regulasi ini, menunjukkan upaya untuk mempertahankan daya saing AI dalam batasan yang ada.
AI dalam Aksi: Mentransformasi Layanan Kesehatan
Kemajuan Ant Group dalam efisiensi AI bukan sekadar latihan teoretis; mereka secara aktif diterjemahkan ke dalam aplikasi dunia nyata, dengan fokus penting pada sektor layanan kesehatan. Perusahaan baru-baru ini meluncurkan peningkatan signifikan pada solusi AI yang disesuaikan untuk layanan kesehatan, menggarisbawahi dampak praktis dari strategi teknologi dasarnya.
Kemampuan AI yang ditingkatkan ini dilaporkan sudah digunakan di beberapa institusi layanan kesehatan terkemuka di kota-kota besar Tiongkok, termasuk Beijing, Shanghai, Hangzhou (markas Ant), dan Ningbo. Tujuh rumah sakit besar dan organisasi layanan kesehatan memanfaatkan AI Ant untuk meningkatkan berbagai aspek operasi dan perawatan pasien mereka.
Dasar dari model AI layanan kesehatan Ant sendiri merupakan contoh inovasi kolaboratif dan pemanfaatan kekuatan teknologi yang beragam. Ini dibangun di atas kombinasi model bahasa besar (LLM) yang kuat:
- Model R1 dan V3 DeepSeek: DeepSeek adalah perusahaan riset AI Tiongkok terkemuka yang dikenal karena mengembangkan model sumber terbuka yang mumpuni, sering kali mencapai tolok ukur kinerja yang kuat.
- Qwen Alibaba: Ini adalah keluarga model bahasa besar proprietary yang dikembangkan oleh afiliasi Ant, Alibaba, mencakup berbagai ukuran dan kemampuan.
- Model BaiLing milik Ant sendiri: Ini menunjukkan upaya internal Ant Group dalam mengembangkan model AI pesanan yang disesuaikan dengan kebutuhan spesifiknya, kemungkinan menggabungkan data dan keahlian keuangan dan mungkin spesifik layanan kesehatan.
Fondasi multi-model ini memungkinkan solusi AI layanan kesehatan untuk memanfaatkan basis pengetahuan dan kemampuan yang luas. Menurut Ant Group, sistem ini mahir dalam menjawab pertanyaan tentang berbagai topik medis, berpotensi berfungsi sebagai alat yang berharga bagi para profesional kesehatan yang mencari informasi cepat dan pasien yang mencari pengetahuan medis umum (meskipun penggambaran yang cermat tentang perannya versus nasihat medis profesional sangat penting).
Di luar pengambilan informasi, perusahaan menyatakan bahwa model AI dirancang untuk meningkatkan layanan pasien. Meskipun detail spesifik sedang muncul, ini dapat mencakup berbagai aplikasi, seperti:
- Triase Cerdas: Membantu dalam memprioritaskan kebutuhan pasien berdasarkan gejala yang dijelaskan.
- Penjadwalan dan Manajemen Janji Temu: Mengotomatiskan dan mengoptimalkan proses pemesanan.
- Tindak Lanjut Pasca-Pulang: Memberikan pengingat otomatis atau memeriksa kemajuan pemulihan pasien.
- Dukungan Administratif: Membantu staf layanan kesehatan dengan tugas dokumentasi, peringkasan, atau entri data, membebaskan waktu untuk perawatan pasien langsung.
Penerapan di rumah sakit besar menandakan langkah penting dalam memvalidasi kegunaan teknologi dan menavigasi kompleksitas domain layanan kesehatan, yang melibatkan persyaratan ketat untuk akurasi, keandalan, dan privasi data.
Merencanakan Arah Melampaui GPU Premium
Ke depan, strategi Ant Group tampaknya sejalan dengan ambisi yang lebih luas dalam industri teknologi Tiongkok: untuk mencapai kinerja AI mutakhir tanpa bergantung sepenuhnya pada GPU paling canggih, yang sering kali dibatasi. Perusahaan dilaporkan berencana untuk meniru jalur yang diambil oleh organisasi seperti DeepSeek, berfokus pada metode untuk meningkatkan skala model AI berkinerja tinggi ‘tanpa GPU premium’.
Ambisi ini menandakan keyakinan bahwa inovasi arsitektur (seperti MoE), optimalisasi perangkat lunak, dan pemanfaatan cerdas dari perangkat keras yang beragam dan berpotensi kurang bertenaga secara kolektif dapat menjembatani kesenjangan kinerja yang diciptakan oleh akses terbatas ke silikon tingkat atas. Ini adalah strategi yang lahir sebagian karena kebutuhan akibat kontrol ekspor, tetapi juga mencerminkan jalur yang berpotensi berkelanjutan menuju pengembangan AI yang lebih hemat biaya dan demokratis.
Mencapai tujuan ini melibatkan penjelajahan berbagai jalan di luar hanya MoE:
- Efisiensi Algoritmik: Mengembangkan algoritma AI baru yang membutuhkan lebih sedikit daya komputasi untuk pelatihan dan inferensi.
- Teknik Optimasi Model: Menerapkan metode seperti kuantisasi (mengurangi presisi angka yang digunakan dalam perhitungan) dan pruning (menghapus bagian redundan dari jaringan neural) untuk membuat model lebih kecil dan lebih cepat tanpa kehilangan kinerja yang signifikan.
- Kerangka Kerja Perangkat Lunak: Menciptakan perangkat lunak canggih yang dapat secara efisien mengelola dan mendistribusikan beban kerja AI di lingkungan perangkat keras heterogen, memaksimalkan pemanfaatan sumber daya komputasi yang tersedia.
- Perangkat Keras Domestik Khusus: Investasi berkelanjutan dan pemanfaatan akselerator AI yang dikembangkan oleh perusahaan Tiongkok seperti Huawei (Ascend), Alibaba (T-Head), dan berpotensi lainnya, yang dirancang khusus untuk tugas AI.
Upaya Ant Group menempuh jalur ini, bersama dengan yang lain dalam ekosistem teknologi Tiongkok, dapat memiliki implikasi signifikan. Jika berhasil, ini dapat menunjukkan bahwa kepemimpinan dalam AI tidak semata-mata bergantung pada akses ke chip tercepat absolut, tetapi juga bergantung pada inovasi dalam perangkat lunak, arsitektur, dan optimalisasi tingkat sistem. Ini mewakili upaya yang gigih untuk membangun kemampuan AI yang tangguh dan mandiri, menavigasi kompleksitas lanskap teknologi global saat ini melalui diversifikasi strategis dan inovasi tanpa henti. Integrasi semikonduktor US dan Tiongkok, yang dioptimalkan melalui teknik seperti MoE dan diterapkan pada sektor-sektor penting seperti layanan kesehatan, menunjukkan pendekatan pragmatis dan adaptif untuk mempertahankan kemajuan AI di bawah tekanan.