Ant: AI Maju dengan Chip Tiongkok

Pendekatan Inovatif Ant dalam Pelatihan Model AI

Ant Group, raksasa fintech yang didukung oleh Jack Ma, telah mencapai terobosan signifikan dalam kecerdasan buatan (AI) dengan memanfaatkan semikonduktor buatan Tiongkok. Pendekatan inovatif ini telah memungkinkan perusahaan untuk mengembangkan teknik untuk melatih model AI, menghasilkan pengurangan biaya yang luar biasa sebesar 20%. Sumber yang mengetahui masalah ini mengungkapkan bahwa Ant menggunakan chip domestik, termasuk dari afiliasinya Alibaba Group Holding Ltd. dan Huawei Technologies Co., untuk melatih model menggunakan pendekatan pembelajaran mesin Mixture of Experts (MoE).

Hasil yang dicapai oleh Ant sebanding dengan yang diperoleh menggunakan chip Nvidia Corp., seperti H800, prosesor kuat yang dibatasi ekspornya ke Tiongkok oleh AS. Sementara Ant terus menggunakan Nvidia untuk pengembangan AI, Ant semakin mengandalkan alternatif, termasuk Advanced Micro Devices Inc. (AMD) dan chip Tiongkok, untuk model terbarunya.

Memasuki Perlombaan AI: Tiongkok vs. AS

Terjunnya Ant ke dalam pengembangan model AI menempatkannya di tengah persaingan sengit antara perusahaan Tiongkok dan AS. Perlombaan ini semakin intensif sejak DeepSeek menunjukkan potensi pelatihan model yang sangat mumpuni dengan biaya yang jauh lebih rendah dibandingkan dengan yang dikeluarkan oleh raksasa industri seperti OpenAI dan Alphabet Inc.’s Google, yang telah berinvestasi miliaran. Prestasi Ant menggarisbawahi tekad perusahaan Tiongkok untuk memanfaatkan alternatif yang bersumber secara lokal daripada semikonduktor Nvidia tercanggih.

Janji Inferensi AI yang Hemat Biaya

Makalah penelitian yang diterbitkan oleh Ant bulan ini menyoroti potensi modelnya, mengklaim kinerja yang unggul dalam tolok ukur tertentu dibandingkan dengan Meta Platforms Inc., meskipun klaim ini belum diverifikasi secara independen oleh Bloomberg News. Namun demikian, jika platform Ant berkinerja seperti yang diiklankan, mereka dapat mewakili kemajuan signifikan dalam pengembangan kecerdasan buatan Tiongkok. Ini terutama karena kemampuan mereka untuk secara drastis mengurangi biaya inferensi, yang merupakan proses untuk mendukung layanan AI.

Mixture of Experts: Pengubah Permainan dalam AI

Ketika perusahaan menggelontorkan sumber daya yang substansial ke dalam AI, model MoE telah mendapatkan keunggulan sebagai pendekatan yang populer dan efisien. Teknik ini, yang digunakan oleh perusahaan seperti Google dan startup yang berbasis di Hangzhou, DeepSeek, melibatkan pembagian tugas menjadi set data yang lebih kecil. Ini analog dengan memiliki tim spesialis, yang masing-masing berfokus pada segmen pekerjaan tertentu, sehingga mengoptimalkan proses secara keseluruhan.

Mengatasi Hambatan GPU

Secara tradisional, pelatihan model MoE sangat bergantung pada chip berkinerja tinggi, seperti unit pemrosesan grafis (GPU) yang diproduksi oleh Nvidia. Biaya chip ini yang sangat mahal telah menjadi kendala utama bagi banyak perusahaan kecil, membatasi adopsi model MoE secara luas. Ant, bagaimanapun, telah rajin mengerjakan metode untuk melatih model bahasa besar (LLM) dengan lebih efisien, secara efektif menghilangkan kendala ini. Judul makalah penelitian mereka, yang menetapkan tujuan untuk menskalakan model ‘without premium GPUs,’ dengan jelas mencerminkan tujuan ini.

Menantang Dominasi Nvidia

Pendekatan Ant secara langsung menantang strategi yang berlaku yang diadvokasi oleh CEO Nvidia, Jensen Huang. Huang secara konsisten berpendapat bahwa permintaan komputasi akan terus tumbuh, bahkan dengan munculnya model yang lebih efisien seperti R1 DeepSeek. Dia percaya bahwa perusahaan akan membutuhkan chip yang lebih baik untuk menghasilkan pendapatan yang lebih tinggi, daripada yang lebih murah untuk mengurangi biaya. Akibatnya, Nvidia tetap fokus pada pembangunan GPU besar dengan inti pemrosesan, transistor, dan kapasitas memori yang ditingkatkan.

Mengukur Penghematan Biaya

Ant telah memberikan angka konkret untuk menunjukkan efektivitas biaya dari pendekatan yang dioptimalkan. Perusahaan menyatakan bahwa melatih 1 triliun token menggunakan perangkat keras berkinerja tinggi akan menelan biaya sekitar 6,35 juta yuan ($880.000). Namun, dengan memanfaatkan perangkat keras dengan spesifikasi lebih rendah dan teknik yang dioptimalkan, Ant dapat mengurangi biaya ini menjadi 5,1 juta yuan. Token mewakili unit informasi yang diproses model untuk mempelajari tentang dunia dan memberikan respons yang relevan terhadap kueri pengguna.

Memanfaatkan Terobosan AI untuk Solusi Industri

Ant berencana untuk memanfaatkan kemajuan terbarunya dalam model bahasa besar, khususnya Ling-Plus dan Ling-Lite, untuk mengembangkan solusi AI industri untuk sektor-sektor seperti perawatan kesehatan dan keuangan. Model-model ini dirancang untuk memenuhi kebutuhan industri tertentu dan memberikan solusi yang disesuaikan.

Memperluas Aplikasi AI dalam Perawatan Kesehatan

Komitmen Ant terhadap perawatan kesehatan terbukti dalam integrasinya dengan platform online Tiongkok Haodf.com ke dalam layanan kecerdasan buatannya. Melalui pembuatan AI Doctor Assistant, Ant bertujuan untuk mendukung jaringan luas Haodf yang terdiri dari 290.000 dokter dengan membantu tugas-tugas seperti manajemen rekam medis. Aplikasi AI ini berpotensi meningkatkan efisiensi dan akurasi secara signifikan dalam pemberian layanan kesehatan.

Bantuan Bertenaga AI untuk Kehidupan Sehari-hari

Selain perawatan kesehatan, Ant juga telah mengembangkan aplikasi ‘life assistant’ AI yang disebut Zhixiaobao dan layanan penasihat keuangan AI bernama Maxiaocai. Aplikasi ini menunjukkan ambisi Ant untuk mengintegrasikan AI ke dalam berbagai aspek kehidupan sehari-hari, menyediakan pengguna dengan bantuan yang dipersonalisasi dan cerdas.

Tolok Ukur Kinerja: Model Ling vs. Pesaing

Dalam makalah penelitiannya, Ant mengklaim bahwa model Ling-Lite mengungguli salah satu model Llama Meta dalam tolok ukur utama untuk pemahaman bahasa Inggris. Selain itu, model Ling-Lite dan Ling-Plus menunjukkan kinerja yang unggul dibandingkan dengan yang setara dengan DeepSeek pada tolok ukur bahasa Mandarin. Ini menyoroti posisi kompetitif Ant dalam lanskap AI.

Seperti yang dinyatakan oleh Robin Yu, chief technology officer dari penyedia solusi AI yang berbasis di Beijing, Shengshang Tech Co., ‘Jika Anda menemukan satu titik serangan untuk mengalahkan master kung fu terbaik dunia, Anda masih dapat mengatakan bahwa Anda mengalahkan mereka, itulah sebabnya aplikasi dunia nyata itu penting.’

Open-Sourcing untuk Kolaborasi dan Inovasi

Ant telah membuat model Ling menjadi open source, mendorong kolaborasi dan inovasi dalam komunitas AI. Ling-Lite terdiri dari 16,8 miliar parameter, yang merupakan pengaturan yang dapat disesuaikan yang mengontrol kinerja model. Ling-Plus, di sisi lain, membanggakan 290 miliar parameter yang jauh lebih besar, menempatkannya di antara model bahasa yang lebih besar. Untuk memberikan konteks, para ahli memperkirakan bahwa GPT-4.5 ChatGPT memiliki sekitar 1,8 triliun parameter, sedangkan DeepSeek-R1 memiliki 671 miliar.

Mengatasi Tantangan dalam Pelatihan Model

Perjalanan Ant dalam mengembangkan model-model ini bukannya tanpa tantangan. Perusahaan mengalami kesulitan di bidang pelatihan tertentu, terutama mengenai stabilitas. Bahkan perubahan kecil pada perangkat keras atau struktur model dapat menyebabkan masalah, termasuk fluktuasi tingkat kesalahan model. Ini menggarisbawahi kompleksitas dan sensitivitas yang terlibat dalam pelatihan model AI tingkat lanjut.

Penerapan di Dunia Nyata dalam Perawatan Kesehatan

Komitmen Ant terhadap aplikasi praktis lebih lanjut ditunjukkan oleh penerapan mesin model besar yang berfokus pada perawatan kesehatan. Mesin-mesin ini saat ini digunakan oleh tujuh rumah sakit dan penyedia layanan kesehatan di kota-kota besar seperti Beijing dan Shanghai. Model besar memanfaatkan DeepSeek R1, Qwen Alibaba, dan LLM Ant sendiri untuk menyediakan layanan konsultasi medis.

Agen AI untuk Layanan Kesehatan yang Ditingkatkan

Selain mesin model besar, Ant telah memperkenalkan dua agen AI medis: Angel dan Yibaoer. Angel telah melayani lebih dari 1.000 fasilitas medis, sementara Yibaoer memberikan dukungan untuk layanan asuransi kesehatan. Selain itu, pada bulan September tahun sebelumnya, Ant meluncurkan layanan AI Healthcare Manager dalam aplikasi pembayaran Alipay-nya, yang semakin memperluas jangkauannya di sektor perawatan kesehatan. Inisiatif ini menunjukkan dedikasi Ant untuk memanfaatkan AI untuk mengubah dan meningkatkan pemberian layanan kesehatan.