Shanghai Goku Technologies, yang didirikan pada tahun 2015, telah memperkenalkan kerangka kerja pelatihan AI baru yang disebut SASR, atau pelatihan hibrida adaptif langkah demi langkah. Pendekatan ini bertujuan untuk mengatasi keterbatasan metode umum seperti penyetelan halus yang diawasi (SFT) dan pembelajaran penguatan (RL). Goku berpendapat bahwa SASR, yang terinspirasi oleh cara manusia mengembangkan keterampilan penalaran, menawarkan jalur yang lebih adaptif dan efisien untuk membangun model AI canggih.
SFT dan RL dianggap sebagai landasan dalam proses pelatihan AI, yang digunakan oleh raksasa industri seperti OpenAI dan DeepSeek. DeepSeek secara eksplisit menekankan peran penting teknik-teknik ini dalam mengoptimalkan kinerja model V3-nya, yang dirilis pada bulan Desember dan memicu minat yang signifikan di sektor teknologi.
Menurut makalah penelitian Goku, yang ditulis bersama dengan peneliti dari Universitas Shanghai Jiao Tong dan anak perusahaan AI yang baru dibentuk, Shanghai AllMind Artificial Intelligence Technology, SASR menunjukkan kinerja yang unggul dibandingkan dengan SFT, RL, dan metodologi pelatihan hibrida statis. "Hasil eksperimen menunjukkan bahwa SASR mengungguli metode pelatihan hibrida SFT, RL, dan statis," tegas tim Goku dalam makalah penelitian mereka.
Implikasi Kemajuan Goku
Terobosan pelatihan AI Goku dilaporkan menggarisbawahi kemajuan berkelanjutan Tiongkok di bidang AI. Ini berpotensi menyoroti keterbatasan kebijakan saat ini yang diterapkan oleh pemerintah AS, yang bertujuan untuk menghambat kemajuan AI Tiongkok melalui pembatasan perangkat keras. Jensen Huang, CEO Nvidia, baru-baru ini berkomentar tentang ketidakefektifan yang dirasakan dari pembatasan ini, yang menyatakan bahwa "Tiongkok memiliki 50 persen pengembang AI di dunia."
DeepSeek, sebuah perusahaan rintisan AI Tiongkok yang muncul dari dana lindung nilai High-Flyer, telah mendapatkan pengakuan luas karena menunjukkan potensi Tiongkok untuk kepemimpinan AI melalui algoritma canggih dan integrasi perangkat keras dan perangkat lunak.
Peran AllMind dalam Strategi AI Goku
Pembentukan AllMind, yang bertepatan dengan publikasi penelitian Goku, menunjukkan langkah strategis untuk mendedikasikan sumber daya untuk penelitian dan pengembangan AI. Catatan registrasi bisnis Tiongkok menunjukkan bahwa AllMind secara resmi terdaftar pada hari yang sama ketika Goku merilis penelitiannya.
Wang Xiao, pendiri Goku dan perwakilan hukum AllMind, telah menyatakan bahwa entitas baru tersebut diciptakan untuk menjelajahi batas-batas AI baru. Ini mencerminkan pendekatan yang diambil oleh High-Flyer, yang mendirikan DeepSeek sebagai entitas terpisah pada tahun 2023.
Hingga akhir tahun lalu, Goku mengelola lebih dari 15 miliar yuan (sekitar US$2,1 miliar) dalam aset domestik dan internasional, menggunakan strategi berbasis AI, menurut informasi yang tersedia di situs web resminya.
Menyelidiki Lebih Dalam SASR: Kerangka Kerja Pelatihan Hibrida Adaptif Langkah Demi Langkah
Kerangka kerja SASR Goku menghadirkan alternatif yang menarik dalam lanskap pelatihan model AI. Untuk benar-benar menghargai potensi dampaknya, pemahaman yang lebih rinci tentang komponen dan cara kerjanya sangat penting.
Aspek "langkah demi langkah" dari SASR menyiratkan proses pelatihan multi-tahap di mana model AI mengalami penyempurnaan berulang. Setiap langkah kemungkinan melibatkan tujuan tertentu dan menggunakan data pelatihan yang berbeda untuk memelihara kemampuan tertentu dalam model. Pendekatan bertahap ini dapat menawarkan manfaat seperti mengurangi tantangan pelatihan model kompleks dari awal dan memungkinkan optimalisasi yang disesuaikan pada setiap tahap.
Elemen "adaptif" menunjukkan bahwa proses pelatihan tidak statis tetapi merespons secara dinamis terhadap kinerja dan karakteristik model. Adaptabilitas ini dapat melibatkan penyesuaian hiperparameter, memodifikasi distribusi data pelatihan, atau secara dinamis menimbang kontribusi dari tujuan pelatihan yang berbeda. Proses adaptif memungkinkan AI untuk belajar dan meningkatkan lebih efektif.
Sifat "hibrida" dari SASR mengungkapkan bahwa ia menggabungkan elemen dari metodologi pelatihan yang berbeda. Ini adalah aspek penting karena ada kekuatan dan kelemahan dalam SFT dan RL. Campuran metode memungkinkan model untuk memanfaatkan manfaat dari setiap pendekatan sambil mengatasi keterbatasannya. Dengan mengintegrasikan tiga karakteristik ini, SARS secara teori lebih baik disetel untuk mengembangkan logika dan penalaran.
Membandingkan SASR dengan Metode Tradisional
Penyetelan halus yang diawasi (SFT) secara tradisional bergantung pada kumpulan data berlabel yang besar di mana model AI belajar untuk memetakan input ke output yang diinginkan. Pembelajaran penguatan (RL) melibatkan pelatihan model melalui uji coba dan kesalahan, memberi penghargaan atau menghukum tindakan untuk memaksimalkan tujuan tertentu.
SASR mencoba mengintegrasikan keduanya sambil mengatasi keterbatasan masing-masing metode. Misalnya, SFT dapat sangat bergantung pada kualitas dan kelengkapan data berlabel. Dalam banyak skenario dunia nyata, memperoleh data yang cukup dan akurat dapat memakan waktu dan mahal. RL, meskipun tidak memerlukan data berlabel, dapat menjadi tidak stabil dan rentan terhadap peretasan hadiah. Peretasan hadiah terjadi ketika model AI menemukan cara yang tidak diinginkan untuk memaksimalkan hadiahnya, yang berpotensi menyebabkan perilaku yang tidak diinginkan.
Kerangka kerja Goku memiliki kemungkinan menjadi peningkatan atas keterbatasan SFT dan RL. Namun, pengujian lebih lanjut dan berkelanjutan diperlukan untuk memverifikasi hasil awal yang didokumentasikan dalam makalah perusahaan.
Inovasi Algoritma dan Batasan Perangkat Keras
Berita tentang kerangka kerja SASR Goku sangat relevan dalam konteks hubungan teknologi AS-Tiongkok. Selama beberapa waktu, pemerintah AS telah berusaha untuk membatasi kebangkitan Tiongkok di bidang AI dengan membatasi akses ke perangkat keras komputasi canggih, terutama GPU kelas atas dari perusahaan seperti Nvidia. Gagasan di balik pembatasan ini adalah bahwa membatasi akses Tiongkok ke perangkat keras yang kuat akan memperlambat upaya pengembangan AI mereka.
Namun, komentar oleh CEO Nvidia Jensen Huang dan kemajuan yang muncul dari laboratorium AI Tiongkok tampaknya menunjukkan bahwa kebijakan ini mungkin tidak seefektif yang diharapkan. Huang terkenal mencatat bahwa Tiongkok memiliki sebagian besar talenta pengembang AI di dunia, dan bahwa membatasi akses perangkat keras dapat memberi mereka insentif untuk menemukan solusi alternatif.
Terobosan AI yang diklaim Goku menunjukkan bahwa inovasi algoritma berpotensi mengimbangi keterbatasan perangkat keras, setidaknya sampai batas tertentu. Jika peneliti Tiongkok dapat mengembangkan algoritma pelatihan yang lebih efisien, mereka mungkin dapat mencapai kinerja AI yang sebanding dengan perangkat keras yang kurang bertenaga. Ini dapat memiliki implikasi signifikan bagi lanskap AI global, karena menunjukkan bahwa Tiongkok mungkin dapat terus memajukan kemampuan AI-nya meskipun ada pembatasan yang sedang berlangsung.
Ini tidak berarti bahwa perangkat keras tidak relevan. GPU canggih masih penting untuk melatih model AI mutakhir, dan akses ke perangkat keras terbaru tidak diragukan lagi menawarkan keunggulan kompetitif yang signifikan. Namun, karya Goku menunjukkan pentingnya berinvestasi dalam perangkat keras dan perangkat lunak, dan bahwa kemajuan di satu area berpotensi mengkompensasi keterbatasan di area lain.
Kebangkitan AI Tiongkok: Di Luar DeepSeek
Kemunculan DeepSeek sebagai pemain terkemuka di arena AI telah menjadi katalis, menunjukkan tekad Tiongkok untuk menjadi pemimpin global dalam teknologi transformatif ini. Namun, DeepSeek hanyalah satu contoh, dan kebangkitan Goku, dengan kerangka kerja pelatihan SASR-nya, semakin mengilustrasikan kekuatan dan inovasi yang berkembang dalam ekosistem AI Tiongkok.
Beberapa faktor berkontribusi pada momentum ini. Pertama, Tiongkok memiliki kumpulan data yang sangat besar, yang penting untuk melatih model AI. Dengan populasi yang besar dan adopsi teknologi digital yang luas, perusahaan Tiongkok memiliki akses ke kumpulan data besar yang dapat digunakan untuk mengembangkan dan menyempurnakan algoritma AI mereka.
Kedua, Tiongkok memiliki penekanan yang kuat pada pendidikan STEM, menghasilkan sejumlah besar insinyur dan ilmuwan berbakat. Ini telah menciptakan tenaga kerja yang sangat terampil yang mampu mendorong inovasi dalam AI dan bidang terkait.
Ketiga, pemerintah Tiongkok telah menjadikan AI sebagai prioritas strategis, memberikan pendanaan dan dukungan yang signifikan untuk penelitian dan pengembangan. Ini telah menciptakan lingkungan yang subur bagi perusahaan rintisan AI dan mendorong kolaborasi antara akademisi dan industri.
Akhirnya, perusahaan Tiongkok sering bersedia mengambil pendekatan yang lebih pragmatis dan berani mengambil risiko untuk inovasi, yang memungkinkan mereka untuk bergerak cepat dan bereksperimen dengan ide-ide baru.
Sebagai hasil dari faktor-faktor ini, Tiongkok dengan cepat mengejar AS dalam hal kemampuan AI. Sementara AS masih memegang keunggulan di bidang-bidang tertentu, seperti penelitian fundamental dan perangkat keras kelas atas, Tiongkok membuat kemajuan signifikan di bidang-bidang seperti visi komputer, pemrosesan bahasa alami, dan robotika.
Kemunculan perusahaan seperti Goku dan DeepSeek menunjukkan bahwa Tiongkok berada dalam posisi yang baik untuk melanjutkan kebangkitannya di domain AI di tahun-tahun mendatang.
Shanghai Goku Technologies: Perusahaan di Balik Inovasi
Shanghai Goku Technologies adalah dana perdagangan kuantitatif yang didirikan pada tahun 2015. Ia mengelola aset yang signifikan menggunakan strategi berbasis AI. Misi perusahaan yang dinyatakan adalah untuk "menggabungkan teknologi dan analisis fundamental" untuk memberikan pengembalian yang lebih baik bagi kliennya. Selain bisnis intinya dalam manajemen aset, Goku telah menunjukkan komitmen untuk mendorong batas-batas penelitian AI. AllMind Artificial Intelligence Technology, anak perusahaan AI, merupakan langkah strategis untuk memformalkan dan mempercepat upaya penelitian AI-nya.
Detail tentang struktur internal dan dinamika operasional perusahaan tetap relatif sedikit. Namun, pernyataan publik dan kegiatan baru-baru ini menawarkan wawasan tentang pendekatannya. Slogan perusahaan, yang diterjemahkan menjadi "logika dan kebenaran adalah satu-satunya prinsip yang kami patuhi", mencerminkan budaya berbasis data dan analitis. Investasi dalam penelitian dan pengembangan AI menunjukkan visi jangka panjang dan kesadaran akan potensi transformatif AI, tidak hanya di dalam sektor keuangan tetapi juga di berbagai industri. Kemungkinan Goku bermaksud untuk memanfaatkan wawasan dari penelitian AI untuk meningkatkan strategi perdagangannya dan mendapatkan keunggulan kompetitif di pasar.