Goku: Terobosan Latihan AI Cabar DeepSeek 2.0? | ms

Menyahsulit Rangka Kerja Latihan SASR Goku

Shanghai Goku Technologies, yang diasaskan pada tahun 2015, telah memperkenalkan rangka kerja latihan AI baharu yang diberi nama SASR, atau latihan hibrid adaptif langkah demi langkah (step-wise adaptive hybrid training). Pendekatan ini bertujuan untuk menangani batasan kaedah lazim seperti penalaan halus terawasi (supervised fine-tuning - SFT) dan pembelajaran pengukuhan (reinforcement learning - RL). Goku berpendapat bahawa SASR, yang diilhamkan oleh cara manusia mengembangkan kemahiran penaakulan, menawarkan laluan yang lebih adaptif dan cekap untuk membina model AI yang canggih.

SFT dan RL dianggap sebagai asas dalam proses latihan AI, yang digunakan oleh gergasi industri seperti OpenAI dan DeepSeek. DeepSeek telah secara jelas menekankan peranan penting teknik ini dalam mengoptimumkan prestasi model V3nya, yang dikeluarkan pada bulan Disember dan mencetuskan minat yang ketara dalam sektor teknologi.

Menurut kertas penyelidikan Goku, yang ditulis bersama dengan penyelidik dari Universiti Shanghai Jiao Tong dan anak syarikat AI yang baru dibentuk, Shanghai AllMind Artificial Intelligence Technology, SASR menunjukkan prestasi unggul berbanding dengan SFT, RL, dan metodologi latihan hibrid statik. “Keputusan eksperimen menunjukkan bahawa SASR mengatasi kaedah latihan hibrid SFT, RL dan statik,” pasukan Goku menegaskan dalam kertas penyelidikan mereka.

Implikasi Kemajuan Goku

Terobosan latihan AI Goku dilaporkan menggariskan kemajuan berterusan China dalam bidang AI. Ia berpotensi menyoroti batasan dasar semasa yang dilaksanakan oleh kerajaan A.S., yang bertujuan untuk menghalang kemajuan AI China melalui sekatan perkakasan. Jensen Huang, CEO Nvidia, baru-baru ini mengulas mengenai ketidakberkesanan sekatan ini yang dilihat, menyatakan bahawa “China mempunyai 50 peratus pembangun AI dunia.”

DeepSeek, sebuah syarikat permulaan AI China yang muncul dari dana lindung nilai High-Flyer, telah mendapat pengiktirafan meluas kerana mempamerkan potensi China untuk kepimpinan AI melalui algoritma lanjutan dan penyepaduan perkakasan dan perisian.

Peranan AllMind dalam Strategi AI Goku

Penubuhan AllMind, yang bertepatan dengan penerbitan penyelidikan Goku, menunjukkan langkah strategik untuk menumpukan sumber kepada penyelidikan dan pembangunan AI. Rekod pendaftaran perniagaan China menunjukkan bahawa AllMind telah didaftarkan secara rasmi pada hari yang sama Goku mengeluarkan penyelidikannya.

Wang Xiao, pengasas Goku dan wakil undang-undang AllMind, telah menyatakan bahawa entiti baharu itu diwujudkan untuk meneroka sempadan AI baharu. Ini mencerminkan pendekatan yang diambil oleh High-Flyer, yang menubuhkan DeepSeek sebagai entiti berasingan pada tahun 2023.

Sehingga akhir tahun lepas, Goku menguruskan lebih daripada 15 bilion yuan (kira-kira AS$2.1 bilion) dalam aset domestik dan antarabangsa, menggunakan strategi yang dipacu AI, menurut maklumat yang terdapat di laman web rasminya.

Meninjau Lebih Dalam SASR: Rangka Kerja Latihan Hibrid Adaptif Langkah Demi Langkah

Rangka kerja SASR Goku mempersembahkan alternatif yang menarik dalam landskap latihan model AI. Untuk benar-benar menghargai potensi impaknya, pemahaman yang lebih terperinci tentang komponen dan cara kerjanya adalah penting.

Aspek “langkah demi langkah” SASR membayangkan proses latihan berbilang peringkat di mana model AI menjalani penambahbaikan berulang. Setiap langkah mungkin melibatkan objektif tertentu dan menggunakan data latihan yang berbeza untuk memupuk keupayaan tertentu dalam model. Pendekatan berfasa ini boleh menawarkan faedah seperti mengurangkan cabaran melatih model kompleks dari awal dan membenarkan pengoptimuman yang disesuaikan pada setiap peringkat.

Elemen “adaptif” mencadangkan bahawa proses latihan tidak statik tetapi bertindak balas secara dinamik terhadap prestasi dan ciri model. Kebolehsuaian ini boleh melibatkan pelarasan hiperparameter, mengubah suai taburan data latihan, atau menimbang secara dinamik sumbangan objektif latihan yang berbeza. Proses adaptif membolehkan AI belajar dan bertambah baik dengan lebih berkesan.

Sifat “hibrid” SASR mendedahkan bahawa ia menggabungkan elemen metodologi latihan yang berbeza. Ini adalah aspek penting kerana terdapat kekuatan dan kelemahan dalam SFT dan RL. Gabungan kaedah membolehkan model memanfaatkan faedah setiap pendekatan sambil menangani batasannya. Dengan mengintegrasikan tiga ciri ini, SARS secara teori lebih sesuai untuk mengembangkan logik dan penaakulan.

Membandingkan SASR dengan Kaedah Tradisional

Penalaan halus terawasi (SFT) secara tradisinya bergantung pada set data berlabel yang besar di mana model AI belajar untuk memetakan input kepada output yang dikehendaki. Pembelajaran pengukuhan (RL) melibatkan latihan model melalui percubaan dan kesilapan, memberi ganjaran atau menghukum tindakan untuk memaksimumkan objektif tertentu.

SASR cuba menyepadukan kedua-duanya sambil mengatasi batasan setiap kaedah. Sebagai contoh, SFT boleh sangat bergantung pada kualiti dan keluasan data berlabel. Dalam banyak senario dunia sebenar, mendapatkan data yang mencukupi dan tepat boleh memakan masa dan mahal. RL, walaupun tidak memerlukan data berlabel, boleh menjadi tidak stabil dan terdedah kepada penggodaman ganjaran. Penggodaman ganjaran berlaku apabila model AI menemui cara yang tidak diingini untuk memaksimumkan ganjarannya, yang berpotensi membawa kepada tingkah laku yang tidak diingini.

Rangka kerja Goku mempunyai kemungkinan menjadi peningkatan berbanding batasan SFT dan RL. Walau bagaimanapun, ujian selanjutnya dan berterusan diperlukan untuk mengesahkan keputusan awal yang didokumenkan dalam kertas kerja syarikat.

Inovasi Algoritma dan Kekangan Perkakasan

Berita tentang rangka kerja SASR Goku amat relevan dalam konteks hubungan teknologi A.S.-China. Untuk beberapa waktu, kerajaan A.S. telah cuba menyekat kebangkitan China dalam domain AI dengan menyekat akses kepada perkakasan pengkomputeran lanjutan, terutamanya GPU mewah daripada syarikat seperti Nvidia. Idea di sebalik sekatan ini ialah dengan mengehadkan akses China kepada perkakasan berkuasa akan melambatkan usaha pembangunan AI mereka.

Walau bagaimanapun, komen oleh CEO Nvidia Jensen Huang dan kemajuan yang muncul dari makmal AI China nampaknya mencadangkan dasar ini mungkin tidak berkesan seperti yang dimaksudkan. Huang terkenal dengan menyatakan bahawa China memiliki sebahagian besar bakat pembangun AI dunia, dan bahawa menyekat akses perkakasan mungkin mendorong mereka untuk mencari penyelesaian alternatif.

Terobosan AI yang didakwa Goku mencadangkan bahawa inovasi algoritma berpotensi mengimbangi batasan perkakasan, sekurang-kurangnya sehingga tahap tertentu. Jika penyelidik China boleh membangunkan algoritma latihan yang lebih cekap, mereka mungkin dapat mencapai prestasi AI yang setanding dengan perkakasan yang kurang berkuasa. Ini boleh mempunyai implikasi yang ketara untuk landskap AI global, kerana ia mencadangkan China mungkin dapat meneruskan kemajuan keupayaan AInya walaupun terdapat sekatan yang berterusan.

Ini bukan untuk mencadangkan bahawa perkakasan tidak relevan. GPU lanjutan masih penting untuk melatih model AI canggih, dan akses kepada perkakasan terkini sudah pasti menawarkan kelebihan daya saing yang ketara. Walau bagaimanapun, kerja Goku menunjukkan kepentingan melabur dalam kedua-dua perkakasan dan perisian, dan kemajuan dalam satu bidang berpotensi mengimbangi batasan dalam bidang yang lain.

Kebangkitan AI China: Melangkaui DeepSeek

Kemunculan DeepSeek sebagai pemain terkemuka dalam arena AI telah menjadi pemangkin, menunjukkan keazaman China untuk menjadi peneraju global dalam teknologi transformatif ini. Walau bagaimanapun, DeepSeek hanyalah satu contoh, dan kebangkitan Goku, dengan rangka kerja latihan SASRnya, seterusnya menggambarkan kekuatan dan inovasi yang semakin meningkat dalam ekosistem AI China.

Beberapa faktor menyumbang kepada momentum ini. Pertama, China mempunyai kumpulan data yang besar, yang penting untuk melatih model AI. Dengan populasi yang besar dan penerimaan meluas teknologi digital, syarikat China mempunyai akses kepada set data besar yang boleh digunakan untuk membangunkan dan memperhalusi algoritma AI mereka.

Kedua, China mempunyai penekanan yang kuat terhadap pendidikan STEM, menghasilkan sebilangan besar jurutera dan saintis berbakat. Ini telah mewujudkan tenaga kerja berkemahiran tinggi yang mampu memacu inovasi dalam AI dan bidang berkaitan.

Ketiga, kerajaan China telah menjadikan AI sebagai keutamaan strategik, menyediakan pembiayaan dan sokongan yang ketara untuk penyelidikan dan pembangunan. Ini telah mewujudkan persekitaran yang subur untuk syarikat permulaan AI dan memupuk kerjasama antara ahli akademik dan industri.

Akhir sekali, syarikat China sering bersedia untuk mengambil pendekatan yang lebih pragmatik dan mengambil risiko untuk inovasi, yang membolehkan mereka bergerak dengan cepat dan bereksperimen dengan idea baharu.

Akibat daripada faktor-faktor ini, China dengan cepat mengejar A.S. dari segi keupayaan AI. Walaupun A.S. masih memegang pendahulu dalam bidang tertentu, seperti penyelidikan asas dan perkakasan mewah, China membuat kemajuan yang ketara dalam bidang seperti penglihatan komputer, pemprosesan bahasa semula jadi dan robotik.

Kemunculan syarikat seperti Goku dan DeepSeek mencadangkan bahawa China berada dalam kedudukan yang baik untuk meneruskan kebangkitannya dalam domain AI pada tahun-tahun akan datang.

Shanghai Goku Technologies: Syarikat Di Sebalik Inovasi

Shanghai Goku Technologies ialah dana dagangan kuantitatif yang diasaskan pada tahun 2015. Ia menguruskan aset yang ketara menggunakan strategi yang dipacu AI. Misi syarikat yang dinyatakan ialah untuk “menggabungkan teknologi dan analisis asas” untuk memberikan pulangan yang lebih baik untuk pelanggannya. Selain daripada perniagaan terasnya dalam pengurusan aset, Goku telah menunjukkan komitmen untuk menolak sempadan penyelidikan AI. AllMind Artificial Intelligence Technology, anak syarikat AI, mewakili langkah strategik untuk memformalkan dan mempercepatkan usaha penyelidikan AInya.

Butiran tentang struktur dalaman dan dinamik operasi syarikat kekal agak terhad. Walau bagaimanapun, kenyataan awam dan aktiviti terbarunya menawarkan pandangan tentang pendekatannya. Slogan syarikat, yang diterjemahkan kepada “logik dan kebenaran adalah satu-satunya prinsip yang kami patuhi”, mencerminkan budaya berasaskan data dan analisis. Pelaburan dalam penyelidikan dan pembangunan AI menunjukkan visi jangka panjang dan kesedaran tentang potensi transformatif AI, bukan sahaja dalam sektor kewangan tetapi juga merentasi pelbagai industri. Kemungkinan besar Goku berhasrat untuk memanfaatkan pandangan daripada penyelidikan AI untuk meningkatkan strategi dagangannya dan mendapatkan kelebihan daya saing dalam pasaran.

dikemaskinikan pada 2025-05-23

# AI # LLM # Fine-Tuning