Melangkaui Langganan: Alternatif AI Sumber Terbuka Berkuasa | ms

Landskap kecerdasan buatan, yang dahulunya kelihatan didominasi oleh segelintir gergasi Silicon Valley seperti OpenAI, Google, Meta, dan Microsoft, sedang mengalami transformasi yang menarik. Walaupun pemain-pemain mapan ini meneruskan perlumbaan pembangunan berisiko tinggi mereka, sering kali meletakkan keupayaan paling canggih mereka di sebalik tembok bayaran langganan, satu arus balas yang kuat sedang mendapat momentum. Gelombang pesaing baru, terutamanya dari hab inovasi di China, menunjukkan bahawa AI canggih tidak semestinya memerlukan kos yang melampau atau kerahsiaan proprietari. Syarikat seperti DeepSeek, Alibaba, dan Baidu melangkah ke pentas global, memperjuangkan model-model hebat yang kerap ditawarkan sebagai alternatif sumber terbuka atau kos rendah, secara asasnya mencabar model perniagaan yang lazim dan meluaskan kemungkinan untuk pembangun dan pengguna di seluruh dunia.

Dinamik yang muncul ini mewakili lebih daripada sekadar pesaing baru memasuki persaingan; ia menandakan potensi peralihan dalam falsafah yang menyokong pembangunan dan kebolehcapaian AI. Keputusan oleh pemain-pemain baru ini untuk mengeluarkan model-model canggih di bawah lesen permisif, menjadikan kod asas tersedia dengan mudah di platform seperti GitHub dan Hugging Face, amat berbeza dengan pendekatan taman tertutup yang sering tidak telus yang digemari oleh beberapa gergasi Barat. Keterbukaan ini bukan sahaja mendemokrasikan akses kepada alat yang berkuasa tetapi juga memupuk ekosistem yang bertenaga di mana pembangun boleh bebas bereksperimen, menyesuaikan, dan membina berdasarkan model-model asas ini, berpotensi mempercepatkan inovasi pada kadar yang belum pernah terjadi sebelumnya. Mari kita mendalami tiga contoh terkemuka yang menerajui usaha ini, meneroka asal usul, keupayaan, dan implikasi strategi terbuka mereka.

DeepSeek: Pendatang Baru Tangkas Menggegarkan Pihak Mapan

Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., yang beroperasi di bawah nama yang lebih ringkas iaitu DeepSeek, muncul di persada AI antarabangsa dengan kepantasan dan impak yang luar biasa. Walaupun merupakan entiti yang agak muda, ditubuhkan secara rasmi pada April 2023 sebagai cabang daripada firma dagangan kuantitatif High-Flyer Quant, DeepSeek dengan cepat menarik perhatian kerana membangunkan model AI yang menyaingi, dan dalam beberapa penanda aras dilaporkan mengatasi, model daripada gergasi industri dengan kitaran pembangunan yang jauh lebih lama dan bajet yang jauh lebih besar. Keupayaan untuk mencapai prestasi kompetitif dengan kecekapan yang kelihatan lebih besar ini telah menimbulkan riak dalam sektor tersebut.

Kitaran lelaran pantas syarikat ini patut diberi perhatian. Bermula dengan DeepSeek-LLM awalnya, ia dengan cepat menyusul dengan model khusus seperti DeepSeek-Math. Pengumuman DeepSeek V2 dan seterusnya DeepSeek V3 pada akhir 2024 sudah menandakan trajektori syarikat yang bercita-cita tinggi. Walau bagaimanapun, pengenalan model penaakulannya, DeepSeek-R1 dan DeepSeek-R1-Zero, pada Januari 2025 yang benar-benar menangkap imaginasi industri dan boleh dikatakan menandakan titik perubahan. Model-model ini membuat perbandingan langsung dan sering kali menguntungkan dengan siri GPT-4 canggih OpenAI dan model ‘o1’ yang dijangkakan, mencetuskan perbincangan penting tentang keadaan terkini dalam penaakulan AI. Pengenalan ini bukan sekadar bersifat akademik; ia dilaporkan mempengaruhi harga saham pesaing, mendorong penilaian semula strategik dalam makmal AI yang mapan, dan bahkan menimbulkan perbincangan di kalangan badan kerajaan mengenai implikasi AI yang begitu kuat dan mudah diakses yang berasal dari pemain global baru.

DeepSeek menggunakan apa yang disebutnya sebagai strategi ‘open weight’ untuk banyak modelnya, mengeluarkannya di bawah Lesen MIT yang permisif. Walaupun ini mungkin tidak bersamaan dengan 100% sumber terbuka dalam definisi yang paling ketat (kerana aspek tertentu data latihan atau metodologi mungkin kekal proprietari), ia mewakili tahap keterbukaan yang signifikan. Yang penting, pemberat model – parameter yang merangkum pengetahuan yang dipelajari oleh model – disediakan. Ini membolehkan pembangun memuat turun model dari repositori seperti GitHub dan Hugging Face, membolehkan mereka menjalankan model secara tempatan, menala halusnya untuk tugas tertentu, mengintegrasikannya ke dalam aplikasi unik, atau sekadar mengkaji seni binanya. Tahap akses ini jauh berbeza daripada berinteraksi semata-mata melalui API terhad atau antara muka web tertutup.

Dari perspektif pengguna, DeepSeek terutamanya muncul sebagai alat AI gaya bot sembang, boleh diakses melalui antara muka web dan aplikasi mudah alih khusus untuk platform iOS dan Android. Pengaruhnya yang semakin meningkat dibuktikan lagi dengan senarai perkongsian yang semakin bertambah. Teknologi DeepSeek sedang diintegrasikan atau diterokai oleh pemain teknologi utama, dilaporkan termasuk Lenovo, Tencent, Alibaba, dan Baidu, mempamerkan potensi kebolehgunaannya merentasi ekosistem perkakasan dan perisian yang pelbagai. Kebangkitan DeepSeek menggariskan tema utama: penemuan AI yang signifikan bukan lagi domain eksklusif makmal penyelidikan yang telah lama bertapak, dan pembangunan yang cekap ditambah dengan keterbukaan strategik dapat dengan cepat membentuk semula landskap persaingan.

Qwen Alibaba: Keterbukaan Berskala Besar dari Gergasi E-dagang

Walaupun DeepSeek mewakili syarikat permulaan yang tangkas mencabar status quo, Alibaba Qwen (Tongyi Qianwen) menandakan penerimaan strategik keterbukaan oleh salah satu konglomerat teknologi terbesar China, dan sememangnya dunia. Alibaba, terkenal dengan empayar e-dagangnya yang luas, perkhidmatan pengkomputeran awan, dan pelbagai usaha teknologi, memasuki perlumbaan AI generatif dengan sumber dan cita-cita yang besar. Keluarga model bahasa besar Qwen dengan cepat menempatkan dirinya di kalangan tawaran sumber terbuka terkemuka di peringkat global.

Perjalanan bermula dengan keluaran beta pada April 2023, dengan cepat mendapat tarikan dalam komuniti AI apabila Alibaba secara progresif mengeluarkan pelbagai model di bawah lesen sumber terbuka sepanjang tahun itu. Komitmen terhadap keterbukaan ini sebahagian besarnya berterusan dengan lelaran berikutnya. Walaupun beberapa versi yang sangat khusus atau sensitif secara komersial mungkin mempunyai pelesenan yang berbeza, model teras dalam siri Qwen, termasuk Qwen 2, siri Qwen-VL pelbagai mod (mengendalikan teks dan imej), Qwen-Audio, dan Qwen2-Math yang cenderung kepada matematik, sering disediakan di bawah lesen permisif seperti Lesen Apache 2.0. Ini membolehkan penggunaan komersial dan penyelidikan yang luas, seterusnya mendorong penggunaan. Seperti DeepSeek, model-model ini mudah diakses oleh komuniti pembangun global melalui platform seperti GitHub dan Hugging Face.

Alibaba tidak segan silu meletakkan modelnya secara langsung menentang yang terbaik dalam industri. Pengumuman Qwen 2.5-Max pada Januari 2025 dan Qwen2.5-VL pelbagai mod pada Mac 2025 datang dengan dakwaan berani, memasarkannya sebagai mempunyai keupayaan melebihi atau menyaingi model terkemuka seperti GPT-4o OpenAI, V3 DeepSeek, dan Llama-3.1-405B Meta yang berkuasa. Walaupun keputusan penanda aras boleh tertakluk kepada tafsiran dan penilaian tugas tertentu, pembangunan yang konsisten dan kedudukan kompetitif menggariskan niat serius Alibaba dalam domain AI.

Menariknya, model Qwen awal mengakui warisannya, sebahagiannya berdasarkan Llama LLM asas Meta – itu sendiri merupakan keluaran sumber terbuka mercu tanda yang memangkin banyak aktiviti dalam bidang tersebut. Walau bagaimanapun, Alibaba telah mengubah suai dan membina secara signifikan di atas asas ini, membangunkan seni bina dan metodologi latihan uniknya sendiri untuk generasi Qwen berikutnya. Evolusi ini menonjolkan corak umum dalam dunia sumber terbuka: membina berdasarkan kerja sedia ada untuk mencipta keupayaan baru dan dipertingkatkan.

Kesan strategi terbuka Qwen mungkin paling baik digambarkan oleh statistik mengejutkan yang dipetik: lebih 90,000 model bebas dilaporkan telah dibangunkan berdasarkan kod sumber terbuka Qwen. Angka ini menunjukkan kuasa penyebaran terbuka. Ia menandakan ekosistem yang berkembang maju di mana penyelidik, syarikat permulaan, dan pembangun individu memanfaatkan kerja asas Alibaba untuk mencipta alat khusus, menjalankan eksperimen baru, dan menolak sempadan AI dalam pelbagai arah. Bagi pengguna akhir, Qwen biasanya diakses melalui antara muka bot sembang yang biasa, tersedia di web dan melalui aplikasi mudah alih di iOS dan Android. Pendekatan Alibaba menunjukkan bahawa walaupun gergasi teknologi boleh memanfaatkan sumber terbuka secara strategik untuk memupuk inovasi, membina komuniti, dan bersaing secara berkesan di pentas AI global.

Ernie Baidu: Peralihan Strategik dari Gergasi Carian

Baidu, sering dirujuk sebagai Google China kerana penguasaannya dalam pasaran enjin carian, membawa warisan yang berbeza kepada perlumbaan AI. Tidak seperti DeepSeek atau bahkan dorongan LLM Alibaba yang agak baru, Baidu telah terlibat secara mendalam dalam penyelidikan AI, terutamanya dalam pemprosesan bahasa semula jadi, selama bertahun-tahun. Keturunan model ERNIE (Enhanced Representation through Knowledge Integration) bermula sejak 2019, mendahului kegilaan keluaran awam yang dicetuskan oleh ChatGPT.

Dorongan AI generatif yang berhadapan dengan awam bermula dengan bersungguh-sungguh dengan keluaran Ernie 3.0 LLM pada Mac 2023, diikuti oleh Ernie 3.5 pada Jun 2023. Pada mulanya, Baidu mengguna pakai pendekatan bertingkat yang lebih konvensional, serupa dengan beberapa rakan sejawat Barat. Ernie 4.0 yang lebih maju, dikeluarkan pada Oktober 2023, terutamanya dikhaskan untuk produk berasaskan langganan Baidu, manakala Ernie 3.5 yang berkebolehan menguasai versi percuma bot sembangnya, yang dikenali sebagai Ernie Bot.

Walau bagaimanapun, dinamik persaingan dalam industri AI, yang dicirikan oleh kemajuan pesat daripada pesaing (domestik dan antarabangsa) dan peningkatan daya maju strategi sumber terbuka, ditambah dengan potensi penurunan kos pengeluaran model, nampaknya telah mendorong pangsi strategik yang signifikan. Baidu memberi isyarat peralihan yang tegas ke arah keterbukaan yang lebih besar. Walaupun model Ernie semasa yang menguasai perkhidmatan utamanya pada mulanya bukan sumber terbuka, syarikat itu mengumumkan rancangan untuk mengubah trajektori ini secara dramatik.

Keluaran Ernie 4.5 LLM dan model penaakulan khusus, Ernie X1, pada pertengahan Mac 2025, serta-merta menarik perbandingan dengan GPT-4.5 OpenAI dan R1 DeepSeek, masing-masing, meletakkan Baidu dengan kukuh dalam kalangan penyedia model AI peringkat teratas. Yang penting, di samping dakwaan prestasi ini, Baidu mengumumkan peta jalan yang jelas ke arah keterbukaan. Syarikat itu mengisytiharkan hasratnya untuk menjadikan model terasnya sumber terbuka bermula 30 Jun. Tambahan pula, ia mengumumkan bahawa bot sembang Ernie Bot akan menjadi percuma untuk semua pengguna mulai 1 April, menghapuskan halangan langganan sebelumnya untuk mengakses AI perbualan yang paling berkebolehan. Memandang ke hadapan, Baidu juga telah menunjukkan bahawa lelaran utama seterusnya, Ernie 5, yang dijangka pada separuh kedua 2025, akan turut menerapkan falsafah sumber terbuka dan percuma untuk digunakan.

Orientasi semula strategik oleh pemain bertaraf Baidu ini sangat signifikan. Ia menunjukkan pengiktirafan bahawa keterbukaan mungkin menjadi satu keperluan kompetitif, bukan sekadar laluan alternatif. Dengan menjadikan model terkini tersedia secara percuma, Baidu berpeluang memupuk komuniti pembangun, merangsang inovasi di sekitar platformnya, dan berpotensi menangkap bahagian minda yang signifikan di kalangan pengguna yang mencari alat AI yang berkuasa dan tidak terhad.

Seperti pesaingnya, antara muka pengguna utama untuk Ernie ialah bot sembang, boleh diakses melalui web dan aplikasi mudah alih (iOS dan Android). Keupayaan Ernie juga telah menemui jalan masuk ke dalam produk pengguna yang ketara, terutamanya diintegrasikan ke dalam ciri AI versi antarabangsa siri telefon pintar Samsung Galaxy S24. Integrasi ini memberikan contoh konkrit bagaimana model bahasa canggih ini bergerak melangkaui makmal penyelidikan dan antara muka web ke dalam peranti yang digunakan oleh berjuta-juta orang setiap hari. Strategi Baidu yang berkembang menggariskan kecairan landskap AI, di mana gergasi yang mapan pun menyesuaikan pendekatan mereka sebagai tindak balas kepada kemajuan teknologi dan jangkaan pasaran yang berubah.

Menavigasi Alam Semesta AI yang Berkembang

Kemunculan model AI yang hebat dan mudah diakses dari DeepSeek, Alibaba, dan Baidu menandakan lebih daripada sekadar peningkatan persaingan untuk pemain mapan seperti OpenAI dan Google. Ia mewakili pengembangan pilihan dan peluang yang asas untuk pelbagai pengguna dan pembangun. Ketersediaan model-model ini, selalunya di bawah lesen sumber terbuka permisif atau ‘open weight’, menurunkan halangan kemasukan untuk inovasi dengan ketara. Perniagaan kecil, pembangun individu, penyelidik, dan pelajar kini boleh mengakses dan memanfaatkan keupayaan AI yang sebelum ini terhad kepada syarikat besar atau peringkat langganan yang mahal.

Percambahan ini menyemarakkan beberapa trend positif:

Penyesuaian: Pembangun boleh menala halus model terbuka ini pada set data tertentu untuk mencipta alat AI yang sangat khusus yang disesuaikan untuk industri niche atau tugas unik, bergerak melangkaui penyelesaian generik, satu saiz untuk semua.
Eksperimen: Keupayaan untuk memuat turun dan mengubah suai pemberat model membolehkan penerokaan yang lebih mendalam tentang seni bina dan keupayaan AI, memupuk penyelidikan akademik dan inovasi akar umbi.
Pengurangan Kos: Bagi pengguna dan organisasi yang jemu dengan yuran langganan berulang, alternatif percuma atau kos rendah ini menawarkan fungsi yang berkuasa tanpa beban kewangan yang berkaitan, berpotensi mendemokrasikan akses kepada alat AI yang meningkatkan produktiviti.
Pertumbuhan Ekosistem: Kebolehcapaian melalui platform seperti GitHub dan Hugging Face memupuk komuniti yang bertenaga di sekitar model-model ini, menawarkan sumber kongsi, sokongan, dan peluang pembangunan kolaboratif.

Walau bagaimanapun, menavigasi alam semesta yang diperluas ini memerlukan pertimbangan yang teliti. Memilih model AI melibatkan lebih daripada sekadar membandingkan penanda aras prestasi. Faktor-faktor seperti kualiti dan ketersediaan dokumentasi, responsif komuniti pembangun, kekuatan dan kelemahan khusus model (cth., kecekapan pengekodan lwn. penulisan kreatif lwn. pemahaman pelbagai mod), dan sumber pengkomputeran yang diperlukan untuk menjalankan atau menala halus model dengan berkesan adalah semua elemen penting dalam proses membuat keputusan. Walaupun platform awan menawarkan sumber berskala, potensi untuk menjalankan model berkuasa secara tempatan pada perkakasan yang berkebolehan adalah cadangan menarik yang dimungkinkan oleh beberapa keluaran terbuka.

Tambahan pula, kebangkitan alternatif berkuasa ini tidak dapat dielakkan menimbulkan persoalan strategik untuk pemain sedia ada. Adakah tekanan daripada model sumber terbuka berkualiti tinggi akan memaksa gergasi AI Barat untuk mengguna pakai strategi yang lebih terbuka sendiri, mungkin dengan mengeluarkan model lama atau menawarkan peringkat percuma yang lebih murah hati? Atau adakah mereka akan menggandakan ciri proprietari, kunci masuk ekosistem, dan penyelesaian berfokuskan perusahaan untuk mengekalkan kelebihan mereka? Interaksi kompetitif adalah dinamik dan sentiasa berkembang.

Dimensi geopolitik juga menambah kerumitan, kerana pembangunan keupayaan AI termaju di luar hab Barat tradisional membawa implikasi jangka panjang yang signifikan untuk kepimpinan teknologi dan piawaian global. Apabila alat berkuasa ini menjadi lebih meluas diedarkan, perbincangan mengenai pembangunan AI yang bertanggungjawab, garis panduan etika, dan potensi penyalahgunaan juga menjadi semakin relevan merentasi semua pemain, tanpa mengira asal usul atau model pelesenan mereka. Perlumbaan AI secara tegas telah meluas, menawarkan landskap yang lebih kaya, lebih kompleks, dan akhirnya lebih mudah diakses berbanding sebelum ini. Cabaran dan peluang kini terletak pada memanfaatkan potensi yang diperluas ini secara bertanggungjawab dan berkesan.

dikemaskinikan pada 2025-03-31

# LLM # AIGC # DeepSeek