Perkembangan kecerdasan buatan yang pesat terus berlanjutan tanpa henti, dengan pemain teknologi utama bersaing untuk keunggulan dalam mencipta model yang lebih berkuasa, cekap dan serba boleh. Ke dalam landskap yang sangat kompetitif ini, Meta telah melontarkan cabaran baharu dengan pengumuman siri Llama 4, koleksi model AI asas yang direka untuk memajukan keadaan terkini secara signifikan dan menguasakan pelbagai aplikasi, daripada alat pembangun kepada pembantu yang berhadapan dengan pengguna. Pelancaran ini menandakan detik penting bagi cita-cita AI Meta, memperkenalkan bukan satu, tetapi dua model berbeza yang tersedia serta-merta, sambil mengacah model ketiga, gergasi yang berpotensi membawa perubahan besar yang kini sedang menjalani latihan yang ketat. Keluarga Llama 4 mewakili evolusi strategik, menggabungkan pilihan seni bina terkini dan bertujuan untuk mencabar penanda aras yang ditetapkan oleh pesaing seperti OpenAI, Google, dan Anthropic. Inisiatif ini menekankan komitmen Meta untuk membentuk masa depan AI, baik dengan menyumbang kepada komuniti penyelidikan terbuka (walaupun dengan kaveat tertentu) dan dengan mengintegrasikan keupayaan canggih ini secara langsung ke dalam ekosistem media sosial dan platform komunikasinya yang luas.
Llama 4 Scout: Kuasa dalam Pakej Padat
Mendahului serangan ialah Llama 4 Scout, model yang direka bentuk dengan kecekapan dan kebolehcapaian sebagai terasnya. Meta menonjolkan keupayaan luar biasa Scout untuk beroperasi dengan berkesan sambil cukup padat untuk ‘dimuatkan dalam satu GPU Nvidia H100’. Ini merupakan pencapaian teknikal yang signifikan dan kelebihan strategik. Dalam era di mana sumber pengkomputeran, terutamanya GPU mewah seperti H100, adalah mahal dan mendapat permintaan tinggi, model berkuasa yang boleh berjalan pada satu unit secara dramatik menurunkan halangan kemasukan bagi pembangun, penyelidik dan organisasi yang lebih kecil. Ia membuka kemungkinan untuk menggunakan keupayaan AI yang canggih dalam persekitaran yang terhad sumber, berpotensi membolehkan pemprosesan AI yang lebih setempat atau pada peranti, mengurangkan kependaman dan meningkatkan privasi.
Meta tidak segan silu meletakkan Scout menentang pesaingnya. Syarikat itu menegaskan bahawa Scout mengatasi beberapa model terkenal dalam kelas beratnya, termasuk Gemma 3 dan Gemini 2.0 Flash-Lite dari Google, serta model sumber terbuka Mistral 3.1 yang dihormati secara meluas. Tuntutan ini berdasarkan prestasi ‘merentasi pelbagai penanda aras yang dilaporkan secara meluas’. Walaupun hasil penanda aras sentiasa memerlukan penelitian yang teliti – kerana ia mungkin tidak menangkap semua aspek prestasi dunia sebenar – prestasi yang secara konsisten mengatasi model yang sedia ada menunjukkan Scout memiliki keseimbangan kuasa dan kecekapan yang menarik. Penanda aras ini biasanya menilai keupayaan seperti pemahaman bahasa, penaakulan, penyelesaian masalah matematik dan penjanaan kod. Kecemerlangan merentasi pelbagai bidang menunjukkan Scout bukanlah model khusus tetapi alat serba boleh yang mampu mengendalikan pelbagai tugas dengan berkesan.
Tambahan pula, Llama 4 Scout mempunyai tetingkap konteks 10 juta token yang mengagumkan. Tetingkap konteks pada dasarnya mentakrifkan jumlah maklumat yang boleh ‘diingati’ atau dipertimbangkan oleh model AI pada bila-bila masa semasa perbualan atau tugas. Tetingkap konteks yang lebih besar membolehkan model mengekalkan koheren sepanjang interaksi yang lebih panjang, memahami dokumen yang kompleks, mengikuti arahan yang rumit, dan mengingati butiran dari awal input. Kapasiti 10 juta token adalah besar, membolehkan aplikasi seperti meringkaskan laporan yang panjang, menganalisis pangkalan kod yang luas, atau terlibat dalam dialog berbilang giliran yang berlarutan tanpa kehilangan jejak naratif. Ciri ini secara signifikan meningkatkan utiliti Scout untuk tugas yang kompleks dan intensif maklumat, menjadikannya lebih daripada sekadar alternatif ringan. Gabungan keserasian GPU tunggal dan tetingkap konteks yang besar menjadikan Scout tawaran yang sangat menarik bagi pembangun yang mencari AI berkuasa tanpa memerlukan pelaburan infrastruktur yang besar.
Maverick: Pesaing Arus Perdana
Diletakkan sebagai adik beradik yang lebih berkuasa dalam keluaran awal Llama 4 ialah Llama 4 Maverick. Model ini direka untuk bersaing secara langsung dengan kelas berat dunia AI, membuat perbandingan dengan model hebat seperti GPT-4o OpenAI dan Gemini 2.0 Flash Google. Maverick mewakili usaha Meta untuk kepimpinan dalam bidang AI berskala besar dan berprestasi tinggi, bertujuan untuk menyediakan keupayaan yang boleh mengendalikan tugas AI generatif yang paling mencabar. Ia adalah enjin yang bertujuan untuk menguasakan ciri paling canggih dalam pembantu Meta AI, kini boleh diakses di seluruh web dan disepadukan ke dalam aplikasi komunikasi teras syarikat: WhatsApp, Messenger, dan Instagram Direct.
Meta menekankan kehebatan Maverick dengan membandingkan prestasinya secara positif berbanding pesaing utamanya. Syarikat itu mendakwa Maverick mampu bersaing, dan dalam beberapa senario berpotensi melebihi, keupayaan GPT-4o dan Gemini 2.0 Flash. Perbandingan ini penting, kerana GPT-4o dan keluarga Gemini mewakili model AI terkini yang tersedia secara meluas. Kejayaan di sini membayangkan Maverick mampu melakukan penjanaan bahasa yang bernuansa, penaakulan yang kompleks, penyelesaian masalah yang canggih, dan berpotensi interaksi pelbagai mod (walaupun keluaran awal banyak tertumpu pada penanda aras berasaskan teks).
Menariknya, Meta juga menonjolkan kecekapan Maverick berbanding model berprestasi tinggi yang lain, secara khusus menyebut DeepSeek-V3 dalam domain pengekodan dan tugas penaakulan. Meta menyatakan bahawa Maverick mencapai hasil yang setanding sambil menggunakan ‘kurang daripada separuh parameter aktif’. Dakwaan ini menunjukkan kemajuan ketara dalam seni bina model dan teknik latihan. Parameter, secara kasarnya, ialah pembolehubah yang dipelajari oleh model semasa latihan yang menyimpan pengetahuannya. ‘Parameter aktif’ sering berkaitan dengan seni bina seperti Mixture of Experts (MoE), di mana hanya subset daripada jumlah parameter digunakan untuk sebarang input tertentu. Mencapai prestasi yang sama dengan parameter aktif yang lebih sedikit menunjukkan Maverick mungkin lebih murah dari segi pengkomputeran untuk dijalankan (kos inferens) dan berpotensi lebih pantas daripada model dengan kiraan parameter aktif yang lebih besar, menawarkan nisbah prestasi-per-watt atau prestasi-per-dolar yang lebih baik. Kecekapan ini penting untuk menggunakan AI pada skala operasi Meta, di mana penambahbaikan marginal sekalipun boleh diterjemahkan kepada penjimatan kos yang besar dan pengalaman pengguna yang lebih baik. Oleh itu, Maverick bertujuan untuk mencapai keseimbangan antara prestasi peringkat teratas dan kecekapan operasi, menjadikannya sesuai untuk kedua-dua aplikasi pembangun yang mencabar dan integrasi ke dalam produk yang melayani berbilion pengguna.
Behemoth: Gergasi yang Dinantikan
Walaupun Scout dan Maverick kini tersedia, Meta juga telah mengumumkan pembangunan model yang lebih besar dan berpotensi lebih berkuasa: Llama 4 Behemoth. Seperti namanya, Behemoth dibayangkan sebagai gergasi dalam landskap AI. CEO Meta Mark Zuckerberg secara terbuka menyatakan cita-cita untuk model ini, menggambarkannya sebagai berpotensi ‘model asas berprestasi tertinggi di dunia’ setelah latihannya selesai. Ini menandakan niat Meta untuk menolak sempadan mutlak keupayaan AI.
Skala Behemoth sangat mengagumkan. Meta telah mendedahkan ia memiliki 288 bilion parameter aktif, diambil daripada kumpulan besar 2 trilion jumlah parameter. Ini sangat menunjukkan penggunaan seni bina Mixture of Experts (MoE) yang canggih pada skala yang belum pernah terjadi sebelumnya. Saiz model yang besar menunjukkan ia dilatih pada set data yang luas dan direka untuk menangkap corak dan pengetahuan yang sangat kompleks. Walaupun melatih model sedemikian adalah usaha yang besar, memerlukan sumber pengkomputeran dan masa yang sangat besar, potensi ganjarannya juga sama signifikan.
Walaupun Behemoth belum dikeluarkan, Meta sudah menetapkan jangkaan yang tinggi untuk prestasinya. Syarikat itu mendakwa bahawa, berdasarkan latihan dan penilaian yang sedang berjalan, Behemoth menunjukkan potensi untuk mengatasi pesaing terkemuka seperti GPT-4.5 yang dijangkakan dari OpenAI dan Claude Sonnet 3.7 dari Anthropic, terutamanya ‘pada beberapa penanda aras STEM’. Kejayaan dalam penanda aras Sains, Teknologi, Kejuruteraan, dan Matematik sering dilihat sebagai penunjuk utama keupayaan penaakulan dan penyelesaian masalah lanjutan. Model yang cemerlang dalam bidang ini boleh membuka kunci penemuan dalam penyelidikan saintifik, mempercepatkan proses reka bentuk kejuruteraan, dan menangani cabaran analitikal kompleks yang kini di luar jangkauan AI. Fokus pada STEM menunjukkan Meta melihat Behemoth bukan sahaja sebagai model bahasa, tetapi sebagai enjin yang berkuasa untuk inovasi dan penemuan. Pembangunan Behemoth menggariskan strategi jangka panjang Meta: bukan sahaja untuk bersaing di peringkat tertinggi tetapi berpotensi mentakrifkan semula siling prestasi untuk model AI asas. Pelepasannya akhirnya akan dipantau rapi oleh seluruh komuniti AI.
Di Sebalik Tabir: Kelebihan Mixture of Experts
Peralihan teknologi utama yang menyokong siri Llama 4 ialah penggunaan seni bina ‘mixture of experts’ (MoE) oleh Meta. Ini mewakili evolusi signifikan daripada reka bentuk model monolitik, di mana keseluruhan model memproses setiap input. MoE menawarkan laluan untuk membina model yang jauh lebih besar dan lebih berkebolehan tanpa peningkatan kos pengkomputeran yang berkadar semasa inferens (proses menggunakan model untuk menjana output).
Dalam model MoE, sistem ini terdiri daripada banyak rangkaian ‘pakar’ yang lebih kecil dan khusus. Apabila input (seperti gesaan teks) diterima, mekanisme rangkaian ‘gating’ atau penghala menganalisis input dan menentukan subset pakar mana yang paling sesuai untuk mengendalikan tugas atau jenis maklumat tertentu itu. Hanya pakar terpilih ini diaktifkan untuk memproses input, manakala yang lain kekal tidak aktif. Pengkomputeran bersyarat ini adalah kelebihan teras MoE.
Faedahnya ada dua:
- Kebolehskalaan: Ia membolehkan pembangun meningkatkan jumlah parameter secara dramatik dalam model (seperti 2 trilion dalam Behemoth) kerana hanya sebahagian kecil daripadanya (parameter aktif, cth., 288 bilion untuk Behemoth) yang terlibat untuk sebarang inferens tunggal. Ini membolehkan model menyimpan jumlah pengetahuan yang jauh lebih besar dan mempelajari fungsi yang lebih khusus dalam rangkaian pakarnya.
- Kecekapan: Kerana hanya sebahagian daripada model yang aktif pada bila-bila masa, kos pengkomputeran dan penggunaan tenaga yang diperlukan untuk inferens boleh menjadi jauh lebih rendah berbanding model padat dengan saiz parameter keseluruhan yang serupa. Ini menjadikan pengendalian model yang sangat besar lebih praktikal dan ekonomik, terutamanya pada skala besar.
Penyebutan eksplisit Meta tentang peralihan kepada MoE untuk Llama 4 menunjukkan seni bina ini adalah pusat untuk mencapai matlamat prestasi dan kecekapan yang ditetapkan untuk Scout, Maverick, dan terutamanya Behemoth yang gergasi. Walaupun seni bina MoE memperkenalkan kerumitannya sendiri, terutamanya dalam melatih rangkaian ‘gating’ dengan berkesan dan mengurus komunikasi antara pakar, penggunaannya oleh pemain utama seperti Meta menandakan kepentingannya yang semakin meningkat dalam menolak sempadan pembangunan AI. Pilihan seni bina ini berkemungkinan merupakan faktor utama di sebalik kecekapan yang didakwa Maverick terhadap DeepSeek-V3 dan skala besar yang dibayangkan untuk Behemoth.
Strategi Pengedaran: Akses Terbuka dan Pengalaman Bersepadu
Meta sedang meneruskan strategi serampang dua mata untuk penyebaran dan penggunaan model Llama 4, mencerminkan keinginan untuk memupuk ekosistem pembangun yang luas dan memanfaatkan pangkalan penggunanya sendiri yang besar.
Pertama, Llama 4 Scout dan Llama 4 Maverick disediakan untuk dimuat turun. Pembangun dan penyelidik boleh mendapatkan model secara langsung daripada Meta atau melalui platform popular seperti Hugging Face, hab pusat untuk komuniti pembelajaran mesin. Pendekatan ini menggalakkan eksperimen, membolehkan pihak luar membina aplikasi di atas Llama 4, dan memudahkan penelitian dan pengesahan bebas terhadap keupayaan model. Dengan menawarkan model untuk dimuat turun, Meta menyumbang kepada landskap AI yang lebih luas, membolehkan inovasi di luar pasukan produknya sendiri. Ini sejajar, sekurang-kurangnya sebahagiannya, dengan etos penyelidikan dan pembangunan terbuka yang secara sejarah telah mempercepatkan kemajuan dalam bidang ini.
Kedua, dan serentak, Meta secara mendalam mengintegrasikan keupayaan Llama 4 ke dalam produknya sendiri. Pembantu Meta AI, yang dikuasakan oleh model baharu ini, sedang dilancarkan di seluruh kehadiran web syarikat dan, mungkin lebih signifikan, dalam aplikasi komunikasinya yang digunakan secara meluas: WhatsApp, Messenger, dan Instagram Direct. Ini serta-merta meletakkan alat AI canggih ke tangan berpotensi berbilion pengguna di seluruh dunia. Integrasi ini mempunyai pelbagai tujuan strategik: ia memberikan nilai segera kepada pengguna platform Meta, menjana sejumlah besar data interaksi dunia sebenar (yang boleh menjadi sangat berharga untuk penambahbaikan model selanjutnya, tertakluk kepada pertimbangan privasi), dan meletakkan aplikasi Meta sebagai platform terkini yang diselitkan dengan kecerdasan AI. Ia mewujudkan gelung maklum balas yang kuat dan memastikan Meta mendapat manfaat secara langsung daripada kemajuan AI sendiri dengan meningkatkan perkhidmatan terasnya.
Strategi dwi ini berbeza dengan pendekatan yang diambil oleh sesetengah pesaing. Walaupun OpenAI terutamanya menawarkan akses melalui API (seperti untuk GPT-4) dan Google mengintegrasikan Gemini secara mendalam ke dalam perkhidmatannya sambil juga menawarkan akses API, penekanan Meta untuk menjadikan model itu sendiri boleh dimuat turun (dengan syarat pelesenan) mewakili pendekatan tersendiri yang bertujuan untuk menangkap perkongsian minda dalam kedua-dua komuniti pembangun dan pasaran pengguna akhir.
Persoalan Sumber Terbuka: Teka-teki Pelesenan
Meta secara konsisten merujuk kepada keluaran model Llama, termasuk Llama 4, sebagai ‘sumber terbuka’. Walau bagaimanapun, penamaan ini telah menjadi titik pertikaian yang berulang dalam komuniti teknologi, terutamanya disebabkan oleh terma khusus lesen Llama. Walaupun model tersebut sememangnya disediakan untuk digunakan dan diubah suai oleh orang lain, lesen tersebut mengenakan sekatan tertentu yang menyimpang daripada definisi standard sumber terbuka yang diperjuangkan oleh organisasi seperti Open Source Initiative (OSI).
Sekatan yang paling signifikan melibatkan penggunaan komersial berskala besar. Lesen Llama 4 menetapkan bahawa entiti komersial yang mempunyai lebih daripada 700 juta pengguna aktif bulanan (MAU) mesti mendapatkan kebenaran eksplisit daripada Meta sebelum menggunakan atau memanfaatkan model Llama 4. Ambang ini secara berkesan menghalang syarikat teknologi terbesar – pesaing langsung yang berpotensi kepada Meta – daripada menggunakan Llama 4 secara bebas untuk meningkatkan perkhidmatan mereka sendiri tanpa persetujuan Meta.
Sekatan ini menyebabkan Open Source Initiative, penjaga prinsip sumber terbuka yang diiktiraf secara meluas, menyatakan sebelum ini (mengenai Llama 2, yang mempunyai terma serupa) bahawa syarat sedemikian mengeluarkan lesen itu ‘daripada kategori ‘Sumber Terbuka’’. Lesen sumber terbuka yang sebenar, menurut definisi OSI, tidak boleh mendiskriminasi bidang usaha atau orang atau kumpulan tertentu, dan ia secara amnya membenarkan penggunaan komersial yang luas tanpa memerlukan kebenaran khas berdasarkan saiz atau kedudukan pasaran pengguna.
Pendekatan Meta boleh dilihat sebagai satu bentuk lesen ‘sumber tersedia’ atau ‘komuniti’ dan bukannya sumber terbuka semata-mata. Rasional di sebalik strategi pelesenan ini mungkin pelbagai aspek. Ia membolehkan Meta meraih muhibah dan memupuk inovasi dalam komuniti pembangun dan penyelidik yang lebih luas dengan menyediakan akses kepada model yang berkuasa. Pada masa yang sama, ia melindungi kepentingan strategik Meta dengan menghalang pesaing terbesarnya daripada memanfaatkan pelaburan AI yang signifikan secara langsung terhadapnya. Walaupun pendekatan pragmatik ini mungkin memenuhi matlamat perniagaan Meta, penggunaan istilah ‘sumber terbuka’ tetap kontroversial, kerana ia boleh menimbulkan kekeliruan dan berpotensi mencairkan makna istilah yang membawa konotasi khusus kebebasan dan akses tanpa had dalam dunia pembangunan perisian. Perdebatan yang berterusan ini menonjolkan persimpangan kompleks antara kerjasama terbuka, strategi korporat, dan harta intelek dalam bidang kecerdasan buatan yang berkembang pesat.
Meta merancang untuk berkongsi butiran lanjut mengenai peta jalan AI dan berinteraksi dengan komuniti pada persidangan LlamaCon yang akan datang, dijadualkan pada 29 April. Acara ini berkemungkinan akan memberikan lebih banyak pandangan tentang asas teknikal Llama 4, lelaran masa depan yang berpotensi, dan visi syarikat yang lebih luas untuk peranan AI dalam ekosistemnya dan seterusnya. Pelancaran Llama 4 Scout dan Maverick, bersama dengan janji Behemoth, jelas menandakan keazaman Meta untuk menjadi kuasa utama dalam revolusi AI, membentuk trajektorinya melalui inovasi teknologi dan penyebaran strategik.