Meta Luaskan Horizon AI dengan Suite Model Llama 4

Kepantasan kemajuan dalam kecerdasan buatan (AI) terus berlanjutan tanpa henti, dan Meta Platforms, Inc. telah dengan tegas memberi isyarat hasratnya untuk kekal sebagai pemain utama dengan pengenalan siri model AI Llama 4 miliknya. Generasi baharu ini mewakili evolusi penting dalam keupayaan AI Meta, direka bukan sahaja untuk memperkasakan ekosistem aplikasi syarikat yang luas tetapi juga untuk disediakan kepada komuniti pembangun yang lebih luas. Dua model berbeza membentuk barisan hadapan pelancaran ini: Llama 4 Scout dan Llama 4 Maverick, masing-masing disesuaikan untuk skala operasi dan sasaran prestasi yang berbeza. Tambahan pula, Meta telah menarik perhatian dunia AI dengan bayangan model yang lebih berkuasa yang sedang dibangunkan, Llama 4 Behemoth, meletakkannya sebagai pesaing masa depan di puncak prestasi AI. Pelancaran pelbagai serampang ini menekankan komitmen Meta untuk menolak sempadan model bahasa besar (LLM) dan bersaing secara agresif dalam bidang yang didominasi oleh gergasi seperti OpenAI, Google, dan Anthropic.

Membongkar Duo Llama 4: Scout dan Maverick Menjadi Tumpuan Utama

Pelancaran awal Meta memberi tumpuan kepada dua model yang direka untuk menangani segmen landskap AI yang berbeza. Ia mewakili usaha strategik untuk menawarkan kedua-dua kuasa yang boleh diakses dan prestasi mewah, memenuhi pelbagai pengguna dan aplikasi yang berpotensi.

Llama 4 Scout: Kuasa Padat dengan Memori Luas

Yang pertama daripada pasangan itu, Llama 4 Scout, direka bentuk dengan mengambil kira kecekapan dan kebolehcapaian. Meta menonjolkan jejaknya yang agak sederhana, menyatakan ia mampu ‘dimuatkan dalam satu GPU Nvidia H100.’ Ini adalah perincian penting dalam iklim AI semasa, di mana akses kepada sumber pengkomputeran berprestasi tinggi, terutamanya GPU yang dicari seperti H100, boleh menjadi halangan besar bagi pembangun dan organisasi. Dengan mereka bentuk Scout untuk beroperasi dalam lingkungan satu unit sedemikian, Meta berpotensi menurunkan halangan kemasukan untuk memanfaatkan keupayaan AI lanjutan.

Walaupun sifatnya yang padat, Scout dipersembahkan sebagai pelaku yang hebat. Meta menegaskan bahawa ia mengatasi beberapa model yang mantap dalam kelasnya, termasuk Gemma 3 dan Gemini 2.0 Flash-Lite Google, serta model sumber terbuka popular Mistral 3.1. Tuntutan ini berdasarkan prestasi ‘merentasi pelbagai penanda aras yang dilaporkan secara meluas,’ mencadangkan kecekapan dalam pelbagai tugas AI standard yang direka untuk mengukur penaakulan, pemahaman bahasa, dan kebolehan menyelesaikan masalah.

Mungkin salah satu ciri Scout yang paling menarik ialah tetingkap konteks 10 juta tokennya. Tetingkap konteks mentakrifkan jumlah maklumat yang boleh disimpan oleh model AI dalam memori aktifnya semasa memproses permintaan. Tetingkap konteks yang lebih besar membolehkan model memahami dan merujuk dokumen yang lebih panjang, mengekalkan koheren sepanjang perbualan yang panjang, dan menangani tugas yang lebih kompleks yang memerlukan pengekalan sejumlah besar maklumat. Kapasiti 10 juta token adalah besar, membolehkan aplikasi berpotensi dalam bidang seperti analisis dokumen terperinci, interaksi chatbot canggih yang mengingati dialog lalu dengan tepat, dan penjanaan kod kompleks berdasarkan pangkalan kod yang besar. Memori besar ini, digabungkan dengan kecekapan dan prestasi penanda aras yang didakwa, meletakkan Scout sebagai alat serba boleh untuk pembangun yang mencari keseimbangan antara keperluan sumber dan keupayaan lanjutan.

Llama 4 Maverick: Meningkatkan Skala untuk Persaingan Berisiko Tinggi

Diletakkan sebagai adik-beradik yang lebih berkuasa, Llama 4 Maverick menyasarkan hujung spektrum prestasi yang lebih tinggi, membuat perbandingan dengan pemain industri kelas berat seperti GPT-4o OpenAI dan Gemini 2.0 Flash Google. Ini menunjukkan Maverick direka untuk tugas yang menuntut nuansa, kreativiti, dan penaakulan kompleks yang lebih hebat. Meta menekankan kelebihan daya saing Maverick, mendakwa prestasi unggul terhadap pesaing terkemuka ini berdasarkan ujian dalaman dan hasil penanda aras.

Aspek menarik profil Maverick ialah kecekapan yang didakwa berbanding kuasanya. Meta menunjukkan bahawa Maverick mencapai hasil yang setanding dengan DeepSeek-V3 khususnya dalam tugas pengekodan dan penaakulan, sambil menggunakan ‘kurang daripada separuh parameter aktif.’ Parameter dalam model AI adalah serupa dengan sambungan antara neuron dalam otak; lebih banyak parameter secara amnya berkorelasi dengan potensi kerumitan dan keupayaan yang lebih besar, tetapi juga kos pengkomputeran yang lebih tinggi. Jika Maverick sememangnya boleh memberikan prestasi peringkat teratas dengan parameter aktif yang jauh lebih sedikit (terutamanya apabila menggunakan teknik seperti Mixture of Experts, dibincangkan kemudian), ia mewakili pencapaian ketara dalam pengoptimuman model, berpotensi membawa kepada masa tindak balas yang lebih pantas dan mengurangkan kos operasi berbanding model berkemampuan serupa. Fokus pada kecekapan di samping kuasa mentah ini boleh menjadikan Maverick pilihan yang menarik untuk organisasi yang memerlukan AI canggih tanpa semestinya menanggung overhed pengkomputeran maksimum mutlak.

Kedua-dua Scout dan Maverick disediakan untuk dimuat turun terus dari Meta dan melalui Hugging Face, platform popular untuk berkongsi model dan set data AI. Strategi pengedaran ini bertujuan untuk memupuk penggunaan dalam komuniti penyelidikan dan pembangunan, membolehkan pihak luar menilai, membina, dan mengintegrasikan model ini ke dalam projek mereka sendiri.

Menyulam AI ke dalam Fabrik Sosial: Integrasi Llama 4 Merentasi Platform Meta

Secara kritikal, model Llama 4 bukan sekadar konstruk teori atau alat semata-mata untuk pembangun luar. Meta segera menggunakan teknologi baharu ini untuk meningkatkan produk yang dihadapi penggunanya sendiri. Pembantu Meta AI, AI perbualan syarikat yang direka untuk membantu pengguna merentasi pelbagai perkhidmatannya, kini dikuasakan oleh Llama 4.

Integrasi ini merangkumi platform paling popular Meta:

  • Antara muka Web untuk Meta AI: Menyediakan portal khusus untuk pengguna berinteraksi dengan pembantu yang dipertingkatkan.
  • WhatsApp: Membawa keupayaan AI lanjutan terus ke dalam aplikasi pemesejan yang paling banyak digunakan di dunia.
  • Messenger: Meningkatkan platform komunikasi utama Meta yang lain dengan kuasa Llama 4.
  • Instagram: Mengintegrasikan ciri AI yang berpotensi berkaitan dengan penciptaan kandungan, carian, atau pemesejan langsung dalam rangkaian sosial yang berpusatkan visual.

Penggunaan meluas ini menandakan langkah besar dalam menjadikan keupayaan AI lanjutan tersedia secara ambien dan boleh diakses oleh berbilion pengguna. Bagi pengguna akhir, ini boleh diterjemahkan kepada interaksi yang lebih membantu, peka konteks, dan berkebolehan dengan pembantu Meta AI. Tugas seperti meringkaskan utas sembang yang panjang, merangka mesej, menjana format teks kreatif, mencari maklumat, atau bahkan mencipta imej mungkin menjadi jauh lebih canggih dan boleh dipercayai.

Dari perspektif Meta, integrasi ini mempunyai pelbagai tujuan strategik. Pertama, ia meningkatkan pengalaman pengguna merentasi produk terasnya, berpotensi meningkatkan penglibatan dan kelekatan platform. Kedua, ia menyediakan medan ujian dunia nyata yang tiada tandingan untuk Llama 4, menjana sejumlah besar data interaksi (diandaikan tanpa nama dan digunakan mengikut dasar privasi) yang boleh menjadi tidak ternilai untuk mengenal pasti bidang penambahbaikan dan melatih lelaran model masa depan. Ia secara berkesan mencipta gelung maklum balas yang kuat, memanfaatkan pangkalan pengguna Meta yang besar untuk memperhalusi teknologi AI secara berterusan. Integrasi ini menjadikan usaha AI Meta sangat kelihatan dan memberi kesan langsung kepada perniagaan utamanya.

Bayangan Behemoth: Sekilas Pandang Ambisi Peringkat Tinggi Meta

Walaupun Scout dan Maverick mewakili masa kini, Meta sudah memberi isyarat trajektori masa depannya dengan Llama 4 Behemoth. Model ini, yang masih menjalani proses latihan intensif, diletakkan sebagai kuasa utama Meta, direka untuk bersaing di puncak keupayaan AI. CEO Meta Mark Zuckerberg dengan berani mendakwa ia bertujuan untuk menjadi ‘model asas berprestasi tertinggi di dunia.’

Statistik yang dikongsi mengenai Behemoth sangat mengejutkan: ia dilaporkan mempunyai 288 bilion parameter aktif, diambil daripada jumlah kumpulan 2 trilion parameter. Skala besar ini meletakkannya dengan kukuh dalam kategori model perbatasan, setanding saiznya atau berpotensi melebihi beberapa model terbesar yang kini tersedia atau dikhabarkan. Perbezaan antara parameter ‘aktif’ dan ‘jumlah’ kemungkinan besar menunjukkan penggunaan seni bina Mixture of Experts (MoE), di mana hanya sebahagian kecil daripada jumlah parameter yang terlibat untuk sebarang tugas tertentu, membolehkan skala besar tanpa kos pengkomputeran yang berkadar besar semasa inferens.

Walaupun Behemoth belum dikeluarkan, Meta sudah membuat tuntutan prestasi berdasarkan pembangunannya yang berterusan. Syarikat itu mencadangkan ia boleh mengatasi pesaing hebat seperti GPT-4.5 (diandaikan model OpenAI hipotetikal atau akan datang) dan Claude Sonnet 3.7 (model yang dijangkakan daripada Anthropic) khususnya ‘pada beberapa penanda aras STEM.’ Penanda aras STEM (Sains, Teknologi, Kejuruteraan, dan Matematik) adalah ujian yang sangat mencabar yang direka untuk menilai keupayaan AI dalam bidang seperti penaakulan matematik kompleks, pemahaman saintifik, dan kecekapan pengekodan. Kejayaan dalam domain ini sering dilihat sebagai penunjuk utama keupayaan kognitif lanjutan model.

Pembangunan Behemoth menekankan cita-cita Meta untuk bukan sahaja mengambil bahagian dalam perlumbaan AI tetapi untuk memimpinnya, mencabar secara langsung pesaing yang dianggap sebagai peneraju. Melatih model gergasi seperti itu memerlukan sumber pengkomputeran yang besar, kepakaran kejuruteraan yang signifikan, dan set data yang luas, menonjolkan skala pelaburan Meta dalam penyelidikan dan pembangunan AI. Pelancaran Behemoth akhirnya, bila-bila masa ia berlaku, akan dipantau dengan teliti sebagai penanda aras baharu yang berpotensi untuk prestasi AI terkini.

Evolusi Seni Bina: Menerima Mixture of Experts (MoE)

Peralihan teknikal utama yang menyokong generasi Llama 4 ialah penggunaan seni bina ‘mixture of experts’ (MoE) oleh Meta. Ini mewakili penyimpangan yang signifikan daripada seni bina model padat tradisional, di mana semua bahagian model diaktifkan untuk setiap pengiraan.

Dalam seni bina MoE, model secara konseptual dibahagikan kepada beberapa sub-rangkaian ‘pakar’ yang lebih kecil, masing-masing mengkhusus dalam jenis data atau tugas yang berbeza. Mekanisme penghadangan (gating mechanism), pada dasarnya pengawal trafik, menghalakan data masuk hanya kepada pakar yang paling relevan yang diperlukan untuk memproses maklumat khusus tersebut.

Kelebihan utama pendekatan ini ialah:

  1. Kecekapan Pengkomputeran: Dengan mengaktifkan hanya sebahagian kecil daripada jumlah parameter model untuk sebarang input tertentu, model MoE boleh menjadi jauh lebih pantas dan kurang mahal dari segi pengkomputeran semasa inferens (proses menjana output) berbanding model padat dengan jumlah saiz yang sama. Ini penting untuk menggunakan model besar secara kos efektif dan mencapai kependaman yang lebih rendah dalam interaksi pengguna.
  2. Kebolehskalaan: MoE membolehkan penciptaan model dengan jumlah kiraan parameter yang jauh lebih besar (seperti 2 trilion Behemoth) tanpa peningkatan linear yang sepadan dalam keperluan pengkomputeran untuk setiap langkah inferens. Ini membolehkan penskalaan kapasiti model melebihi apa yang mungkin praktikal dengan seni bina padat.
  3. Pengkhususan: Setiap pakar berpotensi membangunkan pengetahuan yang sangat khusus, membawa kepada prestasi yang lebih baik pada jenis tugas tertentu berbanding model monolitik tunggal yang cuba mengendalikan segala-galanya.

Peralihan Meta kepada MoE untuk Llama 4 sejajar dengan trend yang lebih luas dalam industri AI, dengan syarikat seperti Google dan Mistral AI juga menggunakan teknik ini dalam model terkemuka mereka. Ia mencerminkan pemahaman yang semakin meningkat bahawa inovasi seni bina adalah sama pentingnya dengan skala semata-mata dalam menolak sampul prestasi sambil menguruskan kos pembangunan dan penggunaan AI yang semakin meningkat. Pilihan seni bina ini kemungkinan besar menyumbang secara signifikan kepada tuntutan prestasi dan kecekapan yang dibuat untuk kedua-dua Maverick (mencapai prestasi tinggi dengan parameter aktif yang lebih sedikit) dan kebolehlaksanaan melatih model Behemoth yang besar. Spesifik pelaksanaan MoE Meta akan menjadi minat utama kepada penyelidik AI.

Kerumitan ‘Terbuka’: Llama 4 dan Persoalan Pelesenan

Meta terus melabelkan model Llama-nya, termasuk keluarga Llama 4 baharu, sebagai ‘open-source.’ Terminologi ini, bagaimanapun, kekal menjadi titik pertikaian dalam komuniti teknologi disebabkan oleh terma khusus lesen Llama. Walaupun model tersebut sememangnya disediakan secara terbuka untuk dimuat turun dan diubah suai, lesen tersebut termasuk sekatan yang membezakannya daripada definisi sumber terbuka tradisional.

Sekatan yang paling ketara menetapkan bahawa entiti komersial yang mempunyai lebih daripada 700 juta pengguna aktif bulanan (MAU) mesti mendapatkan kebenaran khusus daripada Meta sebelum menggunakan model Llama 4 dalam produk atau perkhidmatan mereka. Ambang ini secara berkesan menyasarkan pesaing terbesar Meta – syarikat seperti Google, Microsoft, Apple, ByteDance, dan berpotensi yang lain – menghalang mereka daripada memanfaatkan teknologi AI canggih Meta secara bebas tanpa perjanjian berasingan.

Pendekatan pelesenan ini telah menarik kritikan, terutamanya daripada Open Source Initiative (OSI), penjaga definisi sumber terbuka yang dihormati secara meluas. Pada tahun 2023, mengenai versi Llama terdahulu dengan sekatan yang serupa, OSI menyatakan bahawa batasan sedemikian mengeluarkan lesen ‘daripada kategori ‘Open Source’.’ Prinsip teras sumber terbuka yang ditakrifkan OSI ialah tanpa diskriminasi, bermakna lesen tidak boleh menyekat siapa yang boleh menggunakan perisian atau untuk tujuan apa, termasuk penggunaan komersial oleh pesaing besar.

Strategi Meta boleh ditafsirkan sebagai satu bentuk ‘akses terbuka’ atau ‘pelesenan komuniti’ dan bukannya sumber terbuka tulen. Ia membolehkan akses luas untuk penyelidik, syarikat permulaan, syarikat kecil, dan pembangun individu, memupuk inovasi dan membina ekosistem di sekitar Llama. Ini boleh mempercepatkan pembangunan, mengenal pasti pepijat, dan menjana muhibah. Walau bagaimanapun, sekatan ke atas pemain besar melindungi kedudukan kompetitif Meta, menghalang pesaing langsungnya daripada dengan mudah menggabungkan kemajuan Llama ke dalam perkhidmatan AI mereka sendiri yang berpotensi bersaing.

Pendekatan bernuansa ini mencerminkan pertimbangan strategik yang kompleks bagi syarikat yang melabur berbilion-bilion dalam pembangunan AI. Mereka mencari faedah penglibatan komuniti dan penggunaan meluas sambil melindungi kelebihan teknologi teras mereka terhadap musuh pasaran utama mereka. Perdebatan ini menonjolkan sifatketerbukaan yang berkembang dalam dunia AI generatif yang berisiko tinggi, di mana garis antara pembangunan kolaboratif dan strategi kompetitif semakin kabur. Pembangun dan organisasi yang mempertimbangkan Llama 4 mesti menyemak terma lesen dengan teliti untuk memastikan pematuhan, terutamanya jika mereka beroperasi pada skala yang signifikan.

Kalkulus Strategik: Llama 4 dalam Arena AI Besar

Pelancaran Llama 4 adalah lebih daripada sekadar kemas kini teknikal; ia adalah gerakan strategik yang signifikan oleh Meta dalam perlumbaan senjata AI yang sedang berlangsung. Dengan mengeluarkan Scout, Maverick, dan pratonton Behemoth, Meta menegaskan kedudukannya sebagai pembangun utama model AI asas, yang mampu bersaing merentasi peringkat prestasi yang berbeza.

Beberapa elemen strategik jelas kelihatan:

  • Kedudukan Kompetitif: Perbandingan langsung dengan model dari OpenAI, Google, Mistral, dan DeepSeek menunjukkan niat Meta untuk mencabar pemimpin yang mantap dan alternatif sumber terbuka terkemuka secara langsung. Menawarkan model yang didakwa berdaya saing atau unggul pada penanda aras utama bertujuan untuk menarik perhatian pembangun dan bahagian pasaran.
  • Peningkatan Ekosistem: Mengintegrasikan Llama 4 ke dalam WhatsApp, Messenger, dan Instagram segera memanfaatkan pangkalan pengguna Meta yang besar, memberikan peningkatan produk yang ketara dan mengukuhkan nilai platformnya.
  • Penglibatan Komuniti Pembangun: Menjadikan Scout dan Maverick boleh dimuat turun memupuk komuniti di sekitar Llama, menggalakkan inovasi luaran dan berpotensi mewujudkan saluran bakat dan idea yang boleh dimanfaatkan oleh Meta. Pelesenan ‘terbuka’, walaupun dengan kaveatnya, masih lebih permisif daripada pendekatan tertutup beberapa pesaing seperti model paling canggih OpenAI.
  • Kemajuan Seni Bina: Peralihan kepada MoE menandakan kecanggihan teknikal dan fokus pada penskalaan mampan, menangani cabaran kritikal kos pengkomputeran yang berkaitan dengan model yang semakin besar.
  • Penetapan Rentak Masa Depan: Mengumumkan Behemoth menetapkan jangkaan dan memberi isyarat komitmen jangka panjang kepada penyelidikan AI perbatasan, memastikan Meta relevan dalam perbincangan mengenai trajektori masa depan kecerdasan am buatan (AGI).

Persidangan LlamaCon yang akan datang, dijadualkan pada 29 April, bersedia menjadi tempat utama bagi Meta untuk menghuraikan lebih lanjut strategi AI-nya, memberikan penyelaman teknikal yang lebih mendalam ke dalam model Llama 4, berpotensi mendedahkan lebih lanjut mengenai kemajuan Behemoth, dan mempamerkan aplikasi yang dibina menggunakan teknologinya. Acara khusus ini menekankan kepentingan Llama kepada rancangan masa depan Meta.

Pelancaran Llama 4 berlaku dengan latar belakang inovasi yang sangat pesat merentasi landskap AI. Model dan keupayaan baharu diumumkan dengan kerap, dan penanda aras prestasi sentiasa ditetapkan semula. Keupayaan Meta untuk melaksanakan pelan hala tuju Llama 4, menepati tuntutan prestasinya melalui pengesahan bebas, dan terus berinovasi akan menjadi penting untuk mengekalkan momentumnya dalam bidang yang dinamik dan sangat kompetitif ini. Interaksi antara pembangunan proprietari, penglibatan komuniti, dan pelesenan strategik akan terus membentuk peranan dan pengaruh Meta dalam era transformatif kecerdasan buatan.