Llama Meta: Daripada Canggih ke Terutama?

Komuniti kecerdasan buatan (AI) telah meneliti dan memperdebatkan trajektori model bahasa besar (LLM) Meta, Llama, secara mendalam. Kira-kira setahun memisahkan pelancaran Llama 3 dan Llama 4, satu jangka masa yang lama dalam landskap AI yang berkembang pesat. Walaupun pada mulanya diuar-uarkan sebagai alternatif sumber terbuka yang inovatif kepada model proprietari seperti tawaran OpenAI, perkembangan baru-baru ini mencadangkan perubahan dalam persepsi, dengan sesetengah pihak mempersoalkan kerelevanan berterusan Llama di barisan hadapan inovasi AI.

Kekecewaan LlamaCon dan Perubahan Jangkaan

Di LlamaCon, persidangan sulung Meta yang didedikasikan untuk LLM sumber terbukanya, suasana jangkaan yang tidak dipenuhi menyelubungi atmosfera. Beberapa pembangun yang hadir mengakui bahawa mereka menjangkakan pelancaran model penaakulan yang canggih, atau sekurang-kurangnya model tradisional yang mampu mengatasi pesaing seperti V3 DeepSeek dan Qwen, yang terakhir merupakan suite model yang dibangunkan oleh bahagian pengkomputeran awan Alibaba.

Ketiadaan pengumuman sedemikian mencetuskan kebimbangan bahawa Llama kehilangan kedudukannya dalam perlumbaan untuk penguasaan AI. Hanya sebulan sebelum persidangan itu, Meta telah melancarkan generasi keempat keluarga Llama, termasuk model berat terbuka Llama 4 Scout dan Llama 4 Maverick. Scout direka untuk prestasi cekap pada satu GPU, manakala Maverick direka sebagai model yang lebih besar untuk menyaingi model asas lain.

Selain Scout dan Maverick, Meta memberikan pratonton Llama 4 Behemoth, "model guru" yang jauh lebih besar yang masih menjalani latihan. Tujuan Behemoth adalah untuk memudahkan penyulingan, teknik untuk mencipta model yang lebih kecil dan khusus daripada model yang lebih besar dan lebih umum.

Walau bagaimanapun, laporan muncul yang menunjukkan kelewatan dalam pelepasan Behemoth dan cabaran dalam mencapai prestasi yang kompetitif dengan suite Llama 4. Walaupun dakwaan Meta mengenai keupayaan canggih, persepsi di kalangan beberapa pembangun adalah bahawa Llama tidak lagi menerajui.

Kebangkitan Pesaing: Qwen dan DeepSeek

Kekecewaan di sekitar LlamaCon dan model Llama 4 mencerminkan sentimen yang lebih luas bahawa LLM sumber terbuka Meta kehilangan momentum dari segi prestasi teknikal dan semangat pembangun. Walaupun Meta menekankan komitmennya terhadap prinsip sumber terbuka, pembinaan ekosistem dan inovasi, pesaing seperti DeepSeek, Qwen dan OpenAI pesat maju dalam bidang kritikal seperti penaakulan, penggunaan alat dan penggunaan dunia sebenar.

Seorang pembangun, Vineeth Sai Varikuntla, menyatakan kekecewaannya, menyatakan bahawa dia berharap Llama akan mengatasi Qwen dan DeepSeek dalam kes penggunaan umum dan penaakulan, tetapi mendapati Qwen jauh lebih maju.

Sentimen ini menggariskan cabaran yang dihadapi oleh Meta dalam mengekalkan kedudukan Llama sebagai LLM sumber terbuka yang terkemuka. Walaupun keluaran awal Llama mendapat perhatian dan pujian yang ketara, kemunculan alternatif yang semakin berkemampuan telah meningkatkan lagi landskap persaingan.

Permulaan yang Menjanjikan: Impak Llama 2

Untuk menghargai sepenuhnya naratif semasa di sekitar Llama, adalah penting untuk mengingati asal-usulnya dan keterujaan awal yang dijana. Pada tahun 2023, Ketua Pegawai Eksekutif Nvidia, Jensen Huang memuji pelancaran Llama 2 sebagai "mungkin acara terbesar dalam AI" tahun itu. Menjelang Julai 2024, pelepasan Llama 3 dianggap sebagai kejayaan, yang mewakili LLM terbuka pertama yang mampu mencabar penguasaan OpenAI.

Ketibaan Llama 3 mencetuskan lonjakan segera dalam permintaan untuk kuasa pengkomputeran, yang membawa kepada peningkatan harga sewa GPU, menurut Dylan Patel, ketua penganalisis di SemiAnalysis. Carian Google untuk "Meta" dan "Llama" juga memuncak dalam tempoh ini, menunjukkan minat yang meluas terhadap model baharu itu.

Llama 3 diraikan sebagai LLM buatan Amerika, terbuka dan peringkat teratas. Walaupun ia tidak secara konsisten mendahului penanda aras industri, ia memberikan pengaruh dan kerelevanan yang besar dalam komuniti AI. Walau bagaimanapun, dinamik ini beransur-ansur berubah.

Peralihan dan Kritikan Seni Bina

Model Llama 4 memperkenalkan seni bina "campuran pakar", reka bentuk yang dipopularkan oleh DeepSeek. Seni bina ini membolehkan model mengaktifkan hanya kepakaran yang paling relevan untuk tugas tertentu, dengan itu meningkatkan kecekapan.

Walau bagaimanapun, keluaran Llama 4 disambut dengan kritikan apabila pembangun mendapati bahawa versi yang digunakan untuk penanda aras awam berbeza daripada versi yang tersedia untuk muat turun dan penggunaan. Percanggahan ini membawa kepada tuduhan "memainkan papan pemimpin," yang dinafikan oleh Meta, menyatakan bahawa varian yang dipersoalkan adalah eksperimen dan menilai pelbagai versi model adalah amalan biasa.

Walaupun penjelasan Meta, kontroversi itu menyumbang kepada persepsi bahawa Llama sedang bergelut untuk mengekalkan kelebihan daya saingnya. Memandangkan model pesaing terus maju, Meta seolah-olah tidak mempunyai hala tuju yang jelas.

Mengukur Penerimaan Pembangun: Tugas yang Kompleks

Menentukan keluarga LLM mana yang paling popular di kalangan pembangun adalah tugas yang mencabar. Walau bagaimanapun, data yang tersedia menunjukkan bahawa model terbaru Llama bukan antara pemimpin.

Qwen, khususnya, secara konsisten berada di kedudukan tinggi di pelbagai papan pemimpin di seluruh internet. Menurut Artificial Analysis, tapak yang meletakkan kedudukan model berdasarkan prestasi, Llama 4 Maverick dan Scout diletakkan tepat di atas model GPT-4 OpenAI (dikeluarkan pada akhir tahun sebelumnya) dan di bawah Grok xAI dan Claude Anthropic dari segi kecerdasan.

OpenRouter, platform yang menyediakan pembangun dengan akses kepada pelbagai model dan menerbitkan papan pemimpin berdasarkan penggunaan API, menunjukkan Llama 3.3 antara 20 model teratas pada awal Mei, tetapi bukan Llama 4.

Titik data ini, walaupun tidak muktamad, menunjukkan bahawa lelaran terbaru Llama tidak bergema sekuat pendahulunya di kalangan pembangun.

Melangkaui Penanda Aras: Penggunaan Alat dan Penaakulan

Walaupun penilaian standard Llama 4 mungkin kurang memberangsangkan, pakar berpendapat bahawa semangat yang diredam berpunca daripada faktor di luar metrik prestasi mentah.

AJ Kourabi, seorang penganalisis di SemiAnalysis, menekankan kepentingan "panggilan alat" dan keupayaan model untuk melangkaui fungsi chatbot yang ringkas. Panggilan alat merujuk kepada kapasiti model untuk mengakses dan mengarahkan aplikasi lain di internet atau pada peranti pengguna, ciri penting untuk AI ejen, yang menjanjikan untuk mengautomasikan tugas seperti menempah perjalanan dan menguruskan perbelanjaan.

Meta telah menyatakan bahawa model Llama menyokong panggilan alat melalui APInya. Walau bagaimanapun, Theo Browne, seorang pembangun dan YouTuber, berhujah bahawa panggilan alat telah menjadi keperluan untuk kerelevanan canggih kerana alat ejen semakin menonjol.

Anthropic telah muncul sebagai peneraju awal dalam penggunaan alat, dan model proprietari seperti OpenAI pesat mengejar. Keupayaan untuk memanggil alat yang betul dengan pasti untuk menjana respons yang betul adalah sangat berharga, dan OpenAI telah mengalihkan fokusnya untuk mengutamakan keupayaan ini.

Kourabi berhujah bahawa ketiadaan model penaakulan yang kukuh merupakan petunjuk penting bahawa Meta telah ketinggalan. Penaakulan dianggap sebagai elemen asas dalam persamaan AI ejen, membolehkan model menganalisis tugas dan menentukan tindakan yang sesuai.

Niche Llama: Aplikasi Praktikal dan Penerimaan Perusahaan

Walaupun terdapat kebimbangan tentang kedudukannya di barisan hadapan penyelidikan AI, Llama kekal sebagai alat yang berharga untuk banyak pembangun dan organisasi.

Nate Jones, ketua produk di RockerBox, menasihati pembangun untuk memasukkan Llama dalam resume mereka, kerana kebiasaan dengan model itu mungkin akan dicari pada masa hadapan.

Paul Baier, Ketua Pegawai Eksekutif dan penganalisis utama di GAI Insights, percaya bahawa Llama akan terus menjadi komponen utama strategi AI untuk banyak syarikat, terutamanya syarikat di luar industri teknologi.

Perusahaan menyedari kepentingan model sumber terbuka, dengan Llama menjadi contoh yang menonjol, untuk mengendalikan tugas yang kurang kompleks dan mengawal kos. Banyak organisasi lebih suka gabungan model tertutup dan terbuka untuk memenuhi pelbagai keperluan mereka.

Baris Gultekin, ketua AI di Snowflake, menyatakan bahawa pelanggan sering menilai model berdasarkan kes penggunaan khusus mereka dan bukannya bergantung semata-mata pada penanda aras. Memandangkan kosnya yang rendah, Llama seringkali mencukupi untuk banyak aplikasi.

Di Snowflake, Llama digunakan untuk tugas seperti meringkaskan transkrip panggilan jualan dan mengekstrak maklumat berstruktur daripada ulasan pelanggan. Di Dremio, Llama menjana kod SQL dan menulis e-mel pemasaran.

Tomer Shiran, pengasas bersama dan ketua pegawai produk Dremio, mencadangkan bahawa model khusus mungkin tidak kritikal untuk 80% aplikasi, kerana kebanyakan model kini "cukup baik" untuk memenuhi keperluan asas.

Landskap yang Pelbagai: Peranan Llama yang Mengukuhkan

Walaupun Llama mungkin beralih daripada persaingan langsung dengan model proprietari dalam bidang tertentu, landskap AI keseluruhan menjadi lebih pelbagai, dan peranan Llama semakin kukuh dalam niche tertentu.

Shiran menekankan bahawa penanda aras bukanlah pemacu utama pilihan model, kerana pengguna mengutamakan ujian model pada kes penggunaan mereka sendiri. Prestasi model pada data pelanggan adalah yang terpenting, dan prestasi ini boleh berbeza-beza dari semasa ke semasa.

Gultekin menambah bahawa pemilihan model selalunya merupakan keputusan khusus kes penggunaan dan bukannya acara satu kali.

Llama mungkin kehilangan pembangun yang sentiasa mencari kemajuan terkini, tetapi ia mengekalkan sokongan ramai pembangun yang menumpukan pada membina alat berkuasa AI yang praktikal.

Dinamik ini selaras dengan strategi sumber terbuka Meta yang lebih luas, yang dicontohkan oleh pelancaran React pada tahun 2013 dan penciptaan PyTorch pada tahun 2016. Dengan memupuk ekosistem yang berjaya, Meta mendapat manfaat daripada sumbangan komuniti sumber terbuka.

Seperti yang diperhatikan oleh Nate Jones, Zuckerberg mendapat faedah ketara daripada inisiatif sumber terbuka Meta.