Meta Kembangkan Model Llama "Multimodal" | ms

Meta baru-baru ini memperkenalkan iterasi terkini model kecerdasan buatan (AI) Llama mereka, menandakan langkah penting ke hadapan dalam komitmen berterusan syarikat terhadap inovasi AI. Antara tawaran baharu ialah Llama 4 Scout dan Llama 4 Maverick, yang Meta gelarkan "model multimodal," menonjolkan keupayaan mereka untuk memproses dan berinteraksi dengan pelbagai bentuk media di luar teks semata-mata.

Selain itu, Meta mengusik Llama 4 Behemoth, yang diposisikan sebagai salah satu LLM paling pintar di dunia dan bertujuan untuk berfungsi sebagai guru bagi model yang baru dikeluarkan.

Pengumuman ini menggariskan pelaburan besar Meta dalam AI sejak dua tahun sebelumnya. Ketua Pegawai Eksekutif Mark Zuckerberg secara terbuka menyatakan niatnya untuk memperuntukkan sehingga $65 bilion pada tahun 2025 untuk meningkatkan lagi keupayaan AI syarikat. Cita-cita Meta melangkaui domain media sosialnya, meneroka potensi langganan premium untuk pembantu AInya, Meta AI, untuk mengendalikan tugas seperti membuat tempahan dan penciptaan video.

Usaha Sumber Terbuka OpenAI

Dalam perkembangan selari, OpenAI dilaporkan mempertimbangkan untuk mengeluarkan versi sumber terbuka LLMnya, satu perlepasan daripada amalan terbarunya. Langkah ini akan memberikan pengguna kebebasan untuk menggunakan, mengubah suai dan mengedarkan model tanpa menanggung yuran pelesenan. OpenAI mendapatkan input komuniti daripada pembangun, penyelidik dan orang awam yang lebih luas untuk mengoptimumkan utiliti model.

Model sumber terbuka dijangka dilancarkan dalam beberapa bulan. Kali terakhir OpenAI menerima prinsip sumber terbuka adalah pada tahun 2019 dengan GPT-2 LLM. LLM terbarunya ialah GPT-4.5. OpenAI beralih ke arah model proprietari selepas mendapatkan pelaburan bernilai bilion dolar daripada Microsoft, membentuk pakatan rapat untuk memajukan pembangunan model AI. Microsoft sejak itu telah melabur lebih $13 bilion dalam OpenAI, dengan model OpenAI eksklusif kepada pelanggan perkhidmatan awan Azure Microsoft.

Llama Meta, LLM Mistral dan DeepSeek adalah beberapa model sumber terbuka yang semakin popular kebelakangan ini. Zuckerberg menyebut di Threads bahawa Llama telah dimuat turun 1 bilion kali. Llama telah dilancarkan pada tahun 2023.

Model AI "Behemoth" Meta Menghadapi Kelewatan

Walau bagaimanapun, Meta dilaporkan menangguhkan pelancaran "Behemoth," yang asalnya dijadualkan untuk pelancaran musim panas, dengan kemungkinan pelancaran terawal kini diunjurkan pada musim gugur. Sumber mencadangkan bahawa kemajuan model itu tidak "ketara" cukup untuk mewajarkan pelancaran Jun, dan ia mewakili kelewatan sejak persidangan pembangun Meta.

Kelewatan itu memberi bayangan ke atas keluaran keluarga model bahasa besar utama Llama Meta. The Wall Street Journal mengatakan bahawa ia telah dipuji kerana kepantasan pelepasannya. Llama telah memainkan peranan penting dalam memperkasakan pembangun dalam syarikat yang lebih kecil, organisasi bukan untung dan institusi akademik. Ia merupakan alternatif kepada model proprietari tertutup yang ditawarkan oleh syarikat seperti OpenAI, Google dan Amazon.

Impak kelewatan Behemoth ke atas syarikat yang lebih besar adalah kurang ketara, kerana mereka sering bergantung pada model proprietari berasaskan awan. Walaupun syarikat yang lebih kecil boleh menyesuaikan model Llama sumber terbuka, mereka memerlukan perkhidmatan pelaksanaan tambahan yang tidak ditawarkan oleh Meta. Penggunaan Llama oleh Meta ditujukan untuk meningkatkan alat media sosialnya sendiri, membolehkan Zuckerberg mengekalkan kawalan ke atas trajektori AInya.

Faktor penting di sebalik kelewatan itu terletak pada sama ada model itu menunjukkan peningkatan yang cukup besar untuk mewajarkan pelancaran awam.

Keperluan untuk Inovasi

Dalam dunia industri teknologi yang serba pantas, keluaran baharu mesti mempamerkan kemajuan yang ketara untuk mewajarkan pengenalannya. Di LlamaCon, Meta mempamerkan dua model Llama 4 yang lebih kecil, masing-masing mempunyai keupayaan yang mengagumkan:

Maverick mempunyai sejumlah 400 bilion parameter dengan tetingkap konteks token 1 juta (750,000 perkataan).
Scout mempunyai 109 bilion parameter dan tetingkap konteks token 10 juta (7.5 juta perkataan).

Behemoth pada mulanya dijadualkan untuk keluaran serentak, menggabungkan 2 trilion parameter.

Menurut Wall Street Journal, Meta semakin tidak sabar dengan pasukan Llama 4 kerana pelaburan AI yang berterusan. Pada tahun 2024, syarikat telah memperuntukkan sehingga $72 bilion dalam perbelanjaan modal, kebanyakannya ditujukan kepada pembangunan AI.

Kebimbangan yang Semakin Meningkat

Zuckerberg dan eksekutif kanan lain masih belum mengumumkan tarikh keluaran muktamad untuk Behemoth. Orang dalam bimbang bahawa prestasinya mungkin tidak memenuhi jangkaan yang ditetapkan oleh kenyataan awam Meta.

Sumber menunjukkan peningkatan rasa tidak puas hati dalam kalangan kepimpinan Meta dengan kemajuan yang dicapai oleh pasukan yang membangunkan model Llama 4. Ini telah membawa kepada perbincangan tentang kemungkinan perubahan kepimpinan dalam kumpulan produk AInya.

Meta telah menguar-uarkan Behemoth sebagai sistem yang sangat berkebolehan, mengatasi pesaing seperti OpenAI, Google dan Anthropic pada penanda aras tertentu. Cabaran dalaman telah menghalang kecekapan, seperti yang didakwa oleh mereka yang biasa dengan pembangunannya.

OpenAI juga menghadapi kelewatan. Model utama seterusnya mereka, GPT-5, pada asalnya dijadualkan untuk dikeluarkan pada pertengahan 2024. The Wall Street Journal melaporkan pada bulan Disember bahawa pembangunan telah ketinggalan daripada jadual.

Pada bulan Februari, Ketua Pegawai Eksekutif OpenAI Sam Altman berkata bahawa model interim ialah GPT-4.5, manakala GPT-5 masih beberapa bulan lagi.

Kemungkinan Sebab Kemajuan Terhenti

Beberapa faktor mungkin menyumbang kepada kelembapan dalam pembangunan model AI, termasuk:

Data Berkualiti Tinggi yang Semakin Berkurangan

Model bahasa yang besar memerlukan sejumlah besar data untuk latihan, mencerminkan keluasan internet yang luas. Mereka mungkin menghabiskan sumber data yang tersedia secara terbuka sambil menghadapi liabiliti undang-undang berkaitan hak cipta.

Ini telah membawa OpenAI, Google dan Microsoft untuk menyokong pemeliharaan hak mereka untuk berlatih mengenai bahan berhak cipta.

OpenAI menyebut bahawa kerajaan boleh mendapatkan kebebasan rakyat Amerika untuk belajar daripada AI, dan mengelakkan kehilangan kepimpinan AI kepada PRC [Republik Rakyat China] dengan memelihara keupayaan model AI Amerika untuk belajar daripada bahan berhak cipta.

Halangan Algoritma

Kepercayaan bahawa meningkatkan saiz model, menggunakan lebih banyak pengiraan, dan melatih pada lebih banyak data akan menghasilkan kemajuan ketara telah terbukti salah. Bloomberg mengatakan terdapat hasil yang semakin berkurangan menyebabkan sesetengah orang mengatakan undang-undang penskalaan semakin perlahan.

dikemaskinikan pada 2025-05-16

# LLM # Llama # Meta