Llama Meta: Lebih Daripada Sekadar Model Bahasa

Evolusi Llama: Mencabar Status Quo

Apabila Llama pertama kali muncul, ia mencabar penguasaan LLM sumber tertutup yang besar daripada gergasi teknologi. Meta AI menggunakan strategi yang memfokuskan pada model yang lebih kecil dan lebih umum. Idea terasnya ialah model-model yang lebih kecil ini, yang dilatih pada sejumlah besar token, akan menjadi lebih mudah dan lebih menjimatkan kos untuk dilatih semula dan diperhalusi untuk tugas-tugas khusus. Pendekatan ini berbeza dengan trend membina model yang lebih besar dan intensif sumber.

Walau bagaimanapun, sifat ‘sumber terbuka’ Llama adalah subjek perdebatan. Lesen Meta Llama termasuk sekatan khusus pada penggunaan komersial dan yang boleh diterima. Walaupun sekatan ini boleh dikatakan wajar, ia bercanggah dengan definisi sumber terbuka yang ketat oleh Open Source Initiative. Ini telah membawa kepada perbincangan berterusan sama ada Llama benar-benar layak sebagai sumber terbuka.

Menavigasi Cabaran Undang-undang: Kebimbangan Hak Cipta

Pembangunan Llama tidak terlepas daripada halangan undang-undang. Pada tahun 2023, Meta menghadapi dua tuntutan mahkamah tindakan kelas daripada pengarang yang mendakwa bahawa buku berhak cipta mereka digunakan tanpa kebenaran untuk melatih Llama. Tuntutan mahkamah ini menyerlahkan isu hak cipta yang kompleks di sekitar data latihan yang digunakan untuk model bahasa yang besar. Setakat ini, mahkamah tidak begitu bersimpati dengan tuntutan pengarang.

Memperluas Keupayaan: Keluarga Model Llama yang Berkembang

Sejak akhir 2023, Meta AI telah meluaskan keluarga Llama dengan ketara. Model-model tersebut tidak lagi terhad kepada interaksi berasaskan teks. Ekosistem Llama semasa termasuk model pelbagai mod yang mampu memproses input teks dan visual, serta model yang direka untuk tafsiran kod dan integrasi alat. Tambahan pula, Meta telah memperkenalkan komponen keselamatan, yang dikenali sebagai Llama Guard, untuk mengenal pasti dan mengurangkan potensi risiko dan serangan, ini direka untuk menjadi sebahagian daripada rangka kerja keseluruhan yang dipanggil ‘Llama Stack.’

Berikut adalah pandangan yang lebih mendalam tentang beberapa model utama dalam keluarga Llama (diringkaskan daripada kad model Meta AI):

Llama Guard 1: Melindungi Interaksi

Llama Guard 1 ialah model 7 bilion parameter berdasarkan Llama 2. Ia berfungsi sebagai perlindungan input-output, mengklasifikasikan kandungan dalam kedua-dua prompt pengguna (klasifikasi prompt) dan respons LLM (klasifikasi respons). Model ini membantu memastikan interaksi yang lebih selamat dan lebih bertanggungjawab dengan sistem berasaskan Llama.

Llama Guard menggunakan taksonomi enam peringkat untuk mengkategorikan potensi bahaya:

  • Violence & Hate (Keganasan & Kebencian): Kandungan yang menggalakkan keganasan atau kebencian terhadap individu atau kumpulan.
  • Sexual Content (Kandungan Seksual): Bahan seksual eksplisit atau kandungan yang mengeksploitasi, mendera, atau membahayakan kanak-kanak.
  • Guns & Illegal Weapons (Senjata Api & Senjata Haram): Kandungan yang berkaitan dengan penjualan, penggunaan, atau pengubahsuaian haram senjata api dan senjata lain.
  • Regulated or Controlled Substances (Bahan Terkawal atau Terlarang): Kandungan yang menggalakkan penggunaan atau penjualan dadah, alkohol, atau tembakau secara haram.
  • Suicide & Self Harm (Bunuh Diri & Mencederakan Diri): Kandungan yang menggalakkan atau memberikan arahan untuk bunuh diri atau mencederakan diri.
  • Criminal Planning (Perancangan Jenayah): Kandungan yang memudahkan atau merancang aktiviti haram.

Code Llama 70B: Triad Kebolehan Pengekodan

Code Llama 70B menandakan pengembangan ketara dalam keupayaan pengekodan Llama. Model ini tersedia dalam tiga varian berbeza:

  • Code Llama: Model asas yang direka untuk sintesis dan pemahaman kod umum. Ia boleh menjana kod, menerangkan fungsi kod, dan membantu dengan penyahpepijatan.
  • Code Llama – Python: Versi khusus yang disesuaikan untuk pengaturcaraan Python. Model ini dioptimumkan untuk menjana dan memahami kod Python, menjadikannya alat yang berharga untuk pembangun Python.
  • Code Llama – Instruct: Varian yang memfokuskan pada mengikut arahan dan memastikan penggunaan yang lebih selamat. Model ini amat berguna untuk menjana kod yang mematuhi garis panduan dan protokol keselamatan tertentu.

Ketiga-tiga varian tersedia dalam saiz yang berbeza: 7 bilion, 13 bilion, 34 bilion, dan 70 bilion parameter. Code Llama dan variannya direka untuk kegunaan komersial dan penyelidikan, terutamanya dalam bahasa Inggeris dan bahasa pengaturcaraan yang berkaitan. Terdapat banyak bukti yang menunjukkan bahawa Code Llama mempunyai kebolehan pengekodan yang kuat.

Llama Guard 2: Klasifikasi Keselamatan yang Dipertingkatkan

Llama Guard 2 dibina di atas asas pendahulunya, menawarkan keupayaan klasifikasi keselamatan yang dipertingkatkan. Model 8 bilion parameter ini, berdasarkan Llama 3, dilatih untuk meramalkan label keselamatan merentasi 11 kategori, selaras dengan taksonomi bahaya MLCommons.

Kategori bahaya yang diliputi oleh Llama Guard 2 termasuk:

  • S1: Violent Crimes (Jenayah Keganasan): Kandungan yang berkaitan dengan perbuatan jenayah keganasan.
  • S2: Non-Violent Crimes (Jenayah Bukan Keganasan): Kandungan yang berkaitan dengan kesalahan jenayah bukan keganasan.
  • S3: Sex-Related Crimes (Jenayah Berkaitan Seks): Kandungan yang melibatkan kesalahan seksual.
  • S4: Child Sexual Exploitation (Eksploitasi Seksual Kanak-kanak): Kandungan yang mengeksploitasi, mendera, atau membahayakan kanak-kanak secara seksual.
  • S5: Specialized Advice (Nasihat Khusus): Nasihat yang tidak berkelayakan atau mengelirukan dalam bidang khusus (cth., perubatan, undang-undang, kewangan).
  • S6: Privacy (Privasi): Kandungan yang melanggar privasi atau mendedahkan maklumat peribadi tanpa kebenaran.
  • S7: Intellectual Property (Harta Intelek): Kandungan yang melanggar hak harta intelek.
  • S8: Indiscriminate Weapons (Senjata Tidak Terpilih): Kandungan yang berkaitan dengan senjata yang menyebabkan kemudaratan yang meluas dan tidak terpilih.
  • S9: Hate (Kebencian): Kandungan yang menyatakan kebencian atau prasangka terhadap individu atau kumpulan.
  • S10: Suicide & Self-Harm (Bunuh Diri & Mencederakan Diri): Kandungan yang menggalakkan atau memberikan arahan untuk bunuh diri atau mencederakan diri.
  • S11: Sexual Content (Kandungan Seksual): Bahan seksual eksplisit.

Meta Llama 3: Kepelbagaian dalam Dialog

Meta Llama 3 ditawarkan dalam dua saiz, 8 bilion dan 70 bilion parameter, dengan kedua-dua varian pra-terlatih dan ditala arahan. Model yang ditala arahan dioptimumkan khusus untuk aplikasi berasaskan dialog, menjadikannya sesuai untuk chatbot dan sistem AI perbualan.

Prompt Guard: Bertahan Terhadap Input Berniat Jahat

Prompt Guard ialah model pengelas yang direka untuk mengesan prompt berniat jahat, termasuk jailbreak (percubaan untuk memintas sekatan keselamatan) dan suntikan prompt (percubaan untuk memanipulasi output model melalui input yang direka). Meta AI mengesyorkan penalaan halus Prompt Guard dengan data khusus aplikasi untuk mencapai prestasi optimum.

Tidak seperti Llama Guard, Prompt Guard tidak memerlukan struktur prompt tertentu. Ia beroperasi pada input rentetan, mengklasifikasikannya sebagai sama ada selamat atau tidak selamat (pada dua tahap keterukan yang berbeza). Ia adalah model BERT yang mengeluarkan label secara eksklusif.

Llama Guard 3: Keselamatan Pelbagai Mod dan Pelbagai Bahasa

Llama Guard 3 tersedia dalam tiga versi: Llama Guard 3 1B, Llama Guard 3 8B, dan Llama Guard 3 11B-Vision. Dua yang pertama ialah model teks sahaja, manakala yang ketiga menggabungkan keupayaan pemahaman penglihatan model Llama 3.2 11B-Vision. Semua versi adalah berbilang bahasa (untuk prompt teks sahaja) dan mematuhi kategori bahaya yang ditakrifkan oleh konsortium MLCommons.

Llama Guard 3 8B juga boleh digunakan untuk kategori S14, Code Interpreter Abuse. Adalah penting untuk ambil perhatian bahawa model Llama Guard 3 1B tidak dioptimumkan untuk kategori khusus ini.

Kategori bahaya, yang berkembang pada kategori Llama Guard 2 ialah:

  • S1: Violent Crimes (Jenayah Keganasan)
  • S2: Non-Violent Crimes (Jenayah Bukan Keganasan)
  • S3: Sex-Related Crimes (Jenayah Berkaitan Seks)
  • S4: Child Sexual Exploitation (Eksploitasi Seksual Kanak-kanak)
  • S5: Defamation (Fitnah)
  • S6: Specialized Advice (Nasihat Khusus)
  • S7: Privacy (Privasi)
  • S8: Intellectual Property (Harta Intelek)
  • S9: Indiscriminate Weapons (Senjata Tidak Terpilih)
  • S10: Hate (Kebencian)
  • S11: Suicide & Self-Harm (Bunuh Diri & Mencederakan Diri)
  • S12: Sexual Content (Kandungan Seksual)
  • S13: Elections (Pilihan Raya)
  • S14: Code Interpreter Abuse (Penyalahgunaan Pentafsir Kod)

Meta Llama 3.1: Model Generatif Pelbagai Bahasa

Koleksi Meta Llama 3.1 terdiri daripada model bahasa besar berbilang bahasa, termasuk model generatif pra-terlatih dan ditala arahan dalam saiz 8 bilion, 70 bilion, dan 405 bilion parameter (input teks, output teks).

Bahasa yang disokong termasuk: Bahasa Inggeris, Jerman, Perancis, Itali, Portugis, Hindi, Sepanyol, dan Thai.

Meta Llama 3.2: Keupayaan Dialog yang Dipertingkatkan

Koleksi Llama 3.2 menampilkan model bahasa besar berbilang bahasa, merangkumi model generatif pra-terlatih dan ditala arahan dalam saiz 1 bilion dan 3 bilion parameter (input teks, output teks). Versi terkuantiti bagi model ini juga tersedia. Model teks sahaja Llama 3.2 yang ditala arahan dioptimumkan untuk dialog berbilang bahasa, cemerlang dalam tugas seperti pengambilan dan ringkasan agen. Model 1B dan 3B ialah terbitan Llama 3.1 yang lebih kecil dan kurang berkuasa.

Bahasa yang disokong secara rasmi ialah: Bahasa Inggeris, Jerman, Perancis, Itali, Portugis, Hindi, Sepanyol, dan Thai. Walau bagaimanapun, Llama 3.2 telah dilatih pada julat bahasa yang lebih luas di luar lapan bahasa ini.

Llama 3.2-Vision: Penaakulan dan Pemahaman Imej

Koleksi Llama 3.2-Vision memperkenalkan model bahasa besar berbilang mod. Model ini dipra-latih dan ditala arahan untuk penaakulan imej, tersedia dalam saiz 11 bilion dan 90 bilion parameter (input teks dan imej, output teks). Model yang ditala arahan dioptimumkan untuk pengecaman visual, penaakulan imej, kapsyen, dan menjawab soalan umum tentang imej.

Untuk tugas teks sahaja, bahasa yang disokong secara rasmi ialah Bahasa Inggeris, Jerman, Perancis, Itali, Portugis, Hindi, Sepanyol, dan Thai. Llama 3.2 telah dilatih pada set bahasa yang lebih luas, tetapi untuk aplikasi imej+teks, Bahasa Inggeris ialah satu-satunya bahasa yang disokong.

Meta Llama 3.3: Model 70B yang Berkuasa

Model bahasa besar berbilang bahasa Meta Llama 3.3 ialah model generatif pra-terlatih dan ditala arahan dengan 70 bilion parameter (input teks, output teks).

Bahasa yang disokong: Bahasa Inggeris, Jerman, Perancis, Itali, Portugis, Hindi, Sepanyol, dan Thai.

Adalah penting untuk memahami bahawa model bahasa yang besar, termasuk Llama 3.2, tidak bertujuan untuk penggunaan terpencil. Ia harus disepadukan ke dalam sistem AI yang komprehensif dengan perlindungan keselamatan yang sesuai. Pembangun dijangka melaksanakan perlindungan sistem, terutamanya apabila membina sistem agen.

Llama 3.3, model teks sahaja Llama 3.2, dan Llama 3.1 termasuk sokongan terbina dalam untuk alatan berikut:

  • Brave Search: Panggilan alat untuk melakukan carian web.
  • Wolfram Alpha: Panggilan alat untuk melaksanakan pengiraan matematik yang kompleks.
  • Code Interpreter: Panggilan alat yang membolehkan model mengeluarkan kod Python.

Nota: Model penglihatan Llama 3.2 tidak menyokong panggilan alat dengan input teks+imej.

Llama Stack: Rangka Kerja Bersepadu

Bilangan model Llama yang banyak boleh menjadi sangat menggalakkan. Untuk memudahkan proses pemilihan dan penyepaduan, Meta menawarkan Llama Stack. Rangka kerja ini menekankan model Llama tetapi juga menyediakan penyesuai untuk keupayaan yang berkaitan, seperti pangkalan data vektor untuk penjanaan tambahan pengambilan (RAG).

Llama Stack kini menyokong SDK dalam Python, Swift, Node, dan Kotlin. Ia menawarkan pelbagai pengedaran, termasuk:

  • Local distribution (using Ollama): Untuk pembangunan dan ujian tempatan.
  • On-device distributions (iOS and Android): Untuk menggunakan model Llama pada peranti mudah alih.
  • Distributions for GPUs: Untuk memanfaatkan kuasa GPU untuk pemprosesan yang lebih pantas.
  • Remote-hosted distributions (Together and Fireworks): Untuk mengakses model Llama melalui perkhidmatan berasaskan awan.

Konsep teras di sebalik Llama Stack adalah untuk membolehkan pembangun membina aplikasi secara tempatan dan kemudian beralih dengan mudah ke persekitaran pengeluaran. Ia juga menyediakan Llama Stack Playground interaktif untuk pembangunan tempatan terhadap Llama Stack jauh.

Menjalankan Model Llama: Pilihan Penggunaan Serbaguna

Model Llama boleh digunakan pada pelbagai platform, termasuk Linux, Windows, macOS, dan awan. Model Llama terkuantiti, seperti Llama 3.2 dan Llama 3.2-Vision, boleh berjalan dengan berkesan pada perkakasan moden, malah pada komputer riba seperti M4 Pro MacBook Pro menggunakan alatan seperti Ollama.

Meta menyediakan panduan cara yang komprehensif untuk menggunakan dan menggunakan model Llama. Selain itu, panduan penyepaduan tersedia untuk rangka kerja popular seperti LangChain dan LlamaIndex.

Ringkasnya, Llama telah bergerak melangkaui hanya model bahasa yang mudah, kini ia adalah rangka kerja AI berbilang mod lengkap dengan ciri keselamatan, penjanaan kod, dan sokongan untuk banyak bahasa. Sistem Meta membolehkannya digunakan di banyak tempat, tetapi isu undang-undang dengan data latihan, dan hujah tentang sama ada Llama adalah sumber terbuka, berterusan.