Layanan Oracle Cloud Infrastructure (OCI) Generative AI mendapatkan tambahan baru yang menarik: rangkaian model Meta Llama 4, meliputi Scout dan Maverick. Model-model ini mengintegrasikan arsitektur mixture of experts (MoE) unik, yang secara signifikan meningkatkan kemampuan pemrosesan dan efisiensi. Mereka secara khusus dioptimalkan untuk melakukan performa luar biasa di berbagai bidang seperti pemahaman multimodal, tugas multibahasa, pembuatan kode, dan pemanggilan alat, serta dapat menggerakkan sistem agen yang canggih.
Saat ini, model-model ini tersedia dalam versi general availability (GA) di wilayah berikut:
- On-demand: ORD (Chicago)
- Dedicated AI Clusters: ORD (Chicago), GRU (Guarulhos), LHR (London), KIK (Kikuyu)
Sorotan Utama Rangkaian Llama 4
Kemampuan Multimodal: Mendobrak Batas Tipe Data
Llama 4 Scout dan Maverick bukan hanya model bahasa; mereka adalah master multimodal sejati. Mereka mampu secara native memproses dan mengintegrasikan berbagai jenis data, termasuk teks dan gambar, memungkinkan aplikasi AI yang lebih kaya dan lebih komprehensif. Anda dapat membayangkan sistem AI yang dapat secara bersamaan memahami deskripsi teks dan gambar terkait, sehingga lebih memahami konteks dan membuat keputusan yang lebih tepat. Kemampuan multimodal ini membuka kemungkinan baru untuk tugas-tugas seperti pembuatan caption gambar dan visual question answering.
Dukungan Multibahasa: Komunikasi Tanpa Batas Negara
Sorotan utama lainnya dari rangkaian Llama 4 adalah kemampuan dukungan multibahasanya yang kuat. Model-model ini dilatih pada dataset yang berisi 200 bahasa, dan disetel dengan baik untuk 12 bahasa utama (Arab, Inggris, Prancis, Jerman, Hindi, Indonesia, Italia, Portugis, Spanyol, Tagalog, Thailand, dan Vietnam). Ini berarti bahwa mereka dapat memahami dan menghasilkan teks dalam berbagai bahasa, membuka pintu untuk aplikasi skala global. Perlu dicatat bahwa fungsionalitas pemahaman gambar saat ini hanya mendukung bahasa Inggris.
Pengembangan Efisien: Jejak GPU Lebih Kecil
Untuk pengembang, Llama 4 Scout dirancang dengan tujuan untuk mencapai aksesibilitas yang lebih tinggi. Model ini dapat berjalan secara efisien dengan jejak GPU yang lebih kecil, menjadikannya pilihan ideal untuk lingkungan dengan sumber daya terbatas. Ini berarti bahwa bahkan tanpa perangkat keras yang kuat, pengembang dapat memanfaatkan kemampuan kuat Llama 4 Scout untuk mempercepat pengembangan dan penerapan aplikasi AI.
Model Open Source: Memberdayakan Komunitas
Meta telah memilih sikap terbuka, merilis kedua model di bawah lisensi komunitas Llama 4. Ini berarti bahwa pengembang bebas untuk menyetel dan menerapkan model, hanya perlu mematuhi persyaratan lisensi tertentu. Model terbuka ini mempromosikan inovasi dan kolaborasi komunitas AI, memungkinkan lebih banyak orang untuk berpartisipasi dalam pengembangan dan penerapan teknologi AI.
Tanggal Cut-off Pengetahuan
Perlu dicatat bahwa tanggal cut-off pengetahuan untuk model Llama 4 adalah Agustus 2024. Ini berarti bahwa mereka mungkin tidak dapat memberikan informasi terbaru tentang peristiwa atau informasi yang terjadi setelah tanggal ini.
Penting: Kebijakan penggunaan Llama yang dapat diterima membatasi penggunaannya di dalam Uni Eropa (EU).
Llama 4 Scout: Juara Ringan
Arsitektur: Desain Parameter yang Cerdas
Llama 4 Scout mengadopsi desain arsitektur yang cerdas, hanya mengaktifkan 17 miliar parameter dari total sekitar 109 miliar parameter. Desain ini memanfaatkan campuran 16 ahli, sehingga mencapai keseimbangan yang baik antara performa dan efisiensi. Dengan hanya mengaktifkan sebagian parameter, Scout dapat secara signifikan mengurangi persyaratan komputasi, sehingga dapat berjalan di lingkungan dengan sumber daya terbatas.
Jendela Konteks: Kemampuan Memproses Teks Panjang
Llama 4 Scout mendukung panjang konteks hingga 10 juta token (memerlukan banyak GPU). Namun, dalam general availability (GA), layanan OCI Generative AI akan mendukung panjang konteks 192k token. Bahkan jendela konteks 192k sudah cukup untuk memproses teks yang cukup panjang, seperti bab buku atau laporan terperinci.
Penerapan: Kecil Namun Kuat
Salah satu tujuan desain Llama 4 Scout adalah untuk berjalan secara efisien dengan jejak GPU yang lebih kecil. Ini menjadikannya pilihan ideal untuk berbagai skenario penerapan, termasuk perangkat edge dan lingkungan cloud dengan sumber daya terbatas.
Performa: Mengungguli Pesaing
Llama 4 Scout berkinerja sangat baik di berbagai tolok ukur, mengungguli model seperti Google Gemma 3 dan Mistral 3.1. Ini membuktikan kemampuan Scout yang luar biasa dalam hal performa, menjadikannya alat yang ampuh untuk berbagai tugas AI.
Llama 4 Maverick: Kelas Berat
Arsitektur: Skala Lebih Besar, Kekuatan Lebih Besar
Dibandingkan dengan Scout, Llama 4 Maverick mengadopsi skala arsitektur yang lebih besar. Ini juga mengaktifkan 17 miliar parameter, tetapi diimplementasikan dalam kerangka kerja yang lebih besar dengan total sekitar 400 miliar parameter, dan memanfaatkan 128 ahli. Skala yang lebih besar ini memberi Maverick kemampuan yang lebih besar, memungkinkannya untuk unggul dalam tugas AI yang lebih kompleks.
Jendela Konteks: Memori Sangat Panjang
Llama 4 Maverick mendukung panjang konteks hingga 1 juta token. Dalam general availability (GA), penerapan OCI akan mendukung panjang konteks 512k token. Jendela konteks yang sangat panjang ini memungkinkan Maverick untuk menangani teks yang sangat kompleks, seperti buku lengkap atau kumpulan beberapa dokumen.
Penerapan: Membutuhkan Lebih Banyak Ruang
Karena skalanya yang lebih besar, Llama 4 Maverick membutuhkan ruang penerapan yang lebih besar daripada Scout. Pada saat GA, penerapan Maverick di OCI membutuhkan sekitar dua kali ruang yang dibutuhkan oleh Scout.
Performa: Sebanding dengan Model Teratas
Dalam tugas pembuatan kode dan penalaran, performa Llama 4 Maverick sebanding dengan model teratas seperti GPT-4o OpenAI dan DeepSeek-V3. Ini membuktikan posisi Maverick yang unggul di bidang AI.
Singkatnya, rangkaian Llama 4 mewakili kemajuan signifikan dalam pengembangan model AI. Mereka menunjukkan peningkatan yang signifikan dalam performa, fleksibilitas, dan aksesibilitas, memberikan dukungan yang kuat untuk berbagai skenario aplikasi.
Pelanggan OCI sekarang dapat dengan mudah memanfaatkan model-model yang kuat ini tanpa mengkhawatirkan kompleksitas manajemen infrastruktur. Mereka dapat mengakses model-model ini melalui antarmuka obrolan, API, atau titik akhir khusus, sehingga menyederhanakan proses pengembangan dan penerapan aplikasi AI.
Peluncuran model Llama 4 menandai era baru untuk layanan OCI Generative AI. Dengan menyediakan model-model canggih ini, OCI membantu pelanggan untuk melepaskan potensi penuh AI, dan mendorong inovasi di berbagai industri. Model-model Llama 4 ini, khususnya Llama 4 Scout dan Llama 4 Maverick, membawa perubahan besar pada cara pengembang dan perusahaan berinteraksi dengan teknologi AI.
Llama 4 Scout menonjol sebagai solusi yang efisien dan terjangkau. Kemampuannya untuk berjalan dengan jejak GPU yang lebih kecil menjadikannya ideal untuk berbagai skenario penerapan, termasuk perangkat edge dan lingkungan cloud dengan sumber daya terbatas. Ini membuka peluang baru bagi organisasi yang ingin mengintegrasikan AI ke dalam operasi mereka tanpa investasi besar dalam infrastruktur. Keunggulan Scout dalam berbagai tolok ukur menjamin performa tinggi untuk berbagai tugas, menjadikannya pilihan yang menarik bagi pengembang yang memprioritaskan efisiensi dan efektivitas.
Di sisi lain, Llama 4 Maverick menawarkan kekuatan pemrosesan yang lebih besar dan memori yang lebih luas untuk menangani tugas yang lebih kompleks. Kemampuannya untuk menangani konteks yang sangat panjang memungkinkannya untuk menganalisis dan mensintesis volume informasi yang besar, menjadikannya alat yang berharga untuk penelitian, analisis data, dan otomatisasi proses kompleks. Keunggulan Maverick dalam pembuatan kode dan penalaran menempatkannya pada posisi sejajar dengan model-model AI terkemuka lainnya, menjadikannya pilihan yang menarik bagi organisasi yang mencari kinerja tingkat tinggi.
Selain kemampuan teknisnya, rangkaian Meta Llama 4 juga mendapat manfaat dari pendekatan open source Meta. Dengan merilis model-model ini di bawah lisensi komunitas Llama 4, Meta memungkinkan pengembang untuk bereksperimen, memodifikasi, dan meningkatkan model-model tersebut, mempromosikan inovasi dan kolaborasi dalam komunitas AI. Pendekatan ini membantu mempercepat perkembangan teknologi AI dan memastikan bahwa manfaat AI tersedia secara luas.
Integrasi model Llama 4 ke dalam layanan OCI Generative AI juga memberikan manfaat signifikan bagi pelanggan OCI. Ini memungkinkan mereka untuk dengan mudah mengakses dan menggunakan model-model canggih ini tanpa mengkhawatirkan kompleksitas manajemen infrastruktur. Dengan menawarkan berbagai opsi akses, termasuk antarmuka obrolan, API, dan titik akhir khusus, OCI membuat teknologi AI lebih mudah diakses dan ramah pengguna, memberdayakan pelanggan untuk fokus pada pengembangan dan penerapan aplikasi AI inovatif.
Selain itu, dukungan multibahasa yang kuat yang ditawarkan oleh rangkaian Llama 4 membuka peluang baru untuk aplikasi AI global. Dengan dukungan untuk 200 bahasa dan penyetelan halus untuk 12 bahasa utama, model-model ini dapat memahami dan menghasilkan teks dalam berbagai bahasa, memungkinkan pengembang untuk membuat aplikasi AI yang dapat menjangkau khalayak yang lebih luas dan mengatasi berbagai kebutuhan bahasa. Potensi ini sangat relevan dalam dunia yang semakin terglobalisasi, di mana komunikasi lintas bahasa yang efektif sangat penting.
Namun, penting untuk mempertimbangkan batasan model Llama 4, khususnya tanggal cut-off pengetahuan Agustus 2024. Ini berarti bahwa model-model tersebut mungkin tidak dapat memberikan informasi terbaru tentang peristiwa atau informasi yang terjadi setelah tanggal ini. Pengguna harus menyadari batasan ini dan memperhitungkannya saat menggunakan model Llama 4 untuk aplikasi yang bergantung pada informasi terkini.
Selain itu, kebijakan penggunaan Llama yang dapat diterima membatasi penggunaannya di dalam Uni Eropa (EU). Organisasi yang beroperasi di dalam EU harus menyadari batasan ini dan memastikan kepatuhan terhadap kebijakan yang berlaku saat menggunakan model Llama 4.
Secara keseluruhan, peluncuran rangkaian Meta Llama 4 di OCI Generative AI merupakan peristiwa penting dalam dunia AI. Model-model ini menawarkan kombinasi yang menarik dari performa, fleksibilitas, aksesibilitas, dan dukungan multibahasa, memberdayakan pengembang dan organisasi untuk membuka potensi penuh AI. Dengan menyediakan model-model canggih ini melalui layanan OCI Generative AI, OCI membantu mendorong inovasi di berbagai industri dan mempercepat adopsi teknologi AI secara global. Dengan jejak GPU nya yang kecil dan jendela konteks yang besar serta kemampuan pemrosesan yang mumpuni, Llama 4 Scout memungkinkan pengembangan model AI secara efisien. Sementara, dengan arsitektur yang lebih besar dan kinerja yang sangat baik, model Llama 4 Maverick memperluas kemampuan AI untuk tugas yang lebih kompleks. Adopsi terbuka kedua model di bawah lisensi komunitas Llama 4 memungkinkan pengembang untuk bereksperimen dan juga berkolaborasi. Dengan cara ini, Meta membantu mempercepat pengembangan teknologi AI dan memastikan bahwa manfaat AI tersedia secara luas.