Lanskap Large Language Models (LLM) telah mengalami transformasi signifikan, dengan Google muncul sebagai pemain terkemuka sementara Meta dan OpenAI menghadapi tantangan yang cukup besar. Awalnya, OpenAI mendominasi bidang ini dengan model GPT revolusionernya, menetapkan tolok ukur baru untuk kinerja LLM. Meta juga mengamankan posisi substansial dengan menawarkan model open-weight yang membanggakan kemampuan mengesankan dan memungkinkan penggunaan, modifikasi, dan penerapan kode yang dapat diakses publik mereka tanpa batasan.
Namun, dominasi awal ini membuat raksasa teknologi lainnya, termasuk Google, bermain mengejar ketinggalan. Terlepas dari makalah penelitian penting Google tahun 2017 tentang arsitektur transformer yang mendasari LLM, upaya awal perusahaan dibayangi oleh peluncuran Bard yang dikritik secara luas pada tahun 2023.
Baru-baru ini, keadaan telah berbalik dengan diperkenalkannya LLM baru yang kuat dari Google, ditambah dengan kemunduran yang dialami oleh Meta dan OpenAI. Pergeseran ini telah secara signifikan mengubah dinamika lanskap LLM.
Meta’s Llama 4: Sebuah Kesalahan?
Rilis tak terduga Llama 4 oleh Meta pada hari Sabtu, 5 April, menimbulkan keheranan di seluruh industri.
Keputusan untuk meluncurkan model utama pada akhir pekan dianggap tidak konvensional, menyebabkan penerimaan yang diredam dan mengaburkan pengumuman di tengah arus berita minggu berikutnya.
Meskipun Llama 4 memiliki kekuatan tertentu, termasuk kemampuan multimodalnya (menangani gambar, audio, dan modalitas lainnya) dan ketersediaannya dalam tiga versi (Llama 4 Behemoth, Maverick, dan Scout) dengan berbagai ukuran dan kekuatan, peluncurannya disambut dengan kritik. Versi Llama 4 Scout, khususnya, menampilkan context window substansial hingga 10 juta token, memungkinkan model untuk memproses dan menghasilkan sejumlah besar teks dalam satu sesi.
Namun, penerimaan model menjadi masam ketika perbedaan muncul mengenai pendekatan peringkat Meta di LMArena, sebuah platform yang memberi peringkat LLM berdasarkan suara pengguna. Ditemukan bahwa model Llama 4 khusus yang digunakan untuk peringkat berbeda dari yang tersedia untuk masyarakat umum. LMArena menyatakan bahwa Meta menyediakan ‘model khusus untuk mengoptimalkan preferensi manusia’.
Selain itu, klaim Meta mengenai context window 10 juta token Llama 4 Scout disambut dengan skeptisisme. Terlepas dari akurasi teknis dari angka ini, tolok ukur mengungkapkan bahwa Llama 4 tertinggal di belakang model pesaing dalam kinerja long-context.
Menambah kekhawatiran, Meta menahan diri untuk tidak merilis model Llama 4 ‘penalaran’ atau ‘berpikir’ dan menahan varian yang lebih kecil, meskipun perusahaan telah mengindikasikan bahwa model penalaran akan segera hadir.
Ben Lorica, pendiri perusahaan konsultan AI Gradient Flow, mencatat bahwa Meta menyimpang dari praktik standar rilis yang lebih sistematis, di mana semua komponen dipersiapkan sepenuhnya. Ini menunjukkan bahwa Meta mungkin sangat ingin memamerkan model baru, bahkan jika ia kekurangan elemen penting seperti model penalaran dan versi yang lebih kecil.
OpenAI’s GPT-4.5: Mundur Sebelum Waktunya
OpenAI juga menghadapi tantangan dalam beberapa bulan terakhir.
GPT-4.5, diluncurkan sebagai pratinjau penelitian pada 27 Februari, digembar-gemborkan sebagai ‘model terbesar dan terbaik perusahaan untuk obrolan hingga saat ini’. Tolok ukur OpenAI menunjukkan bahwa GPT-4.5 umumnya mengungguli pendahulunya, GPT-4o.
Namun, struktur harga model menuai kritik. OpenAI menetapkan harga akses API sebesar US$150 per juta token output, peningkatan mengejutkan 15 kali lipat dibandingkan dengan harga GPT-4o sebesar $10 per juta token. API memungkinkan pengembang untuk mengintegrasikan model OpenAI ke dalam aplikasi dan layanan mereka.
Alan D. Thompson, konsultan dan analis AI di Life Architect, memperkirakan bahwa GPT-4.5 kemungkinan merupakan LLM tradisional terbesar yang dirilis selama kuartal pertama tahun 2025, dengan sekitar 5,4 triliun parameter. Dia berpendapat bahwa skala yang sangat besar seperti itu sulit untuk dibenarkan mengingat keterbatasan perangkat keras saat ini dan menimbulkan tantangan signifikan dalam melayani basis pengguna yang besar.
Pada 14 April, OpenAI mengumumkan keputusannya untuk menghentikan akses GPT-4.5 melalui API setelah kurang dari tiga bulan. Meskipun GPT-4.5 akan tetap dapat diakses, itu akan terbatas pada pengguna ChatGPT melalui antarmuka ChatGPT.
Pengumuman ini bertepatan dengan diperkenalkannya GPT-4.1, model yang lebih ekonomis dengan harga $8 per juta token. Tolok ukur OpenAI menunjukkan bahwa GPT-4.1 tidak cukup mampu seperti GPT-4.5 secara keseluruhan, meskipun ia menunjukkan kinerja yang unggul dalam tolok ukur pengkodean tertentu.
OpenAI juga baru-baru ini merilis model penalaran baru, o3 dan o4-mini, dengan model o3 menunjukkan kinerja tolok ukur yang sangat kuat. Namun, biaya tetap menjadi perhatian, karena akses API ke o3 dihargai $40 per juta token output.
Kebangkitan Google: Merebut Peluang
Penerimaan beragam Llama 4 dan ChatGPT-4.5 menciptakan peluang bagi pesaing untuk memanfaatkan, dan mereka telah merebut peluang tersebut.
Peluncuran Llama 4 Meta yang bermasalah tidak mungkin menghalangi pengembang untuk mengadopsi alternatif seperti DeepSeek-V3, Gemma Google, dan Qwen2.5 Alibaba. LLM ini, yang diperkenalkan pada akhir tahun 2024, telah menjadi model open-weight yang disukai di papan peringkat LMArena dan HuggingFace. Mereka menyaingi atau melampaui Llama 4 dalam tolok ukur populer, menawarkan akses API yang terjangkau, dan, dalam beberapa kasus, tersedia untuk diunduh dan digunakan pada perangkat keras kelas konsumen.
Namun, LLM mutakhir Google, Gemini 2.5 Pro, yang benar-benar menarik perhatian.
Diluncurkan pada 25 Maret, Google Gemini 2.5 Pro adalah ‘model berpikir’ yang mirip dengan GPT-o1 dan DeepSeek-R1, menggunakan self-prompting untuk menalar melalui tugas. Gemini 2.5 Pro bersifat multimodal, menampilkan context window satu juta token, dan mendukung penelitian mendalam.
Gemini 2.5 telah dengan cepat mencapai kemenangan tolok ukur, termasuk posisi teratas di SimpleBench (meskipun menyerahkan posisi itu ke o3 OpenAI pada 16 April) dan pada Indeks Kecerdasan AI gabungan Analisis Buatan. Gemini 2.5 Pro saat ini memegang posisi teratas di LMArena. Pada 14 April, model Google menempati 5 dari 10 slot teratas di LMArena, termasuk Gemini 2.5 Pro, tiga varian Gemini 2.0, dan Gemma 3-27B.
Di luar kinerja yang mengesankan, Google juga merupakan pemimpin harga. Google Gemini 2.5 saat ini tersedia untuk penggunaan gratis melalui aplikasi Gemini Google dan situs web AI Studio Google. Harga API Google juga kompetitif, dengan Gemini 2.5 Pro dihargai $10 per juta token output dan Gemini 2.0 Flash dihargai hanya 40 sen per juta token.
Lorica mencatat bahwa untuk tugas penalaran volume tinggi, ia sering memilih DeepSeek-R1 atau Google Gemini, sementara menggunakan model OpenAI membutuhkan pertimbangan harga yang lebih hati-hati.
Sementara Meta dan OpenAI tidak selalu berada di ambang kehancuran, OpenAI mendapat manfaat dari popularitas ChatGPT, yang dilaporkan membanggakan satu miliar pengguna. Namun demikian, peringkat Gemini yang kuat dan kinerja tolok ukur menunjukkan pergeseran dalam lanskap LLM, yang saat ini menguntungkan Google.
Perbandingan Model LLM Utama
Untuk memberikan gambaran yang lebih jelas tentang persaingan di pasar LLM, berikut adalah perbandingan singkat dari model-model utama yang dibahas:
- GPT-4.5 (OpenAI): LLM yang sangat besar dengan kinerja yang kuat tetapi harga API yang mahal, mengakibatkan penarikan awal akses API. Sekarang terbatas pada pengguna ChatGPT.
- GPT-4.1 (OpenAI): Model yang lebih ekonomis daripada GPT-4.5, menunjukkan kinerja yang baik dalam tolok ukur pengkodean tertentu.
- Llama 4 (Meta): Model open-weight dengan kemampuan multimodal, namun peluncurannya dan keakuratan peringkatnya di LMArena telah dikritik. Tidak memiliki model penalaran yang dirilis.
- Gemini 2.5 Pro (Google): Model penalaran multimodal dengan context window yang besar, mencapai kinerja tolok ukur yang tinggi dan tersedia secara gratis melalui aplikasi dan situs web Google. Harganya juga kompetitif melalui API.
- DeepSeek-V3: Model open-weight yang populer, menyaingi atau melampaui Llama 4 dalam tolok ukur dan menawarkan akses API yang terjangkau.
- Gemma (Google): Keluarga model open-weight yang telah menjadi model yang disukai di papan peringkat, menyediakan alternatif yang layak untuk Llama 4.
- Qwen2.5 (Alibaba): LLM lain yang kompetitif yang telah mendapatkan pengakuan sebagai model open-weight yang kuat.
Faktor-faktor yang Mempengaruhi Pergeseran Kekuatan
Beberapa faktor telah berkontribusi pada pergeseran kekuatan yang diamati di arena LLM:
- Harga: Struktur harga OpenAI untuk model yang lebih baru seperti GPT-4.5 telah dianggap tidak dapat dijangkau oleh banyak pengembang, membuka pintu bagi alternatif yang lebih terjangkau seperti Google Gemini dan DeepSeek-R1.
- Kinerja: Gemini 2.5 Pro Google telah menunjukkan kinerja tolok ukur yang mengesankan, bahkan mengungguli model lain dalam tes tertentu. Ini telah menarik perhatian dan minat yang signifikan dari komunitas AI.
- Aksesibilitas: Google telah membuat Gemini 2.5 tersedia untuk penggunaan gratis melalui aplikasi dan situs webnya, memberikan akses yang mudah bagi pengguna untuk mengalami kemampuan model secara langsung.
- Model Open-Weight: Ketersediaan model open-weight seperti Llama 4, Gemma, dan Qwen2.5 telah memberikan pengembang lebih banyak fleksibilitas dan kontrol atas model LLM, yang mengarah ke inovasi dan adopsi yang lebih luas.
- Fokus pada Penalaran: Google telah menekankan pengembangan model penalaran seperti Gemini 2.5 Pro, yang telah terbukti sangat efektif dalam menangani tugas-tugas kompleks yang membutuhkan kemampuan berpikir dan pemecahan masalah tingkat lanjut.
- Ukuran Context Window: Context window satu juta token Gemini 2.5 Pro memungkinkannya untuk memproses dan menghasilkan sejumlah besar teks, memberikan keunggulan yang berbeda dalam aplikasi yang membutuhkan pemahaman dan generasi konteks yang panjang.
Implikasi bagi Masa Depan LLM
Pergeseran kekuatan di lanskap LLM memiliki implikasi yang luas untuk masa depan teknologi AI:
- Persaingan yang Meningkat: Meningkatnya persaingan antara Google, Meta, OpenAI, dan pemain lainnya akan mendorong inovasi dan kemajuan yang berkelanjutan di bidang LLM.
- Lebih Banyak Aksesibilitas: Ketersediaan model open-weight dan opsi harga yang terjangkau akan membuat LLM lebih mudah diakses oleh berbagai pengembang dan organisasi, yang mengarah ke aplikasi dan kasus penggunaan yang lebih luas.
- Fokus yang Lebih Besar pada Penalaran: Seiring LLM menjadi lebih kuat, akan ada peningkatan fokus pada pengembangan model penalaran yang dapat menangani tugas-tugas kompleks dan memecahkan masalah dunia nyata.
- Kemampuan Multimodal yang Ditingkatkan: LLM akan terus menggabungkan kemampuan multimodal, memungkinkan mereka untuk memproses dan menghasilkan teks, gambar, audio, dan modalitas lainnya.
- Integrasi ke dalam Berbagai Industri: LLM akan semakin terintegrasi ke dalam berbagai industri, termasuk perawatan kesehatan, keuangan, pendidikan, dan manufaktur, yang merevolusi cara bisnis beroperasi dan memberikan layanan.
- Pertimbangan Etika: Saat LLM menjadi lebih kuat, akan semakin penting untuk mengatasi pertimbangan etika seperti bias, disinformasi, dan potensi penyalahgunaan teknologi ini.
Kesimpulan
Munculnya Google sebagai pemain terkemuka di arena LLM menandai perubahan signifikan dalam dinamika industri. Sementara Meta dan OpenAI menghadapi tantangan, Gemini 2.5 Pro Google dan model open-weight Google telah mendapatkan pengakuan dan adopsi yang luas. Fokus pada penalaran, harga yang kompetitif, dan aksesibilitas telah berkontribusi pada kebangkitan Google.
Seiring lanskap LLM terus berkembang, persaingan antara para pemain utama ini akan mendorong inovasi dan memunculkan peluang baru bagi bisnis dan individu. Masa depan LLM menjanjikan, dengan potensi aplikasi dan transformasi yang tak terhitung jumlahnya di berbagai industri.