Google Tetapkan Harga Baru: Kos Gemini 2.5 Pro Didedahkan | ms

Arena kecerdasan buatan menyaksikan satu lagi perkembangan penting apabila Google secara rasmi mendedahkan struktur harga untuk mengakses enjin penaakulan AI canggihnya, Gemini 2.5 Pro, melalui Antara Muka Pengaturcaraan Aplikasi (API) miliknya. Model ini telah menjana keghairahan yang besar, menunjukkan prestasi luar biasa merentasi pelbagai penanda aras industri, terutamanya dalam tugas yang menuntut pengekodan canggih, penaakulan logik, dan keupayaan menyelesaikan masalah matematik. Pendedahan struktur kosnya memberikan pandangan penting tentang strategi kedudukan Google dalam landskap model AI berskala besar yang semakin kompetitif dan memberi isyarat trend berpotensi untuk pasaran yang lebih luas.

Pendekatan Bertingkat untuk Akses AI Premium

Google telah melaksanakan sistem harga dua peringkat untuk Gemini 2.5 Pro, secara langsung mengaitkan kos dengan kerumitan dan skala tugas yang ingin dilakukan oleh pembangun, diukur dalam ‘token’ – unit asas data (seperti suku kata, perkataan, atau bahagian kod) yang diproses oleh model ini.

Peringkat Penggunaan Standard (Sehingga 200,000 Token): Untuk gesaan yang termasuk dalam tetingkap konteks yang besar, namun standard ini, pembangun akan dikenakan caj sebanyak $1.25 untuk setiap juta token input yang mereka masukkan ke dalam model. Untuk meletakkan volum ini dalam perspektif, satu juta token secara kasarnya bersamaan dengan 750,000 perkataan Inggeris, volum yang melebihi keseluruhan teks karya epik seperti trilogi ‘The Lord of the Rings’. Kos untuk output yang dijana dalam peringkat ini ditetapkan jauh lebih tinggi, pada $10 setiap juta token output. Perbezaan harga ini mencerminkan keamatan pengiraan yang terlibat dalam menjana respons yang koheren, relevan, dan berkualiti tinggi berbanding dengan hanya memproses input.
Peringkat Konteks Lanjutan (Melebihi 200,000 Token): Menyedari keperluan yang semakin meningkat untuk model yang mampu mengendalikan jumlah maklumat yang sangat besar dalam satu gesaan – keupayaan yang tidak ditawarkan secara universal oleh pesaing – Google telah menetapkan titik harga yang berbeza dan lebih tinggi untuk menggunakan tetingkap konteks lanjutan Gemini 2.5 Pro. Untuk gesaan yang melebihi ambang 200,000 token, kos input berganda kepada $2.50 setiap juta token, manakala kos output menyaksikan peningkatan 50% kepada $15 setiap juta token. Premium ini mengiktiraf keupayaan lanjutan dan permintaan sumber berkaitan yang diperlukan untuk mengekalkan prestasi dan koheren merentasi ruang input yang begitu luas. Tugas seperti menganalisis dokumen undang-undang yang panjang, meringkaskan kertas penyelidikan yang luas, atau terlibat dalam perbualan berbilang giliran yang kompleks dengan memori mendalam mendapat manfaat yang besar daripada kapasiti konteks lanjutan ini.

Perlu diperhatikan bahawa Google juga menyediakan peringkat akses percuma untuk Gemini 2.5 Pro, walaupun dengan had kadar yang ketat. Ini membolehkan pembangun individu, penyelidik, dan penggemar untuk bereksperimen dengan keupayaan model, menilai prestasinya untuk kes penggunaan tertentu, dan membangunkan prototaip tanpa komitmen kewangan awal. Walau bagaimanapun, untuk sebarang aplikasi yang memerlukan daya pemprosesan yang besar atau ketersediaan yang konsisten, peralihan kepada API berbayar menjadi perlu.

Kedudukan dalam Portfolio AI Google

Pengenalan harga Gemini 2.5 Pro dengan tegas menetapkannya sebagai tawaran premium dalam barisan model AI semasa Google yang tersedia melalui akses API. Kosnya jauh melebihi model lain yang dibangunkan oleh Google, menonjolkan strategi untuk mensegmentasikan tawaran mereka berdasarkan keupayaan dan prestasi.

Ambil contoh, Gemini 2.0 Flash. Model ini diletakkan sebagai alternatif yang lebih ringan dan pantas, dioptimumkan untuk tugas di mana kelajuan dan kecekapan kos adalah paling utama. Harganya mencerminkan kedudukan ini, berharga hanya $0.10 setiap juta token input dan $0.40 setiap juta token output. Ini mewakili perbezaan kos lebih daripada sepuluh kali ganda berbanding peringkat standard Gemini 2.5 Pro untuk input dan dua puluh lima kali ganda untuk output.

Kontras yang ketara ini menekankan aplikasi sasaran yang berbeza:

Gemini 2.0 Flash: Sesuai untuk tugas bervolum tinggi, kependaman rendah seperti penjanaan kandungan asas, Soal Jawab mudah, aplikasi sembang di mana respons pantas adalah kunci, dan pengekstrakan data di mana penaakulan peringkat teratas bukanlah keperluan utama.
Gemini 2.5 Pro: Ditujukan kepada penyelesaian masalah yang kompleks, penjanaan dan penyahpepijatan kod yang rumit, penaakulan matematik lanjutan, analisis mendalam set data atau dokumen besar, dan aplikasi yang menuntut tahap ketepatan dan nuansa tertinggi.

Pembangun kini mesti menimbang dengan teliti pertukaran tersebut. Adakah penaakulan unggul, kehebatan pengekodan, dan tetingkap konteks lanjutan Gemini 2.5 Pro bernilai premium harga yang besar berbanding kelajuan dan kemampuan Gemini 2.0 Flash? Jawapannya akan bergantung sepenuhnya pada permintaan khusus aplikasi mereka dan nilai yang diperoleh daripada keupayaan yang dipertingkatkan. Struktur harga ini jelas memberi isyarat niat Google untuk memenuhi segmen pasaran pembangun yang berbeza dengan alat berbeza yang dioptimumkan untuk keperluan yang berbeza.

Menavigasi Landskap Kompetitif

Walaupun Gemini 2.5 Pro mewakili model AI Google yang paling mahal yang tersedia secara umum setakat ini, harganya tidak wujud dalam vakum. Menilai kosnya berbanding model terkemuka daripada pesaing utama seperti OpenAI dan Anthropic mendedahkan gambaran kompleks tentang kedudukan strategik dan nilai tanggapan.

Di Mana Gemini 2.5 Pro Kelihatan Lebih Mahal:

OpenAI’s o3-mini: Model dari OpenAI ini berharga $1.10 setiap juta token input dan $4.40 setiap juta token output. Berbanding dengan peringkat standard Gemini 2.5 Pro ($1.25 input / $10 output), tawaran Google membawa kos input yang sedikit lebih tinggi dan kos output yang jauh lebih tinggi. Penamaan ‘mini’ sering membayangkan model yang lebih kecil, berpotensi lebih pantas tetapi kurang berkemampuan daripada rakan sejawat ‘pro’ atau perdana, menjadikan ini perbandingan antara peringkat keupayaan yang berbeza.
DeepSeek’s R1: Model dari DeepSeek ini, pemain yang kurang menonjol secara global tetapi masih relevan, memberikan pilihan yang lebih ekonomik pada $0.55 setiap juta token input dan $2.19 setiap juta token output. Ini jauh lebih rendah daripada Gemini 2.5 Pro, meletakkan R1 kemungkinan untuk pengguna yang mengutamakan kos di atas segalanya, berpotensi menerima pertukaran dalam prestasi atau set ciri seperti tetingkap konteks lanjutan.

Di Mana Gemini 2.5 Pro Menawarkan Harga Kompetitif atau Lebih Rendah:

Anthropic’s Claude 3.7 Sonnet: Pesaing langsung yang sering disebut kerana prestasinya yang kukuh, Claude 3.7 Sonnet datang dengan tanda harga $3 setiap juta token input dan $15 setiap juta token output. Di sini, peringkat standard Gemini 2.5 Pro ($1.25/$10) jauh lebih murah untuk kedua-dua input dan output. Malah peringkat konteks lanjutan Gemini 2.5 Pro ($2.50/$15) lebih murah pada input dan sepadan dengan kos output Sonnet, sambil berpotensi menawarkan tetingkap konteks yang lebih besar atau ciri prestasi yang berbeza. Ini menjadikan Gemini 2.5 Pro kelihatan berharga agresif terhadap model Anthropic khusus ini.
OpenAI’s GPT-4.5: Sering dianggap sebagai salah satu puncak keupayaan AI semasa, GPT-4.5 mengenakan harga yang jauh lebih tinggi: $75 setiap juta token input dan $150 setiap juta token output. Terhadap penanda aras ini, Gemini 2.5 Pro, walaupun pada peringkat premiumnya, kelihatan sangat berpatutan, berharga kira-kira 30 kali lebih rendah untuk input dan 10 kali lebih rendah untuk output. Ini menonjolkan stratifikasi kos yang signifikan walaupun di kalangan model peringkat teratas.

Analisis perbandingan ini menunjukkan bahawa Google telah meletakkan Gemini 2.5 Pro secara strategik di kedudukan tengah yang kompetitif. Ia bukan pilihan termurah, mencerminkan keupayaannya yang canggih, tetapi ia jauh lebih rendah daripada beberapa model yang paling berkuasa (dan mahal) di pasaran, bertujuan untuk menawarkan keseimbangan prestasi dan kos yang menarik, terutamanya apabila dibandingkan dengan model seperti Claude 3.7 Sonnet dan GPT-4.5.

Penerimaan Pembangun dan Nilai Tanggapan

Walaupun merupakan model Google yang paling mahal, maklum balas awal yang muncul daripada komuniti teknologi dan pembangun kebanyakannya positif. Ramai pengulas dan pengguna awal telah menggambarkan harga sebagai ‘munasabah’ atau ‘berpatutan’ apabila dipertimbangkan berdasarkan keupayaan model yang ditunjukkan.

Persepsi ini kemungkinan berpunca daripada beberapa faktor:

Prestasi Penanda Aras: Gemini 2.5 Pro bukan sekadar penambahbaikan secara beransur-ansur; ia telah mencapai skor peneraju industri pada penanda aras yang direka khusus untuk menguji had AI dalam penjanaan kod, potongan logik, dan tugas matematik yang kompleks. Pembangun yang bekerja pada aplikasi yang sangat bergantung pada keupayaan ini mungkin melihat harga sebagai wajar oleh potensi untuk hasil yang unggul, kadar ralat yang dikurangkan, atau keupayaan untuk menangani masalah yang sebelum ini tidak dapat diselesaikan dengan model yang kurang berkemampuan.
Tetingkap Konteks Lanjutan: Keupayaan untuk memproses gesaan yang lebih besar daripada 200,000 token adalah pembeza yang signifikan. Untuk kes penggunaan yang melibatkan analisis dokumen besar, mengekalkan sejarah perbualan yang panjang, atau memproses pangkalan kod yang luas, ciri ini sahaja boleh memberikan nilai yang besar, mewajarkan kos premium yang berkaitan dengan peringkat yang lebih tinggi. Banyak model pesaing sama ada kekurangan keupayaan ini atau menawarkannya pada kos tersirat yang berpotensi lebih tinggi.
Harga Kompetitif (Relatif): Seperti yang dinyatakan sebelum ini, apabila dibandingkan dengan Sonnet Anthropic atau model mewah OpenAI seperti GPT-4.5 atau o1-pro yang lebih mahal, harga Gemini 2.5 Pro kelihatan kompetitif, jika tidak secara terang-terangan berfaedah. Pembangun yang membandingkan model berprestasi tinggi khusus ini mungkin melihat tawaran Google sebagai menyediakan hasil peringkat teratas tanpa kos mutlak tertinggi.
Ketersediaan Peringkat Percuma: Kewujudan peringkat percuma dengan had kadar membolehkan pembangun mengesahkan kesesuaian model untuk keperluan mereka sebelum komited kepada penggunaan berbayar, merendahkan halangan untuk masuk dan memupuk muhibah.

Penerimaan positif menunjukkan bahawa Google telah berjaya menyampaikan proposisi nilai – meletakkan Gemini 2.5 Pro bukan hanya sebagai satu model AI, tetapi sebagai alat berprestasi tinggi yang kosnya sejajar dengan keupayaan canggih dan kedudukan kompetitifnya.

Peningkatan Kos AI Termaju

Trend asas yang dapat diperhatikan di seluruh industri AI ialah tekanan menaik yang ketara pada harga model perdana. Walaupun Hukum Moore secara sejarah menurunkan kos pengkomputeran, pembangunan dan penggunaan model bahasa besar terkini yang paling berkuasa nampaknya menentang trend itu, sekurang-kurangnya buat masa ini. Keluaran peringkat teratas baru-baru ini daripada makmal AI utama seperti Google, OpenAI, dan Anthropic secara amnya mengenakan harga yang lebih tinggi daripada pendahulu mereka atau adik-beradik peringkat rendah.

o1-pro yang baru dilancarkan oleh OpenAI berfungsi sebagai contoh nyata fenomena ini. Ia mewakili tawaran API syarikat yang paling mahal setakat ini, berharga $150 setiap juta token input dan $600 setiap juta token output yang mengejutkan. Harga ini mengatasi malah harga GPT-4.5 dan menjadikan Gemini 2.5 Pro kelihatan ekonomik jika dibandingkan.

Beberapa faktor kemungkinan menyumbang kepada trajektori harga yang meningkat ini untuk model terkini:

Permintaan Pengiraan yang Intensif: Melatih model besar ini memerlukan kuasa pengiraan yang sangat besar, sering melibatkan beribu-ribu pemproses khusus (seperti GPU atau TPU Google) yang berjalan selama berminggu-minggu atau berbulan-bulan. Ini menanggung kos yang besar dari segi pemerolehan perkakasan, penyelenggaraan, dan, secara kritikal, penggunaan tenaga.
Kos Inferens: Menjalankan model untuk pengguna (inferens) juga menggunakan sumber pengiraan yang signifikan. Permintaan tinggi bermakna meningkatkan infrastruktur pelayan, yang sekali lagi diterjemahkan kepada perbelanjaan operasi yang lebih tinggi. Model dengan kiraan parameter yang lebih besar atau seni bina lanjutan seperti Mixture-of-Experts (MoE) boleh menjadi sangat mahal untuk dijalankan pada skala.
Pelaburan Penyelidikan dan Pembangunan: Menolak sempadan AI memerlukan pelaburan berterusan yang besar dalam penyelidikan, pemerolehan bakat, dan eksperimen. Syarikat perlu mendapatkan semula kos R&D yang besar ini melalui tawaran komersial mereka.
Permintaan Pasaran Tinggi: Apabila perniagaan dan pembangun semakin mengiktiraf potensi transformatif AI lanjutan, permintaan untuk model yang paling berkemampuan melonjak. Ekonomi asas menentukan bahawa permintaan tinggi, ditambah dengan kos bekalan yang tinggi (sumber pengkomputeran), boleh membawa kepada harga yang lebih tinggi, terutamanya untuk produk premium.
Harga Berasaskan Nilai: Makmal AI mungkin menetapkan harga model teratas mereka berdasarkan nilai tanggapan yang mereka berikan dan bukannya semata-mata berdasarkan pemulihan kos. Jika model boleh meningkatkan produktiviti dengan ketara, mengautomasikan tugas yang kompleks, atau membolehkan aplikasi baharu sepenuhnya, pengguna mungkin bersedia membayar premium untuk keupayaan itu.

Ulasan CEO Google Sundar Pichai memberi penekanan kepada faktor permintaan. Beliau menyatakan bahawa Gemini 2.5 Pro pada masa ini adalah model AI syarikat yang paling dicari di kalangan pembangun. Populariti ini telah mendorong lonjakan penggunaan sebanyak 80% dalam platform AI Studio Google dan melalui Gemini API pada bulan semasa sahaja. Penerimaan pantas sedemikian menekankan selera pasaran untuk alat AI yang berkuasa dan memberikan justifikasi untuk struktur harga premium.

Trend ini mencadangkan potensi segmentasi pasaran di mana keupayaan termaju datang pada premium yang signifikan, manakala model yang lebih mantap atau kurang berkuasa menjadi semakin dikomoditikan dan berpatutan. Cabaran bagi pembangun dan perniagaan adalah untuk terus menilai nisbah kos-faedah, menentukan bila ciri lanjutan model perdana mewajarkan perbelanjaan yang lebih tinggi berbanding alternatif yang ‘cukup baik’. Harga Gemini 2.5 Pro adalah titik data yang jelas dalam evolusi pasaran AI yang berterusan ini.

dikemaskinikan pada 2025-04-05

# Google # Gemini # AIGC