Pada I/O 2025, Google memperkenalkan siri kemas kini inovatif untuk model Gemini 2.5, bersama dengan ciri eksperimen inovatif yang dikenali sebagai Deep Think, yang direka untuk meningkatkan keupayaan penaakulan model 2.5 Pro. Kemajuan ini menandakan lonjakan penting dalam bidang kecerdasan buatan, menawarkan pembangun dan pengguna tahap prestasi, kecekapan dan kepelbagaian yang belum pernah terjadi sebelumnya.
Model Gemini 2.5 Pro telah mendapat pengiktirafan meluas daripada pembangun sebagai penyelesaian utama untuk tugas pengekodan, manakala model 2.5 Flash akan menerima peningkatan yang besar. Tambahan pula, Google memperkenalkan pelbagai keupayaan baharu merentasi modelnya, termasuk Deep Think, mod penaakulan dipertingkat eksperimen yang direka khusus untuk model 2.5 Pro.
Dalam pengumuman sebelumnya, Google memperkenalkan Gemini 2.5 Pro, modelnya yang paling cerdas setakat ini, dan mempercepatkan keluaran kemas kini I/O untuk memperkasakan pembangun dalam mencipta aplikasi web yang luar biasa. Hari ini, syarikat itu berkongsi penambahbaikan selanjutnya pada siri model Gemini 2.5, yang menawarkan pencapaian yang luar biasa:
Gemini 2.5 Pro telah melampaui semua jangkaan, menunjukkan prestasi cemerlang pada penanda aras akademik. Ia kini memegang kedudukan teratas di papan pendahulu WebDev Arena dan LMArena, mengukuhkan statusnya sebagai model terkemuka dunia untuk pengekodan dan bantuan pembelajaran.
Ciri baharu sedang disepadukan ke dalam 2.5 Pro dan 2.5 Flash, termasuk output audio natif untuk pengalaman perbualan yang lebih semula jadi dan menarik, langkah keselamatan lanjutan dan penyepaduan keupayaan penggunaan komputer Project Mariner. Model 2.5 Pro akan dipertingkatkan lagi dengan Deep Think, mod eksperimen yang direka untuk menambah baik penaakulan untuk masalah matematik dan pengekodan yang rumit.
Google tetap komited untuk menambah baik pengalaman pembangun melalui penyertaan ringkasan pemikiran dalam Gemini API dan Vertex AI. Ringkasan ini menawarkan ketelusan yang dipertingkatkan, melanjutkan bajet pemikiran untuk 2.5 Pro bagi memastikan kawalan yang lebih besar dan sokongan untuk alatan MCP dalam Gemini API dan SDK untuk akses kepada pelbagai alatan sumber terbuka yang lebih luas.
Model 2.5 Flash kini boleh diakses secara universal dalam apl Gemini. Versi yang dikemas kini akan tersedia tidak lama lagi dalam Google AI Studio untuk pembangun dan dalam Vertex AI untuk perusahaan, yang dijadualkan pada awal Jun, dengan 2.5 Pro menyusul selepas itu.
Kemajuan yang luar biasa ini adalah hasil dedikasi tanpa henti daripada pasukan Google, yang komited untuk sentiasa menambah baik teknologinya dan menggunakannya dengan cara yang selamat dan bertanggungjawab.
Mendedahkan Prestasi Unggul 2.5 Pro
Model 2.5 Pro baru-baru ini telah dikemas kini untuk memperkasakan pembangun dalam mencipta aplikasi web yang lebih interaktif dan kaya dengan ciri. Maklum balas positif yang diterima daripada pengguna dan pembangun sangat dihargai, dan penambahbaikan berterusan akan terus dilaksanakan berdasarkan input pengguna.
Selain prestasinya yang cemerlang pada penanda aras akademik, lelaran terkini 2.5 Pro telah menawan tempat teratas di papan pendahulu pengekodan popular, WebDev Arena, dengan skor ELO yang mengagumkan sebanyak 1415. Ia juga mendahului semua papan pendahulu LMArena, yang menilai keutamaan manusia berdasarkan pelbagai kriteria. Lebih-lebih lagi, dilengkapi dengan tetingkap konteks 1 juta token, 2.5 Pro menyampaikan prestasi terkini dalam konteks panjang dan pemahaman video.
Dengan menyepadukan LearnLM, keluarga model yang dibangunkan dengan kerjasama pakar pendidikan, 2.5 Pro telah menjadi model terkemuka untuk pembelajaran. Dalam perbandingan langsung yang menilai pedagogi dan keberkesanannya, pendidik dan pakar menyokong Gemini 2.5 Pro berbanding model lain merentasi pelbagai senario. Ia juga mengatasi model teratas merentasi kelima-lima prinsip sains pembelajaran, yang digunakan untuk membina sistem AI untuk pembelajaran. Ini menyerlahkan keberkesanannya dalam konteks pendidikan, menawarkan strategi pengajaran yang disesuaikan dan berkesan.
Deep Think: Menolak Sempadan Penaakulan
Google secara aktif meneroka had keupayaan kognitif Gemini dan mula bereksperimen dengan mod penaakulan dipertingkat yang dipanggil Deep Think. Mod inovatif ini menggunakan teknik penyelidikan yang canggih, membolehkan model menilai berbilang hipotesis sebelum merumuskan respons. Pendekatan ini meningkatkan proses membuat keputusan, membenarkan hasil yang lebih canggih dan bernuansa dalam situasi yang kompleks.
Gemini 2.5 Pro Deep Think mencapai skor yang mengagumkan pada USAMO 2025, yang diiktiraf secara meluas sebagai salah satu penanda aras matematik yang paling mencabar. Ia juga cemerlang pada LiveCodeBench, penanda aras yang mencabar untuk pengekodan peringkat pertandingan, dan mencapai skor 84.0% pada MMMU, yang menilai penaakulan multimodal. Hasil ini menggariskan prestasi luar biasa Deep Think dalam mengendalikan tugas yang kompleks, mencadangkan masa depan yang menjanjikan untuk penyelesaian masalah AI yang canggih.
Memandangkan 2.5 Pro Deep Think sedang menolak barisan had bagi perkara yang mungkin, Google meluangkan masa tambahan untuk menjalankan penilaian keselamatan yang teliti dan mendapatkan input selanjutnya daripada pakar keselamatan. Syarikat itu juga akan menyediakan penguji terpilih dengan akses kepada Gemini API untuk mengumpul maklum balas sebelum menjadikannya tersedia secara meluas. Pendekatan yang berhati-hati dan disengajakan ini bertujuan untuk memastikan penggunaan teknologi AI canggih yang bertanggungjawab.
Memperkenalkan 2.5 Flash yang Dipertingkatkan
Model 2.5 Flash, yang terkenal dengan kecekapan dan keberkesanannya dari segi kos, telah diperhalusi merentasi pelbagai dimensi. Ia telah menunjukkan peningkatan merentasi penanda aras kritikal untuk penaakulan, multimodaliti, pengendalian kod dan konteks panjang, sambil menjadi lebih cekap, menggunakan antara 20-30% kurang token dalam penilaian. Ini menonjolkan prestasi dan pengurusan sumber yang dioptimumkan.
2.5 Flash baharu kini tersedia untuk pratonton dalam Google AI Studio untuk pembangun, dalam Vertex AI untuk aplikasi perusahaan dan dalam apl Gemini untuk pengguna umum. Ia dijadualkan untuk ketersediaan umum pada awal Jun, menjadikannya boleh diakses untuk persekitaran pengeluaran.
Keupayaan Baharu Gemini 2.5
Peningkatan pada Output Audio Natif dan API Langsung
API Langsung memperkenalkan versi pratonton input audio-visual dan dialog output audio natif, membolehkan pengguna mencipta pengalaman perbualan dengan Gemini yang lebih semula jadi dan ekspresif. Ciri ini membolehkan aplikasi yang lebih menarik dan interaktif. Keupayaan AI untuk menghasilkan respons audio yang realistik meningkatkan interaksi pengguna dengan ketara dengan mencipta cara berkomunikasi yang lebih intuitif.
API Langsung memperkasakan pengguna untuk mengendalikan nada, loghat dan gaya pertuturan model. Contohnya, model boleh diarahkan untuk menggunakan suara dramatik apabila menceritakan kisah. Ia juga menyokong penggunaan alat, membenarkannya menjalankan carian bagi pihak pengguna. Fleksibiliti dalam kawalan suara dan akses kepada alat luaran menjadikan model ini sangat serba boleh dan berharga merentasi pelbagai senario aplikasi.
Pengguna boleh bereksperimen dengan pelbagai ciri awal, termasuk:
Dialog Afektif: Model mengesan emosi dalam suara pengguna dan bertindak balas dengan sewajarnya. Fungsi ini menambahkan lapisan kecerdasan emosi pada AI, menjadikan interaksi lebih diperibadikan.
Audio Proaktif: Model mengabaikan perbualan latar belakang dan tahu bila untuk bertindak balas, meminimumkan gangguan dan meningkatkan kejelasan. Ciri ini meningkatkan kualiti interaksi, membenarkan komunikasi yang lebih cekap dan fokus.
Berfikir dalam API Langsung: Model memanfaatkan keupayaan pemikiran Gemini untuk menyokong tugas yang lebih kompleks. Ini membenarkan analisis dan pertimbangan yang lebih mendalam apabila menangani tugas yang kompleks, menjadikannya sangat berharga dalam bidang yang memerlukan penyelesaian yang tepat dan berwawasan.
Google juga mengeluarkan pratonton baharu untuk fungsi teks ke pertuturan dalam 2.5 Pro dan 2.5 Flash. Ini menyediakan sokongan pertama seumpamanya untuk berbilang pembesar suara, membolehkan teks ke pertuturan dengan dua suara melalui output audio natif. Ciri ini amat berharga untuk mencipta naratif dan dialog yang menarik dalam aplikasi multimedia.
Seperti dialog Audio Natif, teks ke pertuturan adalah ekspresif dan boleh menangkap nuansa halus seperti bisikan. Ia menyokong lebih 24 bahasa dan bertukar antara mereka dengan lancar, menjadikannya alat serba boleh untuk komunikasi global. Perkara halus dalam penggunaan bahasa ini memperkaya pengalaman pengguna, memudahkan proses komunikasi yang lebih bernuansa dan diperibadikan.
Keupayaan teks ke pertuturan ini akan tersedia kemudian hari ini dalam Gemini API.
Antara Muka Komputer yang Dipertingkatkan
Google memperkenalkan keupayaan penggunaan komputer Project Mariner ke dalam Gemini API dan Vertex AI. Syarikat yang berpandangan ke hadapan seperti Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company dan Cartwheel sedang meneroka potensinya. Google berharap untuk pelancaran yang lebih luas untuk pembangun bagi bereksperimen dengan keupayaan ini pada musim panas ini, membuka jalan untuk projek dan penyelesaian yang inovatif. Keupayaan untuk menyepadukan model AI secara langsung dengan antara muka komputer membawa kepada penyelesaian aliran kerja yang lebih diperkemas dan produktif merentasi pelbagai industri.
Langkah Keselamatan Unggul
Google telah mengukuhkan dengan ketara perlindungannya terhadap ancaman keselamatan, seperti suntikan segera tidak langsung. Ini melibatkan membenamkan arahan berniat jahat ke dalam data yang diambil oleh model AI. Pendekatan keselamatan baharu Google telah meningkatkan dengan ketara kadar perlindungan Gemini terhadap serangan suntikan segera tidak langsung semasa penggunaan alat, menjadikan Gemini 2.5 keluarga modelnya yang paling selamat setakat ini. Keselamatan yang dipertingkatkan ini memastikan pengguna pengalaman yang selamat dan boleh dipercayai apabila menggunakan penyelesaian dipacu AI.
Pengalaman Pembangun yang Dipertingkatkan
Ringkasan Pemikiran
Kedua-dua 2.5 Pro dan Flash kini akan menyertakan ringkasan pemikiran dalam Gemini API dan dalam Vertex AI. Ringkasan ini mengambil pemikiran mentah model dan menyusunnya ke dalam format yang jelas dengan pengepala, butiran utama dan maklumat tentang tindakan model, seperti apabila mereka menggunakan alat. Dengan menawarkan cerapan tentang proses analisis AI, ringkasan pemikiran membantu dalam memahami dan menyahpepijat isu dalam sistem AI, meningkatkan kecekapan dan reka bentuk sistem.
Dengan format yang lebih berstruktur dan diperkemas pada proses pemikiran model, pembangun dan pengguna akan mendapati interaksi dengan model Gemini lebih mudah difahami dan dinyahpepijat.
Bajet Pemikiran
Google melancarkan 2.5 Flash dengan bajet pemikiran untuk memberi pembangun kawalan yang lebih besar ke atas kos dengan mengimbangi kependaman dan kualiti. Keupayaan ini kini dilanjutkan kepada 2.5 Pro, memberikan anda pilihan tala halus yang lebih besar. Dengan mengawal token yang digunakan dan mengoptimumkan sumber, pembangun boleh mencapai keseimbangan yang sesuai antara kos pengiraan dan keberkesanan penyelesaian, menjadikan pelaksanaan AI menjimatkan dan cekap.
Ini membenarkan kawalan penuh ke atas bilangan token yang digunakan oleh model untuk berfikir sebelum ia bertindak balas, atau pun mematikan keupayaan pemikirannya.
Gemini 2.5 Pro dengan bajet akan tersedia secara umum untuk penggunaan pengeluaran yang stabil dalam beberapa minggu akan datang, bersama-sama dengan model yang tersedia secara umum.
Sokongan untuk Alat MCP
Google telah menambah sokongan SDK asli untuk definisi Protokol Konteks Model (MCP) dalam Gemini API untuk penyepaduan yang lebih mudah dengan alatan sumber terbuka. Kaedah penggunaan yang berbeza, seperti pelayan MCP dan alatan yang dihoskan, diterokai untuk memudahkan pengguna membina aplikasi agentik. Ini menambah baik persekitaran pembangunan AI melalui pelbagai pilihan yang lebih luas untuk penyepaduan alat dan kerjasama dalam projek.
Inovasi berterusan adalah kunci dalam komitmen berterusan untuk menambah baik model dan pengalaman pembangun, menjadikannya lebih cekap, berprestasi dan responsif terhadap maklum balas pembangun. Gandakan keluasan dan kedalaman penyelidikan asas untuk menolak barisan had keupayaan Gemini. Akan ada lebih banyak lagi yang akan datang pada masa hadapan.