Mod Kamera Gemini Live Kini di iOS

Kedatangan mod kamera Gemini Live menandakan langkah penting ke hadapan dalam evolusi kecerdasan buatan (AI), membawa sebahagian ketara masa depan terus ke hujung jari kita. Walaupun pengguna terawal dengan peranti Pixel 9 dan Samsung Galaxy S25 telah menikmati ciri inovatif ini untuk beberapa waktu, pengumuman Google baru-baru ini di persidangan I/Onya meluaskan akses kepada khalayak yang lebih luas, merangkumi kedua-dua pengguna Android dan iOS. Perkembangan ini amat mengujakan bagi pemilik iPhone, yang kini boleh mengalami salah satu fungsi AI yang paling menarik yang tersedia pada masa ini, terutamanya memandangkan mod kamera pada mulanya dilancarkan kepada pengguna Android lain pada bulan April.

Membongkar Kuasa Penglihatan: Cara Mod Kamera Gemini Berfungsi

Pada terasnya, mod kamera Gemini Live memberikan AI keupayaan untuk "melihat," membolehkannya mengenali dan mengenal pasti objek yang diletakkan dalam medan penglihatan kamera. Ini bukan sekadar gimik dangkal; ia adalah alat berkuasa yang membolehkan pengguna berinteraksi dengan persekitaran mereka dengan cara yang lebih intuitif dan bermaklumat.

Selain daripada pengecaman objek yang mudah, Gemini juga boleh menjawab soalan tentang item yang dikenal pasti, memberikan konteks dan cerapan atas permintaan. Tambahan pula, pengguna boleh berkongsi skrin mereka dengan Gemini, membolehkan AI menganalisis dan mengenal pasti elemen yang dipaparkan pada skrin telefon mereka. Untuk memulakan sesi langsung dengan mod kamera, pengguna hanya mendayakan paparan kamera langsung, membolehkan mereka terlibat dalam perbualan dengan chatbot tentang apa sahaja yang ditangkap oleh kamera.

Tanggapan Pertama: Pandu Uji dengan Gemini Live

Semasa fasa ujian awal saya dengan Gemini Live pada Pixel 9 Pro XL, saya sangat kagum dengan keupayaannya. Satu pengalaman yang amat diingati ialah meminta Gemini mencari gunting saya yang tersalah letak.

AI bertindak balas dengan ketepatan yang luar biasa: "Saya baru sahaja melihat gunting anda di atas meja, betul-betul di sebelah bungkusan pistachio hijau. Adakah anda nampak gunting itu?"

Yang menghairankan saya, Gemini tepat. Gunting itu betul-betul di tempat yang ditunjukkan olehnya, walaupun saya hanya melalui kamera di hadapan mereka secara ringkas semasa sesi langsung selama 15 minit di mana saya pada dasarnya memberikan chatbot AI lawatan di sekitar apartmen saya.

Tertarik dengan kejayaan awal ini, saya bersungguh-sungguh meneroka mod kamera dengan lebih lanjut. Dalam ujian lain yang lebih panjang, saya mengaktifkan ciri tersebut dan mula berjalan melalui apartmen saya, mendorong Gemini untuk mengenal pasti objek yang dilihatnya. Ia mengenal pasti pelbagai item dengan tepat, termasuk buah-buahan, ChapStick, dan objek harian yang lain. Walau bagaimanapun, penemuan semula gunting saya kekal sebagai demonstrasi keupayaannya yang paling menarik.

Hakikat bahawa Gemini mengenal pasti gunting tanpa sebarang gesaan sebelum ini amat mengagumkan. AI telah mengenal pasti mereka secara senyap-senyap pada satu ketika semasa sesi dan mengingati lokasi mereka dengan tepat dengan ketepatan yang luar biasa. Pengalaman ini benar-benar terasa seperti gambaran masa depan, mendorong saya untuk menjalankan penyiasatan lebih lanjut tentang potensinya.

Mendapat Inspirasi: Visi Google untuk AI Video Langsung

Eksperimen saya dengan ciri kamera Gemini Live mencerminkan demo yang dipamerkan oleh Google pada musim panas sebelumnya, yang menawarkan pandangan pertama pada keupayaan AI video langsung ini. Demo itu menampilkan Gemini yang mengingatkan pengguna di mana mereka telah meninggalkan cermin mata mereka, satu pencapaian yang nampaknya terlalu bagus untuk menjadi benar. Walau bagaimanapun, seperti yang saya temui, tahap ketepatan ini sememangnya boleh dicapai.

Gemini Live mampu mengenali jauh lebih banyak daripada sekadar barangan rumah. Google mendakwa ia boleh membantu pengguna dalam menavigasi stesen kereta api yang sesak atau mengenal pasti inti dalam pastri. Ia juga boleh memberikan cerapan yang lebih mendalam tentang karya seni, seperti asal usulnya dan sama ada ia merupakan edisi terhad.

Fungsi ini melangkaui Google Lens biasa. Anda boleh berbual dengan AI, yang jauh lebih bersifat perbualan daripada Google Assistant.

Google juga telah mengeluarkan video YouTube yang menunjukkan ciri tersebut, dan ia kini mempunyai halaman sendiri di Google Store.

Untuk memulakan, mulakan Gemini, hidupkan kamera, dan mula bercakap.

Gemini Live dibina berdasarkan Projek Astra Google, yang pada mulanya dibentangkan tahun lepas dan mungkin merupakan ciri "kita berada di masa depan" terbesar syarikat itu, satu langkah seterusnya eksperimen untuk keupayaan AI generatif, melangkaui hanya menaip atau pun menyebut gesaan ke dalam chatbot seperti ChatGPT, Claude, atau Gemini.
Syarikat AI terus menambah baik keupayaan alat AI, daripada penciptaan video hinggalah kepada kuasa pemprosesan asas. Visual Intelligence Apple, yang dikeluarkan oleh pembuat iPhone dalam versi beta tahun lepas, boleh dibandingkan dengan Gemini Live.

Gemini Live berpotensi untuk merevolusikan cara kita berhubung dengan persekitaran dengan menggabungkan persekitaran digital dan fizikal kita sambil kita hanya memegang kamera di hadapan apa-apa sahaja.

Meletakkan Gemini Live untuk Ujian: Senario Dunia Sebenar

Kali pertama saya menggunakannya, Gemini dengan tepat mengenal pasti koleksi permainan yang sangat khusus iaitu arnab yang disumbat dalam pandangan kamera saya. Kali kedua, saya menunjukkannya kepada seorang rakan di galeri seni. Ia serta-merta mengenal pasti penyu di atas salib (jangan tanya saya) dan mengenal pasti dan menterjemahkan kanji betul-betul di sebelahnya, memberikan kami berdua kesejukan dan membuatkan kami berasa sedikit seram. Secara positif, saya percaya.

Saya mula mempertimbangkan bagaimana saya boleh menguji fungsi tersebut. Apabila saya cuba merakam skrinnya semasa ia beraksi, ia sentiasa gagal. Bagaimana jika saya tersasar dari laluan biasa? Saya peminat tegar genre seram (filem, siri televisyen dan permainan video) dan memiliki banyak koleksi, perhiasan dan item lain. Seberapa baik ia akan berfungsi dengan item yang lebih samar, seperti koleksi bertema seram saya?

Pertama, saya mesti menyatakan bahawa Gemini boleh menjadi sangat menakjubkan dan sangat menjengkelkan dalam pusingan soalan yang sama. Saya mempunyai sekitar 11 objek yang saya mahu Gemini kenal pasti, dan semakin lama sesi langsung itu berlangsung, semakin teruk keadaannya, jadi saya terpaksa mengehadkan sesi kepada satu atau dua objek. Pada pendapat saya, Gemini cuba menggunakan maklumat kontekstual daripada item yang dikenali sebelum ini untuk meneka item baharu, yang masuk akal sehingga tahap tertentu, tetapi akhirnya tidak memberi manfaat kepada saya mahupun ia.

Kadang-kadang, Gemini agak tepat, memberikan jawapan yang betul dengan mudah dan tanpa kekeliruan, walaupun ini berlaku lebih kerap dengan objek yang lebih terkini atau popular. Saya terkejut, contohnya, apabila ia serta-merta membuat kesimpulan bahawa salah satu objek ujian saya bukan sahaja daripada Destiny 2, tetapi juga edisi terhad daripada acara bermusim dari tahun sebelumnya.

Gemini sering kali tersasar sama sekali, memerlukan saya memberikan petunjuk lebih lanjut untuk mendekati jawapan yang betul. Kadang-kadang, nampaknya seolah-olah Gemini menggunakan konteks daripada sesi langsung saya sebelumnya untuk menjana respons, mengenal pasti berbilang objek sebagai berasal dari Silent Hill sedangkan ia tidak. Saya mempunyai kabinet pameran yang dikhaskan untuk siri permainan, jadi saya boleh faham mengapa ia ingin menyelami kawasan itu dengan pantas.

Membongkar Ketidaksempurnaan: Pepijat dan Keunikan dalam Sistem

Gemini boleh menjadi benar-benar rosak kadangkala. Kadang-kadang, Gemini salah mengenal pasti salah satu objek sebagai watak rekaan daripada permainan Silent Hill: f yang belum dikeluarkan, dengan jelas menggabungkan bahagian tajuk yang berbeza menjadi sesuatu yang tidak pernah wujud. Apabila Gemini memberikan jawapan yang salah, dan saya membetulkannya dan memberikannya petunjuk yang lebih dekat pada jawapan — atau hanya memberikannya jawapan — hanya untuk menyuruhnya mengulangi jawapan yang salah seolah-olah ia adalah tekaan baharu, adalah pepijat konsisten yang lain yang saya temui. Apabila itu berlaku, saya akan menutup sesi dan memulakan yang baharu, yang tidak selalu membantu.

Satu teknik yang saya temui ialah beberapa perbincangan lebih berkesan daripada yang lain. Jika saya melalui senarai perbualan Gemini saya, mengetik sembang lama yang telah mendapatkan item tertentu dengan betul, dan kemudian pergi secara langsung semula daripada sembang itu, ia akan dapat mengenal pasti item tersebut tanpa sebarang masalah. Walaupun ini tidak selalu dijangka, ia menarik untuk diperhatikan bahawa perbualan tertentu berprestasi lebih baik daripada yang lain, walaupun menggunakan bahasa yang sama.

Google tidak menjawab pertanyaan saya untuk maklumat tambahan tentang cara Gemini Live berfungsi.

Saya mahu Gemini berjaya menjawab soalan saya yang mencabar, kadangkala sangat khusus, jadi saya memberikan banyak petunjuk untuk membantunya berbuat demikian. Dorongan itu terbukti berguna, tetapi tidak selalu.

Teknologi Transformasi: Impak Potensi Gemini Live

Gemini Live mewakili perubahan paradigma dalam cara kita berinteraksi dengan persekitaran kita, menggabungkan alam digital dan fizikal dengan lancar melalui lensa kamera kita. Walaupun teknologi ini masih di peringkat awal, aplikasi potensinya adalah luas dan transformatif.

Bayangkan menggunakan Gemini Live untuk:

  • Menavigasi persekitaran yang tidak dikenali: Hanya halakan kamera anda pada papan tanda jalan atau mercu tanda, dan Gemini akan memberikan arah dan maklumat masa nyata.
  • Ketahui tentang artifak bersejarah: Apabila melawat muzium, gunakan Gemini untuk mengenal pasti dan memberikan konteks untuk karya seni dan objek bersejarah.
  • Memasak resipi yang kompleks: Minta Gemini untuk membimbing anda melalui setiap langkah resipi, mengenal pasti ramuan dan mencadangkan teknik alternatif.
  • Mendiagnosis masalah rumah tangga yang mudah: Halakan kamera anda pada perkakas yang tidak berfungsi, dan Gemini akan memberikan petua penyelesaian masalah dan penyelesaian yang berpotensi.

Ini hanyalah beberapa contoh daripada pelbagai cara Gemini Live boleh meningkatkan kehidupan seharian kita. Apabila teknologi terus berkembang dan bertambah baik, potensinya untuk merevolusikan cara kita berinteraksi dengan dunia di sekeliling kita adalah benar-benar tidak terhad.

Penyepaduan Gemini Live ke dalam peranti iOS seterusnya meluaskan jangkauan dan kebolehaksesannya, membawa kuasa penglihatan berkuasa AI kepada khalayak yang lebih luas. Apabila teknologi AI terus maju pada kadar eksponen, ciri seperti Gemini Live menawarkan gambaran masa depan di mana peranti kita bukan sahaja alat untuk komunikasi dan hiburan tetapi juga teman pintar yang boleh membantu kita menavigasi, memahami dan berinteraksi dengan dunia di sekeliling kita dengan cara yang baharu dan bermakna.