Gemini Live کے کیمرہ موڈ کی آمد مصنوعی ذہانت کے ارتقاء میں ایک اہم قدم ہے، جو مستقبل کا ایک ٹھوس ٹکڑا براہ راست ہماری انگلیوں تک پہنچاتا ہے۔ اگرچہ Pixel 9 اور Samsung Galaxy S25 ڈیوائسز کے ابتدائی صارفین کچھ عرصے سے اس جدید خصوصیت سے لطف اندوز ہو رہے ہیں، Google نے اپنی I/O کانفرنس میں حالیہ اعلان کے ساتھ رسائی کو ایک وسیع سامعین تک وسیع کر دیا ہے، جس میں Android اور iOS دونوں صارفین شامل ہیں۔ یہ ترقی خاص طور پر iPhone کے مالکان کے لیے دلچسپ ہے، جو اب سب سے زیادہ زبردست AI افعال میں سے ایک کا تجربہ کر سکتے ہیں، خاص طور پر اس بات کو مدنظر رکھتے ہوئے کہ کیمرہ موڈ ابتدائی طور پر اپریل میں دیگر Android صارفین کے لیے شروع کیا گیا تھا۔
دیکھنے کی طاقت کی نقاب کشائی: Gemini کا کیمرہ موڈ کیسے کام کرتا ہے۔
اپنی بنیادی طور پر، Gemini Live کا کیمرہ موڈ AI کو "دیکھنے" کی صلاحیت فراہم کرتا ہے، جو اسے کیمرے کے میدان میں رکھی ہوئی اشیاء کو پہچاننے اور شناخت کرنے کے قابل بناتا ہے۔ یہ محض ایک سطحی گیماک نہیں ہے۔ یہ ایک طاقتور ٹول ہے جو صارفین کو اپنے اردگرد کے ماحول کے ساتھ زیادہ بدیہی اور معلوماتی انداز میں تعامل کرنے کی اجازت دیتا ہے۔
صرف عام آبجیکٹ کی پہچان سے آگے، Gemini شناخت شدہ اشیاء کے بارے میں سوالات کے جوابات بھی دے سکتا ہے، جو مانگ پر سیاق و سباق اور بصیرت فراہم کرتا ہے۔ مزید برآں، صارفین اپنی اسکرین کو Gemini کے ساتھ شیئر کر سکتے ہیں، جس سے AI ان عناصر کا تجزیہ اور شناخت کر سکتا ہے جو ان کے فون کی اسکرین پر آویزاں ہیں۔ کیمرہ موڈ کے ساتھ لائیو سیشن شروع کرنے کے لیے، صارفین کو صرف لائیو کیمرہ ویو کو فعال کرنا ہوتا ہے، جس سے وہ کسی بھی چیز کے بارے میں چیٹ بوٹ کے ساتھ بات چیت کر سکتے ہیں جو کیمرہ کیپچر کرتا ہے۔
ابتدائی تاثرات: Gemini Live کے ساتھ ٹیسٹ ڈرائیور
Pixel 9 Pro XL پر Gemini Live کے ساتھ میرے ابتدائی ٹیسٹنگ کے دوران، میں اس کی صلاحیتوں سے پوری طرح متاثر ہوا۔ ایک خاص طور پر یادگار تجربہ Gemini سے میری کھوئی ہوئی قینچی کو تلاش کرنے کے لیے کہنا تھا۔
AI نے قابل ذکر درستی کے ساتھ جواب دیا: "میں نے ابھی آپ کی قینچی کو میز پر دیکھا ہے، پستے کے سبز پیکج کے بالکل نیچے۔ کیا آپ انہیں دیکھ رہے ہیں؟"
مجھے حیرت ہوئی، Gemini بالکل ٹھیک تھا۔ قینچی بالکل وہیں تھی جہاں اس نے اشارہ کیا تھا، اس حقیقت کے باوجود کہ میں نے صرف 15 منٹ کے لائیو سیشن کے دوران کیمرہ کو ان کے سامنے سے مختصراً گزارا تھا جہاں میں بنیادی طور پر AI چیٹ بوٹ کو اپنے اپارٹمنٹ کا دورہ کروا رہا تھا۔
اس ابتدائی کامیابی سے متوجہ ہوکر، میں نے کیمرہ موڈ کو مزید شوق سے تلاش کیا۔ ایک اور، زیادہ وسیع ٹیسٹ میں، میں نے فیچر کو فعال کیا اور اپنے اپارٹمنٹ میں گھومنا شروع کر دیا، Gemini سے کہا کہ وہ ان اشیاء کی شناخت کرے جو اس نے دیکھی ہیں۔ اس نے پھلوں، چپ اسٹک اور روزمرہ کی دیگر اشیاء سمیت مختلف اشیاء کو درست طریقے سے پہچانا۔ تاہم، میری قینچی کی دوبارہ دریافت اس کی صلاحیتوں کا سب سے نمایاں مظاہرہ رہی۔
یہ حقیقت کہ Gemini نے کسی پیشگی اشارے کے بغیر قینچی کی شناخت کی خاص طور پر متاثر کن تھی۔ AI نے سیشن کے دوران کسی وقت خاموشی سے انہیں پہچانا تھا اور قابل ذکر درستگی کے ساتھ ان کے مقام کو درست طریقے سے یاد کیا۔ یہ تجربہ واقعی مستقبل کی ایک جھلک کی طرح محسوس ہوا، جس نے مجھے اس کی صلاحیت کے بارے میں مزید تحقیقات کرنے پر آمادہ کیا۔
प्रेरणा लेना: Google का लाइव वीडिओ AI
Gemini Live کے کیمرہ فیچر کے ساتھ میرا تجربہ Google کے پچھلے موسم گرما میں دکھائے جانے والے ڈیمو سے مماثلت رکھتا ہے، جس نے ان لائیو ویڈیو AI صلاحیتوں پر پہلی نظر ڈالی۔ ڈیمو میں Gemini صارف کو یاد دلاتا ہے کہ اس نے اپنا چشمہ کہاں چھوڑا ہے، ایک ایسا کارنامہ جو بظاہر بہت اچھا ہے۔ تاہم، جیسا کہ میں نے دریافت کیا، اس سطح کی درستگی واقعی حاصل کی جا سکتی ہے۔
Gemini Live گھریلو اشیاء سے کہیں زیادہ کو پہچاننے کی صلاحیت رکھتا ہے۔ Google کا دعوی ہے کہ یہ صارفین کو بھیڑ والے ٹرین اسٹیشنوں پر تشریف لے جانے یا پیسٹری میں بھرنے کی شناخت کرنے میں مدد کر سکتا ہے۔ یہ آرٹ ورک کے بارے میں گہری بصیرت بھی فراہم کر سکتا ہے، جیسے کہ اس کی ابتدا اور کیا یہ محدود ایڈیشن کا ٹکڑا ہے۔
یہ فعالیت ایک باقاعدہ Google Lens سے آگے ہے۔ آپ AI کے ساتھ بات چیت کر سکتے ہیں، جو Google اسسٹنٹ سے کہیں زیادہ بات چیت کرنے والا ہے۔
Google نے اس فیچر کو ظاہر کرنے والا ایک YouTube ویڈیو بھی جاری کیا ہے، اور اب اس کا Google Store پر اپنا صفحہ ہے۔
شروع کرنے کے لیے، Gemini شروع کریں، کیمرہ آن کریں اور بات کرنا شروع کریں۔
Gemini Live Google کے پروجیکٹ Astra پر مبنی ہے، جسے ابتدائی طور پر گزشتہ سال پیش کیا گیا تھا اور شاید یہ کمپنی کا سب سے بڑا "ہم مستقبل میں ہیں" فیچر ہے، جو پیدا کرنے والی AI صلاحیتوں کے لیے ایک تجرباتی اگلا قدم ہے، صرف ٹائپ کرنے یا چیٹ جی پی ٹی(ChatGPT)، کلاڈ(Claude) یا Gemini جیسے چیٹ بوٹ میں اشارے بولنے سے بھی آگے ہے۔
AI کمپنیاں ویڈیو بنانے سے لے کر بنیادی پروسیسنگ پاور تک، AI ٹولز کی صلاحیتوں کو مسلسل بہتر بنا رہی ہیں۔ Apple کی Visual Intelligence، جو iPhone بنانے والے نے گزشتہ سال بیٹا میں جاری کی تھی، Gemini Live کے مقابلے میں ہے۔
Gemini Live میں اس بات کی صلاحیت ہے کہ ہم جس طرح سے ماحول سے جڑتے ہیں اس میں انقلاب برپا کر دے، کیونکہ ہم اپنے ڈیجیٹل اور فزکس کے ماحول کو اس وقت ضم کر دیتے ہیں جب ہم کیمرہ کو کسی بھی چیز کے سامنے رکھتے ہیں۔
Gemini Live کی جانچ کرنا: دنیاوی منظرنامे
پہلی بار جب میں نے اسے استعمال کیا تو Gemini نے میرے کیمرے کے نظارے میں ایک بھرے ہوئے خرگوش کے ایک بہت ہی مخصوص گیمنگ کلیکٹیبل کو درست طریقے سے پہچانا۔ دوسری بار، میں نے اسے آرٹ گیلری میں ایک دوست کو دکھایا۔ اس نے صلیب پر موجود کچھوے کو فوراً پہچان لیا (مجھ سے نہ پوچھیں) اور اس کے بالکل ساتھ موجود کانجی کی شناخت اور ترجمہ کیا، ہم دونوں کو ٹھنڈ لگ گئی اور ہمیں تھوڑا سا ڈر لگا۔ مجھے یقین ہے کہ مثبت انداز میں۔
میں اس بات پر غور کرنے لگا کہ میں فنکشن کو کس طرح تناؤ سے جانچ سکتا ہوں۔ جب میں نے اسے عملی طور پر اسکرین ریکارڈ کرنے کی کوشش کی تو یہ مسلسل ناکام رہا۔ کیا ہوگا اگر میں معمول کے راستے سے بھٹک جاؤں؟ నేను ہارર صنف کا بہت بڑا پرستار ہوں (فلمیں, ٹیلی ویژن سیریز, اور वीडियो गेम) اور میرے پاس کلیکٹیبلز, ٹرینکیٹس, اور دیگر اشیاء کی بہتات ہے۔ یہ زیادہ مبہم اشیاء کے ساتھ کیسی کارکردگی دکھائے گا, جیسے میرے ہارर تھیم والے کلیکٹیبلز؟
سب سے پہلے, مجھے یہ بتانا چاہیے کہ جیمنی ایک ही سوالات کے دور میں ناقابل یقین حد تک حیرت انگیز اور ناقابل یقین حد تک پریشان کن دونوں ہو سکتا ہے۔ मेरे पास तकरीबन 11 اشیاء تھیں जिन्हें मैं جیمनी से पहचानना चाहता تھا, और جیسے جیسے लाइव सत्र लंबा होता गया, यह और भी बदतर ہوتا گیا, इसलिए मुझे सत्रों को एक या दो वस्तुओं तक सीमित करना पड़ा। میری رائے میں, جیمनी ने पहली बार बताई गई اشیاء से سیاق و سباق کی معلومات کا उपयोग करके نئی اشیاء کا اندازہ لگانے کی کوشش کی, جو کسی حد تک سمجھ میں آتی ہے, لیکن آخر میں इससे न तो मुझे फायदा हुआ और न ही इसे।
कभी-कभी, جیمनी довольно सटीक تھا, بآسانی اور بغیر کسی الجھاؤ کے صحیح جوابات فراہم کرتا है, حالانکہ یہ زیادہ کثرت से हाल ہی میں یا مقبول اشیاء کے ساتھ ہوتا تھا۔ مثال کے طور پر, مجھے اس وقت حیرت ہوئی, جب اس نے तुरंत अंदाज़ہ लगाया कि میری ٹیسٹ اشیاء میں से ایک نہ صرف ڈեսٹینی2 से تھی, बल्कि पिछले سال के ایکमौسमी پروگرام से एक सीमाबદھ ایڈیشن بھی تھی۔
जیمनी को अक्सर पूरी तरह से गलत निशान पर रखा जाता था, जिससे मुझे सही जवाब के قریب آنے के लिए और अधिक संकेत देने की आवश्यकता होती थी। کبھی-कभी, ऐसा लगता تھا جیسے جیمनी میری पिछली लाइव सत्रوں के संदर्भ का उपयोग करने की प्रतिक्रियाएं उत्पन्न कर रहा है, एकाधिक वस्तुओं को साइलेंट हिल से आया हुआ बता रहा है, जब वे नहीं थे। मेरे पास गेम सीरीज को समर्पित एक डिस्प्ले केस है, इसलिए मैं समझ सकता हूं कि यह उस क्षेत्र में तुरंत क्यों जाना चाहेगा।
अपूर्णताएँ उजागर करना: सिस्टम में बग और अजीब बातें
जیمنی पूरी तरह سے बग हो सकता है कभी-कभी, जیمनी ने वस्तुओं में से एक کو अनरिलीज साइलेंट हिल: f गेम के एक काल्पनिक किरदार के रूप में गलत तरीके से पहचान लिया, जाहिर तौर पर अलग-अलग खिताबों के हिस्सों को मिलाकर ऐसी चीज बना दी जो कभी मौजूद नहीं थी। जब जेमिनी ने एक गलत जवाब दिया, और मैंने इसे सही किया और جواب को अधिक क्लॉजर संकेत दिया-یا ببساوی طور پر اسے جواب دیا-सिर्फ इसे गलत जवाब दोहराने के लिए जैसे कि यह एक नया अनुमान हो, दूसरा लगातार बग था जिसका मैंने अनुभव किया। जब वह हुआ, तो मैं सत्र को बंद कर दूंगा और एक नया सत्र शुरू कर दूंगा, जो हमेशा सहायक नहीं था।
मैंने एक तकनीक खोजी कि कुछ चर्चाएँ दूसरों की तुलना में अधिक प्रभावी थीं। अगर मैं अपनी जेमिनी वार्तालाप सूची से गुज़रा, उस पुरानी चैट को टैप किया जिसमें एक खास आइटम सही ढंग से मिला تھا, और फिर उस चैट से फिर से लाइव हो गया, तो یہ کسی بھی مسئلہ کے بغیر आइटमوں کی شناخت کرنے के قابل होगा। हालांकि यह हमेशा अप्रत्याशित نہیں ہے, लेकिन यह दिलचस्प था कि ध्यान दें कि خاص वार्तालाप میں کارکردگی दूसरों سے بہتر ہے, यहां तक कि उसी भाषा का उपयोग करते हुए भी।
Google ने इस बारे में अतिरिक्त जानकारी के लिए मेरी पूंछों का जवाब नहीं दिया कि Gemini Live कैसे काम करता है।
میں چاہتا تھا कि जेमिनी मेरी चुनौतीपूर्ण, कभी-कभी بہت ہی مخصوص سوالوں का सफलतापूर्वक जवाब दे, इसलिए मैंने इसकी সাহায্য करने के लिए बहुत हिंट दिए। النجات उपयोगी साबित हुई, लेकिन હંમેશા નહીં।
एक परिवर्तनकारी तकनीक: जेमिनी लाइव का संभावित प्रभाव
Gemini Live एक आदर्श परिवर्तन का प्रतिनिधित्व करता है कि हम अपने वातावरण के साथ कैसे परस्पर क्रिया करते हैं, आसानी से अपनी कैमरे के लेंस के माध्यम से डिजिटल और физических दुनिया को विलय करते हैं। हालांकि तकनीक अभी भी अपने शुरुआती चरण में है, इसके संभावित अनुप्रयोग विशाल और परिवर्तनकारी हैं।
कल्पना कीजिए کہ जेमिनी लाइव کا उपयोग کرنا:
- अपरिचित वातावरण में नेविगेट करें: साधारण रूप से अपनी دوربین को सड़क के संकेतों या स्थलों पर पोंट करें, और जेमिनी वास्तविक समय के निर्देश और जानकारी प्रदान करेगा।
- ऐतिहासिक कलाकृतियों के विषय में जानें: जब किसी संग्रहालय का दौरा करते हैं, तो कलाकृति और ऐतिहासिक वस्तुओं के लिए JEMini का उपयोग करें और प्रासंगिकता प्रदान करें।
- जटिल व्यंजनों को पकाएं: JEMini से कहें कि वह आपको एकレシピ के प्रत्येक चरम के माध्यम से मार्गदर्शन करे, सामग्रियों की पहचान करे и विकल्प तकनीकों का सुझाव दें।
- सीधे घरेलू समस्याओं का निदान करें: अपनी دوربین को एक खराब होने वाले उपकरण पर पोंट करें, और जेमिनी समस्या निवारण युक्तियाँ और संभावित समाधान प्रदान करेगा।
ये अनगिनत तरीके से कुछ उदाहरण हैं जिनमें जेमिनी लाइव हमारे दैनिक जीवन को बढ़ा सकता है। जैसे ही तकनीक विकसित करना जारी रखती है и सुधार, परिवर्तन करने की इसकी संभावना है कि हम अपने आसपास की दुनिया के साथ कैसे बातचीत करते हैं वास्तव में असीम है।
iOS उपकरणों में Gemini Live का एकीकरण आगे हमारी पहुंच और अभिगम को बढ़ाता है, एक विस्तृत श्रোতাদের लिए AI-शक्त दृश्य की शक्ति को लाता है। जैसे-जैसे AI तकनीक लगातार तीव्र गति से आगे बढ़ रही है, जेमिनी लाइव जैसी सुविधाएं एक ऐसे भविष्य की झलक पेश करती हैं जहां ہمارے ڈیوائسز نہ صرف مواصلات और मनोरंजन के उपकरण हैं बल्कि बुद्धिमान साथ भी हैं जो हमें नए और उपयोगी तरीकों से दुनिया के साथ नेविगेट करने, समझने और