ریئل ٹائم اسکرین انٹرایکشن: 'اسکرین شیئر'
بارسلونا میں موبائل ورلڈ کانگریس (MWC) 2025 میں نمائش کے لیے پیش کیا گیا، ‘اسکرین شیئر’ فیچر Gemini کے لیے سیاق و سباق کی سمجھ میں ایک چھلانگ کی نمائندگی کرتا ہے۔ یہ فعالیت صارفین کو اپنے فون کی اسکرین کے مواد کو براہ راست AI اسسٹنٹ کے ساتھ شیئر کرنے کی اجازت دیتی ہے، جس سے انٹرایکٹو سوالات کی ایک نئی سطح ممکن ہوتی ہے۔
تصور کریں کہ آپ ایک آن لائن اسٹور براؤز کر رہے ہیں، ڈھیلی جینز کی بہترین جوڑی تلاش کر رہے ہیں۔ اسکرین شیئر کے ساتھ، آپ آسانی سے اپنی اسکرین Gemini کے ساتھ شیئر کر سکتے ہیں اور تکمیلی لباس کی اشیاء کے بارے میں پوچھ گچھ کر سکتے ہیں۔ Gemini، بصری سیاق و سباق کی اپنی بہتر سمجھ کے ساتھ، پھر متعلقہ تجاویز فراہم کر سکتا ہے، جس سے آپ کی خریداری کا تجربہ زیادہ بدیہی اور موثر ہو جاتا ہے۔
یہ فیچر سادہ تصویر کی شناخت سے بالاتر ہے۔ یہ صارف کے موجودہ سیاق و سباق کو سمجھنے اور ایسی معلومات فراہم کرنے کے بارے میں ہے جو براہ راست ان کی فوری سرگرمی سے متعلق ہو۔ چاہے آپ مصنوعات کی خصوصیات کا موازنہ کر رہے ہوں، کسی پیچیدہ خاکے پر وضاحت تلاش کر رہے ہوں، یا یہاں تک کہ کسی نامانوس ایپ پر نیویگیٹ کر رہے ہوں، اسکرین شیئر فوری، سیاق و سباق سے باخبر امداد کے لیے ایک طاقتور ٹول پیش کرتا ہے۔
ویڈیو سرچ: موشن میں بصیرتوں کی نقاب کشائی
پچھلے سال Google I/O میں پہلی بار چھیڑا گیا، ویڈیو سرچ فیچر Gemini کی صلاحیتوں کو جامد تصاویر سے آگے لے جاتا ہے۔ یہ فعالیت صارفین کو ایک ویڈیو ریکارڈ کرنے اور مواد کے بارے میں Gemini سے سوالات کرنے کی طاقت دیتی ہے جیسا کہ اسے فلمایا جا رہا ہے۔
یہ امکانات کی ایک دنیا کھولتا ہے۔ تصور کریں کہ آپ ایک میوزیم میں ہیں، آرٹ کے ایک ٹکڑے سے مسحور ہیں۔ آپ آرٹ ورک کو فلم کر سکتے ہیں اور Gemini سے اس کی تاریخی اہمیت، فنکار کی تکنیکوں، یا یہاں تک کہ ٹکڑے کے اندر موجود علامت کے بارے میں پوچھ سکتے ہیں۔ Gemini، حقیقی وقت میں ویڈیو کا تجزیہ کرتے ہوئے، فوری بصیرت فراہم کر سکتا ہے، آپ کی سمجھ اور تعریف کو بڑھا سکتا ہے۔
تعلیمی ایپلی کیشنز کے امکانات پر غور کریں۔ طلباء ایک سائنسی تجربے کو فلم کر سکتے ہیں اور Gemini سے اس کے بنیادی اصولوں کے بارے میں پوچھ سکتے ہیں۔ مکینکس ایک پیچیدہ انجن کی مرمت کو ریکارڈ کر سکتے ہیں اور Gemini سے حقیقی وقت میں رہنمائی حاصل کر سکتے ہیں۔ امکانات وسیع ہیں اور متعدد شعبوں میں پھیلے ہوئے ہیں۔
AI انٹرایکشن کی حدود کو بڑھانا
یہ نئی خصوصیات صرف سوالات پوچھنے کے بارے میں نہیں ہیں۔ یہ صارفین اور معلومات کے درمیان زیادہ روانی اور قدرتی تعامل پیدا کرنے کے بارے میں ہیں۔ روایتی تلاش کے طریقے اکثر صارفین سے متن پر مبنی درست سوالات بنانے کا تقاضا کرتے ہیں۔ ویڈیو اور اسکرین پر مبنی سوالات کے ساتھ، Gemini ایک زیادہ بدیہی طریقہ کار کی اجازت دیتا ہے، جس کی عکاسی ہوتی ہے کہ ہم کس طرح قدرتی طور پر حقیقی دنیا میں دریافت کرتے ہیں اور سیکھتے ہیں۔
بصری اور سیاق و سباق کی سمجھ کی طرف بڑھنا AI کی ترقی میں ایک اہم رجحان کی نمائندگی کرتا ہے۔ جیسے جیسے AI ماڈل زیادہ نفیس ہوتے جاتے ہیں، وہ غیر متنی معلومات کی تشریح اور جواب دینے کے لیے تیزی سے اہل ہوتے جاتے ہیں، جس سے انسانی کمپیوٹر کے تعامل کے نئے راستے کھلتے ہیں۔
اسکرین شیئر فنکشنلٹی میں گہرا غوطہ
اسکرین شیئر فیچر صرف ایک سادہ اسکرین شیئرنگ ٹول سے زیادہ ہے۔ یہ ایک نفیس نظام ہے جو ایک ہموار اوربدیہی صارف کا تجربہ فراہم کرنے کے لیے AI کی کئی صلاحیتوں کو یکجا کرتا ہے۔
- ریئل ٹائم بصری تجزیہ: Gemini صرف اسکرین کو ‘دیکھتا’ نہیں ہے۔ یہ حقیقی وقت میں مواد کا تجزیہ کرتا ہے۔ اس کا مطلب ہے کہ یہ اشیاء، متن، اور یہاں تک کہ جو کچھ دکھایا جا رہا ہے اس کے مجموعی سیاق و سباق کی شناخت کر سکتا ہے۔ یہ مسلسل تجزیہ Gemini کو سوالات کا تیزی سے اور درست جواب دینے کی اجازت دیتا ہے۔
- سیاق و سباق کی سمجھ: Gemini اسکرین پر عناصر کی شناخت سے آگے بڑھتا ہے۔ یہ صارف کی سرگرمی کے سیاق و سباق کو سمجھتا ہے۔ مثال کے طور پر، اگر آپ خریداری کی ویب سائٹ براؤز کر رہے ہیں، تو Gemini سمجھ جائے گا کہ آپ ممکنہ طور پر مصنوعات کی معلومات یا سفارشات تلاش کر رہے ہیں۔ یہ سیاق و سباق سے متعلق آگاہی Gemini کو زیادہ متعلقہ اور مددگار جوابات فراہم کرنے کی اجازت دیتی ہے۔
- قدرتی زبان کی پروسیسنگ: جب کہ ان پٹ بصری ہے، تعامل قدرتی اور بدیہی رہتا ہے۔ صارفین عام زبان میں سوالات پوچھ سکتے ہیں، بالکل اسی طرح جیسے وہ کسی انسانی معاون سے پوچھتے ہیں۔ Gemini کی قدرتی زبان کی پروسیسنگ کی صلاحیتیں اسے سوال کے پیچھے ارادے کو سمجھنے اور متعلقہ جواب فراہم کرنے کی اجازت دیتی ہیں۔
- موافقت پذیر سیکھنا: Gemini ہر تعامل سے سیکھتا ہے۔ جیسے جیسے صارفین مزید سوالات پوچھتے ہیں اور رائے دیتے ہیں، Gemini کی ان کی ترجیحات اور ضروریات کی سمجھ بہتر ہوتی جاتی ہے۔ یہ موافقت پذیر سیکھنا Gemini کو وقت کے ساتھ ساتھ تیزی سے ذاتی نوعیت کی اور مددگار امداد فراہم کرنے کی اجازت دیتا ہے۔
ویڈیو سرچ کی صلاحیت کو تلاش کرنا
ویڈیو سرچ فیچر AI سے چلنے والی معلومات کی بازیافت میں ایک اہم پیشرفت کی نمائندگی کرتا ہے۔ یہ صرف ویڈیوز تلاش کرنے کے بارے میں نہیں ہے۔ یہ ویڈیوز کے اندر سے علم اور بصیرت نکالنے کے بارے میں ہے۔
- متحرک مواد کا تجزیہ: جامد تصاویر کے برعکس، ویڈیوز میں متحرک معلومات کا خزانہ ہوتا ہے۔ Gemini حرکت کا تجزیہ کر سکتا ہے، وقت کے ساتھ تبدیلیوں کی شناخت کر سکتا ہے، اور ویڈیو کے اندر مختلف عناصر کے درمیان تعلقات کو سمجھ سکتا ہے۔ یہ مواد کی بہت زیادہ امیر اور زیادہ باریک بینی سے سمجھنے کی اجازت دیتا ہے۔
- ریئل ٹائم سوالات کے جوابات: فلم بندی کے دوران سوالات پوچھنے کی صلاحیت ایک گیم چینجر ہے۔ یہ مخصوص تفصیلات کو یاد رکھنے یا حقیقت کے بعد پیچیدہ سوالات بنانے کی ضرورت کو ختم کرتا ہے۔ صارفین آسانی سے اپنے کیمرے کو کسی دلچسپی کی چیز کی طرف اشارہ کر سکتے ہیں اور Gemini سے فوری معلومات طلب کر سکتے ہیں۔
- ملٹی موڈل لرننگ: ویڈیو سرچ بصری معلومات کو آڈیو اشارے (اگر موجود ہو) اور سیاق و سباق کی سمجھ کے ساتھ جوڑتی ہے۔ یہ ملٹی موڈل نقطہ نظر Gemini کو جامع جوابات فراہم کرنے کے لیے معلومات کے متعدد ذرائع سے فائدہ اٹھانے کی اجازت دیتا ہے۔
- بہتر رسائی: ویڈیو سرچ خاص طور پر بصارت سے محروم افراد کے لیے فائدہ مند ہو سکتی ہے۔ صارفین کو اپنے ارد گرد کے بارے میں سوالات پوچھنے کی اجازت دے کر، Gemini انہیں دنیا میں زیادہ آسانی سے نیویگیٹ کرنے اور ایسی معلومات تک رسائی حاصل کرنے میں مدد کر سکتا ہے جو بصورت دیگر ناقابل رسائی ہو گی۔
AI سے چلنے والی امداد کا مستقبل
Gemini میں ویڈیو اور اسکرین پر مبنی سوالات کا تعارف AI سے چلنے والی امداد کے مستقبل کی ایک جھلک ہے۔ جیسے جیسے AI ماڈل تیار ہوتے رہتے ہیں، ہم انسانوں اور ٹیکنالوجی کے درمیان مزید ہموار اور بدیہی تعامل کی توقع کر سکتے ہیں۔
- ذاتی نوعیت کی تعلیم: AI اسسٹنٹ انفرادی سیکھنے کے انداز اور ترجیحات کو سمجھنے میں تیزی سے ماہر ہو جائیں گے۔ وہ تعلیمی مواد کو تیار کرنے اور صارفین کو ان کے سیکھنے کے اہداف کو حاصل کرنے میں مدد کرنے کے لیے ذاتی نوعیت کی رہنمائی فراہم کرنے کے قابل ہوں گے۔
- Augmented Reality Integration: ویڈیو سرچ اور اسکرین پر مبنی سوالات augmented reality (AR) ایپلی کیشنز کے لیے ایک فطری فٹ ہیں۔ AR چشمے پہننے کا تصور کریں جو آپ کے دیکھنے کے میدان میں اشیاء کی شناخت کر سکیں اور ان کے بارے میں حقیقی وقت میں معلومات فراہم کر سکیں۔
*فعال امداد: AI اسسٹنٹ صارف کی ضروریات کا اندازہ لگانے میں زیادہ فعال ہو جائیں گے۔ وہ ممکنہ مسائل یا مواقع کی نشاندہی کرنے اور واضح طور پر پوچھے جانے سے پہلے امداد کی پیشکش کرنے کے قابل ہوں گے۔ - بہتر تعاون: AI اسسٹنٹ انسانوں کے درمیان زیادہ موثر تعاون کی سہولت فراہم کریں گے۔ وہ حقیقی وقت میں زبانوں کا ترجمہ کرنے، میٹنگوں سے اہم نکات کا خلاصہ کرنے، اور یہاں تک کہ ٹیم کی حرکیات کے بارے میں بصیرت فراہم کرنے کے قابل ہوں گے۔
دستیابی اور رول آؤٹ
یہ اہم خصوصیات اس ماہ کے آخر میں Android پر Google One AI Premium پلان پر Gemini Advanced صارفین کے لیے جاری کیے جانے والے ہیں۔ یہ مرحلہ وار رول آؤٹ Google کو صارف کی رائے جمع کرنے اور وسیع تر ریلیز سے پہلے خصوصیات کو مزید بہتر بنانے کی اجازت دیتا ہے۔ Google One AI Premium پلان بہت سے فوائد پیش کرتا ہے، جس میں جدید ترین AI ماڈلز اور خصوصیات تک رسائی شامل ہے، جو اسے AI ٹیکنالوجی کے جدید ترین تجربے کو تلاش کرنے والے صارفین کے لیے ایک زبردست آپشن بناتا ہے۔
Android پر یہ ابتدائی دستیابی پلیٹ فارم کے وسیع پیمانے پر اپنانے کی عکاسی کرتی ہے اور جانچ اور بہتری کے لیے ایک بڑا صارف بیس فراہم کرتی ہے۔ مستقبل میں دوسرے پلیٹ فارمز تک توسیع کا امکان ہے، کیونکہ Google اپنے ماحولیاتی نظام میں Gemini کی صلاحیتوں کو تیار اور بڑھانا جاری رکھے ہوئے ہے۔
عملی ایپلی کیشنز پر گہرا فوکس
ان نئی Gemini خصوصیات کی اصل طاقت مختلف منظرناموں میں ان کی عملی ایپلی کیشنز میں مضمر ہے۔ آئیے کچھ مخصوص مثالوں پر غور کریں:
1. سفر اور دریافت:
- لینڈ مارک کی شناخت: ایک نئے شہر کا دورہ کرتے ہوئے، ایک صارف ایک تاریخی عمارت کو فلم کر سکتا ہے اور Gemini سے اس کا نام، تاریخ اور تعمیراتی اہمیت پوچھ سکتا ہے۔
- مینو ٹرانسلیشن: ایک غیر ملکی ریستوراں میں، ایک صارف اپنی اسکرین کو Gemini کے ساتھ مینو ڈسپلے کرتے ہوئے شیئر کر سکتا ہے اور فوری ترجمہ حاصل کر سکتا ہے، ساتھ ہی ان کی غذائی ترجیحات کی بنیاد پر سفارشات بھی حاصل کر سکتا ہے۔
- پبلک ٹرانسپورٹیشن نیویگیشن: ایک نامانوس سب وے سسٹم پر نیویگیٹ کرتے ہوئے، ایک صارف نقشے کو فلم کر سکتا ہے اور Gemini سے اپنی منزل تک جانے کا بہترین راستہ پوچھ سکتا ہے۔
2. تعلیم اور سیکھنا:
- انٹرایکٹو ٹیکسٹ بکس: طلباء اپنی اسکرین کو Gemini کے ساتھ ٹیکسٹ بک کا صفحہ ڈسپلے کرتے ہوئے شیئر کر سکتے ہیں اور پیچیدہ تصورات یا تعریفوں کے بارے میں سوالات پوچھ سکتے ہیں۔
- سائنس کے تجربے میں مدد: سائنس کا تجربہ کرتے ہوئے، ایک طالب علم اس عمل کو فلم کر سکتا ہے اور Gemini سے متوقع نتائج یا ممکنہ حفاظتی خطرات کے بارے میں پوچھ سکتا ہے۔
- زبان سیکھنا: زبان سیکھنے والے کسی غیر ملکی زبان میں گفتگو یا ویڈیو کلپ کو فلم کر سکتے ہیں اور Gemini سے ترجمہ، گرامر کی وضاحت، یا تلفظ کی رہنمائی کے لیے پوچھ سکتے ہیں۔
3. خریداری اور تجارت:
- مصنوعات کا موازنہ: آن لائن خریداری کرتے ہوئے، ایک صارف اپنی اسکرین کو Gemini کے ساتھ متعدد پروڈکٹ پیجز ڈسپلے کرتے ہوئے شیئر کر سکتا ہے اور خصوصیات، قیمتوں اور کسٹمر کے جائزوں کا موازنہ کرنے کے لیے کہہ سکتا ہے۔
- اسٹائل ایڈوائس: جیسا کہ ابتدائی مثال میں دکھایا گیا ہے، صارفین اپنی اسکرین کو کپڑوں کی اشیاء ڈسپلے کرتے ہوئے شیئر کر کے اور Gemini سے تکمیلی ٹکڑوں یا لباس کی تجاویز طلب کر کے فیشن ایڈوائس حاصل کر سکتے ہیں۔
- ترکیب میں مدد: آن لائن ترکیب پر عمل کرتے ہوئے، ایک صارف اپنی اسکرین کو Gemini کے ساتھ شیئر کر سکتا ہے اور اجزاء کے متبادل یا کھانا پکانے کی تکنیکوں پر وضاحت طلب کر سکتا ہے۔
4. تکنیکی مدد اور خرابیوں کا سراغ لگانا:
- سافٹ ویئر کے مسئلے کی تشخیص: سافٹ ویئر کے مسئلے کا سامنا کرتے ہوئے، ایک صارف اپنی اسکرین کو Gemini کے ساتھ شیئر کر سکتا ہے اور مرحلہ وار خرابیوں کا سراغ لگانے کی رہنمائی حاصل کر سکتا ہے۔
- ہارڈ ویئر کی مرمت میں مدد: کسی ڈیوائس کی مرمت کرنے کی کوشش کرتے ہوئے، ایک صارف اس عمل کو فلم کر سکتا ہے اور Gemini سے اجزاء کی شناخت یا مخصوص مرمت کے مراحل کے بارے میں ہدایات طلب کر سکتا ہے۔
- نیٹ ورک کنیکٹیویٹی ٹربل شوٹنگ: نیٹ ورک کنیکٹیویٹی کے مسائل کا سامنا کرتے ہوئے، ایک صارف اپنی اسکرین کو Gemini کے ساتھ نیٹ ورک سیٹنگز ڈسپلے کرتے ہوئے شیئر کر سکتا ہے اور مسئلے کی تشخیص اور اسے حل کرنے میں مدد حاصل کر سکتا ہے۔
یہ صرف چند مثالیں ہیں، اور ممکنہ ایپلی کیشنز عملی طور پر لامحدود ہیں۔ جیسے جیسے صارفین ان خصوصیات سے زیادہ واقف ہوتے جائیں گے، وہ بلاشبہ اپنی روزمرہ کی زندگیوں میں Gemini کی صلاحیتوں سے فائدہ اٹھانے کے نئے اور جدید طریقے دریافت کریں گے۔ کلید متن پر مبنی سوالات سے تعامل کی ایک زیادہ قدرتی اور بدیہی شکل میں تبدیلی ہے، جس سے صارفین اپنی حقیقی دنیا کی سرگرمیوں کے ساتھ بغیر کسی رکاوٹ کے ضم ہونے والے طریقے سے معلومات اور امداد تک رسائی حاصل کر سکتے ہیں۔