Google I/O 2025 ইতিমধ্যেই শেষ হয়েছে, এবং এটি সর্বকালের সবচেয়ে উত্তেজনাপূর্ণ ইভেন্টগুলির মধ্যে একটি ছিল। এই বছরের সম্মেলনে, Google কর্মীরা তাদের নতুন বুদ্ধিমান AI মডেল, এজেন্ট পণ্য এবং ব্যক্তিগতকৃত বৈশিষ্ট্যগুলি প্রকাশ করার অভূতপূর্ব গতির কথা জানিয়েছে, যা তাদের সকলের জন্য উপযোগী করে তুলেছে। আমরা Gemini মডেল এবং Gemini অ্যাপ্লিকেশন, সার্চ-এ AI মোড, জেনারেটিভ AI প্রযুক্তির আপডেট প্রকাশ করেছি। আমাদের সবচেয়ে বড় I/O ঘোষণার বিষয়ে আপনার জ্ঞান পরীক্ষা করার জন্য এই কুইজটি দেওয়া হলো।
কুইজ শুরু
সত্য অথবা মিথ্যা: “ডিপ থিংক” নামের একটি বর্ধিত যুক্তিবোধ মোড চালু করার মাধ্যমে, আমরা Gemini 2.5 Pro-কে আরও উন্নত করব।
- সঠিক উত্তর: এটি সঠিক। আমরা ডিপ থিংক চালু করার মাধ্যমে Gemini 2.5 Pro-কে উন্নত করছি, যা অত্যন্ত জটিল গণিত এবং কোডিংয়ের জন্য একটি পরীক্ষামূলক বর্ধিত যুক্তি মোড। ব্যবহারের আগে তাদের প্রতিক্রিয়া পেতে আমরা Gemini API-এর মাধ্যমে বিশ্বস্ত পরীক্ষকদের কাছে এটি উপলব্ধ করছি।
আমরা নিম্নলিখিত অঞ্চলে সবার জন্য AI মোড (আমাদের সবচেয়ে শক্তিশালী AI সার্চ) চালু করতে শুরু করেছি:
মার্কিন যুক্তরাষ্ট্র (United States)
যুক্তরাজ্য (United Kingdom)
কানাডা (Canada)
অস্ট্রেলিয়া (Australia)
সঠিক উত্তর: একদম ঠিক, আমরা ল্যাবস-এ সাইন আপ করা ছাড়াই মার্কিন যুক্তরাষ্ট্রের সকলের জন্য AI মোড চালু করছি। AI মোড আরও উন্নত যুক্তি এবং মাল্টিমোডাল ব্যবহার করে এবং ফলো-আপ প্রশ্ন এবং সহায়ক ওয়েব লিঙ্কের মাধ্যমে আরও গভীরভাবে অন্বেষণ করতে সক্ষম। আগামী কয়েক সপ্তাহের মধ্যে, আপনি সার্চ (Search) এবং Google অ্যাপ্লিকেশনগুলির সার্চ বারে AI মোডের জন্য একটি নতুন ট্যাব দেখতে পাবেন। এই সপ্তাহ থেকে শুরু করে, আমেরিকার সার্চে AI মোড এবং AI ওভারভিউ-এর জন্য Gemini 2.5-এর একটি কাস্টম সংস্করণ (আমাদের সবচেয়ে বুদ্ধিমান মডেল) নিয়ে আসছি।
Veo 3 আমাদের সর্বশেষ অত্যাধুনিক ভিডিও জেনারেশন মডেল, যা শুধুমাত্র Veo 2-এর গুণমানই বাড়ায়নি, সেই সাথে প্রথমবারের মতো কী তৈরি করেছে?
অডিও সহ ভিডিও (Video with audio)
৮K ভিডিও (8K video)
বাস্তবসম্মত পদার্থবিদ্যা সহ ভিডিও (Video with realistic physics)
১০ মিনিটের বেশি দৈর্ঘ্যের ভিডিও (Video longer than 10 minutes)
সঠিক উত্তর: দারুণ শোনাচ্ছে: Veo 3 অডিও সহ ভিডিও তৈরি করতে পারে, যেমন শহরের রাস্তার দৃশ্যে যানবাহনের আওয়াজ, পার্কে পাখির গান, এমনকি চরিত্রগুলির মধ্যে কথোপকথন। সামগ্রিকভাবে, Veo 3 টেক্সট (text) এবং ইমেজ প্রম্পট (image prompt), বাস্তবসম্মত পদার্থবিদ্যা এবং নির্ভুল লিপ সিঙ্ক (lip sync)-এর ক্ষেত্রে অসাধারণ। Veo 3 আজ থেকে Gemini অ্যাপ্লিকেশন এবং Flow-তে Ultra গ্রাহকদের জন্য মার্কিন যুক্তরাষ্ট্রে উপলব্ধ। এটি Vertex AI-এর মাধ্যমে এন্টারপ্রাইজ ব্যবহারকারীদের জন্যও উপলব্ধ।
আমাদের নতুন AI সাবস্ক্রিপশন প্ল্যানের নাম কী? এই প্ল্যানটিতে সর্বোচ্চ ব্যবহারের সীমা রয়েছে এবং আমাদের সবচেয়ে শক্তিশালী মডেল এবং উন্নত বৈশিষ্ট্যগুলিতে অ্যাক্সেস পাওয়া যায়।
Google AI Pro
Google AI Ultra
Google AI Premium
Google AI Max
সঠিক উত্তর: এটি খুবই সঠিক। Google AI Ultra, যা আমাদের সবচেয়ে শক্তিশালী মডেল এবং উন্নত বৈশিষ্ট্যগুলিতে অ্যাক্সেস সরবরাহ করে, যার মধ্যে রয়েছে Gemini, Flow এবং Whisk। এছাড়াও আপনি আমাদের এজেন্ট রিসার্চ প্রোটোটাইপ Project Mariner-এ অ্যাক্সেস পাবেন। Google AI Ultra মার্কিন যুক্তরাষ্ট্রে প্রতি মাসে $২৪৯.৯৯ মূল্যে চালু হবে (প্রথমবার ব্যবহারকারীর জন্য প্রথম তিন মাসে ৫০% বিশেষ ছাড়) এবং শীঘ্রই আরও দেশে চালু হবে।
কোন আপডেট করা Gemini মডেলটি আমরা এইমাত্র Gemini অ্যাপ্লিকেশনে সবার জন্য উপলব্ধ করেছি?
Gemini 1.5 Pro
Gemini 2.0 Pro
Gemini 2.5 Pro
Gemini 3.0 Pro
সঠিক উত্তর: একদম ঠিক, আমরা সম্প্রতি Gemini অ্যাপ্লিকেশনে সবার জন্য Gemini 1.5 Pro চালু করতে শুরু করেছি। এটি দ্রুত, আরও প্রতিক্রিয়াশীল এবং বিনামূল্যে ১২৮K কনটেক্সট উইন্ডো(context window) সরবরাহ করে।
আমাদের নতুন AI ফিল্ম মেকিং টুলের নাম কী? এই টুলটি Google-এর সবচেয়ে উন্নত মডেলগুলির (Veo, Imagen এবং Gemini) জন্য বিশেষভাবে ডিজাইন করা হয়েছে।
Firefly
Runway
Flow
Premiere
সঠিক উত্তর: আসুন প্রবাহের সাথে চলি। Flow ক্রিয়েটিভদের জন্য তৈরি করা হয়েছে, যা গল্পকারদের তাদের ধারণাকে অবাধে অন্বেষণ করতে এবং Veo, Imagen এবং Gemini-কে একত্রিত করে তাদের গল্পের জন্য ফিল্ম ক্লিপ এবং দৃশ্য তৈরি করতে সহায়তা করে। এটি আজ মার্কিন যুক্তরাষ্ট্রে Google AI Pro এবং Ultra প্ল্যান গ্রাহকদের জন্য উপলব্ধ এবং শীঘ্রই আরও দেশে চালু হবে।
সত্য অথবা মিথ্যা: আপনি এখন একটি সম্পূর্ণ, কাস্টমাইজড ডিপ রিসার্চ রিপোর্ট (Deep Research report) পেতে পারেন, যা আপনার নিজের আপলোড করা ফাইলের সাথে পাবলিক ডেটা একত্রিত করে।
- সঠিক উত্তর: হ্যাঁ, এটি খুব ভাল, তাই না? যেহেতু আপনি নিজের PDF, ছবি এবং Google ড্রাইভ থেকে ফাইল আপলোড করতে পারবেন ডিপ রিসার্চে, তাই আপনি একটি ব্যাপক ধারণা পাবেন। এই ধারণাটি আপনার অনন্য জ্ঞান এবং বিস্তৃত ট্রেন্ডগুলির সাথে ক্রস-রেফারেন্স (cross-reference) করতে পারে, সবকিছু এক জায়গায়, যা আপনার সময় বাঁচায় এবং আপনি যে সংযোগগুলি মিস করেছেন তা প্রকাশ করে।
সার্চ লাইভ (Search Live)-এর সাহায্যে, আপনি আপনার ____ ব্যবহার করে অনুসন্ধানের সাথে কথোপকথন করতে সক্ষম হবেন।
কীবোর্ড (Keyboard)
ক্যামেরা (Camera)
মাইক্রোফোন (Microphone)
মাউস (Mouse)
সঠিক উত্তর: আপনার ক্যামেরা থেকে লাইভ, এটাই হল… সার্চ লাইভ! আমরা Project Astra-এর লাইভ ক্ষমতাগুলি অনুসন্ধানে নিয়ে আসছি, যাতে আপনি আপনার ক্যামেরা ব্যবহার করতে পারেন এবং আপনি যা দেখছেন সে সম্পর্কে অনুসন্ধানের সাথে রিয়েল-টাইমে আলোচনা করতে পারেন। উদাহরণস্বরূপ, আপনি যদি কোনও সমস্যায় পড়েন এবং কিছু সাহায্যের প্রয়োজন হয়, তাহলে শুধু AI মোড বা লেন্সের “লাইভ” আইকনে ক্লিক করুন, আপনার ক্যামেরাটি ধরুন এবং আপনার প্রশ্ন জিজ্ঞাসা করুন। ঠিক এইভাবেই, সার্চ এমন একটি শেখার সঙ্গীতে পরিণত হয়, যা আপনাকে দেখতে পারে।
গড়পড়তা, Gemini Live-এর সাথে লোকেরা টেক্সট-ভিত্তিক Gemini কথোপকথনের চেয়ে কতক্ষণ বেশি কথা বলে?
দ্বিগুণ (Two times)
তিনগুণ (Three times)
চারগুণ (Four times)
পাঁচগুণ (Five times)
সঠিক উত্তর: অভিনন্দন, একদম ঠিক! লোকেরা Gemini Live পছন্দ করে। প্রকৃতপক্ষে, কথোপকথনগুলি টেক্সট-ভিত্তিক কথোপকথনের চেয়ে গড়ে পাঁচগুণ বেশি দীর্ঘ হয়, কারণ এটি সাহায্য পাওয়ার নতুন উপায় সরবরাহ করে, তা সে কোনও সমস্যাপূর্ণ ডিভাইস মেরামত করাই হোক বা ব্যক্তিগতকৃত শপিংয়ের পরামর্শ নেওয়াই হোক।
এজেন্ট মোড (Agent Mode) কী?
ডিভাইসের পাওয়ার খরচ কমানোর একটি উপায় (A way to reduce device power consumption)
একটি নতুন Gemini বৈশিষ্ট্য, যা আপনার নির্দেশনায় জটিল কাজগুলি পরিচালনা করতে পারে (A new Gemini feature that can manage complex tasks with your instructions)
স্মার্ট হোম ডিভাইসগুলি নিয়ন্ত্রণ করার জন্য একটি ভয়েস কমান্ড সিস্টেম (A voice command system for controlling smart home devices)
একাধিক ডিভাইসের মধ্যে ডেটা সিঙ্ক্রোনাইজ করার একটি প্রোটোকল (A protocol for synchronizing data between multiple devices)
সঠিক উত্তর: আপনার মন ছুটিতে নেই দেখছি: এজেন্ট মোড একটি আকর্ষণীয় নাম, যা একটি নতুন পরীক্ষামূলক বৈশিষ্ট্যকে বোঝায়। আপনি যখন Ultra প্ল্যানে Gemini অ্যাপ্লিকেশনটি আপগ্রেড করবেন, তখন এটি শীঘ্রই ডেস্কটপ ডিভাইসে উপলব্ধ হবে, যেখানে আপনি কেবল আপনার লক্ষ্যটি উল্লেখ করবেন এবং Gemini বুদ্ধিমানের সাথে সেই লক্ষ্যে পৌঁছানোর জন্য প্রয়োজনীয় পদক্ষেপগুলি সাজিয়ে নেবে। এজেন্ট মোড উন্নত বৈশিষ্ট্যগুলিকে একত্রিত করে, যেমন রিয়েল-টাইম ওয়েব ব্রাউজিং, গভীর গবেষণা এবং আপনার Google অ্যাপ্লিকেশনগুলির সাথে স্মার্ট ইন্টিগ্রেশন, তাই এটি খুব কম তত্ত্বাবধানে শুরু থেকে শেষ পর্যন্ত জটিল মাল্টি-স্টেপ (multi-step) কাজগুলি পরিচালনা করতে পারে।
আপনি যদি মার্কিন যুক্তরাষ্ট্রে সার্চ ল্যাব-এ যান, তাহলে আপনি কী আপলোড করতে পারেন কয়েক বিলিয়ন পোশাকের ভার্চুয়াল ট্রাই-অন (virtual try-on) করার জন্য?
একটি সেলফি (A selfie)
একটি ফুল-লেন্থ ছবি (A full-length photo)
একটি পোশাকের ছবি (A photo of clothing)
একটি মডেলের ছবি (A photo of a model)
সঠিক উত্তর: একদম ঠিক! আমাদের “ট্রাই-অন” পরীক্ষার মাধ্যমে, মার্কিন যুক্তরাষ্ট্রের অনলাইন ক্রেতারা এখন কেবল তাদের নিজের একটি ছবি আপলোড করে কয়েক বিলিয়ন পোশাকের ভার্চুয়াল ট্রাই-অন করতে পারেন। এটি একটি নতুন কাস্টম ইমেজ জেনারেশন মডেল (custom image generation model) দ্বারা চালিত, যা মানব শরীর এবং পোশাকের সূক্ষ্ম পার্থক্যগুলি বোঝে, যেমন বিভিন্ন উপকরণ কীভাবে বিভিন্ন শরীরে ভাঁজ হয়, প্রসারিত হয় এবং ঝুলে থাকে।
আগামী কয়েক সপ্তাহের মধ্যে, আমরা আপনার পছন্দের কিছু Google অ্যাপ্লিকেশন সংযোগ করে Gemini Live-কে আরও ব্যক্তিগতকৃত করব, যাতে আপনি কথোপকথনে পদক্ষেপ নিতে পারেন। আপনি কোন অ্যাপ্লিকেশনগুলি সংযোগ করতে পারবেন?
Gmail, ডক্স (Docs) এবং শিটস (Sheets)
ম্যাপস (Maps), ক্যালেন্ডার (Calendar), টাস্কস (Tasks) এবং কিপ (Keep)
ফটোস (Photos), ড্রাইভ (Drive) এবং কন্টাক্টস (Contacts)
YouTube, মিউজিক (Music) এবং পডকাস্ট (Podcasts)
সঠিক উত্তর: একদম ঠিক: Gemini Live আপনার দৈনন্দিন জীবনে আরও গভীরভাবে মিশে যাবে, প্রথমে Google ম্যাপস, ক্যালেন্ডার, টাস্কস এবং কিপ থেকে শুরু করে, ভবিষ্যতে আরও অ্যাপ্লিকেশন সংযোগ করার মাধ্যমে। আপনি যেকোনো সময় অ্যাপ্লিকেশনের সেটিংসে এই অ্যাপ্লিকেশন সংযোগগুলি এবং আপনার তথ্য পরিচালনা করতে পারেন।
AI ওভারভিউ এখন ____ টির বেশি দেশে এবং ____ টির বেশি ভাষায় উপলব্ধ।
১০০ এবং ২০ (100 and 20)
১৫০ এবং ৩০ (150 and 30)
২০০ এবং ৪০ (200 and 40)
২৫০ এবং ৫০ (250 and 50)
সঠিক উত্তর: আপনার অনুমান একেবারে নির্ভুল। এখন AI ওভারভিউ ২০০-টির বেশি দেশে এবং ৪০-টির বেশি ভাষায় উপলব্ধ, এবং এতে আরবি, চীনা, মালয়, উর্দু এবং আরও অনেক ভাষার জন্য সমর্থন যোগ করা হয়েছে।
আমাদের নতুন ভিডিও যোগাযোগ প্ল্যাটফর্ম Google Beam আমাদের AI ভিডিও মডেল এবং ____-কে একত্রিত করে স্ট্যান্ডার্ড 2D ভিডিও স্ট্রীমকে (standard 2D video stream) একটি বাস্তবসম্মত 3D অভিজ্ঞতায় রূপান্তরিত করে।
নিউরাল রেডিয়েন্স ফিল্ডস (NeRF) প্রযুক্তি (Neural Radiance Fields (NeRF) technology)
অগমেন্টেড রিয়েলিটি (AR) ওভারলে (Augmented Reality (AR) overlays)
হলোগ্রাফিক প্রজেকশন (Holographic projection)
ভার্চুয়াল রিয়েলিটি (VR) পরিবেশ (Virtual Reality (VR) environment)
সঠিক উত্তর: একদম ঠিক, Google Beam আমাদের AI ভিডিও মডেলগুলোকে নিউরাল রেডিয়েন্স ফিল্ডের সাথে একত্রিত করে স্ট্যান্ডার্ড 2D ভিডিও স্ট্রীমকে একটি বাস্তবসম্মত 3D অভিজ্ঞতায় রূপান্তরিত করে, যা মানুষকে আগের চেয়ে আরও সহজে এবং আকর্ষকভাবে যোগাযোগ করতে সক্ষম করে।
I/O উপস্থাপনায়, XR প্রোডাক্ট ম্যানেজার নিস্থা ভাটিয়া অ্যান্ড্রয়েড XR চশমা পরে Gemini ব্যবহার করে ব্যাকস্টেজ-এ (backstage) তার কফি খাওয়ার বিস্তারিত বিবরণ স্মরণ করেন। সেটি কী ছিল?
কফি শপের নাম (The name of the coffee shop)
কফির দাম (The price of the coffee)
কফিতে ব্যবহৃত দুধের ধরন (The type of milk used in the coffee)
কফির কাপের আকার (The size of the coffee cup)
সঠিক উত্তর: আপনি নিশ্চয়ই একটি ল্যাটে (latte) খেতে যাচ্ছেন, কারণ এটি সঠিক উত্তর। নিস্থা তার অ্যান্ড্রয়েড XR চশমা পরে Gemini ব্যবহার করে কফি শপের নাম মনে রেখেছিলেন। তিনি তার চশমা ব্যবহার করে সেই কফি শপে আরও পরে কফি খাওয়ার সময়সূচী তৈরি করেন, I/O অংশগ্রহণকারীদের ছবি তোলেন এবং রিয়েল-টাইমে হিন্দি এবং ফার্সি ভাষার কথোপকথন অনুবাদ করেন।