Google Gemini: توانایی هوش مصنوعی در زندگی دیجیتال

Google Gemini به سرعت از یک ابزار تقویت‌کننده جست‌وجوی وب به یک چت‌بات جامع هوش مصنوعی تبدیل شده است که توانایی انجام طیف گسترده‌ای از کارها را دارد. این ابزار اکنون می‌تواند فایل‌ها را پردازش کند، ویدیوهایی با صدا تولید کند و مسائل پیچیده را حل کند. همه این‌ها در حالی است که از فضای ابری و ادغام یکپارچه با برنامه‌های Google بهره‌مند است. Gemini، از پاسخ دادن به سوالات مربوط به صفحات Chrome تا مدیریت Gmail، یک تجربه یکپارچه هوش مصنوعی را ارائه می‌دهد. با این حال، قابلیت‌های منبع‌یابی تحقیقاتی و تولید تصویر آن همیشه عالی نیستند و مانند سایر چت‌بات‌ها، گاهی اوقات می‌تواند اطلاعات نادرستی ارائه دهد.

Gemini به عنوان یک دستیار مجازی

Gemini را به عنوان یک دستیار مجازی پیشرفته در نظر بگیرید که در انجام انواع وظایف مهارت دارد. این ابزار می‌تواند اسناد را تجزیه و تحلیل کند، به سوالات پاسخ دهد، تصاویر و ویدیوها تولید کند، تحقیق کند، در نوشتن خلاقانه به شما کمک کند، در وب جستجو کند و مسائل ریاضی را حل کند. Gemini از طریق متن یا صدا، مشابه Microsoft Copilot یا ChatGPT، قابل دسترسی است.

Gemini همچنین دارای ویژگی‌هایی است که برای برنامه‌نویسان طراحی شده است، از جمله Gemini Code Assist و عامل کدنویسی ناهمزمان Jules. این ابزارها می‌توانند در انجام کارهایی مانند ایجاد پلاگین‌های WordPress سفارشی و اشکال‌زدایی کد به شما کمک کنند.

عملکرد اصلی: Promptها و پاسخ‌ها

در هسته خود، Gemini Promptهای کاربر را دریافت می‌کند و پاسخ‌هایی را تولید می‌کند که توسط مدل‌های زبانی بزرگ (LLM) که روی مجموعه‌های داده عظیمی آموزش داده شده‌اند، پشتیبانی می‌شوند. این مدل‌ها به Gemini امکان دسترسی به انبوهی از اطلاعات در موضوعات مختلف را می‌دهند، که با جستجوهای اینترنتی در زمان واقعی تکمیل می‌شوند.

هرچه کاربران بیشتر با Gemini تعامل داشته باشند، بهتر می‌شود. تعامل کاربر به آموزش مدل‌های زیربنایی کمک می‌کند و Gemini را قادر می‌سازد تا پاسخ‌های دقیق‌تری ارائه دهد و خطاها را در طول زمان کاهش دهد. این فرآیند یادگیری مداوم تدریجی اما ضروری است.

خطوط مدل Gemini: Flash و Pro

Gemini از دو خط مدل اصلی استفاده می‌کند: Flash و Pro. خط Flash برای تعاملات محاوره‌ای طراحی شده است، در حالی که خط Pro در وظایف استدلال پیچیده مانند کدنویسی، ریاضیات و علوم تخصص دارد. هر مدل در این خطوط، نقاط قوت منحصر به فردی را نشان می‌دهد. جدیدترین مدل‌ها 2.5 Flash و 2.5 Pro هستند و آزمایش‌ها اغلب بر روی 2.5 Flash پیش‌فرض و 2.5 Pro برای کارهای تخصصی متمرکز است.

رایگان در مقابل Premium: چه چیزی دریافت می‌کنید؟

Gemini طرح‌های رایگان و Premium را ارائه می‌دهد، که طرح‌های Premium ویژگی‌های اضافی را باز می‌کنند.

طرح رایگان

کاربران رایگان به مدل 2.5 Flash، دسترسی محدود به مدل 2.5 Pro، حالت صوتی (Gemini Live)، قابلیت‌های تحقیق عمیق محدود و دستیارهای هوش مصنوعی سفارشی (Gems) دسترسی دارند. آنها همچنین دسترسی محدودی به ابزار انیمیشن Whisk و 15 گیگابایت فضای ذخیره‌سازی ابری Google Drive دریافت می‌کنند.

طرح‌های Premium

طرح‌های Premium شامل Google AI Pro (19.99 دلار در ماه) و Google AI Ultra (249.99 دلار در ماه) است. سطح AI Pro محدودیت‌های استفاده بالاتری را ارائه می‌دهد، ابزار فیلم‌سازی Flow، Gemini در Google Chrome، تولید ویدیو از طریق مدل Veo 2 Gemini و یک پنجره متنی بزرگتر برای Promptهای پیچیده. فضای ذخیره‌سازی ابری Google Drive با AI Pro به 2 ترابایت افزایش می‌یابد و Gemini با برنامه‌های Google Workspace مانند Gmail، Calendar، Docs و Sheets ادغام می‌شود.

طرح AI Ultra شامل همه چیز در AI Pro است، با محدودیت‌های استفاده حتی بالاتر و چندین ویژگی جدید: 30 ترابایت فضای ذخیره‌سازی ابری Google Drive، دسترسی زودهنگام به عامل ساده‌سازی وظایف Gemini، دسترسی انحصاری به حالت Deep Think آتی 2.5 Pro Gemini، جدیدترین مدل تولید ویدیوی Veo 3 Google و YouTube Premium. طرح AI Pro به طور کلی مقرون به صرفه‌تر برای اکثر کاربراناست. اشتراک Google One، که بر فضای ذخیره‌سازی ابری از طریق Google Drive متمرکز است، به شما امکان می‌دهد Gemini AI Pro را با بیش از 2 ترابایت فضای ذخیره‌سازی ابری، مانند 5 ترابایت (25 دلار در ماه) یا 10 ترابایت (50 دلار در ماه) دریافت کنید.

ارزش پیشنهادی: Gemini در مقابل رقبا

چت‌بات‌های اصلی مانند Copilot، ChatGPT و Gemini برای طرح‌های Premium خود حدود 20 دلار در ماه قیمت دارند. Gemini و Copilot به دلیل ادغام با برنامه‌های Google و Microsoft 365، به ترتیب، متمایز هستند. ChatGPT فقط بر عملکرد چت‌بات تمرکز دارد. در حالی که Copilot Pro ویژگی‌های منحصر به فردی دارد، ادغام فضای ذخیره‌سازی ابری Gemini ارزش استثنایی را ارائه می‌دهد.

دسترسی: وب، موبایل و ادغام‌ها

Gemini از طریق برنامه‌های وب و تلفن همراه (Apple و Android) قابل دسترسی است. در حالی که هیچ برنامه دسکتاپ یا افزونه مرورگر رسمی وجود ندارد، Chrome یک ادغام Gemini را ارائه می‌دهد. Gemini را می‌توان در برنامه‌های Google مانند Calendar، Docs، Drive، Gmail، Maps، Keep، Photos، Sheets و YouTube Music استفاده کرد.

شروع کار: رابط کاربری و تجربه کاربری

Gemini به حساب کاربری نیاز ندارد، اما توصیه می‌شود برای تغییر مدل‌ها، استفاده از تحقیقات عمیق و ذخیره چت‌ها، وارد سیستم شوید.

رابط کاربری ساده است، دارای یک فیلد متنی "Ask Gemini" و چت‌های اخیر در نوار کناری است. Promptهای نمونه قابل کلیک، راهنمایی‌هایی را در مورد کارهایی که Gemini می‌تواند انجام دهد، ارائه می‌دهند. پاسخ‌ها معمولاً سریع هستند، به خصوص برای تولید تصویر. کاربران می‌توانند پاسخ‌ها را کپی، گوش دهند، دوباره تولید یا به اشتراک بگذارند. مشکلات گاه به گاه سرور ممکن است باعث تعلیق پاسخ‌ها شود، مشابه ChatGPT و Copilot.

لحن و حافظه

Gemini مستقیم‌تر و کمتر محاوره‌ای از ChatGPT است. شخصی‌سازی لحن Gemini امکان‌پذیر نیست، اما اطلاعات کاربری خاصی را می‌توان ذخیره کرد تا Gemini به خاطر بسپارد. حافظه قوی Gemini امکان تجربه‌های چت رضایت‌بخش‌تری را فراهم می‌کند و چت‌های گذشته را حتی هنگام شروع چت‌های جدید به خاطر می‌آورد.

حالت صوتی: Gemini Live

نماد میکروفون ورودی گفتار به متن را فعال می‌کند و Gemini Live، مانند حالت صوتی ChatGPT یا Copilot Voice، به کاربران اجازه می‌دهد تا به طور طبیعی با صداهای مختلف صحبت کنند.

Gemini Live از اشتراک‌گذاری دوربین و صفحه پشتیبانی می‌کند و به کاربران امکان می‌دهد در مورد موضوعات دنیای واقعی بحث کنند. در حالی که قابلیت‌های تشخیص تصویر Gemini به طور کلی کارآمد هستند، این ویژگی بیشتر به عنوان صرفه‌جویی در زمان عمل می‌کند.

Project Mariner: یک عامل ساده‌سازی وظایف

Project Mariner، انحصاری برای کاربران AI Ultra، یک دستیار هوش مصنوعی است که وظایفی مانند جستجوی شغل یا شکار آپارتمان را انجام می‌دهد. Google، Project Mariner را یک «نمونه اولیه تحقیقاتی» می‌نامد که نشان می‌دهد هنوز به پالایش بیشتری نیاز دارد.

جستجوی وب و بازیابی اطلاعات

جستجوی وب یک ویژگی استاندارد در تمام چت‌بات‌های اصلی است. Gemini، ChatGPT و Copilot می‌توانند به سوالات مربوط به رویدادهای جاری پاسخ دهند. در حالی که بیشتر سوالات به درستی پاسخ داده می‌شوند، برخی می‌توانند چت‌بات‌ها را سردرگم کنند.

پاسخ‌های Gemini و Copilot معمولاً کوتاه و سرراست هستند، در حالی که ChatGPT اطلاعات دقیق‌تری ارائه می‌کند. Gemini و ChatGPT هر دو دارای نمادهای منبع هستند که به مقالات مرتبط پیوند می‌دهند، اما رابط کاربری ChatGPT نام منبع و عنوان کامل مقاله را نشان می‌دهد.

حالت AI و خرید

حالت AI در صفحه جستجوی Google، که توسط Gemini پشتیبانی می‌شود، از طریق یک دکمه حالت AI قابل دسترسی است. این به کاربران امکان می‌دهد تا سوالاتی را بر اساس نتایج وب بپرسند، با کاشی‌های مقاله مرتبط و تصاویر مرتبط در پاسخ‌ها مشابه ChatGPT. همچنین دسترسی آسانی به جستجوی Google و جستجوی تصویر فراهم می‌کند.

Gemini همچنین می‌تواند با ارائه مشاوره خرید در کنار کاشی‌های Google Shopping با نظرات کاربران، پیوندهای خرده‌فروش و ردیابی قیمت، به خرید کمک کند. ویژگی خرید Gemini توصیه‌های مرتبطی را
ارائه می‌دهد.

تحقیق عمیق: گزارش‌دهی عمیق

تحقیق عمیق یک ویژگی ارزشمند چت‌بات‌های هوش مصنوعی است که به کاربران امکان می‌دهد سؤالاتی را مطرح کنند یا موضوعاتی را برای تحقیق و گزارش Gemini پیشنهاد کنند. گزارش‌ها می‌توانند به منابع متعددی استناد کنند و در حدود 10 دقیقه تولید شوند.

هر دو چت‌بات موضوعات تحقیق ساده را به راحتی انجام می‌دهند، اما سؤالات بدون پاسخ قطعی و نیاز به منابع متنوع چالش‌برانگیزتر هستند.

Gemini به منابع بیشتری استناد می‌کند، اما منبع‌یابی ChatGPT کاربرپسندتر است. Gemini امکان صادرات گزارش‌ها به Google Docs را فراهم می‌کند، اما رابط کاربری تحقیق عمیق ChatGPT اساساً فقط یک نوار بارگیری است.

لحن گزارش به طور قابل توجهی متفاوت است، گزارش‌های Gemini شبیه مقالات آکادمیک و گزارش‌های ChatGPT شبیه پست‌های انجمن هستند.

تولید تصویر: یک مقایسه بصری

تولید تصویر یکی دیگر از ویژگی‌های اصلی چت‌بات‌های هوش مصنوعی است. تست‌ها بر روی تصاویر فوتورئالیستی و تصاویر پیچیده متمرکز هستند.

در تولید تصویر فوتورئالیستی، Gemini تصاویر را به سرعت و از نظر بصری جذاب تولید می‌کند، اگرچه ممکن است حاوی خطا باشد.

برای تصاویر پیچیده، کمیک Gemini معمولاً ناهماهنگ است، در حالی که کمیک ChatGPT به تحقق هدف خود نزدیک‌تر می‌شود.

در تولید نمودارهای فنی، ChatGPT نمودارهای بسیار دقیقی تولید می‌کند که قدرت آن را تثبیت می‌کند.

تولید ویدئو: یک زمینه در حال شکوفایی

تولید ویدئوی هوش مصنوعی یک ویژگی فزاینده جریان اصلی است. Gemini دارای ابزار فیلمساز Flow، مدل تولید ویدئوی Veo 3 و انیماتور هوش مصنوعی Whisk است. توانایی آن در تولید ویدیوهایی با صدا، آن را از تولید ویدئوی Sora ChatGPT متمایز می‌کند، اگرچه انحصاری برای مشترکین AI Ultra است.

Veo 3 یک جهش بزرگ رو به جلو را نشان می‌دهد، اما نیاز به کالیبراسیون دقیق Prompt دارد. هر نسل به 150 اعتبار نیاز دارد (12500 اعتبار در ماه با AI Ultra).

Flow به شما امکان می‌دهد کلیپ‌های ویدئویی را کوتاه کنید و آنها را بر اساسPromptهای جدید گسترش دهید. با اعتبارات کافی، می‌توان یک فیلم را به طور کامل با Flow ساخت.

Whisk، ابزار انیمیشن هوش مصنوعی Google، به کاربران اجازه می‌دهد تصاویر را آپلود کنند. نتایج می‌تواند سرگرم‌کننده باشد اما دارای خطاها و اعوجاج است.

تجزیه و تحلیل فایل: درک محتوای بارگذاری شده

Gemini می‌تواند فایل‌های آپلود شده را تجزیه و تحلیل و درک کند، از رزومه‌ها انتقاد کند، تصاویر را تفسیر کند یا متن را ترجمه کند.

در تشخیص تصویر، چت‌بات‌ها بر روی توانایی خود در شناسایی اجزای یک تصویر آپلود شده آزمایش می‌شوند. ChatGPT می‌تواند حجم بیشتری از جزئیات را شامل شود.

برای پردازش اسناد، چت‌بات‌ها وظیفه دارند به سؤالات بر اساس اسناد آپلود شده پاسخ دهند. Gemini و ChatGPT هر دو پاسخ‌های درستی ارائه می‌دهند، اما هنگام بارگذاری فایل‌ها باید احتیاط کرد. پردازش فایل‌ها در ChatGPT می‌تواند نسبت به Gemini کمی برتری داشته باشد، اما این حاشیه کمی است.

نوشتن خلاقانه: تولید شعر

چت‌بات‌های هوش مصنوعی می‌توانند در نوشتن خلاقانه، از جمله جوک‌ها، مونولوگ‌ها و اشعار کمک کنند.

هنگامی که وظیفه نوشتن یک شعر آزاد به ChatGPT داده می‌شود، از دستورالعمل‌ها دقیق‌تر پیروی می‌کند. شعر Gemini از علامت‌گذاری استفاده نمی‌کند، در حالی که شعر Copilot با شکستن خطوط خود احساس کمبود می‌کند.

استدلال پیچیده: سؤالات امتحانی

استدلال پیچیده با ارائه سؤالات امتحانی مقطع کارشناسی علوم کامپیوتر، ریاضیات و فیزیک به چت‌بات‌ها آزمایش می‌شود.

چت‌بات‌ها بسیار خوب عمل می‌کنند و به طور موثر به تمام سؤالات فیزیک پاسخ می‌دهند. ChatGPT کمترین پاسخ نادرست را در کل برمی‌گرداند.

Gemini در Chrome: ادغام یکپارچه

Chrome اکنون Gemini را یکپارچه می‌کند. دارندگان حساب پولی می‌توانند روی نماد Gemini کلیک کنند تا یک پنجره چت باز کنند، مطابق معمول با Gemini تعامل داشته باشند و از محتوای برگه فعال درخواست کنند. ادغام Gemini در Chrome به کاربران امکان می‌دهد تا نیاز به باز کردن یک زبانه جدید برای پرسیدن چیزی از Gemini را از طریق عملکردی مشابه Copilot Vision در Edge حذف کنند، اگرچه عملکرد Live Gemini در رابط وب آن در دسترس نیست.

پاسخ‌های متنی به طرز چشمگیری سریع هستند. سرعت پاسخ‌ها باعث می‌شود که من فکر کنم Gemini قبل از اینکه شما آنها را با آن به اشتراک بگذارید، به نوعی به صفحات وب دسترسی دارد.

اگرچه Gemini در Chrome محدودیت‌هایی دارد. Gemini نمی‌تواند فیلم‌ها را درک کند و پاسخ‌ها با Live به اندازه متن فوری نیستند، اما در کل مفید است زیرا نیاز به کپی و پیست را از بین می‌برد. با این حال، مگر اینکه مدام از Gemini استفاده کنید، زمانی که با یک کلیک از آن دور باشید، ممکن است تفاوت چندانی نداشته باشد. عملکرد Live نیز به همین ترتیب مفید است و به من این امکان را می‌دهد که در مورد آنچه که به آن نگاه می‌کنم سؤال بپرسم بدون اینکه نیازی به دست زدن به صفحه کلید داشته باشم.

Gemini در Chrome محدودیت‌هایی در مورد آنچه که می‌تواند ببیند و درک کند دارد. در نتیجه، Gemini می‌تواند احساس کند متجاوز است. Gemini می‌تواند به سؤالات مربوط به برگه‌های خاص پس از اشتراک‌گذاری آنها ببیند و پاسخ دهد.

ادغام برنامه‌های Google: بهره‌وری پیشرفته

مشترکین طرح AI Pro ویژگی‌های هوش مصنوعی را در برنامه‌های Google، از جمله Calendar، Docs، Drive، Gmail، Maps، Keep، Photos، Sheets و YouTube Music دریافت می‌کنند.

Google ادغام‌ها را در سایت خود Gemini برجسته می‌کند. می‌توانید رویدادهایی را بر اساس یک Flyers به Google Calendar اضافه کنید، لیست‌های خرید را در Google Keep تولید کنید یا به Gemini اجازه دهید لیست‌های پخش را در YouTube Music سرپرستی کند. Gemini در Docs، Gmail، Sheets و Slides عملکرد Copilot را در برنامه‌های Microsoft 365 منعکس می‌کند و اسلایدها را بر اساس Prompt، پیش‌نویس ایمیل‌ها، تولید متن و پیشنهاد فرمول‌ها ایجاد می‌کند.

Gemini در Gmail برجسته است و دسترسی کامل به سابقه ایمیل شما را به Gemini می‌دهد و به آن اجازه می‌دهد تا اطلاعات خاص را جستجو کند یا مشاوره تمیز کردن صندوق ورودی را ارائه دهد. با این حال، این یک ویژگی تمام عیار نیست. Gemini نمی‌تواند همه کارها را انجام دهد. این ادغام حس تجاوز به حریم خصوصی را دارد.

بسته به میزانی که از ادغام‌های موجود Gemini استفاده می‌کنید. ممکن است مواردی وجود داشته باشد که نیازهای خاص شما را برآورده نکند. با این حال، به دلیل تعدد ویژگی‌ها ممکن است مفید باشد.

Gems: متخصصان هوش مصنوعی سفارشی

Gems نسخه‌های سفارشی Gemini هستند که برای اهداف خاص طراحی شده‌اند. مربیان می‌توانند فایل‌ها را اضافه کنند و یک Gem PC Builder برای کمک به سازندگان رایانه برای اولین بار ایجاد کنند.

پاسخ‌ها با صحبت کردن با Gemini کمی متفاوت است. کسانی که قصد دارند با Gemini در مورد یک موضوع مشخص صحبت کنند، می‌توانند یک Gem ایجاد کنند. با این حال، Gems احساس نمی‌کند که واقعاً وعده Google را محقق می‌کند.

ایمنی و حریم خصوصی

Gemini آگاه نیست و نمی‌تواند مانند یک انسان فکر کند یا چیزها را درک کند.

محتوای بزرگسالان، فعالیت‌های غیرقانونی، تصاویر واقعی از افراد و موضوعات تابو برخلاف سیاست‌های Gemini است، Gemini در سیستم فیلترینگ خود سهل‌انگارترین است.

Gemini دارای یک پنجره متن است. پنجره متن Gemini در طرح AI Pro خود می‌تواند حداکثر 1500 صفحه متن یا 30000 خط کد را به طور همزمان با پرداخت مدیریت کند. اگر از نسخه رایگان به طور گسترده استفاده شود، ممکن است مشترکین با موانعی روبرو شوند.

Google هنگام استفاده از Gemini داده جمع‌آوری می‌کند، از جمله فایل‌ها، اطلاعات مکانی، استفاده از محصول و چت‌ها. این داده‌ها برای بهبود محصولات Google و فناوری‌های یادگیری ماشینی استفاده می‌شوند.

کاربران می‌توانند فعالیت برنامه‌های Gemini را خاموش کنند. به طور پیش فرض، Google داده‌های چت را به مدت 18 ماه ذخیره می‌کند.

در مورد ادغام Google Workspace Gemini، مانند Gmail، Docs، Drive، Sheets و Slides، Google قول می‌دهد که از مدل‌های آموزش دیده استفاده نکند، آن را نفروشد یا از آن برای تبلیغات هدفمند استفاده نکند.

Google در گذشته با مشکلاتی از جمله بازیگران مخربی که از نقص‌های Google chrome سوء استفاده کرده‌اند، تنظیم‌کننده‌های ایتالیایی که از Google به دلیل روش‌های داده‌ای خود یاد کرده‌اند و جمع‌آوری داده‌ها بدون رضایت منجر به از دست دادن میلیاردها دلار شده است، مواجه شده است. بنابراین، توصیه می‌شود داده‌های حساس را به اشتراک نگذارید.