Google Gemini به سرعت از یک ابزار تقویتکننده جستوجوی وب به یک چتبات جامع هوش مصنوعی تبدیل شده است که توانایی انجام طیف گستردهای از کارها را دارد. این ابزار اکنون میتواند فایلها را پردازش کند، ویدیوهایی با صدا تولید کند و مسائل پیچیده را حل کند. همه اینها در حالی است که از فضای ابری و ادغام یکپارچه با برنامههای Google بهرهمند است. Gemini، از پاسخ دادن به سوالات مربوط به صفحات Chrome تا مدیریت Gmail، یک تجربه یکپارچه هوش مصنوعی را ارائه میدهد. با این حال، قابلیتهای منبعیابی تحقیقاتی و تولید تصویر آن همیشه عالی نیستند و مانند سایر چتباتها، گاهی اوقات میتواند اطلاعات نادرستی ارائه دهد.
Gemini به عنوان یک دستیار مجازی
Gemini را به عنوان یک دستیار مجازی پیشرفته در نظر بگیرید که در انجام انواع وظایف مهارت دارد. این ابزار میتواند اسناد را تجزیه و تحلیل کند، به سوالات پاسخ دهد، تصاویر و ویدیوها تولید کند، تحقیق کند، در نوشتن خلاقانه به شما کمک کند، در وب جستجو کند و مسائل ریاضی را حل کند. Gemini از طریق متن یا صدا، مشابه Microsoft Copilot یا ChatGPT، قابل دسترسی است.
Gemini همچنین دارای ویژگیهایی است که برای برنامهنویسان طراحی شده است، از جمله Gemini Code Assist و عامل کدنویسی ناهمزمان Jules. این ابزارها میتوانند در انجام کارهایی مانند ایجاد پلاگینهای WordPress سفارشی و اشکالزدایی کد به شما کمک کنند.
عملکرد اصلی: Promptها و پاسخها
در هسته خود، Gemini Promptهای کاربر را دریافت میکند و پاسخهایی را تولید میکند که توسط مدلهای زبانی بزرگ (LLM) که روی مجموعههای داده عظیمی آموزش داده شدهاند، پشتیبانی میشوند. این مدلها به Gemini امکان دسترسی به انبوهی از اطلاعات در موضوعات مختلف را میدهند، که با جستجوهای اینترنتی در زمان واقعی تکمیل میشوند.
هرچه کاربران بیشتر با Gemini تعامل داشته باشند، بهتر میشود. تعامل کاربر به آموزش مدلهای زیربنایی کمک میکند و Gemini را قادر میسازد تا پاسخهای دقیقتری ارائه دهد و خطاها را در طول زمان کاهش دهد. این فرآیند یادگیری مداوم تدریجی اما ضروری است.
خطوط مدل Gemini: Flash و Pro
Gemini از دو خط مدل اصلی استفاده میکند: Flash و Pro. خط Flash برای تعاملات محاورهای طراحی شده است، در حالی که خط Pro در وظایف استدلال پیچیده مانند کدنویسی، ریاضیات و علوم تخصص دارد. هر مدل در این خطوط، نقاط قوت منحصر به فردی را نشان میدهد. جدیدترین مدلها 2.5 Flash و 2.5 Pro هستند و آزمایشها اغلب بر روی 2.5 Flash پیشفرض و 2.5 Pro برای کارهای تخصصی متمرکز است.
رایگان در مقابل Premium: چه چیزی دریافت میکنید؟
Gemini طرحهای رایگان و Premium را ارائه میدهد، که طرحهای Premium ویژگیهای اضافی را باز میکنند.
طرح رایگان
کاربران رایگان به مدل 2.5 Flash، دسترسی محدود به مدل 2.5 Pro، حالت صوتی (Gemini Live)، قابلیتهای تحقیق عمیق محدود و دستیارهای هوش مصنوعی سفارشی (Gems) دسترسی دارند. آنها همچنین دسترسی محدودی به ابزار انیمیشن Whisk و 15 گیگابایت فضای ذخیرهسازی ابری Google Drive دریافت میکنند.
طرحهای Premium
طرحهای Premium شامل Google AI Pro (19.99 دلار در ماه) و Google AI Ultra (249.99 دلار در ماه) است. سطح AI Pro محدودیتهای استفاده بالاتری را ارائه میدهد، ابزار فیلمسازی Flow، Gemini در Google Chrome، تولید ویدیو از طریق مدل Veo 2 Gemini و یک پنجره متنی بزرگتر برای Promptهای پیچیده. فضای ذخیرهسازی ابری Google Drive با AI Pro به 2 ترابایت افزایش مییابد و Gemini با برنامههای Google Workspace مانند Gmail، Calendar، Docs و Sheets ادغام میشود.
طرح AI Ultra شامل همه چیز در AI Pro است، با محدودیتهای استفاده حتی بالاتر و چندین ویژگی جدید: 30 ترابایت فضای ذخیرهسازی ابری Google Drive، دسترسی زودهنگام به عامل سادهسازی وظایف Gemini، دسترسی انحصاری به حالت Deep Think آتی 2.5 Pro Gemini، جدیدترین مدل تولید ویدیوی Veo 3 Google و YouTube Premium. طرح AI Pro به طور کلی مقرون به صرفهتر برای اکثر کاربراناست. اشتراک Google One، که بر فضای ذخیرهسازی ابری از طریق Google Drive متمرکز است، به شما امکان میدهد Gemini AI Pro را با بیش از 2 ترابایت فضای ذخیرهسازی ابری، مانند 5 ترابایت (25 دلار در ماه) یا 10 ترابایت (50 دلار در ماه) دریافت کنید.
ارزش پیشنهادی: Gemini در مقابل رقبا
چتباتهای اصلی مانند Copilot، ChatGPT و Gemini برای طرحهای Premium خود حدود 20 دلار در ماه قیمت دارند. Gemini و Copilot به دلیل ادغام با برنامههای Google و Microsoft 365، به ترتیب، متمایز هستند. ChatGPT فقط بر عملکرد چتبات تمرکز دارد. در حالی که Copilot Pro ویژگیهای منحصر به فردی دارد، ادغام فضای ذخیرهسازی ابری Gemini ارزش استثنایی را ارائه میدهد.
دسترسی: وب، موبایل و ادغامها
Gemini از طریق برنامههای وب و تلفن همراه (Apple و Android) قابل دسترسی است. در حالی که هیچ برنامه دسکتاپ یا افزونه مرورگر رسمی وجود ندارد، Chrome یک ادغام Gemini را ارائه میدهد. Gemini را میتوان در برنامههای Google مانند Calendar، Docs، Drive، Gmail، Maps، Keep، Photos، Sheets و YouTube Music استفاده کرد.
شروع کار: رابط کاربری و تجربه کاربری
Gemini به حساب کاربری نیاز ندارد، اما توصیه میشود برای تغییر مدلها، استفاده از تحقیقات عمیق و ذخیره چتها، وارد سیستم شوید.
رابط کاربری ساده است، دارای یک فیلد متنی "Ask Gemini" و چتهای اخیر در نوار کناری است. Promptهای نمونه قابل کلیک، راهنماییهایی را در مورد کارهایی که Gemini میتواند انجام دهد، ارائه میدهند. پاسخها معمولاً سریع هستند، به خصوص برای تولید تصویر. کاربران میتوانند پاسخها را کپی، گوش دهند، دوباره تولید یا به اشتراک بگذارند. مشکلات گاه به گاه سرور ممکن است باعث تعلیق پاسخها شود، مشابه ChatGPT و Copilot.
لحن و حافظه
Gemini مستقیمتر و کمتر محاورهای از ChatGPT است. شخصیسازی لحن Gemini امکانپذیر نیست، اما اطلاعات کاربری خاصی را میتوان ذخیره کرد تا Gemini به خاطر بسپارد. حافظه قوی Gemini امکان تجربههای چت رضایتبخشتری را فراهم میکند و چتهای گذشته را حتی هنگام شروع چتهای جدید به خاطر میآورد.
حالت صوتی: Gemini Live
نماد میکروفون ورودی گفتار به متن را فعال میکند و Gemini Live، مانند حالت صوتی ChatGPT یا Copilot Voice، به کاربران اجازه میدهد تا به طور طبیعی با صداهای مختلف صحبت کنند.
Gemini Live از اشتراکگذاری دوربین و صفحه پشتیبانی میکند و به کاربران امکان میدهد در مورد موضوعات دنیای واقعی بحث کنند. در حالی که قابلیتهای تشخیص تصویر Gemini به طور کلی کارآمد هستند، این ویژگی بیشتر به عنوان صرفهجویی در زمان عمل میکند.
Project Mariner: یک عامل سادهسازی وظایف
Project Mariner، انحصاری برای کاربران AI Ultra، یک دستیار هوش مصنوعی است که وظایفی مانند جستجوی شغل یا شکار آپارتمان را انجام میدهد. Google، Project Mariner را یک «نمونه اولیه تحقیقاتی» مینامد که نشان میدهد هنوز به پالایش بیشتری نیاز دارد.
جستجوی وب و بازیابی اطلاعات
جستجوی وب یک ویژگی استاندارد در تمام چتباتهای اصلی است. Gemini، ChatGPT و Copilot میتوانند به سوالات مربوط به رویدادهای جاری پاسخ دهند. در حالی که بیشتر سوالات به درستی پاسخ داده میشوند، برخی میتوانند چتباتها را سردرگم کنند.
پاسخهای Gemini و Copilot معمولاً کوتاه و سرراست هستند، در حالی که ChatGPT اطلاعات دقیقتری ارائه میکند. Gemini و ChatGPT هر دو دارای نمادهای منبع هستند که به مقالات مرتبط پیوند میدهند، اما رابط کاربری ChatGPT نام منبع و عنوان کامل مقاله را نشان میدهد.
حالت AI و خرید
حالت AI در صفحه جستجوی Google، که توسط Gemini پشتیبانی میشود، از طریق یک دکمه حالت AI قابل دسترسی است. این به کاربران امکان میدهد تا سوالاتی را بر اساس نتایج وب بپرسند، با کاشیهای مقاله مرتبط و تصاویر مرتبط در پاسخها مشابه ChatGPT. همچنین دسترسی آسانی به جستجوی Google و جستجوی تصویر فراهم میکند.
Gemini همچنین میتواند با ارائه مشاوره خرید در کنار کاشیهای Google Shopping با نظرات کاربران، پیوندهای خردهفروش و ردیابی قیمت، به خرید کمک کند. ویژگی خرید Gemini توصیههای مرتبطی را
ارائه میدهد.
تحقیق عمیق: گزارشدهی عمیق
تحقیق عمیق یک ویژگی ارزشمند چتباتهای هوش مصنوعی است که به کاربران امکان میدهد سؤالاتی را مطرح کنند یا موضوعاتی را برای تحقیق و گزارش Gemini پیشنهاد کنند. گزارشها میتوانند به منابع متعددی استناد کنند و در حدود 10 دقیقه تولید شوند.
هر دو چتبات موضوعات تحقیق ساده را به راحتی انجام میدهند، اما سؤالات بدون پاسخ قطعی و نیاز به منابع متنوع چالشبرانگیزتر هستند.
Gemini به منابع بیشتری استناد میکند، اما منبعیابی ChatGPT کاربرپسندتر است. Gemini امکان صادرات گزارشها به Google Docs را فراهم میکند، اما رابط کاربری تحقیق عمیق ChatGPT اساساً فقط یک نوار بارگیری است.
لحن گزارش به طور قابل توجهی متفاوت است، گزارشهای Gemini شبیه مقالات آکادمیک و گزارشهای ChatGPT شبیه پستهای انجمن هستند.
تولید تصویر: یک مقایسه بصری
تولید تصویر یکی دیگر از ویژگیهای اصلی چتباتهای هوش مصنوعی است. تستها بر روی تصاویر فوتورئالیستی و تصاویر پیچیده متمرکز هستند.
در تولید تصویر فوتورئالیستی، Gemini تصاویر را به سرعت و از نظر بصری جذاب تولید میکند، اگرچه ممکن است حاوی خطا باشد.
برای تصاویر پیچیده، کمیک Gemini معمولاً ناهماهنگ است، در حالی که کمیک ChatGPT به تحقق هدف خود نزدیکتر میشود.
در تولید نمودارهای فنی، ChatGPT نمودارهای بسیار دقیقی تولید میکند که قدرت آن را تثبیت میکند.
تولید ویدئو: یک زمینه در حال شکوفایی
تولید ویدئوی هوش مصنوعی یک ویژگی فزاینده جریان اصلی است. Gemini دارای ابزار فیلمساز Flow، مدل تولید ویدئوی Veo 3 و انیماتور هوش مصنوعی Whisk است. توانایی آن در تولید ویدیوهایی با صدا، آن را از تولید ویدئوی Sora ChatGPT متمایز میکند، اگرچه انحصاری برای مشترکین AI Ultra است.
Veo 3 یک جهش بزرگ رو به جلو را نشان میدهد، اما نیاز به کالیبراسیون دقیق Prompt دارد. هر نسل به 150 اعتبار نیاز دارد (12500 اعتبار در ماه با AI Ultra).
Flow به شما امکان میدهد کلیپهای ویدئویی را کوتاه کنید و آنها را بر اساسPromptهای جدید گسترش دهید. با اعتبارات کافی، میتوان یک فیلم را به طور کامل با Flow ساخت.
Whisk، ابزار انیمیشن هوش مصنوعی Google، به کاربران اجازه میدهد تصاویر را آپلود کنند. نتایج میتواند سرگرمکننده باشد اما دارای خطاها و اعوجاج است.
تجزیه و تحلیل فایل: درک محتوای بارگذاری شده
Gemini میتواند فایلهای آپلود شده را تجزیه و تحلیل و درک کند، از رزومهها انتقاد کند، تصاویر را تفسیر کند یا متن را ترجمه کند.
در تشخیص تصویر، چتباتها بر روی توانایی خود در شناسایی اجزای یک تصویر آپلود شده آزمایش میشوند. ChatGPT میتواند حجم بیشتری از جزئیات را شامل شود.
برای پردازش اسناد، چتباتها وظیفه دارند به سؤالات بر اساس اسناد آپلود شده پاسخ دهند. Gemini و ChatGPT هر دو پاسخهای درستی ارائه میدهند، اما هنگام بارگذاری فایلها باید احتیاط کرد. پردازش فایلها در ChatGPT میتواند نسبت به Gemini کمی برتری داشته باشد، اما این حاشیه کمی است.
نوشتن خلاقانه: تولید شعر
چتباتهای هوش مصنوعی میتوانند در نوشتن خلاقانه، از جمله جوکها، مونولوگها و اشعار کمک کنند.
هنگامی که وظیفه نوشتن یک شعر آزاد به ChatGPT داده میشود، از دستورالعملها دقیقتر پیروی میکند. شعر Gemini از علامتگذاری استفاده نمیکند، در حالی که شعر Copilot با شکستن خطوط خود احساس کمبود میکند.
استدلال پیچیده: سؤالات امتحانی
استدلال پیچیده با ارائه سؤالات امتحانی مقطع کارشناسی علوم کامپیوتر، ریاضیات و فیزیک به چتباتها آزمایش میشود.
چتباتها بسیار خوب عمل میکنند و به طور موثر به تمام سؤالات فیزیک پاسخ میدهند. ChatGPT کمترین پاسخ نادرست را در کل برمیگرداند.
Gemini در Chrome: ادغام یکپارچه
Chrome اکنون Gemini را یکپارچه میکند. دارندگان حساب پولی میتوانند روی نماد Gemini کلیک کنند تا یک پنجره چت باز کنند، مطابق معمول با Gemini تعامل داشته باشند و از محتوای برگه فعال درخواست کنند. ادغام Gemini در Chrome به کاربران امکان میدهد تا نیاز به باز کردن یک زبانه جدید برای پرسیدن چیزی از Gemini را از طریق عملکردی مشابه Copilot Vision در Edge حذف کنند، اگرچه عملکرد Live Gemini در رابط وب آن در دسترس نیست.
پاسخهای متنی به طرز چشمگیری سریع هستند. سرعت پاسخها باعث میشود که من فکر کنم Gemini قبل از اینکه شما آنها را با آن به اشتراک بگذارید، به نوعی به صفحات وب دسترسی دارد.
اگرچه Gemini در Chrome محدودیتهایی دارد. Gemini نمیتواند فیلمها را درک کند و پاسخها با Live به اندازه متن فوری نیستند، اما در کل مفید است زیرا نیاز به کپی و پیست را از بین میبرد. با این حال، مگر اینکه مدام از Gemini استفاده کنید، زمانی که با یک کلیک از آن دور باشید، ممکن است تفاوت چندانی نداشته باشد. عملکرد Live نیز به همین ترتیب مفید است و به من این امکان را میدهد که در مورد آنچه که به آن نگاه میکنم سؤال بپرسم بدون اینکه نیازی به دست زدن به صفحه کلید داشته باشم.
Gemini در Chrome محدودیتهایی در مورد آنچه که میتواند ببیند و درک کند دارد. در نتیجه، Gemini میتواند احساس کند متجاوز است. Gemini میتواند به سؤالات مربوط به برگههای خاص پس از اشتراکگذاری آنها ببیند و پاسخ دهد.
ادغام برنامههای Google: بهرهوری پیشرفته
مشترکین طرح AI Pro ویژگیهای هوش مصنوعی را در برنامههای Google، از جمله Calendar، Docs، Drive، Gmail، Maps، Keep، Photos، Sheets و YouTube Music دریافت میکنند.
Google ادغامها را در سایت خود Gemini برجسته میکند. میتوانید رویدادهایی را بر اساس یک Flyers به Google Calendar اضافه کنید، لیستهای خرید را در Google Keep تولید کنید یا به Gemini اجازه دهید لیستهای پخش را در YouTube Music سرپرستی کند. Gemini در Docs، Gmail، Sheets و Slides عملکرد Copilot را در برنامههای Microsoft 365 منعکس میکند و اسلایدها را بر اساس Prompt، پیشنویس ایمیلها، تولید متن و پیشنهاد فرمولها ایجاد میکند.
Gemini در Gmail برجسته است و دسترسی کامل به سابقه ایمیل شما را به Gemini میدهد و به آن اجازه میدهد تا اطلاعات خاص را جستجو کند یا مشاوره تمیز کردن صندوق ورودی را ارائه دهد. با این حال، این یک ویژگی تمام عیار نیست. Gemini نمیتواند همه کارها را انجام دهد. این ادغام حس تجاوز به حریم خصوصی را دارد.
بسته به میزانی که از ادغامهای موجود Gemini استفاده میکنید. ممکن است مواردی وجود داشته باشد که نیازهای خاص شما را برآورده نکند. با این حال، به دلیل تعدد ویژگیها ممکن است مفید باشد.
Gems: متخصصان هوش مصنوعی سفارشی
Gems نسخههای سفارشی Gemini هستند که برای اهداف خاص طراحی شدهاند. مربیان میتوانند فایلها را اضافه کنند و یک Gem PC Builder برای کمک به سازندگان رایانه برای اولین بار ایجاد کنند.
پاسخها با صحبت کردن با Gemini کمی متفاوت است. کسانی که قصد دارند با Gemini در مورد یک موضوع مشخص صحبت کنند، میتوانند یک Gem ایجاد کنند. با این حال، Gems احساس نمیکند که واقعاً وعده Google را محقق میکند.
ایمنی و حریم خصوصی
Gemini آگاه نیست و نمیتواند مانند یک انسان فکر کند یا چیزها را درک کند.
محتوای بزرگسالان، فعالیتهای غیرقانونی، تصاویر واقعی از افراد و موضوعات تابو برخلاف سیاستهای Gemini است، Gemini در سیستم فیلترینگ خود سهلانگارترین است.
Gemini دارای یک پنجره متن است. پنجره متن Gemini در طرح AI Pro خود میتواند حداکثر 1500 صفحه متن یا 30000 خط کد را به طور همزمان با پرداخت مدیریت کند. اگر از نسخه رایگان به طور گسترده استفاده شود، ممکن است مشترکین با موانعی روبرو شوند.
Google هنگام استفاده از Gemini داده جمعآوری میکند، از جمله فایلها، اطلاعات مکانی، استفاده از محصول و چتها. این دادهها برای بهبود محصولات Google و فناوریهای یادگیری ماشینی استفاده میشوند.
کاربران میتوانند فعالیت برنامههای Gemini را خاموش کنند. به طور پیش فرض، Google دادههای چت را به مدت 18 ماه ذخیره میکند.
در مورد ادغام Google Workspace Gemini، مانند Gmail، Docs، Drive، Sheets و Slides، Google قول میدهد که از مدلهای آموزش دیده استفاده نکند، آن را نفروشد یا از آن برای تبلیغات هدفمند استفاده نکند.
Google در گذشته با مشکلاتی از جمله بازیگران مخربی که از نقصهای Google chrome سوء استفاده کردهاند، تنظیمکنندههای ایتالیایی که از Google به دلیل روشهای دادهای خود یاد کردهاند و جمعآوری دادهها بدون رضایت منجر به از دست دادن میلیاردها دلار شده است، مواجه شده است. بنابراین، توصیه میشود دادههای حساس را به اشتراک نگذارید.