مدلهای Gemini: موتور محرک
هسته اصلی برنامه Gemini، مدلهای قدرتمند آن است. همه کاربران میتوانند به صورت “دسترسی عمومی” از مدل 2.5 Flash استفاده کنند، که مدل پیشفرض فعلی است. کاربران رایگان میتوانند به صورت “دسترسی محدود” از Gemini 2.5 Pro (نسخه پیشنمایش) استفاده کنند. گوگل اعلام کرده است که این مدل که هنوز در حال آزمایش است، به طور خاص برای “استدلال، ریاضیات و کد” طراحی شده و قابلیت Canvas از آن بهرهمند خواهد شد.
مشترکین Google AI Pro “دسترسی گسترده” به 2.5 Pro (نسخه پیشنمایش) خواهند داشت. توضیحات گوگل در مورد محدودیتهای مدل به شرح زیر است:
برنامه Gemini محدودیتهای بیشتری برای اعلانها و چت برای مدلهای پیشرفته دارد. اگر در یک بازه زمانی مشخص به محدودیت ظرفیت یک مدل خاص رسیدید، میتوانید تا زمان رسیدن به آن محدودیت یا بازخوانی ظرفیت خود، به مدل دیگری переключиться. کاربران برنامه Gemini با Google AI Pro یا Google AI Ultra محدودیت ظرفیت بالاتری برای مدلهای پیشرفته دارند.
Google AI Ultra “بالاترین دسترسی” را به 2.5 Pro (نسخه پیشنمایش) ارائه میدهد. علاوه بر این، مشترکین Ultra در “هفتههای آینده” حالت Deep Think مدل 2.5 Pro را دریافت خواهند کرد و Agent Mode یکی دیگر از ویژگیهای آینده است.
پنجره متن: عمق حافظه
پنجره متن تعیین میکند که مدل چه مقدار اطلاعات را میتواند به خاطر بسپارد، که بر انسجام و عمق مکالمه تأثیر میگذارد. پنجره متن در سطح رایگان برای همه مدلها اعمال میشود و 32000 توکن است که تقریباً معادل 50 صفحه متن است.
کاربران Google AI Pro و AI Ultra پنجره متنی خیرهکننده 1 میلیون توکنی دارند که معادل 1500 صفحه متن یا 30000 خط کد است. این بدان معناست که مدل میتواند سابقه مکالمه طولانیتری را درک کند و در نتیجه پاسخهای مرتبطتر و دقیقتری ارائه دهد.
بارگذاری و تجزیه و تحلیل فایل: گسترش جعبه ابزار شما
کاربران رایگان میتوانند اسناد و اسلایدهای ارائه را در برنامه Gemini بارگذاری کنند تا خلاصهها و بینشها را دریافت کرده و سؤال بپرسند. فرمتهای فایل پشتیبانیشده عبارتند از:
- فایلهای سند: DOC، DOCX، PDF، RTF، DOT، DOTX، HWP، HWPX
- فایلهای ایجاد شده توسط Google Docs
- فایلهای متنی ساده: TXT
- فایلهای ارائه: PPTX
- ارائههای ایجاد شده توسط Google Slides
با این حال، برای بارگذاری صفحات گسترده و سایر فایلهای داده و انجام تجزیه و تحلیل و تجسم (از طریق نمودارها)، باید به Google AI Pro یا AI Ultra ارتقا دهید.
- فایلهای صفحه گسترده: XLS، XLSX
- صفحات گسترده ایجاد شده توسط Google Sheets
- فایلهای داده جدولی: CSV، TSV
به همین ترتیب، قابلیت بارگذاری پوشههای کد و مخازن کد نیز به اشتراک نیاز دارد. گوگل تأکید میکند که میتوانید از هزاران خط کد بینش کسب کنید، تغییرات هوشمندانه ایجاد کنید، اشکالات را برطرف کنید و کد را برای عملکرد بهینه بهینه کنید.
- فایلهای کد شامل C، CPP، PY، JAVA، PHP، SQL و HTML است
تاریخچه چت مرجع: ساخت مکالمات مداوم
کاربران رایگان میتوانند از ویژگی “اطلاعات ذخیره شده” برای تعیین تنظیمات برگزیده چت برای هر مکالمه (به عنوان مثال “من گیاهخوار هستم” یا “پاسخها را مختصر کنید”) بدون نیاز به افزودن دستورالعمل در هر اعلان استفاده کنند.
Google AI Pro و AI Ultra یک قدم فراتر میروند و Gemini میتواند سابقه چت گذشته شما را مشاهده کند و در نتیجه اطلاعاتی را برای مکالمه فعلی ارائه میدهد. برای فعال کردن این ویژگی، “به موضوع یا بازه زمانی چتهای قبلی اشاره کنید” و میتوان از این ویژگی برای خلاصه کردن چتهای قبلی استفاده کرد. در بخش “منابع و محتوای مرتبط” مشخص میشود که چه زمانی از “چت قبلی” استفاده شده است.
تحقیقات عمیق: کاوش در مرزهای دانش
اولین قابلیت عامل Gemini به کاربران اجازه میدهد تا سؤال بپرسند و یک برنامه تحقیقاتی چند نقطهای دریافت کنند که میتوانند آن را بیشتر سفارشی کنند. پس از تأیید، Gemini وب را جستجو میکند، یافتههای خود را تجزیه و تحلیل میکند و گزارشی مینویسد. در I/O 2025، فایلها و تصاویر را میتوان در تحقیقات عمیق بارگذاری کرد و دانش کاربر و دانش عمومی را برای به دست آوردن نتیجه نهایی ترکیب کرد.
- کاربران رایگان: “دسترسی محدود” به تحقیقات عمیق، که اکنون توسط Gemini 2.5 Flash پشتیبانی میشود
- Google AI Pro: “دسترسی گسترده” با استفاده از 2.5 Pro
- Google AI Ultra: “بالاترین دسترسی”
مرور کلی صدا: گوش دادن به دیدگاههای مختلف
- کاربران رایگان: دسترسی محدود
- Google AI Pro: دسترسی گسترده
- Google AI Ultra: بالاترین دسترسی
تولید تصویر: خلق شگفتیهای بصری
همه کاربران میتوانند به طور “عمومی” به تولید تصویر دسترسی داشته باشند، از جمله ایجاد تصاویری با افراد. از زمان I/O 2025، برنامه Gemini از Imagen 4 برای کیفیت بالاتر، جزئیات غنیتر و متن/طراحی بهتر استفاده میکند.
علاوه بر این، ویژگیهای ویرایش تصویر بومی وجود دارد که میتوانید با اعلانهای متنی تصاویر را بهینه کنید (از جمله تصاویر تولید شده و تصاویر بارگذاری شده شما).
تولید ویدیو: تبدیل تخیل به واقعیت
- کاربران رایگان: در دسترس نیست
- Google AI Pro: کلیپهای 8 ثانیهای 720p را با استفاده از Veo 2 تولید کنید
- Google AI Ultra: توسط Veo 3 پشتیبانی میشود، کلیپها دارای صدا هستند (جلوهها، نویز و غیره)
هر دو ویدیو از یک اعلان استفاده میکنند: “نمای هوایی از یک صخره پوشیده از چمن به سمت یک ساحل، امواج در ساحل میکوبند، یک ستون دریایی برجسته از سطح دریا در نزدیکی ساحل بالا میرود، غرق در درخشش گرم طلایی طلوع یا غروب خورشید، захватывающий تغییرات شدید ارتفاع و زیبایی آرام خط ساحلی اقیانوس آرام.”
سایر ویژگیها: احتمالات بیشتر
Gems: برای ساخت نسخههای سفارشی Gemini برای انجام وظایف خاص با دستورالعملهای از پیش تعیین شده استفاده میشود. میتوان آن را به عنوان رباتهای هوش مصنوعی سفارشی درک کرد که به شخصیت و تواناییهای خاصی مجهز شدهاند و میتوانند وظایف خاصی را به طور موثرتری انجام دهند. به عنوان مثال، Gemini را ایجاد کنید که مخصوص تولید متون بازاریابی است، یا Gemini که مخصوص اشکال زدایی کد است. Gems کاربرد هوش مصنوعی را شخصیتر و حرفهایتر میکند.
Gemini Live
- دوربین و اشتراکگذاری صفحه نمایش. این ویژگی Gemini را نه تنها به یک ابزار متنی، بلکه به یک دستیار بصری تبدیل میکند که به کاربران در ارائه از راه دور، آموزش یا کار مشترک کمک میکند. تصور کنید که میتوانید از طریق Gemini Live طرحهای خود را به همکاران نشان دهید و بازخورد آنها را در لحظه بشنوید. یا میتوانید از Gemini Live برای راهنمایی از راه دور اعضای خانواده در مورد نحوه استفاده از تلفن هوشمند استفاده کنید.
به طور خلاصه، ویژگیها و خدمات ارائه شده توسط Gemini میتواند نیازهای انواع مختلف کاربران را برآورده کند، خواه کاربر عادی باشید که مایل به تجربه رایگان عملکردهای اساسی هستید، یا یک متخصص که به ابزارهای قدرتمندی برای افزایش بهره وری نیاز دارد، میتوانید راه حل مناسب خود را در Gemini پیدا کنید. با پیشرفت مداوم فناوری، Gemini در آینده ویژگیهای جدید و هیجانانگیزتری را نیز ارائه میکند، بیایید منتظر بمانیم.