حافظه بهبودیافته: ارتقاء همگانی
توانایی جمینی برای حفظ اطلاعات خاص کاربر، مانند ترجیحات، علایق و جزئیات مربوط به کار، دیگر منحصر به مشترکین Gemini Advanced نیست. این ویژگی که در ابتدا در نوامبر گذشته معرفی شد، اکنون در دسترس همه کاربران جمینی قرار دارد.
این بهبود حافظه به کاربران اجازه میدهد تا جزئیات خاصی در مورد زندگی خود را به جمینی ارائه دهند. این میتواند شامل هر چیزی باشد، از نام شما و نام اعضای خانوادهتان گرفته تا اطلاعاتی در مورد یک پروژه خاص که روی آن کار میکنید. مزیت اصلی این ویژگی، کارایی آن است. دیگر نیازی به وارد کردن مکرر اطلاعات مشابه نخواهید داشت. این امر منجر به پاسخهای شخصیتر و مرتبطتر از سوی جمینی میشود.
گوگل چندین مثال برای نشان دادن نحوه استفاده کاربران از این ویژگی ارائه کرده است:
- ترجیحات زبان: به جمینی دستور دهید که از زبان ساده استفاده کند و از اصطلاحات فنی اجتناب کند.
- محدودیتهای غذایی: جمینی را در مورد ترجیحات غذایی خود، مانند گیاهخوار بودن، مطلع کنید تا از دریافت پیشنهادات نامناسب جلوگیری کنید.
- الزامات ترجمه: درخواست کنید که جمینی بعد از هر پاسخ، ترجمه را به زبان خاصی مانند اسپانیایی اضافه کند.
- برنامهریزی سفر: هنگام برنامهریزی سفر، از جمینی بخواهید هزینه هر روز را در پیشنهادات خود لحاظ کند.
- ترجیحات کدنویسی: زبان کدنویسی مورد علاقه خود، مانند JavaScript، را مشخص کنید تا از دریافت پاسخهای مرتبط با کد اطمینان حاصل کنید.
- سبک پاسخ: ترجیح خود را برای پاسخهای کوتاه و مختصر مشخص کنید.
توجه به این نکته ضروری است که هر بخش از اطلاعات ذخیره شده باید به صورت دستی اضافه شود. برای انجام این کار، به منوی تنظیمات بروید و گزینه ‘Saved info’ را پیدا کنید. به نظر میرسد نسخه دسکتاپ ابتدا این ویژگی را دریافت میکند، اما در نهایت در هر دو پلتفرم دسکتاپ و برنامه تلفن همراه در دسترس خواهد بود. این حرکت یک ویژگی قدرتمند را دموکراتیزه میکند و به همه کاربران اجازه میدهد تا تعامل هوش مصنوعی شخصیتر و کارآمدتری را تجربه کنند. توانایی به خاطر سپردن زمینه، جمینی را از یک ابزار واکنشی به یک دستیار فعال تبدیل میکند که نیازهای کاربر را پیشبینی میکند و تعاملات را ساده میکند.
جمینی لایو بینایی کسب میکند: بعدی جدید برای کاربران ممتاز
در کنگره جهانی موبایل اخیر، گوگل از افزونهای نوآورانه به Gemini Live رونمایی کرد: توانایی ‘دیدن’. این قابلیت که قرار است اواخر این ماه منتشر شود، در ابتدا منحصر به کاربران پولی Gemini Advanced خواهد بود.
این ویژگی ‘دیدن’ به دو صورت عمل میکند: میتواند محتوای روی صفحه نمایش شما را تجزیه و تحلیل کند یا اطلاعات را از یک فید ویدیویی زنده پردازش کند. هنگامی که جمینی را باز میکنید، دکمه ‘Share screen with Live’ در دسترس خواهد بود. با ضربه زدن روی این دکمه، دو گزینه ارائه میشود: اشتراکگذاری صفحه فعلی یا شروع یک ویدیوی زنده. این امر دنیایی از احتمالات را باز میکند و به شما امکان میدهد از جمینی در مورد محیط اطراف خود یا محتوای نمایش داده شده در صفحه تلفن خود سؤال بپرسید.
تصور کنید که میتوانید دوربین خود را به سمت یک شیء بگیرید و از جمینی اطلاعاتی در مورد آن بخواهید. یا یک سند را روی صفحه نمایش خود به اشتراک بگذارید و تجزیه و تحلیل و بازخورد فوری دریافت کنید. این قدرت قابلیتهای بصری جدید Gemini Live است.
یک ویدیوی نمایشی، کاربردهای عملی این ویژگی را به نمایش گذاشت. در یک سناریو، کاربری بر اساس یک شلوار نمایش داده شده روی صفحه، پیشنهاداتی برای لباس درخواست کرد. جمینی با یک تاپ پیشنهادی پاسخ داد و به دنبال آن، پس از درخواست بیشتر، یک ژاکت پیشنهاد کرد. مثال دیگری استفاده از ویدیوی زنده را برجسته کرد، جایی که کاربری از جمینی برای انتخاب رنگ لعاب برای گلدانی که تازه ساخته شده بود، کمک خواست. هنگامی که با نمایش گزینههای موجود مواجه شد، جمینی به طرز چشمگیری ‘اولی در سمت چپ در ردیف دوم’ را شناسایی کرد، که نشاندهنده درک قابل توجهی از زمینه و روابط فضایی است.
این قابلیت ورودی بصری، Gemini Live را فراتر از تعاملات هوش مصنوعی مبتنی بر متن و صدا ارتقا میدهد. این یک بعد جدید از درک را معرفی میکند و به هوش مصنوعی اجازه میدهد تا دنیای فیزیکی را درک و تفسیر کند. این امر امکانات هیجانانگیزی را برای کاربردهای مختلف، از کمک بیدرنگ به کارهای روزمره گرفته تا سناریوهای پیچیدهتر حل مسئله، باز میکند. توانایی تجزیه و تحلیل اطلاعات بصری در زمان واقعی، Gemini Live را به عنوان یک ابزار پیشرفته برای کاربرانی که به دنبال تجربه هوش مصنوعی بصریتر و تعاملیتر هستند، قرار میدهد.
پیامدهای این ارتقاها بسیار گسترده است. برای کاربران رایگان، ویژگی حافظه بهبودیافته، سطحی از شخصیسازی را به ارمغان میآورد که قبلاً برای مشترکین ممتاز محفوظ بود. این به معنای تجربه هوش مصنوعی متناسبتر و کارآمدتر برای همه، صرف نظر از وضعیت اشتراک آنها است. برای کاربران Gemini Advanced، افزودن قابلیتهای بصری به Gemini Live نشاندهنده یک جهش قابل توجه به جلو در تعامل هوش مصنوعی است. توانایی ‘دیدن’ و درک دنیای فیزیکی، قلمروی جدیدی از احتمالات را باز میکند و جمینی را به ابزاری قدرتمندتر و همهکارهتر تبدیل میکند.
این بهروزرسانیها بر تعهد گوگل به بهبود مستمر در زمینه هوش مصنوعی تأکید میکند. گوگل با گسترش دسترسی به ویژگیهای پیشرفته و معرفی قابلیتهای جدید و پیشگامانه، موقعیت جمینی را به عنوان یک پلتفرم هوش مصنوعی پیشرو تثبیت میکند. تمرکز بر شخصیسازی و درک بصری، نشاندهنده درک روشنی از نیازهای کاربر و تعهد به پیشبرد مرزهای آنچه با هوش مصنوعی ممکن است، میباشد.
ادغام حافظه و بینایی در جمینی فقط افزودن ویژگیهای جدید نیست. بلکه در مورد تغییر اساسی نحوه تعامل کاربران با هوش مصنوعی است. هدف ایجاد یک همراه هوش مصنوعی بصریتر، پاسخگوتر و در نهایت مفیدتر است. با عرضه این ویژگیها و شروع به کاوش پتانسیلهای آنها توسط کاربران، میتوان انتظار داشت که شاهد ظهور برنامههای نوآورانهتری باشیم که نقش جمینی را در شکلدهی آینده هوش مصنوعی بیشتر تثبیت میکند.
حافظه بهبودیافته، گفتگوی مستمری را تقویت میکند و نیاز به توضیحات تکراری را از بین میبرد. این امر تعاملی طبیعیتر و روانتر ایجاد میکند، شبیه به گفتگو با یک دستیار آگاه که مکالمات گذشته را به خاطر میآورد. از سوی دیگر، قابلیت ‘دیدن’، شکاف بین دنیای دیجیتال و فیزیکی را پر میکند. این به جمینی اجازه میدهد تا با محیط کاربر به گونهای که قبلاً غیرقابل تصور بود، درگیر شود و درها را به روی طیف گستردهای از کاربردهای عملی باز کند.
تأثیر بالقوه بر دسترسی را در نظر بگیرید. برای افراد دارای اختلالات بینایی، توانایی Gemini Live برای توصیف محیط اطراف میتواند متحول کننده باشد. یا مزایای آموزش را تصور کنید، جایی که دانشآموزان میتوانند توضیحات بیدرنگ مفاهیم بصری پیچیده را دریافت کنند. امکانات گسترده هستند و با تکامل فناوری به گسترش خود ادامه میدهند.
علاوه بر این، این پیشرفتها احتمالاً باعث نوآوری بیشتر در صنعت هوش مصنوعی میشود. همانطور که سایر شرکتها شاهد قابلیتهای جمینی هستند، برای توسعه فناوریهای رقیب خود هدایت میشوند که منجر به شتاب سریع در توسعه هوش مصنوعی به عنوان یک کل میشود. این چشمانداز رقابتی در نهایت به نفع کاربر نهایی است و باعث کاهش هزینهها و افزایش دسترسی به ابزارهای هوش مصنوعی به طور فزایندهای پیچیده میشود.
تکامل جمینی گواهی بر قدرت نوآوری مستمر و پیگیری بیوقفه ایجاد هوش مصنوعی است که واقعاً کاربران را به روشهای معنادار درک و به آنها کمک میکند. این سفری است که به پایان نرسیده است و میتوان انتظار داشت که شاهد پیشرفتهای هیجانانگیزتری در سالهای آینده باشیم. آینده هوش مصنوعی توسط این پیشرفتها شکل میگیرد و جمینی بدون شک در خط مقدم این موج تحولآفرین قرار دارد.