Cải Thiện Bộ Nhớ: Nâng Cấp Chung
Khả năng ghi nhớ thông tin cụ thể của người dùng, chẳng hạn như sở thích, mối quan tâm và chi tiết liên quan đến công việc của Gemini, không còn là đặc quyền riêng của người đăng ký Gemini Advanced. Tính năng này, ban đầu được giới thiệu vào tháng 11 năm ngoái, hiện đã có sẵn cho tất cả người dùng Gemini.
Cải tiến bộ nhớ này cho phép người dùng cung cấp cho Gemini thông tin chi tiết cụ thể về cuộc sống của họ. Đây có thể là bất cứ điều gì từ tên của bạn và tên các thành viên trong gia đình đến thông tin về một dự án cụ thể mà bạn đang thực hiện. Lợi ích chính của tính năng này là hiệu quả của nó. Bạn sẽ không còn cần phải nhập đi nhập lại cùng một thông tin. Điều này dẫn đến các phản hồi cá nhân hóa và phù hợp hơn từ Gemini.
Google đã cung cấp một số ví dụ để minh họa cách người dùng có thể tận dụng tính năng này:
- Tùy chọn Ngôn ngữ: Hướng dẫn Gemini sử dụng ngôn ngữ đơn giản, tránh biệt ngữ kỹ thuật.
- Hạn chế về Chế độ ăn uống: Thông báo cho Gemini về sở thích ăn kiêng của bạn, chẳng hạn như ăn chay, để tránh nhận được các đề xuất không phù hợp.
- Yêu cầu Dịch thuật: Yêu cầu Gemini bao gồm bản dịch bằng một ngôn ngữ cụ thể, như tiếng Tây Ban Nha, sau mỗi phản hồi.
- Lập kế hoạch Du lịch: Khi lập kế hoạch cho các chuyến đi, hãy yêu cầu Gemini bao gồm chi phí mỗi ngày trong các đề xuất của mình.
- Tùy chọn Lập trình: Chỉ định ngôn ngữ lập trình ưa thích của bạn, chẳng hạn như JavaScript, để đảm bảo các phản hồi liên quan đến code có liên quan.
- Kiểu Phản hồi: Cho biết bạn thích phản hồi ngắn gọn, súc tích.
Điều quan trọng cần lưu ý là mỗi phần thông tin đã lưu cần được thêm thủ công. Để thực hiện việc này, hãy điều hướng đến menu cài đặt và tìm tùy chọn ‘Thông tin đã lưu’. Phiên bản desktop dường như nhận được tính năng này trước tiên, nhưng cuối cùng nó sẽ có sẵn trên cả nền tảng ứng dụng desktop và mobile. Động thái này dân chủ hóa một tính năng mạnh mẽ, cho phép tất cả người dùng trải nghiệm tương tác AI được cá nhân hóa và hiệu quả hơn. Khả năng ghi nhớ ngữ cảnh biến Gemini từ một công cụ phản ứng thành một trợ lý chủ động, dự đoán nhu cầu của người dùng và hợp lý hóa các tương tác.
Gemini Live Có Thể ‘Nhìn’: Một Chiều Không Gian Mới Cho Người Dùng Cao Cấp
Tại Mobile World Congress gần đây, Google đã tiết lộ một sự bổ sung sáng tạo cho Gemini Live: khả năng ‘nhìn’. Chức năng này, dự kiến phát hành vào cuối tháng này, ban đầu sẽ dành riêng cho người dùng trả phí Gemini Advanced.
Tính năng ‘nhìn’ này hoạt động theo hai cách: nó có thể phân tích nội dung trên màn hình của bạn hoặc xử lý thông tin từ nguồn cấp dữ liệu video trực tiếp. Khi bạn mở Gemini, nút ‘Chia sẻ màn hình với Live’ sẽ khả dụng. Nhấn vào nút này sẽ hiển thị hai tùy chọn: chia sẻ màn hình hiện tại của bạn hoặc bắt đầu video trực tiếp. Điều này mở ra một thế giới khả năng, cho phép bạn đặt câu hỏi cho Gemini về môi trường xung quanh bạn hoặc về nội dung hiển thị trên màn hình điện thoại của bạn.
Hãy tưởng tượng bạn có thể hướng camera vào một vật thể và yêu cầu Gemini cung cấp thông tin về nó. Hoặc chia sẻ một tài liệu trên màn hình của bạn và nhận được phân tích và phản hồi ngay lập tức. Đây là sức mạnh của khả năng hình ảnh mới của Gemini Live.
Một video trình diễn đã giới thiệu các ứng dụng thực tế của tính năng này. Trong một tình huống, người dùng tìm kiếm các gợi ý trang phục dựa trên một chiếc quần được hiển thị trên màn hình. Gemini đã trả lời bằng một chiếc áo được đề xuất, sau đó là một gợi ý áo khoác theo yêu cầu tiếp theo. Một ví dụ khác làm nổi bật việc sử dụng video trực tiếp, trong đó người dùng yêu cầu Gemini hỗ trợ chọn màu men cho một chiếc bình mới tạo. Khi được hiển thị một loạt các tùy chọn có sẵn, Gemini đã xác định một cách ấn tượng ‘cái đầu tiên ở bên trái ở hàng thứ hai’, thể hiện sự hiểu biết đáng kể về ngữ cảnh và mối quan hệ không gian.
Khả năng nhập liệu bằng hình ảnh này nâng Gemini Live vượt ra ngoài các tương tác AI dựa trên văn bản và giọng nói truyền thống. Nó giới thiệu một chiều hướng hiểu biết mới, cho phép AI nhận thức và diễn giải thế giới vật chất. Điều này mở ra những khả năng thú vị cho các ứng dụng khác nhau, từ hỗ trợ thời gian thực với các công việc hàng ngày đến các tình huống giải quyết vấn đề phức tạp hơn. Khả năng phân tích thông tin hình ảnh trong thời gian thực định vị Gemini Live như một công cụ tiên tiến cho người dùng đang tìm kiếm trải nghiệm AI trực quan và tương tác hơn.
Ý nghĩa của những nâng cấp này là rất sâu rộng. Đối với người dùng miễn phí, tính năng bộ nhớ nâng cao mang lại mức độ cá nhân hóa trước đây chỉ dành cho người đăng ký cao cấp. Điều này có nghĩa là trải nghiệm AI phù hợp và hiệu quả hơn cho tất cả mọi người, bất kể trạng thái đăng ký của họ. Đối với người dùng Gemini Advanced, việc bổ sung khả năng hình ảnh cho Gemini Live thể hiện một bước tiến đáng kể trong tương tác AI. Khả năng ‘nhìn’ và hiểu thế giới vật chất mở ra một lĩnh vực khả năng mới, làm cho Gemini trở thành một công cụ mạnh mẽ và linh hoạt hơn.
Những cập nhật này nhấn mạnh cam kết của Google đối với việc cải tiến liên tục trong lĩnh vực trí tuệ nhân tạo. Bằng cách mở rộng quyền truy cập vào các tính năng nâng cao và giới thiệu các khả năng mới đột phá, Google đang củng cố vị trí của Gemini như một nền tảng AI hàng đầu. Việc tập trung vào cả cá nhân hóa và hiểu biết trực quan thể hiện sự hiểu biết rõ ràng về nhu cầu của người dùng và sự cống hiến để vượt qua các ranh giới của những gì có thể với AI.
Việc tích hợp bộ nhớ và tầm nhìn vào Gemini không chỉ là thêm các tính năng mới; đó là về việc thay đổi cơ bản cách người dùng tương tác với AI. Đó là về việc tạo ra một người bạn đồng hành AI trực quan hơn, nhạy bén hơn và cuối cùng là hữu ích hơn. Khi các tính năng này ra mắt và người dùng bắt đầu khám phá tiềm năng của chúng, chúng ta có thể mong đợi thấy nhiều ứng dụng sáng tạo hơn nữa xuất hiện, củng cố hơn nữa vai trò của Gemini trong việc định hình tương lai của AI.
Bộ nhớ nâng cao thúc đẩy một cuộc đối thoại liên tục, loại bỏ nhu cầu giải thích lặp đi lặp lại. Điều này tạo ra một tương tác tự nhiên và trôi chảy hơn, giống như trò chuyện với một trợ lý am hiểu, người nhớ các cuộc trò chuyện trong quá khứ. Mặt khác, khả năng ‘nhìn’ thu hẹp khoảng cách giữa thế giới kỹ thuật số và vật lý. Nó cho phép Gemini tương tác với môi trường của người dùng theo cách mà trước đây không thể tưởng tượng được, mở ra cánh cửa cho một loạt các ứng dụng thực tế.
Hãy xem xét tác động tiềm tàng đối với khả năng tiếp cận. Đối với những người khiếm thị, khả năng mô tả môi trường xung quanh của Gemini Live có thể mang tính biến đổi. Hoặc hãy tưởng tượng những lợi ích cho giáo dục, nơi học sinh có thể nhận được giải thích thời gian thực về các khái niệm trực quan phức tạp. Các khả năng là rất lớn và tiếp tục mở rộng khi công nghệ phát triển.
Hơn nữa, những tiến bộ này có khả năng thúc đẩy sự đổi mới hơn nữa trong ngành công nghiệp AI. Khi các công ty khác chứng kiến khả năng của Gemini, họ sẽ được thúc đẩy để phát triển các công nghệ cạnh tranh của riêng mình, dẫn đến sự tăng tốc nhanh chóng trong sự phát triển của AI nói chung. Bối cảnh cạnh tranh này cuối cùng mang lại lợi ích cho người dùng cuối, giảm chi phí và tăng khả năng tiếp cận các công cụ AI ngày càng tinh vi.
Sự phát triển của Gemini là một minh chứng cho sức mạnh của sự đổi mới liên tục và sự theo đuổi không ngừng để tạo ra AI thực sự hiểu và hỗ trợ người dùng theo những cách có ý nghĩa. Đó là một hành trình còn lâu mới kết thúc và chúng ta có thể mong đợi được thấy những phát triển thú vị hơn nữa trong những năm tới. Tương lai của AI đang được định hình bởi những tiến bộ này và Gemini chắc chắn đang đi đầu trong làn sóng biến đổi này.