Ứng dụng Gemini của Google, kể từ tháng 5 năm 2025, cung cấp dịch vụ ở ba cấp độ khác nhau, đáp ứng nhu cầu đa dạng từ người dùng thông thường đến chuyên gia. Người dùng miễn phí có thể trải nghiệm một loạt các tính năng, trong khi thành viên Google AI Pro trả phí 19,99 đô la mỗi tháng sẽ mở khóa thêm nhiều tính năng nâng cao. Đối với những người dùng theo đuổi trải nghiệm tối ưu, gói đăng ký Google AI Ultra với giá 249,99 đô la mỗi tháng cung cấp tất cả các tính năng, bao gồm cả công nghệ tiên tiến.
Mô Hình Gemini: Động Lực Cốt Lõi
Trọng tâm của ứng dụng Gemini nằm ở mô hình mạnh mẽ của nó. Tất cả người dùng đều có thể "truy cập chung" vào mô hình 2.5 Flash, đây là mô hình mặc định hiện tại. Người dùng miễn phí có thể "truy cập hạn chế" vào Gemini 2.5 Pro (bản xem trước). Google cho biết mô hình này vẫn đang trong giai đoạn thử nghiệm và được thiết kế đặc biệt cho "suy luận, toán học và mã hóa", đồng thời chức năng Canvas sẽ được hưởng lợi từ nó.
Người đăng ký Google AI Pro sẽ nhận được "truy cập mở rộng" vào 2.5 Pro (bản xem trước). Google giải thích về các giới hạn của mô hình như sau:
Ứng dụng Gemini có nhiều giới hạn về lời nhắc và trò chuyện hơn đối với các mô hình cao cấp. Nếu bạn đạt đến giới hạn dung lượng của một mô hình cụ thể trong một khoảng thời gian nhất định, bạn có thể chuyển sang một mô hình khác cho đến khi bạn đạt đến giới hạn đó hoặc giới hạn dung lượng của bạn được làm mới. Người dùng Gemini có Google AI Pro hoặc Google AI Ultra có giới hạn dung lượng cao hơn đối với các mô hình cao cấp.
Google AI Ultra cung cấp quyền "truy cập cao nhất" vào 2.5 Pro (bản xem trước). Ngoài ra, người đăng ký Ultra sẽ nhận được chế độ Deep Think của 2.5 Pro trong "vài tuần tới", và Agent Mode là một tính năng khác sắp ra mắt.
Cửa Sổ Ngữ Cảnh: Độ Sâu Của Trí Nhớ
Cửa sổ ngữ cảnh xác định mô hình có thể ghi nhớ bao nhiêu thông tin, từ đó ảnh hưởng đến tính mạch lạc và chiều sâu của cuộc trò chuyện. Cửa sổ ngữ cảnh của gói miễn phí áp dụng cho tất cả các mô hình, với 32.000 tokens, tương đương khoảng 50 trang văn bản.
Người dùng Google AI Pro và AI Ultra có cửa sổ ngữ cảnh dài đáng kinh ngạc là 1 triệu tokens, tương đương 1.500 trang văn bản hoặc 30.000 dòng mã. Điều này có nghĩa là mô hình có thể hiểu lịch sử trò chuyện dài hơn, từ đó cung cấp các phản hồi phù hợp và chính xác hơn.
Tải Lên và Phân Tích Tệp: Mở Rộng Bộ Công Cụ Của Bạn
Người dùng miễn phí có thể tải tài liệu và slide lên ứng dụng Gemini để nhận tóm tắt, thông tin chi tiết và đặt câu hỏi. Các định dạng tệp được hỗ trợ bao gồm:
- Tệp tài liệu: DOC, DOCX, PDF, RTF, DOT, DOTX, HWP, HWPX
- Tệp được tạo bởi Google Docs
- Tệp văn bản thuần túy: TXT
- Tệp bản trình bày: PPTX
- Bản trình bày được tạo bởi Google Slides
Tuy nhiên, nếu bạn cần tải lên bảng tính và các tệp dữ liệu khác, đồng thời thực hiện phân tích và trực quan hóa (thông qua biểu đồ), bạn cần nâng cấp lên Google AI Pro hoặc AI Ultra.
- Tệp bảng tính: XLS, XLSX
- Bảng tính được tạo bởi Google Sheets
- Tệp dữ liệu bảng: CSV, TSV
Tương tự, chức năng tải lên thư mục mã và kho mã cũng yêu cầu đăng ký. Google nhấn mạnh rằng bạn có thể nhận được thông tin chi tiết từ hàng nghìn dòng mã, thực hiện các thay đổi thông minh, gỡ lỗi và tối ưu hóa mã để có hiệu suất tốt nhất.
- Các tệp mã bao gồm C, CPP, PY, JAVA, PHP, SQL và HTML
Tham Khảo Lịch Sử Trò Chuyện: Xây Dựng Các Cuộc Đối Thoại Liên Tục
Người dùng miễn phí có thể sử dụng tính năng "Thông tin đã lưu" để chỉ định tùy chọn trò chuyện cho mỗi cuộc trò chuyện (ví dụ: "Tôi là người ăn chay" hoặc "Giữ cho phản hồi ngắn gọn") mà không cần thêm hướng dẫn vào mỗi lời nhắc.
Google AI Pro và AI Ultra tiến xa hơn một bước, Gemini có thể xem lịch sử trò chuyện trước đây của bạn, từ đó cung cấp thông tin cho cuộc trò chuyện hiện tại. Để kích hoạt tính năng này, hãy "đề cập đến Chủ đề hoặc phạm vi thời gian của cuộc trò chuyện trước đây" và bạn có thể sử dụng tính năng này để tóm tắt các cuộc trò chuyện trước đây. Phần "Nguồn và nội dung liên quan" sẽ cho biết khi nào "cuộc trò chuyện trước đây" đã được sử dụng.
Nghiên Cứu Sâu: Khám Phá Ranh Giới Kiến Thức
Tính năng agent đầu tiên của Gemini cho phép người dùng đặt câu hỏi và nhận kế hoạch nghiên cứu đa điểm, họ có thể tùy chỉnh thêm kế hoạch đó. Sau khi được chấp thuận, Gemini sẽ tìm kiếm trên web, phân tích những gì tìm thấy và viết báo cáo. Tại I/O 2025, các tệp và hình ảnh có thể được tải lên Nghiên cứu sâu, kết hợp kiến thức người dùng và công khai để có kết quả cuối cùng.
- Người dùng miễn phí: "Truy cập hạn chế" vào Nghiên cứu sâu, hiện được hỗ trợ bởi Gemini 2.5 Flash
- Google AI Pro: "Truy cập mở rộng" bằng 2.5 Pro
- Google AI Ultra: "Truy cập cao nhất"
Tổng Quan Âm Thanh: Lắng Nghe Các Góc Độ Khác Nhau
- Người dùng miễn phí: Truy cập hạn chế
- Google AI Pro: Truy cập mở rộng
- Google AI Ultra: Truy cập cao nhất
Tạo Hình Ảnh: Tạo Ra Những Điều Kỳ Diệu Thị Giác
Tất cả người dùng đều có thể "truy cập chung" vào tạo hình ảnh, bao gồm cả việc tạo hình ảnh có người. Kể từ I/O 2025, ứng dụng Gemini sử dụng Imagen 4 để có chất lượng cao hơn, chi tiết phong phú hơn và văn bản/kiểu chữ tốt hơn.
Ngoài ra, còn có các tính năng chỉnh sửa hình ảnh gốc, bạn có thể tối ưu hóa hình ảnh thông qua lời nhắc bằng văn bản (bao gồm cả hình ảnh được tạo và hình ảnh bạn tải lên).
Tạo Video: Biến Trí Tưởng Tượng Thành Hiện Thực
- Người dùng miễn phí: Không khả dụng
- Google AI Pro: Tạo clip 8 giây 720p bằng Veo 2
- Google AI Ultra: Được hỗ trợ bởi Veo 3, các clip có âm thanh (hiệu ứng, tiếng ồn, v.v.)
Cả hai video đều sử dụng cùng một lời nhắc: "Ảnh chụp trên không từ một vách đá phủ đầy cỏ đến một bãi biển cát, sóng vỗ bờ, một cột đá biển nổi bật nhô lên từ mặt biển gần bãi biển, đắm mình trong ánh sáng vàng ấm áp của bình minh hoặc hoàng hôn, ghi lại sự thay đổi độ cao mạnh mẽ và vẻ đẹp thanh bình của bờ biển Thái Bình Dương."
Các Tính Năng Khác: Nhiều Khả Năng Hơn
Gems: Được sử dụng để xây dựng các phiên bản tùy chỉnh của Gemini để thực hiện các tác vụ cụ thể với các hướng dẫn được xác định trước. Có thể hiểu là robot AI tùy chỉnh, được trao cho một tính cách và khả năng cụ thể, và có thể hoàn thành các tác vụ cụ thể hiệu quả hơn. Ví dụ: tạo một Gemini dành riêng cho việc tạo bản sao tiếp thị hoặc một Gemini dành riêng cho việc gỡ lỗi mã. Gems làm cho ứng dụng AI được cá nhân hóa và chuyên nghiệp hơn.
Gemini Live
- Chia sẻ camera và màn hình. Tính năng này làm cho Gemini không chỉ là một công cụ văn bản mà còn có thể trở thành một trợ lý trực quan, giúp người dùng thực hiện các bài thuyết trình, giảng dạy hoặc làm việc cộng tác từ xa. Hãy tưởng tượng bạn có thể sử dụng Gemini Live để hiển thị bản thiết kế của mình cho đồng nghiệp và nghe phản hồi của họ trong thời gian thực; hoặc bạn có thể sử dụng Gemini Live để hướng dẫn từ xa cho gia đình cách sử dụng điện thoại thông minh.
Tóm lại, các tính năng và dịch vụ do Gemini cung cấp có thể đáp ứng nhu cầu của các loại người dùng khác nhau. Cho dù bạn là người dùng thông thường hy vọng trải nghiệm các tính năng cơ bản miễn phí hay một chuyên gia cần các công cụ mạnh mẽ để cải thiện hiệu quả công việc, bạn đều có thể tìm thấy giải pháp phù hợp cho mình trong Gemini . Với sự phát triển không ngừng của công nghệ, Gemini sẽ ra mắt nhiều tính năng mới thú vị hơn trong tương lai, hãy cùng chờ xem.