Gemini cải thiện Google Maps với hỏi đáp địa điểm

Bối cảnh kỹ thuật số không ngừng phát triển, với trí tuệ nhân tạo (AI) dần len lỏi vào cấu trúc tương tác trực tuyến hàng ngày của chúng ta. Google, một gã khổng lồ trong lĩnh vực này, tiếp tục đẩy xa các giới hạn bằng cách tích hợp mô hình AI tinh vi của mình, Gemini, vào các dịch vụ được sử dụng rộng rãi. Biểu hiện mới nhất của hướng đi chiến lược này liên quan đến sự kết hợp hấp dẫn giữa Gemini và Google Maps, hứa hẹn một cách trực quan và mang tính hội thoại hơn để người dùng thu thập thông tin về các địa điểm cụ thể. Sự phát triển này giới thiệu một phương pháp mới lạ để truy vấn chi tiết về các địa điểm trực tiếp trong giao diện bản đồ, có khả năng biến đổi cách chúng ta khám phá và hiểu về môi trường vật lý xung quanh qua lăng kính kỹ thuật số.

Giới thiệu Nhận thức Ngữ cảnh: Tính năng ‘Hỏi về địa điểm’

Trọng tâm của sự tích hợp này là một khả năng mới, có thể truy cập thông qua một yếu tố giao diện riêng biệt được gắn nhãn là chip ‘Ask about place‘ (Hỏi về địa điểm). Chip này xuất hiện trong giao diện Gemini khi AI được gọi trong lúc đang xem một địa điểm cụ thể trên Google Maps. Chức năng của nó đơn giản một cách thanh lịch nhưng mạnh mẽ: nó cho phép người dùng đặt câu hỏi bằng ngôn ngữ tự nhiên liên quan trực tiếp đến địa điểm hiện đang được hiển thị trên bản đồ của họ. Hãy tưởng tượng bạn đang đứng trước mặt tiền cửa hàng hoặc một địa danh kỹ thuật số và có một trợ lý AI sẵn sàng trả lời các câu hỏi cụ thể của bạn về nó.

Cơ chế hoạt động bao gồm việc gọi Gemini bằng phương pháp tiêu chuẩn trên thiết bị của bạn (có thể thông qua một ứng dụng chuyên dụng hoặc các phương tiện kích hoạt khác) sau khi chọn một điểm ưa thích—một nhà hàng, một cửa hàng, một bảo tàng, có lẽ là một công viên—trong ứng dụng Google Maps. Khi Gemini được kích hoạt, thường xuất hiện dưới dạng lớp phủ nhập liệu ở cuối màn hình, người dùng sẽ nhận thấy chip ‘Ask about place‘ đã đề cập ở trên. Việc chọn chip này sẽ chuyển thông tin ngữ cảnh một cách hiệu quả, cụ thể là một URL Maps chỉ định vị trí, đến mô hình Gemini. Bước quan trọng này trang bị cho Gemini ngữ cảnh cần thiết, cho phép nó hiểu chính xác vị trí mà các câu hỏi tiếp theo của người dùng đề cập đến.

Liên kết ngữ cảnh này cho phép người dùng vượt ra ngoài các thuật ngữ tìm kiếm chung chung và tham gia vào các truy vấn cụ thể hơn, mang tính hội thoại. Thay vì tìm kiếm thủ công qua các mô tả, đánh giá hoặc trang web bên ngoài, người dùng có thể trực tiếp hỏi Gemini các câu hỏi như:

  • ‘Thực đơn ở đây có những lựa chọn chay nào?’
  • ‘Bảo tàng này có lối đi cho người dùng xe lăn không?’
  • ‘Chuyến tham quan có hướng dẫn cuối cùng hôm nay bắt đầu lúc mấy giờ?’
  • ‘Cửa hàng đồ kim khí này có bán các thương hiệu sơn cụ thể không?’
  • ‘Quán cà phê này có cho phép chó vào khu vực sân ngoài trời không?’

Tham vọng rất rõ ràng: hợp lý hóa quy trình thu thập thông tin, làm cho nó nhanh hơn và mang tính hội thoại hơn so với các phương pháp tìm kiếm truyền thống trong môi trường Maps. Nó đại diện cho một sự chuyển dịch hướng tới việc tận dụng AI không chỉ để truy xuất kiến thức rộng mà còn để hỗ trợ nhận biết vị trí, rất cụ thể.

Trải nghiệm Người dùng: Khả năng và Giới hạn Hiện tại

Những khám phá ban đầu về tính năng non trẻ này cho thấy một trải nghiệm người dùng đầy hứa hẹn, mặc dù đang phát triển. Sự tích hợp tỏ ra hiệu quả nhất khi xử lý các doanh nghiệp được xác định rõ ràng và các điểm ưa thích cụ thể. Khi người dùng chọn một nhà hàng, cửa hàng hoặc điểm thu hút khách du lịch cụ thể, Gemini thể hiện khả năng đáng khen ngợi trong việc phân tích thông tin liên quan được liên kết với thực thể cụ thể đó.

Ví dụ, việc truy vấn về các món trong thực đơn tại một quán ăn được chỉ định đã cho kết quả tích cực. Trong một trường hợp thử nghiệm, Gemini đã xác định chính xác sự sẵn có của một món ăn cụ thể, souvlaki, tại một nhà hàng Địa Trung Hải địa phương. Hơn nữa, nó có khả năng cung cấp danh sách các món khác có trong thực đơn, thể hiện tiềm năng hỗ trợ đưa ra quyết định ăn uống trực tiếp trong giao diện bản đồ. Khả năng này vượt ra ngoài thực đơn; người dùng có thể hỏi về giờ hoạt động, sự sẵn có của các dịch vụ cụ thể (như gói quà hoặc giao hàng), hoặc thậm chí là không khí chung dựa trên dữ liệu tổng hợp.

Tuy nhiên, hệ thống hiện tại bộc lộ những hạn chế. Mức độ thành thạo của nó dường như giảm đi khi đối mặt với các truy vấn rộng hơn, ít xác định hơn. Việc hỏi về toàn bộ khu phố, quận hoặc các thành phố rộng lớn không mang lại các phản hồi có mục tiêu, theo ngữ cảnh tương tự. AI dường như được tối ưu hóa cho các vị trí chính xác thay vì các khu vực địa lý. Điều này cho thấy cơ chế cơ bản phụ thuộc nhiều vào dữ liệu có cấu trúc liên quan đến các danh sách cụ thể trên Maps.

Một hành vi khác được quan sát là xu hướng của Gemini quay trở lại Google Search tiêu chuẩn đối với một số loại câu hỏi nhất định. Điều này thường xảy ra với các truy vấn phức tạp hoặc tinh tế hơn mà có thể không có câu trả lời sẵn có, có cấu trúc trong hệ sinh thái dữ liệu Maps hoặc cơ sở kiến thức tức thời của AI. Mặc dù việc quay lại Search đảm bảo người dùng vẫn nhận được thông tin, nhưng nó nhấn mạnh rằng trải nghiệm hoàn toàn liền mạch, mang tính hội thoại chưa phổ biến trên tất cả các loại truy vấn. Nó hoạt động như một mạng lưới an toàn nhưng tạm thời phá vỡ luồng tương tác AI trực tiếp liên quan đến địa điểm cụ thể.

Bất chấp những hạn chế này, tính năng này thể hiện hiệu quả đáng ngạc nhiên trong phần lớn thời gian, đặc biệt đối với các câu hỏi đơn giản, dựa trên thực tế về các địa điểm đã được thiết lập. Tiềm năng tiết kiệm thời gian và công sức là rõ ràng. Thay vì điều hướng qua nhiều màn hình, đọc qua các bài đánh giá có thể dài dòng, hoặc thậm chí thực hiện một cuộc gọi điện thoại, người dùng thường có thể nhận được câu trả lời nhanh chóng thông qua một giao diện trò chuyện đơn giản, tất cả trong khi vẫn định hướng trực quan trong bản đồ. Yếu tố tiện lợi này có khả năng là một điểm thu hút lớn khi tính năng này trưởng thành.

Hãy xem xét các ứng dụng thực tế cho các tình huống khác nhau:

  • Lập kế hoạch Du lịch: Một khách du lịch khám phá một thành phố mới có thể nhanh chóng hỏi về phí vào cửa bảo tàng, thời lượng của một chuyến tham quan bằng thuyền phổ biến, hoặc cách tốt nhất để đến một địa danh bằng phương tiện công cộng, tất cả mà không cần rời khỏi chế độ xem bản đồ.
  • Mua sắm: Một người đang tìm kiếm một sản phẩm cụ thể có thể hỏi xem một cửa hàng gần đó có bán nó không, có khả năng tiết kiệm một chuyến đi không cần thiết. ‘Hiệu thuốc này có thuốc dị ứng cho trẻ em không?’
  • Ăn ngoài: Việc quyết định chọn nhà hàng có thể được hỗ trợ bằng cách hỏi về các lựa chọn ăn kiêng, chính sách đặt chỗ, hoặc mức độ thân thiện với trẻ em. ‘Quán ăn Ý này có lựa chọn mì ống không chứa gluten không?’
  • Khả năng tiếp cận: Người dùng có vấn đề về di chuyển có thể hỏi về đường dốc cho xe lăn, nhà vệ sinh dễ tiếp cận, hoặc sự sẵn có của thang máy tại các địa điểm.

Sự thành công phụ thuộc vào chất lượng và mức độ chi tiết của dữ liệu mà Google Maps sở hữu về mỗi địa điểm và khả năng của Gemini trong việc diễn giải câu hỏi và truy xuất thông tin liên quan một cách chính xác.

Triển khai theo Giai đoạn và Yêu cầu Kỹ thuật

Như thường lệ với các tính năng mới quan trọng từ các công ty công nghệ lớn, khả năng ‘Ask about place‘ hiện đang được triển khai theo giai đoạn. Điều này có nghĩa là nó chưa có sẵn cho tất cả người dùng Google Maps và Gemini. Quyền truy cập dường như đang dần được mở rộng, nhưng một số người dùng cố gắng sử dụng tính năng này có thể thấy rằng liên kết ngữ cảnh giữa Maps và Gemini không thiết lập được, hoặc chip ‘Ask about place‘ quan trọng đơn giản là không xuất hiện khi gọi Gemini từ bên trong Maps.

Cách tiếp cận theo giai đoạn này cho phép Google theo dõi hiệu suất, thu thập phản hồi của người dùng và giải quyết các vấn đề tiềm ẩn ở quy mô nhỏ hơn trước khi triển khai rộng rãi, toàn cầu. Điều đó cũng có nghĩa là trải nghiệm người dùng có thể thay đổi đáng kể trong giai đoạn đầu này. Cần có sự kiên nhẫn đối với những người háo hức muốn thử nhưng thấy nó không hoạt động trên thiết bị của họ.

Thú vị là, các quan sát sơ bộ cho thấy quyền truy cập vào tính năng này không nhất thiết yêu cầu đăng ký Gemini Advanced, gói AI cao cấp của Google. Các thử nghiệm thành công đã được báo cáo bởi những người dùng hoạt động trên phiên bản Gemini tiêu chuẩn, miễn phí. Điều này cho thấy ý định của Google là làm cho tích hợp cốt lõi này của Maps có thể truy cập rộng rãi, thay vì giữ nó như một đặc quyền cao cấp, điều này có thể thúc đẩy đáng kể tỷ lệ chấp nhận của nó một khi được triển khai đầy đủ.

Để có khả năng kích hoạt tính năng này, người dùng nên đảm bảo họ có các phiên bản tương đối mới của các ứng dụng cốt lõi liên quan. Dựa trên những phát hiện ban đầu, các phiên bản cần thiết dường như là:

  • Ứng dụng Google: Phiên bản 16.10.40 trở lên
  • Ứng dụng Gemini: Phiên bản 1.0.686588308 trở lên
  • Ứng dụng Google Maps: Phiên bản 25.12.01 trở lên

Việc cập nhật các ứng dụng này thông qua cửa hàng ứng dụng liên quan là hành động tốt nhất cho người dùng hy vọng có quyền truy cập khi quá trình triển khai tiến triển. Điều quan trọng cần lưu ý là ngay cả với các phiên bản ứng dụng chính xác, các công tắc phía máy chủ thường kiểm soát tính khả dụng của tính năng, nghĩa là chỉ cập nhật thôi có thể không đảm bảo quyền truy cập ngay lập tức.

Sự phát triển liên tục và việc phát hành dần dần đòi hỏi sự quan sát tiếp tục. Tốc độ Google lặp lại dựa trên dữ liệu sử dụng ban đầu và phản hồi sẽ quyết định tính năng này sẽ sớm chuyển đổi từ một sự mới lạ đầy hứa hẹn thành một công cụ không thể thiếu để điều hướng và hiểu thế giới thông qua Google Maps như thế nào.

Ý nghĩa Rộng hơn: AI Tích hợp vào Điều hướng

Sự tích hợp Gemini vào Google Maps này không chỉ là một nút bấm mới; nó biểu thị một động thái chiến lược sâu sắc hơn của Google nhằm nhúng các khả năng AI của mình vào hệ sinh thái sản phẩm, làm cho chúng phù hợp hơn về mặt ngữ cảnh và hữu ích trong các tác vụ hàng ngày. Maps, là một trong những dịch vụ được sử dụng nhiều nhất của Google, cung cấp một nền tảng màu mỡ để chứng minh sức mạnh thực tế của AI hội thoại.

Bằng cách cho phép người dùng ‘nói chuyện’ với bản đồ về các địa điểm cụ thể, Google đang thay đổi cơ bản mô hình tương tác. Theo truyền thống, việc sử dụng ứng dụng bản đồ bao gồm tìm kiếm, di chuyển, thu phóng và đọc các bảng thông tin tĩnh hoặc đánh giá của người dùng. Mặc dù hiệu quả, quy trình này đôi khi có thể bị phân mảnh và đòi hỏi nỗ lực đáng kể của người dùng để tổng hợp thông tin từ các nguồn khác nhau. Việc tích hợp Gemini nhằm mục đích hợp nhất quy trình truy xuất thông tin này thành một luồng hội thoại duy nhất.

Động thái này có thể được xem là một phần trong nỗ lực rộng lớn hơn của Google nhằm cạnh tranh trong bối cảnh AI đang phát triển nhanh chóng. Bằng cách giới thiệu các ứng dụng hữu hình, hữu ích của Gemini trong các sản phẩm phổ biến, hiện có của mình, Google củng cố đề xuất giá trị của công nghệ AI của mình. Nó đưa AI từ một khái niệm trừu tượng hoặc một trải nghiệm chatbot riêng biệt thành một trợ lý thực tế được nhúng trong các quy trình làm việc quen thuộc.

Nhìn về phía trước, tiềm năng mở rộng là rất lớn. Các phiên bản tương lai có thể thấy Gemini xử lý các truy vấn phức tạp hơn, nhiều bước liên quan đến địa điểm. Hãy tưởng tượng việc hỏi: ‘Tìm cho tôi một nhà hàng hải sản được đánh giá cao gần nhà hát này mở cửa sau 10 giờ tối và nhận đặt chỗ cho hai người.’ Những truy vấn phức hợp như vậy hiện đang thách thức nhiều hệ thống nhưng đại diện cho sự tiến hóa hợp lý của sự tích hợp này.

Các khả năng khác bao gồm:

  • Tích hợp Hình ảnh: Kết hợp khả năng của Gemini với công nghệ Google Lens có thể cho phép người dùng hướng máy ảnh của họ vào một tòa nhà hoặc địa danh và đặt câu hỏi trực tiếp về nó.
  • Đề xuất Chủ động: Gemini có thể dự đoán nhu cầu của người dùng dựa trên vị trí, thời gian trong ngày hoặc hành vi trong quá khứ của họ, cung cấp thông tin hoặc đề xuất liên quan mà không cần nhắc nhở rõ ràng.
  • Khả năng Giao dịch: Tích hợp với các hệ thống đặt chỗ có thể cho phép người dùng đặt bàn nhà hàng, mua vé hoặc đặt dịch vụ trực tiếp thông qua cuộc trò chuyện Gemini trong Maps.
  • Dữ liệu Doanh nghiệp Nâng cao: Nhu cầu về phản hồi AI chính xác có thể khuyến khích các doanh nghiệp cung cấp dữ liệu chi tiết và có cấu trúc hơn cho Google Maps, cải thiện hệ sinh thái thông tin cho mọi người.

Tuy nhiên, sự phụ thuộc ngày càng tăng vào AI cho thông tin địa phương cũng đặt ra những cân nhắc về độ chính xác của dữ liệu, các thành kiến tiềm ẩn trong phản hồi của AI và các tác động về quyền riêng tư của việc kết hợp dữ liệu vị trí với các truy vấn hội thoại. Đảm bảo độ tin cậy và đáng tin cậy của thông tin do Gemini cung cấp sẽ là điều tối quan trọng đối với sự chấp nhận và hài lòng của người dùng.

Về bản chất, tính năng ‘Ask about place‘ là một bước đi sớm nhưng quan trọng hướng tới một tương lai nơi bản đồ kỹ thuật số không chỉ là những biểu diễn tĩnh của thế giới mà còn là các giao diện động, tương tác được cung cấp bởi các trợ lý thông minh, sẵn sàng trả lời các câu hỏi của chúng ta về những nơi xung quanh một cách tự nhiên, mang tính hội thoại. Nó định hình lại mối quan hệ giữa người dùng, bản đồ và kho thông tin khổng lồ mà Google nắm giữ về thế giới vật lý.