Nhìn thoáng qua về tương lai: Nghiên cứu năm 2023 của PYMNTS
Gần hai năm trước, một báo cáo của PYMNTS Intelligence đã dự đoán trước tầm ảnh hưởng ngày càng tăng của công nghệ giọng nói đối với hành vi của người tiêu dùng. Nghiên cứu này nhấn mạnh tiềm năng của nó trong việc cách mạng hóa các hoạt động hàng ngày, và thậm chí hỗ trợ trong các trường hợp khẩn cấp. Quan điểm hướng tới tương lai này hoàn toàn phù hợp với việc Amazon ra mắt Alexa+, một phiên bản cải tiến của trợ lý giọng nói nổi tiếng của hãng, giờ đây được tăng cường với trí tuệ nhân tạo (GenAI) tạo sinh. Bản nâng cấp quan trọng này được thiết kế để nâng cao trí thông minh và khả năng phản hồi của Alexa, mở khóa các khả năng nâng cao như đặt hàng tạp hóa được sắp xếp hợp lý, đặt dịch vụ dễ dàng và gửi tin nhắn đơn giản.
Alexa+: Mở ra kỷ nguyên mới của công nghệ giọng nói được hỗ trợ bởi AI
Được thúc đẩy bởi các mô hình Nova tiên tiến của Amazon và các công nghệ AI phức tạp khác, Alexa+ sẵn sàng định nghĩa lại trải nghiệm trợ lý giọng nói. Nó trực tiếp giải quyết dự đoán của nghiên cứu rằng công nghệ giọng nói sẽ biến đổi thành một công cụ được tích hợp sâu hơn và hiệu quả hơn cho người tiêu dùng. Như dữ liệu của PYMNTS đã nhấn mạnh, người tiêu dùng ngày càng tìm kiếm công nghệ có khả năng xử lý các tác vụ phức tạp. Alexa+ chứng minh rõ ràng điều này, thay đổi cơ bản cách người dùng tương tác với trợ lý giọng nói.
Khả năng truy cập và giá cả: Thành viên Prime sẽ được truy cập miễn phí Alexa+, trong khi người dùng không phải Prime có thể đăng ký với mức phí hàng tháng là 19,99 đô la.
Cá nhân hóa nâng cao: Một tính năng nổi bật của Alexa+ là khả năng ghi nhớ và tận dụng các tương tác trong quá khứ, mở đường cho các phản hồi được cá nhân hóa cao.
Khả năng mở rộng: Ngoài khả năng cá nhân hóa, Alexa+ có thể điều hướng liền mạch các thư viện video, đọc to tài liệu một cách thành thạo và thực hiện một cách thành thạo một loạt các tác vụ khác.
Ra mắt dự kiến: Mặc dù gặp phải một số chậm trễ trong quá trình phát triển, Alexa+ dự kiến sẽ sớm ra mắt, hứa hẹn cho người dùng một bộ tính năng AI tiên tiến có thể truy cập thông qua các thiết bị hỗ trợ Alexa hiện có của họ.
Sự liên kết cộng hưởng với kết quả nghiên cứu của PYMNTS
Bản nâng cấp quan trọng này từ Amazon hài hòa một cách đáng kể với các xu hướng được chỉ ra trong nghiên cứu tháng 4 năm 2023 của PYMNTS. Nghiên cứu ban đầu, dựa trên một cuộc khảo sát toàn diện với 2.939 người tiêu dùng Hoa Kỳ, cho thấy rằng, trong khi các thiết bị thông minh và di động vẫn là trung tâm trong hệ sinh thái công nghệ tiêu dùng hiện đại, công nghệ giọng nói đang nhanh chóng trở thành bước tiến hóa tiếp theo.
Sự tiện lợi vô song của giọng nói: Nghiên cứu nhấn mạnh rằng, bất chấp sự phổ biến của giao diện màn hình cảm ứng, các thiết bị điều khiển bằng giọng nói mang lại mức độ tiện lợi vô song. Điều này đặc biệt rõ ràng trong các tình huống rảnh tay, chẳng hạn như khi lái xe hoặc làm nhiều việc cùng một lúc.
Trích dẫn từ báo cáo gốc: Báo cáo cho biết, “Tuy nhiên, biên giới tiếp theo đang đến gần, và gần hai phần ba người Mỹ đã sử dụng công nghệ mới nổi này trong năm qua. Sự tiến bộ này, tất nhiên, là công nghệ giọng nói.” Nó tiếp tục, “Người tiêu dùng muốn làm cho các thói quen hàng ngày trở nên thông minh, đơn giản và kết nối hơn, và các công nghệ giọng nói rảnh tay có thể phù hợp với hóa đơn. Người tiêu dùng đã có thể sử dụng công nghệ giọng nói để tìm thông tin, nhận dạng bản thân thông qua trợ lý giọng nói, hoặc tìm và đặt vé máy bay, cùng với các khả năng khác.”
Sự hấp dẫn ngày càng tăng của công nghệ giọng nói: Tìm hiểu sâu hơn
Báo cáo của PYMNTS tiết lộ rằng gần hai phần ba người Mỹ đã sử dụng công nghệ giọng nói trong năm trước đó. Các chất xúc tác chính thúc đẩy việc áp dụng này được xác định là tốc độ và sự tiện lợi. Một phần đáng kể người tiêu dùng nhận thấy các lệnh thoại về bản chất nhanh hơn và thân thiện với người dùng hơn so với việc gõ hoặc chạm trên màn hình.
Công nghệ giọng nói trong trường hợp khẩn cấp: Đáng chú ý, gần một nửa số người dùng được khảo sát thừa nhận tiện ích đặc biệt của công nghệ giọng nói trong các tình huống khẩn cấp, nơi hành động nhanh chóng là tối quan trọng. Những phát hiện này cho thấy mạnh mẽ rằng công nghệ giọng nói sở hữu một tiềm năng rộng lớn và phần lớn chưa được khai thác để hợp lý hóa và nâng cao các thói quen hàng ngày.
Kỳ vọng trong tương lai: Báo cáo cũng nhấn mạnh một thống kê hấp dẫn: 60% số người được hỏi bày tỏ niềm tin rằng trợ lý giọng nói cuối cùng sẽ đạt được mức độ khả năng và độ tin cậy ngang bằng với con người trong vòng năm năm tới.
Rào cản niềm tin: Mặc dù sự nhiệt tình đối với công nghệ giọng nói rõ ràng đang gia tăng, báo cáo thừa nhận rằng niềm tin vẫn là một trở ngại đáng kể. Chỉ một phần nhỏ người tiêu dùng hiện tin rằng trợ lý giọng nói sở hữu khả năng tương đương với con người, và nhiều người vẫn do dự giao phó cho họ những nhiệm vụ phức tạp.
Điều hướng những thách thức và nắm bắt tiềm năng
Bất chấp những thách thức còn tồn tại này, báo cáo tuyên bố rõ ràng rằng tiềm năng của công nghệ giọng nói là rất lớn. Người tiêu dùng ngày càng tiếp thu việc sử dụng trợ lý giọng nói cho một loạt các tác vụ khác nhau. Tuy nhiên, một sự cảnh giác rõ ràng vẫn tồn tại liên quan đến việc giao phó cho họ thông tin nhạy cảm hoặc các hoạt động phức tạp hơn. Báo cáo dự đoán rằng khi công nghệ giọng nói tiếp tục quỹ đạo cải tiến và trở nên ngày càng đáng tin cậy, sự gia tăng dần dần nhưng ổn định trong việc áp dụng của người tiêu dùng sẽ theo sau.
Thị trường trợ lý giọng nói cao cấp: Sự phân chia nhân khẩu học
Một điểm mấu chốt từ báo cáo của PYMNTS là sự sẵn sàng rõ rệt của các phân khúc nhân khẩu học cụ thể để đầu tư vào một trợ lý giọng nói đáng tin cậy và thông minh hơn. Những người trẻ tuổi, đặc biệt là thế hệ millennials, và người tiêu dùng có thu nhập cao hơn thể hiện xu hướng đầu tư vào các dịch vụ giọng nói cao cấp lớn hơn. Ngược lại, các thế hệ lớn tuổi và các nhóm thu nhập thấp hơn có xu hướng miễn cưỡng hơn trong việc đón nhận bước nhảy vọt công nghệ này.
Mở rộng các phát hiện cốt lõi: Một góc nhìn chi tiết hơn
Để cung cấp một sự hiểu biết toàn diện hơn về bối cảnh công nghệ giọng nói đang phát triển, hãy đi sâu hơn vào một số khía cạnh chính được nêu bật trong nghiên cứu của PYMNTS và sản phẩm Alexa+ của Amazon.
1. Sự phát triển của tương tác người dùng:
Sự chuyển đổi từ các tương tác chủ yếu dựa trên màn hình cảm ứng sang các giao diện điều khiển bằng giọng nói thể hiện một sự thay đổi mô hình đáng kể trong cách con người tương tác với công nghệ. Giọng nói cung cấp một cách giao tiếp tự nhiên và trực quan hơn, bắt chước cuộc trò chuyện của con người. Điều này đặc biệt thuận lợi trong các tình huống mà sự chú ý thị giác bị hạn chế hoặc tay đang bận. Alexa+ tìm cách tận dụng điều này bằng cách cung cấp một phong cách tương tác đàm thoại hơn và ít máy móc hơn.
2. Vai trò của trí tuệ nhân tạo:
AI tạo sinh là nền tảng cho các khả năng nâng cao của Alexa+. Nó cho phép trợ lý giọng nói vượt ra ngoài các tương tác lệnh-phản hồi đơn giản để hiểu rõ hơn về ý định và ngữ cảnh của người dùng. Điều này cho phép Alexa+ tham gia vào các cuộc đối thoại phức tạp hơn, dự đoán nhu cầu của người dùng và cung cấp các phản hồi phù hợp và được cá nhân hóa hơn. AI cũng tạo điều kiện cho việc tích hợp các tính năng mới, chẳng hạn như tìm kiếm thư viện video và đọc tài liệu, mở rộng phạm vi những gì trợ lý giọng nói có thể thựchiện.
3. Giải quyết sự thiếu hụt niềm tin:
Nghiên cứu của PYMNTS nhấn mạnh tầm quan trọng của niềm tin trong việc thúc đẩy việc áp dụng rộng rãi hơn công nghệ giọng nói. Người tiêu dùng cần cảm thấy tự tin rằng trợ lý giọng nói của họ an toàn, đáng tin cậy và có khả năng xử lý các yêu cầu của họ một cách chính xác và có trách nhiệm. Amazon đang giải quyết vấn đề này theo một số cách:
- Kiểm soát quyền riêng tư: Cung cấp cho người dùng quyền kiểm soát lớn hơn đối với dữ liệu và cài đặt quyền riêng tư của họ.
- Độ chính xác và độ tin cậy: Liên tục cải thiện độ chính xác của nhận dạng giọng nói và xử lý ngôn ngữ tự nhiên.
- Tính minh bạch: Minh bạch hơn về cách dữ liệu giọng nói được thu thập và sử dụng.
4. Tương lai của giọng nói trong các ngành dọc cụ thể:
Các ứng dụng tiềm năng của công nghệ giọng nói mở rộng ra ngoài lĩnh vực nhà thông minh và trợ lý cá nhân. Hãy xem xét những khả năng sau:
- Chăm sóc sức khỏe: Giám sát bệnh nhân hỗ trợ bằng giọng nói, nhắc nhở dùng thuốc và tư vấn sức khỏe từ xa.
- Ô tô: Điều khiển rảnh tay các chức năng của xe, điều hướng và hệ thống giải trí.
- Bán lẻ: Mua sắm kích hoạt bằng giọng nói, đề xuất được cá nhân hóa và tương tác dịch vụ khách hàng.
- Giáo dục: Các công cụ học tập dựa trên giọng nói, hướng dẫn tương tác và các ứng dụng học ngôn ngữ.
5. Bối cảnh cạnh tranh:
Amazon không đơn độc trong cuộc đua phát triển công nghệ giọng nói tiên tiến. Các công ty lớn khác, chẳng hạn như Google (với Google Assistant) và Apple (với Siri), cũng đang đầu tư mạnh vào lĩnh vực này. Sự cạnh tranh này đang thúc đẩy sự đổi mới và vượt qua các ranh giới của những gì có thể với công nghệ giọng nói. Người hưởng lợi cuối cùng của cuộc cạnh tranh này là người tiêu dùng, những người sẽ có quyền truy cập vào các trợ lý giọng nói ngày càng tinh vi và có khả năng.
6. Tầm quan trọng của nhận thức ngữ cảnh:
Một trong những tiến bộ quan trọng trong công nghệ giọng nói là khả năng của trợ lý hiểu và phản hồi ngữ cảnh. Điều này có nghĩa là trợ lý có thể ghi nhớ các tương tác trước đó, hiểu tình huống hiện tại của người dùng và điều chỉnh phản hồi của nó cho phù hợp. Alexa+ tận dụng khả năng này để cung cấp trải nghiệm cá nhân hóa và trực quan hơn. Ví dụ: nếu bạn hỏi Alexa+ về thời tiết và sau đó hỏi “Còn ngày mai thì sao?”, nó sẽ hiểu rằng bạn vẫn đang đề cập đến thời tiết.
7. Thách thức của hỗ trợ đa ngôn ngữ:
Khi công nghệ giọng nói trở nên toàn cầu hơn, nhu cầu hỗ trợ đa ngôn ngữ mạnh mẽ trở nên ngày càng quan trọng. Trợ lý giọng nói cần có khả năng hiểu và phản hồi chính xác các ngôn ngữ và giọng khác nhau. Đây là một thách thức kỹ thuật phức tạp, nhưng là một thách thức cần thiết để được chấp nhận rộng rãi.
8. Các cân nhắc về đạo đức:
Khi công nghệ giọng nói trở nên phổ biến hơn, điều quan trọng là phải xem xét các tác động đạo đức. Chúng bao gồm:
- Quyền riêng tư: Bảo vệ dữ liệu người dùng và đảm bảo rằng các bản ghi âm giọng nói không bị lạm dụng.
- Thiên vị: Đảm bảo rằng trợ lý giọng nói không thiên vị đối với một số nhóm người nhất định.
- Khả năng truy cập: Làm cho công nghệ giọng nói có thể truy cập được đối với người khuyết tật.
- Mất việc làm: Xem xét tác động tiềm tàng của công nghệ giọng nói đối với việc làm.
9. Tích hợp với các công nghệ khác:
Công nghệ giọng nói không phải là một thực thể độc lập. Nó ngày càng được tích hợp với các công nghệ khác, chẳng hạn như Internet of Things (IoT), thực tế tăng cường (AR) và thực tế ảo (VR). Sự tích hợp này đang tạo ra những khả năng mới cho cách chúng ta tương tác với thế giới xung quanh. Ví dụ: bạn có thể sử dụng lệnh thoại để điều khiển các thiết bị nhà thông minh của mình, tương tác với các đối tượng ảo trong môi trường AR hoặc điều hướng một thế giới ảo trong VR.
10. Tầm nhìn dài hạn:
Tầm nhìn dài hạn cho công nghệ giọng nói là tạo ra những trợ lý thực sự thông minh có thể dự đoán nhu cầu của chúng ta, hiểu cảm xúc của chúng ta và tích hợp liền mạch vào cuộc sống của chúng ta. Những trợ lý này sẽ có thể quản lý lịch trình của chúng ta, cung cấp cho chúng ta thông tin, giúp chúng ta thực hiện các nhiệm vụ và thậm chí cung cấp sự đồng hành. Mặc dù tầm nhìn này vẫn còn một chặng đường dài, nhưng những tiến bộ nhanh chóng trong AI và công nghệ giọng nói đang làm cho nó ngày càng trở nên hợp lý.
Việc báo cáo nhấn mạnh vào những người trẻ tuổi và những người có thu nhập cao hơn có xu hướng chấp nhận các dịch vụ giọng nói cao cấp hơn, nhấn mạnh một điểm quan trọng về phân khúc thị trường. Điều này làm nổi bật sự cần thiết của các sản phẩm và chiến lược giá phù hợp để phục vụ cho các nhóm người tiêu dùng khác nhau.