Kết quả bất ngờ khi thử nghiệm 5 trợ lý viết AI

Tôi gần đây đã tham gia vào một thử nghiệm viết AI do The Washington Post tổ chức, tham gia một hội đồng các chuyên gia truyền thông để đánh giá năm công cụ AI phổ biến. Phóng viên công nghệ Geoffrey Fowler đã đóng khung nó như một cách tiếp cận hiện đại đối với một cuộc thi nướng bánh truyền thống, thách thức chúng tôi đánh giá xem các công cụ AI này có thể xử lý năm loại email công việc và cá nhân đầy thách thức tốt như thế nào.

Tại Sao Email?

Fowler giải thích rằng viết email là ‘một trong những điều thực sự hữu ích đầu tiên mà AI có thể làm trong cuộc sống của bạn. Và các kỹ năng mà AI thể hiện trong việc soạn thảo email cũng áp dụng cho các loại nhiệm vụ viết khác.’

Các giám khảo đã đánh giá tổng cộng 150 email trong bài kiểm tra mù này. Mặc dù một công cụ AI đã nổi lên như người chiến thắng rõ ràng, thử nghiệm đã làm nổi bật cả những lợi ích tiềm năng và một hạn chế đáng kể của trợ lý viết và giao tiếp AI.

Trong quá trình đánh giá, chúng tôi không biết email nào được tạo bởi ChatGPT, Microsoft Copilot, Google Gemini, DeepSeek hoặc Claude của Anthropic. Fowler cũng bao gồm các email mà anh ấy đã tự viết, thách thức chúng tôi phân biệt giữa nội dung do AI tạo ra và nội dung do con người viết.

Trợ Lý Viết AI Hàng Đầu

Claude là người chiến thắng không thể tranh cãi.

Fowler lưu ý, ‘Trung bình, email của Claude tạo cảm giác giống con người hơn những email khác.’ Erica Dhawan, một giám khảo khác, nói thêm, ‘Claude sử dụng ngôn ngữ chính xác, tôn trọng mà không quá mang tính chất công ty hoặc thiếu tính cá nhân.’

DeepSeek đảm bảo vị trí thứ hai, tiếp theo là Gemini, ChatGPT và Copilot, xếp hạng cuối cùng. Mặc dù có sẵn rộng rãi trong Windows, Word và Outlook, các giám khảo nhận thấy rằng email của Copilot nghe quá nhân tạo. Theo Fowler, ‘Copilot bắt đầu tin nhắn với một số biến thể của ‘hy vọng bạn khỏe’ siêu chung chung trong ba trong số năm bài kiểm tra của chúng tôi.’

Mặc dù Claude đã chiến thắng trong cuộc thi tổng thể, tôi phát hiện ra rằng điểm số cá nhân của tôi cho thấy sự ưu tiên đối với các email do con người viết. Sự ưu tiên này nhấn mạnh một hạn chế cơ bản mà tất cả các trợ lý AI đều chia sẻ.

Fowler chỉ ra rằng các giám khảo không phải lúc nào cũng đồng ý về email nào là tốt nhất, nhưng họ đã hội tụ vào một vấn đề cốt lõi: tính xác thực. Anh nhấn mạnh rằng ‘Ngay cả khi AI ‘lịch sự’ về mặt kỹ thuật trong cách viết của nó, nó vẫn có thể bị con người coi là không chân thành.’

Bài học quan trọng của tôi từ thử nghiệm là các công cụ AI vượt trội trong việc phác thảo, cấu trúc các lập luận và đảm bảo sự rõ ràng. Tuy nhiên, chúng thường tạo ra các bài viết gượng gạo, quá trang trọng, máy móc và thiếu tính cá nhân, cảm xúc và sự đồng cảm.

Thách thức mà các trợ lý AI phải đối mặt với sự sáng tạo bắt nguồn từ kiến trúc cơ bản của các mô hình ngôn ngữ lớn. Các mô hình này được thiết kế để tạo ra nội dung với ‘sự mạch lạc cú pháp’, có nghĩa là xâu chuỗi các câu lại với nhau một cách tự nhiên và tuân thủ các quy tắc ngữ pháp. Tuy nhiên, như tất cả chúng ta đều biết, các quy tắc đôi khi được tạo ra để bị phá vỡ.

Người Phá Vỡ Quy Tắc: Steve Jobs

Năm 1997, Apple, dưới sự lãnh đạo của Steve Jobs, đã tung ra một trong những chiến dịch tiếp thị đáng nhớ nhất trong lịch sử. Vào thời điểm đó, công ty đang chao đảo trên bờ vực phá sản và rất cần một chiến dịch thu hút sự chú ý và phân biệt nó với các đối thủ cạnh tranh.

Quảng cáo truyền hình kết quả, nổi tiếng là ‘những kẻ điên’, có các bức chân dung đen trắng của những nhân vật nổi loạn và có tầm nhìn như Bob Dylan, John Lennon và Martin Luther King Jr. Chiến dịch này được ghi nhận rộng rãi với việc hồi sinh bản sắc thương hiệu của Apple và đóng một vai trò quan trọng trong sự phục hồi tài chính của công ty.

Nếu AI được giao nhiệm vụ tạo ra chiến dịch Apple, có lẽ nó đã không xảy ra.

Làm sao tôi có thể chắc chắn như vậy? Bởi vì chính Claude đã thừa nhận điều đó.

Claude thừa nhận rằng ‘Nếu được yêu cầu tạo ra một khẩu hiệu như chiến dịch nổi tiếng của Apple ở chế độ mặc định của tôi, tôi gần như chắc chắn sẽ viết ‘Hãy suy nghĩ khác’ thay vì ‘Hãy suy nghĩ khác biệt’. Huấn luyện của tôi nhấn mạnh tính chính xác về ngữ pháp. Dạng trạng từ thích hợp để sửa đổi động từ ‘suy nghĩ’ sẽ là ‘khác biệt’ và tôi sẽ có xu hướng tuân theo quy tắc đã được thiết lập này.’

Theo Claude, nó có thể phân tích lý do tại sao chiến dịch gây được tiếng vang sau thực tế. Tuy nhiên, ‘việc tạo ra loại nổi loạn ngữ pháp có chủ ý đó không đến với tôi một cách tự nhiên.’

AI thiếu một tinh thần nổi loạn đơn giản vì nó không phải là con người. Mặc dù một số bot AI có thể thành thạo hơn những bot khác trong việc mô phỏng các phẩm chất của con người trong cách viết của chúng, nhưng cuối cùng chúng thiếu giọng nói độc đáo được định hình bởi kinh nghiệm cá nhân và những hiểu biết sáng tạo xác định giao tiếp của con người.

AI nên được xem như một trợ lý hữu ích có thể hỗ trợ trong việc động não ý tưởng, làm rõ suy nghĩ, tóm tắt tài liệu, và thu thập và tổ chức thông tin. Đây đều là những nhiệm vụ thiết yếu và tốn thời gian. Tuy nhiên, mặc dù AI chắc chắn có thể tăng cường giao tiếp, nhưng nó không nên thay thế người giao tiếp là con người.

Khi ngày càng có nhiều người dựa vào trợ lý AI để soạn thảo email, sơ yếu lý lịch, bản ghi nhớ và bản trình bày, có một nguy cơ ngày càng tăng về sự đồng nhất, nơi các cá nhân bắt đầu nghe giống nhau. Các nhà tuyển dụng của công ty đã nhận thấy xu hướng này.

Mỗi cá nhân sở hữu một câu chuyện độc đáo và mạnh mẽ để chia sẻ. Điều cần thiết là không cho phép những tiếng nói nhân tạo làm lu mờ tiếng nói đích thực của một người.

Ví dụ, khi viết một email xin lỗi, AI có thể đưa ra một lời xin lỗi chuẩn mực, nhưng một người viết sẽ thêm những chi tiết cụ thể thể hiện sự hối tiếc thực sự và cam kết sửa chữa sai lầm. Hoặc khi viết một bài phát biểu chúc mừng, AI có thể tạo ra một bài phát biểu lịch sự, nhưng một người viết sẽ chèn những kỷ niệm cá nhân và những lời chúc chân thành khiến bài phát biểu trở nên đặc biệt và đáng nhớ hơn.

Hơn nữa, AI có thể gặp khó khăn trong việc hiểu và phản ứng với các sắc thái văn hóa và xã hội khác nhau. Điều gì được coi là phù hợp hoặc tôn trọng trong một nền văn hóa có thể không phù hợp hoặc thậm chí là xúc phạm ở một nền văn hóa khác. Người viết là con người có thể sử dụng trí thông minh cảm xúc và nhận thức văn hóa của họ để điều chỉnh phong cách giao tiếp của họ cho phù hợp với khán giả và bối cảnh cụ thể.

Cuối cùng, mặc dù AI có thể là một công cụ hữu ích cho việc viết, nhưng điều quan trọng là phải ghi nhớ những hạn chế của nó và sử dụng nó một cách thận trọng. Đừng để AI thay thế giọng nói và sự sáng tạo độc đáo của bạn. Sử dụng nó để tăng cường khả năng giao tiếp của bạn, không phải để thay thế nó.