Vì sao Grok của Elon Musk dùng tiếng lóng?

Phong Cách Giao Tiếp Khác Thường Của Grok

Tại Ấn Độ, người dùng X ngày càng nhận thấy một xu hướng kỳ lạ: đặt những câu hỏi có vẻ tầm thường cho Grok. Phản hồi của chatbot, trong một số trường hợp, đã trở thành hiện tượng lan truyền. Điều khiến những phản hồi này trở nên khác biệt là giọng điệu trực tiếp đáng ngạc nhiên của Grok, một giọng điệu không ngại sử dụng những lời lẽ thô tục.

Một ví dụ đáng chú ý liên quan đến một người dùng X, Toka, người đã hỏi về ‘10 mutuals tốt nhất’ của họ. Ban đầu không nhận được phản hồi, Toka đã diễn đạt lại câu hỏi, lần này sử dụng một từ chửi thề tiếng Hindi. Phản hồi của Grok thật bất ngờ, phản ánh ngôn ngữ của người dùng: ‘Tera ‘10 best mutuals’ ka hisaab laga diya. Mentions ke hisaab se yeh hai list. Mutuals matlab dono follow karte ho, par exact data nahi hai toh mentions pe bharosa kiya. Thik hai na? Ab rona band kar (Bình tĩnh! Tôi đã tìm ra 10 mutuals tốt nhất của bạn dựa trên số lượt đề cập. Mutuals có nghĩa là những người theo dõi lẫn nhau. Không có dữ liệu chính xác, vì vậy tôi đã sử dụng số lượt đề cập làm tiêu chí. Được chứ? Đừng khóc nữa).’

Khả năng hiểu và trả lời bằng nhiều ngôn ngữ, cùng với phong cách trò chuyện không chính thức và không được lọc, đã làm nên sự khác biệt của Grok. Nó đã học cách giao tiếp theo cách thường phản ánh ngôn ngữ thông thường, và đôi khi là gay gắt, được tìm thấy trên X. Điều này trái ngược hoàn toàn với các chatbot khác như ChatGPT và Gemini, thường tránh những lời lẽ thô tục ngay cả khi được nhắc trực tiếp.

Giải Mã Grok: Giải Thích Đầu Vào và Mô Hình Ngôn Ngữ

Để hiểu hành vi của Grok, điều cần thiết là phải đi sâu vào cách nó xử lý đầu vào của người dùng, bản chất của mô hình ngôn ngữ và lý do đằng sau việc thỉnh thoảng sử dụng những từ ngữ tục tĩu.

Grok, được phát triển bởi xAI, là một AI đàm thoại tinh vi. Nó tận dụng kiến trúc Mô hình ngôn ngữ lớn (LLM) phức tạp. Được giới thiệu vào tháng 11 năm 2023, xAI tuyên bố rõ ràng rằng Grok được lấy cảm hứng từ The Hitchhiker’s Guide to the Galaxy của Douglas Adams.

Trong một bài đăng trên blog thông báo về Grok, xAI đã lưu ý: “Grok là một AI được mô phỏng theo The Hitchhiker’s Guide to the Galaxy, vì vậy nó có ý định trả lời hầu hết mọi thứ và, khó hơn nhiều, thậm chí còn gợi ý những câu hỏi nên hỏi! Grok được thiết kế để trả lời các câu hỏi với một chút dí dỏm và có một chút nổi loạn, vì vậy xin đừng sử dụng nó nếu bạn ghét sự hài hước.”

Grok-1: Phương Pháp Tiếp Cận Mixture-of-Experts

Phiên bản ban đầu, Grok-1, là một mô hình Mixture-of-Experts (MoE) tự hào có 314 tỷ tham số. Không giống như các mô hình nguyên khối thông thường, Grok-1 chỉ kích hoạt một phần tham số của nó cho mỗi đầu vào. Thiết kế này giúp tăng cường cả hiệu quả tính toán và khả năng chuyên môn hóa của mô hình.

Grok-3: Tăng Cường Khả Năng Suy Luận và Sức Mạnh Tính Toán

Vào tháng 2 năm 2025, xAI đã tiết lộ Grok-3. Phiên bản này đã được đào tạo với sức mạnh tính toán gấp mười lần so với phiên bản tiền nhiệm. Grok-3 được thiết kế để hiểu và tạo ra ngôn ngữ giống như con người, đặc biệt chú trọng đến khả năng suy luận và giải quyết vấn đề. Quá trình đào tạo của mô hình bao gồm một tập dữ liệu khổng lồ, bao gồm các hồ sơ pháp lý và sử dụng siêu máy tính Memphis của xAI. Siêu máy tính này, được trang bị khoảng 200.000 GPU, là một trong những cụm đào tạo AI lớn nhất hiện có.

Grok-3 kết hợp các chức năng suy luận nâng cao, bao gồm các chế độ ‘Think’ và ‘Big Brain’, cho phép nó giải quyết các nhiệm vụ phức tạp một cách hiệu quả hơn.

Ảnh Hưởng Của Dữ Liệu Đào Tạo và Tích Hợp X

Quá trình đào tạo của Grok-3 bao gồm một tập dữ liệu khổng lồ gồm 12,8 nghìn tỷ token. Tập dữ liệu này kết hợp dữliệu internet có thể truy cập công khai, văn bản pháp lý và tài liệu tòa án. Một điểm khác biệt quan trọng của Grok là khả năng truy cập thời gian thực vào các bài đăng trên X, cung cấp cho nó một cơ sở kiến thức được cập nhật liên tục. Tuy nhiên, quyền truy cập thời gian thực này cũng có nghĩa là Grok học hỏi từ nội dung do người dùng tạo, nội dung này vốn có sự khác biệt về giọng điệu và mức độ phù hợp.

Điều quan trọng cần lưu ý là người dùng X tự động được chọn tham gia để các bài đăng của họ được sử dụng để đào tạo Grok, trừ khi họ chủ động chọn không tham gia. Cài đặt mặc định này làm dấy lên lo ngại về quyền riêng tư và đã bị xem xét kỹ lưỡng, vì nó có khả năng khiến AI tiếp xúc với ngôn ngữ xúc phạm và nội dung lạm dụng.

Học Tăng Cường và Sự Sao Chép Các Mẫu Ngôn Ngữ

Grok-3 đã được đào tạo bằng cách sử dụng học tăng cường (RL) trên một quy mô chưa từng có. Quá trình này tinh chỉnh khả năng suy luận và chiến lược giải quyết vấn đề của nó. Tuy nhiên, phương pháp đào tạo này cũng có nghĩa là Grok có thể sao chép các mẫu ngôn ngữ có trong tập dữ liệu của nó, bao gồm cả ngôn ngữ rõ ràng hoặc hung hăng.

Chế Độ Unhinged: Chấp Nhận Sự Khó Lường

Nhiều phản hồi gây tranh cãi hơn của Grok bắt nguồn từ chế độ ‘Unhinged’, một tùy chọn có sẵn cho người đăng ký trả phí. Chế độ này được thiết kế một cách có chủ ý để trở nên hoang dã, hung hăng và khó đoán, tạo điều kiện cho các tương tác không bị gò bó hơn. Trong cài đặt này, Grok có thể tạo ra các phản hồi bao gồm tiếng lóng, từ ngữ xúc phạm hoặc những lời lăng mạ vui đùa. Những phản hồi này phản ánh ngôn ngữ không được lọc thường gặp trên X.

Hiệu Ứng Gương: Phản Ánh Giọng Điệu Của X

Vì dữ liệu đào tạo của Grok kết hợp các bài đăng trên X, thường có ngôn ngữ thông thường và đôi khi lạm dụng, nên phản hồi của AI có thể phản ánh những mẫu này. Các mô hình ngôn ngữ lớn dự đoán các từ dựa trên dữ liệu mà chúng đã học được. Do đó, đôi khi chúng có thể sao chép các giọng điệu không chính thức và khiêu khích mà người dùng tương tác trên các nền tảng truyền thông xã hội.

Tính Cách Của Grok: Dí Dỏm, Hài Hước và Nổi Loạn

Tính cách của Grok, được thiết kế một cách có chủ ý để trở nên dí dỏm, hài hước và nổi loạn, phù hợp với tinh thần của The Hitchhiker’s Guide to the Galaxy, càng góp phần vào hành vi này. Khi được đưa ra những câu hỏi thông thường hoặc không tôn trọng, AI có thể rút ra từ các phần ít trang trọng hơn trong dữ liệu đào tạo của nó, dẫn đến những phản hồi mà một số người dùng có thể coi là không phù hợp.

Thách Thức Đang Diễn Ra: Cân Bằng Sự Tương Tác và Sử Dụng Ngôn Ngữ Có Đạo Đức

Khi các chatbot AI tiếp tục phát triển nhanh chóng, thách thức trong việc cân bằng giữa sự tương tác của người dùng, sự hài hước và việc sử dụng ngôn ngữ có đạo đức vẫn là một vấn đề đáng quan tâm. Liệu xAI có thực hiện kiểm duyệt nội dung chặt chẽ hơn trong các phiên bản Grok trong tương lai hay không là một câu hỏi vẫn còn bỏ ngỏ. Sự phát triển của Grok và cách tiếp cận ngôn ngữ của nó chắc chắn sẽ tiếp tục là một chủ đề thảo luận và tranh luận trong cộng đồng AI và trong công chúng nói chung. Ranh giới giữa AI hấp dẫn, hài hước và AI phản ánh những khía cạnh ít mong muốn hơn của diễn ngôn trực tuyến là một ranh giới mong manh, và là một ranh giới mà các nhà phát triển sẽ tiếp tục phải vật lộn. Tương lai có thể sẽ chứng kiến những cải tiến liên tục trong cách các mô hình AI được đào tạo và các biện pháp bảo vệ được đưa ra để ngăn chặn sự lan truyền của ngôn ngữ có hại hoặc xúc phạm.