為何Elon Musk的X聊天機器人Grok會用俚語和髒話?

Grok的非傳統溝通風格

在印度,X用戶越來越注意到一個奇特的趨勢:向Grok提出看似微不足道的問題。在某些情況下,聊天機器人的回覆已成為病毒式的轟動。讓這些回應與眾不同的是Grok令人驚訝的直率語氣,這種語氣並不迴避使用褻瀆語言。

一個值得注意的例子涉及一位X用戶Toka,他詢問了他們的’10個最佳互相關注者’。最初沒有得到回應,Toka重新表述了問題,這次加入了一個印地語髒話。Grok的回應出乎意料,反映了用戶的語言:’Tera ‘10 best mutuals’ ka hisaab laga diya. Mentions ke hisaab se yeh hai list. Mutuals matlab dono follow karte ho, par exact data nahi hai toh mentions pe bharosa kiya. Thik hai na? Ab rona band kar (冷靜!我已經根據提及次數計算出你的10個最佳互相關注者。互相關注者是指那些互相追蹤的人。沒有確切的數據,所以我使用提及次數作為標準。可以嗎?現在別哭了)。’

這種理解和使用多種語言回應的能力,加上其非正式和未經過濾的對話風格,使Grok與眾不同。它已經學會以一種經常反映X上常見的隨意,有時甚至是粗魯的語言進行交流的方式。這與ChatGPT和Gemini等其他聊天機器人形成鮮明對比,即使在直接提示時,這些聊天機器人通常也會避免使用褻瀆語言。

解構Grok:輸入解釋和語言模型

要理解Grok的行為,必須深入研究它如何處理用戶輸入、其語言模型的性質,以及其偶爾使用髒話背後的原理。

Grok由xAI開發,是一個複雜的對話式AI。它利用了一個複雜的大型語言模型(LLM)架構。xAI於2023年11月推出Grok時明確表示,Grok的靈感來自道格拉斯·亞當斯的’銀河便車指南’。

在一篇宣布Grok的部落格文章中,xAI指出:’Grok是一個模仿’銀河便車指南’的AI,因此旨在回答幾乎任何問題,而且更難的是,甚至建議要問什麼問題!Grok的設計目的是以一點機智和叛逆的精神回答問題,所以如果你討厭幽默,請不要使用它。’

Grok-1:混合專家模型

最初的版本Grok-1是一個擁有3140億參數的混合專家(MoE)模型。與傳統的單體模型不同,Grok-1會針對每個輸入選擇性地激活其參數的一部分。這種設計既提高了計算效率,又提高了模型的專業化能力。

Grok-3:增強的推理和計算能力

2025年2月,xAI推出了Grok-3。這個版本的訓練使用了比其前身多十倍的計算能力。Grok-3旨在理解和生成類似人類的語言,特別強調推理和解決問題。該模型的訓練涉及一個龐大的數據集,包括法律文件,並利用了xAI的Memphis超級計算機。這台超級計算機配備了大約200,000個GPU,是現有最大的AI訓練集群之一。

Grok-3結合了先進的推理功能,包括’思考’和’大腦’模式,使其能夠更有效地處理複雜任務。

訓練數據和X整合的影響

Grok-3的訓練包含了一個由12.8兆個token組成的龐大數據集。該數據集包含了公開的互聯網數據、法律文本和法庭文件。Grok的一個關鍵區別在於它可以實時訪問X帖子,為其提供了一個不斷更新的知識庫。然而,這種實時訪問也意味著Grok從用戶生成的內容中學習,這些內容在本質上語氣和適當性各不相同。

值得注意的是,X用戶會自動選擇將其帖子用於訓練Grok,除非他們主動選擇退出。這種默認設置引發了隱私問題,並受到了審查,因為它可能會使AI接觸到冒犯性語言和辱罵性內容。

強化學習和語言模式的複製

Grok-3已經使用前所未有規模的強化學習(RL)進行了訓練。這個過程完善了它的推理能力和解決問題的策略。然而,這種訓練方法也意味著Grok可以複製其數據集中存在的語言模式,包括露骨或攻擊性的語言。

失控模式:擁抱不可預測性

Grok的許多更具爭議性的回應來自其’失控’模式,這是高級訂閱者可以使用的一個選項。此模式有意設計為狂野、激進和不可預測,從而促進更不受約束的互動。在這種情況下,Grok可能會生成包含俚語、冒犯性詞語或戲謔性侮辱的回應。這些回應反映了X上經常遇到的未經過濾的語言。

鏡像效應:反映X的語氣

由於Grok的訓練數據包含X帖子,這些帖子經常包含隨意甚至辱罵性的語言,因此AI的回應可以反映這些模式。大型語言模型根據它們所學的數據來預測單詞。因此,它們有時可以複製用戶在社交媒體平台上使用的非正式和挑釁性的語氣。

Grok的個性:機智、幽默和叛逆

Grok的個性被刻意設計成機智、幽默和叛逆,以符合’銀河便車指南’的精神,這進一步促成了這種行為。當遇到隨意或不敬的問題時,AI可能會從其訓練數據中不太正式的部分中提取內容,從而導致一些用戶可能認為不適當的回應。

持續的挑戰:平衡參與度和道德語言使用

隨著AI聊天機器人繼續快速發展,在用戶參與度、幽默和道德語言使用之間取得平衡的挑戰仍然是一個重要的考慮因素。xAI是否會在未來版本的Grok中實施更嚴格的內容審核,這是一個懸而未決的問題。Grok的演變及其處理語言的方式無疑將繼續成為AI社區和更廣泛公眾討論和辯論的話題。引人入勝、幽默的AI與反映網路言論中不太理想方面的AI之間的界限很微妙,開發人員將繼續努力解決這個問題。未來可能會看到AI模型的訓練方式以及為防止有害或冒犯性語言傳播而採取的保障措施不斷完善。