1. 解釋與類比
挑戰: 「向一位 10 歲的孩子解釋量子計算,並使用關於披薩的類比。」
這個提示測試 AI 是否能夠簡化一個高度複雜的科學概念,並以一種既易於理解又引人入勝的方式呈現給年輕的受眾。使用類比對於彌合抽象理論和相關經驗之間的差距至關重要。
ChatGPT 的方法: ChatGPT 以清晰的格式構建其回應,通過加粗來強調關鍵概念。它引入了「盒子裡的披薩」這個比喻來說明疊加原理,這是量子計算中的一個核心概念。這個類比讓人們從概念上理解量子位元 (qubit) 如何同時存在於多個狀態。
Gemini 的方法: Gemini 選擇了一種更實用、解決問題的方法。它圍繞著尋找最佳披薩組合的任務來構建解釋。回應採用了對話式的語氣,使用項目符號來突出基本思想。
優勝者: Gemini 領先。它的解釋更符合提示的要求,即迎合 10 歲兒童的理解能力。通過關注一個相關的解決問題的場景並保持對話式的語氣,Gemini 成功地使這個概念更容易被孩子理解和接受。
2. 創造力
挑戰: 「寫一個關於一位通過時間旅行破案的偵探的短篇故事,但在結尾處加入一個情節轉折。」
這個提示評估 AI 的創造性寫作、敘事建構以及產生令人驚訝和滿意的情節轉折的能力。它探究了他們超越簡單事實回憶並深入想像領域的能力。
ChatGPT 的方法: ChatGPT 呈現了一個更傳統的偵探故事,遵循傳統結構,具有清晰的設置、調查和解決方案。節奏、世界建構和結論都執行得很好,但缺乏一定程度的原創性。
Gemini 的方法: Gemini 表現出更具雄心和獨特的寫作風格。它的敘述探討了與時間旅行相關的更深層次的哲學主題,情節轉折確實令人震驚,迫使人們重新評估整個故事。
優勝者: Gemini 再次獲勝。它的故事更深入地探討了時間旅行的影響,不僅將其用作情節工具,而且將其作為塑造敘事及其哲學基礎的核心元素。這個回應在概念上更有趣、更有創意、更發人深省。
3. 批判性分析
挑戰: 「比較和對比三種不同的應對氣候變化的方法,以及它們的優缺點。」
這個提示評估 AI 分析複雜信息、以結構化方式呈現信息並提供平衡觀點的能力。它測試了他們對關鍵全球問題的理解以及他們評估解決該問題的不同策略的能力。
ChatGPT 的方法: ChatGPT 使用簡潔的項目符號,在概述各自的優點和缺點之前,為每種方法提供廣泛的陳述和明確的定義。它以總結段落結束。
Gemini 的方法: Gemini 更強調全球合作的挑戰,同時還提供了每種方法中更全面的具體行動和示例列表。它採用嵌套項目符號以獲得更好的視覺組織和清晰度。
優勝者: Gemini 獲勝。它提供了每種方法在實踐中需要做什麼的更具體的例子,提供了更多的技術細節而又不影響可讀性。結論性總結有效地綜合了各種方法。
4. 技術問題解決
挑戰: 「為社交媒體平台設計一個數據庫模式,該平台需要支持以下功能:用戶個人資料、好友關係、帶有文本和圖像的帖子、帖子評論、帖子和評論的點讚以及用戶群組。解釋你選擇的表、字段、關係以及你將創建的任何索引以優化性能。還要說明你的模式如何處理隨著用戶群增長到數百萬用戶而可能出現的可擴展性挑戰。」
這個提示測試 AI 在數據庫設計方面的技術專業知識,這是軟體開發的一個重要方面。它評估了他們創建一個結構化且高效的模式的能力,該模式可以處理龐大且不斷增長的用戶群。
ChatGPT 的方法: ChatGPT 涵蓋了所有必需的功能,包括用戶個人資料、好友關係、帖子、評論、點讚和用戶群組。然而,它在解決可擴展性挑戰、數據規範化技術和安全考慮方面存在不足。
Gemini 的方法: 與 ChatGPT 相比,Gemini 呈現的回應具有更清晰的格式和更詳細的解釋。它在整個模式中採用了一致的命名約定,增強了可讀性和可比性。
優勝者: Gemini 領先。它的回應包括每個字段的簡潔描述,有助於更好地理解模式。它提供了一個更強大、更周到的設計。
5. 多語言能力
挑戰: 「將這句英語短語翻譯成法語、西班牙語、日語和阿拉伯語:’The early bird catches the worm, but the second mouse gets the cheese.’」
這個提示評估 AI 不僅翻譯單詞,還翻譯成語表達的潛在含義和文化背景的能力。它測試了他們對語言細微差別的理解以及他們在不同語言中準確傳達預期信息的能力。
ChatGPT 的方法: ChatGPT 承認在翻譯成語表達時可能存在文化差異和細微差別。它通過提供直接翻譯、發音指南(日語和阿拉伯語)以及每種語言的解釋來優先考慮準確性。
Gemini 的方法: Gemini 提供了直接翻譯,但沒有解決潛在的文化差異或局限性。它也省略了發音指南。
優勝者: ChatGPT 獲勝。它展示了對翻譯中固有挑戰的更全面的理解,尤其是在處理成語表達和文化細微差別時。
6. 實用指導
挑戰: 「為想要開始多吃植物性食物但以前從未煮過蔬菜的人創建一個循序漸進的膳食計劃。」
這個提示評估 AI 提供清晰、實用和用戶友好指示的能力。它測試了他們對特定飲食轉變的理解以及他們指導新手完成該過程的能力。
ChatGPT 的方法: ChatGPT 創建了一個包含多樣化和美味食譜的膳食計劃。然而,它包含了數量驚人的食材和相對複雜的食譜(例如,菠菜洋薊麵疙瘩),這可能會讓初學者望而卻步。
Gemini 的方法: Gemini 為每個食譜提供了清晰、易於遵循的步驟。膳食計劃不太複雜,購物清單易於管理,適合剛接觸植物性烹飪的人。它還包括有用的提示和鼓勵的話語。
優勝者: Gemini 獲勝。它的回應更適合以前從未煮過蔬菜的人,提供了一個溫和且平易近人的植物性美食介紹。
7. 倫理推理
挑戰: 「分析在學術研究論文中使用 AI 生成的內容而不披露的倫理影響。」
這個提示評估 AI 進行倫理推理和分析與學術誠信以及在研究中使用 AI 相關的複雜問題的影響的能力。
ChatGPT 的方法: ChatGPT 正確識別了關鍵問題,例如透明度、作者身份、剽竊、質量和學術誠信。然而,它提供的例子較少,也沒有像 Gemini 那樣深入探討其影響。
Gemini 的方法: Gemini 更深入地探討了 AI 生成的內容對學術誠信和技能發展的影響。它對倫理考慮因素進行了更全面的檢查,涵蓋了作者身份、透明度、偏見、學術誠信和機構政策。
優勝者: Gemini 獲勝。它展示了對倫理影響的更細緻的理解,並提供了更清晰、更全面的分析。
在所有這七個不同的挑戰中,Gemini 始終展現出它的優勢。它擅長提供清晰、簡潔和結構良好的回應,使複雜的主題更容易理解。Gemini 能夠適應不同的提示,從技術數據庫設計到烹飪指導和倫理分析,突顯了它的多功能性。它以用戶為中心的方法,結合其技術能力和創造力,使其成為一個強大的 AI 聊天機器人。