人工智能聊天機器人不斷發展,現在許多都提供「深度研究」(Deep Research) 選項,讓它們可以代替你研究特定主題。這些機器人扮演著自主 AI 代理的角色,代表你在網上搜索,找到合適的在線資源,然後根據它們的發現向你提供詳細的報告。這樣做的目的是為了節省你親自瀏覽成百上千個網站的時間。
深度研究正迅速成為各種 AI 的一項強大功能。你可以在 OpenAI 的 ChatGPT、Google Gemini、Perplexity AI 甚至 xAI 的 Grok(稱之為 DeepSearch)中找到它。微軟推出了一種帶有兩個 AI 代理(Researcher 和 Analyst)的深度研究類型;但是,它們需要 Microsoft 365 Copilot 許可證,並需要企業版或商業版訂閱,因此尚未提供給普通的 Copilot 用戶。
這聽起來當然是一項有用且有幫助的技能。但是,當面臨這一挑戰時,不同的 AI 服務表現如何?為了回答這個問題,我嘗試了 ChatGPT、Gemini、Perplexity AI 和 Grok 的深度研究功能。我在每個服務中提交了相同的查詢,要求它們「探索電影和電視中對時間旅行的描繪方式,以及它反映了我們的價值觀、恐懼和慾望」。
以下是每種 AI 的研究模式的工作方式以及它們如何處理我的主題。
ChatGPT
OpenAI 的 ChatGPT 提供兩種不同的深度研究模式:完整版和輕量版。完整版提供詳細、深入的報告,但可能需要長達 30 分鐘的時間才能找到最佳來源並呈現其發現。輕量版提供更短、不那麼深入的報告,但通常只需幾分鐘即可完成。你可以使用哪一個以及可以提交多少個查詢取決於你的計劃。
ChatGPT Plus、Team 和 Edu 用戶每月獲得 25 個查詢(10 個完整版和 15 個輕量版),Enterprise 用戶獲得 10 個(全部為完整版),Pro 用戶獲得 250 個(125 個完整版和 125 個輕量版),免費用戶獲得 5 個(全部為輕量版)。一旦你達到完整版深度研究的限制,你的查詢將自動默認為輕量版。
無論你使用的是完整版還是輕量版,過程都是一樣的。你還可以使用適用於 Windows 或 macOS 的桌面應用程序。在提示符處鍵入或說出你的查詢,選擇深度研究按鈕,然後提交你的請求。如果完整版有效,請準備好等待一段時間才能獲得響應。如果輕量版正在運行,你就不必等待那麼久。
我將關於電影和電視中的時間旅行的查詢提交給完整版深度研究和輕量版 – 在第一種情況下使用我的 Plus 訂閱,在第二種情況下使用免費帳戶。兩者都使用了 GPT-4o 模型。兩者還要求我澄清我想要的分析類型,例如在主題方法或更歷史的方法之間做出決定,以及是否只包括經典電影和電視節目或現代電影和電視節目。
完整版花費了大約 17 分鐘來搜索網絡並編譯結果,但它提供了一份詳細、深入的報告,其中包含幾個示例和一個有用的電視節目和電影圖表。輕量版從開始到結束僅花費了大約 8 分鐘,但它提供了一份較短、不太深入的報告 – 完整報告的 Cliff’s Notes 版本。這兩份報告都解決了我的主題,而且讀起來很有趣,但完整版深度研究因其徹底性而獲得了認可。
Google Gemini
Gemini 的深度研究模式適用於訂閱者和免費用戶。訂閱者通常每天獲得 20 個查詢,但該數字可能會有所不同。免費用戶每月限制為 5 個查詢。
要啟用深度研究,請單擊左上角列出當前模型的下拉菜單。訂閱者可以在 2.0 Flash、2.5 Pro(實驗性)和深度研究與 2.5 Pro 之間進行選擇。免費用戶可以選擇 2.0 Flash 或深度研究。選擇所需的模型後,深度研究按鈕應顯示在提示符下。在提示符處鍵入你的問題,選擇深度研究按鈕(如果尚未突出顯示),然後提交你的請求。
在我提交了關於時間旅行的查詢後,Gemini 的深度研究快速生成了一個關於它計劃如何處理我的主題的提綱,我可以調整或按原樣批准它。我給了它一個讚,Gemini 開始在網絡上進行研究。
AI 讓我知道了每個步驟的進展情況,指示了它正在執行的事情、它正在查閱的網站以及報告的進展方式。整個過程大約花費了 10 分鐘。
由此產生的報告非常深入、徹底且冗長。我喜歡包含的包含所討論電影示例的表格。Gemini 的寫作風格比 ChatGPT 的寫作風格更學術,ChatGPT 的寫作風格不那麼正式,讀起來更有趣。但 Gemini 仍然證明值得完成這項任務。
Perplexity AI
Perplexity 的深度研究模式適用於付費訂閱者和免費用戶。Pro 訂閱者每天獲得多達 500 個查詢,而免費用戶每天收到五個查詢。在提示符處,鍵入你的問題,選擇「研究」按鈕,然後提交你的請求。
我讓 Perplexity 的研究模式咀嚼了相同的时间旅行主題。在這裡,AI 讓我知道了它的進展情況,告訴我它正在研究哪些特定的子主題以及它正在分析哪些網站。Perplexity 僅花費了大約五分鐘來編譯其發現並提交其報告。但是結果令人失望。
該報告本身比其他 AI 生成的報告要短得多。每個主題或元素只獲得了幾個段落,其中大部分都缺乏任何深入的分析。該報告作為快速閱讀還不錯。但它讓我想起了一個孩子交的家庭作業,這個孩子只是想在不花費太多時間和精力的情况下完成它。
Grok AI
xAI 的 Grok 3 提供了兩種深度研究模式:DeepSearch 和 DeeperSearch。DeepSearch 查看大量的在線資源,儘管並非所有資源都有用或可靠。此模式還可以非常快速地完成工作。DeeperSearch 是 DeepSearch 的升級版本,它利用更多高品質的資源,並且需要更長的時間才能運行,但通常會提供更深入的報告。
無論你選擇哪種模式,X Premium+ 訂閱者都可以享受無限數量的查詢,而免費和 Basic 用戶每天僅限 10 個 DeepSearch 查詢。
要嘗試此功能,請在 Grok 提示符處鍵入你的查詢,單擊 DeepSearch 的下載箭頭,然後選擇 DeepSearch 或 DeeperSearch。準備就緒後,提交你的請求。
我將相同的时间旅行查詢拋給了 Grok。在 DeepSearch 模式下,AI 僅花費了一分半鐘就完成了整個過程,創下了速度記錄。DeeperSearch 花費的時間稍長,為兩分半鐘。鑒於速度如此之快,我原本期望收到一份糟糕的報告。但是結果讓我感到驚訝。在這兩種模式下,Grok 提供的報告都很有趣且內容豐富,儘管很簡短。該研究列出了各種示例、一個有用的電視節目和電影表格以及一些巧妙的分析。一點也不差。
那麼,哪種 AI 表現最好呢?我不得不宣布 ChatGPT 為贏家。儘管它花費的時間最長,但它的報告是最徹底、深入、寫作最好且最有趣的。否則,如果你趕時間,Grok 絕對值得一試。當然,所有這些都只是基於一個查詢。對於其他主題,我可能會提名不同的冠軍。但是,下次你需要 AI 來處理你自己的深度研究類型時,這些結果仍然值得考慮。
現在,讓我們深入研究一下每個 AI 模型的具體差異,並探討它們在處理複雜研究任務時的獨特優勢和劣勢。我們將重點關注以下幾個關鍵方面:
- 信息來源的質量和多樣性: AI 是否能夠識別並利用來自各種可靠來源的信息?
- 分析的深度和洞察力: AI 是否僅僅是重複信息,還是能夠提供深刻的分析和有價值的見解?
- 報告的清晰度和可讀性: AI 生成的報告是否易於理解,邏輯清晰,並且結構良好?
- 處理時間和效率: AI 完成研究任務所需的時間是否合理,並且與其他模型相比如何?
通過對這些關鍵方面進行更詳細的評估,我們可以更好地了解每種 AI 模型的能力,並確定哪種模型最適合特定的研究需求。
ChatGPT的深度研究表現
首先,讓我們回顧一下 ChatGPT 在深度研究方面的表現。如前所述,ChatGPT 提供了兩種不同的深度研究模式:完整版和輕量版。完整版提供了更深入、更徹底的分析,但需要更長的時間才能完成。輕量版則更快,但深度和細節方面有所妥協。
在信息來源方面,ChatGPT 似乎能夠訪問各種在線資源,包括學術期刊、新聞文章、博客和網站。然而,在某些情況下,它可能會依賴不太可靠的來源,這可能會影響其報告的準確性和可信度。
在分析的深度和洞察力方面,ChatGPT 的完整版通常能夠提供深刻的分析和有價值的見解。它可以識別不同來源之間的關係,並提出有根據的論點。然而,輕量版往往缺乏這種深度,並且可能會提供更表面化的分析。
在報告的清晰度和可讀性方面,ChatGPT 通常能夠生成易於理解、邏輯清晰且結構良好的報告。然而,在某些情況下,它的寫作風格可能過於正式或學術,這可能會降低其吸引力。
在處理時間和效率方面,ChatGPT 的完整版需要相對較長的時間才能完成研究任務。這可能是由於其更徹底的分析和對更廣泛來源的依賴。輕量版則更快,但深度和細節方面有所妥協。
Google Gemini的深度研究表現
接下來,讓我們看看 Google Gemini 在深度研究方面的表現。Gemini 提供了對訂閱者和免費用戶都可用的深度研究模式。它允許用戶調整或批准 AI 處理主題的提綱。
在信息來源方面,Gemini 似乎能夠訪問與 ChatGPT 類似的各種在線資源。然而,它可能對某些來源的可靠性有更嚴格的篩選,這可能會提高其報告的準確性和可信度。
在分析的深度和洞察力方面,Gemini 的深度研究通常能夠提供深刻的分析和有價值的見解。它可以識別不同來源之間的關係,並提出有根據的論點。然而,它的寫作風格可能比 ChatGPT 更學術,這可能會降低其吸引力。
在報告的清晰度和可讀性方面,Gemini 通常能夠生成易於理解、邏輯清晰且結構良好的報告。然而,其學術風格可能會使一些讀者難以理解。
在處理時間和效率方面,Gemini 的深度研究通常比 ChatGPT 的完整版更快。這可能是由於其更高效的分析和對更精簡來源的依賴。
Perplexity AI的深度研究表現
現在,讓我們評估 Perplexity AI 在深度研究方面的表現。Perplexity 提供了對付費訂閱者和免費用戶都可用的深度研究模式。它會通知用戶它正在研究哪些特定的子主題以及它正在分析哪些網站。
在信息來源方面,Perplexity 似乎能夠訪問與 ChatGPT 和 Gemini 類似的各種在線資源。然而,它可能對某些來源的可靠性有更嚴格的篩選,這可能會提高其報告的準確性和可信度。
在分析的深度和洞察力方面,Perplexity 的深度研究通常缺乏深度和細節。它可能會提供更表面化的分析,並且可能無法識別不同來源之間的關係。
在報告的清晰度和可讀性方面,Perplexity 通常能夠生成易於理解、邏輯清晰且結構良好的報告。然而,其簡潔的性質可能會使其缺乏吸引力。
在處理時間和效率方面,Perplexity 的深度研究通常比 ChatGPT 和 Gemini 更快。這可能是由於其更高效的分析和對更精簡來源的依賴。
Grok AI的深度研究表現
最後,讓我們看看 Grok AI 在深度研究方面的表現。Grok 提供了兩種深度研究模式:DeepSearch 和 DeeperSearch。DeepSearch 查看大量的在線資源,而 DeeperSearch 利用更多高品質的資源,並且需要更長的時間才能運行。
在信息來源方面,Grok 的 DeepSearch 可能會依賴不太可靠的來源,這可能會影響其報告的準確性和可信度。DeeperSearch 則更加注重高品質的來源。
在分析的深度和洞察力方面,Grok 的深度研究通常能夠提供有趣且內容豐富的報告,儘管其篇幅較短。它可以識別不同來源之間的關係,並提出有根據的論點。
在報告的清晰度和可讀性方面,Grok 通常能夠生成易於理解、邏輯清晰且結構良好的報告。然而,其簡潔的性質可能會使其缺乏吸引力。
在處理時間和效率方面,Grok 的深度研究是所有模型中最快的。這可能是由於其更高效的分析和對更精簡來源的依賴。
總結
總而言之,每種 AI 模型在深度研究方面都有其獨特的優勢和劣勢。ChatGPT 提供了最徹底、最深入的分析,但需要最長的時間才能完成。Gemini 提供了與 ChatGPT 類似的分析,但具有更學術的寫作風格。Perplexity AI 更快,但缺乏深度和細節。Grok AI 是最快的,但可能會依賴不太可靠的來源。
最終,最適合您的 AI 模型將取決於您的特定研究需求。如果您需要最徹底、最深入的分析,並且不介意等待更長時間,那麼 ChatGPT 可能是最佳選擇。如果您需要更高效的分析,並且對細節的妥協是可以接受的,那麼 Gemini 或 Perplexity AI 可能是更好的選擇。如果您需要最快的分析,並且不介意依賴不太可靠的來源,那麼 Grok AI 可能是最佳選擇。