AI深層研究対決:ChatGPT、Gemini等

AIチャットボットは進化を続け、現在では多くが特定のテーマについてユーザーに代わって調査を行う「深層研究」オプションを提供しています。これらのボットは、自律的なAIエージェントとして機能し、ユーザーの代わりにオンラインで検索を行い、適切なオンラインリソースを見つけ、その発見に基づいて詳細なレポートを提供します。これは、ユーザーが自分で何百ものウェブサイトを閲覧する時間を節約することを目的としています。

深層研究は急速に、さまざまなAIの強力な機能になりつつあります。OpenAIのChatGPT、Google Gemini、Perplexity AI、さらにはxAIのGrok(DeepSearchと呼ぶ)で見つけることができます。マイクロソフトは、2つのAIエージェント(ResearcherとAnalyst)を備えた深層研究タイプを導入しました。ただし、これらにはMicrosoft 365 Copilotライセンスが必要であり、エンタープライズ版またはビジネス版のサブスクリプションが必要なため、通常のCopilotユーザーはまだ利用できません。

これは確かに便利で役立つスキルに聞こえます。しかし、この課題に直面した場合、異なるAIサービスはどのように機能するのでしょうか?この質問に答えるために、ChatGPT、Gemini、Perplexity AI、Grokの深層研究機能を試してみました。私は各サービスに同じクエリを送信し、「映画やテレビにおけるタイムトラベルの描写方法、そしてそれが私たちの価値観、恐怖、欲望をどのように反映しているか」を調査するように依頼しました。

以下は、各AIの研究モードの仕組みと、私のテーマへの取り組み方です。

ChatGPT

OpenAIのChatGPTは、2つの異なる深層研究モードを提供しています。フルバージョンとライトバージョンです。フルバージョンは詳細で深いレポートを提供しますが、最適な情報源を見つけてその発見を提示するまでに最大30分かかる場合があります。ライトバージョンは、より短く、それほど深くはないレポートを提供しますが、通常は数分で完了します。どちらを使用できるか、および送信できるクエリの数は、プランによって異なります。

ChatGPT Plus、Team、Eduのユーザーは、毎月25個のクエリ(フルバージョン10個、ライトバージョン15個)を受け取ります。エンタープライズユーザーは10個(すべてフルバージョン)、Proユーザーは250個(フルバージョン125個、ライトバージョン125個)、無料ユーザーは5個(すべてライトバージョン)を受け取ります。フルバージョンの深層研究の制限に達すると、クエリは自動的にライトバージョンにデフォルト設定されます。

フルバージョンを使用しているかライトバージョンを使用しているかに関係なく、プロセスは同じです。WindowsまたはmacOS用のデスクトップアプリケーションを使用することもできます。プロンプトにクエリを入力または発話し、深層研究ボタンを選択して、リクエストを送信します。フルバージョンが有効な場合は、応答を得るまでしばらく待つ準備をしてください。ライトバージョンが実行されている場合は、それほど長く待つ必要はありません。

映画とテレビにおけるタイムトラベルに関するクエリを、フルバージョンの深層研究とライトバージョンに送信しました。前者の場合はPlusサブスクリプションを使用し、後者の場合は無料アカウントを使用しました。どちらもGPT-4oモデルを使用しました。どちらも、主題的なアプローチまたはより歴史的なアプローチの間で決定するなど、必要な分析の種類を明確にするように求められました。また、古典的な映画やテレビ番組のみを含めるか、現代の映画やテレビ番組のみを含めるかを尋ねられました。

フルバージョンは、ネットワークを検索して結果をまとめるのに約17分かかりましたが、いくつかの例と役立つテレビ番組と映画の図を含む、詳細で深いレポートを提供しました。ライトバージョンは、開始から終了まで約8分しかかかりませんでしたが、より短く、それほど深くはないレポートを提供しました。完全なレポートのクリフノートバージョンです。どちらのレポートも私のテーマに対処しており、読むのは面白かったですが、フルバージョンの深層研究はその徹底性で評価されました。

Google Gemini

Geminiの深層研究モードは、サブスクライバーと無料ユーザーの両方が利用できます。サブスクライバーは通常、1日に20個のクエリを受け取りますが、その数は異なる場合があります。無料ユーザーは、月に5個のクエリに制限されています。

深層研究を有効にするには、左上隅にある現在のモデルを一覧表示するドロップダウンメニューをクリックします。サブスクライバーは、2.0 Flash、2.5 Pro(実験的)、深層研究と2.5 Proの間で選択できます。無料ユーザーは、2.0 Flashまたは深層研究を選択できます。必要なモデルを選択すると、プロンプトの下に深層研究ボタンが表示されるはずです。プロンプトに質問を入力し、深層研究ボタンを選択して(まだ強調表示されていない場合)、リクエストを送信します。

タイムトラベルに関するクエリを送信した後、Geminiの深層研究は、私のテーマへの取り組み方に関するアウトラインを迅速に生成しました。これは、調整またはそのまま承認できます。私はそれに賛成票を与え、Geminiはネットワーク上で調査を開始しました。

AIは、実行しているアクション、参照しているWebサイト、レポートの進捗状況を示すことで、各ステップの進捗状況を知らせてくれました。プロセス全体には約10分かかりました。

生成されたレポートは非常に深く、徹底的で、冗長でした。議論された映画の例を含むテーブルが含まれているのが気に入りました。Geminiのライティングスタイルは、ChatGPTのライティングスタイルよりも学術的です。ChatGPTのライティングスタイルはそれほど形式的ではなく、読むのがより面白いです。しかし、Geminiはそれでもタスクを完了する価値があることを証明しました。

Perplexity AI

Perplexityの深層研究モードは、有料サブスクライバーと無料ユーザーの両方が利用できます。Proサブスクライバーは1日に最大500個のクエリを受け取りますが、無料ユーザーは1日に5個のクエリを受け取ります。プロンプトに質問を入力し、「研究」ボタンを選択して、リクエストを送信します。

Perplexityの研究モードに、同じタイムトラベルのテーマを咀嚼させました。ここで、AIは、調査している特定のサブトピックと、分析しているWebサイトを知らせることで、その進捗状況を知らせてくれました。Perplexityは、発見をまとめてレポートを提出するのに約5分しかかかりませんでした。しかし、結果は残念でした。

レポート自体は、他のAIが生成したレポートよりもはるかに短いです。各トピックまたは要素は数段落しか与えられず、そのほとんどは深い分析を欠いています。レポートは簡単な読書としては悪くありませんでした。しかし、それはあまり時間と労力を費やすことなくそれを完了しようとしている子供によって提出された宿題を思い出させました。

Grok AI

xAIのGrok 3は、DeepSearchとDeeperSearchの2つの深層研究モードを提供しています。DeepSearchは、大量のオンラインリソースを調べますが、すべてが有用または信頼できるとは限りません。このモードはまた、非常に迅速に完了することができます。DeeperSearchはDeepSearchのアップグレード版であり、より高品質のリソースを利用し、実行するのに時間がかかりますが、通常はより深いレポートを提供します。

どちらのモードを選択しても、X Premium+サブスクライバーは無制限のクエリを楽しむことができますが、無料およびベーシックユーザーは1日に10個のDeepSearchクエリに制限されています。

この機能を試すには、Grokプロンプトにクエリを入力し、DeepSearchのダウンロード矢印をクリックして、DeepSearchまたはDeeperSearchを選択します。準備ができたら、リクエストを送信します。

同じタイムトラベルクエリをGrokに投げかけました。DeepSearchモードでは、AIはプロセス全体をわずか1分半で完了し、速度記録を樹立しました。DeeperSearchは、2分半と少し時間がかかりました。速度が非常に速かったので、ひどいレポートを受け取ることを期待していました。しかし、結果は私を驚かせました。どちらのモードでも、Grokが提供するレポートは、簡潔ではありましたが、興味深く、有益でした。この調査では、さまざまな例、役立つテレビ番組と映画の表、そしていくつかの巧妙な分析がリストされました。少しも悪くありません。

では、どのAIが最も優れたパフォーマンスを発揮したのでしょうか?ChatGPTを勝者と宣言せざるを得ません。時間がかかるものの、そのレポートは最も徹底的で、深く、最もよく書かれており、最も面白かったです。そうでなければ、急いでいる場合は、Grokは間違いなく試してみる価値があります。もちろん、これらはすべて1つのクエリに基づいています。他のトピックについては、別のチャンピオンを指名するかもしれません。ただし、次にAIに独自の深層研究タイプを処理させる必要がある場合は、これらの結果を検討する価値があります。

さて、各AIモデルの具体的な違いをさらに深く掘り下げ、複雑な研究タスクを処理する際の独自の強みと弱みを検証してみましょう。次のようないくつかの重要な側面に焦点を当てます。

  • 情報源の質と多様性: AIは、さまざまな信頼できる情報源からの情報を識別して利用できますか?
  • 分析の深さと洞察力: AIは単に情報を繰り返すだけでなく、深い分析と価値のある洞察を提供できますか?
  • レポートの明瞭さと可読性: AIが生成するレポートは、理解しやすく、論理的に明確で、構造化されていますか?
  • 処理時間と効率: AIが研究タスクを完了するのに必要な時間は合理的であり、他のモデルと比較してどうですか?

これらの重要な側面をより詳細に評価することで、各AIモデルの能力をよりよく理解し、特定の研究ニーズに最適なモデルを判断できます。

まず、ChatGPTの深層研究におけるパフォーマンスを振り返ってみましょう。前述のように、ChatGPTは2つの異なる深層研究モードを提供します。フルバージョンとライトバージョンです。フルバージョンは、より深く、より徹底的な分析を提供しますが、完了するまでに時間がかかります。ライトバージョンはより高速ですが、深さと詳細が妥協されています。

情報源の面では、ChatGPTは学術雑誌、ニュース記事、ブログ、Webサイトなど、さまざまなオンラインリソースにアクセスできるようです。ただし、場合によっては、信頼性の低い情報源に依存する可能性があり、レポートの正確性と信頼性に影響を与える可能性があります。

分析の深さと洞察力の面では、ChatGPTのフルバージョンは通常、深い分析と価値のある洞察を提供できます。さまざまな情報源間の関係を識別し、根拠のある議論を提示できます。ただし、ライトバージョンはこの深さを欠いていることが多く、より表面的な分析を提供する可能性があります。

レポートの明瞭さと可読性の面では、ChatGPTは通常、理解しやすく、論理的に明確で、構造化されたレポートを生成できます。ただし、場合によっては、そのライティングスタイルが形式的または学術的すぎる可能性があり、その魅力を低下させる可能性があります。

処理時間と効率の面では、ChatGPTのフルバージョンは、研究タスクを完了するのに比較的長い時間が必要です。これは、より徹底的な分析と、より広範な情報源への依存による可能性があります。ライトバージョンはより高速ですが、深さと詳細が妥協されています。

次に、Google Geminiの深層研究におけるパフォーマンスを見てみましょう。Geminiは、サブスクライバーと無料ユーザーの両方が利用できる深層研究モードを提供します。これにより、ユーザーはAIのテーマへの取り組み方に関するアウトラインを調整または承認できます。

情報源の面では、GeminiはChatGPTと同様のさまざまなオンラインリソースにアクセスできるようです。ただし、一部の情報源の信頼性について、より厳格なスクリーニングを行っている可能性があり、レポートの正確性と信頼性が向上する可能性があります。

分析の深さと洞察力の面では、Geminiの深層研究は通常、深い分析と価値のある洞察を提供できます。さまざまな情報源間の関係を識別し、根拠のある議論を提示できます。ただし、そのライティングスタイルはChatGPTよりも学術的である可能性があり、その魅力を低下させる可能性があります。

レポートの明瞭さと可読性の面では、Geminiは通常、理解しやすく、論理的に明確で、構造化されたレポートを生成できます。ただし、その学術的なスタイルは、一部の読者にとって理解しにくい場合があります。

処理時間と効率の面では、Geminiの深層研究は通常、ChatGPTのフルバージョンよりも高速です。これは、より効率的な分析と、より合理化された情報源への依存による可能性があります。

次に、Perplexity AIの深層研究におけるパフォーマンスを評価してみましょう。Perplexityは、有料サブスクライバーと無料ユーザーの両方が利用できる深層研究モードを提供します。調査している特定のサブトピックと、分析しているWebサイトをユーザーに通知します。

情報源の面では、PerplexityはChatGPTやGeminiと同様のさまざまなオンラインリソースにアクセスできるようです。ただし、一部の情報源の信頼性について、より厳格なスクリーニングを行っている可能性があり、レポートの正確性と信頼性が向上する可能性があります。

分析の深さと洞察力の面では、Perplexityの深層研究は通常、深さと詳細が不足しています。より表面的な分析を提供する可能性があり、さまざまな情報源間の関係を識別できない可能性があります。

レポートの明瞭さと可読性の面では、Perplexityは通常、理解しやすく、論理的に明確で、構造化されたレポートを生成できます。ただし、その簡潔な性質は、その魅力を低下させる可能性があります。

処理時間と効率の面では、Perplexityの深層研究は通常、ChatGPTやGeminiよりも高速です。これは、より効率的な分析と、より合理化された情報源への依存による可能性があります。

最後に、Grok AIの深層研究におけるパフォーマンスを見てみましょう。Grokは、DeepSearchとDeeperSearchの2つの深層研究モードを提供します。DeepSearchは大量のオンラインリソースを調べますが、DeeperSearchはより高品質のリソースを利用し、完了するまでに時間がかかります。

情報源の面では、GrokのDeepSearchは信頼性の低い情報源に依存する可能性があり、レポートの正確性と信頼性に影響を与える可能性があります。DeeperSearchは、より高品質の情報源に焦点を当てています。

分析の深さと洞察力の面では、Grokの深層研究は通常、興味深く有益なレポートを提供できますが、その長さは短いです。さまざまな情報源間の関係を識別し、根拠のある議論を提示できます。

レポートの明瞭さと可読性の面では、Grokは通常、理解しやすく、論理的に明確で、構造化されたレポートを生成できます。ただし、その簡潔な性質は、その魅力を低下させる可能性があります。

処理時間と効率の面では、Grokの深層研究はすべてのモデルの中で最速です。これは、より効率的な分析と、より合理化された情報源への依存による可能性があります。

要するに、各AIモデルには、深層研究において独自の強みと弱みがあります。ChatGPTは最も徹底的で深い分析を提供しますが、完了するまでに最も時間がかかります。GeminiはChatGPTと同様の分析を提供しますが、より学術的なライティングスタイルが特徴です。Perplexity AIはより高速ですが、深さと詳細が不足しています。Grok AIは最速ですが、信頼性の低い情報源に依存する可能性があります。

最終的に、最適なAIモデルは、特定の研究ニーズによって異なります。最も徹底的で深い分析が必要で、より長く待つことを気にしない場合は、ChatGPTが最適な選択肢となる可能性があります。より効率的な分析が必要で、詳細の妥協が許容できる場合は、GeminiまたはPerplexity AIがより良い選択肢となる可能性があります。最速の分析が必要で、信頼性の低い情報源への依存を気にしない場合は、Grok AIが最適な選択肢となる可能性があります。