AI 심층 연구 대결: 누가 최고일까?

인공지능 챗봇은 끊임없이 발전하고 있으며, 현재 많은 챗봇이 특정 주제에 대한 연구를 대신 수행할 수 있는 "심층 연구" 옵션을 제공합니다. 이러한 봇은 자율적인 AI 에이전트 역할을 수행하여 사용자를 대신하여 웹을 검색하고, 적합한 온라인 리소스를 찾은 다음, 발견한 내용을 바탕으로 자세한 보고서를 제공합니다. 이는 사용자가 직접 수백, 수천 개의 웹사이트를 탐색하는 데 드는 시간을 절약하기 위한 것입니다.

심층 연구는 빠르게 다양한 AI의 강력한 기능으로 자리 잡고 있습니다. OpenAI의 ChatGPT, Google Gemini, Perplexity AI, 심지어 xAI의 Grok (DeepSearch라고 함)에서도 이를 찾을 수 있습니다. Microsoft는 두 개의 AI 에이전트(Researcher 및 Analyst)를 사용하는 심층 연구 유형을 도입했지만, Microsoft 365 Copilot 라이선스가 필요하고 기업 또는 비즈니스 구독이 필요하므로 일반 Copilot 사용자에게는 아직 제공되지 않습니다.

이것은 분명히 유용하고 도움이 되는 기술처럼 들립니다. 하지만 이러한 과제에 직면했을 때 다양한 AI 서비스는 어떻게 수행될까요? 이 질문에 답하기 위해 ChatGPT, Gemini, Perplexity AI 및 Grok의 심층 연구 기능을 사용해 보았습니다. 각 서비스에 동일한 쿼리를 제출하여 "영화와 TV에서 시간 여행이 묘사되는 방식과 그것이 우리의 가치관, 두려움 및 욕망을 어떻게 반영하는지 탐구해 달라"고 요청했습니다.

다음은 각 AI의 연구 모드가 작동하는 방식과 주제를 처리하는 방식입니다.

ChatGPT

OpenAI의 ChatGPT는 두 가지 다른 심층 연구 모드를 제공합니다. 전체 버전과 경량 버전입니다. 전체 버전은 자세하고 심층적인 보고서를 제공하지만 최상의 출처를 찾고 결과를 제시하는 데 최대 30분이 걸릴 수 있습니다. 경량 버전은 더 짧고 덜 심층적인 보고서를 제공하지만 일반적으로 몇 분 안에 완료됩니다. 사용할 수 있는 버전과 제출할 수 있는 쿼리 수는 계획에 따라 다릅니다.

ChatGPT Plus, Team 및 Edu 사용자는 매달 25개의 쿼리(전체 버전 10개, 경량 버전 15개)를 받습니다. Enterprise 사용자는 10개(모두 전체 버전), Pro 사용자는 250개(전체 버전 125개, 경량 버전 125개)를 받습니다. 무료 사용자는 5개(모두 경량 버전)를 받습니다. 전체 버전 심층 연구 제한에 도달하면 쿼리는 자동으로 경량 버전으로 기본 설정됩니다.

전체 버전을 사용하든 경량 버전을 사용하든 과정은 동일합니다. Windows 또는 macOS용 데스크톱 응용 프로그램을 사용할 수도 있습니다. 프롬프트에서 쿼리를 입력하거나 말하고, 심층 연구 버튼을 선택한 다음 요청을 제출합니다. 전체 버전이 활성화된 경우 응답을 받기 위해 잠시 기다릴 준비를 하십시오. 경량 버전이 실행 중인 경우 그렇게 오래 기다릴 필요가 없습니다.

영화 및 TV에서의 시간 여행에 대한 쿼리를 전체 버전 심층 연구 및 경량 버전에 제출했습니다. 첫 번째 경우에는 Plus 구독을 사용하고 두 번째 경우에는 무료 계정을 사용했습니다. 둘 다 GPT-4o 모델을 사용했습니다. 또한 주제 접근 방식과 더 역사적인 접근 방식 중에서 원하는 분석 유형을 명확히 하고, 고전 영화 및 TV 프로그램만 포함할지 또는 현대 영화 및 TV 프로그램도 포함할지 묻는 메시지가 표시되었습니다.

전체 버전은 웹을 검색하고 결과를 컴파일하는 데 약 17분이 걸렸지만, 몇 가지 예와 유용한 TV 프로그램 및 영화 차트가 포함된 자세하고 심층적인 보고서를 제공했습니다. 경량 버전은 시작부터 끝까지 약 8분밖에 걸리지 않았지만, 더 짧고 덜 심층적인 보고서를 제공했습니다. 이는 전체 보고서의 Cliff’s Notes 버전이었습니다. 두 보고서 모두 주제를 다루고 흥미롭게 읽을 수 있었지만, 전체 버전 심층 연구는 철저함으로 인해 인정받았습니다.

Google Gemini

Gemini의 심층 연구 모드는 구독자와 무료 사용자 모두에게 제공됩니다. 구독자는 일반적으로 매일 20개의 쿼리를 받지만, 이 숫자는 다를 수 있습니다. 무료 사용자는 매달 5개의 쿼리로 제한됩니다.

심층 연구를 활성화하려면 왼쪽 상단에 현재 모델을 나열하는 드롭다운 메뉴를 클릭합니다. 구독자는 2.0 Flash, 2.5 Pro(실험적) 및 심층 연구와 2.5 Pro 중에서 선택할 수 있습니다. 무료 사용자는 2.0 Flash 또는 심층 연구를 선택할 수 있습니다. 원하는 모델을 선택하면 심층 연구 버튼이 프롬프트 아래에 표시되어야 합니다. 프롬프트에 질문을 입력하고, 심층 연구 버튼을 선택(아직 강조 표시되지 않은 경우)한 다음 요청을 제출합니다.

시간 여행에 대한 쿼리를 제출한 후 Gemini의 심층 연구는 주제를 처리할 계획에 대한 개요를 빠르게 생성했습니다. 이 개요를 조정하거나 그대로 승인할 수 있습니다. 승인하자 Gemini는 웹에서 연구를 시작했습니다.

AI는 각 단계의 진행 상황을 알려주어 수행 중인 작업, 참조 중인 웹사이트 및 보고서 진행 방식을 나타냈습니다. 전체 프로세스는 약 10분이 걸렸습니다.

결과 보고서는 매우 심층적이고 철저하며 길었습니다. 논의된 영화의 예가 포함된 표가 마음에 들었습니다. Gemini의 글쓰기 스타일은 ChatGPT의 글쓰기 스타일보다 더 학문적이었고, ChatGPT의 글쓰기 스타일은 덜 공식적이고 읽기가 더 재미있었습니다. 그러나 Gemini는 여전히 이 작업을 수행할 가치가 있음을 입증했습니다.

Perplexity AI

Perplexity의 심층 연구 모드는 유료 구독자와 무료 사용자 모두에게 제공됩니다. Pro 구독자는 매일 최대 500개의 쿼리를 받을 수 있지만, 무료 사용자는 매일 5개의 쿼리를 받습니다. 프롬프트에서 질문을 입력하고 "연구" 버튼을 선택한 다음 요청을 제출합니다.

Perplexity의 연구 모드를 사용하여 동일한 시간 여행 주제를 분석하도록 했습니다. 여기서 AI는 진행 상황을 알려주어 연구 중인 특정 하위 주제와 분석 중인 웹사이트를 알려주었습니다. Perplexity는 약 5분 만에 발견한 내용을 컴파일하고 보고서를 제출했습니다. 그러나 결과는 실망스러웠습니다.

보고서 자체는 다른 AI가 생성한 보고서보다 훨씬 짧았습니다. 각 주제 또는 요소는 몇 개의 단락만 할당되었으며 대부분 깊이 있는 분석이 부족했습니다. 이 보고서는 빠르게 읽기에는 괜찮았습니다. 그러나 너무 많은 시간과 노력을 들이지 않고 작업을 완료하려는 어린이가 제출한 숙제를 떠올리게 했습니다.

Grok AI

xAI의 Grok 3은 두 가지 심층 연구 모드를 제공합니다. DeepSearch와 DeeperSearch입니다. DeepSearch는 많은 온라인 리소스를 살펴보지만 모든 리소스가 유용하거나 신뢰할 수 있는 것은 아닙니다. 이 모드는 또한 매우 빠르게 작업을 완료할 수 있습니다. DeeperSearch는 DeepSearch의 업그레이드 버전으로, 더 많은 고품질 리소스를 활용하고 실행하는 데 시간이 더 오래 걸리지만 일반적으로 더 심층적인 보고서를 제공합니다.

선택한 모드에 관계없이 X Premium+ 구독자는 무제한 쿼리를 즐길 수 있지만, 무료 및 Basic 사용자는 매일 10개의 DeepSearch 쿼리로 제한됩니다.

이 기능을 사용해 보려면 Grok 프롬프트에 쿼리를 입력하고 DeepSearch의 다운로드 화살표를 클릭한 다음 DeepSearch 또는 DeeperSearch를 선택합니다. 준비가 되면 요청을 제출합니다.

동일한 시간 여행 쿼리를 Grok에 던졌습니다. DeepSearch 모드에서 AI는 전체 프로세스를 1분 30초 만에 완료하여 속도 기록을 세웠습니다. DeeperSearch는 2분 30초로 조금 더 오래 걸렸습니다. 속도가 매우 빠르기 때문에 형편없는 보고서를 받을 것으로 예상했습니다. 그러나 결과는 놀라웠습니다. 두 모드 모두에서 Grok은 흥미롭고 유익한 보고서를 제공했지만 짧았습니다. 이 연구는 다양한 예, 유용한 TV 프로그램 및 영화 표, 그리고 몇 가지 영리한 분석을 나열했습니다. 전혀 나쁘지 않았습니다.

그렇다면 어떤 AI가 가장 잘 수행했을까요? ChatGPT가 승자라고 발표해야겠습니다. 시간이 가장 오래 걸렸지만, 보고서는 가장 철저하고 심층적이며 글쓰기가 가장 좋고 가장 흥미로웠습니다. 그렇지 않으면 시간이 촉박한 경우 Grok을 시도해 볼 가치가 있습니다. 물론 이 모든 것은 단 하나의 쿼리를 기반으로 합니다. 다른 주제의 경우 다른 챔피언을 지명할 수 있습니다. 그러나 다음에 AI가 자신의 심층 연구 유형을 처리해야 할 때 이러한 결과를 고려해 볼 가치가 있습니다.

이제 각 AI 모델의 구체적인 차이점을 자세히 살펴보고 복잡한 연구 작업을 처리할 때의 고유한 강점과 약점을 살펴보겠습니다. 다음과 같은 몇 가지 주요 측면에 초점을 맞출 것입니다.

  • 정보 출처의 품질 및 다양성: AI가 다양한 신뢰할 수 있는 출처에서 정보를 식별하고 활용할 수 있습니까?
  • 분석의 깊이와 통찰력: AI가 단순히 정보를 반복합니까, 아니면 심오한 분석과 가치 있는 통찰력을 제공할 수 있습니까?
  • 보고서의 명확성과 가독성: AI가 생성한 보고서를 이해하기 쉽고 논리적으로 명확하며 구조화가 잘 되어 있습니까?
  • 처리 시간 및 효율성: AI가 연구 작업을 완료하는 데 필요한 시간이 합리적이며 다른 모델과 비교하여 어떻습니까?

이러한 주요 측면에 대한 자세한 평가를 통해 각 AI 모델의 기능을 더 잘 이해하고 특정 연구 요구 사항에 가장 적합한 모델을 결정할 수 있습니다.

먼저 ChatGPT의 심층 연구 성능을 검토해 보겠습니다. 앞서 언급했듯이 ChatGPT는 두 가지 다른 심층 연구 모드를 제공합니다. 전체 버전과 경량 버전입니다. 전체 버전은 더 심층적이고 철저한 분석을 제공하지만 완료하는 데 시간이 더 오래 걸립니다. 경량 버전은 더 빠르지만 깊이와 세부 사항 측면에서 타협합니다.

정보 출처 측면에서 ChatGPT는 학술 저널, 뉴스 기사, 블로그 및 웹사이트를 포함하여 다양한 온라인 리소스에 액세스할 수 있는 것으로 보입니다. 그러나 어떤 경우에는 신뢰할 수 없는 출처에 의존할 수 있으며, 이는 보고서의 정확성과 신뢰성에 영향을 미칠 수 있습니다.

분석의 깊이와 통찰력 측면에서 ChatGPT의 전체 버전은 일반적으로 심오한 분석과 가치 있는 통찰력을 제공할 수 있습니다. 다양한 출처 간의 관계를 식별하고 근거 있는 주장을 제시할 수 있습니다. 그러나 경량 버전은 이러한 깊이가 부족한 경향이 있으며 더 피상적인 분석을 제공할 수 있습니다.

보고서의 명확성과 가독성 측면에서 ChatGPT는 일반적으로 이해하기 쉽고 논리적으로 명확하며 구조화가 잘 된 보고서를 생성할 수 있습니다. 그러나 어떤 경우에는 글쓰기 스타일이 너무 공식적이거나 학문적일 수 있으며, 이는 매력을 떨어뜨릴 수 있습니다.

처리 시간 및 효율성 측면에서 ChatGPT의 전체 버전은 연구 작업을 완료하는 데 상대적으로 오랜 시간이 걸립니다. 이는 더 철저한 분석과 더 광범위한 출처에 대한 의존 때문일 수 있습니다. 경량 버전은 더 빠르지만 깊이와 세부 사항 측면에서 타협합니다.

다음으로 Google Gemini의 심층 연구 성능을 살펴보겠습니다. Gemini는 구독자와 무료 사용자 모두에게 사용할 수 있는 심층 연구 모드를 제공합니다. 이를 통해 사용자는 AI가 주제를 처리하는 방법에 대한 개요를 조정하거나 승인할 수 있습니다.

정보 출처 측면에서 Gemini는 ChatGPT와 유사한 다양한 온라인 리소스에 액세스할 수 있는 것으로 보입니다. 그러나 특정 출처의 신뢰성에 대해 더 엄격한 스크리닝을 할 수 있으며, 이는 보고서의 정확성과 신뢰성을 향상시킬 수 있습니다.

분석의 깊이와 통찰력 측면에서 Gemini의 심층 연구는 일반적으로 심오한 분석과 가치 있는 통찰력을 제공할 수 있습니다. 다양한 출처 간의 관계를 식별하고 근거 있는 주장을 제시할 수 있습니다. 그러나 글쓰기 스타일은 ChatGPT보다 더 학문적일 수 있으며, 이는 매력을 떨어뜨릴 수 있습니다.

보고서의 명확성과 가독성 측면에서 Gemini는 일반적으로 이해하기 쉽고 논리적으로 명확하며 구조화가 잘 된 보고서를 생성할 수 있습니다. 그러나 학문적인 스타일로 인해 일부 독자가 이해하기 어려울 수 있습니다.

처리 시간 및 효율성 측면에서 Gemini의 심층 연구는 일반적으로 ChatGPT의 전체 버전보다 빠릅니다. 이는 더 효율적인 분석과 더 간소화된 출처에 대한 의존 때문일 수 있습니다.

이제 Perplexity AI의 심층 연구 성능을 평가해 보겠습니다. Perplexity는 유료 구독자와 무료 사용자 모두에게 사용할 수 있는 심층 연구 모드를 제공합니다. 연구 중인 특정 하위 주제와 분석 중인 웹사이트를 사용자에게 알립니다.

정보 출처 측면에서 Perplexity는 ChatGPT 및 Gemini와 유사한 다양한 온라인 리소스에 액세스할 수 있는 것으로 보입니다. 그러나 특정 출처의 신뢰성에 대해 더 엄격한 스크리닝을 할 수 있으며, 이는 보고서의 정확성과 신뢰성을 향상시킬 수 있습니다.

분석의 깊이와 통찰력 측면에서 Perplexity의 심층 연구는 일반적으로 깊이와 세부 사항이 부족합니다. 더 피상적인 분석을 제공할 수 있으며 다양한 출처 간의 관계를 식별하지 못할 수 있습니다.

보고서의 명확성과 가독성 측면에서 Perplexity는 일반적으로 이해하기 쉽고 논리적으로 명확하며 구조화가 잘 된 보고서를 생성할 수 있습니다. 그러나 간결한 특성으로 인해 매력이 떨어질 수 있습니다.

처리 시간 및 효율성 측면에서 Perplexity의 심층 연구는 일반적으로 ChatGPT 및 Gemini보다 빠릅니다. 이는 더 효율적인 분석과 더 간소화된 출처에 대한 의존 때문일 수 있습니다.

마지막으로 Grok AI의 심층 연구 성능을 살펴보겠습니다. Grok은 두 가지 심층 연구 모드를 제공합니다. DeepSearch와 DeeperSearch입니다. DeepSearch는 많은 온라인 리소스를 살펴보는 반면 DeeperSearch는 더 많은 고품질 리소스를 활용하고 실행하는 데 시간이 더 오래 걸립니다.

정보 출처 측면에서 Grok의 DeepSearch는 신뢰할 수 없는 출처에 의존할 수 있으며, 이는 보고서의 정확성과 신뢰성에 영향을 미칠 수 있습니다. DeeperSearch는 더 고품질 출처에 중점을 둡니다.

분석의 깊이와 통찰력 측면에서 Grok의 심층 연구는 일반적으로 흥미롭고 유익한 보고서를 제공할 수 있지만 길이는 짧습니다. 다양한 출처 간의 관계를 식별하고 근거 있는 주장을 제시할 수 있습니다.

보고서의 명확성과 가독성 측면에서 Grok은 일반적으로 이해하기 쉽고 논리적으로 명확하며 구조화가 잘 된 보고서를 생성할 수 있습니다. 그러나 간결한 특성으로 인해 매력이 떨어질 수 있습니다.

요약하자면 각 AI 모델은 심층 연구와 관련하여 고유한 강점과 약점을 가지고 있습니다. ChatGPT는 가장 철저하고 심층적인 분석을 제공하지만 완료하는 데 가장 오랜 시간이 걸립니다. Gemini는 ChatGPT와 유사한 분석을 제공하지만 글쓰기 스타일이 더 학문적입니다. Perplexity AI는 더 빠르지만 깊이와 세부 사항이 부족합니다. Grok AI는 가장 빠르지만 신뢰할 수 없는 출처에 의존할 수 있습니다.

궁극적으로 귀하에게 가장 적합한 AI 모델은 특정 연구 요구 사항에 따라 달라집니다. 가장 철저하고 심층적인 분석이 필요하고 더 오래 기다리는 것이 괜찮다면 ChatGPT가 최선의 선택일 수 있습니다. 더 효율적인 분석이 필요하고 세부 사항 측면에서 타협할 수 있다면 Gemini 또는 Perplexity AI가 더 나은 선택일 수 있습니다. 가장 빠른 분석이 필요하고 신뢰할수 없는 출처에 의존하는 것이 괜찮다면 Grok AI가 최선의 선택일 수 있습니다.