앤트로픽의 AI 에이전트 클로드, 포켓몬 게임 중

클로드의 퀘스트 시작: 클로드 vs. 포켓몬 레드

인공지능은 먼 길을 왔지만, 고전 비디오 게임을 마스터할 수 있을까요? 선도적인 AI 스타트업인 Anthropic은 독특하고 재미있는 실험을 통해 자사 기술을 시험하고 있습니다. 이 회사는 인기 게임 플랫폼인 Twitch에 라이브 스트림을 설치하여 AI 모델인 Claude가 사랑받는 게임인 Pokémon Red를 정복하려는 시도를 보여주고 있습니다.

전제는 간단합니다. AI가 포켓몬의 복잡한 세계를 탐색하고, 전투 전략을 세우고, 궁극적으로 포켓몬 마스터가 될 수 있을까요? Anthropic은 AI 에이전트의 능력을 탐구하고 게임 커뮤니티와 소통하기 위해 ‘Claude Plays Pokémon’ 프로젝트를 시작했습니다. 그러나 그 여정은 결코 순탄하지 않았습니다.

초기 어려움: 클로드의 험난한 시작

처음에 이전 버전의 Claude는 상당한 어려움에 직면했습니다. 전투에 참여하는 것과 같은 기본적인 작업도 어려웠습니다. Anthropic의 보고서에 따르면 2024년 6월 Claude 3.5는 거의 모든 조우에서 도망치려고 시도했습니다. 이러한 행동은 이전 모델이 게임의 목표를 이해하고 적절한 행동을 실행하는 데 한계가 있음을 보여주었습니다.

희망의 빛: Claude 3.7 Sonnet의 등장

몇 달 후, 2025년 2월에 Anthropic은 Claude 3.7 Sonnet을 도입했습니다. 이 새로운 반복은 전환점을 맞이했습니다. 게임을 시작한 지 몇 시간 만에 Claude 3.7 Sonnet은 중요한 이정표를 달성했습니다. 첫 번째 체육관 관장인 브록(Brock)을 물리친 것입니다. 며칠 후, 두 번째 체육관 관장인 미스티(Misty)를 정복했습니다. 이러한 승리는 AI 능력의 발전을 입증하는 증거였으며, 이전 모델은 꿈도 꾸지 못했던 발전을 보여주었습니다.

포켓몬을 플레이하는 AI의 내부 작동 방식

Claude 3.7 Sonnet을 차별화하는 것은 무엇이었을까요? Anthropic은 이 버전이 다음과 같은 몇 가지 핵심 영역에서 향상된 능력을 보유하고 있다고 밝혔습니다.

  • 사전 계획: Claude 3.7 Sonnet은 미래의 움직임을 예측하고 그에 따라 전략을 세우는 능력을 보여주었습니다.
  • 목표 기억: AI는 목표에 대한 정보를 유지하고 일관되게 목표를 향해 노력할 수 있었습니다.
  • 실수로부터 학습: Claude 3.7 Sonnet은 오류를 분석하고 게임 플레이를 조정하는 능력을 보여주었는데, 이는 모든 게임을 마스터하는 데 중요한 측면입니다.
  • 지식 기반 구축: AI는 포켓몬 유형, 기술 및 전략을 포함하여 포켓몬 세계에 대한 정보 저장소를 개발했습니다.
  • 시각적 인식: Claude 3.7 Sonnet은 게임 화면을 ‘볼’ 수 있었고, 시각적 정보를 해석하여 정보에 입각한 결정을 내릴 수 있었습니다.
  • 시뮬레이션된 버튼 누르기: AI는 버튼 누르기를 시뮬레이션하여 명령을 실행할 수 있었고, 이를 통해 게임 환경과 상호 작용할 수 있었습니다.

진행 중단: 달맞이 산(Mt. Moon)을 통과하는 긴 여정

초기 성공에도 불구하고 Claude 3.7 Sonnet의 진행은 결국 난관에 부딪혔습니다. 특히 어려운 영역 중 하나는 게임에서 악명 높은 복잡한 던전인 달맞이 산(Mt. Moon)이었습니다. 라이브 스트림 시청자들은 Claude가 이 지역을 탐색하는 데 어려움을 겪으면서 78시간 동안 힘든 시련을 겪는 것을 목격했습니다. 비교를 위해, 인간 플레이어, 심지어 어린 아이들도 일반적으로 이 부분을 몇 시간 만에 완료합니다.

순환 논리: 클로드의 탐색 문제

라이브 스트림은 Claude가 공간 추론 및 탐색에 어려움을 겪고 있음을 보여주었습니다. AI는 종종 원을 그리며 같은 경로를 되짚어 가고 벽에 부딪히는 경우가 많았습니다. 이러한 행동은 AI가 여전히 시각적 정보를 해석하고 가상 환경 내에서 효과적인 움직임으로 변환하는 데 어려움을 겪고 있음을 보여주었습니다.

클로드의 마음 속: AI 의사 결정 엿보기

라이브 스트림의 매력적인 측면 중 하나는 Claude의 ‘사고’ 과정을 보여주는 텍스트 상자가 함께 제공된다는 것입니다. 이 기능은 시청자에게 AI의 의사 결정에 대한 통찰력을 제공하여 AI가 상황을 분석하고, 옵션을 평가하고, 다음 움직임을 선택하는 방법을 보여줍니다.

텍스트 vs. 비주얼: 클로드의 강점과 약점

Anthropic 엔지니어에 따르면 Claude는 포켓몬 전투와 같은 게임의 텍스트 기반 측면에서 뛰어납니다. AI는 포켓몬 유형, 기술 및 통계에 대한 정보를 효과적으로 처리하여 전투에서 전략적인 결정을 내릴 수 있습니다. 그러나 게임 세계의 지도와 마을을 탐색하는 것과 같은 시각적인 구성 요소에는 어려움을 겪습니다.

갈 길이 멀다: 게임에서 AI의 미래

Claude 3.7 Sonnet이 이전 버전에 비해 상당한 발전을 이루었지만, 라이브 스트림은 AI가 여전히 인간이 비교적 쉽게 수행하는 복잡한 작업을 마스터하는 데는 멀었다는 것을 보여줍니다. 적어도 포켓몬 영역에서 AI가 세계를 정복하는 꿈은 여전히 ​​먼 전망입니다. 151마리의 포켓몬을 모두 잡기 위한 Claude의 여정은 계속되며, 인공 지능의 지속적인 발전에 대한 귀중한 데이터와 통찰력을 제공합니다.

클로드의 과제에 대한 심층 분석

Claude가 직면한 어려움은 인간과 현재 AI 시스템이 문제 해결에 접근하는 방식의 근본적인 차이점을 강조합니다. 이러한 주요 차이점 중 일부를 살펴보겠습니다.

1. 공간 추론 및 상식

인간은 공간 관계에 대한 타고난 이해력을 가지고 있으며 복잡한 환경을 쉽게 탐색할 수 있습니다. 우리는 상식과 직관에 의존하여 주변 환경에 대한 빠른 판단을 내립니다. 반면에 AI는 종종 이러한 개념으로 어려움을 겪습니다. Claude가 반복적으로 원을 그리고 벽에 부딪히는 사건은 직관적인 공간 인식이 부족함을 보여줍니다.

2. 맥락적 이해

인간은 맥락을 이해하는 데 탁월합니다. 우리는 방대한 배경 지식과 경험을 바탕으로 상황을 해석할 수 있습니다. AI는 개선되고 있지만 여전히 맥락의 뉘앙스를 파악하는 데 어려움을 겪습니다. Pokémon Red에서 이것은 즉각적인 게임 상태뿐만 아니라 전반적인 목표, 스토리 라인 및 게임의 불문율을 이해하는 것을 의미합니다.

3. 효율적인 탐색

인간은 본질적으로 호기심이 많고 효율적인 탐험가입니다. 우리는 새로운 환경을 체계적으로 탐색하고 불필요한 반복을 피하는 경향이 있습니다. 그러나 AI는 Claude의 달맞이 산(Mt. Moon)에서의 어려움에서 볼 수 있듯이 비효율적인 탐색 패턴에 빠질 수 있습니다. 이는 AI가 보다 정교한 탐색 전략을 개발해야 할 필요성을 강조합니다.

4. 예상치 못한 상황에 적응

인간은 예상치 못한 사건에 적응하고 즉석에서 계획을 변경하는 데 능숙합니다. AI는 실수로부터 배울 수 있지만 예측할 수 없는 상황에 어려움을 겪을 수 있습니다. Pokémon Red와 같은 게임에서 이것은 희귀한 포켓몬을 만나거나, 놀랍도록 강한 상대를 만나거나, 예상치 못한 결함을 처리하는 것을 포함할 수 있습니다.

5. 체화의 역할

인간의 학습은 종종 우리의 신체 및 실제 세계와의 상호 작용과 얽혀 있습니다. 이러한 ‘체화된 인지’는 우리가 주변 환경을 이해하고 탐색하는 방식에 중요한 역할을 합니다. AI는 신체가 없기 때문에 학습의 중요한 측면을놓치고 있습니다. Claude는 버튼 누르기를 시뮬레이션할 수 있지만 인간 플레이어와 같은 방식으로 게임을 경험하지는 않습니다.

더 광범위한 의미

Claude의 포켓몬 모험은 단순한 재미있는 실험 그 이상입니다. AI의 현재 상태와 앞으로의 과제에 대한 귀중한 통찰력을 제공합니다. 이 프로젝트는 다음과 같은 주요 시사점을 강조합니다.

  • AI는 아직 초기 단계입니다: AI가 최근 몇 년 동안 인상적인 발전을 이루었지만, 여전히 인간 수준의 지능을 달성하는 데는 멀었습니다.
  • 특정 작업 vs. 일반 지능: AI는 체스나 바둑을 두는 것과 같이 구체적이고 잘 정의된 작업에서 뛰어난 능력을 발휘할 수 있습니다. 그러나 개방형 목표를 가진 복잡한 비디오 게임을 하는 것과 같이 광범위한 작업에서 지능을 일반화하는 것은 여전히 ​​중요한 장애물입니다.
  • 데이터의 중요성: Claude와 같은 AI 모델은 학습을 위해 데이터에 크게 의존합니다. 데이터의 품질과 양은 성능에 큰 영향을 미칩니다.
  • 지속적인 개선의 필요성: ‘Claude Plays Pokémon’ 프로젝트는 AI 개발의 반복적인 특성을 강조합니다. 지속적인 테스트, 피드백 및 개선은 발전을 위해 필수적입니다.
  • 게임에서 AI의 잠재력: AI 기술이 발전함에 따라 게임 산업에 혁명을 일으켜 보다 현실적이고 도전적인 게임 경험을 창출할 수 있는 잠재력이 있습니다.

포켓몬을 넘어: 다른 영역에서 AI의 잠재력

Claude의 포켓몬 여정에서 얻은 교훈은 게임 세계를 넘어선 의미를 갖습니다. AI가 직면한 과제는 다양한 영역에서 추가 연구 및 개발이 필요한 영역을 강조합니다.

  • 로봇 공학: 공간 추론 및 탐색을 개선하는 것은 로봇이 실제 환경에서 효과적으로 작동하는 데 중요합니다.
  • 자율 주행 자동차: 자율 주행 자동차의 AI 시스템은 맥락을 이해하고, 예상치 못한 상황에 적응하고, 복잡한 교통 상황에서 안전한 결정을 내려야 합니다.
  • 의료: AI는 의료 진단, 치료 계획 및 신약 개발을 지원할 수 있습니다. 그러나 복잡한 의료 데이터를 처리하고 개별 환자의 요구에 적응할 수 있어야 합니다.
  • 고객 서비스: AI 기반 챗봇은 고객 지원을 제공할 수 있지만 자연어를 이해하고, 다양한 질문을 처리하고, 문제를 효과적으로 해결할 수 있어야 합니다.
  • 교육: AI는 학생들을 위한 학습 경험을 개인화할 수 있지만 개별 학습 스타일을 이해하고, 다양한 지식 수준에 적응하고, 매력적인 콘텐츠를 제공할 수 있어야 합니다.

‘Claude Plays Pokémon’ 프로젝트는 성공과 좌절이 섞여 있어 현재 AI 기술의 잠재력과 한계를 모두 상기시켜 줍니다. 탐험, 학습 및 지속적인 개선의 여정이며, 진정으로 지능적인 기계를 만들기 위한 더 넓은 탐구를 반영하는 여정입니다. Claude가 아직 모든 포켓몬을 잡지는 못했지만, 그의 모험에서 얻은 통찰력은 AI의 미래에 매우 중요합니다.