연결된 AI 에이전트 시대의 서막: MCP 및 A2A 프로토콜이 길을 열다
인공지능(AI) 세계는 빠르게 진화하고 있으며, AI 에이전트가 혁신의 중심점으로 떠오르고 있습니다. 마이크로소프트의 Github MCP 서버 출시, Google의 A2A 에이전트 간 통신 프로토콜 공개, Alipay의 MCP 서버 통합과 같은 최근의 발전은 AI 에이전트의 잠재력에 대한 광범위한 관심을 불러일으켰습니다.
AI 에이전트 이해하기: 핵심 구성 요소 및 현재 현황
AI 에이전트에 대한 보편적으로 받아들여지는 정의는 여전히 찾기 어렵지만, 전 OpenAI 연구원인 Lilian Weng은 널리 인정받는 관점을 제시합니다. Weng은 ‘계획’, ‘기억’, ‘도구 사용’이 AI 에이전트의 핵심 구성 요소라고 주장합니다.
AI 에이전트 개발의 현재 상태: 제한된 수익화 및 미개척 잠재력
현재 독립적으로 수익을 창출하는 AI 에이전트는 소수에 불과하여 시장 침투율이 상대적으로 낮음을 나타냅니다. 대부분의 에이전트는 대규모 모델의 광범위한 서비스 제공에 번들로 제공됩니다. 자율적인 작업 계획 기능을 자랑하는 Manus 및 Devin과 같은 독립형 제품은 종종 상당한 제한 사항이 있습니다. 이러한 고급 에이전트의 사용자 경험은 제한되어 광범위한 채택을 방해할 수 있습니다.
그러나 미래는 밝아 보입니다. 대규모 모델의 추론 능력이 계속 향상됨에 따라 AI 에이전트는 애플리케이션 혁신의 총아가 될 것으로 예상됩니다. AI 에이전트의 광범위한 채택을 촉진하기 위해 여러 요인이 수렴되고 있습니다.
- 모델 학습 컨텍스트 창의 기하급수적인 성장: 모델이 방대한 양의 정보를 처리하는 능력이 급속히 확장되고 있으며, 강화 학습 기술의 적용이 증가하고 있습니다. 이는 더욱 정교하고 강력한 추론 모델로 이어집니다.
- 번성하는 생태계: MCP 및 A2A와 같은 프로토콜이 빠르게 개발되어 에이전트가 광범위한 도구에 쉽게 액세스하고 활용할 수 있습니다. 2024년 11월에 Anthropic은 외부 데이터와 도구가 모델에 컨텍스트를 제공하는 방식을 표준화하는 것을 목표로 MCP 프로토콜을 릴리스하고 오픈 소스로 공개했습니다.
MCP 및 A2A: AI 에이전트를 위한 원활한 연결 지원
MCP 프로토콜을 통해 AI 에이전트는 외부 데이터 및 도구에 쉽게 연결할 수 있으며, A2A는 에이전트 간의 통신을 용이하게 합니다. MCP는 에이전트를 외부 리소스에 연결하는 데 중점을 두고 A2A는 에이전트 간 통신에 중점을 두지만, 도구를 에이전트로 캡슐화할 수 있는 복잡한 환경에서는 두 기능이 겹칠 수 있습니다. 이러한 건전한 경쟁은 대규모 모델이 외부 도구에 액세스하고 통신을 용이하게 하는 비용을 줄이는 데 필수적입니다.
AI 에이전트의 미래 구상: 주요 개발 궤적
AI 에이전트의 진화는 다양한 영역에서 새로운 가능성을 열어줄 것을 약속합니다. 다음은 몇 가지 잠재적인 개발 경로입니다.
1. 엔드 투 엔드 기능: 사람이 정의한 워크플로의 필요성 제거
현재 사용 가능한 많은 AI 에이전트는 Coze 및 Dify와 같은 플랫폼을 기반으로 구축되어 사용자가 워크플로를 미리 정의해야 합니다. 이는 고급 형태의 프롬프트 엔지니어링과 유사한 초보적인 에이전트입니다. 보다 고급 에이전트는 사용자의 입력에 따라 처음부터 끝까지 작업을 자율적으로 완료할 수 있는 ‘엔드 투 엔드’가 될 것입니다. 이러한 보다 진보된 에이전트는 매우 바람직하며 다음 AI 애플리케이션의 획기적인 발전이 될 가능성이 높습니다.
2. 로봇 공학 및 자율 주행 지원
AI 에이전트의 개념을 구현된 지능에 적용하면 대규모 모델로 제어되는 로봇과 차량도 에이전트임을 알 수 있습니다. 로봇 공학에서 주요 병목 현상은 물리적 작용을 담당하는 ‘소뇌’가 아니라 어떤 작용을 취할지 결정하는 ‘뇌’입니다. AI 에이전트가 중요한 역할을 할 수 있는 곳이 바로 여기입니다.
3. DID 및 기타 기술을 사용하여 에이전트 간 통신 및 AI 네이티브 네트워크 육성
미래에는 AI 에이전트가 서로 통신하고, 자체적으로 구성하고, 협상할 수 있어야 하며, 현재 인터넷보다 더 효율적이고 비용 효율적인 협업 네트워크를 구축해야 합니다. 중국 개발자 커뮤니티는 에이전트 인터넷 시대의 HTTP 프로토콜이 되는 것을 목표로 ANP와 같은 프로토콜을 개발하고 있습니다. 분산형 ID(DID)와 같은 기술을 사용하여 에이전트 인증을 수행할 수 있습니다.
투자 기회: 추론 능력에 대한 증가하는 수요
시장은 제한된 학습 데이터와 사전 학습된 스케일링 법칙의 접근 한계로 인해 AI 컴퓨팅 능력 수요의 지속 가능성에 대한 우려를 표명했습니다. 그러나 AI 에이전트는 더 많은 추론 능력에 대한 수요를 촉진할 것입니다. 다양한 조직에서 에이전트를 적극적으로 개발하고 있으며 경쟁 환경은 여전히 진화하고 있습니다. 에이전트가 작업을 완료하는 데 필요한 컴퓨팅 능력은 긴 컨텍스트 창과 환경 변화에 따른 지속적인 적응을 통해 단순한 대규모 모델 텍스트 응답에 필요한 것보다 훨씬 큽니다.
AI 에이전트의 급속한 발전은 추론 컴퓨팅 능력에 대한 수요 급증을 만들 것으로 예상됩니다. 우리는 다음과 같은 분야에서 상당한 기회를 봅니다.
- 컴퓨팅 칩 제조업체: NVIDIA, Inphi, Accton, New Era, Cambrian.
- 기본 프로토콜 개발 회사: Google (A2A 프로토콜).
- 컴퓨팅 클라우드 서비스 제공업체: Alibaba 및 Tencent.
- 대규모 모델 제조업체: Alibaba 및 ByteDance.
잠재적 위험
- 견고한 MCP 배포 플랫폼의 부재: MCP 에코시스템에는 현재 중앙 집중식 배포 플랫폼이 없습니다. 시장은 이러한 격차를 메우기 위해 클라우드 플랫폼 및 기타 공급업체가 필요합니다.
- 대규모 모델 기술의 예상보다 느린 개발: 대규모 모델은 컨텍스트 창과 환각에서 계속 상당한 어려움에 직면하고 있습니다.
- 에이전트의 예상보다 느린 상용화: AI 에이전트는 요금을 발표했지만, 요금 부과 상황은 공개되지 않았으며 비즈니스 모델의 지속 가능성은 의심스럽습니다.
AI 에이전트에 대한 심층 분석: MCP 및 A2A 프로토콜의 잠재력 공개
AI 에이전트의 부상은 우리가 기술과 상호 작용하는 방식의 패러다임 전환을 의미합니다. 이러한 지능형 개체는 작업을 자율적으로 수행하고, 경험에서 배우고, 변화하는 환경에 적응하도록 설계되었습니다. MCP(Model-Context-Protocol) 및 A2A(Agent-to-Agent)와 같은 프로토콜의 출현은 AI 에이전트의 개발 및 배포를 더욱 가속화하고 있습니다. 이러한 개념을 더 자세히 살펴보고 그 의미를 살펴봅시다.
AI 에이전트의 본질: 단순한 챗봇을 넘어서
ChatGPT와 같은 챗봇이 대중의 상상력을 사로잡았지만 AI 에이전트는 더 진보된 형태의 AI를 나타냅니다. 사용자는 이러한 에이전트가 명시적인 요청에 응답할 뿐만 아니라 자신의 요구 사항을 사전에 이해하고, 복잡한 작업을 세분화하고, 완료된 프로젝트를 제공할 것으로 기대합니다. 이를 위해서는 더 높은 수준의 자율성과 지능이 필요합니다.
AI 에이전트의 주요 구성 요소: 계획, 기억 및 도구 사용
Lilian Weng이 명확히 밝혔듯이 AI 에이전트의 핵심 구성 요소는 계획, 기억 및 도구 사용입니다.
- 계획: 여기에는 복잡한 작업을 더 작고 관리하기 쉬운 단계로 분해하고 원하는 결과를 달성하기 위한 진행 상황을 반영하는 능력이 포함됩니다.
- 기억: AI 에이전트는 과거 상호 작용에 대한 정보를 보존하고, 경험에서 배우고, 변화하는 상황에 적응하기 위해 단기 및 장기 기억이 모두 필요합니다.
- 도구 사용: 검색 엔진 및 API와 같은 외부 도구에 액세스하고 활용하는 능력은 AI 에이전트가 정보를 수집하고, 작업을 수행하고, 실제 세계와 상호 작용하는 데 매우 중요합니다.
성숙한 AI 에이전트 환경: 연구 프로젝트에서 수익 창출 서비스로
처음에 AI 에이전트 프로젝트는 주로 다양한 영역에서 AI의 잠재력을 탐색하는 것을 목표로 하는 연구 중심이었습니다. 그러나 기술이 성숙함에 따라 상용화로 전환되고 있습니다.
수익 창출 AI 에이전트 서비스의 등장
많은 회사가 이제 AI 에이전트를 기존 서비스 제공에 통합하고 있으며, 종종 프리미엄 구독 패키지의 일부로 제공됩니다. 예를 들어 Google의 Gemini 모델은 유료 사용자를 위한 심층 연구 기능을 제공하여 AI의 힘을 활용하여 심층 연구를 수행하고 보고서를 생성할 수 있습니다.
개선을 위한 제한 사항 및 기회
진전이 이루어졌음에도 불구하고 AI 에이전트는 여전히 제한 사항에 직면해 있습니다. 현재 제품 중 상당수는 사용 및 기능 측면에서 제한되어 있어 더 넓은 범위의 사용자에게 어필하는 데 제한이 있습니다. 그러나 이러한 제한 사항은 또한 추가 혁신 및 개발을 위한 기회를 나타냅니다.
컨텍스트 창, 강화 학습 및 추론 모델의 역할
AI 에이전트 기술의 최근 발전에 여러 요인이 기여했습니다.
큰 컨텍스트 창의 힘
AI 에이전트는 정보를 저장하고 처리하기 위해 기억에 크게 의존합니다. 대규모 모델에서 컨텍스트 창의 크기가 증가함에 따라 에이전트는 더 많은 정보를 보존하고 더 복잡한 작업을 수행할 수 있습니다.
강화 학습: 최적의 결정을 내리도록 에이전트 교육
강화 학습 기술은 코드 생성 및 수학 문제 해결과 같이 객관적으로 평가할 수 있는 작업을 수행하도록 AI 에이전트를 교육하는 데 특히 효과적인 것으로 입증되었습니다.
추론 모델의 발전
AI 에이전트는 기본적으로 추론 모델의 애플리케이션입니다. OpenAI의 Chain of Thought (CoT)와 같이 보다 정교한 추론 모델의 개발은 더 유능하고 지능적인 에이전트를 위한 길을 열었습니다.
MCP 및 A2A 프로토콜의 중요성
표준화된 통신 프로토콜의 출현은 AI 에이전트의 개발 및 배포를 용이하게 하는 데 매우 중요합니다.
MCP: 외부 데이터 및 도구와의 통합 간소화
MCP 프로토콜은 AI 모델이 외부 데이터 및 도구에 액세스하고 활용하는 방법을 표준화하는 것을 목표로 합니다. 이는 에이전트를 다양한 서비스와 통합하는 복잡성과 비용을 줄입니다.
A2A: AI 에이전트 간의 통신 지원
A2A 프로토콜은 AI 에이전트 간의 통신 및 협업을 용이하게 합니다. 이는 복잡한 분산 AI 시스템을 생성하기 위한 새로운 가능성을 열어줍니다.
AI 에이전트의 미래: 지능형 지원의 세계
AI 에이전트의 개발은 아직 초기 단계이지만 잠재력은 엄청납니다. 미래에는 자율적으로 광범위한 작업을 수행하고, 경험에서 배우고, 변화하는 상황에 적응할 수 있는 AI 에이전트가 나타날 것으로 예상할 수 있습니다. 이러한 지능형 지원은 우리가 기술과 상호 작용하는 방식을 혁신하고 삶의 다양한 측면을 변화시킬 것입니다.
과제 및 고려 사항
AI 에이전트가 더 보편화됨에 따라 잠재적인 과제와 우려 사항을 해결하는 것이 중요합니다.
- 윤리적 고려 사항: AI 에이전트는 책임감 있고 윤리적인 방식으로 개발 및 배포되어 특정 그룹에 대한 편견을 영속시키거나 차별하지 않도록 해야 합니다.
- 보안 위험: AI 에이전트는 해킹 및 데이터 침해와 같은 보안 위협에 취약할 수 있습니다. 이러한 시스템을 보호하기 위해 강력한 보안 조치를 구현하는 것이 중요합니다.
- 일자리 대체: AI 에이전트의 자동화 기능은 특정 산업에서 일자리 대체로 이어질 수 있습니다. 이러한 변화에 대비하고 영향을 받는 근로자에게 지원을 제공하는 것이 중요합니다.