Google의 Agent2Agent 프로토콜 심층 분석: AI 에이전트 상호 운용성
인공 지능 환경은 빠르게 진화하고 있으며, AI 에이전트가 핵심 구성 요소로 부상하고 있습니다. AI 에이전트는 본질적으로 **대규모 언어 모델(LLM)**의 인지 능력과 명령을 실행하고, 정보를 검색하며, 자율적으로 작업을 수행할 수 있도록 하는 도구 모음을 결합한 것입니다. 이러한 에이전트는 사용자 요청에 응답하거나 다른 에이전트와 상호 작용합니다. AI 에이전트의 잠재력은 운영 확장, 복잡한 프로세스 자동화, 다양한 비즈니스 기능 전반의 효율성 향상을 통해 개별 생산성을 크게 향상시키는 능력에 있습니다.
만장일치는 보편적인 ‘원 사이즈 올 핏’ 에이전트가 AI 에이전트에게 기대되는 다양하고 복잡한 작업을 효과적으로 처리할 수 없다는 것입니다. 해결책은 에이전트 워크플로우에 있습니다. 이는 최소한의 인간 감독으로 의사 결정을 내리고, 조치를 실행하며, 작업을 조정할 수 있는 자율 AI 에이전트 네트워크에 의해 생성됩니다.
에이전트 상호 운용성에 대한 Google의 비전: Agent2Agent 프로토콜(A2A)
Google은 2025년 4월 9일에 Agent2Agent(A2A) 프로토콜을 도입했습니다. 이는 AI 에이전트 간의 원활한 통신을 촉진하여 데이터를 안전하게 교환하고 복잡한 비즈니스 워크플로우를 자동화할 수 있도록 설계되었습니다. 이는 엔터프라이즈 시스템 및 타사 플랫폼과의 상호 작용을 통해 달성됩니다.
A2A 프로토콜은 Google과 50개 이상의 산업 파트너 간의 협력의 결과이며, 모두 AI 에이전트 협업의 미래에 대한 공통 비전을 공유합니다. 중요한 것은 이 협업이 특정 기술을 초월하고 개방적이고 안전한 표준을 기반으로 한다는 것입니다.
A2A의 핵심 설계 원칙
A2A 프로토콜 개발 중 Google과 파트너는 다음과 같은 몇 가지 기본 원칙을 따랐습니다.
- 개방적이고 공급업체에 구애받지 않음: A2A 프로토콜은 개방적이어야 합니다. 즉, 해당 사양은 공개적으로 액세스할 수 있습니다. 이를 통해 모든 개발자 또는 조직은 독점적인 제한 없이 프로토콜을 구현할 수 있습니다. 공급업체에 구애받지 않는다는 것은 프로토콜이 특정 공급업체의 기술에 묶여 있지 않다는 것을 의미합니다. 이는 모든 참가자에게 공정한 경쟁의 장을 조성합니다.
- 협업을 위한 자연스러운 양식: A2A를 통해 에이전트는 고유한 비정형 통신 방법을 사용하여 협업할 수 있습니다. 이는 에이전트를 도구와 구별하고 A2A를 Model Context Protocol(MCP)와 차별화합니다.
- 기존 표준 기반 구축: 기존 IT 인프라와의 통합을 간소화하기 위해 프로토콜은 HTTP, Server-Sent Events(SSE) 및 JSON-RPC와 같은 확립된 표준을 기반으로 구축되었습니다.
- 기본적으로 안전: 보안은 가장 중요한 문제입니다. A2A는 중요한 데이터를 보호하고 안전한 상호 작용을 보장하기 위해 엔터프라이즈급 인증 및 권한 부여 메커니즘을 통합합니다.
- 데이터 양식에 구애받지 않음: A2A는 텍스트 기반 통신에만 국한되지 않습니다. 이미지, 오디오 및 비디오 스트림을 포함한 다양한 데이터 유형을 처리할 수 있습니다.
A2A의 기능: 에이전트 협업 강화
A2A는 에이전트 상호 작용을 간소화하기 위한 다양한 내장 기능을 제공합니다.
- 기능 검색: 이를 통해 에이전트는 자신의 기능을 광고할 수 있습니다. 클라이언트는 특정 작업에 가장 적합한 에이전트를 쉽게 식별할 수 있습니다. 에이전트가 자신의 기술과 전문 지식을 선보이는 디지털 마켓플레이스와 같습니다.
- 작업 및 상태 관리: 클라이언트와 에이전트 간의 통신은 작업 실행을 중심으로 이루어집니다. 이러한 작업은 프로토콜에 의해 정의되고 명확하게 정의된 라이프사이클을 갖습니다. 작업의 결과를 아티팩트라고 합니다. 작업과 해당 상태의 관리는 안정적이고 추적 가능한 워크플로우를 보장합니다.
- 안전한 협업: 에이전트는 메시지를 안전하게 교환하여 컨텍스트를 공유하고, 응답을 제공하고, 아티팩트를 전달하거나, 사용자 지침을 전달할 수 있습니다. 이는 에이전트가 원활하게 협력할 수 있는 협업 환경을 조성합니다.
- 사용자 경험 협상: 모든 메시지에는 생성된 이미지와 같은 자체 포함 콘텐츠 조각인 ‘파트’가 포함됩니다. 각 파트에는 콘텐츠 유형이 지정되어 있어 클라이언트와 원격 에이전트 모두 필요한 형식을 합의할 수 있습니다. 이 기능에는 iframe, 비디오 및 웹 양식과 같은 사용자의 UI 기능 협상도 포함됩니다.
기능 검색 및 사용자 경험 협상 기능은 에이전트 마켓플레이스 생성을 위한 길을 열어주기 때문에 특히 매력적입니다. 이러한 마켓플레이스에서 공급자는 자신의 에이전트를 나열할 수 있으며, 클라이언트는 특정 작업을 수행할 가장 적합한 에이전트를 선택할 수 있습니다.
이 개념은 매우 유망하고 AI 에이전트 시장의 성장에 잠재적으로 필수적이지만, 이 비전을 실현하려면 상호 작용 프로토콜을 정의하는 것 이상이 필요합니다.
Agent2Agent 프로토콜 개념 디코딩
프로토콜을 뒷받침하는 핵심 개념을 이해하는 것은 효과적인 구현 및 활용에 매우 중요합니다. 이러한 개념은 이미 많은 AI 에이전트 개발자에게 익숙할 것입니다.
- 에이전트 카드: 이는 에이전트의 기능, 기술, 엔드포인트 URL 및 인증 요구 사항을 자세히 설명하는 공개 메타데이터 파일입니다. 에이전트 카드는 검색 단계에서 중요한 역할을 하여 사용자가 적절한 에이전트를 선택하고 에이전트와 상호 작용하는 방법을 이해할 수 있도록 합니다.
- 서버: JSON 사양에 정의된 대로 A2A 프로토콜 메서드를 구현하는 에이전트입니다. 기본적으로 서버는 A2A 프로토콜을 통해 서비스를 제공하는 에이전트입니다.
- 클라이언트: A2A 서비스를 사용하는 애플리케이션 또는 다른 에이전트일 수 있습니다. 클라이언트는 요청을 시작하고 서버에서 제공하는 기능을 활용합니다.
- 작업: 에이전트의 기본 작업 단위입니다. 클라이언트가 시작하고 서버가 수행하며, 라이프사이클 전반에 걸쳐 다양한 상태를 거칩니다.
- 메시지: 클라이언트와 에이전트 간의 통신 교환을 나타냅니다. 각 메시지에는 정의된 역할이 있으며 파트로 구성됩니다.
- 파트: 메시지 또는 아티팩트 내의 기본 콘텐츠 단위입니다. 파트는 텍스트, 파일 또는 구조화된 데이터일 수 있습니다. 이를 통해 다양한 데이터 유형을 유연하게 통신할 수 있습니다.
- 아티팩트: 에이전트가 작업을 완료하는 동안 생성한 출력을 나타냅니다. 메시지와 마찬가지로 아티팩트에도 파트가 포함됩니다.
- 스트리밍: 프로토콜은 스트리밍을 지원하여 서버가 장기 실행 작업의 상태에 대해 클라이언트를 실시간으로 업데이트할 수 있도록 합니다. 이는 지속적인 피드백을 제공하여 사용자 경험을 향상시킵니다.
Agent2Agent 프로젝트의 현재 상황
A2A는 최근에 공개되었으며, 해당 사양은 이제 GitHub에서 사용할 수 있습니다. 현재로서는 공식 로드맵이나 프로덕션 지원 구현은 없습니다. 그러나 Google은 2025년 후반에 프로덕션 지원 버전을 출시하기 위해 파트너와 적극적으로 협력하고 있습니다.
A2A GitHub 리포지토리는 TypeScript와 Python 모두에서 여러 코드 샘플과 포괄적인 데모 애플리케이션을 제공합니다. 이 애플리케이션은 다양한 Agent Development Kits(ADK)를 사용하여 개발된 에이전트 간의 상호 작용을 보여줍니다.
이는 실험을 위한 기반을 제공하지만, A2A는 미션 크리티컬 애플리케이션에서 채택되기 전에 에이전트 워크플로우 배포에 사용되는 기존 프레임워크 및 도구 에코시스템에 통합되어야 합니다.
프로토콜 정의에 대해 Google과 협력하는 많은 주요 업체(특히 기본 모델을 제공하는 회사는 없음)의 지원은 필요한 도구가 곧 제공될 것이며 A2A가 주요 에이전트 프레임워크에 통합될 것임을 강력히 시사합니다.
A2A와 Model Context Protocol(MCP) 비교: 차이점 이해
Anthropic에서 개발한 Model Context Protocol(MCP)을 사용하면 애플리케이션이 대규모 언어 모델에 컨텍스트를 제공할 수 있습니다. Anthropic은 MCP를 ‘AI 애플리케이션용 USB-C 포트’로 설명하여 USB가 다양한 주변 장치를 장치에 연결하는 것과 마찬가지로 LLM을 데이터 소스 및 도구에 연결하는 표준화된 방법을 제공합니다.
Google에 따르면 A2A는 MCP를 대체하기 위한 것이 아닙니다. 두 프로토콜 간에는 최소한의 중복이 있습니다. 서로 다른 문제를 해결하고 서로 다른 추상화 수준에서 작동합니다. A2A는 에이전트 간의 상호 작용을 용이하게 하는 반면 MCP는 대규모 언어 모델을 도구에 연결하고, 도구는 서비스를 넘어 데이터에 연결합니다. 따라서 두 프로토콜은 상호 보완적입니다.
Agent2Agent와 Model Context Protocol은 동일한 퍼즐의 두 조각이며 에이전트 워크플로우와 유비쿼터스 AI에 대한 미래 비전을 실현하려면 둘 다 필요합니다.