최근 Google은 Agent2Agent, 줄여서 A2A라는 에이전트를 위한 새로운 오픈 프로토콜을 발표했습니다. 동시에 Alibaba Cloud의 Bailian도 MCP에 진출을 발표했습니다. A2A와 MCP가 무엇인지 자세히 살펴보겠습니다.
이러한 프로토콜을 이해하려면 국가 간 외교에 대한 비유를 생각해 보십시오. 각 AI 에이전트를 고유한 언어와 관습을 가진 작은 국가라고 상상해 보세요. 이러한 ‘국가’들은 같은 건물 내에 대사관을 두고 서로 소통하고, 교역하고, 정보를 교환하려고 합니다.
이상적인 시나리오에서는 이들 국가가 우호적인 관계를 유지하고 명확한 외교 규칙을 준수하여 원활하게 상호 작용하고, 합의에 서명하고, 회의 테이블 주변에서 국제 프로젝트에 협력할 수 있습니다.
그러나 현실은 각 대사관이 서로 다른 프로토콜을 사용하여 독립적으로 운영된다는 것입니다. 결과적으로 ‘A국’과의 간단한 무역 협정을 시작하려면 조항, 인증, 번역 및 특수 키를 포함하여 수많은 요구 사항을 충족해야 합니다. ‘B국’ 및 ‘C국’과 교류하려면 유사한 절차를 여러 번 반복해야 합니다. 이러한 임시적이고 단편적이며 다면적인 접근 방식은 통신 비용을 부풀려 각 상호 작용에 추가 ‘정보 관세’가 부과됩니다.
과거에는 AI 에이전트가 협업을 시도할 때 유사한 어려움에 직면했습니다.
예를 들어, 이메일에 자동으로 응답하는 에이전트와 일정을 지원하기 위해 캘린더 애플리케이션에 통합된 에이전트가 있을 수 있습니다. 그러나 이러한 AI 개체는 직접 통신하는 데 어려움을 겪으므로 정보를 수동으로 복사하여 붙여넣거나 사용자 지정으로 구축된 인터페이스에 의존해야 합니다.
결과적으로 AI 에이전트는 격리된 상태로 작동하여 상호 운용성이 떨어집니다. 이러한 단편화는 여러 AI 애플리케이션 사이를 탐색해야 하는 사용자를 좌절시키고 AI의 잠재력을 제한합니다. 다중 에이전트 협업을 통해 수행할 수 있는 복잡한 작업은 인위적으로 개별 사일로 내에 갇혀 있습니다.
이러한 상황은 제2차 세계 대전 이후의 상황을 반영하며, 각 AI 에이전트는 자율적으로 행동하고 통일된 규칙이 없으며 통신 장벽에 직면합니다. 현재의 AI 생태계는 전후 황무지와 유사하며 데이터와 기능에 액세스하기 위해 특정 인터페이스와 프로토콜을 준수해야 합니다. 표준의 부재는 새로운 협업 관계마다 추가 ‘관세’를 부과하여 고립과 사리사욕으로 특징지어지는 단절되고 비효율적인 AI 생태계를 초래합니다.
AI 산업은 에이전트와 외부 도구 간의 원활한 상호 작용을 촉진하기 위해 보편적으로 허용되는 프로토콜을 설정할 가능성을 모색하고 있습니다. Google과 Anthropic은 각각 A2A 프로토콜과 MCP 프로토콜이라는 솔루션을 제안하면서 선두 주자로 떠올랐습니다.
A2A 프로토콜
A2A 프로토콜은 Agent2Agent의 약자로 AI 에이전트가 직접 통신하고 협업할 수 있도록 합니다.
A2A 프로토콜의 주요 목표는 다양한 출처와 공급업체의 에이전트가 서로 이해하고 협력할 수 있도록 하는 것입니다. 이는 세계 무역 기구가 무역 장벽을 줄이려는 노력과 유사합니다.
A2A를 채택함으로써 다양한 공급업체와 프레임워크의 에이전트는 자유 무역 지대에 가입하여 공통 언어를 사용하여 통신하고 개별 에이전트의 역량을 뛰어넘는 복잡한 작업을 원활하게 협력하여 수행할 수 있습니다.
A2A가 어떻게 작동하는지 설명하기 위해 다음 비유를 고려해 보겠습니다.
1. 에이전트 = 국가 외교관
각 에이전트는 국가 대사관을 대표하는 외교관 역할을 합니다. A2A 프로토콜은 통일된 외교 예절 및 통신 절차를 확립하는 것을 목표로 합니다. 이전에는 ‘A국’의 외교관은 프랑스어로만 통신하고, ‘B국’의 외교관은 키릴 문자를 사용하고, ‘C국’은 고대 금박 편지를 통해 서신을 요구했습니다. A2A 프로토콜은 모든 참가자가 미리 합의된 언어로 통신하고, 동일한 형식으로 문서를 제출하고, 합의된 결과를 실행할 수 있도록 보장합니다.
2. 에이전트 카드 = 외교 신임장 / 대사 명함
A2A 프레임워크 내에서 각 에이전트는 에이전트의 이름, 버전, 기능 및 지원되는 언어 또는 형식과 같은 세부 정보를 포함하는 외교관 명함과 유사한 ‘에이전트 카드’를 게시해야 합니다.
외교관의 명함이 자신의 역할과 소속을 식별하는 방법과 유사하게 에이전트 카드는 에이전트의 기술, 인증 방법 및 입력/출력 형식을 나열합니다. 이를 통해 다른 외교관은 기능을 신속하게 식별하고 이해하여 통신 장벽을 최소화할 수 있습니다.
3. 태스크 = 양자 또는 다자간 외교 프로젝트
태스크 개념은 A2A의 중심입니다. 에이전트가 다른 에이전트에게 태스크를 위임하려는 경우 ‘협력 프로젝트 의향서’를 발행합니다. 수락 시 양 당사자는 진행 상황을 추적하고 완료될 때까지 정보를 교환하기 위해 태스크 ID를 기록합니다.
외교적 용어로 한 국가가 다른 국가에 ‘국경을 넘는 고속 철도 건설에 협력하고 싶습니다. 엔지니어링 팀을 파견해 주십시오.’라고 제안할 수 있습니다. 이는 A2A 태스크를 미러링하며, 여기서 시작 당사자는 요구 사항을 간략하게 설명하고, 원격 에이전트는 수락하고, 양 당사자는 프로젝트 전반에 걸쳐 진행 상황을 정기적으로 업데이트합니다.
메시지는 프로젝트의 초기 또는 중간 단계에서 교환되는 통신을 나타내며, 외교 케이블, 메모 및 사절 교환과 유사합니다.
4. 푸시 알림 = 외교 대사관 게시판
A2A에서 태스크가 완료하는 데 시간이 오래 걸리는 장기 프로젝트인 경우 원격 에이전트는 장기 인프라 프로젝트에 대한 주기적인 업데이트를 제공하는 국가와 유사하게 푸시 알림을 통해 시작 당사자를 업데이트할 수 있습니다. 이는 비동기 협업 기능을 향상시킵니다.
5. 인증 및 보안 = 외교 특권 및 프로토콜
A2A는 엔터프라이즈급 인증 전략을 사용하며, 양쪽 통신 당사자가 자격 증명을 확인하여 사칭이나 악의적인 도청을 방지해야 합니다. 이 메커니즘은 외교 특권 및 프로토콜과 유사합니다.
본질적으로 A2A는 표준화된 통신 및 보안을 강조하면서 국제 외교 또는 비즈니스 협업의 역학을 미러링합니다.
MCP 프로토콜
MCP 프로토콜 또는 모델 컨텍스트 프로토콜은 Anthropic이 2024년 11월에 도입하고 오픈 소스한 표준입니다.
A2A는 AI 외교관 간의 통신 프로세스를 다루지만 신뢰할 수 있는 정보 소스가 없다는 문제가 여전히 남아 있습니다. 아무리 웅변적인 외교관이나 비즈니스 임원이라도 국제 환경 및 자원 할당에 대한 정확한 정보 없이는 효과적으로 운영할 수 없습니다.
현대 외교관은 업무를 수행하기 위해 비자 시스템, 국제 결제 시스템 및 정보 데이터베이스와 같은 외부 도구에 의존합니다. 마찬가지로 복잡한 책임을 맡은 에이전트는 다양한 데이터베이스, 문서 시스템, 엔터프라이즈 애플리케이션, 심지어 하드웨어 장치에 연결해야 합니다.
이는 외교관을 위한 포괄적인 정보 기관을 설립하고 업무를 용이하게 하기 위해 도구에 대한 액세스 권한을 부여하는 것과 같습니다.
이전에는 에이전트가 사용자 지정 플러그인을 개발하고 다양한 도구와 깊이 통합해야 했는데 이는 번거롭고 시간이 많이 걸렸습니다. 그러나 이제 MCP를 사용하여 프로세스를 간소화할 수 있습니다.
MCP는 대규모 언어 모델과 외부 데이터 소스 및 도구 간의 상호 작용을 표준화합니다. Anthropic은 MCP를 AI 애플리케이션용 USB-C 포트에 비유합니다.
USB-C는 단일 포트를 통해 충전 및 데이터 전송을 처리하는 장치를 위한 범용 인터페이스 역할을 합니다. MCP는 AI 도메인에서 범용 인터페이스를 만들어 다양한 모델과 외부 시스템이 매번 사용자 지정 통합 솔루션을 개발하는 대신 동일한 프로토콜을 사용하여 연결할 수 있도록 하는 것을 목표로 합니다.
데이터베이스, 검색 엔진 또는 타사 애플리케이션에 연결하는 AI 모델은 모두 MCP를 지원하는 경우 원활하게 통신할 수 있습니다.
MCP는 클라이언트-서버 아키텍처를 사용합니다.
1. MCP 서버 = 통합 정보 기관
조직이나 개인은 데이터베이스, 파일 시스템, 캘린더 및 타사 서비스를 MCP 서버로 캡슐화할 수 있습니다. 이러한 서버는 MCP 프로토콜을 준수하여 균일하게 포맷된 액세스 엔드포인트를 노출하여 MCP 클라이언트 표준을 준수하는 모든 에이전트가 요청을 보내고, 정보를 검색하거나, 작업을 실행할 수 있도록 합니다.
2. MCP 클라이언트 = 외교관이 사용하는 터미널 장비
에이전트 외교관은 ‘재무 시스템에서 재고 데이터를 검색’, ‘API에 요청 제출’ 또는 ‘PDF 문서 검색’과 같은 명령을 입력할 수 있는 전용 터미널 장비를 휴대합니다.
MCP가 없으면 다양한 시스템과 통합하려면 번거로운 다양한 액세스 코드를 작성해야 합니다. 그러나 MCP를 사용하면 프로토콜을 지원하는 클라이언트는 쉽게 다른 MCP 서버 간에 전환하여 정보를 검색하고 비즈니스 프로세스를 실행할 수 있습니다.
본질적으로 MCP는 AI 에이전트와 외부 리소스 간의 원활한 통합을 촉진합니다.
A2A와 MCP의 차이점
A2A와 MCP의 차이점을 명확히 하기 위해 글로벌 경제 분석 보고서 생산과 같은 초국가적 작업에 협력하기 위해 국가 원수(기업의 AI 에이전트를 대표)가 모이는 가상 국제 정상 회의를 고려하십시오.
보편적인 프로토콜이 없으면 각 대표가 다른 언어를 사용하므로 그러한 회의는 사실상 불가능합니다. 그러나 A2A 프로토콜을 사용하면 모든 대표는 회의에 들어가기 전에 ‘A2A 비엔나 외교 협약’에 서명하여 통일된 형식을 사용하여 통신하고, 자신을 식별하고, 의도를 밝히고, 응답할 때 이전 발언 ID를 인용하는 데 동의합니다.
이를 통해 ‘에이전트 G’는 A2A 형식으로 ‘에이전트 O’에 메시지를 보내고 ‘에이전트 O’는 그에 따라 응답합니다. 이는 서로 다른 회사의 AI 에이전트 간의 방해받지 않는 통신의 첫 번째 인스턴스를 나타냅니다.
토론 중에 AI 대표는 데이터를 참조하거나 분석 도구를 사용해야 합니다. Anthropic의 ‘에이전트 A’는 외부 데이터 또는 도구 지원을 위해 MCP 시스템을 사용할 것을 제안합니다.
회의장 옆에 ‘MCP 동시 통역실’이 설치되어 요청을 받으면 MCP를 통해 통일된 언어로 응답할 수 있는 전문가가 배치됩니다.
예를 들어 ‘에이전트 Q’는 계산을 위해 클라우드 데이터베이스에 액세스해야 합니다. 누군가를 국가로 다시 보내는 대신 데이터베이스 X에서 데이터를 요청하는 MCP 요청을 보냅니다. MCP 데이터베이스 관리자는 요청을 번역하고 결과를 검색하여 MCP 언어로 ‘에이전트 Q’에 응답합니다. MCP 번역이 인식된 형식으로 되어 있기 때문에 전체 프로세스가 다른 에이전트에게 투명하여 ‘에이전트 Q’가 인용한 데이터를 이해합니다.
보고서 작성 진행 상황에 따라 ‘에이전트 G’와 ‘에이전트 A’는 각자의 기여를 통합해야 한다는 것을 깨닫습니다. ‘에이전트 G’는 수치 분석을 전문으로 하고 ‘에이전트 A’는 언어 요약에 능숙합니다.
‘에이전트 G’는 A2A를 통해 GDP 성장률 데이터를 통신하고 ‘에이전트 A’는 MCP를 통해 Excel 스프레드시트 플러그인에 연결하여 데이터 추세를 확인하고 요약 단락으로 응답합니다.
이 시나리오에서 A2A는 에이전트 간의 통신을 촉진하는 반면 MCP는 에이전트가 외부 도구 및 정보에 액세스할 수 있도록 합니다. 이 프로토콜은 함께 AI 버전의 유엔을 위한 맞춤형 통신 계약을 만듭니다. 이러한 프로토콜을 통해 AI 에이전트는 효과적으로 협력하여 상호 연결된 AI 생태계를 형성할 수 있습니다.
A2A는 직접 에이전트 통신을 처리하는 외교 통신 전용 핫라인과 유사합니다. MCP는 지능형 개체가 외부 정보에 연결되는 문제를 해결하는 동시 통역 및 리소스 공유 시스템과 유사합니다.
A2A와 MCP의 부상은 AI 산업이 경쟁보다는 협업을 향해 진화하고 있음을 예고합니다. 수많은 AI 에이전트가 웹사이트처럼 배포되어 A2A를 통해 검색하고 통신하고 MCP를 통해 리소스에 액세스하고 지식을 공유할 것입니다.