구현된 AI를 향한 탐구: 문샷 목표
수년 동안 로봇 산업은 ‘구현된 AI’라는 달성하기 어려운 목표를 추구해 왔습니다. 이는 안전성과 정밀성을 유지하면서 새롭고 예측할 수 없는 다양한 시나리오를 통해 로봇을 자율적으로 제어할 수 있는 인공 지능을 만드는 것입니다. Nvidia와 같은 회사에서 적극적으로 추진하고 있는 이 야망은 로봇을 실제 세계에서 광범위한 작업을 수행할 수 있는 다재다능한 노동자로 변모시킬 수 있는 잠재력을 가진 ‘성배’로 남아 있습니다.
Gemini Robotics: 언어와 비전의 기반 위에 구축
Google의 새로운 모델은 Gemini 2.0 대규모 언어 모델의 힘을 활용하여 로봇 애플리케이션의 특정 요구 사항을 포괄하도록 기능을 확장합니다. Gemini Robotics는 Google이 ‘시각-언어-행동’(VLA) 능력이라고 부르는 것을 통합합니다. 이를 통해 모델은 시각적 입력을 처리하고, 자연어 명령을 해석하고, 이러한 입력을 정확한 물리적 움직임으로 변환할 수 있습니다. 반면 Gemini Robotics-ER은 ‘구현된 추론’에 중점을 두어 기존 로봇 제어 시스템과의 원활한 통합을 가능하게 하는 향상된 공간 이해력을 자랑합니다.
이해에서 행동으로: 새로운 수준의 정교함
이러한 발전의 실제적인 의미는 심오합니다. Gemini Robotics가 장착된 로봇에게 ‘바나나를 집어 바구니에 넣어’라고 지시하는 것을 상상해 보십시오. 로봇은 카메라 기반 비전을 활용하여 바나나를 식별하고 로봇 팔을 능숙하게 안내하여 작업을 실행합니다. 또는 ‘종이접기 여우를 접어’라는 명령을 생각해 보십시오. 로봇은 종이접기와 종이 접기의 섬세한 기술에 대한 지식을 바탕으로 복잡한 작업을 꼼꼼하게 수행합니다.
2023년에 Google의 RT-2 모델은 일반화된 로봇 기능을 향한 중요한 진전을 이루었습니다. 인터넷 데이터를 활용하여 RT-2는 로봇이 언어 명령을 이해하고 새로운 상황에 적응할 수 있도록 지원하여 이전 모델에 비해 보이지 않는 작업에서 성능을 두 배로 높였습니다. 2년 후, Gemini Robotics는 단순한 이해를 넘어 RT-2의 범위를 명시적으로 벗어난 복잡한 물리적 조작 실행을 포괄하는 또 다른 실질적인 도약을 이룬 것으로 보입니다.
RT-2는 사전에 연습한 물리적 움직임을 재사용하는 데 국한되었지만 Gemini Robotics는 정교함이 놀랍도록 향상된 것으로 보고되었습니다. 이 새로운 정교함은 종이접기의 섬세한 기술과 Zip-loc 가방에 간식을 정확하게 포장하는 것과 같이 이전에는 달성할 수 없었던 작업을 가능하게 합니다. 명령을 이해하는 로봇에서 섬세한 물리적 작업을 실행할 수 있는 로봇으로의 이러한 전환은 DeepMind가 로봇 공학에서 가장 지속적인 과제 중 하나를 해결하는 데 근접했을 수 있음을 의미합니다. 즉, 로봇이 ‘지식’을 실제 세계에서 신중하고 정확한 움직임으로 변환할 수 있도록 하는 것입니다.
일반화: 실제 적응성의 핵심
DeepMind는 새로운 Gemini Robotics 시스템이 명시적으로 훈련되지 않은 새로운 작업을 수행하는 능력인 일반화가 크게 향상되었음을 강조합니다. 이것은 중요한 발전입니다. 회사의 발표에 따르면 Gemini Robotics는 ‘다른 최첨단 시각-언어-행동 모델에 비해 포괄적인 일반화 벤치마크에서 성능을 두 배 이상 향상’시킵니다.
일반화는 각 상황에 대한 특정 교육 없이 새로운 시나리오에 적응할 수 있는 로봇이 예측할 수 없는 실제 환경에서 효과적으로 작동하는 데 핵심이기 때문에 가장 중요합니다. 이러한 적응성은 특수하고 작업별 로봇과 진정으로 다재다능하고 적응 가능한 기계를 구분하는 요소입니다.
일반 로봇 두뇌: Google의 야심 찬 비전
Google의 노력은 다양한 로봇 플랫폼을 제어할 수 있는 다재다능한 AI인 ‘일반 로봇 두뇌’를 만드는 데 분명히 집중되어 있습니다. 이러한 비전에 따라 회사는 ‘Gemini 2.0으로 차세대 휴머노이드 로봇을 구축’하기 위해 선도적인 로봇 회사인 Apptronik과의 파트너십을 발표했습니다.
주로 ALOHA 2로 알려진 양손 로봇 플랫폼에서 훈련되었지만 Google은 Gemini Robotics가 다양한 로봇 유형을 제어할 수 있는 다재다능함을 갖추고 있다고 말합니다. 여기에는 연구 중심의 Franka 로봇 팔과 Apptronik의 Apollo 로봇과 같은 더 정교한 휴머노이드 시스템이 포함됩니다. 이러한 적응성은 Gemini Robotics가 광범위한 로봇 애플리케이션을 위한 범용 ‘두뇌’가 될 수 있는 잠재력을 강조합니다.
휴머노이드 로봇 환경: 하드웨어와 소프트웨어의 융합
휴머노이드 로봇 공학의 추구는 수많은 회사가 과제의 다양한 측면에 기여하는 협력적인 노력입니다. Figure AI 및 Boston Dynamics(이전 Alphabet 자회사)와 같은 회사는 고급 휴머노이드 로봇 하드웨어를 개발하기 위해 부지런히 노력해 왔습니다. 그러나 이러한 로봇에 지능과 자율성을 부여하는 소프트웨어 구성 요소인 진정으로 효과적인 AI ‘드라이버’는 여전히 중요한 누락된 부분으로 남아 있습니다.
이 분야에서 Google의 노력은 탄력을 받고 있습니다. 회사는 Boston Dynamics, Agility Robotics 및 Enchanted Tools를 포함한 선도적인 로봇 회사에 ‘신뢰할 수 있는 테스터’ 프로그램을 통해 Gemini Robotics-ER에 대한 제한된 액세스 권한을 부여했습니다. 이러한 협력적 접근 방식은 진정으로 유능한 휴머노이드 로봇의 개발 및 배포를 가속화하기 위한 공동 노력을 시사합니다.
안전 제일: 책임감 있는 로봇 공학을 위한 계층화된 접근 방식
로봇 공학에서 안전의 중요성을 인식한 Google은 기존 로봇 안전 조치를 통합하는 ‘계층화된 전체론적 접근 방식’을 강조합니다. 이러한 조치에는 충돌 회피 및 힘 제한이 포함되어 로봇이 안전한 매개변수 내에서 작동하도록 합니다.
또한 회사는 ‘로봇 헌법’ 프레임워크 개발을 설명합니다. Isaac Asimov의 로봇 3원칙에서 영감을 받은 이 프레임워크는 로봇의 윤리적이고 안전한 개발 및 배포를 위한 일련의 지침 원칙을 제공합니다. 이 프레임워크와 함께 Google은 연구원이 로봇 행동의 안전 의미를 평가하는 데 도움이 되도록 설계된 ‘ASIMOV’라는 적절한 이름의 데이터 세트를 출시했습니다.
ASIMOV 데이터 세트: 안전 평가 표준화
ASIMOV 데이터 세트는 물리적 피해 방지를 넘어 로봇 안전을 평가하기 위한 표준화된 방법을 확립하려는 Google의 노력을 나타냅니다. 이 데이터 세트는 연구원이 AI 모델이 다양한 시나리오에서 로봇 행동의 잠재적 결과를 얼마나 잘 이해하는지 평가하는 데 도움이 되도록 설계되었습니다. Google의 발표에 따르면 이 데이터 세트는 ‘연구원이 실제 시나리오에서 로봇 행동의 안전 의미를 엄격하게 측정하는 데 도움이 될 것’입니다. 이 이니셔티브는 로봇 공학 분야에서 책임감 있는 혁신에 대한 Google의 약속을 강조합니다.
로봇 공학의 미래: 가능성에 대한 엿보기
Google은 현재 연구 단계에 머물러 있는 새로운 AI 모델에 대한 구체적인 일정이나 상업적 응용 프로그램을 아직 발표하지 않았지만, 입증된 발전은 부인할 수 없을 정도로 중요합니다. Google에서 공개한 데모 비디오는 AI 기반 기능의 놀라운 발전을 보여줍니다. 그러나 이러한 시연은 통제된 연구 환경에서 수행되었다는 점을 인정하는 것이 중요합니다. 이러한 시스템의 진정한 테스트는 예측할 수 없고 역동적인 실제 환경에서 안정적이고 안전하게 수행할 수 있는 능력에 달려 있습니다.
Gemini Robotics 및 Gemini Robotics-ER의 개발은 로봇 공학 진화의 중추적인 순간을 나타냅니다. 이러한 모델은 새로운 수준의 정교함, 적응성 및 자율성을 열어 로봇이 우리 삶에 원활하게 통합되고 광범위한 작업에 기여할 수 있는 길을 열어줄 잠재력이 있습니다. 연구가 진행되고 이러한 기술이 성숙해짐에 따라 우리는 로봇이 가정, 직장 및 지역 사회에서 점점 더 중요한 역할을 하는 미래를 기대할 수 있습니다. 진정으로 구현된 AI를 향한 여정은 계속되고 있지만 Google의 최신 발전은 앞으로 펼쳐질 흥미로운 가능성에 대한 매력적인 엿보기를 제공합니다. 정교한 하드웨어와 점점 더 지능적인 소프트웨어의 융합은 로봇 환경을 변화시켜 로봇이 단순한 도구가 아니라 우리 일상 생활의 다재다능한 파트너가 되는 미래에 더 가까이 다가갈 준비가 되어 있습니다.