Google Gemini AI 비디오, 미지근한 반응

Google이 공식적으로 인공지능 비디오 시장에 진출하여 Gemini Advanced 구독자에게 Veo 2 AI 비디오 모델을 제공하기 시작했습니다.

이는 Google AI 비디오 기술의 공식적인 데뷔를 의미하지만, 처음에는 유료 구독을 통해서만 이용할 수 있습니다.

Veo 2를 사용해보고 싶은 사람들은 Gemini Advanced를 포함하는 Google One AI 프리미엄 구독의 1개월 무료 평가판을 이용할 수 있습니다. 평가판 후에는 월 20달러에 구독할 수 있습니다. Veo 2는 Google Labs의 새로운 AI 애니메이션 프로젝트에도 통합되어 있습니다. Google은 앞으로 Veo 2의 가용성을 무료 사용자에게까지 확대할 계획입니다.

AI 비디오의 등장은 생성적 AI의 최신 진화를 나타냅니다. Google의 Veo 2의 광범위한 릴리스는 OpenAI (Sora) 및 Adobe (Firefly)의 유사한 이니셔티브에 따른 것입니다. AI 크리에이티브 서비스 부문은 주요 기술 회사들이 AI 비디오 모델을 공개하면서 점점 더 경쟁이 치열해지고 있습니다. Google의 진출은 AI 비디오 서비스 제공의 성장 모멘텀을 의미합니다.

Google의 Gemini 개인 정보 보호 정책에 따르면 채팅 및 파일을 포함한 사용자 상호 작용에서 데이터를 수집할 수 있으므로 사용자는 기밀 정보를 공유하지 않도록 권고합니다. Google의 생성적 AI 정책에 동의함으로써 사용자는 유해하거나 불법적인 콘텐츠 생성을 방지하기 위한 회사의 허용 가능한 사용 지침을 준수하는 데 동의합니다.

사용자는 Gemini Advanced 인터페이스 내의 모델 옵션에서 Veo 2를 선택하여 Gemini 웹 또는 모바일 앱을 통해 짧은 AI 클립을 생성할 수 있습니다. 비디오는 일반적으로 1~2분 안에 생성됩니다.

이러한 AI 생성 클립은 지속 시간이 8초로 제한되고 해상도는 720p이며 오디오가 없습니다. Gemini는 자동으로 비디오를 16:9 가로 형식으로 렌더링하며 프롬프트에 지정된 경우에도 대체 크기에 대한 명확한 옵션은 없습니다. 또한 사용자는 이미지 또는 스타일 참조를 업로드할 수 없으므로 원하는 비디오 결과를 얻으려면 AI 프롬프트 엔지니어링에 능숙해야 합니다.

사용자가 매달 생성할 수 있는 비디오 수에는 제한이 있지만 이러한 크레딧의 정확한 측정은 정의되지 않은 상태로 남아 있습니다. Google은 사용자가 한도에 가까워지면 Gemini 내에서 경고를 받을 것이라고 밝혔습니다.

Google의 SynthID 워터마크는 Veo 2 비디오에 자동으로 포함됩니다. 이러한 눈에 보이지 않는 워터마크는 AI에서 완전히 생성된 콘텐츠를 식별하는 역할을 합니다. Google은 Imagen 3 텍스트-이미지 모델을 사용하여 생성된 이미지에도 이 기술을 사용합니다.

Veo 2에 대한 초기 평가는 비디오가 만족스럽지만 눈에 띄지 않는다는 것을 시사합니다. Gemini는 프롬프트를 훌륭하게 준수하여 오류나 불일치가 거의 없이 정확하게 콘텐츠를 생성했습니다. 그러나 Sora 및 Firefly와 같은 플랫폼을 사용하면 1080p와 같은 더 높은 해상도로 AI 비디오를 생성할 수 있으며 사후 편집을 최소화하는 데 중요한 더 광범위한 사용자 지정 옵션을 제공합니다. Google이 Veo 업그레이드에 대한 계획을 가지고 있을 것은 의심할 여지가 없지만 Veo 2는 현재 실험을 위한 흥미로운 도구 역할을 하지만 제작자의 일상적인 워크플로에 필수적인 도구가 될 가능성은 낮습니다.

Gemini의 Veo 2 심층 분석: 포괄적인 개요

Google의 Veo 2의 초기 릴리스가 OpenAI의 Sora 및 Adobe의 Firefly와 같은 경쟁업체에 비해 미흡해 보일 수 있지만, 해당 기능, 제한 사항 및 잠재력의 세부 사항을 더 자세히 살펴보는 것이 중요합니다. 이러한 뉘앙스를 이해하는 것은 Veo 2를 자신의 창의적인 워크플로에 통합하는 것을 고려하는 모든 사람에게 매우 중요합니다.

해상도 및 출력 품질

Veo 2의 가장 즉각적인 제한 사항 중 하나는 최대 출력 해상도가 720p라는 것입니다. 4K 비디오가 점점 더 표준이 되고 심지어 모바일 장치도 고화질로 녹화할 수 있는 시대에 이러한 제약은 생성된 콘텐츠의 인식되는 품질에 상당한 영향을 미칩니다. 720p는 빠른 소셜 미디어 게시물이나 내부 통신에는 충분할 수 있지만 높은 시각적 충실도가 필요한 전문적인 애플리케이션이나 프로젝트에는 미치지 못합니다. 1080p 출력을 제공하는 Sora와 같은 경쟁업체는 이 영역에서 즉시 우위를 점합니다.

오디오 부재

Veo 2 생성 비디오에 오디오가 없다는 것도 또 다른 주목할 만한 단점입니다. 사운드는 비디오 스토리텔링의 중요한 요소이며 사운드가 없으면 음악, 음향 효과 또는 대화를 추가하기 위해 추가 사후 제작 작업이 필요합니다. 이는 완성된 제품을 만드는 데 필요한 시간과 노력을 증가시킬 뿐만 아니라 AI 생성 프로세스 자체 내에서 창의적인 가능성을 제한합니다. 통합 오디오를 사용하여 매력적인 비디오를 빠르게 만들고 싶어하는 사용자는 Veo 2가 부족하다는 것을 알게 될 것입니다.

제한된 사용자 지정 옵션

Veo 2의 제한된 사용자 지정 옵션은 유용성을 더욱 제한합니다. 표준 16:9 형식 이외의 종횡비를 지정할 수 없는 것과 이미지 또는 스타일 참조에 대한 지원 부족은 출력을 특정 창의적인 비전에 맞게 조정하는 것을 어렵게 만듭니다. 따라서 사용자는 텍스트 프롬프트에만 크게 의존해야 하는데, 이는 정확한 결과를 얻기 위해 미세 조정하기 어려울 수 있습니다. 대조적으로 시각적 입력과 스타일 및 구성을 보다 세밀하게 제어할 수 있는 플랫폼은 상당한 이점을 제공합니다.

프롬프트 엔지니어링 과제

사용자 지정의 제한을 감안할 때 Veo 2를 사용할 때 효과적인 프롬프트 엔지니어링이 가장 중요해집니다. 사용자는 AI를 원하는 결과로 안내하기 위해 자세하고 정확한 프롬프트를 작성하는 방법을 배워야 합니다. 이를 위해서는 AI가 언어를 해석하고 시각적 콘텐츠로 변환하는 방식을 깊이 이해해야 합니다. 실험을 통해 사용자가 이 기술을 개발하는 데 도움이 될 수 있지만 학습 곡선이 가파르고 경험이 풍부한 프롬프트 엔지니어조차도 일관된 결과를 얻기 위해 고군분투할 수 있습니다. 프롬프트 생성 과정에서 시각적 피드백이 없다는 점은 문제를 더욱 복잡하게 만듭니다.

월별 생성 제한

공개되지 않은 월별 생성 제한은 Veo 2의 유용성에 또 다른 불확실성을 더합니다. 이러한 제한이 계산되는 방법에 대한 명확한 정보가 없으면 사용자는 중요한 순간에 크레딧이 부족할까 봐 두려워 Veo 2를 워크플로에 완전히 통합하는 것을 주저할 수 있습니다. 이러한 투명성 부족은 AI 도구에 대한 예측 가능한 액세스에 의존하는 전문 사용자에게 특히 우려됩니다.

SynthID 워터마크의 약속

제한 사항에도 불구하고 Veo 2는 한 가지 주목할 만한 이점을 제공합니다. 바로 SynthID 워터마크의 포함입니다. 이러한 보이지 않는 워터마크는 AI 생성 콘텐츠를 사람이 만든 콘텐츠와 구별하는 데 도움이 되며, 이는 잘못된 정보와 딥페이크에 대한 싸움에서 점점 더 중요해지고 있습니다. 다양한 플랫폼과 편집 프로세스에서 AI 생성 비디오를 감지하는 데 있어 SynthID의 효과는 아직 확인되지 않았지만, 그 포함은 책임감 있는 AI 개발에 대한 Google의 약속을 나타냅니다.

미래 성장의 잠재력

Veo 2는 여전히 개발 초기 단계에 있다는 점을 기억하는 것이 중요합니다. Google은 AI 제품을 반복적으로 개선해 온 역사를 가지고 있으며 Veo 2는 앞으로 상당한 업데이트와 개선을 받을 가능성이 높습니다. 잠재적인 개선 사항은 다음과 같습니다.

  • 출력 해상도 증가(1080p, 4K)
  • 오디오 통합
  • 더 광범위한 사용자 지정 옵션(종횡비, 스타일 참조)
  • 향상된 프롬프트 엔지니어링 도구
  • 생성 제한에 대한 더 명확한 정보
  • 향상된 SynthID 워터마킹 기술

AI 비디오 생성의 더 넓은 맥락에서 Veo 2

Veo 2의 시장에서의 위치를 진정으로 이해하려면 다른 주요 AI 비디오 생성 플랫폼과 비교하는 것이 중요합니다. 각 플랫폼에는 고유한 강점과 약점이 있지만 이러한 차이점을 이해하면 사용자가 자신의 요구 사항에 가장 적합한 도구에 대해 정보에 입각한 결정을 내리는 데 도움이 될 수 있습니다.

OpenAI의 Sora

OpenAI의 Sora는 현재 사용 가능한 가장 과장된 AI 비디오 생성 플랫폼이라고 할 수 있습니다. 주요 강점은 다음과 같습니다.

  • 고품질 출력: Sora는 인상적인 시각적 충실도로 1080p 해상도로 비디오를 생성할 수 있습니다.
  • 현실적인 움직임: Sora는 믿을 수 있는 장면을 만드는 데 중요한 현실적이고 자연스러운 움직임을 만드는 데 탁월합니다.
  • 복잡한 장면 생성: Sora는 객체와 캐릭터 간의 복잡한 세부 사항과 상호 작용으로 비디오를 생성할 수 있습니다.
  • 텍스트-비디오 및 이미지-비디오: Sora는 텍스트 및 이미지 프롬프트를 모두 지원하여 사용자에게 높은 수준의 유연성을 제공합니다.

그러나 Sora에는 제한 사항도 있습니다.

  • 제한된 가용성: Sora는 현재 선택된 연구원 및 아티스트 그룹만 사용할 수 있습니다.
  • 높은 계산 비용: Sora로 비디오를 생성하려면 상당한 계산 리소스가 필요하므로 향후 높은 사용 비용이 발생할 수 있습니다.
  • 오용 가능성: 매우 현실적인 AI 생성 비디오를 생성하는 기능은 딥페이크 생성과 같은 오용 가능성에 대한우려를 제기합니다.

Adobe의 Firefly

Adobe의 Firefly는 AI 비디오 생성 분야의 또 다른 주요 업체입니다. 주요 강점은 다음과 같습니다.

  • Adobe Creative Suite와의 통합: Firefly는 Photoshop 및 Premiere Pro와 같은 Adobe의 인기 있는 창의적인 도구와 원활하게 통합되어 사용자가 AI 생성 콘텐츠를 기존 워크플로에 쉽게 통합할 수 있습니다.
  • 상업적 사용에 중점: Adobe는 특히 콘텐츠 라이선스 및 저작권 보호와 같은 기능을 제공하여 상업적 사용자를 대상으로 Firefly를 타겟팅하고 있습니다.
  • 대규모 교육 데이터 세트: Firefly는 대규모 Adobe Stock 이미지 데이터 세트에서 교육을 받아 고품질 출력을 보장하고 저작권이 있는 자료를 생성할 위험을 줄입니다.

그러나 Firefly에는 제한 사항도 있습니다.

  • 제한된 비디오 생성 기능: Firefly는 이미지와 텍스처를 생성하는 데 탁월하지만 비디오 생성 기능은 현재 Sora보다 덜 발전했습니다.
  • 구독 기반 가격: Firefly에 액세스하려면 Adobe Creative Cloud 구독이 필요하며 일부 사용자에게는 비용이 많이 들 수 있습니다.
  • Adobe 에코시스템에 대한 의존성: Adobe의 창의적인 도구에 익숙하지 않은 사용자는 Firefly를 워크플로에 통합하는 데 어려움을 겪을 수 있습니다.

기타 새로운 플랫폼

Sora 및 Firefly 외에도 고유한 기능과 기능을 가진 다양한 다른 AI 비디오 생성 플랫폼이 등장하고 있습니다. 이러한 플랫폼에는 다음이 포함됩니다.

  • RunwayML: RunwayML은 비디오 생성, 이미지 편집 및 스타일 전송을 포함한 창의적인 전문가를 위한 AI 도구 모음을 제공합니다.
  • Synthesia: Synthesia는 기업 교육 및 마케팅 비디오를 위한 AI 생성 아바타 및 가상 발표자를 만드는 데 중점을 둡니다.
  • Pictory: Pictory는 블로그 게시물과 기사를 소셜 미디어를 위한 매력적인 비디오로 바꾸는 데 특화되어 있습니다.

AI 비디오 생성의 미래

AI 비디오 생성 분야는 빠르게 진화하고 있으며 앞으로 몇 년 안에 상당한 발전이 있을 것으로 예상됩니다. 잠재적인 미래 트렌드는 다음과 같습니다.

  • 더 높은 해상도와 품질: AI 비디오 생성 플랫폼은 계속해서 출력의 해상도와 시각적 충실도를 개선하여 궁극적으로 AI 생성 비디오와 사람이 만든 비디오를 구별하기 어려워지는 지점에 도달할 것입니다.
  • 더 현실적인 움직임과 물리학: AI는 현실적인 움직임과 물리학을 시뮬레이션하는 데 더 능숙해져 AI 생성 비디오를 더 믿을 수 있고 몰입감 있게 만들 것입니다.
  • 향상된 제어 및 사용자 지정: 사용자는 카메라 각도, 조명 및 캐릭터 감정과 같은 세부 사항을 지정할 수 있어 창의적인 프로세스를 더 많이 제어할 수 있습니다.
  • 다른 AI 기술과의 통합: AI 비디오 생성이 자연어 처리 및 컴퓨터 비전과 같은 다른 AI 기술과 통합되어 새롭고 혁신적인 애플리케이션을 지원할 것입니다.
  • 비디오 생성의 민주화: AI 비디오 생성은 기술적 기술이나 예산에 관계없이 누구나 고품질 비디오를 더 쉽고 저렴하게 만들 수 있도록 할 것입니다.

Google의 Veo 2가 오늘날 시장에서 가장 인상적인 AI 비디오 생성 플랫폼은 아닐 수 있지만 AI 기술의 민주화를 향한 중요한 진전을 나타냅니다. 분야가 계속 진화함에 따라 더욱 강력하고 접근하기 쉬운 도구가 등장하여 모든 종류의 제작자가 자신의 비전을 실현할 수 있도록 지원할 가능성이 높습니다.