Gemini: 가상 어시스턴트로서의 역할
Gemini는 다양한 작업을 처리하는 데 능숙한 고급 가상 어시스턴트라고 생각할 수 있습니다. 문서 분석, 질문 응답, 이미지 및 비디오 생성, 연구 수행, 창작 글쓰기 지원, 웹 검색, 수학 문제 해결 등이 가능합니다. Microsoft Copilot 또는 ChatGPT와 유사하게 텍스트 또는 음성을 통해 액세스할 수 있습니다.
Gemini는 또한 Gemini Code Assist 및 Jules 비동기 코딩 에이전트를 포함하여 코더를 위해 맞춤화된 기능을 자랑합니다. 이러한 도구는 맞춤형 WordPress 플러그인 생성 및 코드 디버깅과 같은 작업을 지원할 수 있습니다.
핵심 기능: 프롬프트와 응답
Gemini의 핵심은 방대한 데이터 세트에서 훈련된 대규모 언어 모델(LLM)에 의해 구동되는 사용자 프롬프트를 수신하고 응답을 생성하는 것입니다. 이러한 모델은 실시간 인터넷 검색으로 보완된 다양한 주제에 걸쳐 풍부한 정보에 대한 액세스를 Gemini에 제공합니다.
사용자가 Gemini와 더 많이 상호 작용할수록 더 나아집니다. 사용자 참여는 기본 모델을 훈련하는 데 도움이 되어 Gemini가 더 정확한 응답을 제공하고 시간이 지남에 따라 오류를 줄일 수 있습니다. 이러한 지속적인 학습 프로세스는 점진적이지만 필수적입니다.
Gemini의 모델 라인: Flash 및 Pro
Gemini는 Flash 및 Pro의 두 가지 기본 모델 라인을 사용합니다. Flash 라인은 대화형 상호 작용을 위해 설계되었고 Pro 라인은 코딩, 수학 및 과학과 같은 복잡한 추론 작업을 전문으로 합니다. 이러한 라인 내의 각 모델은 고유한 강점을 보여줍니다. 최신 모델은 2.5 Flash 및 2.5 Pro이며 테스트는 종종 기본 2.5 Flash와 특수 작업용 2.5 Pro에 중점을 둡니다.
무료 대 프리미엄: 무엇을 얻을 수 있습니까?
Gemini는 무료 및 프리미엄 플랜을 모두 제공하며 프리미엄 플랜은 추가 기능을 잠금 해제합니다.
무료 플랜
무료 사용자는 2.5 Flash 모델, 2.5 Pro 모델에 대한 제한된 액세스, 음성 모드(Gemini Live), 제한된 심층 연구 기능 및 사용자 지정 AI 도우미(Gems)에 액세스할 수 있습니다. 또한 Whisk 애니메이션 도구 및 15GB의 Google Drive 클라우드 스토리지에 대한 제한된 액세스를 받습니다.
프리미엄 플랜
프리미엄 플랜에는 Google AI Pro(월 $19.99) 및 Google AI Ultra(월 $249.99)가 포함됩니다. AI Pro 티어는 더 높은 사용 제한, Flow 영화 제작 도구, Google Chrome의 Gemini, Gemini의 Veo 2 모델을 통한 비디오 생성 및 복잡한 프롬프트에 대한 더 큰 컨텍스트 창을 제공합니다. Google Drive 클라우드 스토리지 용량은 AI Pro에서 2TB로 증가하고 Gemini는 Gmail, Calendar, Docs 및 Sheets와 같은 Google Workspace 앱과 통합됩니다.
AI Ultra 플랜에는 AI Pro의 모든 기능이 포함되어 있으며 훨씬 더 높은 사용 제한과 몇 가지 새로운 기능이 추가되었습니다. 30TB의 Google Drive 클라우드 스토리지, Gemini의 작업 간소화 에이전트에 대한 조기 액세스, Gemini의 곧 출시될 2.5 Pro Deep Think 모드, Google의 최신 Veo 3 비디오 생성 모델 및 YouTube Premium에 대한 독점 액세스. AI Pro 플랜은 일반적으로 대부분의 사용자에게 비용 효율적입니다. Google Drive를 통한 클라우드 스토리지에 중점을 둔 Google One 구독을 통해 5TB(월 $25) 또는 10TB(월 $50)와 같이 2TB 이상의 클라우드 스토리지를 통해 Gemini AI Pro를 얻을 수 있습니다.
가치 제안: Gemini 대 경쟁사
Copilot, ChatGPT 및 Gemini와 같은 주요 챗봇은 프리미엄 플랜에 대해 월 $20 정도의 가격으로 책정됩니다. Gemini와 Copilot는 각각 Google 및 Microsoft 365 앱과의 통합으로 눈에 띕니다. ChatGPT는 챗봇 기능에만 집중합니다. Copilot Pro에는 고유한 기능이 있지만 Gemini의 클라우드 스토리지 통합은 뛰어난 가치를 제공합니다.
접근성: 웹, 모바일 및 통합
Gemini는 웹 및 모바일 앱(Apple 및 Android)을 통해 액세스할 수 있습니다. 데스크톱 앱이나 공식 브라우저 확장 프로그램은 없지만 Chrome은 Gemini 통합을 제공합니다. Gemini는 Calendar, Docs, Drive, Gmail, Maps, Keep, Photos, Sheets 및 YouTube Music과 같은 Google 앱 내에서 사용할 수 있습니다.
시작하기: 인터페이스 및 사용자 경험
Gemini는 계정이 필요 없지만 모델을 변경하고, 심층 연구를 사용하고, 채팅을 저장하려면 로그인이 권장됩니다.
인터페이스는 “Gemini에게 질문하기” 텍스트 필드와 사이드바의 최근 채팅을 특징으로 하는 간단합니다. 클릭 가능한 샘플 프롬프트는 Gemini가 할 수 있는 작업에 대한 지침을 제공합니다. 응답은 일반적으로 특히 이미지 생성의 경우 빠릅니다. 사용자는 응답을 복사, 듣기, 재생성 또는 공유할 수 있습니다. 때때로 서버 문제가 발생하여 응답이 일시 중지될 수 있으며 이는 ChatGPT 및 Copilot와 유사합니다.
톤 및 기억
Gemini는 ChatGPT보다 더 직접적이고 덜 대화적입니다. Gemini의 톤을 개인화하는 것은 불가능하지만 특정 사용자 정보를 저장하여 Gemini가 기억하도록 할 수 있습니다. Gemini의 강력한 메모리는 새로운 채팅을 시작할 때도 과거 채팅을 기억하여 더욱 만족스러운 채팅 경험을 제공합니다.
음성 모드: Gemini Live
마이크 아이콘을 사용하면 음성-텍스트 입력을 할 수 있으며 ChatGPT의 음성 모드 또는 Copilot Voice와 같은 Gemini Live를 사용하면 사용자가 다양한 음성으로 자연스럽게 대화할 수 있습니다.
Gemini Live는 카메라 및 화면 공유를 지원하므로 사용자는 실제 주제에 대해 토론할 수 있습니다. Gemini의 이미지 인식 기능은 일반적으로 유능하지만 이 기능은 시간 절약의 역할을 합니다.
Project Mariner: 작업 간소화 에이전트
AI Ultra 사용자에게만 제공되는 Project Mariner는 구직이나 아파트 검색과 같은 작업을 완료하는 AI 도우미입니다. Google은 Project Mariner를 “연구 프로토타입”이라고 부르며, 이는 추가 개선이 여전히 필요함을 나타냅니다.
웹 검색 및 정보 검색
웹 검색은 모든 주류 챗봇의 표준 기능입니다. Gemini, ChatGPT 및 Copilot는 현재 이벤트에 대한 질문에 대답할 수 있습니다. 대부분의 질문에 올바르게 대답할 수 있지만 일부는 챗봇을 당황하게 할 수 있습니다.
Gemini와 Copilot의 응답은 일반적으로 짧고 요점에 맞지만 ChatGPT는 더 자세한 정보를 제공합니다. Gemini와 ChatGPT는 모두 연결된 기사로 연결되는 소스 아이콘을 가지고 있지만 ChatGPT의 인터페이스는 소스의 이름과 기사의 전체 제목을 보여줍니다.
AI 모드 및 쇼핑
Gemini에 의해 구동되는 Google 검색 페이지의 AI 모드는 AI 모드 버튼을 통해 액세스할 수 있습니다. 사용자는 웹 결과에 따라 질문할 수 있으며 ChatGPT와 유사하게 응답에 관련 기사 타일과 관련 사진이 표시됩니다. 또한 Google 검색 및 이미지 검색에 편리하게 액세스할 수 있습니다.
Gemini는 사용자 리뷰, 소매업체 링크 및 가격 추적과 함께 Google 쇼핑 타일을 제공하여 쇼핑을 지원할 수도 있습니다. Gemini의 쇼핑 기능은 관련 추천을 제공합니다.
심층 연구: 심층 보고
심층 연구는 AI 챗봇의 가치 있는 기능으로 사용자가 Gemini에 연구 및 보고할 질문을 제기하거나 주제를 제안할 수 있습니다. 보고서는 수많은 소스를 인용하고 약 10분 만에 생성할 수 있습니다.
두 챗봇 모두 간단한 연구 주제를 쉽게 처리하지만 명확한 답이 없고 다양한 소스가 필요한 질문은 더 어렵습니다.
Gemini는 더 많은 소스를 인용하지만 ChatGPT의 소싱은 더 사용자 친화적입니다. Gemini는 보고서를 Google Docs로 내보낼 수 있지만 ChatGPT의 심층 연구 인터페이스는 기본적으로 로딩 막대일 뿐입니다.
보고서 톤은 크게 다르며 Gemini의 보고서는 학술 논문과 유사하고 ChatGPT의 보고서는 포럼 게시물과 유사합니다.
이미지 생성: 시각적 비교
이미지 생성은 AI 챗봇의 또 다른 주요 기능입니다. 테스트는 실사적이고 복잡한 그림에 중점을 둡니다.
실사적인 이미지 생성에서 Gemini는 이미지를 빠르게 생성하고 시각적으로 매력적이지만 오류가 포함될 수 있습니다.
복잡한 그림의 경우 Gemini의 만화는 비일관적인 경향이 있는 반면 ChatGPT의 만화는 목표를 더 잘 충족합니다.
기술 다이어그램 생성에서 ChatGPT는 매우 정확한 다이어그램을 제작하여 강점을 강화합니다.
비디오 생성: 떠오르는 분야
AI 비디오 생성은 점점 더 주류 기능이 되고 있습니다. Gemini에는 Flow 영화 제작 도구, Veo 3 비디오 생성 모델 및 Whisk AI 애니메이터가 있습니다. 오디오로 비디오를 생성하는 기능은 ChatGPT의 Sora 비디오 생성과 차별화되지만 AI Ultra 구독자에게만 제공됩니다.
Veo 3는 상당한 도약을 나타내지만 신중한 프롬프트 교정이 필요합니다. 각 생성에는 150 크레딧이 필요합니다(AI Ultra를 사용하면 월 12,500 크레딧).
Flow를 사용하면 비디오 클립을 자르고 새로운 프롬프트를 기반으로 확장할 수 있습니다. 충분한 크레딧이 있으면 Flow를 사용하여 영화를 완전히 만들 수 있습니다.
Google의 AI 애니메이션 도구인 Whisk를 사용하면 사용자가 사진을 업로드할 수 있습니다. 결과는 재미있을 수 있지만 오류와 왜곡이 있습니다.
파일 분석: 업로드된 콘텐츠 이해
Gemini는 업로드된 파일을 분석하고 이해하여 이력서를 비판하고 이미지를 해석하거나 텍스트를 번역할 수 있습니다.
이미지 인식에서 챗봇은 업로드된 이미지의 구성 요소를 식별하는 능력을 테스트합니다. ChatGPT는 더 많은 세부 정보를 포함할 수 있습니다.
문서 처리의 경우 챗봇은 업로드된 문서를 기반으로만 질문에 대답하는 임무가 주어집니다. Gemini와 ChatGPT는 모두 올바른 답변을 제공하지만 파일을 업로드할 때는 주의해야 합니다. ChatGPT는 Gemini보다 파일 처리에서 약간의 우위를 점할 수 있지만 그 차이는 미미합니다.
창작: 시 생성
AI 챗봇은 농담, 독백 및 시를 포함한 창작을 지원할 수 있습니다.
자유시를 작성하는 임무가 주어지면 ChatGPT는 지침을 더 잘 따릅니다. Gemini의 시는 구두점을 사용하지 않는 반면 Copilot의 시는 줄 바꿈이 부족합니다.
복잡한 추론: 시험 문제
복잡한 추론은 챗봇에 컴퓨터 과학, 수학 및 물리학 분야의 학부 시험 문제를 제시하여 테스트합니다.
챗봇은 매우 잘 수행하여 모든 물리학 질문에 효과적으로 답변합니다. ChatGPT는 전체적으로 가장 적은 수의 오답을 반환합니다.
Chrome의 Gemini: 원활한 통합
Chrome은 이제 Gemini를 통합합니다. 유료 계정 소유자는 Gemini 아이콘을 클릭하여 채팅 창을 열고 평소와 같이 Gemini와 상호 작용하고 활성 탭의 콘텐츠를 쿼리할 수 있습니다. Chrome의 Gemini 통합을 통해 사용자는 Edge의 Copilot Vision과 유사한 기능을 통해 Gemini에게 질문하기 위해 새 탭을 열 필요가 없습니다. 단, Gemini의 Live 기능은 웹 인터페이스에서 사용할 수 없습니다.
텍스트 응답은 놀라울 정도로 빠릅니다. 응답 속도를 보면 Gemini가 사용자와 공유하기 전에 웹 페이지에 대한 어느 정도의 액세스 권한이 있는지 궁금해집니다.
Chrome의 Gemini에는 몇 가지 제한 사항이 있습니다. Gemini는 비디오를 이해할 수 없으며 Live를 통한 응답은 텍스트를 통한 것만큼 빠르지 않지만 복사 및 붙여넣기의 필요성을 없애기 때문에 전반적으로 유용합니다. 그러나 Gemini를 항상 사용하지 않는 한 클릭 한 번으로 시간을 절약하는 것은 큰 문제가 아닐 수 있습니다. Live 기능도 비슷하게 도움이 되어 키보드를 건드리지 않고도 보고 있는 것에 대한 질문을 할 수 있습니다.
Chrome의 Gemini는 볼 수 있고 이해할 수 있는 항목에 대한 몇 가지 제한 사항이 있습니다. 결과적으로 Gemini는 침해적으로 느껴질 수 있습니다. Gemini는 공유한 후 특정 탭에 대한 질문을 보고 응답할 수 있습니다.
Google 앱 통합: 생산성 향상
AI Pro 플랜 가입자는 Calendar, Docs, Drive, Gmail, Maps, Keep, Photos, Sheets 및 YouTube Music을 포함한 Google 앱에서 AI 기능을 이용할 수 있습니다.
Google은 Gemini 자체 사이트에서 통합을 강조합니다. 전단지를 기반으로 Google Calendar에 이벤트를 추가하고 Google Keep에서 식료품 목록을 생성하거나 Gemini가 YouTube Music에서 재생 목록을 큐레이트할 수 있습니다. Docs, Gmail, Sheets 및 Slides의 Gemini는 Microsoft 365 앱의 Copilot를 미러링하여 프롬프트를 기반으로 슬라이드를 만들고, 이메일을 초안하고, 텍스트를 생성하고, 공식을 제안합니다.
Gmail의 Gemini는 두드러져 Gemini에게 이메일 기록에 대한 전체 액세스 권한을 부여하여 특정 정보를 검색하거나 받은 편지함 정리 조언을 제공할 수 있습니다. 그러나 이것은 전능한 기능이 아닙니다. Gemini는 모든 것을 할 수 없습니다. 이 통합은 개인 정보 침해처럼 느껴집니다.
Gemini의 사용 가능한 통합을 활용하는 정도에 따라 특정 요구 사항을 충족하는 통합이 없을 수 있습니다. 그러나 다양한 기능으로 인해 유용할 수 있습니다.
Gems: 맞춤형 AI 전문가
Gems는 특정 목적에 맞게 조정된 Gemini의 사용자 지정 버전입니다. 강사는 파일을 추가하고 처음으로 컴퓨터를 만드는 사람을 돕기 위해 PC Builder Gem을 만들 수 있습니다.
응답은 Gemini와 이야기하는 것과 약간 다릅니다. 특정 주제에 대해 Gemini와 이야기할 계획인 사람은 Gem을 만들 수 있습니다. 그러나 Gems는 Google의 약속을 제대로 이행하지 않는 것 같습니다.
안전 및 개인 정보 보호
Gemini는 의식이 없으며 인간처럼 생각하거나 이해할 수 없습니다.
성인 콘텐츠, 불법 활동, 사람들의 사실적인 이미지 및 금기 사항은 Gemini의 정책에 위배됩니다. Gemini는 필터링 시스템에 가장 관대합니다.
Gemini에는 컨텍스트 창이 있습니다. AI Pro 플랜의 Gemini 컨텍스트 창은 유료로 한 번에 최대 1,500페이지의 텍스트 또는 30,000줄의 코드를 처리할 수 있습니다. 무료 버전을 광범위하게 사용하는 경우 가입자가 장애물에 부딪힐 수 있습니다.
Google은 파일, 위치 정보, 제품 사용 및 채팅을 포함하여 Gemini를 사용할 때 데이터를 수집합니다. 이 데이터는 Google 제품 및 기계 학습 기술을 개선하는 데 사용됩니다.
사용자는 Gemini Apps 활동을 끌 수 있습니다. 기본적으로 Google은 채팅 데이터를 18개월 동안 저장합니다.
Gmail, Docs, Drive, Sheets 및 Slides와 같은 Gemini의 Google Workspace 통합의 경우 Google은 훈련된 모델을 사용하거나 판매하거나 타겟 광고에 사용하지 않을 것을 약속합니다.
Google은 과거에 악성 행위자가 Google Chrome 결함을 악용한 문제, 데이터 관행에 대해 Google을 인용한 이탈리아 규제 기관, 동의 없이 데이터를 수집하여 수십억 달러의 손실을 초래한 문제를 경험했습니다. 따라서 민감한 데이터를 공유하지 않는 것이 좋습니다.