Gemini 모델: 핵심 동력
Gemini 애플리케이션의 핵심에는 강력한 모델이 있습니다. 모든 사용자는 현재 기본 모델인 2.5 Flash 모델에 대한 “일반 액세스” 권한을 갖습니다. 무료 사용자는 Gemini 2.5 Pro(미리보기)에 대한 “제한적 액세스” 권한을 갖습니다. Google은 테스트 중인 이 모델이 “추론, 수학 및 코드”를 위해 설계되었으며 캔버스 기능이 이 모델의 혜택을 받을 것이라고 밝혔습니다.
Google AI Pro 구독자는 2.5 Pro(미리보기)에 대한 “확장된 액세스” 권한을 얻습니다. Google은 모델 제한 사항에 대해 다음과 같이 설명합니다.
Gemini 앱은 고급 모델에 대한 더 많은 프롬프트 및 채팅 제한이 있습니다. 특정 시간 내에 특정 모델의 용량 제한에 도달하면 해당 제한에 도달하거나 용량 제한이 새로 고쳐질 때까지 다른 모델로 전환할 수 있습니다. Google AI Pro 또는 Google AI Ultra를 사용하는 Gemini 앱 사용자는 고급 모델에 대한 용량 제한이 더 높습니다.
Google AI Ultra는 2.5 Pro(미리보기)에 대한 “최고 액세스” 권한을 제공합니다. 또한 Ultra 구독자는 “향후 몇 주 내에” 2.5 Pro의 Deep Think 모드를 받게 되며, Agent Mode는 또 다른 곧 출시될 기능입니다.
컨텍스트 창: 기억의 깊이
컨텍스트 창은 모델이 얼마나 많은 정보를 기억할 수 있는지를 결정하여 대화의 일관성과 심층성에 영향을 미칩니다. 무료 티어의 컨텍스트 창은 모든 모델에 적용되며 32,000개의 토큰(약 50페이지 분량의 텍스트)입니다.
Google AI Pro 및 AI Ultra 사용자는 100만 개의 토큰이라는 놀라운 길이의 컨텍스트 창을 갖습니다. 이는 1,500페이지 분량의 텍스트 또는 30,000줄의 코드에 해당합니다. 즉, 모델은 더 긴 대화 기록을 이해하여 더 관련성이 높고 정확한 응답을 제공할 수 있습니다.
파일 업로드 및 분석: 도구 상자 확장
무료 사용자는 문서 및 슬라이드를 Gemini 앱에 업로드하여 요약, 통찰력을 얻고 질문을 할 수 있습니다. 지원되는 파일 형식은 다음과 같습니다.
- 문서 파일: DOC, DOCX, PDF, RTF, DOT, DOTX, HWP, HWPX
- Google 문서로 만든 파일
- 일반 텍스트 파일: TXT
- 프레젠테이션 파일: PPTX
- Google 슬라이드로 만든 프레젠테이션
그러나 스프레드시트 및 기타 데이터 파일을 업로드하고 분석 및 시각화(차트 사용)를 수행하려면 Google AI Pro 또는 AI Ultra로 업그레이드해야 합니다.
- 스프레드시트 파일: XLS, XLSX
- Google 스프레드시트로 만든 스프레드시트
- 표 형식 데이터 파일: CSV, TSV
마찬가지로 코드 폴더 및 코드 저장소를 업로드하는 기능도 구독이 필요합니다. Google은 수천 줄의 코드에서 통찰력을 얻고, 스마트하게 변경하고, 오류를 디버깅하고, 최적의 성능을 위해 코드를 최적화할 수 있다고 강조합니다.
- 코드 파일에는 C, CPP, PY, JAVA, PHP, SQL 및 HTML이 포함됩니다.
참조 기록 채팅: 연속적인 대화 구축
무료 사용자는 “저장된 정보” 기능을 사용하여 각 프롬프트에 설명을 추가하지 않고도 각 대화에 대한 채팅 기본 설정(예: “저는 채식주의자입니다.” 또는 “응답을 간결하게 만드세요.”)을 지정할 수 있습니다.
Google AI Pro 및 AI Ultra는 한 단계 더 나아가 Gemini가 과거 채팅 기록을 보고 현재 대화에 정보를 제공할 수 있습니다. 이 기능을 트리거하려면 “과거 채팅의 주제 또는 기간을 언급”하고 이 기능을 사용하여 이전 채팅을 요약할 수 있습니다. “출처 및 관련 콘텐츠” 섹션에는 “이전 채팅”이 사용된 시기가 명시됩니다.
깊이 연구: 지식의 경계 탐구
Gemini의 첫 번째 에이전트 기능을 통해 사용자는 질문을 하고 추가로 사용자 지정할 수 있는 다지점 연구 계획을 얻을 수 있습니다. 승인되면 Gemini는 웹을 검색하고, 발견한 내용을 분석하고, 보고서를 작성합니다. I/O 2025에서 파일과 이미지를 심층 연구에 업로드하여 사용자와 공통 지식을 결합하여 최종 결과를 얻을 수 있습니다.
- 무료 사용자: Gemini 2.5 Flash에서 제공하는 “제한적 액세스” 심층 연구
- Google AI Pro: 2.5 Pro를 사용한 “확장된 액세스”
- Google AI Ultra: “최고 액세스”
오디오 개요: 다른 관점 듣기
- 무료 사용자: 제한적 액세스
- Google AI Pro: 확장된 액세스
- Google AI Ultra: 최고 액세스
이미지 생성: 시각적 경이로움 창조
모든 사용자는 인물이 있는 이미지 생성을 포함하여 “일반 액세스” 이미지 생성을 할 수 있습니다. I/O 2025 이후 Gemini 앱은 Imagen 4를 사용하여 더 높은 품질, 더 풍부한 디테일, 더 나은 텍스트/타이포그래피를 얻습니다.
또한, 텍스트 프롬프트로 사진을 최적화할 수 있는(생성된 이미지와 업로드한 이미지 모두 포함) 로컬 이미지 편집 기능도 있습니다.
비디오 생성: 상상을 현실로
- 무료 사용자: 사용할 수 없음
- Google AI Pro: Veo 2를 사용하여 8초 720p 클립 생성
- Google AI Ultra: Veo 3에서 지원, 클립에 사운드(효과, 소음 등) 포함
두 비디오 모두 동일한 프롬프트를 사용했습니다. ". 풀이 무성한 절벽에서 해변으로의 항공 촬영 장면. 파도가 해안을 때리고, 해변 근처의 바다에서 눈에 띄는 해식 기둥이 솟아오르며, 따뜻한 황금빛 일출 또는 일몰에 젖어 극명한 고도 변화와 태평양 해안선의 평온한 아름다움을 담아냅니다."
기타 기능: 추가 가능성
Gems: 사전 정의된 설명과 함께 특정 작업을 수행하기 위해 Gemini의 사용자 지정 버전을 빌드하는 데 사용됩니다. 특정 페르소나와 능력을 부여받아 특정 작업을 보다 효율적으로 완료할 수 있는 사용자 지정 AI 봇으로 이해할 수 있습니다. 예를 들어, 마케팅 카피를 생성하는 데 특화된 Gemini 또는 코드 디버깅에 특화된 Gemini를 만드십시오. Gems는 AI의 응용을 더욱 개인화하고 전문화합니다.
Gemini Live
- 카메라 및 화면 공유. 이 기능을 통해 Gemini는 단순한 텍스트 도구가 아니라 원격 프레젠테이션, 교육 또는 공동 작업을 통해 사용자를 지원하는 시각적 도우미가 될 수 있습니다. Gemini Live를 통해 동료에게 디자인 초안을 보여주고 실시간으로 피드백을 듣거나 Gemini Live를 사용하여 가족 구성원이 스마트폰을 사용하는 방법을 원격으로 안내할 수 있다고 상상해 보십시오.
결론적으로 Gemini가 제공하는 기능과 서비스는 다양한 유형의 사용자의 요구를 충족할 수 있습니다. 기본 기능을 무료로 경험하기를 원하는 일반 사용자이든, 작업 효율성을 높이기 위한 강력한 도구가 필요한 전문가이든, Gemini에서 자신에게 적합한 솔루션을 찾을 수 있습니다. 기술이 계속 발전함에 따라 Gemini는 앞으로 더욱 기대되는 새로운 기능을 출시할 것입니다. 기대해 주십시오.