OCI Generative AI: Cohere 모델 출시

Oracle Cloud Infrastructure Generative AI의 Cohere Command A 및 Rerank 모델 출시

Oracle Cloud Infrastructure (OCI) Generative AI 서비스가 Cohere Command A 및 Rerank 3.5 모델 출시, 그리고 멀티모달 지원 기능을 갖춘 Cohere Embed 3 도입을 포함한 일련의 중요한 업그레이드를 발표했습니다. 이러한 새로운 모델들은 OCI 고객에게 더욱 강력한 엔터프라이즈급 AI 기능을 제공하고, 다양한 애플리케이션 시나리오에서 AI 활용 능력을 더욱 향상시키기 위해 설계되었습니다.

Command A: 성능과 효율성의 정점

Cohere의 Command A 03-2025는 현재 가장 강력한 Command 모델로서, 처리량이 이전 세대 제품보다 150% 향상되었으며 단 두 개의 GPU 만으로도 구동됩니다. Cohere가 제공한 데이터에 따르면, 이 모델은 에이전트 기반의 엔터프라이즈 작업에서 OpenAI 4o 및 DeepSeekv3에 필적하거나 능가하는 성능을 보이며, 컴퓨팅 효율성 측면에서도 상당한 개선을 이루었습니다.

Command A의 뛰어난 성능은 고급 아키텍처 설계와 훈련 방법에서 비롯되며, 다양한 복잡한 엔터프라이즈급 AI 애플리케이션에서 탁월한 성능을 발휘합니다. 대량의 데이터 처리, 복잡한 추론 작업 수행, 실시간 자연어 처리 등 어떤 작업이든 Command A는 효율적이고 안정적인 솔루션을 제공할 수 있습니다.

Command A의 주요 특징은 다음과 같습니다:

  • 초장 문맥 창: 최대 256k 토큰의 문맥 길이를 지원하여 모델이 더 긴 텍스트 시퀀스를 처리하고 문맥 정보를 더 잘 이해하여 더욱 정확하고 일관된 응답을 생성할 수 있습니다. 이는 Command A가 중요한 정보를 놓치지 않고 복잡한 문서, 긴 대화 및 다자간 상호 작용을 처리할 수 있음을 의미합니다.

  • 고급 검색 증강 생성 (RAG): 검색 증강 생성 기술을 통합하여 Command A는 대량의 데이터에서 관련 정보를 검색하고 이를 생성된 콘텐츠에 통합하여 생성 결과의 품질과 정확성을 향상시킬 수 있습니다. 이 기술은 외부 지식에 대한 모델 의존도를 줄일 뿐만 아니라 끊임없이 변화하는 정보 환경에 더 잘 적응할 수 있도록 합니다.

  • 네이티브 에이전트 도구 사용: Command A는 네이티브 에이전트 도구 사용 기능을 갖추고 있어 다른 도구 및 서비스와 통합하여 더욱 복잡한 기능을 구현할 수 있습니다. 예를 들어, 검색 엔진, 데이터베이스, API 등과 상호 작용하여 필요한 정보를 얻거나 특정 작업을 수행할 수 있습니다. 이러한 기능 덕분에 Command A는 자동화된 고객 서비스, 지능형 도우미 및 데이터 분석과 같은 다양한 복잡한 작업을 수행할 수 있습니다.

  • 엔터프라이즈급 보안 및 개인 정보 보호: Command A는 설계 단계부터 엔터프라이즈급 보안 및 개인 정보 보호 요구 사항을 충분히 고려하여 고객 데이터를 보호하기 위한 다양한 보안 조치를 채택했습니다. 예를 들어, 데이터 암호화, 접근 제어 및 감사 기능을 지원하여 고객 데이터가 무단 접근 또는 유출되지 않도록 보장합니다.

  • 강력한 다국어 능력: Command A는 영어, 프랑스어, 스페인어, 이탈리아어, 독일어, 포르투갈어, 일본어, 한국어, 아랍어, 중국어, 러시아어, 폴란드어, 터키어, 베트남어, 네덜란드어, 체코어, 인도네시아어, 우크라이나어, 루마니아어, 그리스어, 힌디어, 히브리어 및 페르시아어를 포함한 23개 언어로 훈련되었습니다. 이를 통해 다양한 언어의 텍스트를 처리하고 전 세계 사용자에게 서비스를 제공할 수 있습니다.

  • 텍스트 입력 및 출력: Command A는 현재 텍스트 입력 및 출력만 지원합니다. 즉, 텍스트 생성, 텍스트 요약, 텍스트 번역 및 텍스트 분류와 같은 텍스트 관련 작업을 처리하는 데 주로 사용됩니다.

주의: Command A 모델은 현재 미세 조정을 지원하지 않습니다.

Rerank 3.5: 기업 검색의 정확도 향상

Rerank 3.5는 Cohere의 최신 AI 검색 기초 모델로, 기업 검색 및 검색 증강 생성 (RAG) 시스템의 정확도를 향상시키기 위해 설계되었습니다. 이 모델은 향상된 추론 능력을 갖추고 있어 복잡한 사용자 쿼리를 이해하고 긴 문서, 이메일, 표, JSON 및 코드와 같은 다양한 데이터 유형과 호환됩니다. 또한 Rerank 3.5는 100개 이상의 언어를 지원하여 전 세계 기업의 검색 요구 사항을 충족할 수 있습니다.

Rerank 3.5는 검색 결과를 재정렬하여 가장 관련성 높은 결과를 맨 위에 배치함으로써 사용자의 검색 효율성과 만족도를 향상시킵니다. 기존의 텍스트 검색뿐만 아니라 이미지 검색, 비디오 검색 및 오디오 검색과 같은 다양한 다른 유형의 검색에도 적용할 수 있습니다.

Rerank 3.5의 주요 특징은 다음과 같습니다:

  • 향상된 추론 능력: Rerank 3.5는 향상된 추론 능력을 갖추고 있어 복잡한 사용자 쿼리를 더 잘 이해할 수 있습니다. 쿼리의 의미와 문맥을 분석하여 사용자의 의도를 정확하게 식별하고 가장 관련성 높은 결과를 반환할 수 있습니다.

  • 다양한 데이터 지원: Rerank 3.5는 긴 문서, 이메일, 표, JSON 및 코드를 포함한 다양한 데이터 유형과 호환됩니다. 이는 다양한 출처의 데이터를 처리하고 유용한 정보를 추출 할 수 있음을 의미합니다.

  • 개선된 다국어 지원: Rerank 3.5는 영어, 아랍어, 중국어, 프랑스어, 독일어, 힌디어, 일본어, 한국어, 포르투갈어, 러시아어 및 스페인어와 같은 주요 비즈니스 언어를 포함하여 100개 이상의 언어를 지원합니다. 이를 통해 전 세계 사용자에게 고품질 검색 서비스를 제공할 수 있습니다.

  • 더 높은 검색 정확도: 금융 데이터에 대한 테스트에서 Rerank 3.5는 Hybris Search보다 23.4%, BM25보다 30.8% 더 나은 성능을 보였습니다. BM25는 주어진 검색 쿼리와 문서의 관련성을 결정하기 위해 검색 엔진 및 정보 검색 시스템에 사용되는 일반적인 순위 함수입니다.

확장된 언어 지원: Rerank 3.5가 100개 이상의 언어를 지원하는 방법

Rerank 3.5의 다국어 능력은 100개 이상의 언어의 쿼리를 이해하고 처리할 수 있다는 사실에서 입증됩니다. 이는 쿼리의 문자 그대로의 의미를 이해할 뿐만 아니라 쿼리 이면에 있는 문화적 배경과 맥락도 이해할 수 있음을 의미합니다. 예를 들어, 사용자가 스페인어로 “mejores restaurantes en Madrid”를 검색하는 경우 Rerank 3.5는 사용자의 의도가 마드리드 최고의 레스토랑을 찾는 것이라는 것을 이해하고 관련 스페인어 검색 결과를 반환할 수 있습니다.

이 목표를 달성하기 위해 Rerank 3.5는 다음과 같은 다양한 기술을 채택했습니다:

  • 다국어 훈련 데이터: Rerank 3.5는 뉴스 기사, 블로그 게시물, 소셜 미디어 게시물 및 제품 리뷰와 같은 다양한 유형의 텍스트를 포함하는 대량의 다국어 데이터에 대해 훈련되었습니다.
  • 교차 언어 임베딩: Rerank 3.5는 교차 언어 임베딩 기술을 사용하여 다른 언어의 단어를 동일한 벡터 공간에 매핑합니다. 이를 통해 모델은 다른 언어 간의 의미 관계를 이해하고 관련 교차 언어 검색 결과를 반환할 수 있습니다.
  • 언어 감지 및 번역: Rerank 3.5는 사용자 쿼리의 언어를 자동으로 감지하고 영어 또는 기타 지원되는 언어로 번역할 수 있습니다. 이를 통해 모델은 다양한 언어의 쿼리를 처리하고 관련 검색 결과를 반환할 수 있습니다.

이러한 기술을 채택함으로써 Rerank 3.5는 전 세계 사용자에게 검색에 사용하는 언어에 관계없이 고품질 검색 서비스를 제공할 수 있습니다.

향상된 추론 능력: Rerank 3.5가 복잡한 쿼리를 이해하는 방법

Rerank 3.5의 추론 능력은 복잡한 쿼리를 이해하고 유용한 정보를 추출할 수 있다는 사실에서 입증됩니다. 예를 들어, 사용자가 “작년에 비해 어떤 기술 회사의 주식이 더 나은 성과를 보였습니까?”를 검색하는 경우 Rerank 3.5는 사용자의 의도가 작년보다 주식 성과가 더 나은 기술 회사를 찾는 것이라는 것을 이해할 수 있습니다.

이 목표를 달성하기 위해 Rerank 3.5는 다음과 같은 다양한 기술을 채택했습니다:

  • 의미 분석: Rerank 3.5는 의미 분석 기술을 사용하여 쿼리의 의미 구조와 문맥을 분석합니다. 이를 통해 모델은 쿼리의 의미를 이해하고 사용자의 의도를 식별할 수 있습니다.
  • 개체 인식: Rerank 3.5는 개체 인식 기술을 사용하여 쿼리의 개체 (예: 회사, 장소 및 사람)를 식별합니다. 이를 통해 모델은 쿼리를 관련 개체와 연결하고 관련 검색 결과를 반환할 수 있습니다.
  • 관계 추출: Rerank 3.5는 관계 추출 기술을 사용하여 쿼리의 개체 간의 관계를 추출합니다. 이를 통해 모델은 쿼리의 의미를 이해하고 관련 검색 결과를 반환할 수 있습니다.

이러한 기술을 채택함으로써 Rerank 3.5는 복잡한 쿼리를 이해하고 관련 검색 결과를 반환하여 사용자의 검색 효율성과 만족도를 향상시킬 수 있습니다.

OCI 고객이 이러한 모델을 활용하는 방법:

OCI 고객은 다음과 같은 다양한 방법으로 이러한 Cohere 모델을 활용할 수 있습니다:

  • 즉시 통합: 이러한 모델은 인프라 관리에 대한 걱정 없이 채팅 인터페이스, API 또는 전용 끝점을 통해 원활하게 액세스할 수 있습니다. 이를 통해 고객은 복잡한 구성 및 배포 없이 이러한 모델을 애플리케이션에 쉽게 통합할 수 있습니다.

  • AI 개발 간소화: OCI Generative AI 서비스는 고객이 AI 개발 프로세스를 간소화하는 데 도움이 되는 완전한 도구 및 서비스 세트를 제공합니다. 이러한 도구 및 서비스에는 다음이 포함됩니다:

    • 데이터 준비: OCI Generative AI 서비스는 고객이 AI 모델의 훈련 및 추론에 사용할 데이터를 정리, 변환 및 준비하는 데 도움이 되는 일련의 데이터 준비 도구를 제공합니다.
    • 모델 훈련: OCI Generative AI 서비스는 고객이 자체 AI 모델을 훈련하는 데 도움이 되는 일련의 모델 훈련 도구를 제공합니다. 이러한 도구는 TensorFlow, PyTorch 및 Scikit-learn과 같은 다양한 모델 유형 및 프레임워크를 지원합니다.
    • 모델 배포: OCI Generative AI 서비스는 고객이 훈련된 AI 모델을 생산 환경에 배포하는 데 도움이 되는 일련의 모델 배포 도구를 제공합니다.
    • 모델 모니터링: OCI Generative AI 서비스는 고객이 AI 모델의 성능과 정확도를 모니터링하는 데 도움이 되는 일련의 모델 모니터링 도구를 제공합니다.
  • RAG 워크플로 간소화: Command A를 사용하여 콘텐츠를 생성하고 Rerank 3.5를 통해 강화된 결과를 최적화하여 복잡한 RAG 프로세스를 더욱 효율적으로 간소화합니다.

애플리케이션 시나리오의 다양성:

이러한 모델은 다음과 같은 다양한 엔터프라이즈 애플리케이션 시나리오에 적용할 수 있습니다:

  • 고객 서비스: Command A 및 Rerank 3.5는 고객의 질문에 답변하고 고객의 우려 사항을 해결하며 개인화된 서비스를 제공할 수 있는 지능형 고객 서비스 봇을 구축하는 데 사용할 수 있습니다.
  • 콘텐츠 생성: Command A는 뉴스 기사, 블로그 게시물, 제품 설명 및 소셜 미디어 게시물과 같은 다양한 유형의 텍스트 콘텐츠를 생성하는 데 사용할 수 있습니다.
  • 검색: Rerank 3.5는 기업 검색의 정확도와 효율성을 향상시켜 사용자가 필요한 정보를 빠르게 찾을 수 있도록 도와줍니다.
  • 데이터 분석: Command A 및 Rerank 3.5는 다양한 유형의 데이터를 분석하고 유용한 정보를 추출하여 기업이 더 나은 의사 결정을 내릴 수 있도록 도와줍니다.
  • 지식 관리: 직원이 필요한 정보를 신속하게 검색하여 작업 효율성을 높일 수 있는 지능형 지식 베이스를 구축할 수 있습니다.

OCI Generative AI 서비스는 고성능, 다기능 및 확장 가능한 AI 모델을 제공하여 기업이 다양한 혁신적인 AI 솔루션을 구축하여 경쟁력과 비즈니스 가치를 향상시킬 수 있도록 지원합니다.

통합 세부 정보 및 가격 정보는 Generative AI 서비스 문서를 참조하거나 Oracle 담당자에게 문의하십시오.