Oracle Cloud Generative AI: Cohereモデル発表

Oracle Cloud Infrastructure (OCI) Generative AIサービスは、Cohere Command AおよびRerank 3.5モデルのリリース、およびマルチモーダルサポートを備えたCohere Embed 3の導入を含む、一連の重要なアップグレードを発表しました。これらの新しいモデルは、OCIのお客様に、より強力なエンタープライズクラスのAI機能を提供し、さまざまなアプリケーションシナリオにおけるAIアプリケーション機能をさらに向上させることを目的としています。

Command A:性能と効率の頂点

CohereのCommand A 03-2025は、現在、最も強力なCommandモデルであり、スループットは前世代の製品よりも150%向上し、GPUは2つしか必要としません。Cohereが提供するデータによると、このモデルは、エージェント型エンタープライズタスクのパフォーマンスにおいてOpenAI 4oおよびDeepSeekv3に匹敵するか、それを上回る性能を発揮し、計算効率も大幅に向上しています。

Command Aの卓越した性能は、高度なアーキテクチャ設計とトレーニング方法によるもので、さまざまな複雑なエンタープライズクラスのAIアプリケーションで優れたパフォーマンスを発揮します。大量のデータの処理、複雑な推論タスクの実行、リアルタイムの自然言語処理など、Command Aは、効率的で信頼性の高いソリューションを提供します。

Command Aの主な特徴

  • 超長コンテキストウィンドウ: 最大256kトークンのコンテキスト長をサポートしており、モデルがより長いテキストシーケンスを処理できるため、コンテキスト情報をより良く理解し、より正確で一貫性のある応答を生成できます。これは、Command Aが重要な情報を失うことなく、複雑なドキュメント、長文の会話、および複数回のやり取りを処理できることを意味します。

  • 高度な検索拡張生成(RAG): 検索拡張生成技術を統合することにより、Command Aは大量のデータから関連情報を検索し、生成されたコンテンツにそれを組み込むことができるため、生成結果の品質と精度が向上します。この技術は、モデルの外部知識への依存度を減らすだけでなく、絶えず変化する情報環境により良く適応できるようにします。

  • ネイティブエージェントツール使用: Command Aはネイティブエージェントツールを使用する機能を備えており、他のツールやサービスと統合して、より複雑な機能を実装できます。たとえば、検索エンジン、データベース、APIなどと対話して、必要な情報を取得したり、特定の操作を実行したりできます。この機能により、Command Aは、自動化されたカスタマーサービス、インテリジェントアシスタント、データ分析など、さまざまな複雑なタスクを実行できます。

  • エンタープライズクラスのセキュリティとプライバシー: Command Aは、設計段階からエンタープライズクラスのセキュリティとプライバシーのニーズを十分に考慮しており、顧客のデータを保護するためにさまざまなセキュリティ対策を採用しています。たとえば、データ暗号化、アクセス制御、監査機能をサポートし、顧客のデータが不正なアクセスまたは漏洩から保護されるようにします。

  • 強力な多言語能力: Command Aは、英語、フランス語、スペイン語、イタリア語、ドイツ語、ポルトガル語、日本語、韓国語、アラビア語、中国語、ロシア語、ポーランド語、トルコ語、ベトナム語、オランダ語、チェコ語、インドネシア語、ウクライナ語、ルーマニア語、ギリシャ語、ヒンディー語、ヘブライ語、ペルシア語を含む23言語でトレーニングされています。これにより、さまざまな言語のテキストを処理し、世界中のユーザーにサービスを提供できます。

  • テキスト入力および出力: Command Aは現在、テキスト入力および出力のみをサポートしています。これは、主にテキスト生成、テキスト要約、テキスト翻訳、テキスト分類などのテキスト関連タスクで使用されることを意味します。

注意: Command Aモデルは現在、微調整をサポートしていません。

Rerank 3.5:エンタープライズ検索の精度を向上

Rerank 3.5は、企業の検索および検索拡張生成(RAG)システムの精度を向上させるように設計された、Cohereの最新のAI検索基盤モデルです。このモデルは、強化された推論機能を備えており、複雑なユーザーのクエリを理解し、長文ドキュメント、電子メール、テーブル、JSON、コードなど、さまざまな種類のデータを扱うことができます。さらに、Rerank 3.5は100を超える言語をサポートしており、グローバル企業の検索ニーズに対応できます。

Rerank 3.5は、検索結果を並べ替えることで、最も関連性の高い結果を上位に表示し、ユーザーの検索効率と満足度を向上させます。従来のテキスト検索だけでなく、画像検索、ビデオ検索、オーディオ検索など、他のさまざまなタイプの検索にも適用できます。

Rerank 3.5の主な特徴

  • 強化された推論能力: Rerank 3.5は強化された推論能力を備えており、複雑なユーザーのクエリをより良く理解できます。クエリのセマンティクスとコンテキストを分析して、ユーザーの意図を正確に識別し、最も関連性の高い結果を返すことができます。

  • 多様なデータのサポート: Rerank 3.5は、長文ドキュメント、電子メール、テーブル、JSON、コードなど、さまざまなデータタイプをサポートしています。これは、さまざまなソースからの多様なデータを処理し、そこから有用な情報を抽出できることを意味します。

  • 改善された多言語サポート: Rerank 3.5は、英語、アラビア語、中国語、フランス語、ドイツ語、ヒンディー語、日本語、韓国語、ポルトガル語、ロシア語、スペイン語などの主要なビジネス言語を含む、100を超える言語をサポートしています。これにより、世界中のユーザーに高品質の検索サービスを提供できます。

  • より高い検索精度: 金融データに関するテストでは、Rerank 3.5のパフォーマンスはHybris Searchよりも23.4%、BM25よりも30.8%優れています。BM25は、検索エンジンと情報検索システムで使用され、ドキュメントと指定された検索クエリとの関連性を判断するための一般的なランキング関数です。

拡張された言語サポート:Rerank 3.5が100以上の言語をどのようにサポートするか

Rerank 3.5の多言語対応能力は、100以上の言語からのクエリを理解し、処理できることに表れています。これは、クエリの文字通りの意味を理解するだけでなく、クエリの背後にある文化的な背景と文脈を理解できることを意味します。たとえば、ユーザーがスペイン語で「mejores restaurantes en Madrid」を検索した場合、Rerank 3.5は、ユーザーの意図がマドリッドで最高のレストランを探すことであることを理解し、関連するスペイン語の検索結果を返します。

この目標を達成するために、Rerank 3.5は、次のようないくつかの技術を採用しています。

  • 多言語トレーニングデータ: Rerank 3.5は、ニュース記事、ブログ記事、ソーシャルメディアの投稿、製品レビューなど、さまざまな種類のテキストを含む、大量の多言語データでトレーニングされています。
  • クロスリンガル埋め込み: Rerank 3.5は、クロスリンガル埋め込み技術を使用して、異なる言語の単語を同じベクトル空間にマッピングします。これにより、モデルは異なる言語間のセマンティックな関係を理解し、関連するクロスリンガル検索結果を返すことができます。
  • 言語検出と翻訳: Rerank 3.5は、ユーザーのクエリの言語を自動的に検出し、それを英語またはサポートされている他の言語に翻訳できます。これにより、モデルはさまざまな言語のクエリを処理し、関連する検索結果を返すことができます。

これらの技術を採用することで、Rerank 3.5は、世界中のユーザーが検索に使用する言語に関係なく、高品質の検索サービスを提供できます。

強化された推論能力:Rerank 3.5が複雑なクエリをどのように理解するか

Rerank 3.5の推論能力は、複雑なクエリを理解し、そこから有用な情報を抽出できることに表れています。たとえば、ユーザーが「昨年と比較して、どのテクノロジー企業の株式のパフォーマンスが優れているか」を検索した場合、Rerank 3.5は、ユーザーの意図が昨年の株式のパフォーマンスよりも優れているテクノロジー企業を探すことであることを理解できます。

この目標を達成するために、Rerank 3.5は、次のようないくつかの技術を採用しています。

  • セマンティック分析: Rerank 3.5は、セマンティック分析技術を使用して、クエリのセマンティック構造とコンテキストを分析します。これにより、モデルはクエリの意味を理解し、ユーザーの意図を識別できます。
  • エンティティ認識: Rerank 3.5は、エンティティ認識技術を使用して、クエリ内のエンティティ(企業、場所、人物など)を識別します。これにより、モデルはクエリを関連するエンティティに関連付け、関連する検索結果を返すことができます。
  • 関係抽出: Rerank 3.5は、関係抽出技術を使用して、クエリ内のエンティティ間の関係を抽出します。これにより、モデルはクエリの意味を理解し、関連する検索結果を返すことができます。

これらの技術を採用することで、Rerank 3.5は複雑なクエリを理解し、関連する検索結果を返すことができ、ユーザーの検索効率と満足度を向上させます。

OCIのお客様がこれらのモデルをどのように活用できるか

OCIのお客様は、次のようないくつかの方法でこれらのCohereモデルを活用できます。

  • 即時統合: これらのモデルは、チャットインターフェイス、API、または専用のエンドポイントを介してシームレスにアクセスでき、インフラストラクチャ管理を気にする必要はありません。これにより、お客様は、複雑な構成やデプロイメントを行うことなく、これらのモデルを独自のアプリケーションに簡単に統合できます。

  • AI開発の簡素化: OCI Generative AIサービスは、お客様がAI開発プロセスを簡素化するのに役立つツールとサービスの完全なセットを提供します。これらのツールとサービスには、以下が含まれます。

    • データ準備: OCI Generative AIサービスは、顧客がデータをクリーンアップ、変換、および準備して、AIモデルのトレーニングと推論に使用できるようにする一連のデータ準備ツールを提供します。
    • モデルトレーニング: OCI Generative AIサービスは、顧客が独自のAIモデルをトレーニングするのに役立つ一連のモデルトレーニングツールを提供します。これらのツールは、TensorFlow、PyTorch、Scikit-learnなど、さまざまなモデルタイプとフレームワークをサポートしています。
    • モデルデプロイメント: OCI Generative AIサービスは、顧客がトレーニング済みのAIモデルを本番環境にデプロイするのに役立つ一連のモデルデプロイメントツールを提供します。
    • モデルモニタリング: OCI Generative AIサービスは、顧客がAIモデルのパフォーマンスと精度を監視するのに役立つ一連のモデルモニタリングツールを提供します。
  • RAGワークフローの簡素化: Command Aを使用してコンテンツを生成し、Rerank 3.5で結果を最適化することで、複雑なRAGプロセスをより効率的かつ簡素化できます。

アプリケーションシナリオの多様性

これらのモデルは、次のようなさまざまなエンタープライズアプリケーションシナリオで使用できます。

  • カスタマーサービス: Command AおよびRerank 3.5を使用して、お客様の質問に回答し、お客様の懸念を解決し、パーソナライズされたサービスを提供するインテリジェントカスタマーサービスボットを構築できます。
  • コンテンツ生成: Command Aを使用して、ニュース記事、ブログ記事、製品の説明、ソーシャルメディアの投稿など、さまざまな種類のテキストコンテンツを生成できます。
  • 検索: Rerank 3.5を使用して、エンタープライズ検索の精度と効率を向上させ、ユーザーが必要な情報をすばやく見つけられるようにすることができます。
  • データ分析: Command AおよびRerank 3.5を使用して、さまざまな種類のデータを分析し、そこから有用な情報を抽出し、企業がより良い意思決定を行うのを支援できます。
  • 知識管理: インテリジェントな知識ベースを構築して、従業員が必要な情報を迅速に見つけ、作業効率を向上させることができます。

OCI Generative AIサービスは、高性能で多機能かつスケーラブルなAIモデルを提供することで、企業がさまざまな革新的なAIソリューションを構築し、競争力とビジネス価値を高めることを可能にします。

統合の詳細と価格情報については、Generative AIサービスのドキュメントを参照するか、Oracleの担当者にお問い合わせください。