OpenAI、GPT-4.5を発表

強化された対話と幻覚の低減

OpenAIは発表に伴うブログ投稿で、GPT-4.5によって提供されるユーザーエクスペリエンスの向上を強調しました。「初期のテストでは、GPT‑4.5との対話がより自然に感じられることが示されています」と同社は述べています。この自然さの向上は、いくつかの主要な改善点に起因します。

  • より広範な知識ベース: GPT-4.5は、より広範な知識ベースを備えており、より幅広いトピックやクエリをより高い精度と深さで処理できます。
  • 意図理解の向上: このモデルは、ユーザーの意図を理解し、それに従う優れた能力を示し、より関連性が高く役立つ応答につながります。
  • より高い’EQ’: OpenAIは、GPT-4.5がより高いレベルの’感情的知性’を示唆しており、人間のコミュニケーションのニュアンスをよりよく理解し、応答できるようになっています。

これらの改善は、より直感的で生産的なユーザーエクスペリエンスに貢献します。さらに、内部テストでは、GPT-4.5は、OpenAIの以前のモデルであるGPT-4oおよびo1よりも大幅に低い幻覚率を示すことが明らかになりました。幻覚、つまりAIモデルが事実と異なる、または無意味な情報を生成する現象は、大規模言語モデルの開発における永続的な課題でした。GPT-4.5の幻覚率の低下は、この問題を軽減するための重要な一歩です。

前進の一歩、しかし頂点ではない

GPT-4.5は重要な進歩を表していますが、OpenAIの共同創設者兼CEOであるSam Altman氏は、ベンチマークパフォーマンスの点で最先端ではないことを明らかにしました。X(旧Twitter)への投稿で、Altman氏はこのモデルを「これまで感じたことのない魔法を持っている」と表現し、そのユニークな機能と可能性を示唆しました。しかし、彼は、それが必ずしも標準化されたテストで他のモデルを上回るとは限らないことを認めました。

この区別は、OpenAIのモデル開発へのアプローチを強調しています。OpenAIは、生のパフォーマンスだけでなく、全体的なユーザーエクスペリエンスと、モデルが現実世界のタスクを効果的に処理する能力も優先しています。GPT-4.5が自然な対話、幻覚の低減、意図理解の向上に焦点を当てていることは、強力であるだけでなく、信頼性が高く、ユーザーフレンドリーなモデルへのシフトを示唆しています。

段階的なロールアウトとインフラストラクチャの課題

OpenAIの研究リーダーであり、同社の技術スタッフのメンバーであるAlex Paino氏は、ライブストリーム中に、GPT-4.5の段階的なロールアウトを計画しており、来週ChatGPT PlusおよびTeamの加入者から開始すると述べました。ChatGPT EduおよびEnterpriseの加入者は、その次の週にアクセスできるようになります。この段階的なアプローチにより、OpenAIは新しいモデルの需要を管理し、ユーザーベースのスムーズな移行を確実に行うことができます。

Altman氏は、Xへの投稿で、GPT-4.5を「巨大で高価なモデル」と表現しました。彼は、リソースの制約のため、最初のロールアウトはPlusおよびProの加入者を優先すると説明しました。「PlusとProに同時にローンチしたかったのですが、成長が著しく、GPUが不足しています」と彼は書いています。「来週、数万個のGPUを追加し、Plus層にロールアウトします。」この声明は、大規模言語モデルの計算需要の大きさと、その展開をサポートするのに十分なハードウェアリソースを確保するという継続的な課題を浮き彫りにしています。GPU(Graphics Processing Units)は、AIモデルに必要な並列処理に特に適した特殊なプロセッサです。

MicrosoftのAzure AI Foundryとの統合

GPT-4.5の可用性は、OpenAI自身のプラットフォームを超えて広がっています。MicrosoftのCEOであるSatya Nadella氏は、Xで、このモデルがMicrosoftのAzure AI Foundryを通じてプレビューで利用可能であると発表しました。この統合は、2つの企業間の深いパートナーシップを反映しています。MicrosoftはOpenAIに130億ドル以上を投資しており、OpenAIのモデルをさまざまなMicrosoft製品に組み込んでいます。さらに、MicrosoftはOpenAIに重要なコンピューティングリソースを提供し、高度なAI技術の開発と展開をサポートしています。

Azure AI Foundryは、開発者にGPT-4.5を含む最先端のAIモデルを使用してアプリケーションを実験および構築するためのプラットフォームを提供します。このコラボレーションにより、OpenAIのテクノロジーのリーチが拡大し、より幅広い開発者がその機能を活用できるようになります。

コンテキスト:市場の動向と将来のロードマップ

GPT-4.5のリリースは、AI分野における激しい活動と競争の時期に行われました。わずか1か月前、市場は中国のラボDeepSeekによる効率的なアプローチの発表に強く反応しました。この出来事は、AIモデル開発で広く使用されているGPUの主要メーカーであるNvidiaの時価総額が1日で約6,000億ドル近く減少するという大幅な下落につながりました。この事件は、急速に進化する人工知能の分野における進歩と競争圧力に対する市場の敏感さを浮き彫りにしました。

市場の意識の高まりに応えて、Altman氏は、OpenAIのロードマップに関する透明性を高める必要性を認めました。Nvidiaの市場下落の2週間後、彼はXへの投稿で、同社が将来の計画に関する公開コミュニケーションを改善することを目指していると述べました。この透明性へのコミットメントは、AI開発の方向性と進捗状況について関係者に情報を提供し続けることの重要性に対する認識の高まりを反映しています。

Altman氏は、OpenAIの将来の計画についてさらに洞察を提供し、GPT-4.5の後にGPT-5が続き、GPT-5にはOpenAIのより幅広いテクノロジーが組み込まれることを示しました。彼はまた、同社がユーザーのクエリ時に広範な計算を実行する「推論モデル」に取り組んでいることにも言及しました。対照的に、GPT-4.5は同社の「最後の非chain-of-thoughtモデル」と表現されており、将来の反復ではより洗練された推論機能へのシフトを示唆しています。Chain-of-thoughtプロンプティングは、大規模言語モデルが複雑な問題を一連の中間ステップに分解することを促し、推論と問題解決能力を向上させる手法です。

GPT-4.5の機能の詳細

GPT-4.5のアーキテクチャとトレーニングデータに関する具体的な技術的詳細は明らかにされていませんが、OpenAIの声明と初期のテスト結果は、その主要な機能と改善点についていくつかの手がかりを提供しています。

  • 強化された言語理解: GPT-4.5は、自然言語理解における先行モデルの進歩に基づいている可能性があります。これには、次のような分野の改善が含まれます。
    • 構文と文法: より正確な構文解析と文法的に正しい文の生成。
    • 意味論: 単語と概念の意味と関係のより良い理解。
    • 語用論: 言語使用の背後にある文脈と意図を解釈する能力の向上。
  • 拡張された知識表現: OpenAIが言及した「より広範な知識ベース」は、GPT-4.5が以前のモデルよりも大きく、より多様なデータセットでトレーニングされたことを示唆しています。これには、より幅広いトピック、事実情報、および書き方のスタイルが含まれる可能性があります。
  • 洗練された推論と問題解決: 明示的に「推論モデル」とはラベル付けされていませんが、GPT-4.5のユーザーの意図に従い、実際の問題を解決する能力の向上は、推論能力の強化を示唆しています。これには、次のような改善が含まれる可能性があります。
    • 論理的演繹: 与えられた前提から有効な結論を導き出す。
    • 常識的推論: 日常の知識と理解を適用して問題を解決する。
    • 因果推論: 原因と結果の関係を特定する。
  • 幻覚の軽減: 幻覚率の低下は重要な進歩です。これは、次のような要因の組み合わせに起因する可能性があります。
    • 改善されたトレーニングデータ: トレーニングデータセットから不正確または誤解を招く情報を除外する。
    • 人間のフィードバックからの強化学習(RLHF): 人間のフィードバックに基づいてモデルを微調整し、事実の正確性を優先し、無意味なコンテンツの生成を減らす。
    • アーキテクチャの変更: モデルの応答を知識ベースに適切に接地させ、サポートされていない主張に逸脱するのを防ぐメカニズムを組み込む可能性があります。

‘感情的知性’の重要性

OpenAIがGPT-4.5のより高い’EQ’に言及していることは特に興味深いです。AIモデルは人間のような意味での感情を持っていませんが、この文脈での「感情的知性」という用語は、モデルの次の能力を指している可能性があります。

  • 感情的なトーンを認識して応答する: ユーザー入力の感情的なトーン(例:ポジティブ、ネガティブ、ニュートラル、不満、熱狂的)を検出し、それに応じて応答を調整する。
  • 適切な感情的なニュアンスでテキストを生成する: 事実として正確であるだけでなく、与えられた文脈に対して感情的に適切なテキストを生成する。これには、状況に応じて、共感的、励まし、または安心させるような言葉を使用することが含まれる場合があります。
  • 暗黙の感情的な手がかりを理解して応答する: 言葉の選択、文の構造、句読点など、言語使用における微妙な手がかりから感情状態を推測する。

AIモデルの「感情的知性」を高めることは、より自然で魅力的な相互作用を生み出すための重要な一歩です。これにより、カスタマーサービス、教育、創作など、さまざまなアプリケーションでユーザーエクスペリエンスを向上させることができます。

GPT-4.5の広範な影響

GPT-4.5のリリースは、人工知能の分野とその応用に対して、いくつかの広範な影響を及ぼします。

  • 汎用AIの継続的な進歩: GPT-4.5は、幅広いタスクを実行し、多様な種類の情報を処理できるAIモデルの開発における継続的な進歩を示しています。この傾向は、AIで可能なことの限界を押し広げ、さまざまな業界での応用の新しい可能性を開いています。
  • 信頼性と信用性への注目の高まり: 幻覚を減らし、事実の正確性を向上させることに重点が置かれていることは、信頼できるAIシステムを構築することの重要性に対する認識の高まりを反映しています。AIモデルが重要なアプリケーションに統合されるにつれて、その信頼性を確保し、誤解を招く情報を生成するリスクを最小限に抑えることが最も重要です。
  • 人間とコンピューターの相互作用の強化: 自然言語理解、意図認識、「感情的知性」の改善は、人間とAIシステム間のよりシームレスで直感的な相互作用に貢献します。これは、AIテクノロジーをより幅広いユーザーにとってよりアクセスしやすく、使いやすくするために不可欠です。
  • 新しいアプリケーションの可能性: GPT-4.5の機能は、次のような分野で新しいアプリケーションを可能にする可能性があります。
    • コンテンツ作成: マーケティング、ジャーナリズム、教育など、さまざまな目的のために高品質の書面コンテンツを生成する。
    • コード生成: コードスニペットの生成、コードのデバッグ、プログラミングタスクの自動化により、ソフトウェア開発者を支援する。
    • データ分析: 大規模なデータセットから洞察を要約および抽出する。
    • パーソナライズされた学習: 個々の生徒のニーズに合わせて教育コンテンツと指導を適応させる。
    • カスタマーサービス: よりインテリジェントで共感的なカスタマーサポートを提供する。

GPT-4.5は、大規模言語モデルの進化における注目すべき進歩を表しています。自然な対話、幻覚の低減、ユーザーエクスペリエンスの向上に焦点を当てているため、幅広いアプリケーションに役立つツールとしての地位を確立しています。究極のベンチマークパフォーマーではありませんが、AI開発の進歩を表しており、強力であるだけでなく、信頼性が高く、信用でき、ユーザーフレンドリーなAIシステムの作成に焦点を当てていることを強調しています。段階的なロールアウトとMicrosoftのAzure AI Foundryとの統合により、そのリーチが拡大し、より幅広いユーザーがその機能を探索できるようになります。