段階的な改善、天文学的なコスト
OpenAIは最近GPT-4.5を発表しました。当初は研究プレビューとして提示されました。この強力な言語モデルの新しいイテレーションは、限定的に利用可能となっており、高額な料金設定がされています。Proユーザーは月額200ドル、Plusユーザーは月額20ドルでアクセスできます。OpenAIのCEOであるSam Altman氏は、GPT-4.5をより自然で会話的なモデルであると宣伝していますが、そのリリースは、特に中核的な推論能力に関して、明らかに賛否両論の反応を受けています。
GPT-4.5は、いくつかの主要分野で改良を誇っています。OpenAIは、精度の向上、「幻覚」(誤った情報を生成すること)の傾向の低減、説得能力の向上を主張しています。しかし、これらの機能強化には、多大なコストがかかります。GPT-4.5を利用するための料金体系は、100万入力トークンあたり75ドル、100万出力トークンあたりなんと150ドルに設定されています。この価格設定は、AIコミュニティ内で激しい議論を巻き起こしており、専門家の間では、段階的な改善がこのような大幅な財政的支出を正当化するかどうかについて意見が大きく分かれています。
核心的な問題は、GPT-4.5の実際の価値提案を中心に展開します。よりスムーズな会話とわずかに改善された精度は歓迎されますが、根本的な疑問は残ります。それはAI機能の大幅な飛躍を表しているのか、それとも既存のテクノロジーの単なる高価な改良なのか?
実世界でのテスト:OpenAIの主張との乖離?
GPT-4.5の独立した評価は、さらなる議論を煽っています。AI分野の著名な人物であるAndrej Karpathy氏は、GPT-4とGPT-4.5を比較する実験を行いました。5つの創作タスクがユーザーに提示され、その後、出力の品質を判断するよう求められました。驚くべきことに、結果は5つのタスクのうち4つで古いGPT-4モデルを支持しました。この結果は、GPT-4.5が普遍的に優れたイテレーションであるという概念に直接的に異議を唱えています。
Raj Dandeker博士の技術的評価も、同様に懸念される結果をもたらしました。彼のテストは、OpenAIが明示的に改善を主張していた分野、例えば数学的推論や論理的演繹に焦点を当てました。しかし、GPT-4.5はこれらの分野で苦戦し、前任者に対する優位性をほとんど、あるいは全く示さなかったと報告されています。これらの調査結果は、OpenAIの主張と直接矛盾し、同社のマーケティング主張の透明性と正確性について深刻な疑問を提起しています。
メディアと業界の反応:さまざまな意見
GPT-4.5に対するメディアの反応は、AIコミュニティ内の意見の分裂を反映しています。テクノロジー・ジャーナリズムの著名な声であるWired誌は、OpenAIの人工汎用知能(AGI)への絶え間ない追求に疑問を呈し、GPT-4.5をわずかな利益しかない高価なアップグレードであると特徴づける批判的な視点を提供しました。もう一つの影響力のある出版物であるFuturismは、リリースを取り巻く最初の誇大宣伝の衰退を指摘し、テクノロジーの真の可能性に対する懐疑論の高まりを示唆しました。
しかし、すべての反応が否定的だったわけではありません。スタンフォード大学と提携しているJacob Rintamaki氏は、より肯定的な評価を提供し、特にGPT-4.5のユーモアのセンスの向上を賞賛しました。彼は、これはAIが社会的相互作用を理解し、関与する能力における重要な前進を表していると主張しました。これは、GPT-4.5の潜在的なニッチ市場、つまり、微妙なコミュニケーションとユーモアのセンスが最も重要な分野で優れていることを強調しています。
競合他社の反応
競合するAIモデルでさえ、ある意味でGPT-4.5のリリースについて「コメント」しています。ライバルの言語モデルであるxAIのGrokは、GPT-4.5の会話能力の向上を認めましたが、そのリソース集約的な性質も指摘しました。これは、GPT-4.5を実行するために必要な膨大な計算能力という重大な懸念を強調しています。これは、直接的に運用コストの増加と環境フットプリントの拡大につながります。
ChatGPT自体は、プロンプトが表示されると、GPT-4.5のコンテキスト保持、創造性、精度の向上を強調しました。しかし、モデルはまだ欠点を示していることも認めました。特に、長時間の会話では、進行中の対話を見失ったり、矛盾した応答を生成したりすることがあります。この自己評価は、一見客観的に見えますが、GPT-4.5は、その進歩にもかかわらず、依然として不完全なテクノロジーであるという認識をさらに強めます。
詳細を掘り下げる
賛否両論の反応を理解するためには、GPT-4.5を取り巻く具体的な主張と反論をより詳細に検討することが重要です。
1. 精度向上の主張:
OpenAIは、GPT-4.5が前任者よりも正確であると主張しています。これは、特定の狭く定義されたタスクでは当てはまるかもしれませんが、Karpathy氏とDandeker氏による独立したテストは、この主張の一般化可能性に疑問を投げかけています。精度の向上は、すべてのドメインで均一ではなく、当初宣伝されていたほど重要ではない可能性があります。
2. 幻覚の低減の約束:
「幻覚」、つまり言語モデルが虚偽または無意味な情報を生成する傾向は、この分野における永続的な課題でした。OpenAIは、GPT-4.5がこの問題の軽減に前進したと主張しています。しかし、ユーザーレポートや事例証拠は、幻覚は、おそらく頻度は少ないものの、依然として問題であることを示唆しています。モデルは、特に複雑または微妙なトピックを扱う場合、自信を持って述べられた不正確さを生成する可能性があります。
3. 説得の技術:
OpenAIは、GPT-4.5の強化された説得能力を強調しています。これは倫理的な懸念を引き起こします。より説得力のあるAIは、誤った情報を広めたり、望ましくない方法で意見に影響を与えたりするなど、操作的な目的に使用される可能性があるためです。GPT-4.5の説得力が真の改善を表すのか、潜在的なリスクを表すのかは、現在も議論の対象となっています。
4. 会話の優位性:
GPT-4.5は、間違いなくGPT-4よりも流暢で魅力的な会話者です。これは、おそらく最も重要で、すぐにわかる改善点です。モデルは、より自然に流れるテキストを生成し、人間のような話し方をより効果的に模倣し、会話のニュアンスをより深く理解します。これにより、チャットボット、仮想アシスタント、創作ツールなどのアプリケーションに適しています。
5. 推論の欠如:
会話の改善にもかかわらず、推論能力における実質的な進歩の欠如は、多くの批評家にとって大きな問題点です。GPT-4.5は、論理的演繹、数学的推論、常識的な理解を必要とするタスクに依然として苦労しています。この制限は、科学研究、財務モデリング、法的な分析など、正確で分析的な思考を必要とする分野での適用性を妨げます。
6. コスト要因:
GPT-4.5を使用するための法外なコストは、多くの潜在的なユーザーにとって参入障壁となっています。入力トークンと出力トークンに基づく価格設定は、大規模なアプリケーションや持続的な使用には法外に高価になります。これは、十分な資金を持つ組織や個人だけがテクノロジーを活用できるため、アクセシビリティと公平性に関する懸念を引き起こします。
7. 「研究プレビュー」ラベル:
OpenAIがGPT-4.5を「研究プレビュー」としてリリースするという決定は注目に値します。これは、モデルがまだ開発中であり、さらなる改良が行われる可能性があることを示唆しています。また、OpenAIが制限を認識しており、将来の改善を導くためにユーザーからのフィードバックを求めていることも意味します。しかし、「研究プレビュー」ラベルは、高コストやOpenAIの主張とモデルの実際のパフォーマンスとの間の矛盾を完全に正当化するものではありません。
より広い文脈:AI軍拡競争
GPT-4.5のリリースは、進行中の「AI軍拡競争」というより広い文脈の中で理解する必要があります。OpenAI、Google、Anthropicなどの企業は、最も高度で有能なAIモデルを開発するための激しい競争を繰り広げています。この競争圧力は、急いだリリース、誇張された主張、根本的なブレークスルーではなく段階的な改善への焦点を招く可能性があります。
人間レベルの知性と一般的な問題解決能力を持つ仮説的なAIであるAGIの追求は、この分野の研究開発の多くを推進する力であり続けています。しかし、GPT-4.5は、その進歩にもかかわらず、この野心的な目標にはほど遠いものです。これは、AGIへの道は長く困難であり、真のブレークスルーはまれで達成が難しいことを思い出させてくれます。
GPT-4.5の将来
GPT-4.5の最終的な運命は不確実なままです。「研究プレビュー」として、時間の経過とともに進化する可能性があります。OpenAIは、批判に対処し、モデルの推論能力を向上させ、コストを削減し、特定のドメインでのパフォーマンスを改善する可能性があります。
しかし、GPT-4.5に対する賛否両論の反応は、AI分野における批判的評価と独立したテストの重要性を強調しています。また、特にモデルの能力と制限に関して、OpenAIのような企業からの透明性の向上の必要性を強調しています。
今のところ、GPT-4.5は、AIにおける進行中の進歩の証であると同時に、誇大宣伝の危険性、真のブレークスルーを達成することの課題、倫理的配慮と現実的な現実とのバランスをとることの重要性についての注意喚起でもあります。高額な価格設定と、疑問の残る投資収益率により、ほとんどの人が手に入れることができず、さらに少数の人しか正当化できない贅沢品となっています。これは、AIの進歩が常に直線的であるとは限らず、より大きく、より高価なモデルが常に優れているとは限らないことを強く思い出させてくれます。