Claude 3.7、コーディングAIの本命へ

Claude 3.7 Sonnet: コーディング能力の新基準

わずか2週間前のClaude 3.7 Sonnetのリリースは、その証拠となるものです。この最新版は、コーディング性能に関する既存のベンチマーク記録を打ち破りました。同時に、Anthropicは、プログラマー向けのアプリケーション開発を迅速化するために設計されたコマンドラインAIエージェントであるClaude Codeを発表しました。さらに、AnthropicのClaudeモデルをデフォルトとするAI搭載コードエディターであるCursorは、わずか12ヶ月で年間経常収益1億ドルという驚異的な数字に急上昇したと報告されています。

Anthropicがコーディングに重点を置いていることは、企業の間でAIコーディングエージェントの変革的な可能性に対する認識が高まっていることと一致しています。これらのエージェントは、経験豊富な開発者とコーディングの専門知識を持たない個人の両方が、前例のない速度と効率でアプリケーションを作成できるようにします。開発者(非コーダーを含む)がフロントエンドアプリケーションを展開できるようにする急成長中の企業であるVercelのCEO、Guillermo Rauchは、「Anthropicは引き続きトップに立っている」と適切に述べています。Vercelが昨年、重要なコーディングタスクでのパフォーマンスを徹底的に評価した結果、主要なコーディングモデルをOpenAIのGPTからAnthropicのClaudeに切り替えたという決定は、この点を強調しています。

2月24日に発表されたClaude 3.7 Sonnetは、ほぼすべてのコーディングベンチマークで明らかにリードを奪っています。エージェントのソフトウェア開発能力の尺度である、高く評価されているSWE-benchベンチマークで70.3%という驚異的なスコアを達成しました。このスコアは、最も近い競合他社であるOpenAIのo1 (48.9%) やDeepSeek-R1 (49.2%) を大幅に上回っています。さらに、Claude 3.7はエージェントタスクで優れたパフォーマンスを示します。

これらのベンチマーク結果は、実際のテストを通じて開発者コミュニティによって迅速に検証されています。オンラインディスカッション、特にRedditのようなプラットフォームでは、Claude 3.7とGrok 3 (Elon MuskのxAIの最新モデル) を比較していますが、コーディングタスクでは一貫してAnthropicのモデルが支持されています。あるトップコメンターは、「私がテストした限りでは、Claude 3.7がコードを書くのに最適であるようです(少なくとも私にとっては)」と感情を要約しました。今週初めに世界を席巻した新しい中国の多目的エージェントManusでさえ、Open AIのDeep Researchや他の自律タスクよりも優れていると述べ、主にClaudeに基づいて構築されたことは非常に重要です。

戦略的焦点: Anthropicのエンタープライズ戦略

Anthropicがコーディング機能に揺るぎなく注力しているのは、決して偶然ではありません。The Informationが報じたリーク予測によると、Anthropicは2027年までに345億ドルという驚異的な収益を目指しています。これは、現在のレベルから86倍の増加です。この予測収益のかなりの部分 (約67%) はAPIビジネスから生じると予想されており、エンタープライズコーディングアプリケーションが主要な成長エンジンとして機能します。Anthropicは正確な収益の数字を開示していませんが、2024年の最終四半期にコーディング収益が1,000%急増したと報告しています。この財務的な勢いに加えて、Anthropicは最近、35億ドルの資金調達ラウンドを発表し、同社の評価額は615億ドルという驚異的なものになりました。

このコーディング中心の戦略は、Anthropic自身のEconomic Indexの調査結果と一致しています。この指数は、Claudeに向けられたクエリの37.2%が「コンピューターと数学」のカテゴリに該当することを明らかにしました。これらのクエリは、主にコードの変更、デバッグ、ネットワークのトラブルシューティングなどのソフトウェアエンジニアリングタスクを網羅していました。

Anthropicのアプローチは、競合他社が幅広い機能を備えたエンタープライズ市場とコンシューマー市場の両方に対応しようとして、活動の渦に巻き込まれることが多い競争環境の中で際立っています。OpenAIは、早期の消費者認知と採用により強力なリードを維持していますが、多様なモデルと機能を備えた一般ユーザーと企業の両方にサービスを提供するという課題に直面しています。Googleも同様に、幅広い製品ポートフォリオを提供する戦略を追求しています。

Anthropicの比較的規律あるアプローチは、製品の決定にも反映されています。同社は、消費者市場のシェアを追うのではなく、GitHub統合、監査ログ、カスタマイズ可能な権限、ドメイン固有のセキュリティ制御などのエンタープライズグレードの機能を優先しています。6ヶ月前、開発者向けに50万トークンのコンテキストウィンドウを導入しました。これは、Googleが100万トークンのウィンドウをプライベートテスターに限定するという決定とは対照的です。この戦略的焦点は、包括的でコーディング中心の製品をもたらし、企業との共鳴をますます高めています。

同社は最近、非コーダーが組織内でAI生成アプリケーションを公開できるようにする機能を導入し、先週のコンソールアップグレードでは、共有可能なプロンプトやテンプレートなどの強化されたコラボレーション機能が追加されました。これは、「トロイの木馬」戦略を反映しています。最初は開発者が堅牢な基盤を構築できるようにし、その後、より広範な企業従業員にアクセスを拡大し、最終的には企業幹部に到達します。

Claudeの実践: 実験

これらのコーディングエージェントの実際の機能を評価するために、記事を保存するデータベースの構築に焦点を当てた実践的な実験が行われました。Anthropicのアプリを介したClaude 3.7 Sonnet、Cursorのコーディングエージェント、Claude Codeの3つの異なるアプローチが採用されました。

Anthropicのアプリを通じてClaude 3.7を直接利用すると、提供されたガイダンスは、特にコーディングの経験が豊富でない人にとっては非常に洞察に満ちたものでした。このモデルは、PostgreSQLデータベースを採用した堅牢なソリューションから、Airtableのような軽量な代替手段まで、いくつかのオプションを提示しました。軽量なソリューションを選択すると、ClaudeはAPIから記事を抽出し、コネクタサービスを使用してAirtableに統合するプロセスを系統的にガイドしました。このプロセスは、主に認証の課題のために約2時間かかりましたが、最終的には機能的なシステムになりました。基本的に、Claudeはすべてのコードを自律的に記述する代わりに、望ましい結果を達成するための包括的な青写真を提供しました。

Claudeのモデルをデフォルトで利用するCursorは、本格的なコードエディターエクスペリエンスを提供し、自動化への傾向が強くなりました。ただし、各ステップで許可が必要であり、やや反復的なワークフローになりました。

Claude Codeは異なるアプローチを提供し、ターミナル内で直接動作し、SQLiteを使用してRSSフィードから記事を取り込んだローカルデータベースを作成しました。このソリューションは、Airtableの実装と比較して堅牢性と機能が劣るものの、最終目標を達成するためにはよりシンプルで信頼性が高いことが証明されました。これは、固有のトレードオフを強調し、特定のプロジェクト要件に基づいてコーディングエージェントを選択することの重要性を強調しています。

この実験からの重要なポイントは、非開発者であっても、3つのすべてのアプローチを使用して機能的なデータベースアプリケーションを構築できたことです。これは、わずか1年前には事実上想像もできなかったでしょう。そして、注目すべきことに、3つのすべてのアプローチがClaudeの基盤となる機能に依存していました。

コーディングエージェントのエコシステム: Cursorとその先

おそらく、Anthropicの成功の最も説得力のある指標は、AIコードエディターであるCursorの驚異的な成長です。報告によると、Cursorはわずか12ヶ月で36万人のユーザーを獲得し、そのうち4万人以上が有料顧客です。この急速な成長軌道は、Cursorをそのマイルストーンに到達する最速のSaaS企業にする可能性があります。

Cursorの成功は、本質的にClaudeと結びついています。Red Dragon (AIエージェントの独立系開発者) の共同創設者であるSam Witteveenは、「彼らの最大の顧客はCursorだと考える必要があります。[Cursor]のほとんどの人は、すでにClaude Sonnetモデル、つまり3.5モデルを使用していました。そして今、誰もが3.7に移行しているようです」と述べています。

Anthropicとそのエコシステムの関係は、Cursorのような個々の企業を超えて広がっています。11月、AnthropicはModel Context Protocol (MCP) をオープンスタンダードとして導入し、開発者がClaudeモデルとシームレスに相互作用するツールを構築できるようにしました。この標準は、開発者コミュニティ内で広く採用されています。

Witteveenはこのアプローチの重要性を説明しました。「これをオープンプロトコルとして立ち上げることで、彼らは’皆さん、どうぞ。このプロトコルに適合するものは何でも開発できます。私たちはこのプロトコルをサポートします’と言っているようなものです。」

この戦略は好循環を生み出します。開発者はClaude専用のツールを構築し、企業にとっての価値提案を高め、それがさらなる採用を促進し、より多くの開発者を引き付けます。

競争環境: Microsoft、OpenAI、Google、オープンソース

Anthropicは、その焦点を絞ったアプローチでニッチを切り開いてきましたが、競合他社はさまざまな程度の成功を収めて多様な戦略を追求しています。

Microsoftは、GitHub Copilotを通じて強力な足場を維持しており、約2年で130万人の有料ユーザーと77,000以上の組織による採用を誇っています。Honeywell、State Street、TD Bank Group、Levi’sなどの著名な企業がそのユーザーです。この広範な採用は、主にMicrosoftの既存の企業関係と、OpenAIへの早期投資とCopilotを強化するためのOpenAIのモデルの利用から生じる先行者利益に起因しています。

しかし、MicrosoftでさえAnthropicの強みを認めています。10月には、GitHub CopilotユーザーがOpenAIの代替としてAnthropicのモデルを選択できるようにしました。さらに、OpenAIの最近のモデルであるo1と新しいo3 (拡張された思考を通じて推論を強調する) は、コーディングやエージェントタスクで特に優位性を示していません。

Googleは最近、Code Assistを無料で提供することで独自の動きを見せましたが、これは戦略的イニシアチブというよりも防御的な動きのようです。

オープンソース運動は、この状況におけるもう1つの重要な力です。MetaのLlamaモデルは、AT&T、DoorDash、Goldman Sachsなどの主要企業がさまざまなアプリケーションにLlamaベースのモデルを展開しており、かなりのエンタープライズの牽引力を獲得しています。オープンソースアプローチは、クローズドモデルではしばしば対応できない、より優れた制御、カスタマイズオプション、およびコストメリットを企業に提供します。

Anthropicは、これを直接的な脅威と見なすのではなく、オープンソースを補完するものとして位置付けているようです。エンタープライズの顧客は、特定の要件に応じてClaudeをオープンソースモデルと組み合わせて活用し、それぞれの強みを最大限に引き出すハイブリッドアプローチを採用できます。

実際、多くの大規模エンタープライズ企業は、特定のタスクに最適なモデルを利用するマルチモーダルアプローチを採用しています。たとえば、Intuitは当初、確定申告アプリケーションのデフォルトとしてOpenAIに依存していましたが、その後、特定のシナリオでのパフォーマンスが優れているためClaudeに切り替えました。この経験により、Intuitはモデル間のシームレスな切り替えを容易にするAIオーケストレーションフレームワークを開発しました。

その後、他のほとんどのエンタープライズ企業も同様の慣行を採用し、多くの場合、単純なAPI呼び出しを通じてモデルを統合し、各特定のユースケースに最も適切なモデルを採用しています。Llamaのようなオープンソースモデルが適切な場合もありますが、計算などの高い精度を必要とするタスクには、Claudeが好まれることがよくあります。

エンタープライズへの影響: コーディングエージェントへの移行

エンタープライズの意思決定者にとって、この急速に進化する状況は、機会と課題の両方を提示します。

セキュリティは依然として最も重要な懸念事項ですが、最近の独立したレポートでは、Claude 3.7 Sonnetがこれまでで最も安全なモデルであると特定され、「ジェイルブレイク防止」であることが証明された唯一のテスト済みモデルでした。このセキュリティ体制は、GoogleとAmazonの両方からのAnthropicの支援 (およびAWS Bedrockへの統合) と相まって、エンタープライズの採用に有利な立場にあります。

コーディングエージェントの普及は、アプリケーションの開発方法を変革するだけでなく、プロセスを民主化しています。GitHubによると、18ヶ月前の時点で、エンタープライズ企業の米国を拠点とする開発者の92%が、すでにAIを活用したコーディングツールを職場で利用していました。この数字は、それ以来大幅に増加した可能性があります。

Witteveenは、技術チームメンバーと非技術チームメンバーの間のギャップを埋めることを強調しました。「[コーダーでないために]人々が抱えている課題は、実際には用語の多くを知らないことです。彼らはベストプラクティスを知りません。」AIコーディングエージェントは、この課題にますます対処し、より効果的なコラボレーションを可能にしています。

エンタープライズの採用について、Witteveenはバランスの取れたアプローチを提唱しています。「現時点では、セキュリティと実験のバランスです。明らかに、開発者側では、人々はこのもので実際のアプリを構築し始めています。」

AIコーディングエージェントの出現は、エンタープライズソフトウェア開発における根本的な変化を示しています。これらのツールを効果的に展開すると、開発者を置き換えるのではなく、役割を変革し、実装の詳細ではなくアーキテクチャとイノベーションに集中できるようにします。

競合他社が複数の優先事項を追求する中で、コーディング機能に特化したAnthropicの規律あるアプローチは、大きな利点をもたらしているようです。2025年末までに、この期間は、AIコーディングエージェントが不可欠なエンタープライズツールになり、Claudeが先導した重要な瞬間として振り返られるかもしれません。

技術的な意思決定者にとって、緊急の課題は明らかです。これらのツールを迅速に実験するか、すでにそれらを活用して開発サイクルを劇的に加速している競合他社に遅れをとるリスクを冒してください。この状況は、iPhone革命の初期の頃に似ています。企業は当初、「認可されていない」デバイスを企業ネットワークから制限しようとしましたが、従業員の需要が圧倒的になるにつれて、最終的にはBYODポリシーを受け入れました。Honeywellのような一部の企業は最近、IT部門によって承認されていないAIコーディングツールの「不正な」使用を同様に停止しようとしました。

スマートな企業は、制御された実験を促進するために、すでに安全なサンドボックス環境を確立しています。イノベーションを促進しながら明確なガードレールを確立する組織は、従業員の熱意と、これらのツールが独自のニーズにどのように最適に対応できるかについての洞察の両方のメリットを享受し、変化に抵抗する競合他社よりも優位に立つことができます。そして、少なくとも現時点では、AnthropicのClaudeは、この変革的な動きの主要な受益者です。