新石器時代革命:イノベーションの種まき
およそ12,000年前、私たちの祖先は遊牧的な狩猟採集民から定住的な農業従事者へと移行し、食料を得るために植物を栽培し、動物を飼育しました。農業、つまり耕作は、太陽光、水、空気を利用して植物や動物を育てる、初歩的な食料工場です。中世において土地耕作に対する固定的な地代の支払いを意味する「firma」という言葉は、農業と同義になりました。
農業は、効率的な農業運営のために階層的な社会構造を必要としました。文字は、これらの食料工場における投入と産出を追跡し、社会的なルールを確立するための管理ツールとして登場しました。時が経つにつれて、文字は多様な分野を網羅するように拡大し、複雑な情報を伝える強力な手段であり続けています。
私たちが弓や槍を鍬、熊手、鋤に交換し、最初の象徴的なグリフを粘土や石に刻んだ瞬間から、AIの出現、そして結果としてAIファクトリーの出現は必然となりました。それは単に時間の問題でした。
産業革命:大量生産への道のりを切り開く
何千年もの間、人類は農業技術を磨き、余剰を生み出して商人階級の出現を促しました。商人階級とは、他者のために商品を製作する人々、つまりラテン語の「手による仕事」に由来する「製造業」に従事する人々です。これにより、貨幣が発展しました。貨幣とは、物々交換を加速させ、現代経済へと転換させる交換媒体です。大航海時代以降、グローバリゼーションは地域経済と国家経済を結びつけました。
その後のグローバリゼーションの波は、農業と製造業の両方を再構築しました。標準化された製造業の中心地である工場における重要な変化は、生産プロセスを個別のステップに分割して、スピードと再現性を向上させることでした。この産業革命は、工場が効率を最大化し、無駄を最小限に抑えるために教育を受けた労働者を必要としたため、識字率が急上昇した啓蒙時代と一致しました。教育は不可欠となり、参政権、私有財産権、宗教の自由、安全、言論の自由、迅速な裁判を受ける権利の認識を促進しました。
これらの原則は、21世紀においては自明のことですが、その起源は18世紀に遡ります。
工場は製造業を屋内にもたらし、蒸気と電気を利用して組み立てラインとリーン生産方式に動力を供給しました。これにより、手頃な価格で商品を生産できるようになり、生活水準が向上し、中産階級の成長が促進され、農業社会の能力を超えた経済成長が推進されました。
AI革命:新たなフロンティアとしてのデータ
インターネットの出現は、個人を結びつけ、新しいリソースを生み出しました。それは、洞察に満ちた分析に最適なデータです。
AI革命は、膨大な量のテキスト、画像、ビデオ、オーディオのデジタル化と、このデータを処理するための手頃な価格の計算能力にかかっていました。ビッグデータは、大規模並列GPUと高メモリ帯域幅と組み合わせることで、世界に対する私たちの理解をエンコードするニューラルネットワークの作成を可能にし、それによって人工知能を可能にします。
本質的に、ビッグデータは、機能的なニューラルネットワークを構築するためにGPUエンジン上で実行されるAIアルゴリズムの原材料を提供します。
これらの要素は同時に収束する必要があります。1980年代、研究者はニューラルネットワークアルゴリズムを持っていましたが、それらを実装するための計算リソースとデータが不足していました。その結果、AIは、これら3つの条件が満たされるまで、ほとんど理論的なままでした。
AIファクトリー:文字通りの変革
「AIファクトリー」という用語は、単なる比喩ではなく、商業環境で動作する最新のAIスーパーコンピューターを正確に記述したものです。これは、企業コンピューティングとデータ分析、つまりデータを実行可能な情報に統合することを根本的に変えます。
AIファクトリーは、集団的な努力が食料生産を保証した農業革命と同じくらい必然です。この革命から生じる社会的および文化的な変化は、人類に熟考と革新のための余暇を与えました。現在、機械は人間の知識全体にアクセスして処理することができ、会話型検索を可能にし、AIアルゴリズムを逆適用して、さまざまな形式で新しいデータを生成できます。
企業や個人は、直接的またはタイムシェアリングの取り決めを通じて、AIファクトリーにアクセスできるようになります。これらのAIファクトリーは、斬新なアイデアやビジョンを生み出し、個々の創造的な能力を増幅します。
AIファクトリーの変革の可能性は、すべてを網羅しています。チャットボット、モデルトレーニングと推論のための並列計算エンジンの開発者、およびOpenAI、Anthropic、Google、Mistralなどのモデル作成者は、AIが私たちの生活のあらゆる側面を再構築することに同意しています。さまざまな問題に関する世界的な意見の相違にもかかわらず、AIの変革的な影響は普遍的に認められています。
洞察と行動の製造
AIファクトリーは、2つの主要な機能を果たします。1つ目は、基盤モデルをトレーニングし、ビジネスと個人の改善のための洞察を生み出すことです。2つ目は、より重要な機能ですが、これらのモデルに新しいデータと質問を入力して、新しい答えを推論し、新しいトークンを生成し、行動を促進することです。
AIに関する議論の多くは、数十億から数兆のパラメーターと膨大なデータセットを誇る、絶えず拡大する基盤モデルのトレーニングに集中しています。トークン数は知識の幅を示し、パラメーターは理解の深さを示します。より大きなトークンセットと組み合わせたより少ないパラメーター数は、より迅速で単純な答えをもたらします。逆に、より大きなパラメーター数とより少ないトークンセットは、限られたドメインに対するよりニュアンスのある洞察を提供します。連鎖思考推論モデルは本質的にマルチモーダルであり、特殊化されたモデルを組み合わせて、他の入力を駆動する出力を考慮し、包括的な答えを生成します。
AIファクトリーは、人間が作成したすべてのコンテンツと、AIモデルが原材料として生成した合成データを利用します。このデータから得られた洞察は、人間とAIエージェントによって活用され、行動を促進します。工場で働く代わりに、個人はAIモデルの知識と速度で自分のスキルを強化して、より多くの、より良い、より速い結果を達成するために工場を活用します。
NVIDIAの共同創設者兼CEOであるジェンスン・フアンによると、「世界は最先端の大規模なAIファクトリーを構築するために競争しています。」AIファクトリーの設立は、膨大なリソース、人員、および材料を必要とする並外れたエンジニアリングの偉業です。
AIファクトリーの構築には、多大な資本投資が必要です。一般的な構成は、GPU、CPU、高速インターコネクト、およびストレージを備えたDGXシステム、複数のラックに基づくNVIDIA DGX SuperPODで構成されています。
多数のDGXシステムを備えたSuperPODは、かなりのメモリ容量と帯域幅を誇り、実質的なパフォーマンスを提供します。パフォーマンスは、より多くのシステムを追加することで拡張できます。
AIファクトリー向けの別のNVIDIAブループリントは、GPU、CPU、DPU、SuperNIC、NVLinkおよびNVSwitch、および高速ネットワーキングを統合したラックスケールシステムであるNVIDIA GB200 NVL72プラットフォームを中心に展開しています。このプラットフォームは、AIモデル向けのより大きな共有GPUメモリドメインと、より高い計算密度を提供し、液冷を必要とします。
完全なボリュームで出荷されるGB200 NVL72は、モデルを構築し、さまざまな形式でデータを生成できる自己完結型システムを表しています。
GB200 NVL72は、Blackwell GPUとペアになったNVIDIA Grace CPUを備えたMGXサーバーノードで構成されています。これらのサーバーノードのうち2つがNVL72ラック内のコンピューティングトレイを形成し、18個のコンピューティングトレイに多数のGPUとCPUが収納されています。
GB200 NVL72ラックスケールシステムは、高速NVLink接続を介して相互接続されたGrace CPUとBlackwell GPUを組み合わせます。NVLinkポートとNVSwitchチップは、共有メモリ構成のすべてのGPUをリンクし、基盤モデルのトレーニングと連鎖思考推論に最適です。
9つのNVLinkスイッチトレイによって促進されるNVLinkファブリックは、AIアプリケーション向けの統合GPUとして、すべてのGPUダイへのアクセスを可能にします。
GB200 NVL72システムは、ホスト処理用の多数のArmコアと、実質的な浮動小数点処理能力を備えています。GB200 NVL72システムは、GPUに接続された実質的なHBM3eメモリを備えており、高い集約帯域幅を備えています。Grace CPUは、NVLink経由でアクセス可能なLPDDR5Xメモリを備えています。
NVIDIA GB200 NVL72は、オンライントランザクション処理に対するSystem/360の変革的な影響を反映していますが、重要な違いは、InfiniBandインターコネクトを介したNVL72のスケーラビリティです。
NVL72ラックスケールシステムに基づくDGX SuperPOD構成は、かなりの電力を必要としますが、複数のコンピューティングラックにわたって巨大な計算能力とメモリ容量を提供します。パフォーマンスは、より多くのラックを追加することで拡張できます。
NVL72ラックの計算密度は、特殊な液冷とデータセンターインフラストラクチャを必要とし、水冷マシンがパフォーマンスを最大化した過去の実践への回帰を表しています。
推論が多様なアプリケーションに不可欠になるにつれて、特に連鎖思考推論モデルへの移行に伴い、AIファクトリーは大幅に多くの計算能力を必要とします。
AIファクトリーには、ハードウェアだけでなく、システムと開発ソフトウェアも含まれます。
DGX GB200システムとDGX SuperPOD AIスーパーコンピューターは、NVIDIA Mission Controlのようなツールによって促進される管理とモデリングを必要とし、AIワークロードを調整し、ジョブを自動的に回復します。Mission Controlは、システムの状態を監視し、電力消費を最適化します。
NVIDIA AI Enterprise(システムソフトウェアスイート)には、NVIDIA GPUおよびネットワーク向けに最適化されたライブラリ、モデル、およびフレームワークが含まれています。AIファクトリースタックは、NVLinkおよびDGX SuperPODインフラストラクチャ全体で推論を実行するためのオープンソースフレームワークであるNVIDIA Dynamoも備えています。DGX Expert Service and Supportは、顧客がこれらのテクノロジーを実装するのを支援し、最初のトークンまでの時間を短縮します。NVIDIAは、データセンターの設計をシミュレートおよび最適化するために、Omniverse「デジタルツイン」環境向けのAIファクトリーブループリントを提供します。
AIファクトリーの重要な側面は、NVIDIAがシステムの成長のためのヘッドルームを優先することで生じる思考の変化です。
NVIDIAのネットワーキング担当シニアバイスプレジデントであるギラッド・シャイナーによると、「トークンを生成することは、現在、多くの企業にとって収益を生成することに相当します。」データセンターは、コストセンターから生産的な資産へと進化しています。
そして、それは究極的には、工場を建設することの本質です。