GokuのSASR学習フレームワーク:詳細解説
上海のクオンツ取引ファンドであるShanghai Goku Technologiesが、国際的な会議で画期的なAI学習手法を発表し、AIコミュニティに衝撃を与えています。これは、ニューラル情報処理システム会議(NeurIPS)に提出された研究論文で詳述されている革新的な手法であり、DeepSeekやOpenAIなどの著名な研究機関で使用されている確立されたAI学習アプローチの効果に匹敵するか、それを上回る可能性を秘めています。この動きは、AIアルゴリズムの進歩で注目を集めたDeepSeek自身の軌跡を反映しています。
Goku Technologiesは2015年に設立され、SASR(step-wise adaptive hybrid training、段階的適応型ハイブリッド学習)と呼ばれる新しいAI学習フレームワークを導入しました。このアプローチは、教師ありファインチューニング(SFT)や強化学習(RL)などの普及している手法の認識されている限界に対処することを目的としています。Gokuは、SASRが人間が推論スキルを開発する方法に着想を得ており、高度なAIモデルを構築するためのより適応的で効率的な経路を提供すると主張しています。
SFTとRLは、OpenAIやDeepSeekなどの業界大手企業で使用されているAI学習プロセスにおいて不可欠な要素と見なされています。DeepSeekは、12月にリリースされ、テクノロジーセクター内で大きな関心を集めたV3モデルのパフォーマンスを最適化する上で、これらの技術の重要な役割を明確に強調しています。
上海交通大学と新たに設立されたAI子会社であるShanghai AllMind Artificial Intelligence Technologyの研究者との共同執筆によるGokuの研究論文によると、SASRはSFT、RL、静的ハイブリッド学習方法と比較して、優れたパフォーマンスを示しています。「実験結果は、SASRがSFT、RL、静的ハイブリッド学習方法よりも優れていることを示しています」とGokuチームは研究論文で主張しています。
Gokuの進歩がもたらす意味
GokuのAI学習のブレークスルーは、中国のAI分野における継続的な進歩を強調していると伝えられています。ハードウェア制限を通じて中国のAIの進歩を阻止することを意図した米国政府によって実施されている現在の政策の限界を潜在的に浮き彫りにします。NvidiaのCEOであるJensen Huangは最近、これらの制限は効果がないと考えているとコメントし、「中国には世界のAI開発者の50%がいる」と述べています。
ハイフライヤーヘッジファンドから生まれた中国のAIスタートアップであるDeepSeekは、高度なアルゴリズムとハードウェアとソフトウェアの統合を通じて、AIリーダーシップに対する中国の可能性を示すことで広く認知されています。
AllMindの役割:GokuのAI戦略
AllMindの設立は、Gokuの研究発表と同時に行われ、AIの研究開発にリソースを投入する戦略的な動きを示しています。中国の企業登録記録によると、AllMindはGokuが研究を発表したのと同じ日に正式に登録されました。
Gokuの創設者であり、AllMindの法定代理人であるWang Xiaoは、新しいエンティティは新しいAIの境界を探索するために作成されたと述べています。これは、ハイフライヤーが2023年にDeepSeekを別のエンティティとして設立したアプローチを反映しています。
昨年末の時点で、Gokuは、公式ウェブサイトで入手可能な情報によると、AI主導の戦略を利用して、国内外で150億元(約21億米ドル)以上の資産を管理していました。
SASRの詳細:段階的適応型ハイブリッド学習フレームワーク
GokuのSASRフレームワークは、AIモデル学習の状況において興味深い代替案を提示します。その潜在的な影響を真に理解するには、そのコンポーネントと動作に関するより詳細な理解が不可欠です。
SASRの「段階的」な側面は、AIモデルが反復的な改良を受ける多段階の学習プロセスを意味します。各ステップは、モデル内の特定の機能を育成するために、特定の目標を含み、明確な学習データを利用する可能性があります。この段階的なアプローチは、ゼロから複雑なモデルを学習する課題を軽減し、各段階で調整された最適化を可能にするなどの利点を提供できます。
「適応型」要素は、学習プロセスが静的ではなく、モデルのパフォーマンスと特性に動的に対応することを示唆しています。この適応性には、ハイパーパラメータの調整、学習データ分布の変更、またはさまざまな学習目標の貢献の動的な重み付けが含まれる可能性があります。適応的なプロセスにより、AIはより効果的に学習および改善できます。
SASRの「ハイブリッド」な性質は、それがさまざまな学習方法論の要素を組み合わせていることを明らかにしています。SFTとRLには長所と短所があるため、これは重要な側面です。方法の組み合わせにより、モデルはそれぞれのアプローチの利点を活用しながら、その制限に対処できます。これらの3つの特性を統合することにより、SARSは理論的には論理と推論を開発するためにより適切に調整されています。
SASRと従来の方法との比較
教師ありファインチューニング(SFT)は、従来、AIモデルが入力から目的の出力へのマッピングを学習する大規模なラベル付きデータセットに依存しています。強化学習(RL)は、特定の目的を最大化するためにアクションに報酬またはペナルティを与えることによって、試行錯誤を通じてモデルを学習させることを伴います。
SASRは、2つの方法を統合しながら、各方法の制限を克服しようとします。たとえば、SFTはラベル付きデータの品質と包括性に大きく依存する可能性があります。多くの現実世界のシナリオでは、十分な正確なデータを取得することは時間と費用がかかる可能性があります。RLは、ラベル付きデータを必要としませんが、不安定で、報酬ハッキングが発生しやすい可能性があります。リワードハッキングは、AIモデルがそのリワードを最大化するための意図しない方法を発見したときに発生し、望ましくない動作につながる可能性があります。
Gokuのフレームワークは、SFTとRLの制限を改善する可能性があります。ただし、会社の論文に記載されている初期結果を確認するには、さらなる継続的なテストが必要です。
アルゴリズムの革新とハードウェアの制約
GokuのSASRフレームワークのニュースは、米中技術関係の文脈において特に重要です。しばらくの間、米国政府は、高度なコンピューティングハードウェア、特にNvidiaのような企業からのハイエンドGPUへのアクセスを制限することにより、AI分野における中国の台頭を阻止しようとしてきました。これらの制限の背後にある考え方は、中国の強力なハードウェアへのアクセスを制限することで、AI開発の取り組みが遅れるということです。
しかし、NvidiaのCEOであるJensen Huangのコメントや、中国のAI研究所からの進歩は、これらの政策が意図したほど効果的ではない可能性があることを示唆しているようです。Huangは、中国が世界のAI開発者の人材の重要な部分を占めており、ハードウェアへのアクセスを制限することで、代替ソリューションを見つける動機を与える可能性があることで有名です。
Gokuが主張するAIのブレークスルーは、アルゴリズムの革新がハードウェアの制限を潜在的に相殺できることを示唆しています。中国の研究者がより効率的な学習アルゴリズムを開発できれば、強力でないハードウェアでも同等のAIパフォーマンスを実現できる可能性があります。これは、グローバルなAIの状況に大きな影響を与える可能性があります。中国が進行中の制限にもかかわらず、AI能力の向上を継続できる可能性があることを示唆しているためです。
これは、ハードウェアが不要であることを示唆するものではありません。高度なGPUは、最先端のAIモデルを学習させる上で依然として重要であり、最新のハードウェアへのアクセスは、疑いなく大きな競争優位性を提供します。ただし、Gokuの作業は、ハードウェアとソフトウェアの両方に投資することの重要性を示しており、ある分野の進歩は、別の分野の制限を潜在的に補うことができることを示しています。
中国のAIの台頭:DeepSeekを超えて
DeepSeekがAI分野の著名なプレーヤーとして登場したことは、中国がこの変革的なテクノロジーのグローバルリーダーになるという決意を示す触媒となっています。ただし、DeepSeekは単なる一例であり、GokuとそのSASR学習フレームワークの台頭は、中国のAIエコシステム内の成長する強さとイノベーションをさらに示しています。
この勢いを促進するいくつかの要因があります。まず、中国には、AIモデルの学習に不可欠な膨大なデータプールがあります。大規模な人口とデジタルテクノロジーの広範な採用により、中国企業はAIアルゴリズムの開発と改良に使用できる大規模なデータセットにアクセスできます。
第二に、中国はSTEM教育を重視しており、多数の才能のあるエンジニアと科学者を輩出しています。これにより、AIおよび関連分野のイノベーションを推進できる高度なスキルを持つ労働力が生まれています。
第三に、中国政府はAIを戦略的優先事項とし、研究開発に多大な資金とサポートを提供しています。これにより、AIスタートアップにとって肥沃な環境が生まれ、学界と産業界の間の連携が促進されています。
最後に、中国企業は、より実用的でリスクをとるイノベーションへのアプローチをとることが多く、新しいアイデアを迅速に移動して試すことができます。
これらの要因の結果として、中国はAIの能力の面で米国に急速に追いついています。米国は依然として基礎研究やハイエンドハードウェアなど、特定の分野でリードを保っていますが、中国はコンピュータービジョン、自然言語処理、ロボティクスなどの分野で大きな進歩を遂げています。
GokuやDeepSeekのような企業の出現は、中国が今後AI分野で台頭を続けるのに適した位置にあることを示唆しています。
Shanghai Goku Technologies:イノベーションの背後にある企業
Shanghai Goku Technologiesは、2015年に設立されたクオンツ取引ファンドです。AI主導の戦略を使用して、大きな資産を管理しています。同社の使命は、「テクノロジーとファンダメンタル分析を組み合わせる」ことで、顧客により良いリターンを提供することです。資産管理におけるコアビジネスに加えて、GokuはAI研究の境界を押し広げることに尽力しています。AI子会社であるAllMind Artificial Intelligence Technologyは、AI研究の取り組みを正式化し、加速するための戦略的な動きを表しています。
同社の内部構造と運用ダイナミクスに関する詳細は比較的乏しいままです。ただし、その公の声明と最近の活動は、そのアプローチへの洞察を提供しています。同社のスローガンは、「論理と真実のみが私たちが従うべき原則である」と翻訳されており、データ主導型で分析的な文化を反映しています。AIの研究開発への投資は、長期的なビジョンと、金融セクター内だけでなく、さまざまな業界全体でもAIの変革の可能性を認識していることを示しています。Gokuは、AI研究からの洞察を活用して、その取引戦略を改善し、市場での競争上の優位性を獲得しようとしている可能性があります。