상하이 퀀트 펀드, DeepSeek 2.0에 도전?

Goku의 SASR 훈련 프레임워크 해독

2015년에 설립된 상하이 Goku Technologies는 SASR(step-wise adaptive hybrid training)이라는 새로운 AI 훈련 프레임워크를 소개했습니다. 이 접근 방식은 지도 학습 미세 조정(SFT) 및 강화 학습(RL)과 같은 널리 사용되는 방법의 인식된 한계를 해결하는 것을 목표로 합니다. Goku는 SASR이 인간이 추론 기술을 개발하는 방식에서 영감을 받아 고급 AI 모델을 구축하는 데 더욱 적응적이고 효율적인 경로를 제공한다고 주장합니다.

SFT와 RL은 OpenAI 및 DeepSeek와 같은 업계 거물들이 사용하는 AI 훈련 프로세스의 초석으로 간주됩니다. DeepSeek는 12월에 출시되어 기술 부문 내에서 상당한 관심을 불러일으킨 V3 모델의 성능을 최적화하는 데 있어 이러한 기술의 중요한 역할을 명시적으로 강조했습니다.

상하이 교통 대학 및 새로 설립된 AI 자회사인 상하이 AllMind Artificial Intelligence Technology의 연구원들과 공동으로 작성한 Goku의 연구 논문에 따르면 SASR은 SFT, RL 및 정적 하이브리드 훈련 방법론에 비해 우수한 성능을 보여줍니다. Goku 팀은 연구 논문에서 "실험 결과 SASR이 SFT, RL 및 정적 하이브리드 훈련 방법보다 우수하다는 것을 입증했습니다."라고 주장했습니다.

Goku 발전의 의미

Goku의 AI 훈련 혁신은 중국의 AI 분야에서 지속적인 발전을 보여주는 것으로 알려져 있습니다. 이는 하드웨어 제한을 통해 중국의 AI 발전을 저해하려는 미국 정부가 시행하는 현재 정책의 한계를 잠재적으로 강조합니다. Nvidia의 CEO인 Jensen Huang은 최근 이러한 제한의 인식된 비효율성에 대해 "중국에는 세계 AI 개발자의 50%가 있습니다."라고 말했습니다.

하이플라이어 헤지 펀드에서 시작된 중국 AI 스타트업인 DeepSeek는 고급 알고리즘과 하드웨어 및 소프트웨어 통합을 통해 AI 리더십에 대한 중국의 잠재력을 보여주는 것으로 널리 인정받고 있습니다.

Goku의 AI 전략에서 AllMind의 역할

Goku 연구 발표와 동시에 AllMind가 설립된 것은 AI 연구 및 개발에 리소스를 전념하려는 전략적 움직임을 나타냅니다. 중국 사업자 등록 기록에 따르면 AllMind는 Goku가 연구 결과를 발표 한 날 공식적으로 등록되었습니다.

Goku의 창립자이자 AllMind의 법적 대표자인 Wang Xiao는 새로운 엔터티가 새로운 AI 경계를 탐구하기 위해 만들어 졌다고 말했습니다. 이는 2023 년에 DeepSeek를 별도의 엔터티로 설립 한 High-Flyer가 취한 접근 방식을 반영합니다.

Goku는 공식 웹 사이트에 따르면 AI 기반 전략을 활용하여 작년 말 기준으로 국내외 자산에서 150 억 위안 (약 21 억 달러) 이상을 관리했습니다.

SASR 심층 분석: 단계별 적응형 혼합 훈련 프레임워크

Goku의 SASR 프레임워크는 AI 모델 훈련 환경에서 흥미로운 대안을 제시합니다. 잠재적인 영향력을 진정으로 이해하려면 구성 요소와 작동 방식에 대한 더 자세한 이해가 필수적입니다.

SASR의 "단계별" 측면은 AI 모델이 반복적인 개선을 거치는 다단계 훈련 프로세스를 의미합니다. 각 단계는 모델 내에서 특정 기능을 육성하기 위해 특정 목표를 포함하고 고유한 훈련 데이터를 활용할 가능성이 높습니다. 이러한 단계적 접근 방식은 처음부터 복잡한 모델을 훈련하는 데 따르는 문제를 완화하고 각 단계에서 맞춤형 최적화를 허용하는 것과 같은 이점을 제공 할 수 있습니다.

"적응형" 요소는 훈련 프로세스가 정적이지 않고 모델의 성능 및 특성에 동적으로 반응한다는 것을 시사합니다. 이러한 적응성에는 하이퍼파라미터 조정, 훈련 데이터 분포 수정 또는 다양한 훈련 목표의 기여도를 동적으로 가중하는 것이 포함될 수 있습니다. 적응형 프로세스를 통해 AI가 보다 효과적으로 학습하고 개선할 수 있습니다.

SASR의 "하이브리드" 특성은 다양한 훈련 방법론의 요소를 결합한다는 것을 보여줍니다. SFT와 RL에는 강점과 약점이 있기 때문에 이것은 중요한 측면입니다. 방법의 조합을 통해 모델은 한계를 해결하면서 각 접근 방식의 이점을 활용할 수 있습니다. 이러한 세 가지 특성을 통합하여 SARS는 이론적으로 논리와 추론을 개발하는 데 더 잘 맞춰져 있습니다.

기존 방법과 SASR 비교

지도 학습 미세 조정 (SFT)은 일반적으로 AI 모델이 입력을 원하는 출력에 매핑하는 방법을 학습하는 대규모 레이블이 지정된 데이터 세트에 의존합니다. 강화 학습 (RL)은 특정 목표를 극대화하기 위해 행동에 보상하거나 처벌하여 시행착오를 통해 모델을 훈련하는 것을 포함합니다.

SASR은 각 방법의 한계를 극복하면서 두 가지를 통합하려고 시도합니다. 예를 들어 SFT는 레이블이 지정된 데이터의 품질과 포괄성에 크게 의존 할 수 있습니다. 많은 실제 시나리오에서 충분하고 정확한 데이터를 얻으려면 시간과 비용이 많이 소요됩니다. RL은 레이블이 지정된 데이터가 필요하지 않지만 불안정하고 보상 해킹에 취약 할 수 있습니다. 보상 해킹은 AI 모델이 의도하지 않은 방식으로 보상을 극대화하는 방법을 발견하여 바람직하지 않은 행동으로 이어질 수있는 경우에 발생합니다.

Goku의 프레임워크는 SFT 및 RL의 한계를 개선 할 수있는 가능성이 있습니다. 그러나 회사의 논문에 문서화 된 초기 결과를 확인하려면 추가 및 지속적인 테스트가 필요합니다.

알고리즘 혁신 및 하드웨어 제약

Goku의 SASR 프레임워크에 대한 소식은 미국-중국 기술 관계와 관련하여 특히 중요합니다. 얼마 동안 미국 정부는 특히 Nvidia와 같은 회사의 고급 GPU에 대한 액세스를 제한하여 AI 분야에서 중국의 부상을 억제하려고 시도했습니다. 이러한 제한의 배후에있는 아이디어는 중국의 강력한 하드웨어 액세스를 제한하면 AI 개발 노력이 느려질 것이라는 것입니다.

그러나 Nvidia CEO 인 Jensen Huang의 의견과 중국 AI 연구실에서 나타나는 발전은 이러한 정책이 의도 한만큼 효과적이지 않을 수 있음을 시사하는 것 같습니다. Huang은 중국이 세계 AI 개발자 인재의 상당 부분을 보유하고 있으며 하드웨어 액세스를 제한하면 대체 솔루션을 찾도록 장려 할 수 있다고 유명하게 언급했습니다.

Goku의 AI 혁신은 알고리즘 혁신이 적어도 어느 정도까지 하드웨어 제한을 상쇄 할 수 있음을 시사합니다. 중국 연구원이보다 효율적인 훈련 알고리즘을 개발할 수 있다면 덜 강력한 하드웨어로 비교 가능한 AI 성능을 달성 할 수 있습니다. 이는 중국이 진행중인 제한에도 불구하고 AI 기능을 계속 발전시킬 수 있음을 시사하므로 글로벌 AI 환경에 상당한 영향을 미칠 수 있습니다.

이것은 하드웨어가 무관하다는 것을 암시하는 것은 아닙니다. 고급 GPU는 여전히 최첨단 AI 모델을 훈련하는 데 중요하며 최신 하드웨어에 대한 액세스는 의심 할 여지없이 상당한 경쟁 우위를 제공합니다. 그러나 Goku의 작업은 하드웨어와 소프트웨어 모두에 투자하는 것의 중요성을 보여 주며 한 분야의 발전이 다른 분야의 한계를 보상 할 수 있습니다.

DeepSeek를 넘어 중국 AI의 부상

AI 분야에서 눈에 띄는 업체로 DeepSeek의 등장은 중국이이 혁신적인 기술에서 글로벌 리더가 되겠다는 의지를 입증하는 촉매제가되었습니다. 그러나 DeepSeek는 단지 하나의 예일 뿐이며 SASR 훈련 프레임워크를 갖춘 Goku의 부상은 중국 AI 생태계 내에서 성장하는 힘과 혁신을 더욱 잘 보여줍니다.

몇 가지 요인이 이러한 추진력에 기여합니다. 첫째, 중국은 AI 모델을 훈련하는 데 필수적인 방대한 데이터 풀을 가지고 있습니다. 많은 인구와 디지털 기술의 광범위한 채택으로 중국 기업은 AI 알고리즘을 개발하고 개선하는 데 사용할 수있는 대규모 데이터 세트에 액세스 할 수 있습니다.

둘째, 중국은 STEM 교육에 강력한 중점을두고 있으며 많은 수의 재능있는 엔지니어와 과학자를 배출합니다. 이는 AI 및 관련 분야에서 혁신을 주도 할 수있는 고도로 숙련 된 인력을 창출했습니다.

셋째, 중국 정부는 AI를 전략적 우선 순위로 삼아 연구 개발에 상당한 자금 지원과 지원을 제공했습니다. 이것은 AI 스타트업을위한 비옥 한 환경을 조성하고 학계와 산업 간의 협력을 육성했습니다.

마지막으로 중국 기업은 종종 혁신에 대해보다 실용적이고 위험을 감수하는 접근 방식을 취할 의향이 있으며, 이를 통해 신속하게 움직이고 새로운 아이디어를 실험 할 수 있습니다.

이러한 요인으로 인해 중국은 AI 기능 측면에서 미국을 빠르게 따라 잡고 있습니다. 미국은 여전히 기본 연구 및 고급 하드웨어와 같은 특정 분야에서 선두를 유지하고 있지만 컴퓨터 비전, 자연어 처리 및 로봇 공학과 같은 분야에서 상당한 진전을 이루고 있습니다.

Goku와 DeepSeek와 같은 기업의 등장은 중국이 앞으로 AI 분야에서 부상을 계속할 수있는 좋은 위치에 있음을 시사합니다.

상하이 Goku Technologies : 혁신의 배후 회사

Shanghai Goku Technologies는 2015년에 설립된 퀀트 트레이딩 펀드입니다. AI 기반 전략을 사용하여 상당한 자산을 관리합니다. 회사의 명시된 사명은 "기술과 기본 분석을 결합"하여 고객에게 더 나은 수익을 제공하는 것입니다. 자산 관리의 핵심 비즈니스 외에도 Goku는 AI 연구의 경계를 넓히기 위한 노력을 보여주었습니다. AI 자회사인 AllMind Artificial Intelligence Technology는 AI 연구 노력을 공식화하고 가속화하기 위한 전략적 움직임을 나타냅니다.

회사의 내부 구조 및 운영 역학에 대한 자세한 내용은 비교적 부족합니다. 그러나 공개 성명과 최근 활동은 접근 방식에 대한 통찰력을 제공합니다. "논리와 진실은 우리가 준수하는 유일한 원칙입니다."로 번역되는 회사의 슬로건은 데이터 중심적이고 분석적인 문화를 반영합니다. AI 연구 개발에 대한 투자는 장기적인 비전과 금융 부문 내에서뿐만 아니라 다양한 산업 전반에 걸쳐 AI의 혁신적인 잠재력에 대한 인식을 나타냅니다. Goku는 AI 연구의 통찰력을 활용하여 거래 전략을 개선하고 시장에서 경쟁 우위를 확보할 가능성이 높습니다.