Bước đột phá AI từ quỹ Thượng Hải: Thách thức DeepSeek 2.0?

Giải mã Khung Huấn luyện SASR của Goku

Shanghai Goku Technologies, được thành lập năm 2015, đã giới thiệu một khung huấn luyện AI mới lạ có tên là SASR, hay huấn luyện lai thích ứng từng bước. Cách tiếp cận này nhằm giải quyết những hạn chế được nhận thấy của các phương pháp phổ biến như tinh chỉnh có giám sát (SFT) và học tăng cường (RL). Goku lập luận rằng SASR, lấy cảm hứng từ cách con người phát triển kỹ năng lý luận, cung cấp một con đường thích ứng và hiệu quả hơn để xây dựng các mô hình AI tiên tiến.

SFT và RL được coi là nền tảng trong quá trình huấn luyện AI, được sử dụng bởi các gã khổng lồ trong ngành như OpenAI và DeepSeek. DeepSeek đã nhấn mạnh rõ ràng vai trò quan trọng của các kỹ thuật này trong việc tối ưu hóa hiệu suất của mô hình V3 của mình, được phát hành vào tháng 12 và gây ra sự quan tâm đáng kể trong lĩnh vực công nghệ.

Theo nghiên cứu của Goku, đồng tác giả với các nhà nghiên cứu từ Đại học Giao thông Thượng Hải và công ty con AI mới thành lập của mình, Shanghai AllMind Artificial Intelligence Technology, SASR thể hiện hiệu suất vượt trội so với SFT, RL và các phương pháp huấn luyện lai tĩnh. “Kết quả thử nghiệm chứng minh rằng SASR vượt trội hơn SFT, RL và các phương pháp huấn luyện lai tĩnh”, nhóm Goku khẳng định trong bài nghiên cứu của họ.

Ý nghĩa của sự tiến bộ của Goku

Bước đột phá huấn luyện AI của Goku được báo cáo là nhấn mạnh sự tiến bộ liên tục của Trung Quốc trong lĩnh vực AI. Nó có khả năng làm nổi bật những hạn chế của các chính sách hiện tại do chính phủ Hoa Kỳ thực hiện, nhằm cản trở sự tiến bộ AI của Trung Quốc thông qua các hạn chế về phần cứng. Jensen Huang, Giám đốc điều hành của Nvidia, gần đây đã nhận xét về sự kém hiệu quả được nhận thấy của những hạn chế này, nói rằng “Trung Quốc có 50% các nhà phát triển AI trên thế giới”.

DeepSeek, một công ty khởi nghiệp AI của Trung Quốc nổi lên từ quỹ phòng hộ High-Flyer, đã đạt được sự công nhận rộng rãi vì đã thể hiện tiềm năng lãnh đạo AI của Trung Quốc thông qua các thuật toán tiên tiến và tích hợp phần cứng và phần mềm.

Vai trò của AllMind trong Chiến lược AI của Goku

Việc thành lập AllMind, trùng với việc công bố nghiên cứu của Goku, cho thấy một động thái chiến lược để dành nguồn lực cho nghiên cứu và phát triển AI. Hồ sơ đăng ký kinh doanh của Trung Quốc chỉ ra rằng AllMind đã được đăng ký chính thức vào cùng ngày Goku phát hành nghiên cứu của mình.

Wang Xiao, người sáng lập Goku và là đại diện pháp lý của AllMind, tuyên bố rằng thực thể mới được tạo ra để khám phá các ranh giới AI mới. Điều này phản ánh cách tiếp cận của High-Flyer, nơi thành lập DeepSeek như một thực thể riêng biệt vào năm 2023.

Tính đến cuối năm ngoái, Goku quản lý hơn 15 tỷ nhân dân tệ (khoảng 2,1 tỷ đô la Mỹ) tài sản trong và ngoài nước, sử dụng các chiến lược dựa trên AI, theo thông tin có trên trang web chính thức của mình.

Đi sâu hơn vào SASR: Một khung Huấn luyện Lai Thích ứng Từng bước

Khung SASR của Goku đưa ra một giải pháp thay thế thú vị trong bối cảnh huấn luyện mô hình AI. Để thực sự đánh giá cao tác động tiềm tàng của nó, cần có sự hiểu biết chi tiết hơn về các thành phần và hoạt động của nó.

Khía cạnh “từng bước” của SASR ngụ ý một quá trình huấn luyện nhiều giai đoạn, trong đó mô hình AI trải qua quá trình tinh chỉnh lặp đi lặp lại. Mỗi bước có khả năng liên quan đến các mục tiêu cụ thể và sử dụng dữ liệu huấn luyện riêng biệt để nuôi dưỡng các khả năng cụ thể trong mô hình. Cách tiếp cận theo từng giai đoạn này có thể mang lại những lợi ích như giảm thiểu những thách thức của việc huấn luyện các mô hình phức tạp từ đầu và cho phép tối ưu hóa phù hợp ở mỗi giai đoạn.

Yếu tố “thích ứng” cho thấy rằng quá trình huấn luyện không tĩnh mà phản ứng linh hoạt với hiệu suất và đặc điểm của mô hình. Khả năng thích ứng này có thể liên quan đến việc điều chỉnh siêu tham số, sửa đổi phân phối dữ liệu huấn luyện hoặc cân bằng động sự đóng góp của các mục tiêu huấn luyện khác nhau. Một quy trình thích ứng cho phép AI học hỏi và cải thiện hiệu quả hơn.

Bản chất “lai” của SASR tiết lộ rằng nó kết hợp các yếu tố của các phương pháp huấn luyện khác nhau. Đây là một khía cạnh quan trọng vì có những điểm mạnh và điểm yếu trong SFT và RL. Sự kết hợp các phương pháp cho phép mô hình tận dụng lợi ích của mỗi cách tiếp cận trong khi giải quyết những hạn chế của nó. Bằng cách tích hợp ba đặc điểm này, SARS về mặt lý thuyết được điều chỉnh tốt hơn để phát triển logic và lý luận.

So sánh SASR với các Phương pháp Truyền thống

Tinh chỉnh có giám sát (SFT) theo truyền thống dựa vào một tập dữ liệu lớn, được gắn nhãn, trong đó mô hình AI học cách ánh xạ đầu vào với đầu ra mong muốn. Học tăng cường (RL) liên quan đến việc huấn luyện mô hình thông qua thử và sai, thưởng hoặc phạt các hành động để tối đa hóa một mục tiêu cụ thể.

SASR cố gắng tích hợp hai phương pháp này trong khi khắc phục những hạn chế của từng phương pháp. Ví dụ, SFT có thể phụ thuộc nhiều vào chất lượng và tính toàn diện của dữ liệu được gắn nhãn. Trong nhiều tình huống thực tế, việc thu thập đủ dữ liệu chính xác có thể tốn thời gian và tốn kém. RL, mặc dù không yêu cầu dữ liệu được gắn nhãn, có thể không ổn định và dễ bị tấn công phần thưởng. Tấn công phần thưởng xảy ra khi mô hình AI khám phá ra những cách không mong muốn để tối đa hóa phần thưởng của mình, có khả năng dẫn đến hành vi không mong muốn.

Khung của Goku có khả năng cải thiện so với những hạn chế của SFT và RL. Tuy nhiên, cần phải thử nghiệm thêm và liên tục để xác minh các kết quả ban đầu được ghi lại trong bài báo của công ty.

Đổi mới Thuật toán và Hạn chế về Phần cứng

Tin tức về khung SASR của Goku đặc biệt phù hợp trong bối cảnh quan hệ công nghệ Hoa Kỳ-Trung Quốc. Trong một thời gian, chính phủ Hoa Kỳ đã cố gắng hạn chế sự trỗi dậy của Trung Quốc trong lĩnh vực AI bằng cách hạn chế quyền truy cập vào phần cứng máy tính tiên tiến, đặc biệt là GPU cao cấp từ các công ty như Nvidia. Ý tưởng đằng sau những hạn chế này là việc hạn chế quyền truy cập của Trung Quốc vào phần cứng mạnh mẽ sẽ làm chậm nỗ lực phát triển AI của họ.

Tuy nhiên, những bình luận của Giám đốc điều hành Nvidia Jensen Huang và những tiến bộ nổi lên từ các phòng thí nghiệm AI của Trung Quốc dường như cho thấy những chính sách này có thể không hiệu quả như dự định. Huang đã nổi tiếng lưu ý rằng Trung Quốc sở hữu một phần đáng kể tài năng nhà phát triển AI trên thế giới và việc hạn chế quyền truy cập phần cứng có thể khuyến khích họ tìm kiếm các giải pháp thay thế.

Bước đột phá AI được tuyên bố của Goku cho thấy rằng đổi mới thuật toán có khả năng bù đắp những hạn chế về phần cứng, ít nhất là ở một mức độ nào đó. Nếu các nhà nghiên cứu Trung Quốc có thể phát triển các thuật toán huấn luyện hiệu quả hơn, họ có thể đạt được hiệu suất AI tương đương với phần cứng kém mạnh mẽ hơn. Điều này có thể có ý nghĩa quan trọng đối với bối cảnh AI toàn cầu, vì nó cho thấy Trung Quốc có thể tiếp tục nâng cao khả năng AI của mình bất chấp những hạn chế đang diễn ra.

Điều này không có nghĩa là phần cứng không liên quan. GPU tiên tiến vẫn rất quan trọng để huấn luyện các mô hình AI tiên tiến và việc truy cập vào phần cứng mới nhất chắc chắn mang lại lợi thế cạnh tranh đáng kể. Tuy nhiên, công việc của Goku chứng minh tầm quan trọng của việc đầu tư vào cả phần cứng và phần mềm, và rằng tiến bộ trong một lĩnh vực có khả năng bù đắp những hạn chế trong lĩnh vực khác.

Sự trỗi dậy của AI Trung Quốc: Vượt xa DeepSeek

Sự nổi lên của DeepSeek như một người chơi nổi bật trong lĩnh vực AI là một chất xúc tác, thể hiện quyết tâm của Trung Quốc trở thành một nhà lãnh đạo toàn cầu trong công nghệ biến đổi này. Tuy nhiên, DeepSeek chỉ là một ví dụ, và sự trỗi dậy của Goku, với khung huấn luyện SASR của mình, minh họa thêm sức mạnh và sự đổi mới ngày càng tăng trong hệ sinh thái AI của Trung Quốc.

Một số yếu tố đóng góp vào động lực này. Thứ nhất, Trung Quốc có một lượng lớn dữ liệu, điều này rất cần thiết cho việc huấn luyện các mô hình AI. Với dân số đông và việc áp dụng rộng rãi các công nghệ kỹ thuật số, các công ty Trung Quốc có quyền truy cập vào các tập dữ liệu khổng lồ có thể được sử dụng để phát triển và tinh chỉnh các thuật toán AI của họ.

Thứ hai, Trung Quốc chú trọng vào giáo dục STEM, tạo ra một số lượng lớn các kỹ sư và nhà khoa học tài năng. Điều này đã tạo ra một lực lượng lao động có tay nghề cao, có khả năng thúc đẩy sự đổi mới trong AI và các lĩnh vực liên quan.

Thứ ba, chính phủ Trung Quốc đã coi AI là một ưu tiên chiến lược, cung cấp tài trợ và hỗ trợ đáng kể cho nghiên cứu và phát triển. Điều này đã tạo ra một môi trường màu mỡ cho các công ty khởi nghiệp AI và thúc đẩy sự hợp tác giữa học viện và ngành công nghiệp.

Cuối cùng, các công ty Trung Quốc thường sẵn sàng áp dụng một cách tiếp cận thực dụng và chấp nhận rủi ro hơn đối với sự đổi mới, cho phép họ di chuyển nhanh chóng và thử nghiệm những ý tưởng mới.

Do những yếu tố này, Trung Quốc đang nhanh chóng bắt kịp Hoa Kỳ về khả năng AI. Trong khi Hoa Kỳ vẫn giữ vị trí dẫn đầu trong một số lĩnh vực nhất định, chẳng hạn như nghiên cứu cơ bản và phần cứng cao cấp, Trung Quốc đang đạt được những tiến bộ đáng kể trong các lĩnh vực như thị giác máy tính, xử lý ngôn ngữ tự nhiên và robot học.

Sự xuất hiện của các công ty như Goku và DeepSeek cho thấy rằng Trung Quốc có vị thế tốt để tiếp tục trỗi dậy trong lĩnh vực AI trong những năm tới.

Shanghai Goku Technologies: Công ty Đứng sau Sự Đổi mới

Shanghai Goku Technologies là một quỹ giao dịch định lượng được thành lập vào năm 2015. Nó quản lý tài sản đáng kể bằng cách sử dụng các chiến lược dựa trên AI. Sứ mệnh đã nêu của công ty là “kết hợp công nghệ và phân tích cơ bản” để mang lại lợi nhuận tốt hơn cho khách hàng của mình. Bên cạnh hoạt động kinh doanh cốt lõi trong quản lý tài sản, Goku đã thể hiện cam kết thúc đẩy các ranh giới của nghiên cứu AI. AllMind Artificial Intelligence Technology, công ty con AI, đại diện cho một động thái chiến lược để chính thức hóa và đẩy nhanh các nỗ lực nghiên cứu AI của mình.

Chi tiết về cấu trúc nội bộ và động lực hoạt động của công ty vẫn tương đối khan hiếm. Tuy nhiên, các tuyên bố công khai và các hoạt động gần đây của nó cung cấp những hiểu biết sâu sắc về cách tiếp cận của nó. Khẩu hiệu của công ty, dịch là “logic và sự thật là những nguyên tắc duy nhất chúng ta tuân theo”, phản ánh một nền văn hóa phân tích và dựa trên dữ liệu. Việc đầu tư vào nghiên cứu và phát triển AI cho thấy tầm nhìn dài hạn và nhận thức về tiềm năng biến đổi của AI, không chỉ trong lĩnh vực tài chính mà còn trên nhiều ngành công nghiệp khác nhau. Có khả năng Goku dự định tận dụng những hiểu biết sâu sắc từ nghiên cứu AI để cải thiện các chiến lược giao dịch của mình và đạt được lợi thế cạnh tranh trên thị trường.