DeepSeek: Cuộc cách mạng AI ở Trung Quốc

Hiệu ứng ‘Cá da trơn’: Sự gián đoạn không chủ ý của DeepSeek

Sự xuất hiện của DeepSeek trong lĩnh vực trí tuệ nhân tạo (AI) của Trung Quốc đã tạo ra những làn sóng trong toàn ngành, thúc đẩy một loạt hoạt động giữa các công ty cùng ngành. Công ty mới nổi này, được tách ra từ một quỹ đầu cơ, đã thách thức các phương pháp tiếp cận thông thường đối với việc phát triển và định giá mô hình AI, buộc các công ty khởi nghiệp khác phải đánh giá lại chiến lược của họ và tìm kiếm những con đường mới để tăng trưởng và tài trợ.

Tác động của DeepSeek vượt ra ngoài biên giới Trung Quốc, tạo ra làn sóng ở cả Wall Street và Thung lũng Silicon. Tuy nhiên, ảnh hưởng của nó được cảm nhận rõ ràng nhất trong cộng đồng AI Trung Quốc, nơi nó đã làm lu mờ những công ty đã thành danh như Moonshot AI và MiniMax.

Liang Wenfeng, động lực đằng sau DeepSeek, thừa nhận trong một cuộc phỏng vấn vào tháng 7 năm 2024 rằng công ty đã vô tình trở thành ‘cá da trơn’ trong thị trường AI của Trung Quốc. Thuật ngữ ẩn dụ này dùng để chỉ một yếu tố cạnh tranh khuấy động hoạt động và ngăn chặn sự trì trệ trong một ngành cụ thể. Mặc dù ý định ban đầu của DeepSeek có thể không phải là gây gián đoạn, nhưng việc phát hành mô hình V2 vào tháng 7 năm 2024 đã gây ra một cuộc chiến giá cả, và các bản phát hành tiếp theo (V3 vào tháng 12 và R1 vào tháng 1) càng củng cố vai trò đột phá của nó. Những tiến bộ này đặt ra những câu hỏi sống còn cho nhiều công ty trong thị trường mô hình AI vốn đã đông đúc của Trung Quốc.

Sự khác biệt trong cách tiếp cận: Trung Quốc vs. Hoa Kỳ

Nghịch lý thay, sự gián đoạn của DeepSeek cuối cùng có thể mang lại lợi ích cho hệ sinh thái AI của Trung Quốc. Bằng cách đẩy mạnh các ranh giới của khả năng mô hình AI và làm cho công nghệ dễ tiếp cận hơn, DeepSeek, theo một số nhà phân tích, đã mang lại cho Trung Quốc một ‘lợi thế’.

Nhà phân tích AI Grace Shao, người sáng lập bản tin ngành AI Proem, nhấn mạnh sự khác biệt chính trong cách AI đang được tiếp cận ở Trung Quốc so với Hoa Kỳ. Trước R1 của DeepSeek, nhiều công ty khởi nghiệp AI của Trung Quốc đã tập trung vào các ứng dụng hướng tới người tiêu dùng. Các chiến lược này được thúc đẩy bởi chiến lược kiếm tiền từ kỷ nguyên internet di động. Ngược lại, Hoa Kỳ phần lớn đã chấp nhận AI như một công cụ để nâng cao năng suất của doanh nghiệp và nhân viên văn phòng.

Shao cho rằng sự khác biệt này là do sự khác biệt về cấu trúc kinh tế giữa hai thị trường. Tuy nhiên, cô nhấn mạnh rằng khả năng mô hình mạnh mẽ vẫn là nền tảng của ngành công nghiệp AI, bất kể ứng dụng cụ thể nào.

Cuộc đua bắt kịp: Các công ty khởi nghiệp AI của Trung Quốc phản hồi

Nhận thức được tầm quan trọng của những tiến bộ AI nền tảng, các nhà phát triển mô hình AI khác của Trung Quốc hiện đang nỗ lực thu hẹp khoảng cách với DeepSeek.

Zhipu AI: Đảm bảo nguồn vốn và áp dụng nguồn mở

Zhipu AI có trụ sở tại Bắc Kinh, một công ty khởi nghiệp có nguồn gốc từ Đại học Thanh Hoa, gần đây đã công bố một vòng tài trợ đáng kể trị giá 1 tỷ nhân dân tệ (140 triệu USD). Khoản đầu tư này bao gồm sự hỗ trợ từ chính quyền thành phố Hàng Châu, nơi Zhipu AI đã thành lập một công ty con.

Ngoài việc đảm bảo nguồn vốn, Zhipu AI cũng đã áp dụng phong trào nguồn mở. Công ty đã cung cấp các mô hình và tác nhân AI của mình cho các nhà phát triển, thúc đẩy sự hợp tác và đổi mới trong cộng đồng rộng lớn hơn. Một ví dụ gần đây về cam kết này là việc phát hành CogView-4, một mô hình chuyển văn bản thành hình ảnh nguồn mở có khả năng tạo ra các ký tự Trung Quốc.

Sự trỗi dậy của nguồn mở: Một sự thay đổi văn hóa

Xu hướng phát triển nguồn mở trong lĩnh vực AI của Trung Quốc phản ánh một sự thay đổi văn hóa rộng lớn hơn.

Tại sao lại là nguồn mở?

  • Mong muốn chứng minh sự đổi mới: Đối với một thế hệ doanh nhân sinh ra trong thập niên 80 và 90, có một mong muốn mạnh mẽ để chứng minh rằng các công ty Trung Quốc có khả năng đổi mới thực sự, vượt ra ngoài nhận thức đơn giản là ‘sao chép’ các công nghệ hiện có.
  • Sự công nhận toàn cầu: Sức hấp dẫn của sự công nhận quốc tế là một động lực mạnh mẽ. Việc được các nhà phát triển và doanh nghiệp bên ngoài Trung Quốc trích dẫn và sử dụng thường được coi là uy tín hơn là chỉ tập trung vào lợi nhuận từ các dự án riêng lẻ.

Stepfun: Mô hình đa phương thức và quan hệ đối tác chiến lược

Stepfun có trụ sở tại Thượng Hải, được thành lập vào năm 2023 bởi cựu nhà khoa học trưởng của Microsoft Research Asia, Jiang Daxin, là một công ty khởi nghiệp khác đang có những bước tiến trong lĩnh vực nguồn mở.

Đóng góp nguồn mở của Stepfun:

  • Step-Video-T2V: Một mô hình tạo video từ đầu vào văn bản.
  • Step-Audio: Được thiết kế cho các tương tác bằng giọng nói.
  • Mô hình chuyển đổi hình ảnh thành video sắp ra mắt: Dự kiến phát hành trong tháng này.

Quan hệ đối tác chiến lược của Stepfun làm nổi bật tính chất hợp tác của hệ sinh thái AI của Trung Quốc. Những người ủng hộ bao gồm Capital Investment Co thuộc sở hữu của chính quyền thành phố Thượng Hải, gã khổng lồ internet Tencent Holdings, Qiming Venture Partners và 5Y Capital.

MiniMax: Sự chấp nhận nguồn mở muộn màng

MiniMax, được biết đến với các ứng dụng AI cá nhân hóa phổ biến Talkie và Xingye, ban đầu theo đuổi một cách tiếp cận khép kín hơn. Tuy nhiên, công ty đã thay đổi hướng đi vào tháng 1, ngay sau khi DeepSeek phát hành V3.

Các sản phẩm nguồn mở của MiniMax:

  • MiniMax-Text-01: Một mô hình ngôn ngữ lớn (LLM), công nghệ làm nền tảng cho các dịch vụ AI tổng quát như ChatGPT.
  • MiniMax-VL-01: Một mô hình đa phương thức.

Người sáng lập Yan Junjie thẳng thắn thừa nhận trong một cuộc phỏng vấn với hãng truyền thông Trung Quốc LatePost rằng, nếu có cơ hội thứ hai, anh ấy sẽ chọn con đường nguồn mở ngay từ đầu.

Moonshot AI: Suy luận đa phương thức và đổi mới

Moonshot AI, được công nhận với chatbot Kimi, cũng đã hoạt động tích cực trong không gian nguồn mở.

Đóng góp của Moonshot AI:

  • K1.5: Một mô hình suy luận đa phương thức cấp độ o1, được phát hành vào tháng 1 (trùng với thời điểm ra mắt R1 của DeepSeek).
  • Các cải tiến về kiến trúc và trình tối ưu hóa nguồn mở: Được giới thiệu vào tháng trước.

Baichuan AI: Tái tập trung vào lĩnh vực y tế

Baichuan AI, được thành lập bởi cựu CEO của Sogou, Wang Xiaochuan, đã có một sự thay đổi chiến lược để tập trung nỗ lực vào lĩnh vực y tế. Việc tái tập trung này bao gồm việc tái cấu trúc, bao gồm cả việc giải tán đội ngũ dịch vụ tài chính. Baichuan AI đã xác nhận động thái này, tuyên bố rằng họ đang ‘tối ưu hóa và điều chỉnh hoạt động kinh doanh tài chính để tập trung nguồn lực và tập trung vào các hoạt động kinh doanh y tế cốt lõi của chúng tôi’.

01.AI: Từ mô hình quy mô lớn đến ứng dụng chuyên biệt cho ngành

01.AI, được thành lập bởi cựu chủ tịch Google Trung Quốc, Lee Kai-fu, cũng đã trải qua một bước ngoặt chiến lược. Công ty đã chuyển từ việc đào tạo các mô hình AI quy mô lớn và hiện đang tập trung vào việc phát triển các ứng dụng chuyên biệt cho từng ngành. Một ví dụ đáng chú ý về sự thay đổi này là quan hệ đối tác của 01.AI với đơn vị dịch vụ điện toán đám mây của Alibaba Group Holding để thành lập một ‘phòng thí nghiệm chung mô hình lớn công nghiệp’. Sự hợp tác này liên quan đến việc chuyển đổi một số nhân viên của 01.AI sang Alibaba Cloud.

Bối cảnh phát triển: Cạnh tranh và hợp tác

Bối cảnh AI của Trung Quốc được đặc trưng bởi sự tương tác năng động của cạnh tranh và hợp tác. Sự gia nhập đột phá của DeepSeek chắc chắn đã thúc đẩy một làn sóng đổi mới, buộc các công ty đã thành danh phải thích ứng và những công ty mới phải tăng tốc nỗ lực. Việc áp dụng các nguyên tắc nguồn mở đang thúc đẩy một môi trường hợp tác hơn, nơi chia sẻ kiến thức và tiến bộ tập thể được ưu tiên.

Xu hướng chính:

  • Tăng cường tập trung vào các mô hình nềntảng: Các công ty khởi nghiệp đang nhận ra tầm quan trọng của việc phát triển các mô hình AI nền tảng mạnh mẽ làm cơ sở cho sự đổi mới trong tương lai.
  • Phong trào nguồn mở: Cách tiếp cận nguồn mở đang thu hút sự chú ý, được thúc đẩy bởi mong muốn được công nhận toàn cầu và niềm tin vào sức mạnh của sự phát triển hợp tác.
  • Quan hệ đối tác chiến lược: Sự hợp tác giữa các công ty khởi nghiệp, các công ty công nghệ đã thành danh và các tổ chức chính phủ ngày càng trở nên phổ biến, tập hợp các nguồn lực và chuyên môn.
  • Ứng dụng chuyên biệt cho ngành: Một số công ty đang chuyển trọng tâm từ các mô hình AI đa năng sang phát triển các ứng dụng chuyên biệt phù hợp với các ngành cụ thể, chẳng hạn như chăm sóc sức khỏe và tài chính.

Tác động lâu dài của sự gián đoạn của DeepSeek vẫn còn phải xem xét. Tuy nhiên, có một điều rõ ràng: bối cảnh AI của Trung Quốc đang trải qua một giai đoạn phát triển nhanh chóng, được thúc đẩy bởi sự kết hợp của áp lực cạnh tranh, tiến bộ công nghệ và cam kết ngày càng tăng đối với các nguyên tắc nguồn mở. Môi trường năng động này hứa hẹn sẽ mang lại những đột phá hơn nữa và định hình lại tương lai của AI, không chỉ ở Trung Quốc mà trên toàn cầu. Sự cạnh tranh gia tăng cũng buộc các công ty phải chú trọng hơn đến hiệu quả và tiết kiệm chi phí. Các công ty đang chịu áp lực phải cung cấp các mô hình chất lượng cao với giá cả cạnh tranh, điều này cuối cùng mang lại lợi ích cho người dùng cuối và đẩy nhanh việc áp dụng AI trong các lĩnh vực khác nhau.

Sự chuyển dịch sang các ứng dụng chuyên biệt cho ngành cũng là một xu hướng đáng chú ý. Bằng cách tập trung vào các nhu cầu và thách thức riêng của các lĩnh vực cụ thể, các công ty như Baichuan AI và 01.AI đang hướng tới việc tạo ra các giải pháp có liên quan và tác động trực tiếp hơn. Cách tiếp cận này có thể dẫn đến việc áp dụng AI nhanh hơn trong các lĩnh vực như chăm sóc sức khỏe, tài chính và sản xuất, mang lại lợi ích hữu hình cho các doanh nghiệp và người tiêu dùng.

Hơn nữa, sự tham gia của các tổ chức chính phủ, chẳng hạn như khoản đầu tư của chính quyền thành phố Thượng Hải vào Stepfun và sự hỗ trợ của chính quyền Hàng Châu cho Zhipu AI, làm nổi bật tầm quan trọng chiến lược của việc phát triển AI ở Trung Quốc. Sự hậu thuẫn của chính phủ này không chỉ cung cấp nguồn lực tài chính mà còn mang lại một mức độ xác thực và ổn định, khuyến khích đầu tư và đổi mới hơn nữa trong lĩnh vực này.

Sự tương tác giữa cạnh tranh và hợp tác cũng là một đặc điểm xác định của bối cảnh AI Trung Quốc. Trong khi các công ty chắc chắn đang cạnh tranh để giành thị phần và sự công nhận, thì cũng có một sự thừa nhận ngày càng tăng rằng sự hợp tác, đặc biệt là thông qua các sáng kiến nguồn mở, có thể đẩy nhanh tiến độ cho toàn ngành. Tinh thần hợp tác này thể hiện rõ trong việc chia sẻ các mô hình, mã và kết quả nghiên cứu, thúc đẩy ý thức về sự tiến bộ tập thể.

Sự phát triển không ngừng của lĩnh vực AI của Trung Quốc là một minh chứng cho tham vọng của đất nước này trở thành một nhà lãnh đạo toàn cầu về trí tuệ nhân tạo. Sự kết hợp giữa động lực kinh doanh, sự hỗ trợ của chính phủ và sự chấp nhận ngày càng tăng đối với các nguyên tắc nguồn mở đang tạo ra một nền tảng màu mỡ cho sự đổi mới. Khi các công ty AI Trung Quốc tiếp tục vượt qua các ranh giới của những gì có thể, họ không chỉ định hình lại thị trường nội địa của mình mà còn đóng góp vào sự tiến bộ toàn cầu của trí tuệ nhân tạo. Câu chuyện về DeepSeek và tác động của nó đối với bối cảnh AI của Trung Quốc là một ví dụ hấp dẫn về cách một lực lượng đột phá duy nhất có thể xúc tác cho sự thay đổi trên diện rộng và đẩy nhanh tốc độ đổi mới trong toàn bộ ngành.