Đột phá AI TQ: DeepSeek và Hạn chế Chip | vi

Ngành trí tuệ nhân tạo (AI) ở Trung Quốc đang trải qua một sự chuyển đổi mạnh mẽ, được thúc đẩy bởi sự nổi lên của các công ty đổi mới như DeepSeek và được tăng cường bởi những hạn chế do lệnh cấm xuất khẩu chip của Hoa Kỳ áp đặt. Sự hợp lưu của các yếu tố này đã tạo ra một môi trường độc đáo, nơi các công ty công nghệ Trung Quốc đang chạy đua để phát triển và phát hành các mô hình AI mã nguồn mở, trong khi các công ty khởi nghiệp ngày càng tập trung vào xây dựng các ứng dụng thực tế hơn là các mô hình nền tảng.

Tác động của DeepSeek đến ngành AI của Trung Quốc

Sự trỗi dậy của DeepSeek đã bơm thêm năng lượng mới vào ngành AI của Trung Quốc, thu hút nguồn vốn nhà nước đáng kể và đẩy nhanh động lực hướng tới tự chủ công nghệ. Thành công của công ty cũng đã tạo ra sự cạnh tranh khốc liệt giữa các công ty khởi nghiệp để phát triển các sản phẩm và dịch vụ dựa trên công nghệ mã nguồn mở hiệu suất cao của mình. Điều này đang xảy ra ngay cả khi các công ty công nghệ lớn của Trung Quốc đang ra mắt các mô hình AI của riêng mình.

Lệnh cấm chip của Hoa Kỳ, cùng với những thành tựu của DeepSeek, đã buộc hệ sinh thái AI của Trung Quốc phải đẩy nhanh đổi mới, củng cố vị thế của mình trong đấu trường công nghệ toàn cầu. Những yếu tố này cũng đã thúc đẩy các công ty khởi nghiệp chuyển trọng tâm sang phát triển các ứng dụng thực tế hơn.

Theo Kevin Xu, người sáng lập Interconnected Capital, thành công của DeepSeek chứng minh rằng các phòng thí nghiệm AI của Trung Quốc có thể tạo ra các mô hình tiên tiến ngay cả khi bị hạn chế kiểm soát xuất khẩu. Thành công này cũng đang khuyến khích nhiều công ty khởi nghiệp tập trung vào xây dựng các ứng dụng và dịch vụ hơn là dành nguồn lực để phát triển các mô hình.

Thu hẹp khoảng cách hiệu suất

Mặc dù Trung Quốc отста về Hoa Kỳ về số lượng mô hình AI được sản xuất vào năm ngoái, các mô hình của Trung Quốc đang nhanh chóng bắt kịp về hiệu suất, theo một báo cáo từ Viện AI lấy con người làm trung tâm của Stanford. Tuy nhiên, các công ty Trung Quốc phải đối mặt với những thách thức đáng kể, bao gồm cả việc mở rộng kiểm soát xuất khẩu của Hoa Kỳ, hạn chế quyền truy cập vào các chip tiên tiến.

DeepSeek tuyên bố đã đào tạo mô hình nền tảng V3 của mình, một hệ thống AI quy mô lớn được đào tạo trên các bộ dữ liệu khổng lồ và có khả năng thích ứng với nhiều tác vụ khác nhau, sử dụng các chip Nvidia ít tiên tiến hơn với chi phí khoảng 6 triệu đô la. Con số này thấp hơn đáng kể so với chi phí 100 triệu đô la + để đào tạo mô hình GPT-4 của OpenAI.

Melanie Tng, một nhà phân tích tại PitchBook, cho rằng những tuyên bố về hiệu quả của DeepSeek đang ảnh hưởng đến tâm lý nhà đầu tư đối với các công ty AI bên ngoài Trung Quốc. Nếu các mô hình hiệu suất cao có thể được xây dựng với chi phí thấp hơn nhiều, thì tính bền vững của ngân sách đào tạo hàng tỷ đô la ở những nơi khác đang bị đặt dấu hỏi.

Xu tin rằng các nhà đầu tư ở Trung Quốc hiện sẽ do dự trong việc hỗ trợ các công ty AI nhỏ hơn vẫn tập trung vào các mô hình nền tảng, vì công nghệ của DeepSeek khiến họ khó cạnh tranh hơn. Mặc dù một vài công ty sẽ vẫn cam kết thúc đẩy các mô hình AI, nhưng hầu hết sẽ tập trung vào xây dựng các ứng dụng, dịch vụ và tác nhân. Đây là nơi dòng tiền đầu tư sẽ chảy vào.

Sự thúc đẩy AI của các gã khổng lồ công nghệ

Các gã khổng lồ công nghệ Trung Quốc đang tung ra các mô hình AI mới và đầu tư hàng tỷ đô la vào nghiên cứu, báo hiệu một tương lai nơi chỉ những người chơi lớn mới cạnh tranh trong phát triển mô hình AI. Một số công ty đã đạt được những bước tiến đáng kể trong lĩnh vực này:

Meituan: Gã khổng lồ giao đồ ăn đang phát triển mô hình AI của riêng mình, được gọi là LongCat, nhằm cải thiện hiệu quả hoạt động.
Baidu: Baidu đã ra mắt Ernie Bot dưới dạng chatbot AI miễn phí, với các khách hàng doanh nghiệp và nhà phát triển trả tiền để truy cập các tính năng nâng cao hơn.
ByteDance: Chủ sở hữu của TikTok đã phát triển Doubao 1.5, một mô hình AI chi phí thấp được thiết kế cho nhiều ứng dụng khác nhau.
Alibaba: Gã khổng lồ thương mại điện tử gần đây đã ra mắt một mô hình AI mã nguồn mở trong dòng Qwen của mình, giúp nó có thể truy cập được cho nhiều nhà phát triển hơn.
Zhipu: Công ty khởi nghiệp đã ra mắt một tác nhân AI miễn phí được xây dựng trên mô hình của riêng mình, tuyên bố nó cạnh tranh với hiệu suất của DeepSeek trong việc thực hiện các nhiệm vụ nghiên cứu và trợ lý cá nhân.

Alibaba đã phát hành một phiên bản mã nguồn mở của dòng mô hình ngôn ngữ lớn Qwen của mình vào ngày đầu tiên của Tết Nguyên đán, ngay sau thông báo của DeepSeek. Công ty cũng cam kết đầu tư 53 tỷ đô la trong ba năm tới vào cơ sở hạ tầng AI và điện toán đám mây của mình và đang ra mắt thế hệ tiếp theo của dòng Qwen LLM trong những tuần tới.

Tencent Holdings, Baidu và ByteDance cũng đã ra mắt các mô hình AI mới. Baidu đã cung cấp chatbot Ernie Bot miễn phí cho công chúng trước thời hạn. Giám đốc điều hành Baidu Robin Li tuyên bố rằng chi phí đào tạo mô hình ‘có thể giảm hơn 90% trong 12 tháng’. Ông nhấn mạnh sự cần thiết phải đầu tư liên tục để luôn đi đầu trong đổi mới công nghệ.

Meituan đã công bố mô hình AI của mình, LongCat, mô hình này đã cải thiện hiệu quả hoạt động. Người sáng lập Meituan, Wang Xing đã cam kết ‘hàng tỷ nhân dân tệ’ cho phát triển AI, hứa hẹn sẽ cạnh tranh gay gắt với các công ty khác.

Rui Ma, người sáng lập Tech Buzz China, tin rằng các công ty công nghệ lớn có lợi thế hơn so với các đối thủ nhỏ hơn trong nghiên cứu nền tảng vì việc kiếm tiền từ việc chỉ bán quyền truy cập mô hình đang giảm dần do tính hiệu quả về chi phí của DeepSeek. Điều này buộc các công ty khác phải tập trung vào sản phẩm hơn.

Sự chuyển đổi sang các ứng dụng thực tế

Ngay cả trước DeepSeek, các công ty khởi nghiệp nhỏ hơn đã phản ứng với việc thiếu sự nhiệt tình của nhà đầu tư đối với việc tài trợ cho nghiên cứu. Một số trong số ‘sáu con rồng nhỏ’ của Trung Quốc, các công ty khởi nghiệp AI hàng đầu của đất nước, đã buộc phải xoay trục khi sự quan tâm của nhà đầu tư và người tiêu dùng đã suy yếu. Baichuan đã dừng việc đào tạo trước mô hình của mình vào giữa năm 2024 để tập trung vào các dịch vụ AI y tế, theo hãng truyền thông công nghệ Trung Quốc 36Kr. Một công ty khởi nghiệp khác, 01.ai, sẽ áp dụng DeepSeek khi chuyển đổi từ phát triển các mô hình AI của riêng mình sang trở thành nhà cung cấp giải pháp, đặc biệt là trong lĩnh vực tài chính, trò chơi điện tử và pháp lý.

Zhipu đã ra mắt một tác nhân AI miễn phí được xây dựng trên mô hình của riêng mình, tuyên bố nó cạnh tranh với hiệu suất của DeepSeek. Các tác nhân AI này thực hiện các nhiệm vụ nghiên cứu và trợ lý cá nhân, chẳng hạn như đặt vé máy bay và gọi đồ ăn.

Celia Chen, một nhà đầu tư mạo hiểm có trụ sở tại Bắc Kinh, tin rằng việc chuyển sang giải quyết ‘các vấn đề trong thế giới thực’ là một động thái thông minh. Thay vì tham gia vào cuộc chạy đua vũ trang cơ sở hạ tầng nổi tiếng, các công ty khởi nghiệp AI của Trung Quốc có thể thử nghiệm và triển khai các ý tưởng với một phần nhỏ chi phí cần thiết để cạnh tranh trong việc xây dựng các mô hình lớn.

Xu hướng đầu tư mạo hiểm

Bất chấp sự hỗ trợ lớn hơn của nhà nước và sự nhiệt thành dân tộc chủ nghĩa, nguồn vốn đầu tư mạo hiểm trong không gian này vẫn còn yếu. Trong quý đầu tiên của năm nay, các nhà đầu tư mạo hiểm đã đầu tư 1,2 tỷ đô la vào 144 giao dịch trong lĩnh vực AI và học máy của Trung Quốc, bao gồm nhận dạng giọng nói và điều khiển robot, theo PitchBook. Tổng giá trị giao dịch giảm 30% so với cùng kỳ năm ngoái.

Kayla Blomquist, giám đốc Phòng thí nghiệm Chính sách Trung Quốc Oxford, tin rằng điều này có thể có lợi, vì nó thúc đẩy các công ty tạo ra các sản phẩm AI để tạo doanh thu. Cô lưu ý rằng nhiều công ty khởi nghiệp đang tập trung vào việc xây dựng dựa trên các mô hình nền tảng như DeepSeek’s, điều này có thể làm giảm nhu cầu đầu tư lớn và hỗ trợ VC. Điều này có thể dân chủ hóa AI theo một số cách.

Tương lai của AI Trung Quốc

Khi việc ra mắt mô hình thế hệ tiếp theo của DeepSeek đang được chờ đợi, Butterfly Effect đã tung ra Manus, một tác nhân AI chỉ dành cho khách mời vào tháng trước. Nó tuyên bố Manus là tác nhân AI tổng quát đầu tiên trên thế giới, có thể thực hiện các tác vụ với mức độ tự chủ mà các mô hình AI hiện tại còn thiếu.

Công ty gần đây đã công bố hợp tác với Alibaba. Đồng sáng lập của Manus, Yichao ‘Peak’ Ji, cho biết tác nhân này được phát triển bằng nhiều mô hình nền tảng, bao gồm Claude của Anthropic và Qwen của Alibaba. Bất chấp các sự cố và trục trặc, Manus đã tạo ra sự phấn khích về một thế hệ công cụ AI hoàn toàn mới với nhiều ứng dụng khác nhau.

Đối với các công ty AI Trung Quốc, sự kết hợp chiến thắng có thể nằm ở việc kết hợp AI với chuyên môn trong lĩnh vực để cung cấp các giải pháp mà các công ty công nghệ lớn không thể dễ dàng sao chép. Điều này bao gồm các công ty giúp tạo ra các chẩn đoán y tế chính xác hơn hoặc quy trình làm việc kinh doanh nhanh hơn.

Các cơ hội có ý nghĩa đang nổi lên không chỉ cho những người chơi lớn mà còn cho những người sáng lập thị trường đại chúng. Sự thay đổi hướng tới các ứng dụng thực tế và các giải pháp chuyên biệt này có thể xác định giai đoạn đổi mới AI tiếp theo ở Trung Quốc.

Tác động của lệnh cấm chip của Hoa Kỳ

Lệnh cấm chip của Hoa Kỳ đã có tác động đáng kể đến ngành AI của Trung Quốc, tạo ra cả thách thức và cơ hội. Mặc dù việc hạn chế quyền truy cập vào các chip tiên tiến đã cản trở một số khía cạnh của phát triển AI, nhưng nó cũng đã thúc đẩy sự đổi mới trong các lĩnh vực khác. Các công ty Trung Quốc đã buộc phải tìm ra các giải pháp sáng tạo để vượt qua những hạn chế này, chẳng hạn như phát triển các thuật toán hiệu quả hơn và sử dụng phần cứng kém tiên tiến hơn một cách hiệu quả hơn.

Điều này đã dẫn đến sự tập trung lớn hơn vào tối ưu hóa phần mềm và đổi mới thuật toán, cho phép các công ty AI Trung Quốc đạt được kết quả ấn tượng ngay cả với nguồn lực hạn chế. Thành công của DeepSeek, công ty đã đào tạo mô hình V3 của mình bằng các chip Nvidia kém tiên tiến hơn, là minh chứng cho sự khéo léo này.

Lệnh cấm chip cũng đã đẩy nhanh sự phát triển của khả năng sản xuất chip trong nước ở Trung Quốc. Chính phủ đã đầu tư mạnh vào lĩnh vực này, nhằm giảm sự phụ thuộc của đất nước vào các nhà cung cấp nước ngoài. Mặc dù có thể mất thời gian để Trung Quốc đạt được khả năng tự cung tự cấp hoàn toàn trong sản xuất chip, nhưng lệnh cấm chip chắc chắn đã ускорите quá trình này.

Mô hình AI mã nguồn mở

Sự trỗi dậy của các mô hình AI mã nguồn mở ở Trung Quốc là một xu hướng quan trọng khác định hình ngành công nghiệp này. Các công ty như Alibaba và DeepSeek đã phát hành các mô hình của họ cho công chúng, cho phép các nhà phát triển và nhà nghiên cứu truy cập và xây dựng dựa trên công việc của họ. Điều này đã thúc đẩy một môi trường hợp tác và đẩy nhanh tốc độ đổi mới.

Các mô hình mã nguồn mở hạ thấp các rào cản gia nhập cho các công ty và công ty khởi nghiệp nhỏ hơn, cho phép họ phát triển các ứng dụng được hỗ trợ bởi AI mà không phải đầu tư nhiều vào việc xây dựng các mô hình của riêng họ từ đầu. Điều này đã dẫn đến sự gia tăng của các sản phẩm và dịch vụ được hỗ trợ bởi AI trong nhiều ngành công nghiệp khác nhau.

Phong trào mã nguồn mở cũng khuyến khích tính minh bạch và trách nhiệm giải trình trong phát triển AI. Bằng cách cung cấp công khai mã và dữ liệu được sử dụng để đào tạo các mô hình này, các nhà nghiên cứu có thể xem xét kỹ lưỡng hiệu suất của chúng và xác định các thành kiến hoặc hạn chế tiềm ẩn. Điều này có thể dẫn đến các hệ thống AI mạnh mẽ và đáng tin cậy hơn.

Sự tập trung vào các tác nhân AI

Các tác nhân AI, có thể thực hiện các tác vụ với một mức độ tự chủ, đang nổi lên như một lĩnh vực trọng tâm chính trong ngành AI của Trung Quốc. Các công ty như Butterfly Effect đang phát triển các tác nhân AI có thể tự động hóa các tác vụ, cung cấp các đề xuất được cá nhân hóa và hỗ trợ người dùng theo nhiều cách khác nhau.

Các tác nhân AI này có khả năng biến đổi nhiều ngành công nghiệp, từ chăm sóc sức khỏe đến tài chính đến giáo dục. Chúng có thể tự động hóa các tác vụ lặp đi lặp lại, giải phóng người lao động để tập trung vào các hoạt động sáng tạo và chiến lược hơn. Chúng cũng có thể cung cấp các dịch vụ được cá nhân hóa phù hợp với nhu cầu cá nhân của từng người dùng.

Việc phát triển các tác nhân AI đòi hỏi sự kết hợp của các công nghệ AI tiên tiến, bao gồm xử lý ngôn ngữ tự nhiên, học máy và thị giác máy tính. Các công ty AI Trung Quốc đang đầu tư mạnh vào các lĩnh vực này để phát triển các tác nhân AI tiên tiến có thể cạnh tranh trên quy mô toàn cầu.

Vai trò của hỗ trợ chính phủ

Chính phủ Trung Quốc đóng một vai trò quan trọng trong việc hỗ trợ ngành AI thông qua tài trợ, các sáng kiến chính sách và khuôn khổ pháp lý. Chính phủ đã xác định AI là một ưu tiên chiến lược và cam kết thúc đẩy sự phát triển của nó.

Tài trợ của chính phủ được направ vào các viện nghiên cứu, trường đại học và công ty tham gia vào nghiên cứu và phát triển AI. Tài trợ này giúp đẩy nhanh đổi mới và đảm bảo rằng Trung Quốc vẫn đi đầu trong công nghệ AI.

Chính phủ cũng thúc đẩy việc áp dụng AI trong nhiều ngành công nghiệp khác nhau thông qua các sáng kiến chính sách và các dự án thí điểm. Các sáng kiến này khuyến khích các công ty tích hợp AI vào hoạt động của họ và phát triển các giải pháp được hỗ trợ bởi AI sáng tạo.

Chính phủ cũng đóng một vai trò trong việc điều chỉnh ngành AI để đảm bảo rằng AI được phát triển và sử dụng có trách nhiệm. Điều này bao gồm giải quyết các vấn đề như bảo mật dữ liệu, thành kiến thuật toán và các tác động đạo đức của AI.

Kết luận

Ngành AI của Trung Quốc đang trải qua một giai đoạn tăng trưởng và chuyển đổi nhanh chóng, được thúc đẩy bởi sự kết hợp của các yếu tố, bao gồm sự trỗi dậy của các công ty đổi mới như DeepSeek, những hạn chế do lệnh cấm chip của Hoa Kỳ áp đặt và sự hỗ trợ mạnh mẽ của chính phủ đối với phát triển AI.

Điều này đã dẫn đến sự tập trung lớn hơn vào các ứng dụng thực tế, các mô hình mã nguồn mở và các tác nhân AI, và sự nhấn mạnh ngày càng tăng vào tối ưu hóa phần mềm và đổi mới thuật toán. Khi ngành AI của Trung Quốc tiếp tục phát triển, nó được định vị để đóng một vai trò ngày càng quan trọng trong bối cảnh AI toàn cầu.

cập nhật lúc 2025-04-16

# Agent # DeepSeek # Qwen