Sự trỗi dậy của DeepSeek: 100 Ngày Đột Phá AI và Khát Vọng Khởi Nghiệp
Bối cảnh AI đã thay đổi không thể đảo ngược trong 100 ngày sau sự trỗi dậy vượt bậc của DeepSeek R1 vào ngày 20 tháng 1 năm 2025. Giai đoạn này chứng kiến DeepSeek nổi lên như một thế lực thống trị, không chỉ thể hiện sức mạnh AI của Trung Quốc mà còn định hình quỹ đạo phát triển AI toàn cầu. Báo cáo này đi sâu vào tác động chuyển đổi từ sự vươn lên của DeepSeek, khám phá ảnh hưởng của nó đối với các liên doanh AI, chiến lược đầu tư và động lực cạnh tranh trong ngành.
Phao Cứu Sinh Cho Các Startup AI
Đối với Zhang Yang, người sáng lập một công ty phần cứng AI, sự xuất hiện của DeepSeek không khác gì một chiếc phao cứu sinh. Vào cuối năm 2024, công ty của Zhang Yang, tập trung vào phần cứng AI đồng hành, đã phải vật lộn để đảm bảo nguồn vốn đầy đủ mặc dù đã nỗ lực rất nhiều. Nhu cầu đối với sản phẩm của họ bị hạn chế và công ty nhanh chóng cạn kiệt nguồn lực cho nghiên cứu và phát triển.
Sự ra mắt của DeepSeek R1 vào đầu năm 2025 đã chứng tỏ là một bước ngoặt. Công ty của Zhang Yang đã nhận được một đơn đặt hàng lớn từ một thương hiệu nổi tiếng đang tìm cách phát triển một thiết bị nhà thông minh cho trẻ em dựa trên mô hình DeepSeek R1. Cơ hội bất ngờ này đã biến đổi doanh nghiệp của Zhang Yang từ bờ vực phá sản thành trạng thái tăng trưởng nhanh chóng. “Tôi thực sự muốn cảm ơn Liang Wenfeng,” Zhang Yang dí dỏm bày tỏ lòng biết ơn của mình.
Sự chuyển đổi này không phải là một trường hợp cá biệt. Li Po, người dấn thân vào con đường khởi nghiệp AI sau khi rời Microsoft vào tháng 7 năm 2023, đã chia sẻ ứng dụng DeepSeek với cha mẹ mình trong dịp Tết Nguyên Đán. Anh nhận thấy DeepSeek là ứng dụng AI đầu tiên thực sự gây được tiếng vang với công chúng nói chung.
Startup của Li Po, vốn đang ở giai đoạn tài trợ hạt giống vào năm ngoái, đã phải đối mặt với các yêu cầu khắt khe thường liên quan đến tài trợ vòng Pre-A và A. Tuy nhiên, năm nay, nhóm của anh đã tham gia vào các cuộc thảo luận đầy hứa hẹn với một số quỹ đô la Mỹ hàng đầu. Đối với Li Po, người trước đây tập trung vào thị trường nước ngoài, sự công nhận quốc tế của DeepSeek đã đóng vai trò như một tấm danh thiếp, chứng minh không chỉ trình độ công nghệ AI tiên tiến ở Trung Quốc mà còn cả tiềm năng của các nhóm AI Trung Quốc trong việc giảm chi phí và đẩy nhanh quá trình thương mại hóa.
Sự Thay Đổi Của Đầu Tư AI
100 ngày sau khi phát hành DeepSeek R1 đã chứng kiến một sự thay đổi đáng kể trong bối cảnh đầu tư mạo hiểm AI.
Vào tháng 8 năm 2024, Zhu Xiaohu, Đối tác quản lý tại GSR Ventures, dự đoán rằng không có công ty mô hình lớn độc lập nào có thể tồn tại quá năm năm, cho thấy rằng AI “Little Six Tigers” cuối cùng sẽ bị các tập đoàn lớn hơn mua lại. Tuy nhiên, trong vòng 60 ngày sau thành công đột phá của DeepSeek, Zhu Xiaohu đã đăng trên nguồn cấp dữ liệu WeChat của mình vào tháng 3 năm 2025, bày tỏ sự sẵn sàng đầu tư vào DeepSeek ở bất kỳ mức định giá nào nếu công ty mở ra để tài trợ.
Mặc dù có sự tin tưởng mới vào AI, các mô hình đầu tư đã chuyển từ phát triển mô hình lớn sang các ứng dụng AI và trí tuệ thể hiện. Ví dụ: Huarong Capital đã đầu tư vào Fluidity có trụ sở tại Silicon, có các dịch vụ tăng tốc suy luận cho DeepSeek rất quan trọng trong việc áp dụng rộng rãi. ZhenGe Fund và những người khác đã đầu tư mạnh vào trí tuệ thể hiện, với vòng tài trợ B trị giá 1 tỷ nhân dân tệ của YuShu Technology đã thiết lập một kỷ lục mới trong lĩnh vực này. Các công ty cổ phần tư nhân cũng đã bắt đầu khám phá các lĩnh vực dọc như “AI + Healthcare” và “AI + Law”. Ví dụ: định giá của Harvey, một công cụ tạo hợp đồng pháp lý, đã tăng gấp đôi chỉ trong sáu tháng.
Việc DeepSeek nhấn mạnh vào các giải pháp nguồn mở chi phí thấp không chỉ hạ thấp rào cản gia nhập cho phát triển ứng dụng AI mà còn làm tăng cường sự cạnh tranh trong ngành AI.
Ví dụ: YueZhiAnMian, một trong những AI “Little Six Tigers”, được báo cáo đã cắt giảm 70% ngân sách tiếp thị cho chatbot Kimi để tập trung vào đào tạo mô hình, cố gắng sao chép phương pháp kỹ thuật của DeepSeek. Zhipu AI, trước đây đã sa thải 20% nhân viên vào năm 2024 do áp lực thương mại hóa, đã thông báo vào tháng 3 rằng họ sẽ mở mã nguồn cho các mô hình dòng GLM của mình, tham gia phong trào nguồn mở. Nó cũng nhận được hơn 1,5 tỷ nhân dân tệ tài trợ từ tài sản nhà nước ở Hàng Châu và Chu Hải, tìm cách khẳng định ảnh hưởng của mình như một “đội tuyển quốc gia”.
AI Agent của Li Po, “WorkfxAI,” tập trung vào các kịch bản dọc như thương mại điện tử, ngân hàng và chăm sóc sức khỏe. Bằng cách tinh chỉnh các mô hình với dữ liệu từ các lĩnh vực cụ thể này, nó đã tạo ra gần một triệu nhân dân tệ doanh thu. “Sự cạnh tranh không còn là về các thông số kỹ thuật mà là về việc ai có thể liên kết các mô hình với các kịch bản cụ thể một cách nhanh chóng và hiệu quả hơn,” Li Po nói.
DeepSeek cũng tiếp tục lặp lại và đổi mới. Vào ngày 25 tháng 3, DeepSeek chính thức công bố nâng cấp phiên bản nhỏ cho mô hình V3 và vào ngày 30 tháng 4, họ đã phát hành mô hình lớn DeepSeek-Prover-V2-671B, tập trung vào chứng minh toán học. Bất kể tác động tích cực hay tiêu cực, trận động đất “vô ý” do DeepSeek gây ra chắc chắn sẽ có những hậu quả sâu sắc và lan rộng hơn nữa.
Sự Hấp Dẫn Của Nguồn Vốn Nước Ngoài
“Tài chính trong nước nhìn ra nước ngoài. Sự xuất hiện của DeepSeek đã khiến các nhà đầu tư nước ngoài quan tâm hơn đến các đội AI Trung Quốc.”
Li Po là một trong những thành viên đầu tiên của nhóm tìm kiếm Bing của Microsoft. Từ Alibaba đến Microsoft, và sau đó bắt đầu liên doanh AI của riêng mình vào tháng 7 năm 2023, anh đã xây dựng các nhóm cả ở Trung Quốc và nước ngoài. Tuy nhiên, năm ngoái, anh đã không thể đảm bảo được một số tiền tài trợ thỏa đáng.
Trước thành công đột phá của DeepSeek vào tháng 1 năm 2025, các doanh nhân AI như Li Po phải đối mặt với một thị trường đầu tư ảm đạm.
Trong lĩnh vực Agent của Li Po, việc đảm bảo tài trợ vòng thiên thần ở Trung Quốc đòi hỏi phải đạt được doanh thu hàng năm là 1 triệu đô la trong vòng sáu tháng, bắt đầu từ con số không. Vào thời điểm đó, không có sự hiểu biết rõ ràng về AI giữa người dùng B-end hoặc C-end ở Trung Quốc, điều này khiến các yêu cầu có vẻ khắc nghiệt đối với các startup như Li Po. “Khi huy động vốn vòng thiên thần hoặc hạt giống, các nhà đầu tư về cơ bản đã sử dụng các tiêu chuẩn vòng Pre-A hoặc A. Không đủ để có nhiều người dùng để nhận được tài trợ. Họ yêu cầu doanh thu và tỷ lệ thanh toán cấp A-round/Pre-A.”
Ở nước ngoài, các từ khóa liên quan đến các đội Trung Quốc là “lạc hậu về công nghệ, sao chép”. Nhóm của Li Po cũng không thu hút được sự chú ý.
Sau thành công bùng nổ của DeepSeek trong dịp Tết Nguyên Đán, gió đã đổi chiều.
Li Po không còn cần phải giải thích một cách khổ sở AI là gì cho người thân và bạn bè của mình. Thành công của DeepSeek đã làm cho nó dễ hiểu ngay cả đối với cha mẹ anh ở quê nhà. Đồng thời, những đột phá công nghệ của DeepSeek đã khiến các nhà đầu tư nước ngoài nhận ra rằng “Công nghệ AI của Trung Quốc đã bắt kịp. Mặc dù nó có thể không sáng tạo như OpenAI về hiệu suất, nhưng DeepSeek đã chứng minh rằng chúng ta có thể giảm giá.” Các quỹ nước ngoài trước đây đã bỏ qua Li Po giờ đây có xu hướng xem xét các đội Trung Quốc hơn.
Ngày nay, vòng tài trợ hạt giống của Li Po đã đạt đến giai đoạn cuối cùng, “Mục tiêu là huy động 5 triệu đô la.”
Fang Cheng, một đối tác tại một quỹ đầu tư mạo hiểm hàng đầu trong nước, cũng nói với Alpha rằng việc giảm giá của DeepSeek sẽ dẫn đến một sự bùng nổ trên thị trường ứng dụng AI và có một sự đồng thuận để tích cực đầu tư vào thượng nguồn (chẳng hạn như chip) và hạ nguồn (chẳng hạn như ứng dụng và phần cứng) của AI. “Sự xuất hiện của DeepSeek thực sự đã dẫn đến sự hội tụ trong nhận thức của mọi người.”
Fang Cheng phát hiện ra rằng sự xuất hiện của DeepSeek không chỉ khiến các công ty lớn vội vã ra mắt các mô hình lớn có tư duy sâu sắc, mà các doanh nhân AI cũng đang học hỏi từ DeepSeek.
“WorkfxAI” của Li Po cũng đã bắt đầu thêm một quy trình trình diễn tư duy trong suốt thiết kế sản phẩm và các liên kết khác nhau. Sự phổ biến của DeepSeek khiến anh nhận ra rằng cho dù đó là ToB hay ToC, người dùng đều muốn sự minh bạch và dễ giải thích hơn. Người dùng muốn biết AI thực sự đang làm gì.
Chấp Nhận Tính Minh Bạch Và Dễ Giải Thích
Giống như Li Po, sau thành công của DeepSeek, Cheng Sen không chỉ thay thế một phần mô hình sản phẩm của mình bằng DeepSeek mà còn sửa đổi các quy trình nội bộ của sản phẩm dựa trên nguồn cảm hứng mà anh có được.
Sau khi rời một công ty Internet hàng đầu để bắt đầu công việc kinh doanh của riêng mình vào tháng 9 năm ngoái, Cheng Sen đã ra mắt công cụ Agent của riêng mình vào tháng 1 năm nay. Khi phân tích các lý do dẫn đến thành công của DeepSeek, Cheng Sen nhận ra rằng chất lượng tạo cao của DeepSeek là do tư duy bên trong của nó được hiển thị bên ngoài, cho phép người dùng C-end trực tiếp đưa ra hướng dẫn và hạn chế mô hình lớn trong quy trình CoOT (Chuỗi Tư duy).
Do đó, Cheng Sen cũng đã thêm các nút vào sản phẩm để kết hợp quá trình tư duy của máy vào vòng đầu ra tiếp theo. “Chất lượng đầu ra thực sự cao hơn sau khi thêm quá trình tư duy.” Mặc dù chi phí tiêu thụ mã thông báo hàng tháng đã tăng gấp 2-3 lần so với trước đây, số lượng người dùng đã đăng ký cũng đã tăng từ 4.000 vào tháng 2 lên hơn 30.000 ngày nay.
Tuy nhiên, Fang Cheng thừa nhận rằng mặc dù nhóm đã thấy số lượng dự án gấp đôi gần đây so với tháng 11 năm ngoái, nhưng có một sự hiểu biết ngầm trong ngành để tránh lĩnh vực cơ sở mô hình lớn nơi DeepSeek tọa lạc và thay vào đó tập trung vào đầu tư vào các ứng dụng AI và các tuyến đường trí tuệ thể hiện.
“DeepSeek đã chứng minh rằng các mô hình lớn không nhất thiết phải được xếp chồng lên nhau với sức mạnh tính toán để cải thiện hiệu suất, nhưng nó cũng đã nâng cao các rào cản đối với các mô hình lớn một lần nữa. Giờ đây, các quỹ khác ngoài tài sản nhà nước rất khó tiếp quản khoản đầu tư tiếp theo vào Little Six Tigers.” Fang Cheng nói rằng ngay cả khi các nhà đầu tư đã nới lỏng lời lẽ của họ đối với các doanh nhân, thì không có nhiều người thực sự hành động.
Thực Tế Của Việc Gây Quỹ Trong Một Bối Cảnh Cạnh Tranh
Đối với các doanh nhân, thị trường đầu tư hiện tại có vẻ như ánh nắng mùa xuân, trông tươi sáng nhưng không thể truyền nhiệt.
“So với năm ngoái, có nhiều nhà đầu tư xem xét hướng Agent hơn, nhưng khó gây quỹ hơn.”
Cheng Sen nói với Alpha rằng năm ngoái anh, giống như Li Po, đã bị chặn bởi các điều kiện tài chính gần như khắc nghiệt. Danh hiệu của một công ty Internet hàng đầu đã không “kiếm tiền” một cách suôn sẻ. Cuối cùng, anh đã chọn lấy tiền từ các nhà đầu tư cá nhân làm vốn khởi nghiệp.
Với sự phổ biến của DeepSeek, các nhà đầu tư đang tìm kiếm tích cực hơn so với năm ngoái, nhưng DeepSeek đã hạ thấp hơn nữa ngưỡng kỹ thuật cho các nhà phát triển thông thường và kết quả là có nhiều đối thủ cạnh tranh hơn và khó gây tiền hơn.
Trên thực tế, trong 100 ngày kể từ thành công của DeepSeek, con đường mô hình lớn đã trở nên ngày càng đông đúc.
Dữ liệu của AppGrowing cho thấy kể từ tháng Hai, khoản đầu tư của Kimi đã giảm mạnh, từ hơn 100 triệu nhân dân tệ đầu tư hàng tháng vào tháng 12 năm 2024 và tháng 1, xuống còn 44,25 triệu nhân dân tệ vào tháng Hai. Là một trường kỹ thuật tương đối nổi tiếng trong Six Little Tigers, YueZhiAnMian cũng đã tiết lộ tin tức về việc giảm đáng kể ngân sách đầu tư sản phẩm.
Đồng thời, khi DeepSeek tuyên bố rằng tỷ suất lợi nhuận lý thuyết của nó là 545%, ngay cả với giá mã thông báo cực kỳ thấp, nó vẫn có thể kiếm được lợi nhuận. Zhipu, được định giá hơn 20 tỷ nhân dân tệ và vừa nhận được hơn 1,5 tỷ nhân dân tệ tài trợ ở nhiều nơi, đã có doanh thu 300 triệu nhân dân tệ vào năm 2024, theo Phoenix.com, nhưng vẫn lỗ 2 tỷ nhân dân tệ. Trước DeepSeek, nguồn mở hơn và có khả năng hiển thị cao hơn, các doanh nhân AI, ngay cả những người đứng đầu Six Little Tigers, đang phải đối mặt với một vòng loại bỏ khốc liệt trong việc thương mại hóa các doanh nghiệp B-end.
MiniMax gần đây cũng được đồn đại là có sự ra đi của Wei Wei, người đứng đầu nền tảng mở. Để đáp lại, MiniMax cho biết rằng doanh nghiệp B-end trong nước đã mở ra một giai đoạn phát triển mới và sẽ được dẫn dắt bởi những người lãnh đạo khác. Áp lực thương mại hóa của các công ty mô hình lớn do cơn sốt DeepSeek gây ra dường như là không thể tránh khỏi đối với MiniMax.
Ngay cả trong các kịch bản dọc, mức độ cạnh tranh chỉ tăng lên. Điều nằm trước mắt các doanh nhân AI là vấn đề thương mại hóa khẩn cấp cần được trả lời.
Zero One Wanwu, được thành lập bởi Li KaiFu, đã ngừng “đào tạo trước” các mô hình ngôn ngữ lớn và thay vào đó tập trung vào việc bán các giải pháp kinh doanh trí tuệ nhân tạo tùy chỉnh bằng cách sử dụng các mô hình của DeepSeek. Baichuan Intelligence đã chuyển sang thị trường chăm sóc sức khỏe.
Cheng Sen đã chọn phát triển các dịch vụ tùy chỉnh cho các doanh nghiệp B-end nhỏ hơn, nhắm mục tiêu đến hai nhóm tuổi: người già và người trẻ.
Dưới cơn sốt Deepseek, Cheng Sen đã thông báo trên Xiaohongshu rằng Agent của anh đã truy cập vào Deepseek và số lượng lượt thích có thể đạt hơn 4.000, đây là bài đăng phổ biến nhất kể từ khi anh bắt đầu công việc kinh doanh của mình. Tuy nhiên, khi số lượng người dùng tăng từ 4.000 vào tháng Hai lên hơn 30.000 và mức tiêu thụ mã thông báo hàng tháng tăng gấp 2-3 lần, Cheng Sen vẫn cần tìm một lối thoát cho nhóm.
Tuy nhiên, cho dù đó là dưới hình thức hỗ trợ cư trú của nhóm hay khám phá mô hình tính phí của SaaS thương mại, Cheng Sen thừa nhận rằng đây chỉ là những nguồn tiền có thể, “Sau tất cả, SaaS thương mại trong nước đã được phát triển trong nhiều năm và các công ty lớn vẫn chưa hình thành một mô hình đặc biệt tốt.”
Khác với sự nhầm lẫn khi tìm kiếm các nhà đầu tư khi bắt đầu kinh doanh vào đầu năm ngoái, nhóm của Cheng Sen đã quyết định thu hẹp cơ sở người dùng xuống còn hai nhóm tuổi, người già và người trẻ. Mặc dù sức tiêu thụ của hai nhóm này bị nghi ngờ, Cheng Sen quyết định trước tiên làm “những điều có giá trị, không quan trọng nếu chúng ta không thể gây quỹ trong năm nay.”
Áp Lực Không Ngừng Của Cạnh Tranh Công Nghệ
Có vẻ như những làn sóng do viên sỏi của DeepSeek khuấy động vẫn còn hạn chế.
Đối với các doanh nhân, điều không thay đổi trong hơn 60 ngày và 100 ngày kể từ thành công đột phá của DeepSeek là áp lực do cạnh tranh công nghệ không ngừng gây ra.
WorkfxAI của Li Po duy trì tần suất cập nhật được lặp lại cứ 1-2 tháng một lần. Các bản cập nhật chức năng của các nhà máy lớn như Google, OpenAI, ByteDance, Alibaba, DeepSeek, v.v., sẽ trở thành tài liệu tham khảo cho tiến độ cập nhật của WorkfxAI, “Khi Gemini và OpenAI được cập nhật, chúng tôi sẽ cập nhật ngay lập tức.”
Để duy trì các rào cản kỹ thuật trong việc cung cấp nền tảng Agent cho người dùng B-end, nhóm của Li Po phải đi trên con đường lặp lại liên tục.
Và gần đây, DeepSeek Vv3 đã đạt được các bản cập nhật chức năng và mô hình R2, tập trung vào khả năng suy luận, cũng dự kiến sẽ được phát hành trước tháng Năm. Vào tháng Ba, OpenAI đã thực hiện các bản cập nhật lớn cho GPT-4o và Sora và ra mắt một mô hình chuyển văn bản thành hình ảnh mới. Nó không chỉ hỗ trợ đặt câu hỏi liên tục, chuyển đổi kiểu và hình ảnh PPT mà thậm chí còn vượt qua Midjourney, nền tảng hàng đầu trong lĩnh vực này, về một số khía cạnh hiệu suất.
Một rung động từ một gã khổng lồ công nghệ có thể là một cơn bão đối với các doanh nhân. “Các thuật toán và mô hình đã mất rất nhiều thời gian và nhân lực để tinh chỉnh có thể bị thay thế bởi một bản cập nhật mô hình lớn một lần.” Cheng Sen nói thêm.
Để theo kịp quá trình lặp lại công nghệ, các doanh nhân cần cạnh tranh với các công ty lớn về con người và nguồn lực. Mặc dù sự phổ biến của DeepSeek đã dẫn đến các điều chỉnh chiến lược của các công ty lớn như ByteDance, Alibaba và Tencent, điều này đã dẫn đến mộtsốtài năng kỹ thuật xuất sắc đột nhiên xuất hiện trên thị trường, “vẫn không có đủ người. Các gói lương hàng năm của các tài năng thuật toán giỏi không phải là điều mà các startup thông thường có thể chi trả.” Fang Cheng nói thêm.
Cần lưu ý rằng trong cuộc cạnh tranh đầy rẫy những điều chưa biết này, quyết tâm của cả các công ty lớn và các doanh nhân trong việc tiếp tục đầu tư vào AI sẽ không thay đổi và thậm chí còn được củng cố hơn nữa trong hơn 60 ngày kể từ khi DeepSeek phổ biến.
Ngoài việc theo kịp DeepSeek và nắm bắt các cổ tức tràn, Tencent không chỉ tích cực quảng bá Yuanyuanbao mà còn ra mắt mô hình lớn suy luận sâu T1 của riêng mình vào đúng thời điểm. Đồng thời, Alibaba gần đây cũng đã tăng tầm quan trọng của Quark một lần nữa, định vị nó là ứng dụng hàng đầu về AI của Alibaba.
Theo dữ liệu của AppGrowing, kể từ cuối tháng Hai, Tongyi Qianwen đã dần tăng cường đầu tư vào quảng cáo và khối lượng đầu tư của nó đã lọt vào TOP10 sau khi phát hành mô hình suy luận nguồn mở QwQ-32B vào ngày 6 tháng Ba. Bộ phận mô hình lớn Doubao (Seed) của Byte cũng đã đề xuất tại cuộc họp toàn thể rằng ứng dụng dài hạn của mô hình nên được thực hiện theo khả năng của mô hình và mô hình suy luận Doubao sẽ được cập nhật đầy đủ.
“Các mô hình lớn giống như vũ khí hạt nhân và các công ty lớn phải có chúng cho dù thế nào đi nữa. Bởi vì nếu có một đột phá lớn trong khả năng của mô hình và bạn không theo kịp, người dùng của bạn vẫn sẽ bị cướp đi.” Đánh giá của Fu Sheng về cuộc cạnh tranh ứng dụng AI hiện tại cũng lặp lại các hành động của các công ty lớn.
Nhìn chung, “DeepSeek giống như một nguồn cảm hứng hơn, sự xuất hiện của nó đã mang lại cho thị trường một sự đồng thuận và khiến các doanh nhân trở nên phấn khích hơn, nhưng hiệu quả thực tế không rõ ràng. DeepSeek có thể cần phải phù hợp với OpenAI về tất cả các khía cạnh của khả năng chung. Nếu nó vẫn có thể có mức giá thấp như vậy vào thời điểm đó, nó sẽ hoàn toàn dẫn đầu một cuộc cách mạng AI.” Li Po nói thêm.
Cho dù đó là các công ty lớn, AI Six Little Tigers hay thậm chí DeepSeek, cuộc chiến xung quanh các mô hình cơ sở và ứng dụng AI này vẫn chưa đến hồi kết. 100 ngày DeepSeek phổ biến có thể giống như một chú thích kỹ thuật hơn và các doanh nhân Trung Quốc đang bắt đầu cưỡi trên con sóng. Tiếp theo, có nhiều điều chưa biết đang chờ đợi họ.