Từ Tầm Nhìn Lớn Đến Chuyển Đổi Chiến Lược
Sự phát triển nhanh chóng của công nghệ AI ở Trung Quốc đã mang lại cả sự hứng thú lẫn bất ổn cho nhiều startup. Từng tràn đầy những mục tiêu đầy tham vọng, một số công ty giờ đây đang điều chỉnh lại chiến lược của mình, đối mặt với thực tế khắc nghiệt của một thị trường cạnh tranh và tốn nhiều nguồn lực.
Một bức thư nội bộ gần đây từ CEO của một trong những ‘AI Tiểu Hổ’ của Trung Quốc, Baichuan Intelligent, đánh dấu kỷ niệm hai năm của công ty và nhấn mạnh một sự thay đổi chiến lược. Trọng tâm sẽ thu hẹp lại, ưu tiên các ứng dụng y tế. Điều này trái ngược hoàn toàn với sứ mệnh ban đầu là tạo ra một mô hình nền tảng đột phá tương tự như OpenAI, hoàn chỉnh với các ứng dụng sáng tạo.
Tương tự, Li Kaifu, người sáng lập một ‘Tiểu Hổ’ khác, 01.AI, đã tuyên bố vào tháng 1 rằng công ty của ông sẽ áp dụng một phương pháp ‘nhỏ nhưng đẹp’. Đây là một sự khác biệt đáng chú ý so với tầm nhìn lớn là xây dựng một nền tảng AI 2.0 để đẩy nhanh sự xuất hiện của AGI.
Những sự rút lui chiến lược này đã thúc đẩy những suy đoán, với một số nhà quan sát cho rằng những ‘Tiểu Hổ’ này đang trở nên giống ‘mèo ốm’ hơn. Trong một môi trường được đánh dấu bằng sự thay đổi liên tục, làm thế nào những công ty này có thể đảm bảo tương lai của mình?
Để trả lời câu hỏi này, nhóm biên tập tại Zhiwei đã tìm kiếm thông tin chi tiết từ nhiều chuyên gia khác nhau, bao gồm các chuyên gia công nghệ mô hình lớn, các chuyên gia AI trong tài chính và chăm sóc sức khỏe, và các chuyên gia công nghệ AI từ các công ty hàng đầu.
Hiệu Ứng DeepSeek và Sự Thay Đổi Chiến Lược
Bức tranh toàn cảnh AI đã thay đổi đáng kể sau sự nổi tiếng bùng nổ của DeepSeek, một mô hình đã làm rung chuyển thị trường. Giống như một chiến binh đáng gờm, DeepSeek đã phá vỡ cảnh quan, buộc nhiều công ty AI phải đánh giá lại vị trí của mình và theo đuổi những con đường khác nhau.
Tuy nhiên, sự chuyển đổi này đã bắt đầu thậm chí sớm hơn nhiều người nhận ra. Theo Wang Wenguang, một chuyên gia công nghệ mô hình lớn, một số công ty AI Trung Quốc đã bắt đầu từ bỏ việc theo đuổi đào tạo mô hình lớn ngay cả trước khi phát hành DeepSeek V3 và R1. Chi phí đơn giản là quá cao, và những công ty này cảm thấy không thể cạnh tranh với các giải pháp thay thế có sẵn miễn phí và mã nguồn mở như DeepSeek V2.5 và Qwen 70B của Alibaba.
Liang He, một chuyên gia từ một doanh nghiệp dịch vụ công nghệ AI, nói thêm rằng trong khi hầu hết các ‘Tiểu Hổ’ vẫn đang đào tạo các mô hình lớn vào giữa năm 2024, thì khoản đầu tư của họ đã giảm đáng kể. Đến tháng 1 năm 2025, với việc phát hành DeepSeek R1, nhiều công ty nhỏ hơn đã nhận ra rằng họ không thể theo kịp.
Sự thay đổi đột ngột này đã gây ra một sự thay đổi lớn trong hướng đi cho các ‘Tiểu Hổ’, chuyển từ phát triển AGI sang các phương pháp chuyên biệt hơn.
Baichuan và 01.AI đã từ bỏ việc đào tạo trước các mô hình lớn, tập trung vào AI y tế và ứng dụng công nghiệp, tương ứng. MiniMax đang giảm các hoạt động B2B của mình và tập trung vào các thị trường nước ngoài với việc tạo video C-end và các ứng dụng khác. Zhipu, Moonshot AI và StepUp vẫn hoạt động trong cộng đồng mã nguồn mở nhưng chưa tạo ra bất kỳ mô hình mới nào vượt trội hơn DeepSeek R1. Zhipu đã đảm bảo được nguồn tài trợ đáng kể và các mối quan hệ đối tác chính phủ-doanh nghiệp, đảm bảo sự sống còn của nó. Sản phẩm chính của Moonshot AI, Kimi, đã chứng kiến vị thế của mình bị đe dọa bởi Yuanbao, khiến vị trí của nó ngày càng trở nên khó xử.
Nhìn chung, các ‘Tiểu Hổ’ ngày càng hội tụ với thị trường SaaS B2B, mà một số người coi là ‘không tưởng tượng được’.
Sự Hấp Dẫn và Hạn Chế của Thị Trường B2B
01.AI gần đây đã công bố ý định tích hợp hoàn toàn DeepSeek để tạo ra một nền tảng mô hình lớn doanh nghiệp một cửa cho các ngành công nghiệp khác nhau. Tuy nhiên, động thái này đã gặp phải sự hoài nghi.
Jiang Shao, một chuyên gia AI tài chính, tin rằng tương lai của 01.AI là không chắc chắn do sự tập trung rộng rãi, thiếu năng lực cạnh tranh về công nghệ sau sự xuất hiện của DeepSeek và khả năng thương mại hóa hạn chế.
Wang Wenguang lặp lại tình cảm này, lưu ý rằng rào cản kỹ thuật để gia nhập một nền tảng mô hình lớn một cửa là tương đối thấp.
Wang chia sẻ kinh nghiệm phát triển một nền tảng như vậy một cách độc lập trong khoảng sáu tháng, bán nó thông qua các kênh cá nhân. Ông lập luận rằng mặc dù khó có thể kiếm lợi nhuận từ sản phẩm này với tư cách là một công ty, nhưng nó có thể có lợi nhuận như một liên doanh solo.
Wang hợp tác với một số công ty B2B cung cấp dịch vụ mô hình lớn nhưng thiếu một nền tảng kỹ thuật. Ông cung cấp nền tảng của mình với chi phí thấp, khoảng 40.000 đến 50.000 nhân dân tệ cho mỗi giấy phép, cắt giảm đáng kể các công ty lớn hơn.
Nền tảng của ông, KAF (Nhà máy Đại lý dựa trên Kiến thức), sử dụng đồ thị tri thức, cơ sở dữ liệu vector và công cụ tìm kiếm để cung cấp các ứng dụng Đại lý và mô hình lớn. Nó cho phép người dùng tạo trợ lý kiến thức hoặc Đại lý tùy chỉnh mà không cần mã hóa thông qua quản lý lời nhắc và mô hình. Wang lưu ý sự phổ biến của các nền tảng tương tự trên thị trường, giúp dễ dàng sao chép.
Theo Wang, một công ty tìm cách phát triển một ứng dụng mô hình lớn B2B có thể nhanh chóng tạo ra một sản phẩm bằng cách thuê một đội ngũ nhỏ những cá nhân lành nghề hoặc hợp tác với một công ty AI bên ngoài. Cách tiếp cận này rẻ hơn đáng kể so với việc đào tạo một mô hình lớn.
Ngoài mô hình nền tảng, các giải pháp tích hợp cung cấp phần cứng, phần mềm và môi trường thực thi, cung cấp chức năng sẵn có. Zhang Sensen, người đứng đầu nhóm nền tảng công nghệ tại Ping An Insurance, tin rằng các giải pháp tích hợp có một thị trường khả thi, đặc biệt là giữa các tổ chức chính phủ và giáo dục có khả năng triển khai kỹ thuật hạn chế. Những giải pháp này ưu tiên tính dễ sử dụng và quyền tự chủ kỹ thuật, mang lại những lợi ích như bảo mật dữ liệu, tuân thủ quyền riêng tư và tối ưu hóa phần cứng-phần mềm. Họ cũng có thể sử dụng chip sản xuất trong nước, bỏ qua các hạn chế và cải thiện hiệu quả. Các công ty nhạy cảm về chi phí và tập trung vào ROI có thể thấy các giải pháp tích hợp hấp dẫn do vòng đời dài hơn của chúng.
Thị trường SaaS trong nước đã từng phải đối mặt với những thách thức như yêu cầu tùy chỉnh cao, các sản phẩm chung chung và đồng nhất, cạnh tranh gay gắt, chiến lược định giá thấp và tập trung vào kiếm tiền ngắn hạn. Khách hàng trong thị trường này thường có mức độ số hóa thấp và sẵn sàng trả tiền hạn chế.
Ngược lại, thị trường SaaS quốc tế nhấn mạnh tính chuyên môn, với các công ty tập trung vào các lĩnh vực cụ thể và cung cấp các dịch vụ chuyên sâu cho các khách hàng lớn và vừa với mức độ sẵn sàng trả tiền lớn hơn.
Lĩnh vực mô hình lớn phản ánh những xu hướng này. Các sự kiện gần đây trên thị trường SaaS quốc tế chứng minh điều này:
- Vào tháng 2 năm 2025, MongoDB đã mua lại Voyage AI, một startup AI 17 tháng tuổi tập trung vào các mô hình nhúng và xếp hạng lại, với giá 220 triệu đô la.
- Vào năm 2024, Amazon đã công bố một thỏa thuận cấp phép công nghệ với Adept, một startup Đại lý AI hai năm tuổi, với một số thành viên Adept gia nhập nhóm AGI của Amazon.
Những startup này đã đạt được thành công bằng cách tập trung vào một niche cụ thể trong công nghệ mô hình lớn. Những ví dụ như vậy rất hiếm ở Trung Quốc. Nhiều doanh nghiệp vừa và nhỏ phải liên tục cảnh giác chống lại việc các công ty lớn hơn tham gia vào không gian của họ.
Wang Wenguang, rút ra từ kinh nghiệm sâu rộng của mình trong thị trường B2B, đã mô tả thực tế khắc nghiệt của nó. Ông lưu ý rằng mặc dù có một thị trường lớn cho các nền tảng một cửa, nhưng nó bị phân mảnh. Các công ty nhỏ hơn với chi phí hoạt động thấp hơn có thể cung cấp giá cả cạnh tranh, cắt giảm các công ty lớn hơn. Điều này làm giảm giá của các dịch vụ ứng dụng. Ngay cả các công ty lớn cũng phải đối mặt với sự cạnh tranh từ các startup khác và các nhà tích hợp truyền thống. Các công ty lớn có thể có các mô hình lớn và lợi thế thương hiệu của riêng họ, nhưng họ phải đối mặt với các chiến lược kinh doanh B2B tương tự.
Như Wang đã nói, ‘Tôi cũng đang sử dụng DeepSeek, và rất nhiều công ty khác đang sử dụng DeepSeek, vì vậy không có sự khác biệt. Có rất nhiều nhà cung cấp đám mây ở Trung Quốc, vì vậy sẽ có ít nhất rất nhiều đối thủ cạnh tranh. Thị trường B2B trong nước luôn như thế này; để tồn tại, bạn phải có các mối quan hệ mạnh mẽ, dịch vụ tốt hoặc giá thấp.’
Liang He đã đưa ra một đánh giá ngắn gọn về các lựa chọn hiện tại và triển vọng tương lai của 01.AI:
- Quyết định của Li Kaifu để chuyển hoàn toàn hoạt động kinh doanh của 01.AI sang các ứng dụng B2B và quảng bá một nền tảng mô hình lớn doanh nghiệp một cửa là hợp lý về mặt thương mại nhưng sẽ dẫn đến sự cạnh tranh gay gắt.
- Nhu cầu của 01.AI phải cung cấp các sản phẩm mô hình lớn giá thấp hơn so với các công ty lớn hơn là kết quả của việc thiếu các lợi thế độc đáo ở lớp ứng dụng.
- Động thái của 01.AI sang B2B báo hiệu sự mất trí tưởng tượng và các dự án ít ‘gợi cảm’ hơn. Điều này tương tự như số phận của nhiều công ty thị giác máy tính từ làn sóng AI trước đó vào năm 2017.
- 01.AI có thể có cơ hội nếu nó khám phá các thị trường nước ngoài.
So với 01.AI, ý kiến về tương lai của Baichuan ít bi quan hơn.
Tuy nhiên, việc Baichuan tham gia vào lĩnh vực y tế thiếu các lợi thế độc đáo, đặc biệt là về dữ liệu.
Jiang Shao nói rằng việc Baichuan chuyển sang y tế chỉ đơn giản là một cách để tồn tại. Tuy nhiên, so với 01.AI, Baichuan ít nhất đang cố gắng tham gia vào một thị trường ngách.
Zhang Sensen nói rằng cô lạc quan hơn về các công ty có dữ liệu y tế phát triển các mô hình lớn y tế hơn là các công ty công nghệ. Điều này áp dụng cho bất kỳ công ty nào tìm cách tạo ra một mô hình lớn dành riêng cho ngành. Thách thức chính trong việc tạo ra các mô hình lớn y tế nằm ở dữ liệu, không phải bản thân mô hình. Có nhiều bệnh viện xuất sắc ở Trung Quốc có thể tinh chỉnh một mô hình lớn bằng DeepSeek để sử dụng riêng.
Làm thế nào để có được dữ liệu y tế một cách hiệu quả? Jiang Shao nói rằng các startup công nghệ AI thiếu lợi thế về dữ liệu. Để tạo ra các mô hình lớn y tế, họ có thể cần hợp tác với các công ty đã cung cấp dịch vụ CNTT cho các bệnh viện.
Được biết, một trong những ‘Tiểu Hổ’ đã hợp tác độc quyền với một diễn đàn trao đổi bác sĩ lớn trong nước để đào tạo các mô hình sử dụng số lượng lớn các trường hợp được tạo ra từ các cuộc trao đổi bác sĩ.
Ngoài một triển vọng lạc quan hơn về các thị trường ngách, các chuyên gia trong ngành có hy vọng cho người sáng lập Baichuan, Wang Xiaochuan.
Liang He tin rằng liệu Wang Xiaochuan có thành công trong việc chuyên về y học hay không phụ thuộc vào việc anh ta muốn theo đuổi một lý tưởng hay kiếm tiền. Anh tin rằng Wang có xu hướng theo đuổi một lý tưởng hơn, tạo ra các kết quả nghiên cứu AI y tế đột phá.
Wang Wenguang nhấn mạnh bản chất lỗi thời của thị trường này. Ông nói rằng nếu mục tiêu là thương mại hóa ngắn hạn, thì lĩnh vực y tế cũng có tính cạnh tranh cao, tương tự như thị trường B2B nói chung. Nhiều công ty có thể sử dụng đồ thị tri thức, tìm kiếm vector và các mô hình lớn cho các ứng dụng y tế.
Theo các cuộc thảo luận của Zhiwei với các chuyên gia AI y tế, bản thân nghiên cứu y tế có những khoảng trống kiến thức đáng kể và kiến thức mới đang phát triển nhanh chóng. Do đó, có tiềm năng đáng kể để sử dụng các mô hình lớn để tiến hành nghiên cứu cơ bản về y tế. Ví dụ, mô hình AlphaFold để dự đoán cấu trúc protein đã được hơn 1,8 triệu nhà khoa học trên toàn thế giới sử dụng để tăng tốc nghiên cứu, bao gồm phát triển các vật liệu tái tạo sinh học và thúc đẩy nghiên cứu di truyền, theo Meis Medical.
Ngoài việc theo đuổi một lý tưởng hoặc kiếm tiền, startup AI y tế cũng phải đối mặt với câu hỏi có nên tạo ra một mô hình lớn y tế chung hay không.
Zhang Sensen nói rằng chưa có một bước đột phá nào trong các mô hình lớn y tế chung trên thị trường trong nước, chủ yếu là do sự phụ thuộc vào các thiết bị y tế mạnh mẽ để thu thập và ứng dụng dữ liệu quy mô lớn. Nhiều cơ sở y tế ở Trung Quốc chưa được phổ biến rộng rãi, khiến AI khó thực hiện chẩn đoán chính xác. Tuy nhiên, một số bệnh viện mạnh, chẳng hạn như Mayo Clinic, đã bắt đầu khám phá việc tung ra các mô hình lớn của riêng họ. Mặc dù khó có thể thấy các cơ hội kiếm lợi nhuận trong ngắn hạn, nhưng những loại mô hình lớn này có thể có tác động sâu sắc đến ngành y tế trong dài hạn.
Ngành y tế cũng phải đối mặt với thách thức chẩn đoán hoàn toàn tự động, đặc biệt là trên thị trường trong nước, nơi thiết bị không đầy đủ và AI không thể thay thế hoàn toàn các phương pháp chẩn đoán truyền thống. Việc thiếu thiết bị y tế lan rộng, đặc biệt là ở các vùng sâu vùng xa, gây khó khăn cho việc bao phủ hoàn toàn công nghệ y tế, vì vậy chẩn đoán hoàn toàn tự động vẫn là một thách thức đáng kể.
Ngành y tế có các yêu cầu cấp phép và tuân thủ nghiêm ngặt, và các mô hình lớn phải giải quyết các vấn đề tuân thủ khi tham gia vào lĩnh vực y tế. Các dịch vụ y tế C-end trong tương lai có thể kết hợp các kỹ thuật của bác sĩ và AI để cải thiện hiệu quả chẩn đoán và điều trị, đặc biệt là cho các thế hệ trẻ.
Cuối cùng, ngay cả khi bỏ qua các đặc điểm của thị trường B2B trong nước, sự cạnh tranh trong các ứng dụng mô hình lớn gây khó khăn cho việc tồn tại trong thị trường To B. Wang Wenguang nói rằng trong khi các mô hình thiết kế cho các sản phẩm mô hình lớn To B vẫn đang được khám phá, chúng cuối cùng sẽ hội tụ. Điều này đúng không chỉ ở Trung Quốc mà còn ở các công ty công nghệ Thung lũng Silicon như OpenAI, Anthropic và Google. Miễn là không có sự khác biệt đáng kể nào về hiệu suất của chính các mô hình, thì không thể kiếm tiền trên thị trường này và cuối cùng mọi người sẽ ở cùng một cấp độ.
Đây là lý do tại sao DeepSeek R1 có tác động lớn nhất không phải ở Trung Quốc mà ở nước ngoài, đặc biệt là đối với các công ty công nghệ Thung lũng Silicon. Thị trường chứng khoán Hoa Kỳ bắt đầu trải qua sự biến động cao và sau đó giảm sau khi phát hành R1. Logic cốt lõi rất đơn giản: Các mô hình lớn của Thung lũng Silicon đã bị Trung Quốc bắt kịp. Mặc dù không vượt qua chúng, nhưng việc không thể nới rộng khoảng cách đã khiến không thể hỗ trợ các định giá cao như vậy, dẫn đến sự sụt giảm giá cổ phiếu.
Tất nhiên, có một cách khác để thị trường To B thu hút khách hàng: mã nguồn mở. Các mô hình lợi nhuận chính cho mã nguồn mở bao gồm cung cấp các chức năng cấp trả phí, lưu trữ đám mây và các dịch vụ giá trị gia tăng như tư vấn và đào tạo cấp doanh nghiệp dựa trên công nghệ mã nguồn mở.
Hiệu ứng trực tiếp nhất của các mô hình lớn mã nguồn mở là thúc đẩy sự phổ biến của công nghệ. Zhang Sensen nói rằng mã nguồn mở của DeepSeek đã tăng tốc đáng kể việc áp dụng các mô hình lớn của các công ty. Ban quản lý cấp cao rất ủng hộ việc áp dụng các mô hình lớn. Khi các mô hình lớn hoạt động tốt trong các ứng dụng thực tế, đặc biệt là trong việc giảm can thiệp của con người và tăng hiệu quả, sự hỗ trợ sẽ tiếp tục tăng.
Ngành tài chính, với tư cách là ngành có chất lượng dữ liệu tốt nhất, luôn có sự tích lũy kỹ thuật phong phú trong AI và có thể nhanh chóng theo kịp. Bất kể DeepSeek, tài chính sẽ triển khai công nghệ AI. Tuy nhiên, với DeepSeek, AI sẽ không chỉ cho phép các hoạt động kinh doanh cốt lõi của ngành tài chính mà còn được sử dụng trong các nhiệm vụ và hoạt động văn phòng hàng ngày mà trước đây rất khó thực hiện.
Các hoạt động trước đây rất tốn kém. Ví dụ, phân tích nguyên nhân gốc rễ trước đây yêu cầu giám sát hoạt động truyền thống và AIOps, cũng như đào tạo các mô hình nhỏ. Giờ đây, DeepSeek có thể được sử dụng kết hợp với cơ sở kiến thức để tạo ra các kế hoạch ứng dụng để xử lý giám sát, báo động, phân tích tự phục vụ và khả năng truy xuất nguồn gốc, xử lý tự động và cải thiện độ ổn định, linh hoạt hơn AIOps.
Ngoài ra, phạm vi phủ sóng của AI đối với các hoạt động đã trở nên rộng hơn, với sự cân nhắc lớn hơn cho tính tương tác và chủ động. Chủ động có nghĩa là cho phép AI chủ động thực hiện các hoạt động. Chuyển từ việc dựa vào các quy tắc, con người hoặc thậm chí kinh nghiệm cá nhân, nơi mức độ kinh nghiệm của con người quyết định mức độ khả năng hoạt động, các mô hình AI nhẹ hơn giờ đây có thể được sử dụng để đạt được điều này trực tiếp.
Mặc dù tỷ lệ ảo giác của DeepSeek vẫn còn cao, thậm chí không khác biệt đáng kể so với các mô hình tương tự khác, nhưng khả năng lý luận và ứng dụng thực tế của nó có thể bù đắp những ảnh hưởng tiêu cực của ảo giác. Vấn đề này sẽ dần được cải thiện thông qua tinh chỉnh và tối ưu hóa bằng cách sử dụng RAG và các công nghệ liên quan khác.
Chuyên gia công nghệ mô hình lớn của Alibaba, Gao Peng, tin rằng tác động của DeepSeek khác nhau đối với các công ty lớn và nhỏ:
Các mô hình lớn được sử dụng nội bộ bởi Alibaba luôn là những mô hình tiên tiến nhất trong ngành, vì vậy sự xuất hiện của DeepSeek không có tác động đáng kể. Alibaba sử dụng DeepSeek để đánh giá hiệu suất và so sánh, cung cấp nhiều cảm hứng kỹ thuật hơn. Việc triển khai DeepSeek trong Lý luận tương đối nhanh và các chi tiết kỹ thuật phổ biến hơn. DeepSeek cũng đã bị ảnh hưởng bởi Qianwen.
Ngược lại, DeepSeek có tác động lớn hơn đến các công ty vừa và nhỏ, vì trước đây không có mô hình nào có thể đạt được hiệu quả của DeepSeek trong khi cung cấp triển khai riêng tư, chi phí thấp. Sau khi DeepSeek được phát hành, nhiều công ty bán máy tích hợp DeepSeek đã xuất hiện. Tuy nhiên, DeepSeek không phải là rẻ nhất so với nhiều máy tích hợp mô hình mã nguồn mở, tùy thuộc vào các tiêu chuẩn cụ thể.
Trong mọi trường hợp, mô hình lớn mã nguồn mở trong nước hiện đang phát triển mạnh mẽ và có thể cạnh tranh trên toàn cầu. Tuy nhiên, dựa trên việc Ping An Insurance triển khai các mô hình lớn, Zhang Sensen tin rằng các mô hình lớn mã nguồn mở vẫn có những hạn chế không thể vượt qua:
Đối với chúng tôi, DeepSeek chủ yếu có lợi thế chi phí rất lớn. Về khả năng, nó có thể tốt hơn các mô hình khác trong các kịch bản hoạt động về lý luận, khả năng khái quát hóa và hiểu ngữ cảnh. Tuy nhiên, DeepSeek không hoạt động tốt trong các kịch bản phức tạp hơn như kiểm soát rủi ro tài chính. Điều này là do cần phải tinh chỉnh chi tiết hơn hoặc thậm chí tối ưu hóa kết hợp với các mô hình khác. Do đó, cần phải tinh chỉnh mục tiêu dựa trên các kịch bản ứng dụng cụ thể để cải thiện hơn nữa hiệu suất mô hình.
Các mô hình lớn tự phát triển của Ping An được chia thành hai lớp: mô hình lớn nền tảng cơ bản và các mô hình miền chịu trách nhiệm cho các hoạt động ngân hàng, bảo hiểm và các hoạt động kinh doanh khác. Các mô hình lớn được sử dụng nội bộ hoạt động tốt hơn DeepSeek trong lĩnh vực kiến thức chuyên môn, đặc biệt là trong các lĩnh vực cụ thể như tài chính và y học, nơi các mô hình chính xác hơn. Tuy nhiên, DeepSeek vẫn có một lợi thế mạnh mẽ về khả năng lý luận. Trong một số kịch bản, chúng tôi muốn sử dụng DeepSeek cho một nỗ lực quy mô nhỏ để xem liệu nó có thể được chạy hay không.
Không có sự khác biệt đáng kể giữa Alibaba Qianwen, Baidu Wenxin và Zhipu ChatGLM và DeepSeek về mặt này. Sự phán xét dựa trên thực tế là các mô hình này không có sự khác biệt đáng kể so với DeepSeek về khả năng lý luận và cấu trúc cơ sở kiến thức.
Nhìn chung, tác động của các mô hình lớn mã nguồn mở hiện đang bị hạn chế và tốc độ cạnh tranh giữa chúng rất gay gắt.
Những Hiểm Nguy của Thị Trường To C
Trong khi sự cạnh tranh khốc liệt trên thị trường To B, điều này không có nghĩa là tuyến đường To C mang lại nhiều hy vọng hơn.
Sự cạnh tranh trên thị trường To C cho các mô hình lớn cũng rất khốc liệt, nhưng nó rất khác với thị trường To B.
Bức tranh toàn cảnh thị trường liên tục thay đổi.
Việc kiếm tiền từ To C rất khó khăn.
Các ứng dụng phổ biến nhất không nhất thiết tạo ra doanh thu cao nhất. Ví dụ, ChatGPT có doanh thu cao nhất, nhưng OpenAI vẫn lỗ 5 tỷ đô la một năm, trong khi nhiều ứng dụng ‘bắt chước’ ChatGPT có khả năng đạt được lợi nhuận nhanh chóng; sau khi DeepSeek trở nên phổ biến, những kẻ bắt chước và làm giả đã xuất hiện hàng loạt.
Quan sát tình hình của ‘Tiểu Hổ’ từ thị trường C-end cũng không lạc quan. Giao tiếp của Zhiwei với các chuyên gia trong ngành thường tin rằng các nhà sản xuất lớn sẽ mang lại áp lực sống còn lớn.
Jiang Shao nói rằng người hoạt động tốt nhất trong ‘Tiểu Hổ’ trên thị trường tiêu dùng là Kimi của Moonshot AI. Nhưng bây giờ, Yuanbao của Tencent đứng đầu tiên, DeepSeek đứng thứ hai và Doubao đứng thứ ba. Ba công ty hàng đầu gần như chiếm phần lớn thị phần. Yuanbao của Tencent đã đạt được một lượng lớn lưu lượng truy cập khách hàng với sự giúp đỡ của hệ sinh thái WeChat, trong khi DeepSeek đã nổi bật với sự đổi mới công nghệ và hiệu suất tuyệt vời trong nhiều kịch bản.
Liang He nói rằng công nghệ mô hình lớn của Kimi không khác nhiều so với các đối thủ cạnh tranh của nó, vì vậy nó chỉ có thể miễn phí, điều này gây rất nhiều khó khăn cho Moonshot để thương mại hóa. Là một ứng dụng To C, không rõ nó khác với Yuanbao và Doubao ở đâu. Hơn nữa, Doubao có thể được hỗ trợ bởi các hoạt động kinh doanh khác của Byte và Yuanbao có thể được hỗ trợ bởi các hoạt động kinh doanh khác của Tencent. Họ có thể đầu tư 100 tỷ để hỗ trợ các ứng dụng này.
Jiang Shao nói thêm rằng người dùng C-end quan tâm nhiều hơn đến tính dễ sử dụng của sản phẩm, điều mà Tencent và Byte giỏi hơn. Tất nhiên, Alibaba cũng có cơ hội. Alibaba đang ươm tạo một ứng dụng có tên ‘AI Listening’, sử dụng AI để trò chuyện và tương tác, nhằm mục đích thay thế Douyin trên nền tảng video ngắn. Mặc dù Douyin thu hút một số lượng lớn người sáng tạo để tạo ra nội dung chất lượng cao, nhưng các ứng dụng trò chuyện AI có tiềm năng thu hút các nhóm người dùng bằng cách cung cấp trải nghiệm cá nhân hóa và tương tác hơn. Sự khác biệt giữa hai nằm ở việc tạo nội dung và tương tác. Nếu Alibaba có thể đột phá điều này, nó cũng có cơ hội lật ngược tình thế, nhưng khó có thể nói liệu Tencent có làm theo hay không.
Về MiniMax, ý kiến của ngành hơi khác nhau.
Liang He tin rằng Conch AI của MiniMax hiện đang tạo ra lợi nhuận tốt. Nó đã tìm thấy con đường riêng của mình, nhưng vẫn chưa biết liệu con đường này có cho phép MiniMax tăng định giá của nó đủ hay không. Do định hướng ứng dụng của nó, MiniMax thoải mái hơn sau khi DeepSeek ra mắt. Nếu họ sử dụng các mô hình của DeepSeek, nó sẽ tiết kiệm chi phí nghiên cứu và phát triển của mô hình và các ứng dụng của nó có thể tiếp tục kiếm tiền, thậm chí nhiều hơn.
Jiang Shao tin rằng MiniMax có cơ hội nếu nó có thể tạo ra một ỨNG DỤNG phổ biến sau này, nhưng Alibaba có thể vượt quá nó và tạo ra một ỨNG DỤNG phổ biến trước, vì vậy ngay cả khi MiniMax có cơ hội, xác suất không cao.
Cuối cùng, sự khác biệt của sản phẩm vẫn là điểm đột phá cho các ứng dụng C-end.
Theo báo cáo mới nhất của a16z ‘100 Ứng Dụng Tiêu Dùng Gen AI Hàng Đầu’, nhiều ứng dụng sử dụng ít thực sự đạt được doanh thu tốt hơn. Một số sản phẩm có tính linh hoạt kém, chẳng hạn như nhận dạng thực vật và dinh dưỡng, thu hút người dùng trả tiền nhiều hơn các sản phẩm chung.
Rất khó để phân biệt các sản phẩm AI chung. Người dùng có ít sẵn sàng trả tiền, chu kỳ lợi nhuận dài, vì vậy họ không thể sống sót qua các công ty lớn.
Và nếu sự khác biệt không đủ sâu theo chiều dọc, nó cũng dễ dàng được nội bộ hóa bởi mô hình lớn cơ sở thông qua nâng cấp dung lượng. Ví dụ, khả năng tạo hình ảnh gần đây của GPT-4o đã mang lại một đòn giảm chiều đối với các start-up chuyển văn bản thành hình ảnh như Midjourney. Khả năng phủ sóng này thường ngẫu nhiên và không thể đoán trước, như người ta thường nói, ‘Phá hủy bạn không liên quan gì đến bạn.’
Việc bắt chước các đối thủ cạnh tranh ở cấp độ pixel và nâng cấp nhanh chóng các mô hình lớn cơ sở khiến phong cảnh của các start-up AI C-end gần như luôn được duy trì chỉ trong một thời gian ngắn.
Về cách nắm bắt xác suất cực kỳ thấp để trở thành một hit, các chuyên gia trong ngành nhất trí tin rằng ‘về cơ bản không có kinh nghiệm nào để làm theo.’
‘Tiểu Hổ’ đã bước vào tình cảnh ngày nay, phần lớn là do họ đã đầu tư quá nhiều vào mô hình lớn cơ sở và đánh giá thấp nguồn nhân lực, nguồn tài chính và nguồn lực vật chất cần thiết để tồn tại và vượt trội trong lĩnh vực này, dẫn đến việc khó phân biệt trên con đường ứng dụng.
Giờ đây, ‘Tiểu Hổ’ ngày càng ít quyết tâm tấn công AGI và Li Kaifu đã tuyên bố công khai rằng chỉ có DeepSeek, Ali và Byte sẽ còn lại trong mô hình lớn cơ sở trong nước.
Về vấn đề này, các chuyên gia trong ngành đã liên lạc với Zhiwei về cơ bản đồng ý với quan điểm này.
Jiang Shao nói rằng các start-up AI vẫn đang tiếp tục nỗ lực vào công nghệ mô hình lớn về cơ bản phải chết. Hứa hẹn nhất chắc chắn là DeepSeek, thứ hai là Alibaba và thứ ba là ByteDance. Vị trí đầu tiên dự kiến sẽ nhận được 50%-80% lưu lượng truy cập và hai vị trí sau có thể nhận được 10% lưu lượng truy cập. Cốt lõi nằm ở việc ai tạo ra AGI trước và ai là người chiến thắng cuối cùng.
DeepSeek hiện là cạnh tranh nhất trong lĩnh vực mô hình lớn và sự đổi mới công nghệ và hiệu suất của nó trong các ứng dụng thực tế là hoàn hảo. Alibaba và ByteDance cũng có khả năng cạnh tranh mạnh mẽ, đặc biệt là trong các ứng dụng đa nền tảng và tài nguyên dữ liệu. Xếp hạng chủ yếu dựa trên khả năng đổi mới của mỗi công ty trong công nghệ cơ bản, sức mạnh tính toán, tài nguyên dữ liệu và ứng dụng thực tế.
Các nhóm Zhipu và Kimi tin chắc rằng tiếp tục tăng cường khả năng của mô hình cơ sở là tương lai. Ngược lại, tôi tin rằng với những thay đổi trong nhu cầu thị trường và sự đa dạng hóa các kịch bản ứng dụng, lộ trình chỉ đơn giản là tăng cường mô hình cơ sở có thể bị hạn chế và các con đường phát triển mô hình linh hoạt và thích ứng hơn có thể cạnh tranh hơn trên thị trường.
Sự cạnh tranh trong công nghệ mô hình lớn là cực kỳ khốc liệt và các công ty có khoản đầu tư khổng lồ cuối cùng phải có những đột phá rõ ràng về đổi mới, sức mạnh tính toán, dữliệu và tối ưu hóa để duy trì khả năng cạnh tranh. Các công ty khác không theo kịp tiến bộ công nghệ hoặc không thể đối phó với nhu cầu thị trường sẽ dần bị loại bỏ.
Liang He nói rằng chỉ có DeepSeek, Ali và Byte sẽ còn lại trong công ty mô hình lớn cơ sở trong nước trong tương lai, dựa trên thực tế là ba công ty này có sức mạnh và quyết tâm đầu tư các nguồn lực siêu việt vào nghiên cứu và phát triển. Đối với Byte, không thể bỏ lỡ cơ hội cho các mô hình lớn, nếu không nó sẽ có tác động lớn đến tổng thể của nó. Và công nghệ của DeepSeek sẽ không có quá nhiều rào cản đối với Byte, nhưng DeepSeek hiện có lợi thế lớn hơn về hiệu quả R&D. Mô hình mã nguồn mở Qianwen của Alibaba tự nó ở mức độ cao. Trước khi DeepSeek trở nên phổ biến, Qianwen và Llama về cơ bản đuổi nhau. Đối với Alibaba, mô hình Qianwen có thể không kiếm được tiền, nhưng các hoạt động kinh doanh đám mây liên quan có thể kiếm được tiền và Byte cũng tương tự và có thể tiếp tục sử dụng công nghệ mô hình lớn để liên tục tối ưu hóa trải nghiệm của Douyin và các Ứng dụng khác. Đối với các start-up AI, nếu bản thân mô hình không kiếm được tiền, nó sẽ chạm vào gốc rễ của sự sống còn.
Wang Wenguang nói rằng lợi thế của DeepSeek chủ yếu nằm ở chủ nghĩa lý tưởng công nghệ. Trong vòng hai hoặc ba tháng trước và sau Lễ hội mùa xuân, lưu lượng truy cập của DeepSeek là rất lớn. Nếu nó muốn thương mại hóa, nó sẽ sớm đạt đến đỉnh cao trên thế giới và các mô hình lớn khác như Doubao sẽ không có cơ hội nào cả. Miễn là DeepSeek không mở mã nguồn các phương pháp tối ưu hóa liên quan đến cơ sở hạ tầng trong tuần mã nguồn mở gần đây, nó có thể dựa vào điều này để kiếm tiền trong tương lai, để những người khác không có cơ hội nào cả. DeepSeek chưa được tài trợ và không cần phải bị ảnh hưởng bởi các nhà đầu tư. Chủ nghĩa lý tưởng công nghệ và tài năng là những rào cản lớn nhất. So với OpenAI, kết quả mà OpenAI có thể thấy bây giờ về cơ bản là kết quả nghiên cứu trước tranh chấp giữa Altman và Ilya xảy ra. Ít nhất các điểm đổi mới đã được xác định. Giờ đây, sau sự ra đi của nhóm những người theo chủ nghĩa lý tưởng ban đầu, bản thân OpenAI hầu như không có sự đổi mới nào. Hiện tại, sự đổi mới của OpenAI tập trung nhiều hơn ở cấp độ ứng dụng, chẳng hạn như Deep Research. Không có rào cản nào đối với sự đổi mới ở cấp độ ứng dụng, vì vậy nó phải cạnh tranh với các đối thủ cạnh tranh.
Wang Mu, một chuyên gia công nghệ AI nhà máy lớn, nói với Zhiwei rằng trừ khi có tiền, tài năng và phần cứng, không cần lãng phí nỗ lực vào việc đào tạo trước các mô hình lớn. DeepSeek đã có một cụm 10.000 thẻ ngay từ năm 2021 và không thiếu tiền. Ngược lại, các công ty vừa và nhỏ khác khó có thể tập hợp điều kiện này.
Gao Peng nói rằng các start-up AI muốn tồn tại, họ vẫn phải chuyển sang các ứng dụng. Tôi đã nghĩ như vậy một hoặc hai năm trước và bây giờ có thể quá muộn để chuyển. Lô công ty AI đầu tiên bị loại bỏ tiếp theo sẽ là những công ty tạo ra các mô hình lớn cơ sở. Đào tạo mô hình lớn thực sự có rất nhiều chi tiết phức tạp và rất phụ thuộc vào sự tích lũy kinh nghiệm. Các chi tiết bên trong của kiến trúc Transformer nói chung được hiểu rõ, nhưng các bài báo về các mô hình mã nguồn mở hoặc đóng về cơ bản không cho bạn biết cách chuẩn bị dữ liệu, chi tiết dữ liệu là gì, quy mô dữ liệu lớn như thế nào và chất lượng dữ liệu tốt như thế nào. Không có tiêu chuẩn thống nhất trong ngành.
Mã nguồn mở mở một nửa luôn là một thông lệ điển hình trong lĩnh vực mô hình lớn. Hiện tại, có rất ít mô hình lớn sẽ tiết lộ đầy đủ mã, trọng số, bộ dữ liệu và quy trình đào tạo. Những cái nổi tiếng hơn là OLMo, BLOOM, v.v.
Tuy nhiên, ngay cả khi chuyển sang các ứng dụng có thể tồn tại? Từ phân tích trước đó về lĩnh vực To B và lĩnh vực To C, gần như khó để các start-up AI hình thành các rào cản ngành riêng của họ trong các ứng dụng. Về vấn đề này, Gao Peng nói rằng chìa khóa để hình thành các rào cản ngành riêng của bạn nằm ở việc bạn có dữ liệu gì. Các mô hình có thể được sử dụng bởi bất kỳ ai. Dữ liệu được chia thành hai khía cạnh: một là kinh nghiệm lĩnh vực của doanh nhân và hai là dữ liệu trong tay.
Từ góc độ văn hóa doanh nghiệp, Gao Peng tin rằng nghiên cứu và phát triển các mô hình lớn cơ sở đòi hỏi một tinh thần làm việc chăm chỉ thử nghiệm và kỹ thuật. ‘Trong một thời gian dài trước đây, nhiều start-up AI trong nước đã quá ồn ào. Khi làm công nghệ, bạn nên làm trước một cách kín đáo và sau đó quảng bá nó một cách ồn ào. Một số nhóm được cấu tạo nhiều hơn từ giới học thuật, nhưng những người trong giới học thuật đôi khi nghiên cứu công nghệ quá lý thuyết. Về mặt tài năng hoặc đội ngũ, sự thành công của một đội ngũ mô hình lớn chủ yếu phụ thuộc vào việc ông chủ có hiểu các mô hình lớn hay không. Nếu ông chủ không hiểu công nghệ mô hình lớn hoặc không có niềm tin để kiên trì, vì nó không kiếm được tiền, nó sẽ không hoạt động gì cả. Thành công của DeepSeek dựa nhiều hơn vào một chế độ tổ chức từ trên xuống. Ông chủ hiểu rất