Cuộc đua AI: Mỹ đối mặt thách thức từ startup Trung Quốc DeepSeek
Trong bối cảnh cạnh tranh khốc liệt về trí tuệ nhân tạo (AI), một câu chuyện “David đấu Goliath” đang diễn ra. Mỹ, với dự án “Stargate” đầy tham vọng và khoản đầu tư khổng lồ 500 tỷ đô la, đang nỗ lực củng cố vị thế dẫn đầu toàn cầu về AI. Nỗ lực to lớn này, được hỗ trợ bởi các gã khổng lồ công nghệ, nhằm mục đích thiết lập một mạng lưới các trung tâm dữ liệu tiên tiến trên khắp đất nước. Tuy nhiên, một startup nhanh nhẹn của Trung Quốc, hoạt động với ngân sách mà một số người có thể gọi là “trò đùa”, đã nổi lên như một đối thủ đáng gờm, phủ bóng lên tham vọng của Mỹ.
DeepSeek, một công ty có trụ sở tại Hàng Châu, gần đây đã công bố một loạt các mô hình AI mã nguồn mở không chỉ ngang bằng mà trong một số trường hợp còn vượt trội so với hiệu suất của các mô hình OpenAI. Hơn nữa, họ đã đạt được điều này với hiệu quả đáng kể và với chi phí thấp hơn nhiều. Sự phát triển này đã gây ra những làn sóng trong cộng đồng AI, đặt ra câu hỏi về tính hiệu quả của chiến lược của Mỹ và tương lai của sự thống trị AI.
Sự trỗi dậy của DeepSeek: Một thách thức mới trong lĩnh vực AI
Bối cảnh AI hiện đang bị chi phối bởi một số công ty lớn, chủ yếu có trụ sở tại Mỹ. Các công ty này, với nguồn tài trợ và tài nguyên dồi dào, đã đi đầu trong đổi mới AI, phát triển các mô hình mạnh mẽ hỗ trợ nhiều ứng dụng. Tuy nhiên, sự xuất hiện của DeepSeek báo hiệu một sự thay đổi tiềm năng trong động lực này, chứng minh rằng AI đột phá có thể được phát triển với nguồn lực ít hơn đáng kể.
Mô hình R1 của DeepSeek, được phát hành vào đầu tuần này, là một ví dụ điển hình về sự gián đoạn này. Theo công ty, mô hình này ngang bằng và thậm chí vượt quá hiệu suất của mô hình o1 của OpenAI, được phát hành vào năm ngoái và được thiết kế để giải quyết các vấn đề lý luận và toán học phức tạp. Thực tế là mô hình của DeepSeek là mã nguồn mở và có sẵn cho công chúng càng khuếch đại tác động của nó, cho phép các nhà nghiên cứu và nhà phát triển trên toàn thế giới tận dụng các khả năng của nó. Các nhà phê bình đã ca ngợi khả năng của mô hình R1 trong việc xử lý các tác vụ như mã hóa và lý luận, đặt nó vào sự cạnh tranh trực tiếp với các mô hình tiên tiến nhất trên thị trường.
Thành tựu này càng đáng chú ý hơn khi xem xét các nguồn lực mà DeepSeek có trong tay. Mô hình ngôn ngữ lớn V3 của công ty, được công bố vào tháng 12, được cho là đã được đào tạo chỉ với 5,6 triệu đô la giá trị sức mạnh tính toán. Đây là một sự tương phản rõ rệt so với hơn 100 triệu đô la được cho là đã được sử dụng để đào tạo GPT-4 của OpenAI. Mô hình V3 của DeepSeek đã được so sánh với các mô hình từ OpenAI và Anthropic, với DeepSeek tuyên bố ngang bằng về hiệu suất. Andrej Karpathy, một nhà nghiên cứu AI nổi tiếng, người trước đây làm việc tại Tesla và OpenAI, đã mô tả khả năng đào tạo AI tiên tiến của DeepSeek với “ngân sách trò đùa” là rất ấn tượng.
Yếu tố thành công của DeepSeek
Sự trỗi dậy của DeepSeek trong lĩnh vực AI cạnh tranh của Trung Quốc không phải là ngẫu nhiên. Người sáng lập 40 tuổi của công ty, Liang Wenfeng, gần đây đã gặp Thủ tướng Trung Quốc Lý Cường, nhấn mạnh tầm quan trọng của những thành tựu của DeepSeek trong nước. Cuộc họp này, có sự tham dự của các chuyên gia hàng đầu trong ngành khác, làm nổi bật cam kết của Trung Quốc trong việc thúc đẩy đổi mới công nghệ và tham vọng của mình trong lĩnh vực AI. Thành công của DeepSeek là minh chứng cho sự khéo léo và tháo vát của lĩnh vực công nghệ Trung Quốc, thể hiện khả năng cạnh tranh trên trường quốc tế mặc dù phải đối mặt với các hạn chế về tiếp cận một số công nghệ nhất định.
Nguồn gốc của DeepSeek bắt nguồn từ HighFlyer, một quỹ phòng hộ định lượng của Trung Quốc quản lý khoảng 1,4 tỷ đô la tài sản vào năm 2019. HighFlyer đã tách DeepSeek vào năm 2023, thành lập nó như một startup AI chuyên dụng tập trung vào phát triển mô hình và tạo ra sản phẩm AI. Liang Wenfeng, người có nền tảng về AI từ Đại học Chiết Giang, đồng sáng lập HighFlyer và tận dụng các nguồn lực tài chính của nó để mua hàng nghìn chip AI Nvidia trước khi Mỹ áp đặt các hạn chế vào năm 2022. Động thái chiến lược này đã mang lại cho DeepSeek một lợi thế đáng kể so với các startup AI khác, cho phép nó tiếp tục nghiên cứu và phát triển trong khi những người khác phải vật lộn để đảm bảo sức mạnh xử lý.
Hiệu suất và công nghệ của DeepSeek
Mặc dù các chuyên gia có ý kiến khác nhau về hiệu suất của DeepSeek so với ChatGPT của OpenAI và Claude của Anthropic, nhưng sự đồng thuận chung là các mô hình của DeepSeek hoạt động đặc biệt tốt trong các cấu hình phần cứng cụ thể. Tuy nhiên, chúng có thể gặp phải những thách thức trong các tình huống khác.
DeepSeek tập trung vào việc cải thiện hiệu quả và giảm chi phí, điều này thể hiện rõ trong mô hình “hỗn hợp các chuyên gia” sáng tạo của nó. Mô hình này sử dụng các phần khác nhau của AI để xử lý các câu hỏi cụ thể, tối ưu hóa hiệu suất và sử dụng tài nguyên. Một điểm khác biệt chính khác của các mô hình DeepSeek là bản chất mã nguồn mở của chúng, cho phép sử dụng trên các nền tảng phần cứng đa dạng. Quan trọng hơn, các mô hình của DeepSeek cung cấp tính minh bạch, tiết lộ cách chúng đưa ra câu trả lời, không giống như o1 của OpenAI. Tính minh bạch này là một điểm bán hàng quan trọng cho những khách hàng đang tìm kiếm các giải pháp AI hiệu quả về chi phí, đặc biệt là những người bị loại khỏi thị trường các mô hình do Mỹ phát triển có giá cao và những người bị hạn chế tiếp cận sức mạnh tính toán của Mỹ.
Những thách thức và chiến lược của Trung Quốc trong lĩnh vực AI
Mối quan tâm của Mỹ về sự tiến bộ của Trung Quốc trong lĩnh vực AI là không phải không có cơ sở. Chính phủ Mỹ đã tích cực cố gắng hạn chế sự phát triển AI của Trung Quốc thông qua kiểm soát xuất khẩu đối với chip AI tiên tiến kể từ năm 2022. Điều này đã ngăn cản các công ty Trung Quốc mua được các bộ xử lý cần thiết để đào tạo các mô hình AI tiên tiến. Bất chấp những hạn chế này, các nhà sản xuất chip như Nvidia và Intel đã cố gắng tạo ra các bộ xử lý tuân thủ các yêu cầu của Mỹ đối với thị trường Trung Quốc, nhưng chỉ phải đối mặt với việc Washington thắt chặt hơn nữa các quy tắc.
Những hạn chế này đã buộc các công ty AI Trung Quốc phải khám phá các chiến lược thay thế. Một số dựa vào chip do Mỹ sản xuất đã được nhập khẩu trước khi lệnh cấm, trong khi những người khác đang chuyển sang các đường dây buôn lậu chợ đen vận chuyển chip từ các địa điểm của bên thứ ba. Một số đang khám phá các trung tâm dữ liệu bên ngoài Trung Quốc, trong khi những người khác đang dựa vào các giải pháp thay thế do Trung Quốc sản xuất từ các công ty như Huawei. Mặc dù Huawei tuyên bố rằng chip AI của họ vượt trội so với bộ xử lý A100 của Nvidia, nhưng họ đã phải đối mặt với những thách thức trong việc sản xuất chúng một cách đáng tin cậy ở quy mô lớn.
Liang Wenfeng đã tuyên bố rằng “tiền chưa bao giờ là vấn đề đối với chúng tôi; lệnh cấm vận chuyển chip tiên tiến mới là vấn đề.” Tuyên bố này nhấn mạnh những trở ngại đáng kể mà các công ty Trung Quốc phải đối mặt trong việc theo đuổi vị trí dẫn đầu AI. Ngoài lệnh cấm xuất khẩu chip, chính quyền Biden cũng đã cấm đầu tư của Mỹ vào AI của Trung Quốc, làm phức tạp thêm tình hình.
Bất chấp những thách thức này, Trung Quốc đã nuôi dưỡng một hệ sinh thái AI phát triển mạnh mẽ. Các công ty công nghệ lớn như Baidu, Alibaba và ByteDance đang phát triển các mô hình nền tảng của riêng họ và cung cấp các dịch vụ dựa trên AI. Các startup AI của Trung Quốc như MiniMax và Moonshot AI đã ra mắt các dịch vụ hướng đến người tiêu dùng đã đạt được thành công ngay cả ở thị trường Mỹ.
Sự cạnh tranh khốc liệt trong lĩnh vực AI của Trung Quốc đã dẫn đến một cuộc chiến giá cả, với việc các công ty giảm giá mạnh tới 90% trong suốt năm 2024 để giành lợi thế cạnh tranh. Cuộc chiến giá cả này càng làm nổi bật sự tháo vát và khả năng thích ứng của lĩnh vực AI Trung Quốc.
Phản ứng của Mỹ và tương lai của cuộc đua AI
Mỹ ngày càng lo ngại về những thành công của Trung Quốc trong lĩnh vực AI, vì điều đó ngụ ý rằng các biện pháp được thực hiện để bảo vệ vị trí dẫn đầu của Mỹ trong lĩnh vực AI không hiệu quả. Cựu CEO của Google, Eric Schmidt, đã bày tỏ sự ngạc nhiên trước sự tiến bộ của Trung Quốc, nói rằng ông “nghĩ rằng những hạn chế mà chúng tôi áp đặt đối với chip sẽ kìm hãm họ.”
OpenAI, nhà phát triển ChatGPT, cũng đã bày tỏ lo ngại về sự tiến bộ AI của Trung Quốc. Trong một tài liệu chính sách gần đây, OpenAI tuyên bố rằng có khoảng 175 tỷ đô la quỹ toàn cầu đang chờ đầu tư vào các dự án AI. Công ty cảnh báo rằng “nếu Mỹ không thu hút được các quỹ đó, chúng sẽ chảy vào các dự án do Trung Quốc hậu thuẫn, tăng cường ảnh hưởng toàn cầu của Đảng Cộng sản Trung Quốc.”
Để đáp lại những lo ngại này, CEO của OpenAI Sam Altman, CEO của SoftBank Masayoshi Son và đồng sáng lập Oracle Larry Ellison đã công bố Dự án Stargate, cam kết đầu tư 500 tỷ đô la vào cơ sở hạ tầng AI trên khắp nước Mỹ. Dự án này là một dấu hiệu rõ ràng về cam kết của Mỹ trong việc duy trì vị trí dẫn đầu trong lĩnh vực AI.
Tuy nhiên, sự xuất hiện của các công ty như DeepSeek cho thấy rằng con đường dẫn đến sự thống trị AI có thể không đơn giản như việc chỉ đầu tư một số tiền lớn. Khả năng đổi mới, thích ứng và đạt được những đột phá với nguồn lực hạn chế là một yếu tố quan trọng trong bối cảnh AI hiện tại. Khi cuộc đua AI tiếp tục tăng cường, thế giới sẽ theo dõi chặt chẽ cách Mỹ và Trung Quốc vượt qua những thách thức phức tạp này. Kết quả sẽ có những tác động sâu rộng đến tương lai của công nghệ và động lực quyền lực toàn cầu. Câu chuyện của DeepSeek là một lời nhắc nhở rằng sự khéo léo và tháo vát có thể là những lực lượng mạnh mẽ trong cuộc đua giành quyền tối cao về AI. Trong khi Mỹ đang đầu tư mạnh để duy trì vị trí dẫn đầu, thì thách thức từ Trung Quốc, đặc biệt là từ các startup sáng tạo như DeepSeek, là một thách thức đáng gờm. Những năm tới sẽ rất quan trọng trong việc xác định người chiến thắng cuối cùng trong cuộc cạnh tranh có tính rủi ro cao này. Bối cảnh AI đang phát triển nhanh chóng và động lực giữa hai cường quốc toàn cầu này sẽ tiếp tục định hình tương lai của công nghệ mang tính chuyển đổi này.