Vượt Ngoài Thuê Bao: Khám Phá Các AI Mã Nguồn Mở Mạnh Mẽ | vi

Bối cảnh trí tuệ nhân tạo, từng có vẻ bị thống trị bởi một số ít gã khổng lồ ở Thung lũng Silicon như OpenAI, Google, Meta và Microsoft, đang trải qua một sự chuyển đổi hấp dẫn. Trong khi những người chơi lâu đời này tiếp tục cuộc đua phát triển đầy rủi ro, thường đặt các khả năng tiên tiến nhất của họ sau các bức tường phí thuê bao, một dòng chảy ngược mạnh mẽ đang có đà phát triển. Một làn sóng mới các đối thủ cạnh tranh, đặc biệt là từ các trung tâm đổi mới ở Trung Quốc, đang chứng minh rằng AI tiên tiến không nhất thiết đòi hỏi chi phí cắt cổ hoặc bí mật độc quyền. Các công ty như DeepSeek, Alibaba và Baidu đang bước vào ánh đèn sân khấu toàn cầu, ủng hộ các mô hình mạnh mẽ thường được cung cấp dưới dạng mã nguồn mở hoặc các lựa chọn thay thế chi phí thấp, thách thức cơ bản các mô hình kinh doanh hiện hành và mở rộng khả năng cho các nhà phát triển và người dùng trên toàn thế giới.

Động lực mới nổi này đại diện cho nhiều hơn là chỉ những đối thủ cạnh tranh mới tham gia vào cuộc chiến; nó báo hiệu một sự thay đổi tiềm năng trong triết lý làm nền tảng cho sự phát triển và khả năng tiếp cận AI. Quyết định của những người chơi mới hơn này trong việc phát hành các mô hình tinh vi theo giấy phép cho phép, làm cho mã nguồn cơ bản có sẵn trên các nền tảng như GitHub và Hugging Face, hoàn toàn trái ngược với cách tiếp cận thường mờ đục, khép kín được một số gã khổng lồ phương Tây ưa chuộng. Sự cởi mở này không chỉ dân chủ hóa quyền truy cập vào các công cụ mạnh mẽ mà còn nuôi dưỡng một hệ sinh thái sôi động, nơi các nhà phát triển có thể tự do thử nghiệm, tùy chỉnh và xây dựng dựa trên các mô hình nền tảng này, có khả năng thúc đẩy sự đổi mới với tốc độ chưa từng có. Hãy cùng đi sâu vào ba ví dụ nổi bật dẫn đầu xu hướng này, khám phá nguồn gốc, khả năng và ý nghĩa của các chiến lược mở của họ.

DeepSeek: Kẻ Mới Nổi Nhanh Nhẹn Làm Rung Chuyển Giới Công Nghệ

Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., hoạt động dưới tên gọi ngắn gọn hơn là DeepSeek, đã bùng nổ trên trường AI quốc tế với tốc độ và tác động đáng kể. Mặc dù là một thực thể tương đối non trẻ, chính thức được thành lập vào tháng 4 năm 2023 như một nhánh của công ty giao dịch định lượng High-Flyer Quant, DeepSeek nhanh chóng thu hút sự chú ý vì đã phát triển các mô hình AI cạnh tranh, và trong một số điểm chuẩn được báo cáo là vượt qua, những mô hình từ các gã khổng lồ trong ngành với chu kỳ phát triển dài hơn nhiều và ngân sách lớn hơn đáng kể. Khả năng đạt được hiệu suất cạnh tranh với hiệu quả dường như cao hơn này đã tạo ra những gợn sóng trong lĩnh vực.

Chu kỳ lặp lại nhanh chóng của công ty là đáng chú ý. Bắt đầu với DeepSeek-LLM ban đầu, công ty nhanh chóng tiếp nối với các mô hình chuyên biệt như DeepSeek-Math. Việc công bố DeepSeek V2 và sau đó là DeepSeek V3 vào cuối năm 2024 đã báo hiệu quỹ đạo đầy tham vọng của công ty. Tuy nhiên, chính việc công bố các mô hình suy luận của mình, DeepSeek-R1 và DeepSeek-R1-Zero, vào tháng 1 năm 2025 mới thực sự thu hút trí tưởng tượng của ngành và được cho là đánh dấu một bước ngoặt. Các mô hình này đã tạo ra sự so sánh trực tiếp và thường là thuận lợi với dòng GPT-4 tiên tiến của OpenAI và mô hình ‘o1’ được mong đợi của nó, gây ra cuộc thảo luận đáng kể về tình trạng hiện tại của nghệ thuật suy luận AI. Việc giới thiệu không chỉ mang tính học thuật; nó được báo cáo là đã ảnh hưởng đến giá cổ phiếu của đối thủ cạnh tranh, thúc đẩy các đánh giá lại chiến lược trong các phòng thí nghiệm AI đã thành lập, và thậm chí làm dấy lên các cuộc thảo luận giữa các cơ quan chính phủ về ý nghĩa của AI mạnh mẽ, dễ tiếp cận như vậy bắt nguồn từ những người chơi toàn cầu mới.

DeepSeek sử dụng cái mà họ gọi là chiến lược “trọng số mở” (open weight) cho nhiều mô hình của mình, phát hành chúng theo giấy phép MIT License cho phép. Mặc dù điều này có thể không tương đương với 100% mã nguồn mở theo định nghĩa nghiêm ngặt nhất (vì một số khía cạnh nhất định của dữ liệu đào tạo hoặc phương pháp luận có thể vẫn là độc quyền), nó đại diện cho một mức độ cởi mở đáng kể. Quan trọng là, các trọng số của mô hình – các tham số gói gọn kiến thức đã học của mô hình – được cung cấp. Điều này cho phép các nhà phát triển tải xuống các mô hình từ các kho lưu trữ như GitHub và Hugging Face, cho phép họ chạy các mô hình cục bộ, tinh chỉnh chúng cho các tác vụ cụ thể, tích hợp chúng vào các ứng dụng độc đáo hoặc đơn giản là nghiên cứu kiến trúc của chúng. Mức độ truy cập này khác xa so với việc chỉ tương tác thông qua một API bị hạn chế hoặc giao diện web đóng.

Từ góc độ người dùng, DeepSeek chủ yếu thể hiện dưới dạng một công cụ AI kiểu chatbot, có thể truy cập thông qua giao diện web và các ứng dụng di động chuyên dụng cho cả nền tảng iOS và Android. Ảnh hưởng ngày càng tăng của nó được chứng minh thêm bởi danh sách các đối tác ngày càng tăng. Công nghệ của DeepSeek đang được tích hợp hoặc khám phá bởi các công ty công nghệ lớn, được báo cáo bao gồm Lenovo, Tencent, Alibaba và Baidu, cho thấy khả năng ứng dụng tiềm năng của nó trên các hệ sinh thái phần cứng và phần mềm đa dạng. Sự trỗi dậy của DeepSeek nhấn mạnh một chủ đề chính: những đột phá AI quan trọng không còn là lĩnh vực độc quyền của các phòng thí nghiệm nghiên cứu lâu đời, và sự phát triển hiệu quả kết hợp với tính cởi mở chiến lược có thể nhanh chóng định hình lại bối cảnh cạnh tranh.

Qwen của Alibaba: Sự Cởi Mở Quy Mô Lớn Từ Gã Khổng Lồ Thương Mại Điện Tử

Trong khi DeepSeek đại diện cho startup nhanh nhẹn thách thức hiện trạng, Alibaba Qwen (Tongyi Qianwen) biểu thị một sự chấp nhận chiến lược về tính cởi mở của một trong những tập đoàn công nghệ lớn nhất Trung Quốc và thực sự là của thế giới. Alibaba, nổi tiếng với đế chế thương mại điện tử rộng lớn, dịch vụ điện toán đám mây và các dự án công nghệ đa dạng, đã tham gia cuộc đua AI tạo sinh với nguồn lực và tham vọng đáng kể. Dòng mô hình ngôn ngữ lớn Qwen nhanh chóng khẳng định vị thế của mình trong số các sản phẩm mã nguồn mở hàng đầu trên toàn cầu.

Hành trình bắt đầu với bản phát hành beta vào tháng 4 năm 2023, nhanh chóng thu hút sự chú ý trong cộng đồng AI khi Alibaba liên tục phát hành các mô hình khác nhau theo giấy phép mã nguồn mở trong suốt năm đó. Cam kết về tính cởi mở này phần lớn đã tiếp tục với các lần lặp lại tiếp theo. Mặc dù một số phiên bản chuyên biệt cao hoặc nhạy cảm về mặt thương mại có thể có giấy phép khác nhau, các mô hình cốt lõi trong dòng Qwen, bao gồm Qwen 2, dòng Qwen-VL đa phương thức (xử lý cả văn bản và hình ảnh), Qwen-Audio, và Qwen2-Math thiên về toán học, thường được cung cấp theo các giấy phép cho phép như Apache 2.0 License. Điều này cho phép sử dụng rộng rãi cho mục đích thương mại và nghiên cứu, tiếp tục thúc đẩy việc áp dụng. Giống như DeepSeek, các mô hình này dễ dàng truy cập đối với cộng đồng nhà phát triển toàn cầu thông qua các nền tảng như GitHub và Hugging Face.

Alibaba đã không ngần ngại định vị các mô hình của mình trực tiếp đối đầu với những mô hình tốt nhất trong ngành. Việc công bố Qwen 2.5-Max vào tháng 1 năm 2025 và Qwen2.5-VL đa phương thức vào tháng 3 năm 2025 đi kèm với những tuyên bố táo bạo, quảng bá chúng sở hữu các khả năng vượt trội hoặc sánh ngang với các mô hình nổi bật như GPT-4o của OpenAI, V3 của DeepSeek và Llama-3.1-405B mạnh mẽ của Meta. Mặc dù kết quả điểm chuẩn có thể tùy thuộc vào cách giải thích và đánh giá nhiệm vụ cụ thể, sự phát triển nhất quán và định vị cạnh tranh nhấn mạnh ý định nghiêm túc của Alibaba trong lĩnh vực AI.

Điều thú vị là, mô hình Qwen ban đầu đã thừa nhận di sản của nó, một phần dựa trên Llama LLM nền tảng của Meta – bản thân nó là một bản phát hành mã nguồn mở mang tính bước ngoặt đã xúc tác nhiều hoạt động trong lĩnh vực này. Tuy nhiên, Alibaba đã sửa đổi và xây dựng đáng kể dựa trên nền tảng này, phát triển kiến trúc và phương pháp đào tạo độc đáo của riêng mình cho các thế hệ Qwen tiếp theo. Sự phát triển này làm nổi bật một mô hình phổ biến trong thế giới mã nguồn mở: xây dựng dựa trên công việc hiện có để tạo ra các khả năng mới lạ và nâng cao.

Tác động của chiến lược mở của Qwen có lẽ được minh họa rõ nhất bằng thống kê đáng kinh ngạc được trích dẫn: hơn 90.000 mô hình độc lập được báo cáo đã được phát triển dựa trên mã nguồn mở của Qwen. Con số này nói lên rất nhiều về sức mạnh của việc phổ biến mở. Nó biểu thị một hệ sinh thái phát triển mạnh mẽ, nơi các nhà nghiên cứu, startup và nhà phát triển cá nhân đang tận dụng công việc nền tảng của Alibaba để tạo ra các công cụ chuyên biệt, tiến hành các thí nghiệm mới lạ và đẩy lùi ranh giới của AI theo nhiều hướng khác nhau. Đối với người dùng cuối, Qwen thường được truy cập thông qua giao diện chatbot quen thuộc, có sẵn trên web và thông qua các ứng dụng di động trên iOS và Android. Cách tiếp cận của Alibaba cho thấy ngay cả những gã khổng lồ công nghệ cũng có thể tận dụng chiến lược mã nguồn mở để thúc đẩy đổi mới, xây dựng cộng đồng và cạnh tranh hiệu quả trên trường AI toàn cầu.

Ernie của Baidu: Sự Chuyển Đổi Chiến Lược Từ Gã Khổng Lồ Tìm Kiếm

Baidu, thường được gọi là Google của Trung Quốc do sự thống trị của nó trong thị trường công cụ tìm kiếm, mang đến một loại di sản khác cho cuộc đua AI. Không giống như DeepSeek hay thậm chí là sự thúc đẩy LLM tương đối gần đây của Alibaba, Baidu đã tham gia sâu vào nghiên cứu AI, đặc biệt là xử lý ngôn ngữ tự nhiên, trong nhiều năm. Dòng mô hình ERNIE (Enhanced Representation through Knowledge Integration) của họ có từ năm 2019, trước cả cơn sốt phát hành công khai do ChatGPT khởi xướng.

Sự thúc đẩy AI tạo sinh hướng tới công chúng bắt đầu một cách nghiêm túc với việc phát hành Ernie 3.0 LLM vào tháng 3 năm 2023, tiếp theo là Ernie 3.5 vào tháng 6 năm 2023. Ban đầu, Baidu đã áp dụng một cách tiếp cận phân cấp thông thường hơn, tương tự như một số đối tác phương Tây. Ernie 4.0 tiên tiến hơn, được phát hành vào tháng 10 năm 2023, chủ yếu được dành riêng cho các sản phẩm dựa trên đăng ký của Baidu, trong khi Ernie 3.5 có khả năng cung cấp năng lượng cho phiên bản miễn phí của chatbot của nó, được gọi là Ernie Bot.

Tuy nhiên, động lực cạnh tranh trong ngành AI, đặc trưng bởi những tiến bộ nhanh chóng từ các đối thủ (cả trong nước và quốc tế) và tính khả thi ngày càng tăng của các chiến lược mã nguồn mở, cùng với chi phí sản xuất mô hình có khả năng giảm, dường như đã thúc đẩy một sự thay đổi chiến lược quan trọng. Baidu báo hiệu một sự chuyển dịch quyết định hướng tới sự cởi mở hơn. Mặc dù các mô hình Ernie hiện tại cung cấp năng lượng cho các dịch vụ chính của họ ban đầu không phải là mã nguồn mở, công ty đã công bố kế hoạch thay đổi quỹ đạo này một cách đáng kể.

Việc phát hành Ernie 4.5 LLM và một mô hình suy luận chuyên dụng, Ernie X1, vào giữa tháng 3 năm 2025, ngay lập tức tạo ra sự so sánh với GPT-4.5 của OpenAI và R1 của DeepSeek, tương ứng, đặt Baidu vững chắc vào nhóm các nhà cung cấp mô hình AI hàng đầu. Quan trọng là, cùng với những tuyên bố về hiệu suất này, Baidu đã công bố một lộ trình rõ ràng hướng tới sự cởi mở. Công ty tuyên bố ý định biến các mô hình cốt lõi của mình thành mã nguồn mở bắt đầu từ ngày 30 tháng 6. Hơn nữa, họ thông báo rằng chatbot Ernie Bot của mình sẽ trở nên miễn phí cho tất cả người dùng kể từ ngày 1 tháng 4, loại bỏ rào cản đăng ký trước đó để truy cập AI đàm thoại có khả năng nhất của mình. Nhìn về phía trước, Baidu cũng đã chỉ ra rằng lần lặp lại lớn tiếp theo của mình, Ernie 5, dự kiến vào nửa cuối năm 2025, cũng sẽ tương tự áp dụng triết lý mã nguồn mở và miễn phí sử dụng.

Sự tái định hướng chiến lược này của một người chơi tầm cỡ như Baidu là rất có ý nghĩa. Nó cho thấy sự thừa nhận rằng tính cởi mở có thể đang trở thành một điều cần thiết cạnh tranh, không chỉ là một con đường thay thế. Bằng cách cung cấp miễn phí các mô hình tiên tiến nhất của mình, Baidu có thể nuôi dưỡng một cộng đồng nhà phát triển, kích thích sự đổi mới xung quanh nền tảng của mình và có khả năng chiếm được sự chú ý đáng kể của người dùng đang tìm kiếm các công cụ AI mạnh mẽ, không bị hạn chế.

Giống như các đối thủ cạnh tranh, giao diện người dùng chính cho Ernie là một chatbot, có thể truy cập qua web và ứng dụng di động (iOS và Android). Khả năng của Ernie cũng đã tìm được đường vào các sản phẩm tiêu dùng hữu hình, đáng chú ý là được tích hợp vào các tính năng AI của phiên bản quốc tế của dòng điện thoại thông minh Samsung Galaxy S24. Sự tích hợp này cung cấp một ví dụ cụ thể về cách các mô hình ngôn ngữ tiên tiến này đang vượt ra ngoài các phòng thí nghiệm nghiên cứu và giao diện web để đi vào các thiết bị mà hàng triệu người sử dụng hàng ngày. Chiến lược đang phát triển của Baidu nhấn mạnh tính linh hoạt của bối cảnh AI, nơi ngay cả những gã khổng lồ đã thành danh cũng đang điều chỉnh cách tiếp cận của họ để đối phó với tiến bộ công nghệ và kỳ vọng thị trường đang thay đổi.

Điều Hướng Vũ Trụ AI Mở Rộng

Sự xuất hiện của các mô hình AI mạnh mẽ, dễ tiếp cận từ DeepSeek, Alibaba và Baidu biểu thị nhiều hơn là chỉ sự cạnh tranh gia tăng đối với những người chơi đã thành danh như OpenAI và Google. Nó đại diện cho một sự mở rộng cơ bản về lựa chọn và cơ hội cho một loạt người dùng và nhà phát triển đa dạng. Sự sẵn có của các mô hình này, thường theo giấy phép mã nguồn mở hoặc “trọng số mở” cho phép, làm giảm đáng kể rào cản gia nhập cho sự đổi mới. Các doanh nghiệp nhỏ, nhà phát triển cá nhân, nhà nghiên cứu và sinh viên giờ đây có thể truy cập và tận dụng các khả năng AI mà trước đây chỉ giới hạn trong các tập đoàn lớn hoặc các gói đăng ký đắt tiền.

Sự phổ biến này thúc đẩy một số xu hướng tích cực:

Tùy chỉnh: Các nhà phát triển có thể tinh chỉnh các mô hình mở này trên các bộ dữ liệu cụ thể để tạo ra các công cụ AI chuyên biệt cao phù hợp với các ngành công nghiệp ngách hoặc các tác vụ độc đáo, vượt ra ngoài các giải pháp chung chung, một kích cỡ phù hợp với tất cả.
Thử nghiệm: Khả năng tải xuống và sửa đổi trọng số mô hình cho phép khám phá sâu hơn về kiến trúc và khả năng của AI, thúc đẩy nghiên cứu học thuật và đổi mới từ cơ sở.
Giảm chi phí: Đối với người dùng và tổ chức mệt mỏi với phí đăng ký định kỳ, các lựa chọn thay thế miễn phí hoặc chi phí thấp này cung cấp chức năng mạnh mẽ mà không có gánh nặng tài chính liên quan, có khả năng dân chủ hóa quyền truy cập vào các công cụ AI nâng cao năng suất.
Tăng trưởng hệ sinh thái: Khả năng truy cập thông qua các nền tảng như GitHub và Hugging Face nuôi dưỡng các cộng đồng sôi động xung quanh các mô hình này, cung cấp tài nguyên được chia sẻ, hỗ trợ và cơ hội phát triển hợp tác.

Tuy nhiên, việc điều hướng vũ trụ mở rộng này đòi hỏi sự cân nhắc cẩn thận. Việc chọn một mô hình AI không chỉ đơn thuần là so sánh các điểm chuẩn hiệu suất. Các yếu tố như chất lượng và tính sẵn có của tài liệu, khả năng phản hồi của cộng đồng nhà phát triển, điểm mạnh và điểm yếu cụ thể của một mô hình (ví dụ: khả năng viết mã so với viết sáng tạo so với hiểu đa phương thức) và tài nguyên tính toán cần thiết để chạy hoặc tinh chỉnh mô hình một cách hiệu quả đều là những yếu tố quan trọng trong quá trình ra quyết định. Mặc dù các nền tảng đám mây cung cấp tài nguyên có thể mở rộng, tiềm năng chạy các mô hình mạnh mẽ cục bộ trên phần cứng có khả năng là một đề xuất hấp dẫn được kích hoạt bởi một số bản phát hành mở.

Hơn nữa, sự trỗi dậy của các lựa chọn thay thế mạnh mẽ này chắc chắn đặt ra các câu hỏi chiến lược cho những người chơi đương nhiệm. Liệu áp lực từ các mô hình mã nguồn mở chất lượng cao có buộc các gã khổng lồ AI phương Tây phải áp dụng các chiến lược cởi mở hơn, có lẽ bằng cách phát hành các mô hình cũ hơn hoặc cung cấp các cấp miễn phí hào phóng hơn không? Hay họ sẽ tăng cường các tính năng độc quyền, khóa hệ sinh thái và các giải pháp tập trung vào doanh nghiệp để duy trì lợi thế của mình? Sự tương tác cạnh tranh là năng động và không ngừng phát triển.

Khía cạnh địa chính trị cũng làm tăng thêm sự phức tạp, vì việc phát triển các khả năng AI hàng đầu bên ngoài các trung tâm phương Tây truyền thống mang ý nghĩa dài hạn đáng kể đối với vai trò lãnh đạo công nghệ và các tiêu chuẩn toàn cầu. Khi các công cụ mạnh mẽ này được phân phối rộng rãi hơn, các cuộc thảo luận xung quanh việc phát triển AI có trách nhiệm, các hướng dẫn đạo đức và khả năng lạm dụng tiềm ẩn cũng trở nên ngày càng phù hợp đối với tất cả người chơi, bất kể nguồn gốc hoặc mô hình cấp phép của họ. Cuộc đua AI chắc chắn đã mở rộng, mang đến một bối cảnh phong phú hơn, phức tạp hơn và cuối cùng là dễ tiếp cận hơn bao giờ hết. Thách thức và cơ hội bây giờ nằm ở việc khai thác tiềm năng mở rộng này một cách có trách nhiệm và hiệu quả.

cập nhật lúc 2025-03-31

# LLM # AIGC # DeepSeek