DeepSeek, công ty khởi nghiệp AI của Trung Quốc, đã có một bước tiến đáng chú ý trong bối cảnh cạnh tranh của trí tuệ nhân tạo với một phiên bản nâng cao của mô hình nền tảng của mình. Thay vì tiết lộ DeepSeek R2 được đồn đoán, công ty đã giới thiệu DeepSeek-R1-0528 vào ngày 28 tháng 5, thể hiện những tiến bộ trong suy luận, logic, toán học và lập trình. Mô hình mã nguồn mở tinh chỉnh này, hoạt động theo giấy phép MIT, hiện cho thấy các số liệu hiệu suất cạnh tranh với các mô hình hàng đầu như GPT-3 của OpenAI và Gemini 2.5 Pro của Google.
Cải thiện Khả năng Xử Lý Các Tác Vụ Suy Luận Phức Tạp
Những cải tiến trong DeepSeek-R1-0528 có thể là do việc phân bổ tài nguyên tính toán hợp lý hơn, cùng với các tối ưu hóa thuật toán được triển khai trong giai đoạn hậu huấn luyện. Những điều chỉnh tinh chỉnh này làm tăng độ sâu tư duy của mô hình trong quá trình suy luận. Để minh họa, phiên bản trước đó tiêu thụ khoảng 12.000 token cho mỗi câu hỏi trong các bài kiểm tra American Invitational Mathematics Examination (AIME), trong khi mô hình được cập nhật hiện sử dụng gần 23.000 token. Việc sử dụng token tăng lên này tương quan với sự gia tăng đáng kể về độ chính xác, tăng từ 70% lên 87,5% trong phiên bản năm 2025 của bài kiểm tra AIME.
Trong lĩnh vực toán học, điểm số được ghi nhận của mô hình đã đạt đến mức ấn tượng, đạt 91,4% trên AIME 2024 và 79,4% trên Harvard-MIT Mathematics Tournament (HMMT) 2025. Những con số này tiếp cận hoặc vượt qua các tiêu chuẩn hiệu suất được đặt ra bởi một số mô hình nguồn đóng, bao gồm GPT-3 và Gemini 2.5 Pro.
Đối với khả năng lập trình, chỉ số LiveCodeBench đã trải qua sự gia tăng đáng kể gần 10 điểm, từ 63,5 lên 73,3%. Hơn nữa, đánh giá SWE-Verified đã cho thấy sự cải thiện về tỷ lệ thành công, tăng từ 49,2% lên 57,6%.
Trong lĩnh vực suy luận chung, hiệu suất của mô hình trên bài kiểm tra GPQA-Diamond đã được cải thiện đáng kể, với điểm số tăng từ 71,5% lên 81,0%. Đáng chú ý, hiệu suất của nó trên điểm chuẩn “Last Examination of Humanity” đã tăng hơn gấp đôi, từ 8,5% lên 17,7%.
Những cải tiến này cùng nhau nhấn mạnh khả năng nâng cao của DeepSeek-R1-0528 để giải quyết các tác vụ suy luận phức tạp, định vị nó như một đối thủ đáng gờm trong bối cảnh AI. Các thuật toán tinh chỉnh và việc sử dụng tài nguyên tối ưu hóa đã chuyển thành những lợi ích hữu hình về độ chính xác và khả năng giải quyết vấn đề trên nhiều lĩnh vực khác nhau.
Giảm Tỷ Lệ Lỗi và Cải thiện Tích Hợp Ứng Dụng
Một trong những tiến bộ nổi bật được giới thiệu bởi bản cập nhật này là sự giảm đáng kể tỷ lệ ảo giác, một mối quan tâm quan trọng đối với độ tin cậy của các mô hình ngôn ngữ lớn (LLM). Bằng cách giảm thiểu tỷ lệ phản hồi không chính xác về mặt thực tế, DeepSeek-R1-0528 tăng cường độ mạnh mẽ của nó, đặc biệt trong các bối cảnh mà độ chính xác là tối quan trọng. Độ chính xác tăng lên này thúc đẩy sự tin tưởng lớn hơn vào đầu ra của mô hình, làm cho nó trở thành một công cụ đáng tin cậy hơn cho các ứng dụng khác nhau.
Hơn nữa, bản cập nhật kết hợp các tính năng được thiết kế để sử dụng trong môi trường có cấu trúc, bao gồm tạo đầu ra JSON trực tiếp và hỗ trợ mở rộng cho các lệnh gọi hàm. Những tiến bộ kỹ thuật này hợp lý hóa việc tích hợp mô hình vào quy trình làm việc tự động, tác nhân phần mềm hoặc hệ thống phụ trợ, loại bỏ sự cần thiết cho quá trình xử lý trung gian mở rộng. Bằng cách cung cấp hỗ trợ gốc cho các định dạng dữ liệu có cấu trúc và các lệnh gọi hàm, DeepSeek-R1-0528 đơn giản hóa việc phát triển và triển khai các ứng dụng hỗ trợ AI, giúp các nhà phát triển dễ dàng tận dụng các khả năng của nó.
Việc tập trung vào giảm lỗi và cải thiện tích hợp ứng dụng minh họa cam kết của DeepSeek trong việc nâng cao tính thực tế và khả năng sử dụng của các mô hình của mình. Bằng cách giải quyết các thách thức chính liên quan đến độ chính xác và dễ dàng tích hợp, công ty đang định vị các mô hình của mình như những tài sản có giá trị cho một loạt các ngành công nghiệp và ứng dụng.
Tăng Cường Tập Trung vào Chưng Cất
Song song với những cải tiến được thực hiện đối với DeepSeek-R1-0528, nhóm DeepSeek đã bắt đầu một quá trình chưng cất chuỗi tư duy thành các mô hình nhẹ hơn được thiết kế cho các nhà phát triển và nhà nghiên cứu có nguồn lực phần cứng hạn chế. DeepSeek-R1-0528, bao gồm 685 tỷ tham số, đã được sử dụng để huấn luyện hậu kỳ Qwen3 8B Base, dẫn đến việc tạo ra DeepSeek-R1-0528-Qwen3-8B.
Đáng chú ý, mô hình chưng cất này quản lý để cạnh tranh với các mô hình mã nguồn mở lớn hơn nhiều trên một số điểm chuẩn nhất định. Với điểm số 86,0% trên AIME 2024, nó không chỉ vượt quá hiệu suất của Qwen3 8B hơn 10,0% mà còn phù hợp với hiệu suất của Qwen3-235B-thinking. Thành tích này nhấn mạnh tiềm năng của các kỹ thuật chưng cất để tạo ra các mô hình nhỏ gọn và hiệu quả hơn mà không làm giảm hiệu suất.
Cách tiếp cận này thách thức quan niệm lâu nay rằng các mô hình lớn là vốn dĩ vượt trội, cho thấy rằng các phiên bản tiết kiệm hơn nhưng được đào tạo tốt hơn có thể khả thi hơn cho một số nhiệm vụ suy luận nhất định. Bằng cách tập trung vào chưng cất, DeepSeek đang khám phá các con đường thay thế để đạt được tiến bộ trong AI, có khả năng mở đường cho các mô hình dễ tiếp cận và tiết kiệm tài nguyên hơn.
Mô hình DeepSeek-R1-0528 đại diện cho một bước tiến vượt bậc trong lĩnh vực trí tuệ nhân tạo, chứng minh sức mạnh của tối ưu hóa thuật toán và phân bổ tài nguyên chiến lược. Khả năng nâng cao của nó trong suy luận, toán học, lập trình và kiến thức chung, cùng với tỷ lệ lỗi giảm và các tính năng tích hợp được cải thiện, định vị nó như một đối thủ đáng gờm đối với các mô hình đã được thiết lập từ những gã khổng lồ của Mỹ. Hơn nữa, việc DeepSeek khám phá các kỹ thuật chưng cất cho thấy một con đường đầy hứa hẹn hướng tới các giải pháp AI hiệu quả và dễ tiếp cận hơn. Khi bối cảnh AI tiếp tục phát triển, cam kết của DeepSeek đối với sự đổi mới và tính thực tế có thể sẽ đóng một vai trò quan trọng trong việc định hình tương lai của ngành.
Việc liên tục tinh chỉnh và cải thiện các mô hình AI như DeepSeek-R1-0528 là điều cần thiết để khai thác toàn bộ tiềm năng của trí tuệ nhân tạo. Bằng cách vượt qua các giới hạn của những gì có thể và giải quyết các thách thức chính liên quan đến độ chính xác, hiệu quả và khả năng truy cập, DeepSeek đang đóng góp vào sự tiến bộ của AI và việc tích hợp nó vào các khía cạnh khác nhau của cuộc sống của chúng ta. Khi AI ngày càng trở nên phổ biến, tầm quan trọng của những tiến bộ này sẽ chỉ tiếp tục tăng lên, định hình tương lai của công nghệ và xã hội nói chung.
Ý Nghĩa của DeepSeek-R1-0528 Đối với Cộng Đồng AI và Hơn Thế Nữa
Việc phát hành DeepSeek-R1-0528 và các tiêu chuẩn hiệu suất ấn tượng của nó có ý nghĩa quan trọng đối với cộng đồng AI và hơn thế nữa. Thứ nhất, nó chứng minh rằng sự đổi mới trong AI không giới hạn ở các gã khổng lồ đã được thành lập ở Hoa Kỳ và các nước phương Tây khác. Các công ty khởi nghiệp Trung Quốc như DeepSeek có khả năng phát triển các mô hình AI tiên tiến có thể cạnh tranh với những mô hình tốt nhất trên thế giới. Sự cạnh tranh gia tăng này có thể thúc đẩy sự đổi mới hơn nữa và đẩy nhanh sự phát triển của các công nghệ AI trên toàn cầu.
Thứ hai, bản chất mã nguồn mở của DeepSeek-R1-0528 cho phép các nhà nghiên cứu và nhà phát triển trên khắp thế giới truy cập và sử dụng các khả năng của nó. Sự dân chủ hóa công nghệ AI này có thể thúc đẩy sự hợp tác, tăng tốc nghiên cứu và dẫn đến sự phát triển của các ứng dụng và trường hợp sử dụng mới. Mô hình mã nguồn mở cũng cho phép tăng cường tính minh bạch và kiểm tra, điều này có thể giúp xác định và giải quyết các thành kiến hoặc hạn chế tiềm ẩn trong mô hình.
Thứ ba, hiệu suất được cải thiện của DeepSeek-R1-0528 trong các lĩnh vực khác nhau, chẳng hạn như toán học, lập trình và suy luận chung, có khả năng tác động đến một loạt các ngành công nghiệp và ứng dụng. Trong lĩnh vực giáo dục, mô hình có thể được sử dụng để tạo ra trải nghiệm học tập cá nhân hóa, cung cấp phản hồi tự động và hỗ trợ sinh viên giải quyết vấn đề. Trong thế giới kinh doanh, nó có thể được sử dụng để tự động hóa các tác vụ, cải thiện việc ra quyết định và nâng cao dịch vụ khách hàng. Và trong cộng đồng khoa học, nó có thể được sử dụng để đẩy nhanh nghiên cứu, phân tích dữ liệu và tạo ra những hiểu biết mới.
Cuối cùng, việc DeepSeek tập trung vào các kỹ thuật chưng cất cho thấy một con đường đầy hứa hẹn hướng tới các giải pháp AI hiệu quả và dễ tiếp cận hơn. Bằng cáchCreating nhỏ hơn, mô hình hiệu quả hơn vẫn giữ lại các khả năng của các đối tác lớn hơn của chúng, DeepSeek đang làm cho công nghệ AI dễ tiếp cận hơn đối với các nhà phát triển và nhà nghiên cứu có nguồn lực phần cứng hạn chế. Điều này có thể giúp dân chủ hóa AI và đảm bảo rằng lợi ích của nó được chia sẻ rộng rãi hơn.
Tóm lại, DeepSeek-R1-0528 đại diện cho một cột mốc quan trọng trong sự phát triển của trí tuệ nhân tạo. Hiệu suất ấn tượng, bản chất mã nguồn mở và tập trung vào chưng cất có tiềm năng thúc đẩy sự đổi mới hơn nữa, đẩy nhanh nghiên cứu và dân chủ hóa quyền truy cập vào công nghệ AI. Khi bối cảnh AI tiếp tục phát triển, những đóng góp của DeepSeek có thể sẽ đóng một vai trò quan trọng trong việc định hình tương lai của ngành và tác động của nó đối với xã hội.