Mô hình Qwen của Alibaba

Tham vọng AI của Trung Quốc được khơi dậy bởi mô hình Qwen của Alibaba

Vào ngày 5 tháng 3, gã khổng lồ công nghệ Trung Quốc Alibaba đã công bố mô hình suy luận trí tuệ nhân tạo mới nhất của mình, một sự phát triển khiến cổ phiếu niêm yết tại Hồng Kông của công ty tăng vọt 8%. Mặc dù mô hình mới này, được đặt tên là QwQ-32B, có thể chưa sánh được với khả năng của các hệ thống AI hàng đầu ở Hoa Kỳ, nhưng nó được cho là có hiệu suất tương đương với đối thủ cạnh tranh trong nước, mô hình R1 của DeepSeek. Điều làm nên sự khác biệt của QwQ-32B là nhu cầu năng lượng tính toán thấp hơn đáng kể, cả trong quá trình phát triển và vận hành liên tục. Những người đứng sau QwQ-32B tuyên bố nó thể hiện một “tinh thần triết học cổ đại”, tiếp cận các vấn đề với cảm giác “thực sự kỳ diệu và nghi ngờ”.

Hệ sinh thái AI mở rộng của Trung Quốc

Scott Singer, một học giả thỉnh giảng trong Chương trình Công nghệ và Các vấn đề Quốc tế tại Carnegie Endowment for International Peace, nhận xét: “Việc phát hành này nhấn mạnh khả năng cạnh tranh rộng lớn hơn của hệ sinh thái AI tiên phong của Trung Quốc”. Hệ sinh thái này là một bối cảnh sôi động với những người chơi như DeepSeek với mô hình R1 và Tencent với mô hình Hunyuan. Đáng chú ý, người đồng sáng lập Anthropic, Jack Clark, đã thừa nhận Hunyuan là “đẳng cấp thế giới” ở một số khía cạnh. Tuy nhiên, điều quan trọng cần lưu ý là các đánh giá về mô hình mới nhất của Alibaba vẫn còn ở giai đoạn đầu. Khó khăn cố hữu trong việc đo lường khả năng của mô hình, cùng với thực tế là QwQ-32B mới chỉ được Alibaba đánh giá nội bộ, có nghĩa là “môi trường thông tin hiện tại không phong phú lắm”, như Singer chỉ ra.

Sự ra mắt của mô hình R1 của DeepSeek vào tháng 1 đã gây ra những gợn sóng trên thị trường chứng khoán toàn cầu, đưa hệ sinh thái công nghệ của Trung Quốc vào tâm điểm chú ý của quốc tế. Sự chú ý này càng được khuếch đại bởi nhận thức ngày càng tăng ở Mỹ về một cuộc chạy đua với Trung Quốc để đạt được trí tuệ nhân tạo tổng quát (AGI). AGI đại diện cho một mức độ tinh vi giả định của AI, nơi các hệ thống có khả năng thực hiện một loạt các nhiệm vụ nhận thức, từ thiết kế đồ họa đến nghiên cứu machine-learning, ở mức độ tương đương hoặc vượt quá khả năng của con người.

Ý nghĩa chiến lược của AGI

Sự phát triển của AGI được dự đoán rộng rãi sẽ mang lại lợi thế quân sự và chiến lược đáng kể cho bất kỳ thực thể nào – có thể là một công ty hoặc một chính phủ – đạt được nó trước tiên. Các ứng dụng tiềm năng của một hệ thống như vậy rất rộng lớn và mang tính biến đổi, từ khả năng tác chiến mạng tiên tiến đến việc tạo ra các loại vũ khí hủy diệt hàng loạt mới.

“Chúng tôi tin tưởng rằng việc kết hợp các mô hình nền tảng mạnh mẽ hơn với học tăng cường được hỗ trợ bởi các tài nguyên tính toán có quy mô sẽ thúc đẩy chúng ta tiến gần hơn đến việc đạt được AGI”, nhóm chịu trách nhiệm về mô hình mới nhất của Alibaba tuyên bố. Việc theo đuổi AGI này là một chủ đề chung xuyên suốt hầu hết các phòng thí nghiệm AI hàng đầu. Mục tiêu đã nêu của DeepSeek là “làm sáng tỏ bí ẩn của AGI với sự tò mò”. Tương tự, sứ mệnh của OpenAI là “đảm bảo rằng trí tuệ nhân tạo tổng quát—các hệ thống AI thường thông minh hơn con người—mang lại lợi ích cho toàn nhân loại”. Các CEO AI nổi tiếng đã bày tỏ kỳ vọng rằng các hệ thống giống AGI có thể xuất hiện trong nhiệm kỳ hiện tại của Tổng thống Trump.

Sự tái xuất của Jack Ma và bối cảnh công nghệ Trung Quốc

Bước đột phá AI gần đây của Alibaba diễn ra ngay sau sự xuất hiện công khai đáng chú ý của người đồng sáng lập công ty, Jack Ma. Ông được ngồi ở hàng ghế đầu trong cuộc gặp giữa Chủ tịch Tập Cận Bình và các nhân vật kinh doanh hàng đầu của Trung Quốc. Điều này đánh dấu một sự thay đổi đáng kể đối với Ma, người đã phần lớn rút lui khỏi tầm nhìn của công chúng kể từ năm 2020. Những lời chỉ trích trước đây của ông đối với các cơ quan quản lý nhà nước và các ngân hàng nhà nước vì đã cản trở sự đổi mới và hoạt động với “tâm lý tiệm cầm đồ” dường như đã dẫn đến một thời gian giảm bớt tầm nhìn.

Trong thời gian Ma vắng bóng, chính phủ Trung Quốc đã thực hiện một loạt các biện pháp nhắm vào ngành công nghệ. Các quy định chặt chẽ hơn đã được áp dụng đối với cách các công ty có thể sử dụng dữ liệu và tham gia cạnh tranh thị trường. Đồng thời, chính phủ đã kiểm soát chặt chẽ hơn các nền tảng kỹ thuật số quan trọng.

Thay đổi ưu tiên: Từ đàn áp công nghệ đến phục hồi kinh tế

Đến năm 2022, một sự thay đổi rõ rệt trong trọng tâm của chính phủ đã xuất hiện. Mối đe dọa được nhận thức do ngành công nghiệp công nghệ gây ra dường như giảm dần so với thách thức suy thoái kinh tế đang rình rập. Singer giải thích: “Câu chuyện về sự trì trệ kinh tế đó và nỗ lực đảo ngược nó đã thực sự định hình rất nhiều chính sách trong 18 tháng qua”. Trung Quốc hiện đang tích cực theo đuổi việc áp dụng công nghệ tiên tiến. Các báo cáo chỉ ra rằng ít nhất 13 chính quyền thành phố và 10 công ty năng lượng nhà nước đã tích hợp các mô hình DeepSeek vào hệ thống hoạt động của họ.

Xu hướng tăng hiệu quả AI

Mô hình của Alibaba thể hiện một xu hướng tiếp tục trong lĩnh vực AI: tăng cường hiệu suất hệ thống một cách nhất quán cùng với việc giảm chi phí vận hành. Epoch AI, một tổ chức nghiên cứu phi lợi nhuận, ước tính rằng sức mạnh tính toán cần thiết để đào tạo các hệ thống AI đã tăng với tốc độ vượt quá 4 lần mỗi năm. Tuy nhiên, những tiến bộ đồng thời trong thiết kế thuật toán đã dẫn đến sự gia tăng gấp ba lần hiệu quả của sức mạnh tính toán đó mỗi năm. Về mặt thực tế, điều này có nghĩa là một hệ thống AI có thể đã yêu cầu 10.000 chip máy tính tiên tiến để đào tạo vào năm ngoái có thể được đào tạo chỉ với một phần ba số đó trong năm nay.

Vai trò quan trọng của chip máy tính cao cấp

Bất chấp những lợi ích hiệu quả ấn tượng này, Singer cảnh báo rằng chip máy tính cao cấp vẫn không thể thiếu cho sự phát triển AI tiên tiến. Thực tế này nhấn mạnh thách thức đang diễn ra do các biện pháp kiểm soát xuất khẩu của Hoa Kỳ đối với các chip này đối với các công ty AI của Trung Quốc như Alibaba và DeepSeek. Giám đốc điều hành của DeepSeek đã xác định cụ thể việc tiếp cận chip, thay vì nguồn tài chính hoặc nhân tài, là nút thắt cổ chai chính của họ.

Một mô hình mới: “Mô hình suy luận”

QwQ đại diện cho sự bổ sung mới nhất cho một thế hệ hệ thống AI đang phát triển được phân loại là “mô hình suy luận”. Một số chuyên gia xem đây là một sự thay đổi mô hình trong lĩnh vực AI. Trước đây, các hệ thống AI đã cải thiện thông qua sự kết hợp của việc mở rộng quy mô sức mạnh tính toán được sử dụng để đào tạo và nâng cao số lượng và chất lượng của dữ liệu đào tạo.

Mô hình mới này nhấn mạnh một cách tiếp cận khác. Nó liên quan đến việc lấy một mô hình đã trải qua quá trình đào tạo ban đầu – trong trường hợp này là Qwen 2.5-32B – và sau đó tăng đáng kể các tài nguyên tính toán được phân bổ cho hệ thống khi nó trả lời một truy vấn cụ thể. Như nhóm Qwen đã nói một cách hùng hồn, “khi được dành thời gian để suy ngẫm, đặt câu hỏi và phản ánh, sự hiểu biết của mô hình về toán học và lập trình sẽ nở rộ như một bông hoa mở ra với ánh mặt trời”. Quan sát này phù hợp với các xu hướng được thấy trong các mô hình phương Tây, trong đó các kỹ thuật cho phép kéo dài thời gian “suy nghĩ” đã dẫn đến những cải thiện đáng kể về hiệu suất đối với các nhiệm vụ phân tích phức tạp.

Phát hành Open-Weight và động lực thị trường

QwQ của Alibaba đã được phát hành theo mô hình “open weight”. Điều này có nghĩa là các trọng số, về cơ bản cấu thành mô hình và có thể truy cập được dưới dạng tệp máy tính, có thể được tải xuống và chạy cục bộ, ngay cả trên một máy tính xách tay cao cấp. Điều thú vị là, bản xem trước của mô hình được phát hành vào tháng 11 năm trước đã thu hút được ít sự chú ý hơn đáng kể. Singer lưu ý rằng “thị trường chứng khoán thường phản ứng với việc phát hành mô hình chứ không phải với quỹ đạo của công nghệ”, điều này được dự đoán sẽ tiếp tục tiến bộ nhanh chóng ở cả hai bờ Thái Bình Dương. Ông nhấn mạnh thêm, “Hệ sinh thái Trung Quốc có một loạt các người chơi trong đó, tất cả đều đang đưa ra các mô hình rất mạnh mẽ và hấp dẫn, và không rõ ai sẽ nổi lên, khi tất cả đã nói và làm, là có mô hình tốt nhất.”

Kiểm tra chi tiết kiến trúc của QwQ-32B

Mô hình QwQ-32B, mặc dù được xây dựng trên nền tảng của Qwen 2.5-32B, kết hợp một số sửa đổi kiến trúc chính và cải tiến đào tạo góp phần vào khả năng suy luận được cải thiện của nó. Những cải tiến này có thể được phân loại rộng rãi thành:

  • Mở rộng cửa sổ ngữ cảnh: Cửa sổ ngữ cảnh, xác định lượng văn bản mà mô hình có thể xem xét cùng một lúc, có khả năng đã được mở rộng đáng kể. Điều này cho phép QwQ-32B xử lý và hiểu các đoạn văn bản dài hơn, phức tạp hơn, dẫn đến khả năng hiểu tốt hơn và các phản hồi sắc thái hơn.

  • Cơ chế chú ý nâng cao: Cơ chế chú ý, một thành phần cốt lõi của các mô hình dựa trên transformer như QwQ-32B, có khả năng đã được tinh chỉnh. Điều này có thể liên quan đến các kỹ thuật như chú ý đa đầu (multi-headed attention) hoặc chú ý thưa thớt (sparse attention), cho phép mô hình tập trung hiệu quả hơn vào thông tin liên quan trong văn bản đầu vào và lọc ra nhiễu.

  • Học tăng cường từ phản hồi của con người (RLHF): Mặc dù không được nêu rõ ràng, nhưng rất có khả năng QwQ-32B đã được tinh chỉnh bằng RLHF. Kỹ thuật này liên quan đến việc đào tạo mô hình để tạo ra các đầu ra được người đánh giá là con người ưa thích, dẫn đến những cải tiến trong các lĩnh vực như tính mạch lạc, tính hữu ích và tính vô hại.

  • Tinh chỉnh hướng dẫn (Instruction Tuning): QwQ-32B có thể đã trải qua quá trình tinh chỉnh hướng dẫn sâu rộng, một quá trình trong đó mô hình được đào tạo trên một tập hợp đa dạng các hướng dẫn và đầu ra tương ứng. Điều này giúp mô hình khái quát hóa tốt hơn cho các nhiệm vụ mới và tuân theo các hướng dẫn chính xác hơn.

  • Chain-of-Thought Prompting: Mô hình được thiết kế rõ ràng để tận dụng chain-of-thought prompting, một kỹ thuật trong đó mô hình được khuyến khích tạo ra một loạt các bước suy luận trung gian trước khi đi đến câu trả lời cuối cùng. Điều này thúc đẩy suy luận có chủ ý và logic hơn.

Ý nghĩa đối với các ngành công nghiệp cụ thể

Những tiến bộ được thể hiện bởi QwQ-32B và các mô hình AI khác của Trung Quốc có ý nghĩa quan trọng đối với các ngành công nghiệp khác nhau, cả ở Trung Quốc và trên toàn cầu. Một số lĩnh vực chính có khả năng bị ảnh hưởng bao gồm:

  • Thương mại điện tử: Hoạt động kinh doanh cốt lõi của Alibaba, thương mại điện tử, có khả năng được hưởng lợi đáng kể từ khả năng AI được cải thiện. Điều này bao gồm các lĩnh vực như đề xuất được cá nhân hóa, chatbot dịch vụ khách hàng, phát hiện gian lận và tối ưu hóa chuỗi cung ứng.

  • Tài chính: Các mô hình AI có thể được sử dụng cho các nhiệm vụ như đánh giá rủi ro, phát hiện gian lận, giao dịch thuật toán và quản lý quan hệ khách hàng. Khả năng suy luận tăng lên của các mô hình như QwQ-32B có thể dẫn đến các dự đoán tài chính chính xác hơn và cải thiện việc ra quyết định.

  • Chăm sóc sức khỏe: AI có thể hỗ trợ khám phá thuốc, chẩn đoán bệnh, y học cá nhân hóa và theo dõi bệnh nhân. Các mô hình suy luận mạnh mẽ hơn có thể phân tích dữ liệu y tế phức tạp và cung cấp những hiểu biết mà trước đây không thể truy cập được.

  • Sản xuất: Tự động hóa dựa trên AI, kiểm soát chất lượng và bảo trì dự đoán có thể nâng cao hiệu quả và giảm chi phí trong các quy trình sản xuất.

  • Giao thông vận tải: Xe tự lái, hệ thống quản lý giao thông và tối ưu hóa hậu cần phụ thuộc rất nhiều vào AI. Những tiến bộ trong suy luận AI có thể góp phần vào mạng lưới giao thông an toàn và hiệu quả hơn.

  • Giáo dục: Các mô hình AI ngày càng được áp dụng để hỗ trợ tốt hơn cho học sinh, và thậm chí là dạy kèm cá nhân.

Tương lai của cạnh tranh và hợp tác AI

Sự tiến bộ nhanh chóng của các mô hình AI của Trung Quốc như QwQ-32B đặt ra những câu hỏi quan trọng về tương lai của cạnh tranh và hợp tác AI trên phạm vi toàn cầu. Mặc dù một động lực cạnh tranh chắc chắn tồn tại, đặc biệt là giữa Hoa Kỳ và Trung Quốc, cũng có những lợi ích tiềm năng cho sự hợp tác và chia sẻ kiến thức.

  • Mã nguồn mở so với mã nguồn đóng: Quyết định của Alibaba phát hành QwQ-32B dưới dạng mô hình open-weight là rất quan trọng. Nó trái ngược với cách tiếp cận của một số công ty AI phương Tây duy trì các mô hình của họ như các hệ thống độc quyền, mã nguồn đóng. Các mô hình mã nguồn mở có thể thúc đẩy sự hợp tác lớn hơn và tăng tốc đổi mới bằng cách cho phép các nhà nghiên cứu và nhà phát triển trên toàn thế giới xây dựng dựa trên công việc hiện có.

  • Chia sẻ dữ liệu và tiêu chuẩn hóa: Sự phát triển của các hệ thống AI mạnh mẽ và đáng tin cậy đòi hỏi một lượng lớn dữ liệu. Hợp tác quốc tế về chia sẻ dữ liệu và thiết lập các tiêu chuẩn chung có thể mang lại lợi ích cho toàn bộ cộng đồng AI.

  • Cân nhắc về đạo đức: Khi các hệ thống AI trở nên mạnh mẽ hơn, các cân nhắc về đạo đức ngày càng trở nên quan trọng. Đối thoại và hợp tác toàn cầu là rất cần thiết để đảm bảo rằng AI được phát triển và triển khai một cách có trách nhiệm, với các biện pháp bảo vệ thích hợp để giảm thiểu rủi ro tiềm ẩn.

  • Trao đổi nhân tài: Lĩnh vực AI được hưởng lợi từ một nhóm nhân tài đa dạng và phân tán trên toàn cầu. Tạo điều kiện trao đổi các nhà nghiên cứu và kỹ sư giữa các quốc gia có thể thúc đẩy chuyển giao kiến thức và tăng tốc tiến độ.

Sự xuất hiện của QwQ-32B và các mô hình AI tiên tiến khác của Trung Quốc đại diện cho một cột mốc quan trọng trong quá trình phát triển liên tục của trí tuệ nhân tạo. Nó làm nổi bật khả năng ngày càng tăng của hệ sinh thái công nghệ Trung Quốc và nhấn mạnh ý nghĩa toàn cầu của những tiến bộ AI. Những năm tới có khả năng chứng kiến sự tiến bộ nhanh chóng liên tục, cạnh tranh gay gắt và những lời kêu gọi hợp tác quốc tế ngày càng tăng để đảm bảo rằng AI mang lại lợi ích cho toàn nhân loại.