Ant của Jack Ma tiên phong AI với chip Trung Quốc

Phương pháp tiếp cận sáng tạo của Ant trong đào tạo mô hình AI

Ant Group, gã khổng lồ fintech được Jack Ma hậu thuẫn, đã đạt được một bước đột phá quan trọng trong lĩnh vực trí tuệ nhân tạo (AI) bằng cách tận dụng các chất bán dẫn do Trung Quốc sản xuất. Phương pháp tiếp cận sáng tạo này đã cho phép công ty phát triển các kỹ thuật đào tạo mô hình AI, giúp giảm đáng kể 20% chi phí. Các nguồn tin thân cận với vấn đề này tiết lộ rằng Ant đã sử dụng chip nội địa, bao gồm cả chip từ công ty liên kết Alibaba Group Holding Ltd. và Huawei Technologies Co., để đào tạo các mô hình sử dụng phương pháp học máy Mixture of Experts (MoE).

Kết quả mà Ant đạt được tương đương với kết quả thu được khi sử dụng chip của Nvidia Corp., chẳng hạn như H800, một bộ xử lý mạnh mẽ bị Mỹ hạn chế xuất khẩu sang Trung Quốc. Mặc dù Ant vẫn tiếp tục sử dụng Nvidia để phát triển AI, nhưng công ty ngày càng phụ thuộc vào các giải pháp thay thế, bao gồm Advanced Micro Devices Inc. (AMD) và chip Trung Quốc, cho các mô hình mới nhất của mình.

Tham gia cuộc đua AI: Trung Quốc vs. Mỹ

Việc Ant tham gia vào lĩnh vực phát triển mô hình AI đặt công ty vào giữa cuộc cạnh tranh gay gắt giữa các công ty Trung Quốc và Mỹ. Cuộc đua này đã trở nên căng thẳng hơn kể từ khi DeepSeek chứng minh tiềm năng đào tạo các mô hình có khả năng cao với chi phí thấp hơn đáng kể so với các gã khổng lồ trong ngành như OpenAI và Google của Alphabet Inc., những công ty đã đầu tư hàng tỷ đô la. Thành tích của Ant nhấn mạnh quyết tâm của các công ty Trung Quốc trong việc sử dụng các giải pháp thay thế có nguồn gốc địa phương cho các chất bán dẫn Nvidia tiên tiến nhất.

Tiềm năng của suy luận AI với chi phí hiệu quả

Bài báo nghiên cứu được Ant công bố trong tháng này làm nổi bật tiềm năng của các mô hình của mình, tuyên bố hiệu suất vượt trội trong một số tiêu chuẩn nhất định so với Meta Platforms Inc., mặc dù những tuyên bố này chưa được Bloomberg News xác minh độc lập. Tuy nhiên, nếu các nền tảng của Ant hoạt động như quảng cáo, chúng có thể đại diện cho một tiến bộ đáng kể trong sự phát triển trí tuệ nhân tạo của Trung Quốc. Điều này chủ yếu là do khả năng giảm đáng kể chi phí suy luận, tức là quá trình hỗ trợ các dịch vụ AI.

Mixture of Experts: Thay đổi cuộc chơi trong AI

Khi các công ty đổ nguồn lực đáng kể vào AI, các mô hình MoE đã trở nên nổi bật như một phương pháp tiếp cận phổ biến và hiệu quả. Kỹ thuật này, được sử dụng bởi các công ty như Google và công ty khởi nghiệp DeepSeek có trụ sở tại Hàng Châu, liên quan đến việc chia các tác vụ thành các tập dữ liệu nhỏ hơn. Điều này tương tự như việc có một đội ngũ chuyên gia, mỗi người tập trung vào một phân đoạn cụ thể của công việc, từ đó tối ưu hóa toàn bộ quá trình.

Vượt qua nút thắt GPU

Theo truyền thống, việc đào tạo các mô hình MoE phụ thuộc rất nhiều vào các chip hiệu suất cao, chẳng hạn như bộ xử lý đồ họa (GPU) do Nvidia sản xuất. Chi phí đắt đỏ của các chip này là một trở ngại lớn đối với nhiều công ty nhỏ hơn, hạn chế việc áp dụng rộng rãi các mô hình MoE. Tuy nhiên, Ant đã nỗ lực làm việc trên các phương pháp để đào tạo các mô hình ngôn ngữ lớn (LLM) hiệu quả hơn, loại bỏ hiệu quả ràng buộc này. Tiêu đề của bài báo nghiên cứu của họ, đặt mục tiêu mở rộng quy mô một mô hình “mà không cần GPU cao cấp”, phản ánh rõ ràng mục tiêu này.

Thách thức sự thống trị của Nvidia

Cách tiếp cận của Ant trực tiếp thách thức chiến lược phổ biến mà CEO của Nvidia, Jensen Huang, ủng hộ. Huang đã liên tục lập luận rằng nhu cầu tính toán sẽ tiếp tục tăng, ngay cả với sự xuất hiện của các mô hình hiệu quả hơn như R1 của DeepSeek. Ông tin rằng các công ty sẽ cần chip tốt hơn để tạo ra doanh thu cao hơn, thay vì chip rẻ hơn để giảm chi phí. Do đó, Nvidia vẫn tập trung vào việc xây dựng các GPU lớn với lõi xử lý, bóng bán dẫn và dung lượng bộ nhớ tăng cường.

Định lượng khoản tiết kiệm chi phí

Ant đã cung cấp số liệu cụ thể để chứng minh tính hiệu quả về chi phí của phương pháp tối ưu hóa của mình. Công ty tuyên bố rằng việc đào tạo 1 nghìn tỷ token bằng phần cứng hiệu suất cao sẽ tốn khoảng 6,35 triệu nhân dân tệ (880.000 USD). Tuy nhiên, bằng cách sử dụng phần cứng có thông số kỹ thuật thấp hơn và các kỹ thuật tối ưu hóa của mình, Ant có thể giảm chi phí này xuống còn 5,1 triệu nhân dân tệ. Token đại diện cho các đơn vị thông tin mà một mô hình xử lý để tìm hiểu về thế giới và cung cấp các phản hồi liên quan đến các truy vấn của người dùng.

Tận dụng những đột phá AI cho các giải pháp công nghiệp

Ant có kế hoạch tận dụng những tiến bộ gần đây của mình trong các mô hình ngôn ngữ lớn, cụ thể là Ling-Plus và Ling-Lite, để phát triển các giải pháp AI công nghiệp cho các lĩnh vực như chăm sóc sức khỏe và tài chính. Các mô hình này được thiết kế để giải quyết các nhu cầu cụ thể của ngành và cung cấp các giải pháp phù hợp.

Mở rộng ứng dụng AI trong chăm sóc sức khỏe

Cam kết của Ant đối với lĩnh vực chăm sóc sức khỏe được thể hiện rõ qua việc tích hợp nền tảng trực tuyến Haodf.com của Trung Quốc vào các dịch vụ trí tuệ nhân tạo của mình. Thông qua việc tạo ra AI Doctor Assistant, Ant hướng tới mục tiêu hỗ trợ mạng lưới rộng lớn gồm 290.000 bác sĩ của Haodf bằng cách hỗ trợ các tác vụ như quản lý hồ sơ bệnh án. Ứng dụng AI này có tiềm năng cải thiện đáng kể hiệu quả và độ chính xác trong việc cung cấp dịch vụ chăm sóc sức khỏe.

Hỗ trợ dựa trên AI cho cuộc sống hàng ngày

Ngoài lĩnh vực chăm sóc sức khỏe, Ant cũng đã phát triển một ứng dụng ‘trợ lý cuộc sống’ AI có tên Zhixiaobao và một dịch vụ tư vấn tài chính AI có tên Maxiaocai. Các ứng dụng này thể hiện tham vọng của Ant trong việc tích hợp AI vào các khía cạnh khác nhau của cuộc sống hàng ngày, cung cấp cho người dùng sự hỗ trợ cá nhân hóa và thông minh.

Điểm chuẩn hiệu suất: Mô hình Ling so với đối thủ cạnh tranh

Trong bài báo nghiên cứu của mình, Ant tuyên bố rằng mô hình Ling-Lite vượt trội hơn một trong các mô hình Llama của Meta trong một tiêu chuẩn quan trọng để hiểu ngôn ngữ tiếng Anh. Hơn nữa, cả hai mô hình Ling-Lite và Ling-Plus đều thể hiện hiệu suất vượt trội so với các mô hình tương đương của DeepSeek trên các tiêu chuẩn ngôn ngữ Trung Quốc. Điều này làm nổi bật vị thế cạnh tranh của Ant trong bối cảnh AI.

Như Robin Yu, giám đốc công nghệ của nhà cung cấp giải pháp AI có trụ sở tại Bắc Kinh Shengshang Tech Co., đã nhận xét một cách thích hợp, “Nếu bạn tìm thấy một điểm tấn công để đánh bại võ sư kung fu giỏi nhất thế giới, bạn vẫn có thể nói rằng bạn đã đánh bại họ, đó là lý do tại sao ứng dụng trong thế giới thực là quan trọng.”

Mã nguồn mở để hợp tác và đổi mới

Ant đã cung cấp mã nguồn mở cho các mô hình Ling, thúc đẩy sự hợp tác và đổi mới trong cộng đồng AI. Ling-Lite bao gồm 16,8 tỷ tham số, là các cài đặt có thể điều chỉnh để kiểm soát hiệu suất của mô hình. Mặt khác, Ling-Plus tự hào có 290 tỷ tham số lớn hơn đáng kể, đưa nó vào hàng ngũ các mô hình ngôn ngữ lớn hơn. Để cung cấp ngữ cảnh, các chuyên gia ước tính rằng GPT-4.5 của ChatGPT có khoảng 1,8 nghìn tỷ tham số, trong khi DeepSeek-R1 có 671 tỷ.

Giải quyết những thách thức trong đào tạo mô hình

Hành trình của Ant trong việc phát triển các mô hình này không phải là không có thách thức. Công ty đã gặp khó khăn trong một số lĩnh vực đào tạo nhất định, đặc biệt là liên quan đến tính ổn định. Ngay cả những thay đổi nhỏ trong phần cứng hoặc cấu trúc của mô hình cũng có thể dẫn đến các vấn đề, bao gồm cả sự dao động trong tỷ lệ lỗi của mô hình. Điều này nhấn mạnh sự phức tạp và nhạy cảm liên quan đến việc đào tạo các mô hình AI tiên tiến.

Triển khai thực tế trong chăm sóc sức khỏe

Cam kết của Ant đối với các ứng dụng thực tế được thể hiện rõ hơn bằng việc triển khai các máy mô hình lớn tập trung vào chăm sóc sức khỏe. Các máy này hiện đang được sử dụng bởi bảy bệnh viện và nhà cung cấp dịch vụ chăm sóc sức khỏe ở các thành phố lớn như Bắc Kinh và Thượng Hải. Mô hình lớn tận dụng DeepSeek R1, Qwen của Alibaba và LLM của riêng Ant để cung cấp các dịch vụ tư vấn y tế.

Tác nhân AI để tăng cường dịch vụ chăm sóc sức khỏe

Ngoài các máy mô hình lớn, Ant đã giới thiệu hai tác nhân AI y tế: Angel và Yibaoer. Angel đã phục vụ hơn 1.000 cơ sở y tế, trong khi Yibaoer cung cấp hỗ trợ cho các dịch vụ bảo hiểm y tế. Hơn nữa, vào tháng 9 năm trước, Ant đã ra mắt dịch vụ AI Healthcare Manager trong ứng dụng thanh toán Alipay của mình, mở rộng hơn nữa phạm vi tiếp cận trong lĩnh vực chăm sóc sức khỏe. Những sáng kiến này thể hiện sự cống hiến của Ant trong việc tận dụng AI để chuyển đổi và cải thiện việc cung cấp dịch vụ chăm sóc sức khỏe.