AI Trung Quốc: Ưu tiên tích hợp thực tế

Cuộc trò chuyện toàn cầu về trí tuệ nhân tạo thường dường như tập trung vào một cuộc chạy đua vũ trang không ngừng nghỉ – ai có thể xây dựng mô hình ngôn ngữ lớn (LLM) lớn nhất, mạnh mẽ nhất? Những tiến bộ gần đây, như khả năng ấn tượng được thể hiện bởi các mô hình như DeepSeek ở Trung Quốc, chắc chắn thúc đẩy câu chuyện này. Giữa bối cảnh kinh tế đầy thách thức, cả trên toàn cầu và trong nước, những bước nhảy vọt công nghệ như vậy mang đến một cái nhìn hấp dẫn về tiềm năng tương lai và có lẽ, một chất xúc tác rất cần thiết cho sự tăng trưởng. Tuy nhiên, chỉ tập trung vào những LLM gây chú ý này là bỏ lỡ bức tranh toàn cảnh. Trí tuệ nhân tạo, theo những cách ít phô trương hơn nhưng có tác động sâu sắc, đã được đan xen sâu sắc vào kết cấu cuộc sống số của chúng ta trong nhiều năm.

Hãy xem xét các nền tảng phổ biến thống trị tương tác và thương mại trực tuyến. Liệu TikTok, hay đối tác Trung Quốc của nó là Douyin, có thể đạt được phạm vi tiếp cận toàn cầu đáng kinh ngạc như vậy nếu không có các thuật toán đề xuất tinh vi liên tục điều chỉnh nguồn cấp nội dung không? Tương tự, những thành công của các gã khổng lồ thương mại điện tử, dù là những người chơi quốc tế như Amazon, Shein và Temu, hay các cường quốc trong nước như Taobao và JD.com, được xây dựng trên nhiều thứ hơn là chỉ tìm nguồn cung ứng và hậu cần hiệu quả. AI hoạt động như bàn tay vô hình, tinh tế điều khiển các lựa chọn của chúng ta. Từ những cuốn sách chúng ta cân nhắc mua đến các xu hướng thời trang chúng ta áp dụng, thói quen tiêu dùng của chúng ta ngày càng được định hình bởi các hệ thống phân tích các giao dịch mua trong quá khứ, lịch sử duyệt web và các mẫu nhấp chuột. Rất lâu trước khi AI đàm thoại có thể tạo ra những bài thơ tao nhã theo yêu cầu, các công ty như Amazon và Google đã đi tiên phong trong việc sử dụng AI để hiểu và dự đoán hành vi của người tiêu dùng, làm thay đổi căn bản thị trường. Hình thức AI yên tĩnh hơn, phổ biến hơn này đã định hình lại thương mại và tiêu thụ phương tiện truyền thông trong nhiều thập kỷ, thường hoạt động dưới ngưỡng nhận thức có ý thức.

Thanh Gươm Hai Lưỡi của Các Mô Hình Ngôn Ngữ Lớn

Sự xuất hiện của các LLM mạnh mẽ như DeepSeek không thể phủ nhận là một cột mốc công nghệ quan trọng. Khả năng tạo ra văn bản giống con người, dịch ngôn ngữ và thậm chí viết nội dung sáng tạo như thơ của chúng là đáng chú ý. Những công cụ này hứa hẹn rất lớn với tư cách là trợ lý cá nhân, trợ giúp nghiên cứu và đối tác sáng tạo. Hãy tưởng tượng việc tận dụng một mô hình như vậy để soạn thảo email, tóm tắt các tài liệu dài hoặc động não ý tưởng – tiềm năng nâng cao năng suất cá nhân là rõ ràng.

Tuy nhiên, sức mạnh này đi kèm với những cảnh báo đáng kể, bắt nguồn từ chính bản chất hoạt động của các mô hình này. LLM được xây dựng dựa trên các phương pháp thống kê phức tạp và mạng nơ-ron rộng lớn được đào tạo trên các bộ dữ liệu khổng lồ. Chúng xuất sắc trong việc xác định các mẫu và dự đoán chuỗi từ có khả năng xảy ra nhất, nhưng chúng không sở hữu sự hiểu biết thực sự hay ý thức. Nền tảng thống kê này dẫn đến một lỗ hổng nghiêm trọng: ảo giác (hallucinations). Khi đối mặt với các chủ đề nằm ngoài dữ liệu đào tạo của chúng hoặc các truy vấn đòi hỏi sự phán đoán tinh tế, LLM có thể tự tin tạo ra thông tin nghe có vẻ hợp lý nhưng hoàn toàn sai lệch hoặc gây hiểu lầm.

Hãy nghĩ về một LLM không phải như một nhà tiên tri không thể sai lầm, mà có lẽ như một chuyên gia cực kỳ uyên bác, hùng hồn, nhưng đôi khi bịa chuyện. Mặc dù DeepSeek có thể sáng tác một bài sonnet khuấy động, nhưng việc dựa vào nó để giải thích pháp lý quan trọng, chẩn đoán y tế chính xác hoặc tư vấn tài chính có rủi ro cao sẽ là rất thiếu thận trọng. Công cụ xác suất thống kê cho phép nó tạo ra văn bản trôi chảy cũng khiến nó dễ bịa đặt “sự thật” khi thiếu kiến thức xác định. Mặc dù các kiến trúc và mô hình lý luận mới hơn (như R1 của DeepSeek hoặc o1/o3 được đồn đại của OpenAI) nhằm mục đích giảm thiểu vấn đề này, chúng vẫn chưa loại bỏ được nó. Một LLM hoàn hảo, đảm bảo chính xác trong mọi trường hợp, vẫn còn khó nắm bắt. Do đó, mặc dù LLM có thể là công cụ mạnh mẽ cho các cá nhân, việc sử dụng chúng phải được tiết chế bằng đánh giá phê bình, đặc biệt là khi các quyết định dựa trên đầu ra của chúng mang trọng lượng đáng kể. Chúng tăng cường khả năng của con người; chúng không thay thế sự phán đoán của con người trong các lĩnh vực quan trọng.

Điều Hướng Việc Triển Khai AI của Doanh Nghiệp và Chính Phủ

Bất chấp những hạn chế cố hữu đối với các truy vấn mở, có rủi ro cao, LLM mang lại những đề xuất giá trị đáng kể cho các doanh nghiệp và cơ quan chính phủ, đặc biệt là trong các môi trường được kiểm soát. Điểm mạnh của chúng không nằm ở việc thay thế việc ra quyết định cuối cùng, mà ở việc hợp lý hóa quy trình và trích xuất thông tin chi tiết. Các ứng dụng chính bao gồm:

  • Tự động hóa quy trình: Xử lý các tác vụ thông thường như nhập dữ liệu, sàng lọc trước dịch vụ khách hàng, tóm tắt tài liệu và tạo báo cáo.
  • Tối ưu hóa quy trình làm việc: Xác định các điểm nghẽn, đề xuất cải tiến hiệu quả và quản lý các mốc thời gian dự án phức tạp dựa trên phân tích dữ liệu.
  • Phân tích dữ liệu: Xử lý các bộ dữ liệu khổng lồ để khám phá các xu hướng, mối tương quan và sự bất thường mà con người có thể bỏ sót, hỗ trợ lập kế hoạch chiến lược và phân bổ nguồn lực.

Một khía cạnh quan trọng đối với việc sử dụng của chính phủ và doanh nghiệp là bảo mật và bảo mật dữ liệu. Sự sẵn có của các mô hình mã nguồn mở như DeepSeek mang lại lợi thế ở đây. Các mô hình này có khả năng được lưu trữ trong cơ sở hạ tầng kỹ thuật số chuyên dụng, an toàn của chính phủ hoặc doanh nghiệp. Cách tiếp cận “tại chỗ” hoặc “đám mây riêng” này cho phép xử lý thông tin nhạy cảm hoặc bí mật mà không để lộ nó cho các máy chủ bên ngoài hoặc nhà cung cấp bên thứ ba, giảm thiểu các rủi ro đáng kể về quyền riêng tư và bảo mật.

Tuy nhiên, tính toán thay đổi đáng kể khi xem xét các ứng dụng chính phủ hướng tới công chúng nơi thông tin được cung cấp phải có thẩm quyền và chính xác một cách rõ ràng. Hãy tưởng tượng một công dân truy vấn một cổng thông tin chính phủ được hỗ trợ bởi LLM về điều kiện nhận trợ cấp xã hội, quy định thuế hoặc các thủ tục khẩn cấp. Ngay cả khi AI tạo ra các phản hồi hoàn toàn chính xác 99% thời gian, 1% còn lại các câu trả lời sai lệch hoặc không chính xác có thể gây ra hậu quả nghiêm trọng, làm xói mòn lòng tin của công chúng, gây khó khăn tài chính hoặc thậm chí gây nguy hiểm đến an toàn.

Điều này đòi hỏi việc thực hiện các biện pháp bảo vệ mạnh mẽ. Các giải pháp tiềm năng bao gồm:

  • Lọc truy vấn: Thiết kế các hệ thống để xác định các yêu cầu nằm ngoài phạm vi được xác định trước của các câu trả lời an toàn, có thể kiểm chứng.
  • Giám sát của con người: Gắn cờ các truy vấn phức tạp, mơ hồ hoặc có rủi ro cao để một chuyên gia con người xem xét và phản hồi.
  • Chấm điểm độ tin cậy: Lập trình AI để chỉ ra mức độ chắc chắn của nó về một câu trả lời, nhắc người dùng tìm kiếm xác minh cho các phản hồi có độ tin cậy thấp.
  • Xác thực câu trả lời: Đối chiếu các phản hồi do AI tạo ra với các cơ sở dữ liệu được quản lý gồm thông tin chính xác, đã biết trước khi trình bày chúng cho công chúng.

Các biện pháp này làm nổi bật sự căng thẳng cơ bản vốn có trong công nghệ LLM hiện tại: sự đánh đổi giữa sức mạnh tạo sinh ấn tượng của chúng và yêu cầu tuyệt đối về độ chính xác và độ tin cậy trong các bối cảnh quan trọng. Quản lý sự căng thẳng này là chìa khóa để triển khai AI có trách nhiệm trong khu vực công.

Hướng Tới AI Đáng Tin Cậy: Cách Tiếp Cận Đồ Thị Tri Thức

Cách tiếp cận của Trung Quốc dường như ngày càng tập trung vào việc điều hướng sự căng thẳng này bằng cách tích hợp AI vào các ứng dụng cụ thể, được kiểm soát trong khi tích cực tìm cách nâng cao độ tin cậy. Một ví dụ thuyết phục là sáng kiến thành phố thông minh đang diễn ra ở Zhuhai, một thành phố thuộc Khu vực Vịnh Lớn (Greater Bay Area). Chính quyền thành phố gần đây đã thực hiện một khoản đầu tư chiến lược đáng kể (khoảng 500 triệu nhân dân tệ hoặc 69 triệu đô la Mỹ) vào Zhipu AI, báo hiệu cam kết đưa AI tiên tiến vào cơ sở hạ tầng đô thị.

Tham vọng của Zhuhai vượt ra ngoài tự động hóa đơn giản. Mục tiêu là triển khai AI theo lớp, toàn diện nhằm cải thiện hữu hình các dịch vụ công. Điều này bao gồm tối ưu hóa luồng giao thông thông qua phân tích dữ liệu thời gian thực, tích hợp các luồng dữ liệu khác nhau giữa các phòng ban chính phủ khác nhau để ra quyết định toàn diện hơn, và cuối cùng, tạo ra một môi trường đô thị hiệu quả và đáp ứng tốt hơn cho người dân.

Trọng tâm của nỗ lực này là mô hình ngôn ngữ chung GLM-4 của Zhipu AI. Mặc dù thành thạo trong việc xử lý cả tác vụ tiếng Trung và tiếng Anh và sở hữu khả năng đa phương thức (xử lý thông tin ngoài văn bản), điểm khác biệt chính của nó nằm ở kiến trúc. Zhipu AI, một công ty tách ra từ Nhóm Kỹ thuật Tri thức (Knowledge Engineering Group) nổi tiếng của Đại học Tsinghua, kết hợp các bộ dữ liệu có cấu trúc và đồ thị tri thức vào quá trình học của mình. Không giống như các LLM thông thường chủ yếu học từ khối lượng lớn văn bản phi cấu trúc (như trang web và sách), Zhipu AI tận dụng rõ ràng các đồ thị tri thức được quản lý, có độ chính xác cao – các biểu diễn có cấu trúc của các sự kiện, thực thể và mối quan hệ của chúng.

Công ty tuyên bố cách tiếp cận này làm giảm đáng kể tỷ lệ ảo giác của mô hình, được báo cáo là đạt tỷ lệ thấp nhất trong một so sánh toàn cầu gần đây. Bằng cách đặt nền tảng cho các suy luận thống kê của AI trong một khuôn khổ kiến thức có cấu trúc, đã được xác minh (như ngụ ý từ nguồn gốc “Kỹ thuật Tri thức”), Zhipu AI nhằm mục đích xây dựng một công cụ nhận thức đáng tin cậy hơn. Điều này đại diện cho một bước đi thực tế khỏi các mô hình thuần túy thống kê hướng tới các hệ thống tích hợp nền tảng thực tế, nâng cao độ tin cậy cho các ứng dụng cụ thể như những ứng dụng được hình dung trong dự án thành phố thông minh của Zhuhai.

Cuộc Tìm Kiếm Sự Tích Hợp Thần Kinh-Biểu Tượng

Ví dụ về Zhipu AI gợi ý về một sự thay đổi rộng lớn hơn, cơ bản hơn được dự đoán trong sự phát triển của trí tuệ nhân tạo: sự tích hợp của mạng nơ-ron thống kê với lý luận logic biểu tượng. Trong khi các LLM hiện tại chủ yếu đại diện cho chiến thắng của mạng nơ-ron – xuất sắc trong nhận dạng mẫu, xử lý dữ liệu cảm giác và tạo ra các đầu ra có xác suất thống kê – giai đoạn tiếp theo có khả năng liên quan đến việc kết hợp khả năng “trực quan” này với lý luận có cấu trúc, dựa trên quy tắc đặc trưng của AI biểu tượng truyền thống.

Sự tích hợp thần kinh-biểu tượng (neuro-symbolic integration) này thường được mô tả là “chén thánh” trong nghiên cứu AI chính xác bởi vì nó hứa hẹn những gì tốt nhất của cả hai thế giới: khả năng học hỏi và thích ứng của mạng nơ-ron kết hợp với tính minh bạch, khả năng kiểm chứng và lý luận rõ ràng của các hệ thống biểu tượng. Hãy tưởng tượng một AI không chỉ nhận ra các mẫu trong dữ liệu mà còn có thể giải thích lý do của nó dựa trên các quy tắc, luật lệ hoặc nguyên tắc logic đã được thiết lập.

Việc đạt được sự tích hợp liền mạch đặt ra nhiều thách thức phức tạp, bao gồm các khuôn khổ lý thuyết, hiệu quả tính toán và triển khai thực tế. Tuy nhiên, việc xây dựng đồ thị tri thức mạnh mẽ đại diện cho một điểm khởi đầu hữu hình. Các cơ sở dữ liệu có cấu trúc về sự kiện và mối quan hệ này cung cấp nền tảng biểu tượng cần thiết để neo giữ các suy luận của mạng nơ-ron.

Người ta có thể hình dung một nỗ lực quy mô lớn, do nhà nước tài trợ ở Trung Quốc, có lẽ lặp lại công việc đồ sộ của việc biên soạn bộ bách khoa toàn thư Vĩnh Lạc Đại Điển (Yongle Dadian) dưới triều đại nhà Minh. Bằng cách mã hóa kỹ thuật số một lượng lớn thông tin đã được xác minh trong các lĩnh vực quan trọng nơi độ chính xác là không thể thương lượng – chẳng hạn như y học, luật, kỹ thuật và khoa học vật liệu – Trung Quốc có thể tạo ra các cấu trúc tri thức nền tảng. Việc neo giữ các mô hình AI trong tương lai vào các cơ sở tri thức có cấu trúc, được mã hóa này sẽ là một bước quan trọng hướng tới việc làm cho chúng đáng tin cậy hơn, ít bị ảo giác hơn và cuối cùng, đáng tin cậy hơn cho các ứng dụng quan trọng, có khả năng thúc đẩy các giới hạn của các lĩnh vực này trong quá trình đó.

Lái Xe Tự Hành: Lợi Thế Hệ Sinh Thái của Trung Quốc

Có lẽ đấu trường hấp dẫn nhất nơi Trung Quốc dường như sẵn sàng tận dụng sự tập trung vào AI tích hợp, đáng tin cậy là lái xe tự hành. Ứng dụng này khác biệt so với các mô hình ngôn ngữ đa năng vì an toàn không chỉ là mong muốn; nó là tối quan trọng. Vận hành một phương tiện trong môi trường thế giới thực phức tạp, khó đoán đòi hỏi nhiều hơn là chỉ nhận dạng mẫu; nó đòi hỏi các quyết định trong tích tắc dựa trên luật giao thông, các ràng buộc vật lý, cân nhắc đạo đức và lý luận dự đoán về hành vi của những người tham gia giao thông khác.

Do đó, các hệ thống lái xe tự hành đòi hỏi một kiến trúc thần kinh-biểu tượng thực sự.

  • Mạng nơ-ron rất cần thiết để xử lý luồng dữ liệu cảm giác từ camera, lidar và radar, xác định các đối tượng như người đi bộ, người đi xe đạp và các phương tiện khác, và hiểu môi trường xung quanh ngay lập tức.
  • Logic biểu tượng rất quan trọng để thực hiện các quy tắc giao thông (dừng đèn đỏ, nhường đường), tuân thủ các giới hạn vật lý (khoảng cách phanh, bán kính quay vòng), đưa ra các quyết định minh bạch, có thể kiểm chứng trong các tình huống phức tạp và thậm chí có khả năng điều hướng các tình huống khó xử về đạo đức (như các lựa chọn tai nạn không thể tránh khỏi, mặc dù đây vẫn là một lĩnh vực vô cùng phức tạp).

Một chiếc xe tự hành phải kết hợp hiệu quả “trực giác” dựa trên dữ liệu với lý luận dựa trên quy tắc, hoạt động nhất quán và có thể dự đoán được để đảm bảo an toàn thích ứng trong các tình huống năng động. Nó không thể chấp nhận loại “ảo giác” hoặc lỗi xác suất có thể chấp nhận được trong các ứng dụng AI ít quan trọng hơn.

Ở đây, Trung Quốc sở hữu một sự hội tụ độc đáo của các yếu tố tạo ra một hệ sinh thái màu mỡ cho việc phát triển và triển khai lái xe tự hành, được cho là vượt trội hơn các cường quốc toàn cầu khác:

  1. Chuỗi Cung Ứng Xe Điện Hàng Đầu Thế Giới: Trung Quốc thống trị sản xuất xe điện và các bộ phận của chúng, đặc biệt là pin, cung cấp một cơ sở công nghiệp vững chắc.
  2. Cơ Sở Hạ Tầng Sạc Rộng Khắp: Mạng lưới trạm sạc mở rộng nhanh chóng giúp giảm bớt nỗi lo về phạm vi hoạt động và hỗ trợ việc áp dụng xe điện rộng rãi.
  3. Mạng 5G Tiên Tiến: Giao tiếp băng thông cao, độ trễ thấp rất quan trọng cho giao tiếp giữa phương tiện với mọi thứ (V2X), cho phép phối hợp giữa các phương tiện và cơ sở hạ tầng.
  4. Tích Hợp Thành Phố Thông Minh: Các sáng kiến như của Zhuhai thể hiện sự sẵn lòng tích hợp các hệ thống giao thông với các mạng dữ liệu đô thị rộng lớn hơn, tối ưu hóa luồng giao thông và cho phép các tính năng AV tiên tiến.
  5. Gọi Xe Phổ Biến: Việc người tiêu dùng chấp nhận cao các ứng dụng gọi xe tạo ra một thị trường sẵn sàng cho các dịch vụ robotaxi, cung cấp một con đường rõ ràng để thương mại hóa xe tự hành.
  6. Tỷ Lệ Sử Dụng Xe Điện Cao: Người tiêu dùng Trung Quốc đã đón nhận xe điện dễ dàng hơn so với nhiều nước phương Tây, tạo ra một thị trường nội địa lớn.
  7. Môi Trường Pháp Lý Hỗ Trợ: Mặc dù an toàn vẫn là yếu tố then chốt, dường như có sự hỗ trợ của chính phủ cho việc thử nghiệm và triển khai các công nghệ tự hành, bằng chứng là các hoạt động robotaxi đã được tiến hành tại các thành phố như Wuhan.

Hãy đối chiếu điều này với các khu vực khác. Hoa Kỳ, bất chấp những nỗ lực tiên phong của Tesla, lại tụt hậu đáng kể về tỷ lệ sử dụng xe điện nói chung trong số các quốc gia phát triển, một xu hướng có khả năng trở nên trầm trọng hơn do những thay đổi chính sách. Châu Âu tự hào có tỷ lệ sử dụng xe điện cao nhưng lại thiếu sự tập trung tương tự của các nhà sản xuất xe điện nội địa thống trị hoặc các gã khổng lồ AI hàng đầu toàn cầu tập trung vào sự tích hợp này.

Do đó, lợi thế chiến lược của Trung Quốc dường như không nằm ở việc sở hữu LLM mạnh nhất duy nhất mà là ở việc điều phối hệ sinh thái phức tạp này. Các mảnh ghép đang khớp lại với nhau – từ năng lực sản xuất đến cơ sở hạ tầng kỹ thuật số và sự chấp nhận của người tiêu dùng – để có khả năng cho phép xe tự hành chuyển từ thử nghiệm thích hợp sang áp dụng chính thống trong thập kỷ này, thậm chí có thể chứng kiến sự cất cánh đáng kể trong năm nay. Sức mạnh biến đổi hoàn toàn sẽ được mở khóa khi những phương tiện này tích hợp liền mạch với cơ sở hạ tầng thành phố thông minh đang phát triển.

Chuyển Hướng Tập Trung: Từ Sức Mạnh Tính Toán Sang Hệ Sinh Thái Tích Hợp

Trong khi Hoa Kỳ và những người chơi khác thường dường như bị khóa trong một “cuộc đua tính toán”, tập trung vào ưu thế chip, cơ sở hạ tầng máy chủ khổng lồ và đạt được vị trí dẫn đầu về điểm chuẩn với các LLM ngày càng lớn hơn, Trung Quốc dường như đang theo đuổi một chiến lược bổ sung, có lẽ cuối cùng có tác động mạnh mẽ hơn. Chiến lược này nhấn mạnh sự tích hợp của AI vào các ứng dụng hữu hình, có khả năng biến đổi xã hội, ưu tiên độ tin cậy và sức mạnh tổng hợp của hệ sinh thái, đặc biệt là trong các lĩnh vực như lái xe tự hành và thành phố thông minh.

Điều này liên quan đến một động thái có chủ ý hướng tới các phương pháp tiếp cận thần kinh-biểu tượng, nhắm mục tiêu vào các lĩnh vực cụ thể có giá trị cao, quan trọng về an toàn, nơi các mô hình thống kê thuần túy không đáp ứng được. Lợi thế cạnh tranh thực sự có thể không nằm trong bất kỳ thuật toán hoặc mô hình đơn lẻ nào, bất kể sức mạnh hay hiệu quả chi phí của nó, mà nằm ở khả năng đan xen AI vào bối cảnh vật lý và kinh tế thông qua các hệ sinh thái toàn diện, tích hợp. Trung Quốc đang lặng lẽ đạt được những bước tiến hướng tới sự tích hợp thần kinh-biểu tượng thực tế, dành riêng cho từng lĩnh vực, nhìn xa hơn sự mê hoặc hiện tại với LLM hướng tới các ứng dụng có thể định hình lại cơ bản cuộc sống đô thị và giao thông vận tải. Tác động thực tế của AI trong tương lai có thể nằm ít hơn ở sự hùng hồn của các chatbot và nhiều hơn ở chức năng đáng tin cậy của các hệ thống phức tạp, được nhúng AI này.