Đấu trường trí tuệ nhân tạo, một bối cảnh đặc trưng bởi sự đổi mới nhanh chóng và cạnh tranh khốc liệt, đang chứng kiến sự trỗi dậy của những đối thủ mới thách thức các gã khổng lồ đã thành danh. Trong số những lực lượng mới nổi này có Zhipu AI, một công ty đang có những bước tiến đáng kể, đặc biệt là với việc giới thiệu mô hình GLM-4 của mình. Câu hỏi trung tâm vang vọng khắp các hành lang công nghệ là làm thế nào sản phẩm mới này có thể sánh được với tiêu chuẩn đáng gờm do GPT-4 được công nhận rộng rãi của OpenAI đặt ra. Việc xem xét các chỉ số hiệu suất, phương pháp tiếp cận thị trường, nền tảng công nghệ và hỗ trợ tài chính tương ứng của họ cho thấy một cuộc đối đầu hấp dẫn đang diễn ra trong cuộc đua AI toàn cầu.
Đo lường các Gã khổng lồ: Chuẩn mực Hiệu suất và Tuyên bố
Trọng tâm của sự so sánh nằm ở khía cạnh quan trọng về hiệu suất. Zhipu AI đã đưa ra những khẳng định táo bạo về mô hình GLM-4 của mình, tuyên bố rằng nó không chỉ cạnh tranh mà còn thực sự vượt trội hơn GPT-4 của OpenAI trên một loạt các tiêu chuẩn đánh giá chuẩn hóa. Đây không phải là một tuyên bố nhỏ; đó là một thách thức trực tiếp đối với một mô hình thường được coi là tiêu chuẩn vàng của ngành. Các tiêu chuẩn cụ thể được trích dẫn – MMLU (Massive Multitask Language Understanding), GSM8K (Grade School Math 8K), MATH (Measuring Mathematical Problem Solving), BBH (Big-Bench Hard), GPQA (Graduate-Level Google-Proof Q&A), và HumanEval (Human-Level Programming Evaluation) – đại diện cho một loạt các nhiệm vụ nhận thức phức tạp đa dạng.
- MMLU kiểm tra bề rộng kiến thức và khả năng giải quyết vấn đề của mô hình trên hàng chục môn học, mô phỏng một kỳ thi học thuật toàn diện. Việc xuất sắc ở đây cho thấy sự hiểu biết chung mạnh mẽ về thế giới.
- GSM8K tập trung đặc biệt vào các bài toán suy luận toán học nhiều bước thường gặp ở cuối cấp tiểu học hoặc đầu cấp trung học cơ sở, kiểm tra khả năng suy luận logic và thao tác số học.
- MATH nâng cao độ phức tạp này, giải quyết các bài toán từ tiền giải tích đến giải tích và hơn thế nữa, đòi hỏi sự thấu hiểu toán học tinh vi.
- BBH bao gồm một bộ các nhiệm vụ được chọn đặc biệt từ tiêu chuẩn Big-Bench lớn hơn vì chúng tỏ ra đặc biệt thách thức đối với các mô hình AI trước đó, thăm dò các lĩnh vực như suy luận logic, ý thức thông thường và điều hướng sự mơ hồ.
- GPQA đưa ra các câu hỏi được thiết kế để gây khó khăn ngay cả đối với những người có năng lực cao trả lời nhanh chóng bằng cách sử dụng công cụ tìm kiếm, nhấn mạnh vào khả năng suy luận sâu và tổng hợp kiến thức thay vì truy xuất thông tin đơn giản.
- HumanEval đánh giá khả năng của mô hình trong việc tạo ra mã chức năng chính xác từ các docstring, một khả năng quan trọng cho các ứng dụng phát triển phần mềm.
Lập luận của Zhipu AI là GLM-4 bằng hoặc đạt điểm cao hơn so với GPT-4 trong các bài kiểm tra đòi hỏi khắt khe này. Tuyên bố này đã thu hút sự chú ý đáng kể sau khi một bài báo nghiên cứu được công bố vào tháng 6 năm 2024. Theo các báo cáo xung quanh bài báo này, các phát hiện chỉ ra rằng GLM-4 đã chứng minh mức hiệu suất gần như tương đương, và trong một số trường hợp vượt trội, so với GPT-4 trên một số chỉ số đánh giá chung.
Tuy nhiên, điều quan trọng là phải tiếp cận những tuyên bố như vậy với sự nghiêm ngặt trong phân tích. Các tiêu chuẩn hiệu suất, mặc dù có giá trị, chỉ cung cấp một bức tranh một phần. Các phiên bản cụ thể của các mô hình được thử nghiệm (cả GLM-4 và GPT-4 đều phát triển), điều kiện thử nghiệm chính xác và khả năng ‘dạy theo bài kiểm tra’ (tối ưu hóa các mô hình đặc biệt cho hiệu suất tiêu chuẩn thay vì tiện ích trong thế giới thực) đều là những yếu tố cần được xem xét. Hơn nữa, các tuyên bố bắt nguồn từ nghiên cứu liên quan trực tiếp đến nhà phát triển mô hình tự nhiên mời gọi sự xem xét kỹ lưỡng về khả năng thiên vị. Việc xác minh độc lập, của bên thứ ba trong các điều kiện tiêu chuẩn hóa là điều cần thiết để xác nhận một cách chắc chắn những lợi thế về hiệu suất như vậy. OpenAI, trong lịch sử, cũng đã công bố kết quả tiêu chuẩn của riêng mình, thường thể hiện thế mạnh của GPT-4, góp phần vào một câu chuyện phức tạp và đôi khi gây tranh cãi về khả năng của mô hình. Cộng đồng AI háo hức chờ đợi các phân tích so sánh độc lập, rộng rãi hơn để định vị đầy đủ các khẳng định về hiệu suất của Zhipu AI trong hệ thống phân cấp cạnh tranh. Tuy nhiên, hành động đơn thuần là tuyên bố ngang bằng hoặc vượt trội, được hỗ trợ bởi nghiên cứu ban đầu, báo hiệu tham vọng và sự tự tin của Zhipu AI vào những tiến bộ công nghệ của mình.
Động thái Chiến lược: Thâm nhập Thị trường và Tiếp cận Người dùng
Ngoài hiệu suất thô, các chiến lược được sử dụng để đưa những công cụ AI mạnh mẽ này đến người dùng khác nhau đáng kể, tiết lộ các triết lý và mục tiêu thị trường riêng biệt. Zhipu AI đã áp dụng một chiến lược thu hút người dùng đặc biệt tích cực bằng cách cung cấp tác nhân AI mới của mình, AutoGLM Rumination, hoàn toàn miễn phí. Động thái này loại bỏ rào cản đăng ký thường giới hạn quyền truy cập vào các tính năng tiên tiến nhất do các đối thủ cạnh tranh cung cấp, bao gồm cả OpenAI. Bằng cách cung cấp các khả năng AI tinh vi mà không cần chi phí trả trước, Zhipu AI có khả năng nhắm đến việc nhanh chóng nuôi dưỡng một lượng lớn người dùng, thu thập dữ liệu sử dụng có giá trị để tinh chỉnh mô hình hơn nữa và thiết lập một chỗ đứng vững chắc trong các thị trường nhạy cảm về chi phí hoặc tìm kiếm các lựa chọn thay thế cho các nền tảng phương Tây thống trị. Cách tiếp cận truy cập mở này có thể tỏ ra đặc biệt hiệu quả trong việc thu hút người dùng cá nhân, sinh viên, nhà nghiên cứu và các doanh nghiệp nhỏ hơn đang khám phá việc tích hợp AI mà không cần cam kết tài chính đáng kể.
Điều này hoàn toàn trái ngược với mô hình đã được thiết lập của OpenAI. Mặc dù OpenAI cung cấp quyền truy cập miễn phí vào các phiên bản cũ hơn của mô hình của mình (như GPT-3.5 qua ChatGPT) và quyền truy cập hạn chế vào các khả năng mới hơn, việc mở khóa toàn bộ sức mạnh và các tính năng mới nhất của GPT-4 thường yêu cầu đăng ký trả phí (ví dụ: ChatGPT Plus) hoặc liên quan đến việc định giá dựa trên mức sử dụng thông qua API của nó cho các nhà phát triển và khách hàng doanh nghiệp. Chiến lược cao cấp này tận dụng lợi thế hiệu suất được nhận thức và danh tiếng đã được thiết lập của GPT-4, nhắm mục tiêu đến người dùng và tổ chức sẵn sàng trả tiền cho các khả năng tiên tiến, độ tin cậy và thường là hỗ trợ tích hợp tốt hơn. Doanh thu từ đăng ký thúc đẩy nghiên cứu và phát triển liên tục, hỗ trợ cơ sở hạ tầng tính toán khổng lồ và cung cấp một con đường rõ ràng để đạt được lợi nhuận.
Hàm ý của những chiến lược khác biệt này là rất sâu sắc. Việc cung cấp miễn phí của Zhipu AI có thể dân chủ hóa quyền truy cập vào các công cụ AI tiên tiến, thúc đẩy thử nghiệm rộng rãi hơn và có khả năng đẩy nhanh việc áp dụng AI trong một số lĩnh vực hoặc khu vực nhất định. Tuy nhiên, tính bền vững tài chính dài hạn của một mô hình như vậy vẫn là một câu hỏi. Việc kiếm tiền cuối cùng có thể đến thông qua các tính năng cao cấp, giải pháp doanh nghiệp, quyền truy cập API hoặc các con đường khác chưa được tiết lộ đầy đủ. Ngược lại, mô hình trả phí của OpenAI đảm bảo một nguồn doanh thu trực tiếp nhưng có khả năng hạn chế phạm vi tiếp cận của nó so với một đối thủ cạnh tranh miễn phí, đặc biệt là đối với những người dùng quan tâm đến chi phí. Sự thành công của mỗi chiến lược sẽ phụ thuộc vào các yếu tố như giá trị cảm nhận, hiệu suất thực tế của mô hình trong các tác vụ thực tế (ngoài các tiêu chuẩn), trải nghiệm người dùng, sự tin cậy và bối cảnh pháp lý đang phát triển chi phối việc triển khai AI. Cuộc chiến giành người dùng không chỉ về các tính năng, mà còn cơ bản về khả năng tiếp cận và mô hình kinh doanh.
Bên trong: Sự khác biệt về Công nghệ
Trong khi các tiêu chuẩn hiệu suất và chiến lược thị trường cung cấp cái nhìn từ bên ngoài, công nghệ cơ bản cung cấp cái nhìn sâu sắc về các phương pháp tiếp cận độc đáo được thực hiện bởi mỗi công ty. Zhipu AI nhấn mạnh công nghệ độc quyền của mình, nêu bật các thành phần cụ thể như mô hình suy luận GLM-Z1-Air và mô hình nền tảng GLM-4-Air-0414. Những cái tên này gợi ý một kiến trúc được thiết kế riêng với các khả năng cụ thể trong tâm trí. Việc chỉ định ‘mô hình suy luận’ ngụ ý sự tập trung vào các nhiệm vụ đòi hỏi suy luận logic, suy luận nhiều bước và có khả năng giải quyết vấn đề phức tạp hơn so với việc khớp mẫu hoặc tạo văn bản đơn giản. Việc kết hợp điều này với một mô hình nền tảng được tối ưu hóa cho các ứng dụng như tìm kiếm trên web và viết báo cáo cho thấy một nỗ lực chiến lược để xây dựng các tác nhân AI thành thạo trong việc thu thập thông tin, tổng hợp và tạo ra đầu ra có cấu trúc – những nhiệm vụ quan trọng đối với nhiều ứng dụng kinh doanh và nghiên cứu thực tế.
Việc phát triển các thành phần riêng biệt, được đặt tên như GLM-Z1-Air cho thấy một cách tiếp cận mô-đun, có khả năng cho phép Zhipu AI tối ưu hóa các phần khác nhau của quy trình nhận thức một cách độc lập. Điều này có thể dẫn đến hiệu quả hoặc nâng cao khả năng trong các lĩnh vực mục tiêu. Mặc dù chi tiết về các kiến trúc cụ thể vẫn là độc quyền, sự tập trung vào ‘suy luận’ và các mô hình nền tảng tập trung vào ứng dụng gợi ý một nỗ lực vượt ra ngoài khả năng làm chủ ngôn ngữ đa mục đích hướng tới trí thông minh chuyên biệt hơn, hướng đến nhiệm vụ.
GPT-4 của OpenAI, mặc dù phần lớn cũng là một hộp đen về hoạt động bên trong của nó, thường được hiểu là một mô hình dựa trên transformer khổng lồ. Suy đoán và một số báo cáo cho thấy nó có thể sử dụng các kỹ thuật như Mixture of Experts (MoE), nơi các phần khác nhau của mạng chuyên xử lý các loại dữ liệu hoặc nhiệm vụ khác nhau, cho phép quy mô và hiệu quả lớn hơn mà không cần kích hoạt toàn bộ số lượng tham số khổng lồ cho mọi truy vấn. Trọng tâm của OpenAI thường được miêu tả là đẩy lùi ranh giới của các mô hình ngôn ngữ quy mô lớn, đa mục đích có khả năng giải quyết một loạt các nhiệm vụ cực kỳ rộng lớn, từ viết sáng tạo và hội thoại đến mã hóa và phân tích phức tạp.
Việc so sánh nền tảng công nghệ là một thách thức nếu không có sự minh bạch hoàn toàn. Tuy nhiên, việc Zhipu đề cập rõ ràng đến một ‘mô hình suy luận’ và các mô hình nền tảng tập trung vào ứng dụng tương phản với nhận thức tổng quát hơn về kiến trúc của GPT-4. Điều này có thể biểu thị các triết lý thiết kế khác nhau: Zhipu có khả năng tập trung vào việc tối ưu hóa các quy trình công việc phức tạp cụ thể (như nghiên cứu và báo cáo thông qua AutoGLM Rumination), trong khi OpenAI tiếp tục mở rộng quy mô một trí thông minh thích ứng phổ quát hơn. Hiệu quả của những đặt cược công nghệ khác nhau này sẽ trở nên rõ ràng hơn khi các mô hình được áp dụng cho một phạm vi rộng hơn các vấn đề trong thế giới thực, tiết lộ liệu các kiến trúc chuyên biệt hay tổng quát cuối cùng tỏ ra có lợi hơn hay liệu các phương pháp tiếp cận khác nhau có vượt trội trong các lĩnh vực riêng biệt hay không. Việc đầu tư vào công nghệ độc quyền nhấn mạnh nỗ lực R&D mạnh mẽ cần thiết để cạnh tranh ở cấp độ cao nhất của phát triển AI.
Tiếp lửa cho Sự trỗi dậy: Tài trợ và Quỹ đạo Tăng trưởng
Việc phát triển các mô hình AI tiên tiến như GLM-4 và GPT-4 đòi hỏi nguồn lực khổng lồ – cho nghiên cứu, thu hút nhân tài và quan trọng là sức mạnh tính toán khổng lồ cần thiết cho việc đào tạo và suy luận. Sự nổi lên của Zhipu AI như một đối thủ cạnh tranh nghiêm túc được củng cố đáng kể bởi sự hỗ trợ tài chính đáng kể. Các báo cáo chỉ ra rằng công ty đã đảm bảo các khoản đầu tư đáng kể, định vị mạnh mẽ trong bối cảnh AI cạnh tranh cao, đặc biệt là ở China. Mặc dù các nhà đầu tư cụ thể và con số chính xác thường được giữ bí mật, việc đảm bảo các vòng tài trợ lớn là sự xác nhận quan trọng về tiềm năng của một công ty và cung cấp nhiên liệu cần thiết cho sự tăng trưởng và đổi mới bền vững.
Nguồn tài trợ này cho phép Zhipu AI cạnh tranh để giành lấy những tài năng AI hàng đầu, đầu tư mạnh vào nghiên cứu và phát triển để tinh chỉnh các mô hình của mình và khám phá các kiến trúc mới, đồng thời mua sắm các cụm GPU đắt tiền cần thiết cho việc đào tạo mô hình quy mô lớn. Nó cũng cho phép công ty theo đuổi các chiến lược thị trường tích cực, chẳng hạn như cung cấp quyền truy cập miễn phí vào các công cụ nhất định như AutoGLM Rumination, điều này có thể khó khăn về mặt tài chính nếu không có sự hỗ trợ mạnh mẽ. Sự hỗ trợ mà Zhipu AI đã thu được phản ánh sự tin tưởng từ cộng đồng đầu tư, có khả năng bao gồm các công ty đầu tư mạo hiểm, đối tác chiến lược của công ty hoặc thậm chí các quỹ liên kết nhà nước, phù hợp với trọng tâm chiến lược quốc gia của China trong việc thúc đẩy năng lực AI.
Tình hình này phản ánh, nhưng khác biệt, so với môi trường tài trợ cho các đối tác phương Tây như OpenAI. OpenAI nổi tiếng đã chuyển đổi từ một phòng thí nghiệm nghiên cứu phi lợi nhuận thành một thực thể lợi nhuận giới hạn, đảm bảo các khoản đầu tư khổng lồ, đáng chú ý nhất là quan hệ đối tác trị giá hàng tỷ đô la với Microsoft. Quan hệ đối tác này không chỉ cung cấp vốn mà còn cung cấp quyền truy cập vào cơ sở hạ tầng đám mây Azure của Microsoft, rất quan trọng để xử lý các yêu cầu tính toán của các mô hình như GPT-4. Các phòng thí nghiệm AI hàng đầu khác, chẳng hạn như Anthropic và Google DeepMind, cũng được hưởng lợi từ sự hỗ trợ đáng kể của công ty hoặc đầu tư mạo hiểm.
Do đó, bối cảnh tài trợ là một chiến trường quan trọng trong cuộc đua AI toàn cầu. Việc tiếp cận vốn trực tiếp chuyển thành khả năng xây dựng các mô hình lớn hơn, có năng lực hơn và triển khai chúng trên quy mô lớn. Việc gây quỹ thành công của Zhipu AI chứng tỏ khả năng điều hướng môi trường rủi ro cao này và định vị nó như một người chơi chủ chốt trong hệ sinh thái AI đang phát triển mạnh mẽ của China. Sức mạnh tài chính này là không thể thiếu để thách thức những người đương nhiệm như OpenAI và giành lấy một phần đáng kể của thị trường AI toàn cầu đang mở rộng nhanh chóng. Nguồn và quy mô tài trợ cũng có thể ảnh hưởng tinh tế đến định hướng chiến lược, ưu tiên nghiên cứu và định vị thị trường của một công ty, thêm một lớp phức tạp khác vào động lực cạnh tranh.
Thách thức AI Đang tiến triển: Góc nhìn Cạnh tranh Rộng hơn
Trong khi sự so sánh trực tiếp giữa GLM-4 của Zhipu AI và GPT-4 của OpenAI rất hấp dẫn, nó diễn ra trong một hệ sinh thái AI toàn cầu rộng lớn và cạnh tranh khốc liệt hơn nhiều. Những tiến bộ và định vị chiến lược của Zhipu AI đại diện cho một thách thức đáng kể không chỉ đối với OpenAI mà còn đối với toàn bộ tầng lớp thượng lưu của các nhà phát triển AI trên toàn thế giới. Bối cảnh còn lâu mới là một cuộc đua song mã. Google DeepMind tiếp tục đẩy mạnh giới hạn với dòng Gemini của mình, Anthropic thu hút sự chú ý với các mô hình Claude nhấn mạnh các nguyên tắc an toàn và AI hiến định, Meta đóng góp đáng kể với các mô hình Llama mã nguồn mở mạnh mẽ của mình, và nhiều phòng thí nghiệm nghiên cứu và công ty công nghệ khác liên tục đổi mới.
Ngay tại China, Zhipu AI hoạt động giữa một bối cảnh AI sôi động và phát triển nhanh chóng, cạnh tranh với các đối thủ lớn trong nước khác được hỗ trợ bởi các gã khổng lồ công nghệ như Alibaba, Baidu và Tencent, mỗi công ty đều đầu tư mạnh vào các mô hình ngôn ngữ lớn và ứng dụng AI. Sự cạnh tranh nội bộ này tiếp tục thúc đẩy sự đổi mới và thúc đẩy các công ty như Zhipu AI tạo sự khác biệt thông qua hiệu suất, khả năng chuyên biệt hoặc chiến lược thị trường.
Sự trỗi dậy của các đối thủ cạnh tranh đáng tin cậy như Zhipu AI đang định hình lại cơ bản ngành công nghiệp AI. Nó tăng cường áp lực lên các nhà lãnh đạo đã thành danh như OpenAI phải liên tục đổi mới và biện minh cho việc định giá cao cấp hoặc sự thống trị thị trường của họ. Nó cung cấp cho người dùng và doanh nghiệp nhiều lựa chọn hơn, có khả năng dẫn đến cạnh tranh về giá và sự đa dạng hóa các công cụ AI phù hợp với các nhu cầu, ngôn ngữ hoặc bối cảnh văn hóa khác nhau. Sự tập trung của Zhipu, có khả năng tận dụng thế mạnh của mình trong việc hiểu ngôn ngữ và văn hóa Trung Quốc, có thể mang lại lợi thế cho họ tại các thị trường khu vực cụ thể.
Hơn nữa, sự cạnh tranh vượt ra ngoài khả năng của mô hình để bao gồm việc thu hút nhân tài, tiếp cận dữ liệu đào tạo chất lượng cao, phát triển phần cứng hiệu quả (như GPU và bộ tăng tốc AI chuyên dụng) và điều hướng các khung pháp lý phức tạp và đang phát triển ở các khu vực pháp lý khác nhau. Các cân nhắc địa chính trị cũng đóng một vai trò không thể phủ nhận, với lợi ích quốc gia ảnh hưởng đến các chính sách tài trợ, hợp tác và chuyển giao công nghệ.
Chiến lược của Zhipu AI, kết hợp các tuyên bố về hiệu suất vượt trội với mô hình truy cập mở cho các công cụ nhất định, đại diện cho một sự kết hợp mạnh mẽ được thiết kế để phá vỡ hiện trạng. Liệu GLM-4 có luôn đáp ứng được các tuyên bố về hiệu suất của mình trong các thử nghiệm độc lập, rộng rãi hay không và liệu chiến lược thị trường của Zhipu AI có chứng tỏ được tính bền vững và hiệu quả hay không vẫn là những câu hỏi bỏ ngỏ. Tuy nhiên, sự xuất hiện của nó chắc chắn báo hiệu rằng cuộc đua giành quyền tối cao về AI đang trở nên đa cực, năng động và cạnh tranh khốc liệt hơn. Ngành công nghiệp, các nhà đầu tư và người dùng trên toàn thế giới đang theo dõi chặt chẽ khi những gã khổng lồ AI này tranh giành vị trí dẫn đầu về công nghệ và thị phần trong một lĩnh vực sẵn sàng định nghĩa lại vô số khía cạnh của nền kinh tế và xã hội toàn cầu. Môi trường áp lực cao đảm bảo rằng tốc độ đổi mới có khả năng vẫn sẽ chóng mặt, mang lại lợi ích cho người dùng cuối với các khả năng AI ngày càng mạnh mẽ và dễ tiếp cận.