Baidu ra mắt mô hình AI mới vượt trội

Ernie 4.5: Sức Mạnh Đa Phương Thức

Ernie 4.5, với khả năng đa phương thức mở rộng bao gồm hình ảnh, âm thanh và video, đã chứng minh hiệu suất vượt trội so với GPT-4o của OpenAI. Sự vượt trội này được quan sát trên một loạt các nền tảng benchmark, bao gồm CCBench và OCRBench đáng chú ý, như chi tiết trong một tuyên bố do Baidu công bố trên nền tảng WeChat. Hơn nữa, công ty tuyên bố rằng khả năng xử lý văn bản của mô hình nền tảng Ernie 4.5 không chỉ vượt qua DeepSeek V3 mà còn đạt được mức hiệu suất gần tương đương với GPT-4.5 của OpenAI, dựa trên một loạt các đánh giá benchmark.

Vai Trò Tiên Phong Của Baidu và Sự Trỗi Dậy Của Cạnh Tranh

Baidu giữ vị trí là công ty công nghệ lớn đầu tiên của Trung Quốc giới thiệu một LLM tại Trung Quốc. Động thái tiên phong này diễn ra vào tháng 3 năm 2023, đón đầu làn sóng phấn khích do sự ra mắt ChatGPT của OpenAI. Tuy nhiên, lợi thế ban đầu của Baidu đã bị cạnh tranh ngày càng gay gắt bởi những công ty AI mới nổi khác ở Trung Quốc trong hai năm qua. Động thái chiến lược gần đây của gã khổng lồ tìm kiếm nhằm củng cố vị thế của mình trên thị trường AI của Trung Quốc diễn ra vào thời điểm DeepSeek đã khơi mào một xu hướng nguồn mở. Đồng thời, các gã khổng lồ trong ngành như Alibaba, Tencent và ByteDance đang tích cực theo đuổi cả người dùng doanh nghiệp và người tiêu dùng cho các mô hình AI tương ứng của họ.

Ernie X1: Hiệu Suất và Giá Cả

Mặc dù Baidu không tiết lộ kết quả benchmark cụ thể cho mô hình suy luận mới được giới thiệu của mình, Ernie X1, công ty tuyên bố rằng nó “mang lại hiệu suất ngang bằng với DeepSeek R1 với giá chỉ bằng một nửa.” Tuyên bố này cho thấy một lợi thế cạnh tranh đáng kể về mặt hiệu quả chi phí.

Đối với các doanh nghiệp muốn tích hợp các khả năng của Ernie X1, giá truy cập vào giao diện lập trình ứng dụng (API) của nó được cấu trúc như sau: 2 nhân dân tệ (khoảng 0,28 đô la Mỹ) cho mỗi triệu token đầu vào và 8 nhân dân tệ cho mỗi triệu token đầu ra. Ngược lại, DeepSeek hiện đang tính phí 0,55 đô la Mỹ cho mỗi triệu token đầu vào và 2,19 đô la Mỹ cho mỗi triệu token đầu ra cho DeepSeek-reasoner, được điều khiển bởi mô hình suy luận R1 của nó. Điều đáng chú ý là DeepSeek, một công ty khởi nghiệp có trụ sở tại Hàng Châu, gần đây đã tăng giá API của mình để đáp ứng với sự gia tăng đáng kể về nhu cầu.

Sự Chuyển Đổi Của Baidu Sang Nguồn Mở

Robin Li Yanhong, người sáng lập, chủ tịch và CEO của Baidu, đã đưa ra một thông báo đáng chú ý vào tháng trước về tương lai của Ernie 4.5. Ông tiết lộ rằng mô hình này sẽ được mở nguồn bắt đầu từ ngày 30 tháng 6. Quyết định này thể hiện một sự khác biệt đáng kể so với sự ủng hộ trước đây của ông đối với phát triển AI nguồn đóng, đánh dấu một bước ngoặt 180 độ trong cách tiếp cận của ông.

Li giải thích thêm về sự thay đổi chiến lược này trong một cuộc gọi hội nghị với các nhà phân tích vào tháng Hai, nói rằng, “Một điều chúng tôi học được từ DeepSeek là việc mở nguồn các mô hình tốt nhất có thể giúp ích rất nhiều cho việc áp dụng.” Ông giải thích thêm, “Khi mô hình là nguồn mở, mọi người tự nhiên muốn thử nó vì tò mò, điều này giúp thúc đẩy việc áp dụng rộng rãi hơn.” Sự thừa nhận này về lợi ích của phát triển nguồn mở nhấn mạnh chiến lược phát triển của Baidu trong bối cảnh cạnh tranh AI.

Hiệu Suất Kinh Doanh Của Baidu Giữa Những Tiến Bộ AI

Mặc dù Baidu đã đạt được những tiến bộ đáng chú ý trong lĩnh vực trí tuệ nhân tạo, hoạt động kinh doanh tổng thể của công ty đang phải đối mặt với những khó khăn do doanh thu quảng cáo yếu hơn. Các báo cáo tài chính gần đây cho thấy tổng doanh thu của Baidu trong quý IV đã giảm 2% so với cùng kỳ năm trước. Hơn nữa, doanh thu cả năm cũng giảm 1%. Những con số này làm nổi bật những thách thức mà Baidu phải đối mặt trong việc cân bằng các khoản đầu tư vào công nghệ AI tiên tiến với nhu cầu duy trì hiệu quả tài chính mạnh mẽ.

Mở Rộng Các Khía Cạnh Chính

Để cung cấp một sự hiểu biết toàn diện hơn, chúng ta hãy đi sâu hơn vào một số khía cạnh quan trọng trong thông báo của Baidu và bối cảnh rộng lớn hơn của lĩnh vực AI ở Trung Quốc.

Tầm Quan Trọng Của Đa Phương Thức:

Việc nhấn mạnh vào khả năng “đa phương thức” trong cả Ernie 4.5 và Ernie X1 là rất quan trọng. Các LLM truyền thống chủ yếu tập trung vào xử lý dựa trên văn bản. Tuy nhiên, khả năng xử lý và hiểu thông tin từ các phương thức khác nhau – hình ảnh, âm thanh và video – mở ra một loạt các khả năng mới. Điều này bao gồm:

  • Nhận Dạng Hình Ảnh Nâng Cao: Các mô hình AI giờ đây không chỉ có thể xác định các đối tượng trong hình ảnh mà còn hiểu được ngữ cảnh và mối quan hệ giữa chúng.
  • Cải Thiện Phiên Âm và Phân Tích Âm Thanh: Phiên âm ngôn ngữ nói với độ chính xác cao hơn và thậm chí phát hiện các sắc thái như cảm xúc và ý định trong các bản ghi âm.
  • Hiểu Video: Phân tích nội dung video để xác định cảnh, hành động và thậm chí dự đoán các sự kiện trong tương lai.

Cuộc Tranh Luận Nguồn Mở:

Quyết định của Robin Li về việc mở nguồn Ernie 4.5 là một bước phát triển quan trọng trong cuộc tranh luận đang diễn ra giữa phát triển AI nguồn đóng và nguồn mở.

  • Nguồn Đóng: Những người ủng hộ phương pháp này cho rằng nó cho phép kiểm soát tốt hơn công nghệ, đảm bảo việc sử dụng có trách nhiệm và ngăn chặn việc lạm dụng. Nó cũng cho phép các công ty bảo vệ tài sản trí tuệ của họ và duy trì lợi thế cạnh tranh.
  • Nguồn Mở: Những người ủng hộ phát triển nguồn mở tin rằng nó thúc đẩy sự hợp tác, tăng tốc đổi mới và thúc đẩy tính minh bạch. Nó cho phép các nhà nghiên cứu và nhà phát triển trên toàn thế giới đóng góp vào sự tiến bộ của công nghệ AI.

Việc Baidu chuyển sang mở nguồn, ít nhất là đối với Ernie 4.5, cho thấy sự công nhận về động lực ngày càng tăng của phong trào nguồn mở và những lợi ích tiềm năng của nó.

Bối Cảnh Cạnh Tranh:

Cuộc đua AI ở Trung Quốc rất khốc liệt, với nhiều công ty đang tranh giành vị trí thống trị.

  • Alibaba: LLM Tongyi Qianwen của Alibaba là một đối thủ cạnh tranh lớn và công ty đang tích cực tích hợp AI vào các đơn vị kinh doanh khác nhau của mình, bao gồm thương mại điện tử, điện toán đám mây và hậu cần.
  • Tencent: LLM Hunyuan của Tencent là một công ty quan trọng khác và công ty đang tận dụng AI để nâng cao các nền tảng truyền thông xã hội, các sản phẩm trò chơi và dịch vụ đám mây của mình.
  • ByteDance: Công ty mẹ của TikTok, ByteDance, cũng đang đầu tư mạnh vào AI, sử dụng nó để cung cấp năng lượng cho các thuật toán đề xuất và phát triển các sản phẩm mới.
  • DeepSeek: DeepSeek là một đối thủ đáng gờm trong không gian LLM.

Tác Động Của Giá Cả:

Chiến lược giá cả tích cực của Baidu đối với Ernie X1, giảm giá của DeepSeek xuống một nửa, là một dấu hiệu rõ ràng về ý định giành thị phần của công ty. Cuộc chiến giá cả này có thể mang lại lợi ích cho các doanh nghiệp và người tiêu dùng bằng cách làm cho công nghệ AI dễ tiếp cận và hợp túi tiền hơn.

Những Hàm Ý Rộng Lớn Hơn:

Những tiến bộ của Baidu trong lĩnh vực AI, cùng với sự cạnh tranh gay gắt trên thị trường Trung Quốc, có những tác động sâu rộng:

  • Tiến Bộ Công Nghệ: Tốc độ đổi mới nhanh chóng đang thúc đẩy sự phát triển của các mô hình AI ngày càng tinh vi với khả năng rộng hơn.
  • Tác Động Kinh Tế: AI sẵn sàng chuyển đổi các ngành công nghiệp khác nhau, tăng năng suất, tạo ra việc làm mới và có khả năng định hình lại bối cảnh kinh tế toàn cầu.
  • Tác Động Xã Hội: Việc áp dụng rộng rãi AI đặt ra những câu hỏi quan trọng về đạo đức và xã hội cần được giải quyết, bao gồm các vấn đề liên quan đến thành kiến, quyền riêng tư và sự dịch chuyển việc làm.

Phân Tích Sâu Hơn Về Chiến Lược Của Baidu

Chiến lược của Baidu dường như có nhiều mặt, bao gồm cả đổi mới công nghệ và định vị thị trường.

1. Sức Mạnh Công Nghệ:

  • Tập Trung vào Đa Phương Thức: Baidu rõ ràng đang ưu tiên phát triển các mô hình AI đa phương thức, nhận ra tiềm năng của công nghệ này để mở khóa các ứng dụng và khả năng mới.
  • Cải Tiến Liên Tục: Việc phát hành Ernie 4.5 và Ernie X1 thể hiện cam kết của Baidu đối với nghiên cứu và phát triển liên tục, không ngừng vượt qua các ranh giới của hiệu suất AI.
  • Chấp Nhận Nguồn Mở: Quyết định mở nguồn Ernie 4.5 báo hiệu sự sẵn sàng tham gia với cộng đồng AI rộng lớn hơn và đóng góp vào sự tiến bộ chung của lĩnh vực này.

2. Định Vị Thị Trường:

  • Giá Cả Cạnh Tranh: Giá cả tích cực của Ernie X1 là một động thái chiến lược để thu hút người dùng và giành thị phần trong bối cảnh LLM cạnh tranh cao.
  • Nhắm Mục Tiêu Doanh Nghiệp: Việc tập trung vào quyền truy cập API cho thấy Baidu đang tích cực nhắm mục tiêu đến các doanh nghiệp đang tìm cách tích hợp AI vào hoạt động của họ.
  • Giải Quyết Điểm Yếu: Công ty đang thừa nhận và giải quyết các thách thức của mình, chẳng hạn như sự sụt giảm doanh thu quảng cáo, bằng cách tận dụng các tiến bộ AI của mình để đa dạng hóa các sản phẩm và khám phá các nguồn doanh thu mới.

3. Tầm Nhìn Dài Hạn:

  • Dẫn Đầu AI: Các hành động của Baidu cho thấy tham vọng rõ ràng là trở thành công ty dẫn đầu trong bối cảnh AI toàn cầu, không chỉ ở Trung Quốc.
  • Công Nghệ Chuyển Đổi: Công ty dường như coi AI là một công nghệ biến đổi có tiềm năng định hình lại hoạt động kinh doanh của mình và đóng góp vào sự tiến bộ xã hội rộng lớn hơn.
  • Khả Năng Thích Ứng: Sự sẵn sàng thích ứng chiến lược của Baidu, bằng chứng là sự chuyển đổi sang phát triển nguồn mở, thể hiện sự nhanh nhẹn và khả năng phản ứng của công ty trước những động lực phát triển của ngành AI.

Về bản chất, Baidu đang định vị mình là một lực lượng chính trong cuộc cách mạng AI, kết hợp đổi mới công nghệ với các động thái thị trường chiến lược để đạt được các mục tiêu đầy tham vọng của mình. Sự tiến bộ của công ty và sự cạnh tranh đang diễn ra trên thị trường AI Trung Quốc sẽ được theo dõi chặt chẽ vì chúng có ý nghĩa quan trọng đối với tương lai của AI trên toàn cầu.