Meta gần đây đã công bố các phiên bản mới nhất của mô hình trí tuệ nhân tạo (AI) Llama, đánh dấu một bước tiến quan trọng trong cam kết liên tục của công ty đối với sự đổi mới AI. Trong số các sản phẩm mới có Llama 4 Scout và Llama 4 Maverick, mà Meta đã mệnh danh là “các mô hình đa phương thức,” làm nổi bật khả năng xử lý và tương tác với nhiều hình thức truyền thông khác nhau ngoài văn bản đơn thuần.
Ngoài ra, Meta còn giới thiệu sơ bộ về Llama 4 Behemoth, được định vị là một trong những LLM thông minh nhất trên toàn cầu và dự định đóng vai trò là người hướng dẫn cho các mô hình mới được phát hành.
Thông báo này nhấn mạnh khoản đầu tư đáng kể của Meta vào AI trong hai năm trước. CEO Mark Zuckerberg đã công khai tuyên bố ý định phân bổ tới 65 tỷ đô la vào năm 2025 để nâng cao hơn nữa khả năng AI của công ty. Tham vọng của Meta vượt ra ngoài lĩnh vực truyền thông xã hội của mình, khám phá các đăng ký trả phí tiềm năng cho trợ lý AI của mình, Meta AI, để xử lý các tác vụ như đặt chỗ và tạo video.
Nỗ Lực Mã Nguồn Mở của OpenAI
Trong các diễn biến song song, OpenAI được cho là đang cân nhắc việc phát hành một phiên bản mã nguồn mở của LLM của mình, một sự khác biệt so với các thông lệ gần đây của họ. Động thái này sẽ trao cho người dùng quyền tự do sử dụng, sửa đổi và phân phối mô hình mà không phải chịu phí cấp phép. OpenAI tìm kiếm ý kiến đóng góp từ cộng đồng các nhà phát triển, nhà nghiên cứu và công chúng rộng rãi hơn để tối ưu hóa tính hữu dụng của mô hình.
Mô hình mã nguồn mở dự kiến sẽ ra mắt trong vòng vài tháng. Lần cuối cùng OpenAI áp dụng các nguyên tắc mã nguồn mở là vào năm 2019 với GPT-2 LLM. LLM gần đây nhất của nó là GPT-4.5. OpenAI đã chuyển sang các mô hình độc quyền sau khi đảm bảo khoản đầu tư trị giá hàng tỷ đô la từ Microsoft, hình thành một liên minh chặt chẽ để thúc đẩy phát triển mô hình AI. Kể từ đó, Microsoft đã đầu tư hơn 13 tỷ đô la vào OpenAI, với các mô hình của OpenAI độc quyền cho khách hàng dịch vụ đám mây Azure của Microsoft.
Llama của Meta, LLM của Mistral và DeepSeek là một số mô hình mã nguồn mở đang ngày càng trở nên phổ biến gần đây. Zuckerberg đã đề cập trên Threads rằng Llama đã được tải xuống 1 tỷ lần. Llama được ra mắt vào năm 2023.
Mô Hình AI “Behemoth” của Meta Đối Mặt Với Sự Chậm Trễ
Tuy nhiên, Meta được cho là đang trì hoãn việc phát hành “Behemoth,” ban đầu dự kiến ra mắt vào mùa hè, với thời điểm phát hành sớm nhất có thể hiện được dự kiến vào mùa thu. Các nguồn tin cho thấy rằng tiến độ của mô hình chưa “đáng kể” để biện minh cho việc phát hành vào tháng Sáu và nó thể hiện một sự chậm trễ kể từ hội nghị nhà phát triển của Meta.
Sự chậm trễ đổ bóng lên việc phát hành dòng mô hình ngôn ngữ lớn hàng đầu Llama của Meta. Tờ Wall Street Journal cho biết chúng đã được ca ngợi vì tốc độ phát hành của chúng. Llama đã đóng vai trò quan trọng trong việc trao quyền cho các nhà phát triển trong các công ty nhỏ hơn, các tổ chức phi lợi nhuận và các viện nghiên cứu. Nó là một giải pháp thay thế cho các mô hình độc quyền, khép kín do các công ty như OpenAI, Google và Amazon cung cấp.
Tác động của sự chậm trễ của Behemoth đối với các công ty lớn hơn ít rõ rệt hơn, vì họ thường dựa vào các mô hình độc quyền dựa trên đám mây. Mặc dù các công ty nhỏ hơn có thể tùy chỉnh các mô hình Llama mã nguồn mở, nhưng họ yêu cầu các dịch vụ triển khai bổ sung mà Meta không cung cấp. Việc Meta sử dụng Llama hướng đến việc nâng cao các công cụ truyền thông xã hội của riêng mình, cho phép Zuckerberg duy trì quyền kiểm soát quỹ đạo AI của mình.
Một yếu tố quan trọng đằng sau sự chậm trễ nằm ở việc liệu mô hình có chứng minh được những cải tiến đủ đáng kể để đảm bảo ra mắt công khai hay không.
Sự Bắt Buộc Đối Với Đổi Mới
Trong thế giới nhịp độ nhanh của ngành công nghệ, các bản phát hành mới phải thể hiện những tiến bộ hữu hình để biện minh cho việc giới thiệu chúng. Tại LlamaCon, Meta đã giới thiệu hai mô hình Llama 4 nhỏ hơn, mỗi mô hình sở hữu những khả năng ấn tượng:
- Maverick tự hào có tổng cộng 400 tỷ tham số với cửa sổ ngữ cảnh 1 triệu mã thông báo (750.000 từ).
- Scout có 109 tỷ tham số và cửa sổ ngữ cảnh 10 triệu mã thông báo (7,5 triệu từ).
Behemoth ban đầu dự kiến phát hành đồng thời, kết hợp 2 nghìn tỷ tham số.
Theo tờ Wall Street Journal, Meta đang ngày càng mất kiên nhẫn với nhóm Llama 4 của mình vì các khoản đầu tư AI liên tục của mình. Tính đến năm 2024, công ty đã phân bổ tới 72 tỷ đô la cho chi tiêu vốn, chủ yếu hướng vào phát triển AI.
Những Lo Ngại Gia Tăng
Zuckerberg và các giám đốc điều hành cấp cao khác vẫn chưa công bố ngày phát hành chính thức cho Behemoth. Những người trong cuộc lo sợ rằng hiệu suất của nó có thể không đáp ứng được những kỳ vọng do những tuyên bố công khai của Meta đặt ra.
Các nguồn tin cho biết sự bất mãn ngày càng tăng trong giới lãnh đạo của Meta với tiến độ mà nhóm phát triển các mô hình Llama 4 đã đạt được. Điều này đã dẫn đến các cuộc thảo luận về những thay đổi lãnh đạo có thể xảy ra trong nhóm sản phẩm AI của mình.
Meta đã quảng cáo Behemoth là một hệ thống có khả năng cao, vượt trội so với các đối thủ như OpenAI, Google và Anthropic về các điểm chuẩn cụ thể. Những thách thức nội bộ đã cản trở hiệu quả của nó, như tuyên bố của những người quen thuộc với sự phát triển của nó.
OpenAI cũng gặp phải sự chậm trễ. Mô hình lớn tiếp theo của họ, GPT-5, ban đầu dự kiến phát hành vào giữa năm 2024. Tờ Wall Street Journal đưa tin vào tháng 12 rằng quá trình phát triển đã bị chậm tiến độ.
Vào tháng Hai, CEO Sam Altman của OpenAI cho biết mô hình tạm thời sẽ là GPT-4.5, trong khi GPT-5 vẫn còn nhiều tháng nữa mới ra mắt.
Các Nguyên Nhân Có Thể Gây Ra Sự Trì Trệ Trong Tiến Độ
Một số yếu tố có thể góp phần làm chậm quá trình phát triển mô hình AI, bao gồm:
Dữ Liệu Chất Lượng Cao Giảm Dần
Các mô hình ngôn ngữ lớn yêu cầu lượng dữ liệu khổng lồ để đào tạo, phản ánh sự rộng lớn của internet. Chúng có thể đang khai thác cạn kiệt các nguồn dữ liệu có sẵn công khai trong khi phải đối mặt với các trách nhiệm pháp lý liên quan đến bản quyền.
Điều này đã khiến OpenAI, Google và Microsoft ủng hộ việc bảo tồn quyền được đào tạo trên tài liệu có bản quyền của họ.
OpenAI đã đề cập rằng chính phủ có thể đảm bảo quyền tự do học hỏi từ AI của người Mỹ và tránh mất ưu thế AI vào tay CHND Trung Hoa bằng cách duy trì khả năng học hỏi từ tài liệu có bản quyền của các mô hình AI của Mỹ.
Những Rào Cản Thuật Toán
Niềm tin rằng việc tăng quy mô mô hình, sử dụng nhiều tính toán hơn và đào tạo trên nhiều dữ liệu hơn sẽ tạo ra những tiến bộ đáng chú ý đã được chứng minh là sai. Bloomberg cho biết đã có sự suy giảm lợi nhuận khiến một số người nói rằng các quy luật về quy mô đang chậm lại.