DMind-1: Mô hình ngôn ngữ Web3 nguồn mở
DMind ra mắt DMind-1, LLM nguồn mở cho Web3, tinh chỉnh từ Qwen3-32B của Alibaba, đạt SOTA trên 9 danh mục Web3. Chi phí suy luận thấp hơn nhiều so với LLM chính thống.
DMind ra mắt DMind-1, LLM nguồn mở cho Web3, tinh chỉnh từ Qwen3-32B của Alibaba, đạt SOTA trên 9 danh mục Web3. Chi phí suy luận thấp hơn nhiều so với LLM chính thống.
Alibaba tuyên bố giảm 90% chi phí huấn luyện AI với ZEROSEARCH, cho phép LLM mô phỏng tìm kiếm mà không cần API thực.
Một quỹ giao dịch định lượng Thượng Hải tuyên bố đột phá trong huấn luyện AI, có thể cạnh tranh với DeepSeek 2.0, nhấn mạnh sự tiến bộ của Trung Quốc trong lĩnh vực này.
Mistral AI ra mắt Medium 3, mô hình ngôn ngữ tùy chỉnh cho doanh nghiệp, cân bằng chi phí, hiệu suất và triển khai linh hoạt, hấp dẫn cho các doanh nghiệp ứng dụng AI.
Joey Conway của NVIDIA hé lộ về Llama Nemotron Ultra và Parakeet, các mô hình AI nguồn mở tân tiến, mở ra kỷ nguyên mới cho AI.
Mô hình Phi-4 Reasoning Plus của Microsoft sử dụng RL thành công, vượt trội các mô hình lớn hơn trong các bài kiểm tra về lập trình, toán học và khoa học.
Các mô hình AI Gemma của Google đã đạt 150 triệu lượt tải, nhấn mạnh sự phổ biến và khả năng thích ứng của chúng, mặc dù còn một số thách thức về giấy phép.
Nemotron-Tool-N1 sử dụng học tăng cường để cải thiện khả năng sử dụng công cụ của LLM, vượt trội so với các phương pháp học có giám sát truyền thống.
Malaysia có thể tận dụng AI mã nguồn mở của Trung Quốc để phát triển hệ sinh thái AI địa phương, tăng cường an ninh dữ liệu và thúc đẩy đổi mới sáng tạo.
Deepseek-R1 thúc đẩy nghiên cứu mô hình ngôn ngữ có khả năng suy luận, tập trung vào chất lượng dữ liệu và học tăng cường.