Tag: Fine-Tuning

DMind-1: Mô hình ngôn ngữ Web3 nguồn mở

DMind ra mắt DMind-1, LLM nguồn mở cho Web3, tinh chỉnh từ Qwen3-32B của Alibaba, đạt SOTA trên 9 danh mục Web3. Chi phí suy luận thấp hơn nhiều so với LLM chính thống.

DMind-1: Mô hình ngôn ngữ Web3 nguồn mở

Alibaba Giảm 90% Chi Phí Nhờ ZEROSEARCH

Alibaba tuyên bố giảm 90% chi phí huấn luyện AI với ZEROSEARCH, cho phép LLM mô phỏng tìm kiếm mà không cần API thực.

Alibaba Giảm 90% Chi Phí Nhờ ZEROSEARCH

Bước đột phá AI từ quỹ Thượng Hải: Thách thức DeepSeek 2.0?

Một quỹ giao dịch định lượng Thượng Hải tuyên bố đột phá trong huấn luyện AI, có thể cạnh tranh với DeepSeek 2.0, nhấn mạnh sự tiến bộ của Trung Quốc trong lĩnh vực này.

Bước đột phá AI từ quỹ Thượng Hải: Thách thức DeepSeek 2.0?

Mistral Medium 3: Giải Pháp AI Cho Doanh Nghiệp

Mistral AI ra mắt Medium 3, mô hình ngôn ngữ tùy chỉnh cho doanh nghiệp, cân bằng chi phí, hiệu suất và triển khai linh hoạt, hấp dẫn cho các doanh nghiệp ứng dụng AI.

Mistral Medium 3: Giải Pháp AI Cho Doanh Nghiệp

Đột phá của NVIDIA: Llama Nemotron Ultra & Parakeet

Joey Conway của NVIDIA hé lộ về Llama Nemotron Ultra và Parakeet, các mô hình AI nguồn mở tân tiến, mở ra kỷ nguyên mới cho AI.

Đột phá của NVIDIA: Llama Nemotron Ultra & Parakeet

Phi-4 Reasoning Plus: RL Tiếp Tục Thắng Lợi

Mô hình Phi-4 Reasoning Plus của Microsoft sử dụng RL thành công, vượt trội các mô hình lớn hơn trong các bài kiểm tra về lập trình, toán học và khoa học.

Phi-4 Reasoning Plus: RL Tiếp Tục Thắng Lợi

Gemma AI: 150 Triệu Lượt Tải và Tiềm Năng

Các mô hình AI Gemma của Google đã đạt 150 triệu lượt tải, nhấn mạnh sự phổ biến và khả năng thích ứng của chúng, mặc dù còn một số thách thức về giấy phép.

Gemma AI: 150 Triệu Lượt Tải và Tiềm Năng

Cách Mạng Hóa Sử Dụng Công Cụ LLM: RL của Nemotron-Tool-N1

Nemotron-Tool-N1 sử dụng học tăng cường để cải thiện khả năng sử dụng công cụ của LLM, vượt trội so với các phương pháp học có giám sát truyền thống.

Cách Mạng Hóa Sử Dụng Công Cụ LLM: RL của Nemotron-Tool-N1

Cơ hội Malaysia: Tận dụng AI mã nguồn mở Trung Quốc

Malaysia có thể tận dụng AI mã nguồn mở của Trung Quốc để phát triển hệ sinh thái AI địa phương, tăng cường an ninh dữ liệu và thúc đẩy đổi mới sáng tạo.

Cơ hội Malaysia: Tận dụng AI mã nguồn mở Trung Quốc

Hiệu ứng Deepseek-R1: Chất xúc tác cho Mô hình ngôn ngữ

Deepseek-R1 thúc đẩy nghiên cứu mô hình ngôn ngữ có khả năng suy luận, tập trung vào chất lượng dữ liệu và học tăng cường.

Hiệu ứng Deepseek-R1: Chất xúc tác cho Mô hình ngôn ngữ