Tag: LLM

20 Lời Khuyên Cho Chuyên Gia Muốn Tham Gia Lĩnh Vực AI và Generative AI

Bài viết này cung cấp 20 lời khuyên từ các thành viên của Forbes Business Council, giúp các chuyên gia định hướng và thành công trong lĩnh vực AI và Generative AI đang phát triển nhanh chóng. Các lời khuyên bao gồm từ việc bắt đầu nhỏ, nắm vững kiến thức cơ bản, đến việc phát triển kỹ năng mềm và tư duy đạo đức.

20 Lời Khuyên Cho Chuyên Gia Muốn Tham Gia Lĩnh Vực AI và Generative AI

Thị trường Chatbot AI Trung Quốc: ByteDance Vượt Mặt Alibaba và Baidu

Thị trường chatbot AI tại Trung Quốc đang chứng kiến sự trỗi dậy mạnh mẽ của Doubao từ ByteDance, vượt qua các đối thủ lớn như Alibaba và Baidu. Bài viết này phân tích các yếu tố thúc đẩy sự phát triển của Doubao, thách thức mà các đối thủ gặp phải, và những tác động rộng lớn đến tương lai của AI tại Trung Quốc.

Thị trường Chatbot AI Trung Quốc: ByteDance Vượt Mặt Alibaba và Baidu

Kimi k1.5: Mô hình AI đa phương thức sánh ngang OpenAI o1

Moonshot AI đã ra mắt Kimi k1.5, một mô hình AI đa phương thức có hiệu suất sánh ngang với OpenAI o1, đánh dấu bước tiến lớn trong lĩnh vực AI. Mô hình này vượt trội ở nhiều lĩnh vực như toán học, lập trình và suy luận đa phương thức, đặc biệt phiên bản short-CoT còn vượt trội hơn cả GPT-4o và Claude 3.5 Sonnet. Sự phát triển này thể hiện tiềm năng của đổi mới trong nước và tinh thần hợp tác trong cộng đồng AI.

Kimi k1.5: Mô hình AI đa phương thức sánh ngang OpenAI o1

Phát triển AI Agent thời gian thực trong 20 phút với mã nguồn mở của OpenAI

Bài viết này làm nổi bật bước tiến đáng kể của OpenAI trong việc phát triển AI Agent thời gian thực chỉ trong 20 phút. Công nghệ này mang lại hiệu quả cao, tương tác dữ liệu nhanh chóng, và khả năng tùy biến linh hoạt, mở ra tiềm năng lớn cho các ứng dụng AI.

Phát triển AI Agent thời gian thực trong 20 phút với mã nguồn mở của OpenAI

Cơ chế Attention Mới Giảm Bộ Nhớ KV Cache Cho Mô Hình Ngôn Ngữ Lớn

Bài báo giới thiệu cơ chế attention mới, Multi-matrix Factorization Attention (MFA) và biến thể MFA-Key-Reuse (MFA-KR), giúp giảm đáng kể chi phí suy luận của mô hình ngôn ngữ lớn. MFA không chỉ vượt trội MLA về hiệu suất mà còn tương đương MHA truyền thống, đồng thời giảm sử dụng KV Cache đến 93.7%. MFA được thiết kế đơn giản, dễ tái tạo, ít nhạy cảm với siêu tham số và tương thích với nhiều phương pháp Pos-embedding.

Cơ chế Attention Mới Giảm Bộ Nhớ KV Cache Cho Mô Hình Ngôn Ngữ Lớn

ESM3 đột phá trong nghiên cứu protein mô phỏng 500 triệu năm tiến hóa

ESM3 của Evolutionaryscale là mô hình sinh học đột phá với 98 tỷ tham số, mô phỏng 5 nghìn tỷ năm tiến hóa, cung cấp API miễn phí, được Yann LeCun đánh giá cao, mở ra tiềm năng lớn trong y học và kỹ thuật protein.

ESM3 đột phá trong nghiên cứu protein mô phỏng 500 triệu năm tiến hóa

Mô Hình AI Đột Phá của Microsoft trong Thiết Kế Vật Liệu Tăng Độ Chính Xác Gấp 10 Lần

Microsoft giới thiệu MatterGen, một mô hình ngôn ngữ lớn đột phá được thiết kế để tạo ra vật liệu vô cơ, tăng gấp đôi tỷ lệ vật liệu ổn định, độc đáo và mới lạ so với phương pháp truyền thống, đồng thời giúp cấu trúc gần hơn 10 lần với mức năng lượng tối thiểu DFT. MatterGen có tiềm năng ứng dụng trong pin, chất bán dẫn và giải quyết các thách thức toàn cầu.

Mô Hình AI Đột Phá của Microsoft trong Thiết Kế Vật Liệu Tăng Độ Chính Xác Gấp 10 Lần