Chúng tôi rất vui mừng được tham gia hội nghị Build một lần nữa, đây là một khoảnh khắc đặc biệt hàng năm để giao lưu với cộng đồng nhà phát triển toàn cầu. Thật thú vị khi chia sẻ những gì chúng tôi đã nỗ lực và tìm hiểu cách các nhà phát triển đang sử dụng nền tảng Microsoft để xây dựng các công nghệ tiên tiến tiếp theo.
Tại Microsoft, chúng tôi tin rằng tương lai của trí tuệ nhân tạo đang được xây dựng trên đám mây, biên và Windows. Windows hiện là và sẽ tiếp tục là một nền tảng mở, trao quyền cho các nhà phát triển để hoàn thành công việc tốt nhất của họ và cung cấp sự linh hoạt tối đa.
Ngôi sao Bắc Đẩu của chúng tôi rất rõ ràng: biến Windows trở thành nền tảng tốt nhất cho các nhà phát triển, được xây dựng đặc biệt cho kỷ nguyên AI mới, trong đó trí thông minh được tích hợp vào phần mềm, chip và phần cứng. Từ việc sử dụng Windows 11 trên máy khách đến sử dụng Windows 365 trên đám mây, chúng tôi đang xây dựng một nền tảng hỗ trợ nhiều tình huống khác nhau, từ phát triển AI đến quy trình làm việc CNTT cốt lõi, tất cả đều dựa trên nguyên tắc an toàn là trên hết.
Trong năm qua, chúng tôi đã dành thời gian lắng nghe ý kiến của các nhà phát triển, tìm hiểu những gì họ coi trọng nhất và những nơi chúng tôi có cơ hội tiếp tục giúp Windows trở thành một môi trường phát triển tốt hơn, đặc biệt là trong kỷ nguyên phát triển AI. Những phản hồi này đã định hình quan điểm của chúng tôi về nền tảng nhà phát triển Windows cũng như các bản cập nhật mà chúng tôi giới thiệu ngày hôm nay.
Các tính năng mới của Windows tại hội nghị Build:
Windows AI Foundry là sự phát triển của Windows Copilot Runtime, cung cấp một nền tảng thống nhất và đáng tin cậy, hỗ trợ vòng đời phát triển AI từ lựa chọn, tối ưu hóa, tinh chỉnh mô hình đến triển khai trên các máy khách và đám mây. Windows AI Foundry bao gồm các khả năng sau:
Windows ML là nền tảng của nền tảng AI và là thời gian chạy suy luận AI tích hợp trên Windows. Điều này cho phép các nhà phát triển mang theo mô hình của riêng họ và triển khai các mô hình này một cách hiệu quả trong hệ sinh thái đối tác chip, bao gồm AMD, Intel, Nvidia và Qualcomm, bao gồm CPU, GPU và NPU.
Windows AI Foundry tích hợp Foundry Local và các danh mục mô hình khác, chẳng hạn như Ollama và NVIDIA NIMs, do đó cung cấp cho các nhà phát triển quyền truy cập nhanh vào nhiều mô hình nguồn mở sẵn sàng sử dụng trên chip Windows. Điều này cho phép các nhà phát triển duyệt, kiểm tra, tương tác và triển khai các mô hình trong các ứng dụng cục bộ của họ.
Ngoài ra, Windows AI Foundry còn cung cấp các API AI có sẵn được hỗ trợ bởi các mô hình tích hợp của Windows trên Copilot+ PC, dành cho các tác vụ ngôn ngữ và hình ảnh quan trọng, chẳng hạn như thông minh văn bản, mô tả hình ảnh, nhận dạng văn bản, lời nhắc tùy chỉnh và xóa đối tượng. Chúng tôi đang công bố một số tính năng mới, chẳng hạn như LoRA (low-rank-adaption), để tinh chỉnh SLM Phi Silica tích hợp của chúng tôi bằng dữ liệu tùy chỉnh. Chúng tôi cũng đang công bố API mới cho tìm kiếm ngữ nghĩa và truy xuất kiến thức, để các nhà phát triển có thể sử dụng dữ liệu tùy chỉnh của họ để xây dựng các tình huống tìm kiếm bằng ngôn ngữ tự nhiên và RAG (Tạo tăng cường truy xuất) trong các ứng dụng của họ.
Phát triển Windows 11 cho môi trường Agentic trong tương lai thông qua hỗ trợ gốc cho Giao thức ngữ cảnh mô hình (MCP). Việc tích hợp MCP với Windows sẽ cung cấp một khung tiêu chuẩn cho các tác nhân AI để kết nối với các ứng dụng Windows gốc, cho phép các ứng dụng tham gia liền mạch vào các tương tác Agentic. Các ứng dụng Windows có thể hiển thị các chức năng cụ thể để nâng cao các kỹ năng và khả năng của các tác nhân được cài đặt trên Windows PC. Trong những tháng tới, chúng tôi sẽ cung cấp bản xem trước dành cho nhà phát triển riêng tư với các đối tác được chọn để bắt đầu thu thập phản hồi.
Thao tác ứng dụng trên Windows, đây là một tính năng nhà phát triển ứng dụng mới, có thể xây dựng các thao tác cho các tính năng cụ thể trong ứng dụng và cải thiện khả năng khám phá, do đó mở khóa các điểm vào mới cho các nhà phát triển để thu hút người dùng mới.
Các tính năng bảo mật Windows mới, chẳng hạn như SDK Vùng bảo vệ an toàn dựa trên ảo hóa (VBS) và mật mã hậu lượng tử (PQC), cung cấp cho các nhà phát triển các công cụ bổ sung giúp họ dễ dàng hơn trong việc phát triển các giải pháp bảo mật khi bối cảnh mối đe dọa tiếp tục phát triển.
Mã nguồn mở Windows Subsystem for Linux (WSL), mời các nhà phát triển đóng góp, tùy chỉnh và giúp chúng tôi tích hợp Linux liền mạch hơn vào Windows.
Các cải tiến mới cho các công cụ phát triển Windows phổ biến, bao gồm Terminal, WinGet và PowerToys, cho phép các nhà phát triển tăng năng suất và tập trung vào những gì họ giỏi nhất - viết mã.
Các tính năng tăng trưởng Microsoft Store mới, hiện bao gồm đăng ký nhà phát triển miễn phí, Trình cài đặt web cho ứng dụng Win32, báo cáo phân tích, chương trình quảng cáo ứng dụng, v.v., để giúp các nhà phát triển ứng dụng tăng mức độ thu hút, khám phá và tương tác của người dùng trên Windows.
Windows AI Foundry
Chúng tôi muốn dân chủ hóa khả năng của các nhà phát triển để xây dựng, thử nghiệm và tiếp cận người dùng thông qua các trải nghiệm AI đột phá. Chúng tôi đã nghe từ những nhà phát triển mới bắt đầu phát triển AI rằng họ thích các giải pháp sẵn có cho các khả năng tác vụ cụ thể để tăng tốc quá trình tích hợp AI vào các ứng dụng. Các nhà phát triển cũng cho chúng tôi biết rằng họ cần một cách dễ dàng để duyệt, kiểm tra và tích hợp các mô hình mã nguồn mở trong ứng dụng của họ. Các nhà phát triển xây dựng các mô hình nâng cao của riêng họ nói với chúng tôi rằng họ thích các giải pháp nhanh chóng và mạnh mẽ để triển khai mô hình một cách hiệu quả trên nhiều chip khác nhau. Để đáp ứng mọi nhu cầu phát triển, chúng tôi đã phát triển Windows Copilot Runtime để biến nó thành Windows AI Foundry, cung cấp nhiều chức năng mạnh mẽ.
Nhà phát triển có thể dễ dàng truy cập vào các mô hình nguồn mở sẵn sàng sử dụng
Windows AI Foundry tích hợp Foundry Local và các danh mục mô hình khác, chẳng hạn như Ollama và NVIDIA NIMs, do đó cung cấp cho các nhà phát triển quyền truy cập nhanh vào nhiều mô hình nguồn mở sẵn sàng sử dụng trên chip Windows. Thông qua danh mục mô hình Foundry Local, chúng tôi đã hoàn thành công việc khó khăn là tối ưu hóa các mô hình này trên CPU, GPU và NPU, giúp các mô hình này có thể sử dụng ngay lập tức.
Trong bản xem trước, các nhà phát triển có thể truy cập Foundry Local bằng cách cài đặt từ WinGet (winget install Microsoft.FoundryLocal) và Foundry Local CLI để duyệt, tải xuống và kiểm tra các mô hình. Foundry Local sẽ tự động phát hiện phần cứng thiết bị (CPU, GPU và NPU) và liệt kê các mô hình tương thích mà nhà phát triển có thể thử. Các nhà phát triển cũng có thể sử dụng Foundry Local SDK để dễ dàng tích hợp Foundry Local vào ứng dụng của họ. Trong những tháng tới, chúng tôi sẽ cung cấp trực tiếp các chức năng này trong Windows 11 và Windows App SDK, do đó tối ưu hóa trải nghiệm nhà phát triển khi sử dụng Foundry Local để phát hành các ứng dụng sản xuất.
Mặc dù chúng tôi cung cấp các mô hình nguồn mở sẵn sàng sử dụng, nhưng ngày càng có nhiều nhà phát triển đang xây dựng các mô hình của riêng họ và mang lại những trải nghiệm đột phá cho người dùng cuối. Windows ML là nền tảng của nền tảng AI và là thời gian chạy suy luận AI tích hợp, có thể đơn giản hóa và triển khai hiệu quả các mô hình trên CPU, GPU và NPU.
Windows ML là một thời gian chạy suy luận cục bộ hiệu suất cao được xây dựng trực tiếp trong Windows, có thể đơn giản hóa quá trình vận chuyển các ứng dụng sản xuất cho các mô hình nguồn mở hoặc độc quyền, bao gồm cả trải nghiệm Copilot+ PC của riêng chúng tôi. Nó được xây dựng ngay từ đầu để được tối ưu hóa cho hiệu suất và sự nhanh nhẹn của mô hình, đồng thời đáp ứng tốc độ đổi mới của kiến trúc mô hình, toán tử và tối ưu hóa trên tất cả các lớp của ngăn xếp. Windows ML là sự phát triển của DirectML (DML) dựa trên các bài học kinh nghiệm của chúng tôi trong năm qua (lắng nghe phản hồi từ nhiều nhà phát triển, đối tác chip của chúng tôi và nhóm của chính chúng tôi về việc phát triển trải nghiệm AI trên Copilot+ PC). Windows ML được thiết kế để xem xét những phản hồi này, do đó cho phép các đối tác chip của chúng tôi (AMD, Intel, Nvidia, Qualcomm) sử dụng các thỏa thuận nhà cung cấp thực thi để tối ưu hóa hiệu suất mô hình và bắt kịp tốc độ đổi mới.
Windows ML cung cấp một số lợi ích sau:
Đơn giản hóa việc triển khai: Cho phép các nhà phát triển phát hành các ứng dụng sản xuất mà không cần đóng gói thời gian chạy ML, nhà cung cấp thực thi phần cứng hoặc trình điều khiển với ứng dụng của họ. Windows ML phát hiện phần cứng trên thiết bị máy khách, trích xuất nhà cung cấp thực thi tương ứng và chọn nhà cung cấp thực thi chính xác để suy luận dựa trên cấu hình do nhà phát triển cung cấp.
Tự động thích ứng với phần cứng AI thế hệ tương lai: Windows ML cho phép các nhà phát triển tự tin xây dựng các ứng dụng AI trong một hệ sinh thái chip đang phát triển nhanh chóng. Khi phần cứng mới được giới thiệu, Windows ML sẽ luôn cập nhật tất cả các phần phụ thuộc cần thiết và thích ứng với các chip mới, đồng thời duy trì độ chính xác của mô hình và khả năng tương thích phần cứng.
Các công cụ để chuẩn bị và phát hành mô hình hiệu suất cao: Các công cụ mạnh mẽ trong AI Toolkit for VS Code cho nhiều tác vụ (từ chuyển đổi, định lượng đến tối ưu hóa mô hình) giúp đơn giản hóa quá trình chuẩn bị và phát hành mô hình hiệu suất cao.
Chúng tôi đang hợp tác chặt chẽ với tất cả các đối tác chip (AMD, Intel, Nvidia, Qualcomm) để tích hợp liền mạch nhà cung cấp thực thi của họ với Windows ML, do đó cung cấp hiệu suất mô hình tối ưu cho chip cụ thể của họ.
Nhiều nhà phát triển ứng dụng (chẳng hạn như Adobe, Bufferzone, McAfee, Reincubate, Topaz Labs, Powder và Wondershare) đã hợp tác với chúng tôi để sử dụng Windows ML để triển khai các mô hình trên chip AMD, Intel, Nvidia và Qualcomm. Để tìm hiểu thêm về Windows ML, hãy truy cập blog này.
Tích hợp AI nhanh chóng và dễ dàng bằng các API được hỗ trợ bởi các mô hình tích hợp ของ Windows
Chúng tôi đang cung cấp các API AI có sẵn được hỗ trợ bởi các mô hình tích hợp của Windows, dành cho các tác vụ quan trọng, chẳng hạn như thông tin văn bản và xử lý hình ảnh. Chúng bao gồm các API ngôn ngữ (chẳng hạn như tóm tắt và viết lại văn bản) và API hình ảnh (chẳng hạn như mô tả hình ảnh, nhận dạng văn bản (OCR), siêu phân giải hình ảnh và phân đoạn hình ảnh), tất cả đều có sẵn trong phiên bản ổn định mới nhất của Windows App SDK 1.7.2. Các API này loại bỏ chi phí xây dựng hoặc triển khai mô hình. Các API này chạy cục bộ trên thiết bị và giúp cung cấp quyền riêng tư, bảo mật và tuân thủ với chi phí bằng không và được tối ưu hóa cho NPU trên Copilot+ PC. Các nhà phát triển ứng dụng (chẳng hạn như Dot Vista, Filmora của Wondershare, Pieces của nhà phát triển, Powder, iQIYI, v.v.) đã sử dụng các API AI có sẵn của chúng tôi trong ứng dụng của họ.
Chúng tôi cũng đã biết từ các nhà phát triển rằng họ cần tinh chỉnh LLM bằng dữ liệu tùy chỉnh của họ để nhận đầu ra bắt buộc cho các tình huống cụ thể. Nhiều người cũng nói rằng việc tinh chỉnh mô hình cơ bản là một nhiệm vụ khó khăn. Đó là lý do tại sao chúng tôi đang công bố hỗ trợ LoRA (low-rank-adaption) cho Phi Silica.
Giới thiệu LoRA (low-rank-adaption) cho Phi Silica để tinh chỉnh SLM tích hợp của chúng tôi bằng dữ liệu tùy chỉnh
LoRA cải thiện hiệu quả tinh chỉnh bằng cách chỉ cập nhật một phần nhỏ các tham số của mô hình bằng dữ liệu tùy chỉnh. Điều này cho phép cải thiện hiệu suất của các tác vụ cần thiết, mà không ảnh hưởng đến khả năng tổng thể của mô hình. Điều này bắt đầu từ hôm nay trong bản xem trước công khai trên Snapdragon X series NPU và sẽ được sử dụng cho Intel và AMD Copilot+ PC trong những tháng tới. Các nhà phát triển có thể truy cập LoRA của Phi Silica trong Windows App SDK 1.8 Experimental 2.
Các nhà phát triển có thể bắt đầu đào tạo LoRA của Phi Silica bằng AI Toolkit for VS Code. Chọn công cụ tinh chỉnh, chọn mô hình Phi Silica, định cấu hình dự án và khởi chạy đào tạo trong Azure bằng bộ dữ liệu tùy chỉnh. Sau khi đào tạo hoàn tất, các nhà phát triển có thể tải xuống bộ điều hợp LoRA, sử dụng nó trên Phi Silica API và thử nghiệm để tìm hiểu sự khác biệt về phản hồi có và không có bộ điều hợp LoRA.
Giới thiệu tìm kiếm ngữ nghĩa và truy xuất kiến thức cho LLM
Chúng tôi đang giới thiệu các API tìm kiếm ngữ nghĩa mới để giúp các nhà phát triển tạo trải nghiệm tìm kiếm mạnh mẽ bằng dữ liệu ứng dụng của họ. Các API này hỗ trợ tìm kiếm ngữ nghĩa (tìm kiếm theo nghĩa, bao gồm tìm kiếm hình ảnh) và tìm kiếm theo từ vựng (tìm kiếm theo từ chính xác), do đó cho phép người dùng tìm thấy những gì họ cần một cách trực quan và linh hoạt hơn.
Các API tìm kiếm này chạy cục bộ trên tất cả các loại thiết bị và cung cấp hiệu suất và quyền riêng tư liền mạch. Trên Copilot+ PC, chức năng ngữ nghĩa đã được bật để có được trải nghiệm chất lượng.
Ngoài tìm kiếm truyền thống, các API này còn hỗ trợ RAG (Tạo tăng cường truy xuất), cho phép các nhà phát triển sử dụng dữ liệu tùy chỉnh của riêng họ để hỗ trợ đầu ra LLM.
Các API này hiện có sẵn trong bản xem trước riêng tư.
Tóm lại, Windows AI Foundry cung cấp nhiều chức năng cho các nhà phát triển để đáp ứng nhu cầu trong hành trình AI của họ. Nó cung cấp các API có sẵn được hỗ trợ bởi các mô hình tích hợp, các công cụ để tùy chỉnh các mô hình tích hợp của Windows và thời gian chạy suy luận hiệu suất cao để giúp các nhà phát triển phân phối các mô hình của riêng họ và triển khai chúng trên chip. Thông qua tích hợp Foundry Local vào Windows AI Foundry, các nhà phát triển cũng có thể truy cập một danh mục phong phú các mô hình nguồn mở.
Áp dụng Windows AI Foundry ISV
Chúng tôi rất vui mừng được ăn mừng cộng đồng nhà phát triển đáng kinh ngạc của chúng tôi, những người đang xây dựng trải nghiệm bằng AI trên thiết bị trên Windows 11 ngày hôm nay và chúng tôi rất nóng lòng muốn xem các nhà phát triển sẽ xây dựng những gì khác bằng các chức năng phong phú do Windows AI Foundry cung cấp.
Giới thiệu hỗ trợ Giao thức ngữ cảnh mô hình (MCP) gốc để hỗ trợ hệ sinh thái Agentic trên Windows 11
Khi thế giới đang hướng tới một tương lai Agentic, Windows đang phát triển để cung cấp các công cụ, chức năng và mô hình bảo mật cho các tác nhân để chạy và nâng cao kỹ năng của họ, do đó mang lại giá trị có ý nghĩa cho khách hàng.
Nền tảng MCP trên Windows sẽ cung cấp một khung tiêu chuẩn cho các tác nhân AI để kết nối với các ứng dụng Windows gốc, các ứng dụng này có thể hiển thị các chức năng cụ thể để nâng cao các kỹ năng và khả năng của các tác nhân đó trên Windows 11 PC. Cơ sở hạ tầng này sẽ có sẵn trong bản xem trước nhà phát triển riêng tư với các đối tác được chọn trong những tháng tới để bắt đầu thu thập phản hồi.
An toàn và quyền riêng tư là trên hết: Thông qua chức năng MCP mới, chúng tôi nhận ra rằng khi chúng tôi tiếp tục mở rộng MCP và các chức năng Agentic khác, chúng tôi sẽ không ngừng học hỏi và ưu tiên hàng đầu của chúng tôi là đảm bảo rằng chúng tôi xây dựng trên một nền tảng an toàn. Dưới đây là một số nguyên tắc hướng dẫn chúng tôi phát triển MCP một cách có trách nhiệm trên Windows 11:
Chúng tôi cam kết biến sổ đăng ký MCP của Windows thành một hệ sinh thái máy chủ MCP an toàn đáng tin cậy, tuân thủ các tiêu chuẩn so sánh an ninh mạnh mẽ.
Kiểm soát người dùng là nguyên tắc hướng dẫn chúng tôi khi phát triển tích hợp này. Theo mặc định, quyền truy cập của tác nhân vào máy chủ MCP đã bị tắt. Sau khi được bật, tất cả các thao tác nhạy cảm mà tác nhân thực hiện thay mặt cho người dùng sẽ có thể kiểm tra và minh bạch.
Quyền truy cập máy chủ MCP sẽ được quản lý theo nguyên tắc đặc quyền tối thiểu, nguyên tắc này được thực thi thông qua các chức năng khai báo và cô lập (nếu có), do đó đảm bảo rằng người dùng có thể kiểm soát các đặc quyền được cấp cho máy chủ MCP và giúp hạn chế tác động của bất kỳ cuộc tấn công nào vào bất kỳ máy chủ cụ thể nào.
An toàn không phải là một chức năng một lần mà là một cam kết liên tục. Khi chúng tôi mở rộng MCP và các chức năng Agentic khác, chúng tôi sẽ tiếp tục phát triển khả năng phòng thủ của mình. Để tìm hiểu thêm về các phương pháp bảo mật, hãy truy cập Bảo vệ giao thức ngữ cảnh mô hình: Xây dựng một tương lai Agentic an toàn trên Windows.
Chúng tôi đang giới thiệu các thành phần sau trong nền tảng MCP trên Windows:
Sổ đăng ký MCP của Windows: Đây là một nguồn duy nhất, an toàn và đáng tin cậy, cho phép các tác nhân AI truy cập máy chủ MCP trên Windows. Các tác nhân có thể khám phá các máy chủ MCP được cài đặt trên thiết bị máy khách thông qua sổ đăng ký MCP của Windows, tận dụng chuyên môn của họ và mang lại giá trị có ý nghĩa cho người dùng cuối.
Máy chủ MCP của Windows: Điều này sẽ bao gồm các chức năng hệ thống Windows, chẳng hạn như hệ thống tệp, cửa sổ và Windows Subsystem for Linux, làm máy chủ MCP mà các tác nhân tương tác.
Nhà phát triển có thể đóng gói các chức năng và tính năng mong muốn trong ứng dụng của họ dưới dạng máy chủ MCP và cung cấp chúng thông qua sổ đăng ký MCP của Windows. Chúng tôi đang giới thiệu các thao tác ứng dụng trên Windows, đây là một chức năng nhà phát triển mới, cũng có thể được sử dụng làm máy chủ MCP tích hợp, cho phép các ứng dụng cung cấp chức năng của chúng cho các tác nhân.
Kiến trúc MCP trên Windows
Chúng tôi đang hợp tác với các nhà phát triển ứng dụng (chẳng hạn như Anthropic, Perplexity, OpenAI và Figma) để xây dựng nền tảng này, những nhà phát triển này đang tích hợp chức năng MCP của họ cho các ứng dụng trên Windows.
Như Rich O’Connell, người đứng đầu liên minh chiến lược của Anthropic, đã chia sẻ, "_Chúng tôi rất vui khi thấy việc tiếp tục áp dụng giao thức ngữ cảnh mô hình cũng như hệ sinh thái tích hợp đang phát triển mạnh mẽ được xây dựng bởi các dịch vụ và cộng đồng phổ biến. LLM hưởng lợiจาก việc kết nối với thế giới dữ liệu và công cụของคุณ vàเราหวังว่าจะได้