Nvidia Đẩy Mạnh AI Doanh Nghiệp

Thích Ứng AI Cho Doanh Nghiệp và Hơn Thế Nữa

Tại Hội nghị Kỹ thuật GPU (GTC) 2025 gần đây, CEO của Nvidia, Jensen Huang, đã phác thảo chiến lược của công ty để điều chỉnh khả năng tính toán tăng tốc của mình cho nhiều ứng dụng. Trong khi tâm điểm chiếu sáng rực rỡ vào các GPU ‘Blackwell’ B300 thế hệ tiếp theo của Nvidia và dòng bộ tăng tốc ‘Rubin’ trong tương lai, Huang cũng nhấn mạnh cam kết của công ty trong việc phục vụ nhu cầu của các doanh nghiệp, điện toán biên và lĩnh vực AI vật lý.

Huang nhấn mạnh rằng trong khi các nhà cung cấp dịch vụ đám mây bị thu hút bởi công nghệ tiên tiến và phương pháp tiếp cận full-stack của Nvidia, thì việc áp dụng rộng rãi hơn của AI đòi hỏi một chiến lược tinh tế hơn. Ông tuyên bố, “Tính toán tăng tốc không phải là về chip, thậm chí không phải là về chip và các thư viện, mô hình lập trình. Đó là chip, mô hình lập trình và một loạt phần mềm đi kèm với nó.”

Sự Phát Triển Của AI: Từ Đám Mây Đến Khắp Mọi Nơi

Động lực ban đầu của AI có thể bắt nguồn từ đám mây, nhưng quỹ đạo của nó rõ ràng đang mở rộng ra xa hơn. Khi AI thâm nhập vào các lĩnh vực khác nhau, nó gặp phải các cấu hình hệ thống, môi trường hoạt động, thư viện chuyên biệt và các mô hình sử dụng đa dạng. Huang nhấn mạnh sự mở rộng này, lưu ý đến các yêu cầu riêng của CNTT doanh nghiệp, sản xuất, robot, xe tự lái và thậm chí cả các nhà cung cấp đám mây GPU mới nổi.

Bản chất cơ bản của điện toán đang được định hình lại bởi AI và machine learning, ảnh hưởng đến mọi thứ từ bộ xử lý và hệ điều hành đến các ứng dụng và việc điều phối chúng. Quy trình làm việc của doanh nghiệp đang phát triển từ việc truy xuất dữ liệu đơn giản sang tương tác hỏi đáp tương tác với các hệ thống AI.

Sự Trỗi Dậy Của Các Tác Nhân AI và Người Lao Động Kỹ Thuật Số

Huang hình dung ra một tương lai nơi các tác nhân AI trở thành một phần không thể thiếu của lực lượng lao động kỹ thuật số. Ông dự đoán rằng cùng với một tỷ người lao động tri thức trên thế giới, sẽ có mười tỷ người lao động kỹ thuật số xuất hiện, cộng tác liền mạch. Sự hiện diện phổ biến của các tác nhân AI này đòi hỏi một loại máy tính mới, được tối ưu hóa cho các nhu cầu hoạt động riêng của chúng.

Giới Thiệu Phần Cứng Mới Cho Kỷ Nguyên AI

Nvidia đang giải quyết nhu cầu này bằng việc giới thiệu hai siêu máy tính AI cá nhân: DGX Spark và DGX Station. Các hệ thống máy tính để bàn này được thiết kế để suy luận và các tác vụ khác, cung cấp sự linh hoạt cho hoạt động cục bộ hoặc tích hợp với DGX Cloud của Nvidia và các môi trường đám mây tăng tốc khác.

DGX Spark tự hào có Superchip GB10 Grace Blackwell, mang lại hiệu suất vượt trội cho việc tinh chỉnh và suy luận AI. DGX Station, một hệ thống máy tính để bàn mạnh mẽ hơn, có Superchip máy tính để bàn GB300 Grace-Blackwell Ultra, cung cấp bộ nhớ liên kết khổng lồ 784 GB, ConnectX-8 SuperNIC của Nvidia, nền tảng phần mềm AI Enterprise và quyền truy cập vào các dịch vụ vi mô NIM AI.

Vượt Ra Ngoài Các Tác Nhân: Bình Minh Của Suy Luận AI

Các hệ thống mới này không chỉ cung cấp cho các doanh nghiệp các công cụ mạnh mẽ cho khối lượng công việc AI mà còn mở đường cho giai đoạn phát triển tiếp theo của AI: các mô hình suy luận. Các mô hình này thể hiện một bước nhảy vọt đáng kể so với các tác nhân AI cơ bản, có khả năng giải quyết các vấn đề phức tạp và thể hiện khả năng suy luận vượt xa bản chất nhắc nhở và trả lời của các chatbot AI hiện tại.

Huang mô tả sự tiến bộ này, nói rằng, “Giờ đây chúng ta có Ais có thể suy luận, về cơ bản là chia nhỏ một vấn đề, từng bước một. Giờ đây chúng ta có Ais có thể suy luận từng bước bằng cách sử dụng… các công nghệ được gọi là chuỗi suy nghĩ, tốt nhất trong N, kiểm tra tính nhất quán, lập kế hoạch đường đi, một loạt các kỹ thuật khác nhau.”

Mô Hình Nemotron: Trao Quyền Cho Suy Luận AI

Xây dựng trên nền tảng được đặt ra tại Consumer Electronics Show với việc ra mắt các mô hình Llama Nemotron và Cosmos Nemotron, Nvidia đã giới thiệu một loạt các mô hình Llama Nemotron mở tại GTC. Các mô hình này tự hào có khả năng suy luận nâng cao cho các tác vụ đa bước trong toán học, mã hóa, ra quyết định và tuân theo hướng dẫn.

Kari Briski, Phó Chủ tịch Phần mềm AI Tạo sinh cho Doanh nghiệp của Nvidia, đã nhấn mạnh cam kết của công ty trong việc hỗ trợ nhà phát triển. Nvidia đang cung cấp các bộ dữ liệu, bao gồm 60 tỷ token dữ liệu được tạo tổng hợp và các kỹ thuật để tạo điều kiện thuận lợi cho việc áp dụng các mô hình này.

Briski giải thích, “Giống như con người, các tác nhân cần hiểu ngữ cảnh để chia nhỏ các yêu cầu phức tạp, hiểu ý định của người dùng và thích ứng trong thời gian thực.”

Các mô hình Nemotron cung cấp các mức độ khả năng suy luận khác nhau và có ba kích cỡ: Nano (được tối ưu hóa cho PC và thiết bị biên), Super (độ chính xác và thông lượng cao trên một GPU) và Ultra (được thiết kế cho nhiều GPU).

AI-Q Blueprint: Kết Nối Dữ Liệu Với Các Tác Nhân Suy Luận

Nền tảng phần mềm AI Enterprise của Nvidia đang được tăng cường với AI-Q Blueprint, một sản phẩm dựa trên NIM cho phép các doanh nghiệp kết nối dữ liệu độc quyền với các tác nhân AI suy luận. Phần mềm mở này tích hợp với công cụ NeMo Retriever của Nvidia, cho phép truy vấn các loại dữ liệu đa dạng (văn bản, hình ảnh, video) và tạo điều kiện cộng tác giữa tính toán tăng tốc của Nvidia và các nền tảng lưu trữ và phần mềm của bên thứ ba, bao gồm cả các mô hình Llama Nemotron.

Briski nhấn mạnh những lợi ích cho các nhóm phát triển, nói rằng, “Đối với các nhóm tác nhân được kết nối, bản thiết kế cung cấp khả năng quan sát và tính minh bạch cho hoạt động của tác nhân, cho phép các nhà phát triển cải thiện tác nhân theo thời gian. Các nhà phát triển có thể cải thiện độ chính xác của tác nhân và giảm thời gian hoàn thành các tác vụ này từ hàng giờ xuống còn vài phút.”

Nền Tảng Dữ Liệu AI: Thiết Kế Tham Khảo Cho Cơ Sở Hạ Tầng Doanh Nghiệp

Nền tảng Dữ liệu AI của Nvidia đóng vai trò là thiết kế tham khảo cho cơ sở hạ tầng doanh nghiệp, kết hợp các tác nhân truy vấn AI được xây dựng bằng AI-Q Blueprint.

AI Vật Lý: Kết Nối Thế Giới Kỹ Thuật Số và Vật Lý

Huang cũng đề cập đến lĩnh vực AI vật lý đang phát triển, bao gồm việc tích hợp AI vào các hệ thống vật lý để cho phép nhận thức và tương tác trong thế giới thực. Ông dự đoán rằng lĩnh vực này có thể trở thành phân khúc lớn nhất của thị trường AI.

“AI hiểu thế giới vật lý, những thứ như ma sát và quán tính, nguyên nhân và kết quả, tính vĩnh viễn của đối tượng, khả năng hiểu thế giới vật lý, thế giới ba chiều. Đó là những gì sẽ cho phép một kỷ nguyên mới của AI vật lý và nó sẽ cho phép robot học,” Huang giải thích.

Những Tiến Bộ Trong Robot Học và Xe Tự Hành

Một số thông báo đã nhấn mạnh cam kết của Nvidia đối với AI vật lý, bao gồm việc giới thiệu Bộ dữ liệu AI của Nvidia, được thiết kế đặc biệt cho robot và xe tự hành. Bộ dữ liệu này trao quyền cho các nhà phát triển đào tạo trước, kiểm tra, xác thực và tinh chỉnh các mô hình nền tảng, tận dụng cả dữ liệu thế giới thực và dữ liệu tổng hợp được sử dụng trong nền tảng phát triển mô hình thế giới Cosmos của Nvidia, phần mềm Drive AV, nền tảng phát triển robot Isaac AI và khung Metropolis cho các thành phố thông minh.

Phiên bản ban đầu của bộ dữ liệu có sẵn trên Hugging Face, cung cấp 15 terabyte dữ liệu để đào tạo robot, với sự hỗ trợ cho phát triển xe tự hành dự kiến trong tương lai gần.
Ngoài ra, Nvidia đã công bố Isaac GROOT N1, một mô hình nền tảng cho robot hình người. Nó được đào tạo trên dữ liệu thực và tổng hợp, và đại diện cho sự tiến bộ của Project GROOT.

Mở Rộng Chân Trời AI

Các sáng kiến chiến lược của Nvidia thể hiện một tầm nhìn rõ ràng cho tương lai của AI, mở rộng phạm vi tiếp cận của nó vượt ra ngoài giới hạn của đám mây và đi vào trung tâm của doanh nghiệp và thế giới vật lý. Thông qua sự kết hợp của phần cứng tiên tiến, nền tảng phần mềm sáng tạo và cam kết trao quyền cho nhà phát triển, Nvidia đang định vị mình là động lực thúc đẩy làn sóng đổi mới AI tiếp theo. Việc giới thiệu các khả năng suy luận, cùng với việc phát triển các công cụ và bộ dữ liệu cho AI vật lý, đánh dấu một bước tiến quan trọng hướng tới một tương lai nơi AI tích hợp liền mạch với cuộc sống hàng ngày của chúng ta, chuyển đổi các ngành công nghiệp và xác định lại cách chúng ta tương tác với công nghệ. Việc tập trung vào các giải pháp doanh nghiệp, điện toán biên và robot học làm nổi bật sự hiểu biết của Nvidia về các nhu cầu đa dạng và đang phát triển của bối cảnh AI, củng cố vị trí của mình như một nhà lãnh đạo trong cuộc cách mạng công nghệ biến đổi này.