Điều Hướng Cuộc Cách Mạng Suy Luận
Jensen Huang, CEO của Nvidia, đã phát biểu tại hội nghị các nhà phát triển phần mềm thường niên của công ty ở San Jose, California, khẳng định vị trí vững chắc của Nvidia giữa bối cảnh chuyển đổi quan trọng trong ngành công nghiệp trí tuệ nhân tạo (AI). Ông nhấn mạnh sự thay đổi đang diễn ra từ giai đoạn huấn luyện (training) các mô hình AI sang giai đoạn suy luận (inference), nơi các doanh nghiệp ngày càng tập trung vào việc trích xuất những hiểu biết chi tiết, có thể hành động từ các mô hình này.
Giải Quyết Mối Quan Ngại Của Nhà Đầu Tư và Động Lực Thị Trường
Bài thuyết trình của Huang, được thực hiện trong chiếc áo khoác da đen và quần jean đặc trưng của ông, đóng vai trò như một lời bảo vệ cho vị trí thống trị của Nvidia trong thị trường chip AI đầy cạnh tranh. Những lo ngại gần đây của các nhà đầu tư, được thúc đẩy bởi các báo cáo về việc các đối thủ cạnh tranh như DeepSeek của Trung Quốc đạt được hiệu suất chatbot tương đương với tiềm năng sử dụng ít chip AI hơn, đã tạo ra một bóng đen cho vị trí dẫn đầu dường như không thể lay chuyển của Nvidia.
Bất chấp bài phát biểu đầy tự tin của Huang, thị trường đã phản ứng với một mức độ hoài nghi. Cổ phiếu của Nvidia đã giảm 3,4%, phản ánh sự sụt giảm rộng hơn của chỉ số chip, đóng cửa giảm 1,6%. Phản ứng này cho thấy thị trường có thể đã định giá phần lớn các tin tức được dự đoán trước, phản ánh cách tiếp cận “chờ xem” đối với chiến lược dài hạn của Nvidia.
Xóa Tan Những Quan Niệm Sai Lầm và Làm Nổi Bật Nhu Cầu Tính Toán
Huang trực tiếp đối đầu với những gì ông cho là sự hiểu lầm lan rộng liên quan đến các yêu cầu tính toán ngày càng tăng của AI. Ông mạnh dạn tuyên bố, “Gần như cả thế giới đã hiểu sai,” nhấn mạnh sự gia tăng theo cấp số nhân về sức mạnh tính toán cần thiết cho các ứng dụng AI tiên tiến, đặc biệt là trong lĩnh vực “AI tác tử” (agentic AI).
Agentic AI, đặc trưng bởi các tác tử tự động có khả năng thực hiện các tác vụ thường ngày với sự can thiệp tối thiểu của con người, đòi hỏi khả năng xử lý lớn hơn đáng kể. Huang ước tính rằng nhu cầu tính toán cho agentic AI và suy luận “dễ dàng gấp 100 lần so với những gì chúng ta nghĩ là cần thiết vào thời điểm này năm ngoái.” Sự gia tăng đáng kể này nhấn mạnh nhu cầu liên tục và có lẽ bị đánh giá thấp đối với các giải pháp điện toán hiệu năng cao.
Sự Phân Đôi Giữa Huấn Luyện và Suy Luận
Một yếu tố quan trọng trong thách thức hiện tại của Nvidia nằm ở sự thay đổi động lực của thị trường AI. Ngành công nghiệp đang chuyển đổi từ việc tập trung chủ yếu vào huấn luyện, nơi các tập dữ liệu khổng lồ được sử dụng để truyền đạt trí thông minh cho các mô hình AI như chatbot, sang suy luận. Suy luận là giai đoạn mà mô hình đã được huấn luyện tận dụng kiến thức đã học được để cung cấp cho người dùng các câu trả lời và giải pháp cụ thể.
Sự thay đổi này tạo ra một trở ngại tiềm tàng cho Nvidia, vì các chip sinh lợi nhất của hãng theo truyền thống đã được tối ưu hóa cho giai đoạn huấn luyện chuyên sâu về tính toán. Mặc dù Nvidia đã xây dựng một hệ sinh thái mạnh mẽ gồm các công cụ phần mềm và hỗ trợ nhà phát triển trong thập kỷ qua, nhưng chính các chip trung tâm dữ liệu, có giá hàng chục nghìn đô la, mới là động lực chính cho phần lớn doanh thu của hãng, tổng cộng 130,5 tỷ đô la vào năm ngoái.
Duy Trì Động Lực: Sự Tăng Trưởng Ba Năm và Hơn Thế Nữa
Cổ phiếu của Nvidia đã chứng kiến sự tăng trưởng vượt bậc, tăng hơn gấp bốn lần giá trị trong ba năm qua. Sự tăng trưởng đáng kể này được thúc đẩy bởi vai trò then chốt của công ty trong việc cung cấp năng lượng cho sự xuất hiện của các hệ thống AI tinh vi, bao gồm ChatGPT, Claude và nhiều hệ thống khác. Phần cứng của công ty đã trở thành đồng nghĩa với sự phát triển AI tiên tiến.
Tuy nhiên, việc duy trì động lực này đòi hỏi phải thích ứng với các yêu cầu thay đổi của thị trường tập trung vào suy luận. Mặc dù tầm nhìn dài hạn về một ngành công nghiệp AI được xây dựng trên các chip của Nvidia vẫn còn hấp dẫn, kỳ vọng của các nhà đầu tư ngắn hạn nhạy cảm hơn với những thách thức và cơ hội trước mắt do cuộc cách mạng suy luận mang lại.
Ra Mắt Chip Thế Hệ Tiếp Theo: Blackwell Ultra và Hơn Thế Nữa
Huang đã sử dụng hội nghị làm nền tảng để công bố một loạt các bản phát hành chip mới, được thiết kế để củng cố vị trí của Nvidia trong bối cảnh AI đang phát triển. Trong số những thông báo này có việc ra mắt chip GPU Blackwell Ultra, dự kiến phát hành vào nửa cuối năm nay.
Blackwell Ultra tự hào có dung lượng bộ nhớ nâng cao so với phiên bản tiền nhiệm, chip Blackwell thế hệ hiện tại. Bộ nhớ tăng lên này cho phép nó hỗ trợ các mô hình AI lớn hơn và phức tạp hơn, đáp ứng nhu cầu ngày càng tăng của các ứng dụng AI tiên tiến.
Tập Trung Kép: Khả Năng Phản Hồi và Tốc Độ
Huang nhấn mạnh rằng các chip của Nvidia được thiết kế để giải quyết hai khía cạnh quan trọng của hiệu suất AI: khả năng phản hồi (responsiveness) và tốc độ (speed). Các chip phải cho phép các hệ thống AI cung cấp các phản hồi thông minh cho một số lượng lớn các truy vấn của người dùng đồng thời cung cấp các phản hồi đó với độ trễ tối thiểu.
Huang lập luận rằng công nghệ của Nvidia có vị trí độc nhất để vượt trội trong cả hai lĩnh vực. Ông đã so sánh với tìm kiếm trên web, nói rằng, “Nếu bạn mất quá nhiều thời gian để trả lời một câu hỏi, khách hàng sẽ không quay lại.” Sự so sánh này làm nổi bật tầm quan trọng của tốc độ và hiệu quả trong việc duy trì sự tương tác và hài lòng của người dùng trong các ứng dụng hỗ trợ AI.
Lộ Trình Cho Tương Lai: Vera Rubin và Feynman
Nhìn xa hơn Blackwell Ultra, Huang đã cung cấp một cái nhìn thoáng qua về lộ trình chip tương lai của Nvidia, tiết lộ chi tiết về hệ thống Vera Rubin sắp ra mắt. Dự kiến phát hành vào nửa cuối năm 2026, Vera Rubin được thiết kế để kế nhiệm Blackwell, cung cấp tốc độ nhanh hơn và khả năng nâng cao.
Xa hơn nữa, Huang thông báo rằng chip Rubin sẽ được tiếp nối bởi chip Feynman, dự kiến sẽ ra mắt vào năm 2028. Lộ trình đa thế hệ này thể hiện cam kết của Nvidia đối với sự đổi mới liên tục và quyết tâm duy trì lợi thế công nghệ trong thị trường phần cứng AI đang phát triển nhanh chóng.
Giải Quyết Các Thách Thức Của Ngành và Sự Ra Mắt Của Blackwell
Việc ra mắt các chip mới này diễn ra vào thời điểm mà sự gia nhập thị trường của Blackwell chậm hơn so với dự kiến ban đầu. Một lỗi thiết kế được báo cáo đã dẫn đến những thách thức trong sản xuất, góp phần vào sự chậm trễ. Tình huống này phản ánh những khó khăn rộng hơn của ngành, khi cách tiếp cận truyền thống là cung cấp các tập dữ liệu ngày càng mở rộng vào các trung tâm dữ liệu khổng lồ chứa đầy chip Nvidia đã bắt đầu cho thấy lợi nhuận giảm dần.
Bất chấp những thách thức này, Nvidia đã báo cáo vào tháng trước rằng các đơn đặt hàng cho Blackwell là “tuyệt vời”, cho thấy nhu cầu mạnh mẽ đối với chip mới bất chấp những thất bại ban đầu.
Mở Rộng Hệ Sinh Thái: Máy Trạm DGX và Đổi Mới Phần Mềm
Ngoài các thông báo về chip cốt lõi, Huang đã giới thiệu một máy tính cá nhân mới mạnh mẽ, máy trạm DGX, dựa trên chip Blackwell. Máy trạm này, sẽ được sản xuất bởi các công ty hàng đầu như Dell, Lenovo và HP, đại diện cho một thách thức đối với một số sản phẩm Mac cao cấp của Apple.
Huang tự hào trưng bày một bo mạch chủ cho một trong những thiết bị này, tuyên bố, “Đây là hình dáng của một chiếc PC.” Động thái này báo hiệu tham vọng của Nvidia trong việc mở rộng sự hiện diện của mình trong thị trường điện toán hiệu năng cao ngoài các trung tâm dữ liệu và vào lĩnh vực máy trạm chuyên nghiệp.
Dynamo: Tăng Tốc Suy Luận và Hợp Tác với General Motors
Về mặt phần mềm, Huang đã công bố phát hành Dynamo, một công cụ phần mềm mới được thiết kế để tăng tốc quá trình suy luận trong các ứng dụng AI. Dynamo đang được cung cấp miễn phí, nhằm mục đích thúc đẩy việc áp dụng rộng rãi hơn và tăng tốc đổi mới trong lĩnh vực này.
Hơn nữa, Huang tiết lộ một quan hệ đối tác quan trọng với General Motors, chọn Nvidia để cung cấp năng lượng cho đội xe tự lái của mình. Sự hợp tác này nhấn mạnh ảnh hưởng ngày càng tăng của Nvidia trong ngành công nghiệp ô tô và cam kết thúc đẩy công nghệ lái xe tự động. Đây là một chiến thắng nổi bật, và nó cho thấy các ứng dụng của Nvidia đa dạng như thế nào.
Con Đường Phía Trước
Nvidia đang đặt cược lớn vào tương lai của AI, và sự đổi mới liên tục của họ là chìa khóa. Họ nhận ra sự cần thiết phải thích ứng với sự thay đổi hướng tới suy luận, và họ đã phát triển các chip có thể làm cả hai. Với lịch sử thành công và cam kết nghiên cứu và phát triển, Nvidia có khả năng vẫn là một công ty lớn trong ngành công nghiệp AI trong nhiều năm tới. Quan hệ đối tác với các công ty công nghệ và ô tô lớn là một dấu hiệu cho thấy Nvidia đang đi về đâu.