Trong lĩnh vực trí tuệ nhân tạo, bối cảnh đóng vai trò tối quan trọng. Nguyên tắc này phản ánh trí thông minh của con người, cho thấy sự liên quan của nó đến AI, vì chúng ta tạo ra nó theo hình ảnh của chính mình.
Hiện tại, chúng ta thấy các công ty như NVIDIA đi đầu trong việc xây dựng các nhà máy AI – về cơ bản là các siêu máy tính xử lý hàng petabyte dữ liệu để cung cấp các phản hồi thông minh – như một phương tiện mới để thúc đẩy những thay đổi đáng kể trong nền kinh tế và văn hóa toàn cầu.
Nhưng làm thế nào chúng ta đến được bước ngoặt này? Câu trả lời, như mọi khi, nằm ở một loạt các tiến bộ gia tăng.
Trước khi đi sâu vào các chi tiết cụ thể của nhà máy AI và ý nghĩa của chúng đối với tương lai của kinh doanh và xã hội, chúng ta hãy thiết lập một số bối cảnh nền tảng.
Cuộc cách mạng đồ đá mới: Gieo mầm đổi mới
Khoảng 12.000 năm trước, tổ tiên của chúng ta đã chuyển từ những người du mục săn bắn hái lượm sang những người nông nghiệp định cư, trồng trọt và chăn nuôi để kiếm sống. Nông nghiệp, hay canh tác, đại diện cho một nhà máy thực phẩm sơ khai, dựa vào ánh sáng mặt trời, nước và không khí để cây trồng và vật nuôi phát triển. Thuật ngữ “firma”, biểu thị một khoản thanh toán tiền thuê cố định cho việc canh tác đất đai vào thời trung cổ, đã trở thành đồng nghĩa với nông nghiệp.
Nông nghiệp đòi hỏi các cấu trúc xã hội phân cấp để hoạt động canh tác hiệu quả. Chữ viết nổi lên như một công cụ hành chính, tạo điều kiện thuận lợi cho việc theo dõi các đầu vào và đầu ra trong các nhà máy thực phẩm này và thiết lập các quy tắc xã hội. Theo thời gian, chữ viết mở rộng để bao gồm các lĩnh vực đa dạng và vẫn là một phương tiện mạnh mẽ để truyền đạt thông tin phức tạp.
Từ thời điểm chúng ta đổi cung tên và giáo mác lấy cuốc xẻng, cào và lưỡi cày, và khắc những ký tự tượng trưng đầu tiên vào đất sét hoặc đá, sự ra đời của AI, và do đó, nhà máy AI, đã trở nên không thể tránh khỏi. Đó chỉ là vấn đề thời gian.
Cuộc cách mạng công nghiệp: Rèn luyện con đường dẫn đến sản xuất hàng loạt
Trong hàng thiên niên kỷ, nhân loại đã mài giũa các kỹ năng nông nghiệp của mình, tạo ra thặng dư thúc đẩy sự xuất hiện của một tầng lớp thương gia – những cá nhân tham gia vào việc chế tạo hàng hóa cho người khác, hay “sản xuất”, có nguồn gốc từ tiếng Latinh “một công việc bằng tay”. Điều này dẫn đến sự phát triển của tiền tệ, một phương tiện trao đổi giúp tăng tốc độ buôn bán và biến nó thành nền kinh tế hiện đại. Toàn cầu hóa kết nối các nền kinh tế khu vực và quốc gia sau Thời đại Khám phá.
Các làn sóng toàn cầu hóa tiếp theo đã định hình lại cả nông nghiệp và sản xuất. Một sự thay đổi quan trọng trong các nhà máy, trung tâm của sản xuất tiêu chuẩn, liên quan đến việc chia quá trình sản xuất thành các bước riêng biệt để tăng tốc độ và khả năng lặp lại. Cuộc cách mạng công nghiệp này trùng hợp với Thời kỳ Khai sáng, đặc trưng bởi tỷ lệ biết chữ tăng vọt khi các nhà máy yêu cầu công nhân được giáo dục để tối đa hóa hiệu quả và giảm thiểu lãng phí. Giáo dục trở thành một điều cần thiết, thúc đẩy sự công nhận về quyền bầu cử, quyền sở hữu tư nhân, tự do tôn giáo, an toàn, ngôn luận và quyền được xét xử nhanh chóng.
Những nguyên tắc này, tự thân đã rõ ràng trong thế kỷ 21, có nguồn gốc từ thế kỷ 18.
Các nhà máy đưa sản xuất vào trong nhà, sử dụng hơi nước và điện để cung cấp năng lượng cho dây chuyền lắp ráp và các kỹ thuật sản xuất tinh gọn. Điều này cho phép sản xuất hàng hóa với giá cả phải chăng, nâng cao mức sống và thúc đẩy sự tăng trưởng của tầng lớp trung lưu, thúc đẩy sự mở rộng kinh tế vượt xa khả năng của các xã hội nông nghiệp.
Cuộc cách mạng AI: Dữ liệu là biên giới mới
Sự ra đời của Internet kết nối các cá nhân và tạo ra một nguồn tài nguyên mới: dữ liệu, chín muồi cho phân tích sâu sắc.
Cuộc cách mạng AI xoay quanh việc số hóa một lượng lớn văn bản, hình ảnh, video và âm thanh, kết hợp với sức mạnh tính toán giá cả phải chăng để xử lý dữ liệu này. Dữ liệu lớn, khi kết hợp với GPU song song khổng lồ và băng thông bộ nhớ cao, cho phép tạo ra các mạng thần kinh mã hóa sự hiểu biết của chúng ta về thế giới, do đó cho phép trí tuệ nhân tạo.
Về cơ bản, dữ liệu lớn cung cấp nguyên liệu thô cho các thuật toán AI chạy trên các công cụ GPU để xây dựng các mạng thần kinh chức năng.
Các yếu tố này phải hội tụ đồng thời. Trong những năm 1980, các nhà nghiên cứu sở hữu các thuật toán mạng thần kinh nhưng thiếu tài nguyên tính toán và dữ liệu để triển khai chúng. Do đó, AI phần lớn vẫn mang tính lý thuyết cho đến khi ba điều kiện này được đáp ứng.
Nhà máy AI: Một sự chuyển đổi theo nghĩa đen
Thuật ngữ “nhà máy AI” không chỉ là một phép ẩn dụ mà là một mô tả chính xác về một siêu máy tính AI hiện đại hoạt động trong một môi trường thương mại. Nó về cơ bản làm thay đổi điện toán doanh nghiệp và phân tích dữ liệu – sự tổng hợp dữ liệu thành thông tin hữu ích.
Nhà máy AI là không thể tránh khỏi như cuộc cách mạng nông nghiệp, nơi nỗ lực tập thể đảm bảo sản xuất lương thực. Những thay đổi về xã hội và văn hóa do cuộc cách mạng này mang lại đã cho nhân loại thời gian rảnh rỗi để suy ngẫm và đổi mới. Giờ đây, máy móc có thể truy cập và xử lý toàn bộ kiến thức của nhân loại, cho phép tìm kiếm đàm thoại và ứng dụng ngược lại các thuật toán AI để tạo dữ liệu mới ở nhiều định dạng khác nhau.
Doanh nghiệp và cá nhân sẽ có quyền truy cập vào các nhà máy AI, trực tiếp hoặc thông qua các thỏa thuận chia sẻ thời gian. Các nhà máy AI này sẽ tạo ra những ý tưởng, tầm nhìn mới và khuếch đại khả năng sáng tạo cá nhân.
Tiềm năng biến đổi của các nhà máy AI là bao trùm tất cả. Các chatbot, các nhà phát triển các công cụ tính toán song song để đào tạo và suy luận mô hình, và những người tạo mô hình như OpenAI, Anthropic, Google và Mistral đều đồng ý rằng AI sẽ định hình lại mọi khía cạnh của cuộc sống của chúng ta. Bất chấp những bất đồng toàn cầu về các vấn đề khác nhau, tác động chuyển đổi của AI được thừa nhận rộng rãi.
Sản xuất cái nhìn sâu sắc và hành động
Các nhà máy AI phục vụ hai chức năng chính. Đầu tiên là đào tạo các mô hình nền tảng, mang lại những hiểu biết sâu sắc để cải thiện kinh doanh và cá nhân. Thứ hai, và quan trọng hơn, chức năng liên quan đến việc đưa dữ liệu và câu hỏi mới vào các mô hình này để suy ra các câu trả lời mới, tạo ra các mã thông báo mới và thúc đẩy hành động.
Phần lớn các cuộc thảo luận xung quanh AI đã tập trung vào việc đào tạo các mô hình nền tảng ngày càng mở rộng, tự hào có hàng trăm tỷ đến hàng nghìn tỷ tham số và các bộ dữ liệu khổng lồ. Số lượng mã thông báo cho biết bề rộng của kiến thức, trong khi các tham số phản ánh chiều sâu của sự hiểu biết. Số lượng tham số nhỏ hơn kết hợp với các bộ mã thông báo lớn hơn mang lại câu trả lời nhanh hơn, đơn giản hơn. Ngược lại, số lượng tham số lớn hơn và các bộ mã thông báo nhỏ hơn cung cấp những hiểu biết sắc thái hơn về một miền giới hạn. Các mô hình lý luận chuỗi tư duy, có bản chất đa phương thức, kết hợp các mô hình chuyên biệt để xem xét các đầu ra thúc đẩy các đầu vào khác, tạo ra các câu trả lời toàn diện.
Các nhà máy AI sử dụng tất cả nội dung do nhân loại tạo ra và dữ liệu tổng hợp do các mô hình AI tạo ra làm nguyên liệu thô. Những hiểu biết sâu sắc có được từ dữ liệu này được con người và các tác nhân AI khai thác để thúc đẩy hành động. Thay vì làm việc tại nhà máy, các cá nhân khai thác nó, tăng cường kỹ năng của họ bằng kiến thức và tốc độ của các mô hìnhAI để đạt được kết quả nhiều hơn, tốt hơn và nhanh hơn.
Theo Jensen Huang, đồng sáng lập và CEO của NVIDIA, ‘Thế giới đang chạy đua để xây dựng các nhà máy AI quy mô lớn, hiện đại nhất.’ Việc thành lập một nhà máy AI là một kỳ công kỹ thuật phi thường, đòi hỏi nguồn lực, nhân lực và vật chất to lớn.
Việc xây dựng một nhà máy AI đòi hỏi vốn đầu tư đáng kể. Một cấu hình điển hình bao gồm NVIDIA DGX SuperPOD dựa trên nhiều giá đỡ hệ thống DGX, có GPU, CPU, kết nối tốc độ cao và bộ nhớ.
Với nhiều hệ thống DGX, SuperPOD mang lại hiệu suất đáng kể, tự hào có dung lượng bộ nhớ và băng thông đáng kể. Hiệu suất có thể được mở rộng bằng cách thêm nhiều hệ thống hơn.
Một bản thiết kế NVIDIA khác cho một nhà máy AI tập trung vào nền tảng NVIDIA GB200 NVL72, một hệ thống quy mô giá tích hợp GPU, CPU, DPU, SuperNIC, NVLink và NVSwitch, và mạng tốc độ cao. Nền tảng này cung cấp một miền bộ nhớ GPU dùng chung lớn hơn cho các mô hình AI và mật độ tính toán cao hơn, đòi hỏi làm mát bằng chất lỏng.
GB200 NVL72, được vận chuyển với số lượng lớn, đại diện cho một hệ thống khép kín có khả năng xây dựng các mô hình và tạo dữ liệu ở nhiều định dạng khác nhau.
GB200 NVL72 bao gồm một nút máy chủ MGX có CPU NVIDIA Grace kết hợp với GPU Blackwell. Hai trong số các nút máy chủ này tạo thành một khay tính toán trong giá NVL72, với mười tám khay tính toán chứa nhiều GPU và CPU.
Hệ thống quy mô giá GB200 NVL72 kết hợp CPU Grace với GPU Blackwell, được kết nối thông qua các kết nối NVLink tốc độ cao. Các cổng NVLink và chip NVSwitch liên kết tất cả các GPU trong một cấu hình bộ nhớ chia sẻ, lý tưởng cho việc đào tạo mô hình nền tảng và suy luận chuỗi tư duy.
Kết cấu NVLink, được tạo điều kiện bởi chín khay chuyển mạch NVLink, cho phép truy cập vào tất cả các khuôn GPU như một GPU thống nhất cho các ứng dụng AI.
Các hệ thống GB200 NVL72 có nhiều lõi Arm để xử lý máy chủ và sức mạnh xử lý dấu phẩy động đáng kể. Hệ thống GB200 NVL72 tự hào có bộ nhớ HBM3e đáng kể được gắn vào GPU, với băng thông tổng hợp cao. CPU Grace có bộ nhớ LPDDR5X, có thể truy cập qua NVLink.
NVIDIA GB200 NVL72 phản ánh tác động chuyển đổi của System/360 đối với xử lý giao dịch trực tuyến, sự khác biệt chính là khả năng mở rộng của NVL72 thông qua các kết nối InfiniBand.
Các cấu hình DGX SuperPOD dựa trên các hệ thống quy mô giá NVL72 đòi hỏi nguồn điện đáng kể nhưng mang lại sức mạnh tính toán và dung lượng bộ nhớ to lớn trên nhiều giá đỡ tính toán. Hiệu suất có thể được mở rộng bằng cách thêm nhiều giá đỡ hơn.
Mật độ tính toán của giá NVL72 đòi hỏi làm mát bằng chất lỏng chuyên dụng và cơ sở hạ tầng trung tâm dữ liệu, đại diện cho sự trở lại các thông lệ trong quá khứ, nơi các máy làm mát bằng nước tối đa hóa hiệu suất.
Các nhà máy AI sẽ đòi hỏi sức mạnh tính toán lớn hơn đáng kể khi suy luận trở thành không thể thiếu đối với các ứng dụng đa dạng, đặc biệt là với sự chuyển đổi sang các mô hình lý luận chuỗi tư duy.
Các nhà máy AI bao gồm không chỉ phần cứng mà còn cả hệ thống và phần mềm phát triển.
Hệ thống DGX GB200 và siêu máy tính AI DGX SuperPOD yêu cầu quản lý và mô hình hóa, được tạo điều kiện bởi các công cụ như NVIDIA Mission Control, công cụ này điều phối khối lượng công việc AI và tự động khôi phục các công việc. Mission Control theo dõi tình trạng hệ thống và tối ưu hóa mức tiêu thụ điện năng.
NVIDIA AI Enterprise, bộ phần mềm hệ thống, bao gồm các thư viện, mô hình và khuôn khổ được tối ưu hóa cho GPU và mạng NVIDIA. Ngăn xếp nhà máy AI cũng có NVIDIA Dynamo, một khuôn khổ nguồn mở để chạy suy luận trên cơ sở hạ tầng NVLink và DGX SuperPOD. DGX Expert Service and Support hỗ trợ khách hàng triển khai các công nghệ này, giảm thời gian đến mã thông báo đầu tiên. NVIDIA cung cấp các bản thiết kế nhà máy AI cho môi trường ‘song sinh kỹ thuật số’ Omniverse của mình để mô phỏng và tối ưu hóa thiết kế trung tâm dữ liệu.
Một khía cạnh quan trọng của các nhà máy AI là sự thay đổi trong tư duy mà chúng tạo ra, với NVIDIA ưu tiên khoảng không cho sự phát triển của hệ thống.
Theo Gilad Shainer, phó chủ tịch cấp cao về mạng tại NVIDIA, ‘Tạo mã thông báo bây giờ tương đương với tạo doanh thu cho nhiều công ty.’ Các trung tâm dữ liệu đang phát triển từ các trung tâm chi phí thành các tài sản sản xuất.
Và đó, cuối cùng, là bản chất của việc xây dựng một nhà máy.