Tiếng Vọng Quá Khứ: AI Meta Thức Giấc trên Windows 98

Trong một sự giao thoa hấp dẫn giữa các kỷ nguyên công nghệ, một câu chuyện đã xuất hiện, bắc cầu giữa những ngày đầu của máy tính gia đình phổ biến với đỉnh cao của trí tuệ nhân tạo. Marc Andreessen, một nhân vật nổi bật trong thế giới công nghệ và đồng sáng lập công ty đầu tư mạo hiểm có ảnh hưởng Andreessen Horowitz, gần đây đã làm nổi bật một kỳ tích đáng chú ý: một phiên bản nhỏ gọn của mô hình trí tuệ nhân tạo Llama của Meta đã được vận hành thành công trên một máy tính chạy hệ điều hành Windows 98 đáng kính, chỉ được trang bị 128 megabyte RAM. Phát hiện này đóng vai trò như một lời nhắc nhở mạnh mẽ về tiềm năng công nghệ và đặt ra những câu hỏi hấp dẫn về quỹ đạo lịch sử của điện toán.

Chính khái niệm về việc chạy một AI phức tạp, ngay cả khi đã được thu nhỏ, trên phần cứng có niên đại hơn một phần tư thế kỷ dường như gần như nghịch lý. AI tạo sinh hiện đại, công nghệ cung cấp năng lượng cho các công cụ như ChatGPT và Copilot của chính Microsoft, thường gắn liền với các bộ xử lý mạnh mẽ, phân bổ bộ nhớ đáng kể và thường là cơ sở hạ tầng dựa trên đám mây. Bản thân Microsoft đã đầu tư mạnh mẽ vào việc tích hợp các khả năng AI, đặc biệt là trợ lý Copilot của mình, sâu vào hệ điều hành mới nhất, Windows 11, và một thế hệ phần cứng mới được mệnh danh là Copilot+ PCs, được thiết kế rõ ràng với khối lượng công việc AI. Sự tương phản này làm cho thử nghiệm Windows 98 càng trở nên nổi bật hơn. Nó thách thức các giả định của chúng ta về các tài nguyên thực sự cần thiết cho một số chức năng AI nhất định và cung cấp một cái nhìn thoáng qua về một dòng thời gian công nghệ thay thế.

Hồi sinh quá khứ: Nỗ lực phi thường đằng sau thử nghiệm

Trong khi Andreessen thu hút sự chú ý rộng rãi hơn đến thành tựu này, công việc kỹ thuật nặng nhọc dường như bắt nguồn từ công việc trước đó, đáng chú ý là của nhóm tại Exo Labs. Hành trình của họ để đưa một AI hiện đại lên cỗ máy cổ điển như vậy không hề đơn giản; đó là một bài tập về khảo cổ học kỹ thuật số và giải quyết vấn đề sáng tạo, làm nổi bật sự khác biệt lớn giữa điện toán thời đó và bây giờ.

Rào cản đầu tiên liên quan đến hậu cần cơ bản và khả năng tương thích phần cứng. Tìm kiếm phần cứng chức năng từ thời Windows 98 đã đủ thách thức. Nhưng ngoài việc chỉ khởi động máy, nhóm còn cần các thiết bị ngoại vi. Giao diện USB hiện đại, phổ biến ngày nay, không phải là tiêu chuẩn trong thời kỳ hoàng kim của Windows 98. Điều này đòi hỏi phải tìm nguồn cung cấp các thiết bị đầu vào tương thích sử dụng các đầu nối PS/2 cũ hơn – bàn phím và chuột mà nhiều người đam mê công nghệ trẻ tuổi có thể chưa bao giờ gặp phải.

Sau khi giải quyết xong thiết lập vật lý, trở ngại đáng kể tiếp theo là truyền dữ liệu. Làm thế nào để bạn đưa các tệp mô hình AI cần thiết và các công cụ phát triển vào một máy thiếu các tùy chọn kết nối hiện đại như cổng USB tốc độ cao hoặc tích hợp mạng liền mạch? Điều này có thể liên quan đến việc sử dụng các phương pháp cũ hơn, chậm hơn, có lẽ là ghi tệp vào đĩa CD hoặc sử dụng các giao thức mạng hạn chế của thời đó, biến việc sao chép tệp đơn giản thành một quy trình có khả năng tốn thời gian.

Tuy nhiên, thách thức kỹ thuật cốt lõi nằm ở việc biên dịch mã hiện đại cho một môi trường cổ xưa. Mô hình AI, dựa trên kiến trúc Llama của Meta, được xây dựng bằng các phương pháp và ngôn ngữ lập trình đương đại. Để làm cho mã này dễ hiểu và có thể thực thi bởi Windows 98 đòi hỏi một trình biên dịch – một chương trình dịch mã nguồn thành ngôn ngữ máy – có thể chạy trên hệ điều hành cũ xử lý sự phức tạp của mã AI.

Exo Labs ban đầu chuyển sang Borland C++ 5.02, bản thân nó là một phần của lịch sử phần mềm – một môi trường phát triển tích hợp (IDE) và trình biên dịch kết hợp đã 26 năm tuổi chạy nguyên bản trên Windows 98. Sự lựa chọn này đại diện cho một cầu nối tiềm năng giữa cơ sở mã hiện đại và hệ điều hành cổ điển. Tuy nhiên, con đường đầy rẫy những phức tạp. Sự phức tạp của các tiêu chuẩn và thư viện C++ hiện đại tỏ ra khó dung hòa với các khả năng và hạn chế của trình biên dịch Borland và môi trường Windows 98. Các vấn đề tương thích nảy sinh, buộc nhóm phải xoay trục.

Giải pháp của họ liên quan đến việc quay trở lại phiên bản cũ hơn của ngôn ngữ lập trình C. Mặc dù C là một ngôn ngữ nền tảng và là tiền thân của C++, việc sử dụng một tiêu chuẩn C cũ hơn có nghĩa là hy sinh một số trừu tượng hóa cấp cao hơn và sự tiện lợi của C++. Điều này đòi hỏi một quy trình mã hóa tốn nhiều công sức hơn, quản lý thủ công các yếu tố như hàm và biến mà C++ xử lý một cách thanh lịch hơn. Tiến độ chắc chắn chậm hơn, đòi hỏi sự chú ý tỉ mỉ đến từng chi tiết để tránh các lỗi mà các công cụ phát triển cũ hơn có thể không dễ dàng phát hiện ra.

Cuộc chiến bộ nhớ: Thuần hóa Llama cho tài nguyên hạn chế

Có lẽ hạn chế đáng sợ nhất là Bộ nhớ Truy cập Ngẫu nhiên (RAM) cực kỳ hạn chế. Máy mục tiêu chỉ sở hữu 128 megabyte RAM. Để dễ hình dung, điện thoại thông minh hiện đại thường xuất xưởng với 8, 12 hoặc thậm chí 16 gigabyte RAM (một gigabyte xấp xỉ 1000 megabyte). Các máy tính cá nhân cao cấp được thiết kế để chơi game hoặc công việc chuyên nghiệp thường có 32GB, 64GB hoặc hơn. Chạy một ứng dụng phức tạp như mô hình AI trong một không gian bộ nhớ nhỏ bé như vậy giống như thực hiện một cuộc phẫu thuật phức tạp trong tủ đựng chổi.

Họ mô hình Llama của Meta, mặc dù thường được coi là hiệu quả hơn về tài nguyên so với những gã khổng lồ như GPT-4 của OpenAI, vẫn bao gồm các phiên bản với hàng tỷ tham số. Kiến trúc Llama 2, chẳng hạn, bao gồm các mô hình có quy mô lên tới 70 tỷ tham số. Các mô hình lớn hơn này đòi hỏi sức mạnh tính toán đáng kể và quan trọng là lượng bộ nhớ khổng lồ để tải trọng số mô hình và quản lý các phép tính liên quan đến xử lý thông tin và tạo phản hồi. Một mô hình Llama 2 tiêu chuẩn sẽ hoàn toàn không thể chạy trong giới hạn 128MB.

Do đó, sự thành công của thử nghiệm phụ thuộc vào việc sử dụng hoặc phát triển một phiên bản lặp lại được tối ưu hóa cao, nhỏ hơn đáng kể của kiến trúc Llama. Phiên bản chuyên biệt này phải được điều chỉnh đặc biệt để hoạt động trong điều kiện hạn chế phần cứng nghiêm trọng. Nó có thể liên quan đến các kỹ thuật như lượng tử hóa mô hình (giảm độ chính xác của các con số được sử dụng trong tính toán của mô hình) và tỉa bớt (loại bỏ các phần ít quan trọng hơn của mạng nơ-ron) để thu nhỏ đáng kể dấu chân bộ nhớ và tính toán của nó. Exo Labs đã cung cấp phiên bản điều chỉnh của họ trên GitHub, giới thiệu các sửa đổi cụ thể cần thiết.

AI nhỏ bé này, chạy trên phần cứng lỗi thời, sẽ không sở hữu kiến thức rộng lớn hoặc khả năng đàm thoại tinh tế của những người anh em họ lớn hơn, chạy trên đám mây. Khả năng của nó sẽ bị hạn chế. Tuy nhiên, chính thực tế là nó có thể chạy và thực hiện các tác vụ tạo sinh cơ bản đại diện cho một thành tựu kỹ thuật đáng kể. Nó chứng minh rằng các khái niệm cốt lõi của các mô hình ngôn ngữ lớn, về nguyên tắc, có thể được thu nhỏ đáng kể, ngay cả khi tiện ích thực tế bị hạn chế ở những thái cực như vậy.

Sự khiêu khích của Andreessen: Một dòng thời gian bị mất cho điện toán đàm thoại?

Marc Andreessen đã nắm bắt được minh chứng kỹ thuật này để đưa ra một điểm rộng hơn, mang tính khiêu khích hơn về lịch sử và tương lai tiềm năng của điện toán. Suy ngẫm của ông không chỉ đơn thuần là về sự tò mò kỹ thuật khi chạy phần mềm mới trên phần cứng cũ; đó là một suy ngẫm về một lịch sử thay thế có thể có của tương tác giữa người và máy tính.

Ông đã trình bày rõ điều này bằng cách gợi ý rằng việc vận hành thành công Llama trên một chiếc PC Dell 26 năm tuổi ngụ ý một cơ hội bị bỏ lỡ kéo dài hàng thập kỷ. “Tất cả những chiếc PC cũ đó thực sự có thể đã thông minh suốt thời gian qua,” Andreessen đặt giả thuyết. “Chúng ta có thể đã nói chuyện với máy tính của mình trong 30 năm nay rồi.”

Tuyên bố này mời chúng ta tưởng tượng một thế giới nơi quỹ đạo phát triển AI hội tụ khác đi với sự trỗi dậy của máy tính cá nhân. Thay vì PC chủ yếu là công cụ để tính toán, tạo tài liệu và cuối cùng là truy cập internet, có lẽ chúng có thể đã phát triển thành các đối tác đàm thoại sớm hơn nhiều. Hình ảnh được gợi lên là người dùng tương tác với máy Windows 95, 98 hoặc thậm chí cũ hơn của họ thông qua ngôn ngữ tự nhiên, đặt câu hỏi, nhận hỗ trợ và tham gia đối thoại theo cách mà chỉ trở thành hiện thực chính thống với sự ra đời của các trợ lý kỹ thuật số hiện đại và các LLM phức tạp.

Tất nhiên, đây là một bước nhảy phản thực tế đáng kể. AI tạo sinh, như chúng ta hiểu ngày nay, với sự phụ thuộc vào các bộ dữ liệu khổng lồ, kiến trúc mạng nơ-ron phức tạp (như kiến trúc Transformer làm nền tảng cho các mô hình Llama và GPT) và sức mạnh tính toán khổng lồ để đào tạo, là một hiện tượng tương đối gần đây. Nghiên cứu AI của những năm 1980 và 1990, mặc dù đầy tham vọng, tập trung vào các mô hình khác nhau, chẳng hạn như hệ thống chuyên gia và lý luận tượng trưng. Phần cứng của thời đại đó, mặc dù có khả năng chạy Llama rút gọn được Exo Labs chứng minh, nhưng yếu hơn hàng bậc so với các hệ thống ngày nay, và các bộ dữ liệu kỹ thuật số khổng lồ cần thiết để đào tạo các mô hình tạo sinh có năng lực đơn giản là không tồn tại ở dạng có thể truy cập được.

Andreessen thừa nhận bối cảnh này, lưu ý sự lạc quan của sự bùng nổ AI những năm 1980: “Rất nhiều người thông minh trong những năm 80 nghĩ rằng tất cả những điều này sẽ xảy ra sau đó.” Thời đại đó đã chứng kiến sự đầu tư và nghiên cứu đáng kể vào trí tuệ nhân tạo, nhưng cuối cùng nó đã dẫn đến một “mùa đông AI” – một giai đoạn giảm tài trợ và sự quan tâm khi công nghệ không thực hiện được những lời hứa tham vọng nhất của nó. Những hạn chế về sức mạnh tính toán, tính sẵn có của dữ liệu và các phương pháp tiếp cận thuật toán là rất sâu sắc.

Do đó, bình luận của Andreessen có lẽ được hiểu rõ nhất không phải là một tuyên bố theo nghĩa đen rằng AI phức tạp, giống con người là khả thi trên phần cứng những năm 1990 theo cách chúng ta trải nghiệm bây giờ, mà là một thí nghiệm tư duy. Nó nhấn mạnh tiềm năng có thể đã được mở khóa nếu các ưu tiên nghiên cứu, đột phá thuật toán và phát triển phần cứng đi theo một hướng khác. Nó nhấn mạnh ý tưởng rằng các khối xây dựng cho một số hình thức tương tác thông minh có thể đã khả thi về mặt kỹ thuật, ngay cả khi kết quả sẽ đơn giản hơn nhiều so với AI ngày nay.

Tương phản các kỷ nguyên: Từ giấc mơ Dial-Up đến thực tế thấm đẫm AI

Thử nghiệm Windows 98 đóng vai trò là một điểm tương phản rõ rệt với bối cảnh tích hợp AI hiện tại. Ngày nay, AI đang nhanh chóng chuyển từ một dịch vụ tập trung vào đám mây sang được nhúng sâu vào hệ điều hành và thậm chí cả chính phần cứng.

Sự thúc đẩy của Microsoft với Copilot và Copilot+ PCs là minh chứng cho xu hướng này. Windows 11 có nhiều điểm truy cập cho Copilot, cung cấp hỗ trợ AI cho các tác vụ từ tóm tắt tài liệu và soạn thảo email đến tạo hình ảnh và điều chỉnh cài đặt hệ thống. Thông số kỹ thuật mới của Copilot+ PC yêu cầu bao gồm Bộ xử lý Thần kinh (NPU) – silicon chuyên dụng được thiết kế để tăng tốc các tính toán AI một cách hiệu quả. Điều này biểu thị một sự thay đổi cơ bản trong đó xử lý AI đang trở thành một chức năng cốt lõi của máy tính cá nhân, được xử lý cục bộ thay vì chỉ dựa vào các máy chủ từ xa.

Cách tiếp cận hiện đại này giả định và tận dụng nguồn tài nguyên dồi dào. Copilot+ PCs yêu cầu tối thiểu 16GB RAM và bộ nhớ thể rắn nhanh, các thông số kỹ thuật vượt xa mức 128MB khiêm tốn của máy Windows 98. Các mô hình AI được sử dụng, mặc dù được tối ưu hóa để thực thi phía máy khách, phức tạp và có khả năng hơn nhiều so với phiên bản Llama thu nhỏ được sử dụng trong thử nghiệm. Chúng được hưởng lợi từ nhiều thập kỷ tinh chỉnh thuật toán, bộ dữ liệu đào tạo khổng lồ và phần cứng được kiến trúc đặc biệt cho nhu cầu của chúng.

Sự tương phản làm sáng tỏ một số điểm:

  1. Tối ưu hóa phần mềm so với Sự cồng kềnh: Thử nghiệm của Exo Labs là một minh chứng cho sự tối ưu hóa cực đoan, buộc các thuật toán hiện đại vào một môi trường cực kỳ hạn chế. Nó ngầm chỉ trích xu hướng phần mềm hiện đại giả định tài nguyên phần cứng ngày càng tăng, đôi khi dẫn đến sự kém hiệu quả hoặc “cồng kềnh”.
  2. Sự tiến hóa của phần cứng: Sự khác biệt tuyệt đối về sức mạnh tính toán và bộ nhớ giữa một PC điển hình năm 1998 và một Copilot+ PC năm 2024 là đáng kinh ngạc, đại diện cho nhiều thế hệ của Định luật Moore và sự đổi mới kiến trúc.
  3. Khả năng truy cập dữ liệu: Việc đào tạo các LLM hiện đại dựa trên các bộ dữ liệu quy mô internet không thể tưởng tượng được trong kỷ nguyên Windows 98. Vũ trụ kỹ thuật số đơn giản là quá nhỏ và bị ngắt kết nối vào thời điểm đó.
  4. Đột phá thuật toán: Sự phát triển của các kiến trúc như mô hình Transformer vào năm 2017 là một thời điểm then chốt, cho phép khả năng mở rộng và hiệu suất được thấy trong AI tạo sinh ngày nay. Các phương pháp tiếp cận AI trước đó có những hạn chế cơ bản.

Trong khi Andreessen mơ về những chiếc máy tính biết nói cách đây 30 năm, thực tế là sự hội tụ của sức mạnh phần cứng, tính sẵn có của dữ liệu và sự đổi mới thuật toán cần thiết cho trải nghiệm AI ngày nay chỉ xảy ra gần đây hơn nhiều.

Tất cả có ý nghĩa gì? Suy ngẫm vượt ra ngoài nỗi nhớ

Việc triển khai thành công mô hình Llama trên Windows 98 chỉ đơn thuần là một thủ thuật thông minh, một pha trình diễn hoài cổ dành cho những người đam mê công nghệ? Hay nó có ý nghĩa sâu sắc hơn? Nó được cho là phục vụ một số mục đích:

  • Chứng minh khả năng mở rộng cực cao: Nó chứng minh rằng các nguyên tắc cơ bản đằng sau các mô hình ngôn ngữ lớn có thể được điều chỉnh để hoạt động trong điều kiện tài nguyên cực kỳ eo hẹp. Điều này có ý nghĩa tiềm năng cho việc triển khai AI trên các hệ thống nhúng công suất thấp, thiết bị IoT hoặc phần cứng cũ hơn vẫn còn được sử dụng ở nhiều nơi trên thế giới.
  • Làm nổi bật sức mạnh của các ràng buộc: Làm việc trong những giới hạn nghiêm ngặt thường thúc đẩy sự đổi mới và hiệu quả. Nhóm Exo Labs đã phải tìm ra các giải pháp sáng tạo và tối ưu hóa một cách tàn nhẫn, những kỹ năng có giá trị ngay cả trong môi trường giàu tài nguyên.
  • Thách thức các giả định: Nó thúc đẩy sự suy ngẫm về việc liệu tất cả sức mạnh tính toán và bộ nhớ được sử dụng bởi các ứng dụng hiện đại có thực sự cần thiết cho giá trị mà chúng cung cấp hay không. Liệu một số phần mềm có thể gọn gàng và hiệu quả hơn không?
  • Minh họa tính ngẫu nhiên của các con đường công nghệ: Lịch sử hiếm khi đi theo một đường thẳng. Thực tế là một số AI sơ khai có thể đã khả thi trên phần cứng cũ hơn nhấn mạnh cách các lựa chọn, hướng nghiên cứu khác nhau hoặc thậm chí các khám phá tình cờ có thể đã dẫn chúng ta đi theo một con đường công nghệ khác.

Thử nghiệm này không viết lại lịch sử, cũng không có nghĩa là những trải nghiệm AI phức tạp của năm 2024 bằng cách nào đó có thể đạt được vào năm 1998. Khoảng cách về các công nghệ hỗ trợ – sức mạnh xử lý, bộ nhớ, dữ liệu, thuật toán – vẫn còn rất lớn. Tuy nhiên, nó cung cấp một điểm dữ liệu hấp dẫn, một minh chứng cho sự khéo léo kỹ thuật và một chất xúc tác để suy ngẫm về con đường quanh co của tiến bộ công nghệ. Nó nhắc nhở chúng ta rằng những hạn chế của ngày hôm qua đôi khi có thể được khắc phục bằng kiến thức của ngày hôm nay, mang lại những kết quả đáng ngạc nhiên và thúc đẩy chúng ta xem xét lại những gì có thể xảy ra, cả bây giờ và trong tương lai. Bóng ma trong cỗ máy cũ không chỉ thì thầm về những gì đã qua, mà có lẽ còn về tiềm năng chưa được khai thác nằm trong sự đơn giản và hiệu quả.