Sự Trỗi Dậy của Mã Nguồn Mở
Mark Zuckerberg nhấn mạnh sự mở rộng đáng kể của cộng đồng AI mã nguồn mở kể từ khi giới thiệu Llama, với số lượt tải xuống vượt quá 1,2 tỷ, tăng đáng kể so với 650 triệu vào tháng 12 trước đó. Ông nhận xét rằng bức tranh toàn cảnh đã thay đổi đáng kể từ một số ít các tùy chọn mã nguồn mở cách đây một năm thành một hệ sinh thái đang phát triển mạnh mẽ với sự đóng góp từ Google, Mistral, DeepSeek và trong tương lai gần là OpenAI. Chris Cox của Meta chỉ ra hoạt động phong phú của hàng nghìn nhà phát triển đang tích cực tạo ra hàng chục nghìn mô hình phái sinh. Một ví dụ minh họa là Nemotron Ultra Llama-3.1 sáng tạo của Nvidia, vượt trội hơn R1 của DeepSeek về hiệu suất trong khi chỉ bằng một nửa kích thước. Hơn nữa, Meta đã công bố Llama API, một sáng kiến được thiết kế để hợp lý hóa việc triển khai các khả năng AI cho các tổ chức. Giám đốc điều hành của Databricks, Ali Ghodsi, nhấn mạnh ứng dụng thực tế của Llama bởi Crisis Text Line, nơi một phiên bản tùy chỉnh của mô hình được sử dụng để xác định những cá nhân có nguy cơ tự gây hại hoặc tự tử cao hơn. Nền tảng này, đã tham gia vào hàng triệu cuộc trò chuyện quan trọng, sử dụng Llama để tinh chỉnh độ chính xác và hiệu quả của các đánh giá rủi ro của nó.
Giọng Nói là Giao Diện Hậu Chạm
Zuckerberg xác định giọng nói là giao diện quan trọng tiếp theo cho AI, nhấn mạnh tầm quan trọng của độ trễ cực thấp trong việc cho phép các tương tác tự nhiên, theo thời gian thực, đặc biệt là trong công nghệ đeo được như kính thông minh Meta Ray-Ban.
Quan điểm này phù hợp với sự công nhận ngày càng tăng về khả năng giọng nói, hiện đang bị đánh giá thấp mặc dù có những tiến bộ đáng chú ý trong giọng nói AI bắt chước chặt chẽ giọng nói của con người. Tương tác với các hệ thống AI thông qua giọng nói tạo ra trải nghiệm gợi nhớ đến các tương tác của Tony Stark với Jarvis, cung cấp một chế độ tương tác trực quan và tự nhiên hơn. Điều này mở đường cho các ứng dụng thú vị trên nhiều lĩnh vực khác nhau, bao gồm giáo dục, dịch vụ khách hàng, chăm sóc sức khỏe và hơn thế nữa. Tiềm năng chuyển đổi tương tác giữa người và máy tính thông qua giọng nói là rất lớn, hứa hẹn một trải nghiệm người dùng liền mạch và tích hợp hơn.
Bình Minh của AI Agents
AI agents nổi lên như một tiêu điểm trong gần như mọi phiên tại LlamaCon. Zuckerberg và Giám đốc điều hành của Microsoft, Satya Nadella, cả hai đều lưu ý rằng khoảng 30% mã của các tổ chức của họ hiện đang được tạo bởi AI. Zuckerberg dự đoán rằng phần lớn mã dự án sẽ sớm được viết hoàn toàn bởi AI, dẫn đến đầu ra chất lượng cao hơn với tốc độ nhanh hơn so với các nhà phát triển con người.
Sự phát triển này mang ý nghĩa đáng kể, đặc biệt khi các cuộc thảo luận chính sách ở Washington thường vẫn tập trung vào chatbot. Ngược lại, các cuộc trò chuyện trong Thung lũng Silicon ngày càng tập trung vào AI agents có khả năng lý luận, lập kế hoạch, hành động và phản ánh với quyền tự chủ đáng kể.
Sự thay đổi hướng tới AI lấy agent làm trung tâm đại diện cho sự khác biệt so với các tương tác truy vấn-phản hồi đơn giản, thay vào đó chuyển sang cộng tác tích cực với các đồng nghiệp kỹ thuật số thông minh. Những ý nghĩa của quá trình chuyển đổi này phần lớn vẫn chưa được khám phá trong các vòng tròn chính sách. Bước nhảy từ chatbot sang agent không chỉ là gia tăng; đó là một sự thay đổi mô hình cơ bản đòi hỏi phải đánh giá lại các khuôn khổ chính sách hiện có để tránh cả sự bảo vệ xã hội không đầy đủ và những hạn chế quá mức đối với sự đổi mới.
Định Nghĩa Lại Nội Dung Kỹ Thuật Số
Nadella đặt ra một câu hỏi đầy gợi ý: "Khi một giao diện có thể tạo ra văn bản, mã, hình ảnh và mô phỏng có thể chạy được — ‘tài liệu’ là gì?" ChatGPT, Google Gemini, Meta.ai và Anthropic Claude mỗi cái đều cung cấp một "canvas" có khả năng tạo ra nội dung đa dạng, từ văn bản cơ bản đến hình ảnh phức tạp và mã chức năng. Ngày nay, người dùng có thể tương tác với PDF để trích xuất thông tin chi tiết chính, thực hiện nghiên cứu chuyên sâu trên nhiều nguồn và sau đó sử dụng cùng một giao diện để tạo ra một mô phỏng tương tác — tất cả trong một môi trường do AI cung cấp. Bản chất của hình thức nội dung mới nổi này có tiềm năng cách mạng hóa các mô hình xuất bản truyền thống, đặc biệt là trong lĩnh vực giáo dục. Sự hội tụ của các khả năng tạo nội dung khác nhau trong một nền tảng do AI điều khiển duy nhất đang định hình lại cách thông tin được truy cập, xử lý và sử dụng.
Suy Ngẫm Chiến Lược
Một số điểm chiến lược nổi lên từ LlamaCon, làm nổi bật các lĩnh vực xem xét chính cho các tổ chức và các nhà hoạch định chính sách:
Cổ Phần Địa Chính Trị của AI Mã Nguồn Mở: Việc công bố DeepSeek R1 vào tháng 1 đã nhấn mạnh tầm quan trọng chiến lược ngày càng leo thang của AI biên giới mã nguồn mở, không chỉ là một tiến bộ công nghệ mà còn là một yếu tố then chốt trong bối cảnh cạnh tranh giữa Hoa Kỳ và Trung Quốc, cũng như lợi ích an ninh quốc gia của Hoa Kỳ. Ưu tiên việc áp dụng các mô hình mã nguồn mở có trụ sở tại Hoa Kỳ bởi các quốc gia và tổ chức ở Nam Bán Cầu có lợi thế chiến lược so với việc tích hợp các mô hình của Trung Quốc vào hệ thống và cơ sở hạ tầng của họ. Cân nhắc này làm nổi bật các khía cạnh địa chính trị của việc phát triển và triển khai AI, nhấn mạnh sự cần thiết phải lập kế hoạch và đầu tư chiến lược.
Chuyên Môn Như Một Dịch Vụ: Hai năm qua của GenAI đã được xác định bởi con người được tăng cường bởi AI. Chúng ta hiện đang chứng kiến sự nổi lên non trẻ của AI agents như những cộng tác viên kỹ thuật số thực sự. Các mô hình mở có tiềm năng dân chủ hóa việc tiếp cận chuyên môn và trí thông minh, mở rộng phạm vi tiếp cận của chúng đến hàng triệu người trên toàn thế giới. Sự thay đổi này vượt qua mô hình phần mềm như một dịch vụ truyền thống, phát triển thành "chuyên môn như một dịch vụ". Báo cáo gần đây của Microsoft nhấn mạnh sự chuyển đổi quan trọng này, kêu gọi các nhà hoạch định chính sách xem xét cẩn thận những ý nghĩa sâu sắc của nó. Dân chủ hóa chuyên môn thông qua AI có tiềm năng định hình lại các ngành công nghiệp, trao quyền cho các cá nhân và thúc đẩy sự đổi mới trên nhiều lĩnh vực khác nhau.
Chính Sách và Sự Tham Gia của Xã Hội Dân Sự: Meta nên được khen ngợi vì đã đưa các đại diện chính sách công và xã hội dân sự tại LlamaCon, thúc đẩy một cuộc đối thoại quan trọng giữa công nghệ và chính sách. Thực hành này nên được áp dụng bởi nhiều công ty AI hơn để thúc đẩy việc hoạch định chính sách có trách nhiệm và sáng suốt. Sự hợp tác giữa các nhà phát triển công nghệ, các nhà hoạch định chính sách và các bên liên quan trong xã hội dân sự là rất quan trọng để điều hướng các thách thức về đạo đức, xã hội và quy định liên quan đến phát triển và triển khai AI. Bằng cách thúc đẩy giao tiếp và tham gia cởi mở, ngành công nghiệp có thể làm việc để đảm bảo rằng AI mang lại lợi ích cho xã hội nói chung.
LlamaCon của Meta đã cung cấp một cái nhìn hấp dẫn về thế giới đang phát triển của AI mã nguồn mở, nhấn mạnh tầm quan trọng ngày càng tăng của nó và lời hứa về việc dân chủ hóa quyền truy cập vào trí thông minh. Các mô hình mở đang củng cố vị thế của chúng như các nguồn tài nguyên thiết yếu, tạo điều kiện cho việc tiếp cận rộng rãi hơn các chức năng AI phức tạp và đóng một vai trò có ảnh hưởng trong động lực địa chính trị toàn cầu và các công thức chính sách.
Zuckerberg đã chỉ ra những tiến bộ đáng kể trong AI tạo sinh (GenAI) trong hai năm qua, với con người được tăng cường bởi AI. Ông lưu ý rằng chúng ta hiện đang chứng kiến sự nổi lên mới chớm nở của các tác nhân AI như những cộng tác viên kỹ thuật số thực sự. Các mô hình mở có tiềm năng dân chủ hóa việc tiếp cậnchuyên môn và trí tuệ, mở rộng phạm vi tiếp cận của chúng đến hàng triệu người trên toàn thế giới. Sự thay đổi này vượt qua mô hình phần mềm như một dịch vụ (SaaS) truyền thống, phát triển thành "chuyên môn như một dịch vụ".
Điều quan trọng cần lưu ý là Thung lũng Silicon và Washington, D.C. đang có các cuộc trò chuyện khác nhau về AI. Các cuộc thảo luận về chính sách ở Washington, D.C. thường bị mắc kẹt trong các cuộc trò chuyện về chatbot, trong khi các cuộc trò chuyện trong Thung lũng Silicon ngày càng tập trung vào các tác nhân AI có khả năng lý luận, lập kế hoạch, hành động và phản ánh với quyền tự chủ đáng kể. Zuckerberg và Giám đốc điều hành của Microsoft, Satya Nadella, cả hai đều lưu ý rằng khoảng 30% mã của các tổ chức của họ hiện đang được tạo bởi AI. Zuckerberg dự đoán rằng phần lớn mã dự án sẽ sớm được viết hoàn toàn bởi AI, dẫn đến đầu ra chất lượng cao hơn với tốc độ nhanh hơn so với các nhà phát triển con người.
Bối cảnh AI đang phát triển nhanh chóng, và bối cảnh chính sách cần phải theo kịp. Bước nhảy từ chatbot sang tác nhân không chỉ là gia tăng; đó là một sự thay đổi mô hình cơ bản. Các nhà hoạch định chính sách cần phải đánh giá lại các khuôn khổ chính sách hiện có để tránh cả sự bảo vệ xã hội không đầy đủ và những hạn chế quá mức đối với sự đổi mới.
Về nội dung kỹ thuật số, Nadella đặt ra một câu hỏi kích thích tư duy: "Khi một giao diện có thể tạo ra văn bản, mã, hình ảnh và mô phỏng có thể chạy được - thì ‘tài liệu’ là gì?" ChatGPT, Google Gemini, Meta.ai và Anthropic Claude mỗi nơi đều cung cấp một "canvas" có khả năng tạo ra nội dung đa dạng, từ văn bản cơ bản đến hình ảnh phức tạp và mã chức năng. Người dùng có thể tương tác với PDF để trích xuất thông tin chi tiết chính, thực hiện nghiên cứu chuyên sâu trên nhiều nguồn và sau đó sử dụng cùng một giao diện để tạo ra một mô phỏng tương tác — tất cả trong một môi trường do AI cung cấp. Bản chất của hình thức nội dung mới nổi này có tiềm năng cách mạng hóa các mô hình xuất bản truyền thống.
Một số điểm chiến lược nổi lên từ LlamaCon:
Cổ phần địa chính trị của AI mã nguồn mở: Việc công bố DeepSeek R1 vào tháng 1 đã nhấn mạnh tầm quan trọng chiến lược ngày càng leo thang của AI biên giới mã nguồn mở như một yếu tố then chốt trong cạnh tranh giữa Hoa Kỳ và Trung Quốc cũng như an ninh quốc gia của Hoa Kỳ.
Chuyên môn như một dịch vụ: Các mô hình mở có tiềm năng dân chủ hóa quyền truy cập vào chuyên môn và trí thông minh, mở rộng phạm vi tiếp cận của chúng đến hàng triệu người trên toàn thế giới. Microsoft nhấn mạnh sự chuyển đổi quan trọng này, kêu gọi các nhà hoạch định chính sách xem xét cẩn thận những ý nghĩa sâu sắc của nó.
Chính sách và sự tham gia của xã hội dân sự: Meta nên được khen ngợi về việc bao gồm các đại diện chính sách công và xã hội dân sự tại LlamaCon, và thực tiễn này nên được áp dụng bởi nhiều công ty AI hơn để thúc đẩy việc hoạch định chính sách có trách nhiệm và sáng suốt.
Cuối cùng, Zuckerberg xác định giọng nói là giao diện quan trọng tiếp theo cho AI, nhấn mạnh tầm quan trọng của độ trễ cực thấp trong việc cho phép các tương tác tự nhiên, theo thời gian thực. Điều này đặc biệt áp dụng cho các loại điện toán đeo được như kính Ray-Ban của Meta. Chúng ta đang nhanh chóng tiến tới thời điểm tương tác với AI có cảm giác như Tony Stark đang nói chuyện với Jarvis..