Sự Chuyển Đổi Mang Tính Cách Mạng trong AI Nguồn Mở
Trong lịch sử, việc phát triển AI nguồn mở là một nỗ lực rời rạc, thường dẫn đến các mô hình hoạt động kém hiệu quả. Trước năm 2023, rất ít tổ chức phi lợi nhuận có đủ nguồn lực để đào tạo các mô hình AI có khả năng tiệm cận với GPT-2. Các công ty công nghệ lớn thống trị lĩnh vực AI độc quyền, trong khi AI nguồn mở phần lớn bị giới hạn trong các ứng dụng thích hợp.
Năm 2023 đánh dấu một bước ngoặt. Nhiều mô hình cơ sở mới với giấy phép cho phép đã được phát hành, tiếp theo là việc Meta phát hành mô hình Llama 2 nguồn mở mang tính đột phá với sự hợp tác của Microsoft. Sự kiện này đã khơi mào cho một loạt hoạt động, với hơn 10.000 mô hình phái sinh được tạo ra trong vòng sáu tháng. Một kỷ nguyên mới của phát triển AI nguồn mở đã bắt đầu.
Mục Tiêu Đầy Tham Vọng và Ủy Ban Điều Hành Xuất Sắc
Trong bối cảnh đó, AI Alliance đã đặt ra một loạt các mục tiêu ấn tượng ngay từ khi thành lập. Những mục tiêu này bao gồm:
- Thúc đẩy hợp tác mở
- Thiết lập quản trị và các biện pháp bảo vệ cho AI
- Phát triển các công cụ đo điểm chuẩn và các quan điểm chính sách rõ ràng
- Ưu tiên các sáng kiến giáo dục mở rộng
- Nuôi dưỡng hệ sinh thái phần cứng mạnh mẽ
Sức mạnh của Liên minh càng được nhấn mạnh bởi tầm cỡ của ủy ban điều hành, bao gồm một danh sách các tổ chức thương mại và trường đại học nổi tiếng.
Tiêu Chí Thành Viên: Cam Kết Mở và Hợp Tác
Để trở thành thành viên của AI Alliance, một tổ chức phải đáp ứng bốn tiêu chí chính:
- Phù hợp với Sứ mệnh: Thành viên tiềm năng phải phù hợp với sứ mệnh nuôi dưỡng an toàn, khoa học mở và đổi mới.
- Cam kết với các Dự án: Các thành viên phải tận tâm làm việc trong các dự án quan trọng phù hợp với sứ mệnh của Liên minh.
- Đa dạng về Quan điểm: Các thành viên tiềm năng phải sẵn sàng đóng góp vào sự đa dạng về quan điểm và văn hóa trong cộng đồng thành viên toàn cầu, hiện đã vượt quá 140 tổ chức và dự kiến sẽ còn tăng thêm.
- Uy tín: AI Alliance tìm kiếm các thành viên có uy tín được công nhận là nhà giáo dục, nhà xây dựng hoặc người ủng hộ trong cộng đồng AI nguồn mở.
Phân Loại Thành Viên: Người Xây Dựng, Người Hỗ Trợ và Người Ủng Hộ
Các thành viên của Liên minh thường thuộc một trong ba loại:
- Người Xây Dựng (Builders): Các thành viên này chịu trách nhiệm tạo ra các mô hình, bộ dữ liệu, công cụ và ứng dụng sử dụng AI.
- Người Hỗ Trợ (Enablers): Các thành viên này thúc đẩy việc áp dụng các công nghệ AI mở thông qua các hướng dẫn, trường hợp sử dụng và hỗ trợ cộng đồng nói chung.
- Người Ủng Hộ (Advocates): Các thành viên này nhấn mạnh lợi ích của hệ sinh thái AI Alliance và thúc đẩy niềm tin và sự an toàn của công chúng giữa các nhà lãnh đạo tổ chức, các bên liên quan trong xã hội và các cơ quan quản lý.
Sáu Lĩnh Vực Trọng Tâm Chính: Cách Tiếp Cận Toàn Diện cho Hệ Sinh Thái AI
AI Alliance xác định các ưu tiên dài hạn của mình trên sáu lĩnh vực trọng tâm chính. Tuy nhiên, điều quan trọng cần lưu ý là Liên minh có cách tiếp cận toàn diện đối với toàn bộ hệ sinh thái AI, khuyến khích các thành viên cộng đồng và nhà phát triển tham gia vào một hoặc nhiều lĩnh vực và thích ứng khi sở thích hoặc ưu tiên thay đổi.
Dưới đây là cái nhìn chi tiết hơn về sáu lĩnh vực trọng tâm chính:
Kỹ Năng và Giáo Dục
Lĩnh vực này dành riêng cho việc cung cấp kiến thức AI cho đối tượng rộng rãi, bao gồm người tiêu dùng và các nhà lãnh đạo doanh nghiệp đánh giá rủi ro của AI, cũng như sinh viên và các nhà phát triển xây dựng ứng dụng AI. Nó nhằm mục đích đơn giản hóa quá trình tìm kiếm hướng dẫn chuyên môn trong các lĩnh vực cụ thể và bao gồm một sáng kiến đánh giá mô hình.
Năm 2024, Liên minh đã xuất bản Hướng dẫn về Năng lực Cần thiết cho AI, một nguồn tài nguyên toàn diện là kết quả của một cuộc khảo sát sâu rộng để xác định các vai trò chính trong AI và các kỹ năng cần thiết cho các vai trò đó. Mặc dù mới được xuất bản gần đây, hướng dẫn đã trải qua chín lần sửa đổi và một cuộc khảo sát tiếp theo được lên kế hoạch để giải quyết các vấn đề được xác định trong cuộc khảo sát ban đầu.
Tin Cậy và An Toàn
Lĩnh vực quan trọng này khám phá các yếu tố thiết yếu của sự tin cậy và an toàn cần thiết cho sự thành công của tất cả các ứng dụng AI. Các điểm chuẩn, công cụ và phương pháp luận được sử dụng để đảm bảo rằng các mô hình và ứng dụng có chất lượng cao, an toàn và đáng tin cậy. Điều này bao gồm việc hỗ trợ các tiêu chuẩn ứng xử đang phát triển và các phản ứng hiệu quả đối với rủi ro.
Nhóm làm việc trong lĩnh vực này tập hợp các khái niệm tốt nhất liên quan đến sự tin cậy và an toàn và kết nối người dùng với chuyên môn mà họ cần. Cuộc khảo sát Tình trạng Tin cậy và An toàn AI Nguồn Mở - Phiên bản Cuối năm 2024, được xuất bản trên trang web của AI Alliance, đã làm nổi bật cả nhu cầu và thành công trong lĩnh vực này. Các khoảng trống về nghiên cứu và môi trường đang được giải quyết thông qua các nỗ lực nghiên cứu và phát triển của nhiều thành viên AI Alliance.
Ứng Dụng và Công Cụ
Nhóm này tập trung vào việc khám phá các công cụ và kỹ thuật để xây dựng các ứng dụng hỗ trợ AI hiệu quả và mạnh mẽ. Nó cũng đang phát triển một phòng thí nghiệm AI để tạo điều kiện cho việc thử nghiệm và kiểm tra các ứng dụng AI, đẩy nhanh quá trình đổi mới.
Hỗ Trợ Phần Cứng
Lĩnh vực này dành riêng cho việc thúc đẩy một hệ sinh thái bộ tăng tốc phần cứng AI mạnh mẽ bằng cách đảm bảo rằng ngăn xếp phần mềm AI không phụ thuộc vào phần cứng. Các công nghệ như MLIR và Triton là các công cụ phần mềm quan trọng để đạt được tính di động phần cứng hiệu suất cao. Những công cụ này trao quyền cho các tổ chức tận dụng phần cứng ưa thích của họ, tăng tính linh hoạt và hiệu suất đồng thời giảm sự phụ thuộc vào các hệ thống độc quyền.
Mô Hình Nền Tảng và Bộ Dữ Liệu
Lĩnh vực này tập trung vào các mô hình cho các lĩnh vực chưa được phục vụ đầy đủ, bao gồm đa ngôn ngữ, đa phương thức, chuỗi thời gian, khoa học và các lĩnh vực khác. Ví dụ, các mô hình khoa học và chuyên biệt nhắm mục tiêu đến biến đổi khí hậu, khám phá phân tử và ngành công nghiệp bán dẫn.
Các mô hình hiệu quả và kiến trúc ứng dụng AI yêu cầu các bộ dữ liệu hữu ích với quyền quản trị và sử dụng rõ ràng. Sáng kiến Dữ liệu Mở Đáng tin cậy (Open Trusted Data Initiative) đang làm rõ các yêu cầu đối với các bộ dữ liệu đó và xây dựng danh mục các bộ dữ liệu tuân thủ. Nỗ lực này nhằm mục đích loại bỏ phần lớn các mối quan tâm về các vấn đề pháp lý, bản quyền và quyền riêng tư.
Vận Động Chính Sách
Vận động các chính sách quy định là điều cần thiết để tạo ra một hệ sinh thái AI lành mạnh và cởi mở. Tất cả các chính sách và quy định về AI nên đại diện cho các quan điểm cân bằng, thay vì thiên vị.
Tìm Hiểu Sâu về Tin Cậy và An Toàn: Sáng Kiến 2025
Tin cậy và An toàn là một lĩnh vực quan trọng và rộng lớn trong AI Alliance, với nhiều chuyên gia làm việc trên các công cụ để phát hiện và giảm thiểu lời nói căm thù, thành kiến và nội dung có hại khác. Sáng kiến Đánh giá Tin cậy và An toàn (Trust and Safety Evaluation Initiative) là một dự án lớn cho năm 2025, cung cấp một cái nhìn thống nhất về toàn bộ phạm vi đánh giá – không chỉ về an toàn mà còn về hiệu suất và các lĩnh vực khác mà việc đánh giá hiệu quả của các mô hình và ứng dụng AI là rất quan trọng. Một dự án phụ đang khám phá các ưu tiên an toàn cụ thể theo lĩnh vực, chẳng hạn như y tế, luật và tài chính.
Vào giữa năm 2025, AI Alliance có kế hoạch phát hành bảng xếp hạng Hugging Face cho phép các nhà phát triển:
- Tìm kiếm các đánh giá phù hợp nhất với nhu cầu của họ
- So sánh hiệu suất của các mô hình mở so với các đánh giá đó
- Tải xuống và triển khai các đánh giá đó để kiểm tra các mô hình và ứng dụng AI riêng tư của họ
Sáng kiến này cũng sẽ cung cấp hướng dẫn về các khía cạnh an toàn và tuân thủ quan trọng của các trường hợp sử dụng khác nhau.
Hỗ Trợ AI Tại Chỗ: Ngăn Xếp Phần Mềm Không Phụ Thuộc Phần Cứng
Không phải tất cả các lời gọi mô hình AI sẽ dựa vào các dịch vụ thương mại được lưu trữ. Một số tình huống nhất định đòi hỏi các giải pháp cách ly (air-gapped). Các thiết bị biên thông minh hỗ trợ AI đang thúc đẩy việc triển khai các mô hình mới, nhỏ và mạnh mẽ tại chỗ, thường không có kết nối internet. Để hỗ trợ các trường hợp sử dụng này và tạo điều kiện cho việc phục vụ mô hình quy mô lớn với cấu hình phần cứng linh hoạt, AI Alliance đang phát triển các ngăn xếp phần mềm không phụ thuộc vào phần cứng.
Ví Dụ Thực Tế về Hợp Tác: SemiKong và DANA
Hai ví dụ làm nổi bật cách hợp tác mở giữa các thành viên Liên minh đang mang lại lợi ích đáng kể cho tất cả mọi người:
SemiKong
SemiKong là một nỗ lực hợp tác giữa ba thành viên Liên minh. Họ đã tạo ra một mô hình ngôn ngữ lớn nguồn mở đặc biệt cho lĩnh vực quy trình sản xuất chất bán dẫn. Các nhà sản xuất có thể tận dụng mô hình này để tăng tốc độ phát triển các thiết bị và quy trình mới. SemiKong sở hữu kiến thức chuyên môn về vật lý và hóa học của các thiết bị bán dẫn. Chỉ trong sáu tháng, SemiKong đã thu hút được sự chú ý của ngành công nghiệp bán dẫn toàn cầu.
SemiKong được phát triển bằng cách tinh chỉnh mô hình cơ sở Llama 3 bằng cách sử dụng các bộ dữ liệu do Tokyo Electron quản lý. Quá trình điều chỉnh này đã tạo ra một mô hình AI tổng quát dành riêng cho ngành với kiến thức vượt trội về quy trình khắc bán dẫn so với mô hình cơ sở chung. Một báo cáo kỹ thuật về SemiKong có sẵn.
DANA (Domain-Aware Neurosymbolic Agents)
DANA là sự phát triển chung của Aitomatic Inc. (có trụ sở tại Thung lũng Silicon) và Fenrir Inc. (có trụ sở tại Nhật Bản). Nó đại diện cho một ví dụ ban đầu về kiến trúc tác nhân hiện đang phổ biến, trong đó các mô hình được tích hợp với các công cụ khác để cung cấp các khả năng bổ sung. Mặc dù chỉ riêng các mô hình có thể đạt được kết quả ấn tượng, nhưng nhiều nghiên cứu đã chỉ ra rằng LLM thường tạo ra câu trả lời không chính xác. Một nghiên cứu năm 2023 được trích dẫn trong bài báo SemiKong đã đo lường các lỗi LLM điển hình ở mức 50%, trong khi việc sử dụng bổ sung các công cụ lý luận và lập kế hoạch của DANA đã tăng độ chính xác lên 90% cho các ứng dụng mục tiêu.
DANA sử dụng các tác nhân biểu tượng thần kinh (neurosymbolic agents) kết hợp khả năng nhận dạng mẫu của mạng nơ-ron với lý luận tượng trưng, cho phép giải quyết vấn đề dựa trên logic và quy tắc nghiêm ngặt. Lý luận logic, kết hợp với các công cụ lập kế hoạch (chẳng hạn như thiết kế quy trình dây chuyền lắp ráp), tạo ra kết quả chính xác và đáng tin cậy, điều cần thiết cho các hệ thống kiểm soát chất lượng công nghiệp và lập kế hoạch và lập lịch tự động.
Tính linh hoạt của DANA mở rộng sang nhiều lĩnh vực. Ví dụ, trong dự báo tài chính và ra quyết định, DANA có thể hiểu các xu hướng thị trường và đưa ra dự đoán dựa trên các lý thuyết phức tạp, sử dụng cả dữ liệu có cấu trúc và không có cấu trúc. Khả năng tương tự này có thể được áp dụng để truy xuất và đánh giá tài liệu y khoa và thông tin nghiên cứu, đảm bảo rằng chẩn đoán và điều trị tuân thủ các quy trình và thực hành y tế đã được thiết lập. Về bản chất, DANA có thể cải thiện kết quả của bệnh nhân và giảm sai sót trong các ứng dụng bệnh nhân quan trọng.
Nền Tảng Vững Chắc cho Sự Phát Triển Tiếp Tục
AI Alliance bắt đầu năm 2025 ở một vị thế vững chắc, với các thành viên trải rộng trên 23 quốc gia và nhiều nhóm làm việc tập trung vào các thách thức AI lớn. Liên minh tự hào có hơn 1.200 cộng tác viên nhóm làm việc tham gia vào hơn 90 dự án đang hoạt động. Trên phạm vi quốc tế, AI Alliance đã tham gia vào các sự kiện được tổ chức tại 10 quốc gia, tiếp cận hơn 20.000 người và đã xuất bản năm hướng dẫn về các chủ đề AI quan trọng để hỗ trợ các nhà nghiên cứu và nhà phát triển trong việc xây dựng và sử dụng AI.
AI Alliance đã xuất bản các ví dụ về việc sử dụng AI trên các mô hình như dòng Granite của IBM và các mô hình Llama của Meta. Bộ sưu tập “công thức” ngày càng tăng của nó tận dụng các thư viện và mô hình mở phổ biến nhất cho các mẫu ứng dụng phổ biến, bao gồm RAG, đồ thị tri thức, hệ thống biểu tượng thần kinh và các kiến trúc lập kế hoạch và lý luận tác nhân mới nổi.
Mở Rộng Quy Mô: Kế Hoạch Đầy Tham Vọng cho Năm 2025 và Hơn Thế Nữa
Vào năm 2025, AI Alliance cam kết mở rộng phạm vi và tác động của mình lên gấp mười lần. Hai trong số các sáng kiến lớn mới của nó, đã được thảo luận trước đó, là Sáng kiến Dữ liệu Mở Đáng tin cậy (Open Trusted Data Initiative) và Sáng kiến Đánh giá Tin cậy và An toàn (Trust and Safety Evaluation Initiative). AI Alliance cũng có kế hoạch thành lập một phòng thí nghiệm cộng đồng tiêu chuẩn công nghiệp để phát triển và thử nghiệm các công nghệ ứng dụng AI. Các sáng kiến mô hình chuyên biệt của nó sẽ tiếp tục phát triển. Ví dụ, Nhóm Làm việc về Khí hậu và Tính bền vững mới có kế hoạch phát triển các mô hình nền tảng đa phương thức và công cụ phần mềm nguồn mở để giải quyết các thách thức chính trong biến đổi khí hậu và giảm thiểu nó.
Đến năm 2030, AI dự kiến sẽ đóng góp khoảng 20 nghìn tỷ đô la cho nền kinh tế toàn cầu. Đến lúc đó, người ta dự báo rằng 70% ứng dụng AI công nghiệp sẽ chạy trên AI nguồn mở. Sự thiếu hụt các chuyên gia AI cũng được dự đoán sẽ trở nên gay gắt hơn so với hiện nay. Các thành viên AI Alliance có thể giảm thiểu thách thức này bằng cách hợp tác với các thành viên khác để có quyền truy cập vào chuyên môn đa dạng và chia sẻ tài nguyên.
AI Alliance đang đi theo quỹ đạo tăng trưởng tương tự như các tổ chức nguồn mở thành công khác, chẳng hạn như Linux Foundation, Apache Software Foundation và Open Source Initiative. Chúng bao gồm:
- Các chương trình giáo dục và kỹ năng AI toàn diện
- Vận động toàn cầu cho AI có trách nhiệm
- Tạo các công cụ để đảm bảo an toàn và tin cậy cho AI, cũng như dễ dàng phát triển và sử dụng
- Nghiên cứu hợp tác với các tổ chức học thuật
Ban lãnh đạo của AI Alliance sẽ tiếp tục thu hút các nhà phát triển và nhà nghiên cứu, cũng như các nhà lãnh đạo doanh nghiệp và chính phủ. Ban lãnh đạo của AI Alliance đã thiết lập việc mở rộng quy mô hợp tác toàn cầu là sứ mệnh bao trùm của mình cho năm 2025. Xét về mọi mặt, AI Alliance có nền tảng để phát triển thành một lực lượng toàn cầu thống trị, định hình, cải thiện và đổi mới tương lai của Trí tuệ Nhân tạo.