Meta, NIC và AIV hợp tác về AI

Sự hợp tác để thúc đẩy AI tại Việt Nam

Ngày 14 tháng 3, một quan hệ đối tác quan trọng đã được thiết lập tại Hà Nội, đánh dấu một bước tiến quan trọng cho trí tuệ nhân tạo (AI) tại Việt Nam. Meta, gã khổng lồ công nghệ, đã hợp tác với Trung tâm Đổi mới Sáng tạo Quốc gia (NIC), một đơn vị trực thuộc Bộ Kế hoạch và Đầu tư, để khởi động Thử thách Đổi mới Sáng tạo Việt Nam 2025. Nỗ lực hợp tác này, hiện đã bước sang năm thứ ba, nhấn mạnh cam kết bền vững trong việc thúc đẩy phát triển AI tại Việt Nam.

Dự án ViGen: Nền tảng của sự phát triển AI

Phiên bản 2025 của thử thách tập trung vào dự án ViGen, một sáng kiến đầy tham vọng với những tác động sâu rộng. ViGen tập trung vào việc tạo ra một bộ dữ liệu tiếng Việt nguồn mở, chất lượng cao, quy mô lớn. Bộ dữ liệu này được thiết kế đặc biệt để đóng vai trò là nguồn tài nguyên quan trọng cho việc đào tạo và phát triển các mô hình ngôn ngữ lớn (LLMs).

Mục tiêu cốt lõi của ViGen là nâng cao đáng kể khả năng của các mô hình AI trong việc hiểu được sự phức tạp của văn hóa, bối cảnh và sắc thái ngôn ngữ Việt Nam. Bằng cách đạt được điều này, dự án hướng tới việc mở ra một làn sóng các ứng dụng AI đột phá được thiết kế riêng cho nền kinh tế kỹ thuật số đang phát triển của Việt Nam.

Vai trò và trách nhiệm: Quan hệ đối tác hiệp lực

Dự án ViGen thể hiện sự hiệp lực của chuyên môn và nguồn lực, với mỗi đối tác đóng một vai trò riêng biệt:

  • NIC: Trung tâm Đổi mới Sáng tạo Quốc gia đóng vai trò chủ đạo trong việc giám sát, điều phốivà đảm bảo rằng dự án phù hợp với các chiến lược phát triển quốc gia rộng lớn hơn của Việt Nam.
  • AI for Vietnam: Tổ chức này, với sự hỗ trợ kỹ thuật và tài chính từ Meta, được giao nhiệm vụ thực hiện các thành phần cụ thể của sáng kiến.
  • Đối tác chiến lược: Dự án cũng được hưởng lợi từ sự đóng góp của các đối tác chiến lược quan trọng, bao gồm NVIDIA, Viettel và Viện Hàn lâm Khoa học và Công nghệ Việt Nam. Các đối tác này đóng góp vào một hệ sinh thái hợp tác sôi động và bền vững.

Trao quyền cho AI với sự hiểu biết sâu sắc về tiếng Việt

Về cốt lõi, ViGen được thúc đẩy bởi sứ mệnh phát triển một bộ dữ liệu tiếng Việt nguồn mở, chất lượng cao, đủ lớn để tạo điều kiện thuận lợi cho việc đào tạo và đánh giá các mô hình AI tiên tiến. Nỗ lực này không chỉ đơn thuần là cho phép các hệ thống AI xử lý tiếng Việt một cách tự nhiên. Nó còn đảm bảo rằng các tiêu chuẩn đạo đức và giá trị văn hóa của Việt Nam được gắn sâu vào kết cấu của sự phát triển AI.

Ưu tiên quốc gia: Thúc đẩy đột phá công nghệ

Võ Xuân Hoài, Phó Giám đốc NIC, nhấn mạnh tiềm năng biến đổi của AI, tuyên bố, ‘AI đang thay đổi thế giới mỗi ngày’. Ông cũng nhấn mạnh tầm quan trọng của dự án ViGen đối với Việt Nam: ‘Đối với Việt Nam, việc phát triển các bộ dữ liệu tiếng Việt nguồn mở, chất lượng cao là ưu tiên hàng đầu để thúc đẩy đột phá công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia’.

Vai trò của Việt Nam trong bối cảnh AI toàn cầu

Giáo sư Yann LeCun, Phó Chủ tịch kiêm Giám đốc Khoa học AI tại Meta, đã trình bày rõ ý nghĩa rộng lớn hơn của ViGen và Thử thách Đổi mới Sáng tạo Việt Nam. Ông lưu ý rằng những sáng kiến này vượt ra ngoài những tiến bộ công nghệ đơn thuần. Chúng đóng vai trò như một sự khẳng định mạnh mẽ về vai trò mới nổi của Việt Nam trong bối cảnh AI toàn cầu, đồng thời bảo tồn và quảng bá ngôn ngữ và văn hóa Việt Nam trong thời đại AI.

‘Chúng tôi không chỉ tạo ra công nghệ’, Yann LeCun nhấn mạnh, ‘chúng tôi đang xây dựng một tương lai AI toàn diện, tôn trọng các giá trị địa phương’.

Đóng góp của Meta: Bộ dữ liệu mở vì lợi ích cộng đồng

Cam kết của Meta đối với dự án ViGen mở rộng đến việc cung cấp các bộ dữ liệu mở theo chương trình AI và Dữ liệu vì Lợi ích Cộng đồng. Các bộ dữ liệu này bao gồm rất nhiều thông tin, bao gồm dữ liệu về di chuyển, kết nối xã hội và bản đồ dân số do AI cung cấp. Đóng góp này sẵn sàng thúc đẩy nghiên cứu và ứng dụng AI trên nhiều lĩnh vực khác nhau.

Tăng cường sự hiện diện của tiếng Việt trong AI toàn cầu

Trần Việt Hùng, CEO của AI for Vietnam, nhấn mạnh tác động sâu sắc mà ViGen sẽ mang lại cho sự hiện diện của tiếng Việt trong các bộ dữ liệu AI toàn cầu. Ông cũng chỉ ra rằng ViGen sẽ tích cực đóng góp cho Sáng kiến Dữ liệu Mở và Đáng tin cậy (OTDI), một thành phần quan trọng của Quan hệ Đối tác Toàn cầu về AI, trong đó AI for Vietnam đóng một vai trò quan trọng.

Ra mắt sổ tay ‘Đổi mới Sáng tạo Khu vực Công ở Châu Á - Thái Bình Dương với AI Nguồn Mở’

Ngoài dự án ViGen, Meta và Deloitte đã chọn Việt Nam là quốc gia đầu tiên ở khu vực Châu Á - Thái Bình Dương ra mắt cuốn sổ tay quan trọng có tựa đề ‘Đổi mới Sáng tạo Khu vực Công ở Châu Á - Thái Bình Dương với AI Nguồn Mở: Khai phá Tiềm năng Chuyển đổi với Llama’.

Cuốn sổ tay này được thiết kế để cung cấp hỗ trợ vô giá cho các cơ quan nhà nước, cho phép họ áp dụng hiệu quả AI nguồn mở. Nó đóng vai trò như một hướng dẫn thực tế để triển khai các mô hình AI được điều chỉnh chính xác theo điều kiện địa phương và nhu cầu cụ thể.

Khai thác toàn bộ tiềm năng của AI

Sarim Aziz, Giám đốc Chính sách Công tại Meta, nhấn mạnh cam kết của công ty trong việc trao quyền cho các tổ chức và doanh nghiệp Việt Nam: ‘Thông qua các mô hình nguồn mở như Llama, Meta hy vọng sẽ giúp các tổ chức và doanh nghiệp Việt Nam khai thác toàn bộ tiềm năng của AI’.

Ứng dụng thực tế: Chuyển đổi hoạt động của chính phủ

Một báo cáo được công bố tại sự kiện đã giới thiệu hai ví dụ điển hình về cách mô hình Llama đã được triển khai thành công tại Việt Nam:

  1. Bộ Khoa học và Công nghệ: Hợp tác với MISA, Bộ đã phát triển một trợ lý ảo giúp giảm đáng kể thời gian cần thiết cho các cán bộ tra cứu thông tin. Điều này đã dẫn đến việc giảm 98% thời gian tra cứu, nâng cao đáng kể hiệu quả công việc.
  2. Bộ Tư pháp và Viettel: Các đơn vị này đã cùng nhau ứng dụng Llama để tạo ra một trợ lý pháp lý, hợp lý hóa quy trình nghiên cứu tài liệu. Ứng dụng này đã giúp giảm 30% thời gian nghiên cứu tài liệu.

AI nguồn mở: Động lực của chuyển đổi số

Chris Lewin, Giám đốc Năng lực AI và Dữ liệu khu vực Châu Á - Thái Bình Dương tại Deloitte, nhấn mạnh vai trò then chốt của AI nguồn mở trong việc thúc đẩy chuyển đổi số trong khu vực công. Ông tuyên bố, ‘Thông qua báo cáo này, Deloitte mong muốn giúp các cơ quan quản lý và tổ chức tại Việt Nam hiểu sâu hơn về các ứng dụng AI thế hệ tiếp theo dựa trên các nguyên tắc minh bạch và đáng tin cậy’.

Giải thích chi tiết về các khái niệm và sáng kiến chính:

Mô hình ngôn ngữ lớn (LLMs)

Là trung tâm của nhiều tiến bộ AI, Mô hình Ngôn ngữ Lớn là các hệ thống AI phức tạp. Chúng được đào tạo trên các bộ dữ liệu khổng lồ về văn bản và mã, cho phép chúng thực hiện nhiều tác vụ khác nhau, bao gồm:

  • Tạo văn bản: Tạo văn bản chất lượng như con người ở nhiều định dạng khác nhau.
  • Dịch thuật: Dịch chính xác các ngôn ngữ.
  • Trả lời câu hỏi: Cung cấp câu trả lời toàn diện và nhiều thông tin cho nhiều câu hỏi khác nhau.
  • Tóm tắt: Cô đọng một lượng lớn văn bản thành các bản tóm tắt ngắn gọn.
  • Tạo mã: Viết mã bằng nhiều ngôn ngữ lập trình khác nhau.

Hiệu quả của một LLM phụ thuộc rất nhiều vào chất lượng và kích thước của bộ dữ liệu mà nó được đào tạo. Đây là nơi mà sự tập trung của dự án ViGen vào việc tạo ra một bộ dữ liệu tiếng Việt chất lượng cao, quy mô lớn trở nên quan trọng.

AI nguồn mở

Khái niệm AI nguồn mở là trung tâm của dự án ViGen và sự hợp tác rộng lớn hơn. AI nguồn mở đề cập đến các mô hình AI, bộ dữ liệu và công cụ được cung cấp miễn phí cho công chúng. Cách tiếp cận này mang lại một số lợi thế:

  • Tính minh bạch: Mã và dữ liệu cơ bản được mở để xem xét kỹ lưỡng, thúc đẩy sự tin cậy và trách nhiệm giải trình.
  • Hợp tác: Các nhà phát triển và nhà nghiên cứu trên toàn thế giới có thể đóng góp vào việc cải tiến và hoàn thiện các mô hình AI.
  • Đổi mới: Quyền truy cập mở thúc đẩy tốc độ đổi mới nhanh hơn, vì bất kỳ ai cũng có thể xây dựng dựa trên các mô hình và bộ dữ liệu hiện có.
  • Khả năng tiếp cận: AI nguồn mở làm giảm các rào cản gia nhập cho các tổ chức và cá nhân, làm cho công nghệ AI có thể truy cập rộng rãi hơn.
  • Tùy chỉnh: Người dùng có thể điều chỉnh và sửa đổi các mô hình AI nguồn mở để đáp ứng các nhu cầu và yêu cầu cụ thể của họ.

Thử thách Đổi mới Sáng tạo Việt Nam

Thử thách Đổi mới Sáng tạo Việt Nam là một chương trình thường niên nhằm mục đích:

  • Xác định và hỗ trợ các giải pháp đổi mới cho những thách thức chính mà Việt Nam đang đối mặt.
  • Thúc đẩy hợp tác và chia sẻ kiến thức giữa các bên liên quan trong hệ sinh thái đổi mới sáng tạo.
  • Thúc đẩy sự phát triển và áp dụng các công nghệ tiên tiến, đặc biệt là trong lĩnh vực AI.

Tầm quan trọng của bộ dữ liệu

Bộ dữ liệu là huyết mạch của AI. Chúng cung cấp nguyên liệu thô mà các mô hình AI sử dụng để học hỏi và cải thiện. Chất lượng, kích thước và tính đa dạng của bộ dữ liệu ảnh hưởng trực tiếp đến hiệu suất và khả năng của mô hình AI.

  • Chất lượng: Bộ dữ liệu chất lượng cao phải chính xác, nhất quán và đại diện cho các hiện tượng trong thế giới thực mà nó dự định nắm bắt.
  • Kích thước: Bộ dữ liệu lớn hơn thường dẫn đến các mô hình AI hoạt động tốt hơn, vì chúng cung cấp nhiều ví dụ hơn cho mô hình học hỏi.
  • Tính đa dạng: Bộ dữ liệu đa dạng bao gồm nhiều ví dụ khác nhau, đảm bảo rằng mô hình AI không bị thiên vị đối với các nhóm hoặc quan điểm cụ thể.

Sắc thái văn hóa và ngôn ngữ

Việc dự án ViGen tập trung vào việc nắm bắt các sắc thái văn hóa và ngôn ngữ Việt Nam là đặc biệt quan trọng. Ngôn ngữ không chỉ đơn thuần là một công cụ giao tiếp; nó gắn bó sâu sắc với văn hóa, bối cảnh và bản sắc.

  • Bối cảnh văn hóa: Các mô hình AI cần hiểu bối cảnh văn hóa mà ngôn ngữ được sử dụng để diễn giải chính xác ý nghĩa và tránh hiểu lầm.
  • Sắc thái ngôn ngữ: Tiếng Việt, giống như bất kỳ ngôn ngữ nào, có những sắc thái ngôn ngữ riêng, bao gồm thành ngữ, cách diễn đạt và cấu trúc ngữ pháp mà các mô hình AI phải có khả năng nắm bắt.

Bằng cách kết hợp những sắc thái này vào bộ dữ liệu, ViGen hướng tới việc tạo ra các mô hình AI không chỉ thông thạo tiếng Việt mà còn nhạy cảm về văn hóa và nhận thức về bối cảnh.

Tiêu chuẩn đạo đức và giá trị văn hóa

Việc đưa các tiêu chuẩn đạo đức và giá trị văn hóa của Việt Nam vào phát triển AI là một khía cạnh quan trọng của dự án ViGen. Điều này đảm bảo rằng công nghệ AI phù hợp với các giá trị và ưu tiên của quốc gia.

  • Cân nhắc về đạo đức: Phát triển AI đặt ra một loạt các cân nhắc về đạo đức, bao gồm quyền riêng tư, công bằng và trách nhiệm giải trình.
  • Giá trị văn hóa: Các hệ thống AI nên phản ánh và tôn trọng các giá trị văn hóa của xã hội mà chúng được triển khai.

Bằng cách kết hợp những cân nhắc này vào bộ dữ liệu, ViGen hướng tới việc thúc đẩy sự phát triển AI có trách nhiệm và đạo đức tại Việt Nam.