Meta, NIC et AIV : l'IA vietnamienne

Une collaboration pour faire progresser l’IA au Vietnam

Le 14 mars, un partenariat historique a été conclu à Hanoï, marquant une étape importante pour l’intelligence artificielle (IA) au Vietnam. Meta, le géant de la technologie, s’est associé au National Innovation Center (NIC), une entité relevant du ministère des Finances, pour lancer le Vietnam Innovation Challenge 2025. Cette initiative collaborative, qui en est à sa troisième année, souligne un engagement soutenu en faveur du développement de l’IA dans le pays.

Le projet ViGen : une pierre angulaire du développement de l’IA

L’édition 2025 du challenge met en lumière le projet ViGen, une initiative ambitieuse aux implications considérables. ViGen se concentre sur la création d’un ensemble de données vietnamien open source, à grande échelle et de haute qualité. Cet ensemble de données est spécifiquement conçu pour servir de ressource cruciale pour l’entraînement et le développement de grands modèles de langage (LLM).

L’objectif principal de ViGen est d’améliorer considérablement la capacité des modèles d’IA à comprendre les subtilités de la culture, du contexte et des nuances linguistiques vietnamiennes. En atteignant cet objectif, le projet vise à débloquer une vague d’applications d’IA innovantes, spécifiquement adaptées à l’économie numérique en plein essor du Vietnam.

Rôles et responsabilités : un partenariat synergique

Le projet ViGen représente une synergie d’expertise et de ressources, chaque partenaire jouant un rôle distinct :

  • NIC: Le National Innovation Center prend la tête de la supervision, de la coordination et de l’alignement du projet avec les stratégies de développement nationales plus larges du Vietnam.
  • AI for Vietnam: Cette organisation, bénéficiant du soutien technique et financier de Meta, est chargée de l’exécution de composantes spécifiques de l’initiative.
  • Partenaires stratégiques: Le projet bénéficie également des contributions de partenaires stratégiques clés, notamment NVIDIA, Viettel et l’Académie vietnamienne des sciences et technologies. Ces partenaires contribuent à un écosystème coopératif dynamique et durable.

Donner à l’IA une compréhension approfondie du vietnamien

Au cœur de ViGen se trouve la mission de développer un ensemble de données vietnamien open source de haute qualité, suffisamment important pour faciliter l’entraînement et l’évaluation de modèles d’IA de pointe. Cette entreprise va au-delà de la simple capacité des systèmes d’IA à traiter la langue vietnamienne de manière naturelle. Elle garantit également que les normes éthiques et les valeurs culturelles du Vietnam sont profondément intégrées au tissu même du développement de l’IA.

Une priorité nationale : stimuler les percées technologiques

Vo Xuan Hoai, directeur adjoint du NIC, a souligné le potentiel de transformation de l’IA, déclarant : « L’IA transforme le monde chaque jour ». Il a également souligné l’importance cruciale du projet ViGen pour le Vietnam : « Pour le Vietnam, le développement d’ensembles de données vietnamiens open source de haute qualité est une priorité essentielle pour stimuler les percées technologiques, l’innovation et la transformation numérique nationale ».

Le rôle du Vietnam dans le paysage mondial de l’IA

Le professeur Yann LeCun, vice-président et scientifique en chef de l’IA chez Meta, a exprimé la signification plus large de ViGen et du Vietnam Innovation Challenge. Il a noté que ces initiatives vont au-delà des simples avancées technologiques. Elles servent d’affirmation puissante du rôle émergent du Vietnam dans le paysage mondial de l’IA, tout en préservant et en promouvant simultanément la langue et la culture vietnamiennes à l’ère de l’IA.

« Nous ne créons pas seulement de la technologie », a souligné Yann LeCun, « nous construisons un avenir de l’IA inclusif qui reste fidèle aux valeurs locales ».

La contribution de Meta : des ensembles de données ouverts au profit de la communauté

L’engagement de Meta envers le projet ViGen s’étend à la fourniture d’ensembles de données ouverts dans le cadre du programme AI and Data for Community Benefit. Ces ensembles de données englobent une mine d’informations, notamment des données sur la mobilité, les connexions sociales et des cartes de population basées sur l’IA. Cette contribution est susceptible de propulser la recherche et les applications de l’IA dans un large éventail de domaines.

Améliorer la représentation vietnamienne dans l’IA mondiale

Tran Viet Hung, PDG d’AI for Vietnam, a souligné l’impact profond que ViGen aura sur la représentation du vietnamien dans les ensembles de données d’IA mondiaux. Il a également souligné que ViGen contribuera activement à l’Open & Trusted Data Initiative (OTDI), un élément clé du Partenariat mondial sur l’IA, dans lequel AI for Vietnam joue un rôle essentiel.

Lancement du manuel ‘Innovation du secteur public en Asie-Pacifique avec l’IA open source’

Au-delà du projet ViGen, Meta et Deloitte ont choisi le Vietnam comme premier pays de la région Asie-Pacifique à lancer un manuel important intitulé « Innovation du secteur public en Asie-Pacifique avec l’IA open source : libérer le potentiel de transformation avec Llama ».

Ce manuel est conçu pour fournir un soutien précieux aux agences publiques, leur permettant d’adopter efficacement l’IA open source. Il sert de guide pratique pour la mise en œuvre de modèles d’IA précisément adaptés aux conditions locales et aux besoins spécifiques.

Exploiter le plein potentiel de l’IA

Sarim Aziz, directeur des politiques publiques chez Meta, a souligné l’engagement de l’entreprise à autonomiser les organisations et les entreprises vietnamiennes : « Grâce à des modèles open source comme Llama, Meta espère aider les organisations et les entreprises vietnamiennes à exploiter le plein potentiel de l’IA ».

Applications concrètes : transformer les opérations gouvernementales

Un rapport publié lors de l’événement a présenté deux exemples convaincants de la manière dont le modèle Llama a été mis en œuvre avec succès au Vietnam :

  1. Ministère des Sciences et Technologies : En collaboration avec MISA, le ministère a développé un assistant virtuel qui réduit considérablement le temps nécessaire aux fonctionnaires pour rechercher des informations. Cela a entraîné une réduction remarquable de 98 % du temps de recherche, améliorant considérablement l’efficacité du travail.
  2. Ministère de la Justice et Viettel : Ces entités ont conjointement appliqué Llama pour créer un assistant juridique, rationalisant le processus de recherche documentaire. Cette application a permis de réduire de 30 % le temps de recherche documentaire.

L’IA open source : un moteur de la transformation numérique

Chris Lewin, responsable des capacités d’IA et de données pour l’Asie-Pacifique chez Deloitte, a souligné le rôle central de l’IA open source dans la transformation numérique du secteur public. Il a déclaré : « Grâce à ce rapport, Deloitte vise à aider les organismes de gestion et les organisations au Vietnam à acquérir une compréhension plus approfondie des applications d’IA de nouvelle génération basées sur les principes de transparence et de fiabilité ».

Explication détaillée des concepts et initiatives clés :

Grands modèles de langage (LLM)

Au cœur de nombreuses avancées en matière d’IA, les grands modèles de langage sont des systèmes d’IA sophistiqués. Ils sont entraînés sur des ensembles de données massifs de texte et de code, ce qui leur permet d’effectuer diverses tâches, notamment :

  • Génération de texte : Création de texte de qualité humaine dans divers formats.
  • Traduction : Traduction précise des langues.
  • Réponse aux questions : Fourniture de réponses complètes et informatives à un large éventail de questions.
  • Résumé : Condensation de grandes quantités de texte en résumés concis.
  • Génération de code : Écriture de code dans divers langages de programmation.

L’efficacité d’un LLM dépend fortement de la qualité et de la taille de l’ensemble de données sur lequel il est entraîné. C’est là que l’accent mis par le projet ViGen sur la création d’un ensemble de données vietnamien de haute qualité et à grande échelle devient crucial.

IA Open Source

Le concept d’IA open source est au cœur du projet ViGen et de la collaboration plus large. L’IA open source fait référence aux modèles d’IA, aux ensembles de données et aux outils qui sont mis gratuitement à la disposition du public. Cette approche offre plusieurs avantages :

  • Transparence : Le code et les données sous-jacents sont ouverts à l’examen, ce qui favorise la confiance et la responsabilité.
  • Collaboration : Les développeurs et les chercheurs du monde entier peuvent contribuer à l’amélioration et au perfectionnement des modèles d’IA.
  • Innovation : L’accès ouvert favorise un rythme d’innovation plus rapide, car n’importe qui peut s’appuyer sur les modèles et les ensembles de données existants.
  • Accessibilité : L’IA open source abaisse les barrières à l’entrée pour les organisations et les individus, rendant la technologie de l’IA plus largement accessible.
  • Personnalisation : Les utilisateurs peuvent adapter et modifier les modèles d’IA open source pour répondre à leurs besoins et exigences spécifiques.

Le Vietnam Innovation Challenge

Le Vietnam Innovation Challenge est un programme annuel qui vise à :

  • Identifier et soutenir des solutions innovantes aux défis clés auxquels le Vietnam est confronté.
  • Favoriser la collaboration et le partage des connaissances entre les parties prenantes de l’écosystème de l’innovation.
  • Promouvoir le développement et l’adoption de technologies de pointe, en particulier dans le domaine de l’IA.

L’importance des ensembles de données

Les ensembles de données sont le moteur de l’IA. Ils fournissent la matière première que les modèles d’IA utilisent pour apprendre et s’améliorer. La qualité, la taille et la diversité d’un ensemble de données ont un impact direct sur les performances et les capacités d’un modèle d’IA.

  • Qualité : Un ensemble de données de haute qualité est précis, cohérent et représentatif des phénomènes du monde réel qu’il est censé capturer.
  • Taille : Les ensembles de données plus volumineux conduisent généralement à des modèles d’IA plus performants, car ils fournissent plus d’exemples à partir desquels le modèle peut apprendre.
  • Diversité : Un ensemble de données diversifié comprend un large éventail d’exemples, garantissant que le modèle d’IA n’est pas biaisé en faveur de groupes ou de perspectives spécifiques.

Nuances culturelles et linguistiques

L’accent mis par le projet ViGen sur la capture des nuances culturelles et linguistiques vietnamiennes est particulièrement important. La langue n’est pas simplement un outil de communication ; elle est profondément liée à la culture, au contexte et à l’identité.

  • Contexte culturel : Les modèles d’IA doivent comprendre le contexte culturel dans lequel la langue est utilisée pour interpréter avec précision le sens et éviter les malentendus.
  • Nuances linguistiques : Le vietnamien, comme toute langue, possède son propre ensemble unique de nuances linguistiques, y compris des idiomes, des expressions et des structures grammaticales, que les modèles d’IA doivent être capables de saisir.

En intégrant ces nuances dans l’ensemble de données, ViGen vise à créer des modèles d’IA qui sont non seulement fluides en vietnamien, mais aussi culturellement sensibles et conscients du contexte.

Normes éthiques et valeurs culturelles

L’intégration des normes éthiques et des valeurs culturelles du Vietnam dans le développement de l’IA est un aspect crucial du projet ViGen. Cela garantit que la technologie de l’IA est alignée sur les valeurs et les priorités du pays.

  • Considérations éthiques : Le développement de l’IA soulève une série de considérations éthiques, notamment la confidentialité, l’équité et la responsabilité.
  • Valeurs culturelles : Les systèmes d’IA doivent refléter et respecter les valeurs culturelles de la société dans laquelle ils sont déployés.

En intégrant ces considérations dans l’ensemble de données, ViGen vise à promouvoir le développement responsable et éthique de l’IA au Vietnam.