베트남 AI 발전을 위한 협력적 노력
3월 14일, 하노이에서 베트남 인공지능(AI) 발전을 위한 중요한 파트너십이 체결되었습니다. 기술 대기업인 Meta는 재무부 산하 기관인 NIC(National Innovation Center)와 협력하여 2025 Vietnam Innovation Challenge을 시작했습니다. 올해로 3년째를 맞는 이 협력 노력은 베트남 내 AI 개발을 촉진하기 위한 지속적인 노력을 강조합니다.
ViGen 프로젝트: AI 개발의 초석
2025년 챌린지는 광범위한 영향을 미치는 야심 찬 이니셔티브인 ViGen 프로젝트에 초점을 맞춥니다. ViGen은 대규모, 고품질, 오픈 소스 베트남어 데이터 세트를 만드는 데 중점을 둡니다. 이 데이터 세트는 LLM(Large Language Models)을 훈련하고 개발하는 데 중요한 리소스로 사용하도록 특별히 설계되었습니다.
ViGen의 핵심 목표는 AI 모델이 베트남 문화, 맥락 및 언어적 뉘앙스의 복잡성을 이해하는 능력을 크게 향상시키는 것입니다. 이를 통해 이 프로젝트는 베트남의 급성장하는 디지털 경제에 특별히 맞춰진 획기적인 AI 애플리케이션의 물결을 일으키는 것을 목표로 합니다.
역할 및 책임: 시너지 파트너십
ViGen 프로젝트는 각 파트너가 고유한 역할을 수행하는 전문 지식과 리소스의 시너지 효과를 나타냅니다.
- NIC: National Innovation Center는 프로젝트를 감독, 조정하고 베트남의 광범위한 국가 개발 전략과 원활하게 연계되도록 하는 데 앞장섭니다.
- AI for Vietnam: Meta의 기술 및 재정적 지원을 받는 이 조직은 이니셔티브의 특정 구성 요소 실행을 담당합니다.
- 전략적 파트너: 이 프로젝트는 NVIDIA, Viettel 및 Vietnam Academy of Science and Technology를 포함한 주요 전략적 파트너의 기여로부터 혜택을 받습니다. 이러한 파트너는 활기차고 지속 가능한 협력 생태계에 기여합니다.
베트남어에 대한 깊은 이해로 AI 역량 강화
ViGen은 최첨단 AI 모델의 훈련 및 평가를 용이하게 할 만큼 충분히 큰 고품질, 오픈 소스 베트남어 데이터 세트를 개발하는 미션에 의해 추진됩니다. 이 노력은 AI 시스템이 베트남어를 자연스러운 방식으로 처리할 수 있도록 하는 것 이상입니다. 또한 베트남의 윤리적 기준과 문화적 가치가 AI 개발의 구조에 깊이 내재되도록 합니다.
국가 우선 순위: 기술 혁신 주도
NIC 부국장 Vo Xuan Hoai는 “AI는 매일 세상을 변화시키고 있습니다.”라고 말하면서 AI의 변혁적 잠재력을 강조했습니다. 그는 또한 베트남에서 ViGen 프로젝트의 중요성을 강조했습니다. “베트남의 경우 고품질, 오픈 소스 베트남어 데이터 세트를 개발하는 것은 기술 혁신, 혁신 및 국가 디지털 전환을 주도하는 핵심 우선 순위입니다.”
글로벌 AI 환경에서 베트남의 역할
Meta의 부사장이자 최고 AI 과학자인 Yann LeCun 교수는 ViGen과 Vietnam Innovation Challenge의 광범위한 중요성을 설명했습니다. 그는 이러한 이니셔티브가 단순한 기술 발전을 넘어선다고 언급했습니다. 이는 글로벌 AI 환경에서 베트남의 부상하는 역할을 강력하게 확인하는 동시에 AI 시대에 베트남어와 문화를 보존하고 홍보하는 역할을 합니다.
Yann LeCun은 “우리는 단순히 기술을 만드는 것이 아니라 지역 가치에 충실한 포용적인 AI 미래를 구축하고 있습니다.”라고 강조했습니다.
Meta의 기여: 커뮤니티 혜택을 위한 오픈 데이터 세트
ViGen 프로젝트에 대한 Meta의 노력은 AI 및 Data for Community Benefit 프로그램에 따라 오픈 데이터 세트를 제공하는 것으로 확장됩니다. 이러한 데이터 세트에는 이동성, 사회적 연결 및 AI 기반 인구 지도에 대한 데이터를 포함한 풍부한 정보가 포함되어 있습니다. 이 기여는 다양한 분야에서 AI 연구 및 애플리케이션을 추진할 준비가 되어 있습니다.
글로벌 AI에서 베트남어 표현 향상
AI for Vietnam의 CEO인 Tran Viet Hung은 ViGen이 글로벌 AI 데이터 세트에서 베트남어 표현에 미칠 심오한 영향을 강조했습니다. 그는 또한 ViGen이 AI for Vietnam이 중요한 역할을 하는 Global Partnership on AI의 핵심 구성 요소인 OTDI(Open & Trusted Data Initiative)에 적극적으로 기여할 것이라고 지적했습니다.
‘오픈 소스 AI를 활용한 아시아 태평양 지역 공공 부문 혁신’ 핸드북 출시
ViGen 프로젝트 외에도 Meta와 Deloitte는 베트남을 아시아 태평양 지역에서 ‘Llama를 통한 변혁적 잠재력 활용: 오픈 소스 AI를 활용한 아시아 태평양 지역 공공 부문 혁신’이라는 중요한 핸드북을 출시하는 첫 번째 국가로 선정했습니다.
이 핸드북은 공공 기관이 오픈 소스 AI를 효과적으로 채택할 수 있도록 귀중한 지원을 제공하도록 설계되었습니다. 이는 지역 조건과 특정 요구 사항에 정확하게 맞춰진 AI 모델을 구현하기 위한 실용적인 가이드 역할을 합니다.
AI의 잠재력 최대한 활용
Meta의 공공 정책 책임자인 Sarim Aziz는 베트남 조직과 기업에 힘을 실어주기 위한 회사의 노력을 강조했습니다. “Llama와 같은 오픈 소스 모델을 통해 Meta는 베트남 조직과 기업이 AI의 잠재력을 최대한 활용할 수 있도록 돕고자 합니다.”
실제 애플리케이션: 정부 운영 혁신
이 행사에서 발표된 보고서는 Llama 모델이 베트남에서 성공적으로 구현된 두 가지 설득력 있는 사례를 보여주었습니다.
- 과학기술부: MISA와 협력하여 이 부처는 공무원이 정보를 조회하는 데 필요한 시간을 획기적으로 줄이는 가상 비서를 개발했습니다. 그 결과 조회 시간이 98%나 단축되어 작업 효율성이 크게 향상되었습니다.
- 법무부 및 Viettel: 이 기관들은 공동으로 Llama를 적용하여 문서 연구 프로세스를 간소화하는 법률 비서를 만들었습니다. 이 애플리케이션으로 인해 문서 연구 시간이 30% 단축되었습니다.
오픈 소스 AI: 디지털 전환의 동력
Deloitte의 아시아 태평양 지역 AI 및 데이터 기능 책임자인 Chris Lewin은 공공 부문의 디지털 전환을 주도하는 데 있어 오픈 소스 AI의 중추적인 역할을 강조했습니다. 그는 “이 보고서를 통해 Deloitte는 베트남의 관리 기관과 조직이 투명성과 신뢰성의 원칙에 기반한 차세대 AI 애플리케이션에 대한 더 깊은 이해를 얻을 수 있도록 돕고자 합니다.”라고 말했습니다.
주요 개념 및 이니셔티브에 대한 자세한 설명:
LLM(Large Language Models)
많은 AI 발전의 핵심인 LLM은 정교한 AI 시스템입니다. 텍스트와 코드의 방대한 데이터 세트에 대해 훈련되어 다음을 포함한 다양한 작업을 수행할 수 있습니다.
- 텍스트 생성: 다양한 형식으로 사람이 작성한 것과 같은 품질의 텍스트를 만듭니다.
- 번역: 언어를 정확하게 번역합니다.
- 질문 답변: 광범위한 질문에 대한 포괄적이고 유익한 답변을 제공합니다.
- 요약: 많은 양의 텍스트를 간결한 요약으로 압축합니다.
- 코드 생성: 다양한 프로그래밍 언어로 코드를 작성합니다.
LLM의 효과는 훈련된 데이터 세트의 품질과 크기에 크게 좌우됩니다. 이것이 바로 ViGen 프로젝트가 고품질, 대규모 베트남어 데이터 세트를 만드는 데 중점을 두는 이유입니다.
오픈 소스 AI
오픈 소스 AI의 개념은 ViGen 프로젝트와 광범위한 협력의 핵심입니다. 오픈 소스 AI는 대중에게 무료로 제공되는 AI 모델, 데이터 세트 및 도구를 말합니다. 이 접근 방식은 다음과 같은 몇 가지 이점을 제공합니다.
- 투명성: 기본 코드와 데이터는 면밀한 조사를 위해 공개되어 신뢰와 책임감을 높입니다.
- 협업: 전 세계의 개발자와 연구원은 AI 모델의 개선 및 개선에 기여할 수 있습니다.
- 혁신: 개방형 액세스는 누구나 기존 모델과 데이터 세트를 기반으로 구축할 수 있으므로 더 빠른 혁신 속도를 촉진합니다.
- 접근성: 오픈 소스 AI는 조직과 개인의 진입 장벽을 낮추어 AI 기술에 더 널리 접근할 수 있도록 합니다.
- 사용자 정의: 사용자는 오픈 소스 AI 모델을 특정 요구 사항과 요구 사항에 맞게 조정하고 수정할 수 있습니다.
Vietnam Innovation Challenge
Vietnam Innovation Challenge는 다음을 목표로 하는 연례 프로그램입니다.
- 베트남이 직면한 주요 과제에 대한 혁신적인 솔루션을 식별하고 지원합니다.
- 혁신 생태계의 이해 관계자 간의 협력과 지식 공유를 촉진합니다.
- 특히 AI 분야에서 최첨단 기술의 개발 및 채택을 촉진합니다.
데이터 세트의 중요성
데이터 세트는 AI의 생명선입니다. AI 모델이 학습하고 개선하는 데 사용하는 원자재를 제공합니다. 데이터 세트의 품질, 크기 및 다양성은 AI 모델의 성능과 기능에 직접적인 영향을 미칩니다.
- 품질: 고품질 데이터 세트는 정확하고 일관성이 있으며 캡처하려는 실제 현상을 나타냅니다.
- 크기: 더 큰 데이터 세트는 일반적으로 모델이 학습할 수 있는 더 많은 예제를 제공하므로 더 나은 성능의 AI 모델로 이어집니다.
- 다양성: 다양한 데이터 세트에는 광범위한 예제가 포함되어 있어 AI 모델이 특정 그룹이나 관점에 편향되지 않도록 합니다.
문화 및 언어적 뉘앙스
ViGen 프로젝트가 베트남 문화 및 언어적 뉘앙스를 포착하는 데 중점을 두는 것은 특히 중요합니다. 언어는 단순한 의사 소통 도구가 아닙니다. 문화, 맥락 및 정체성과 깊이 얽혀 있습니다.
- 문화적 맥락: AI 모델은 의미를 정확하게 해석하고 오해를 피하기 위해 언어가 사용되는 문화적 맥락을 이해해야 합니다.
- 언어적 뉘앙스: 베트남어는 다른 언어와 마찬가지로 관용구, 표현 및 문법 구조를 포함하여 AI 모델이 파악할 수 있어야 하는 고유한 언어적 뉘앙스를 가지고 있습니다.
ViGen은 이러한 뉘앙스를 데이터 세트에 통합함으로써 베트남어에 능통할 뿐만 아니라 문화적으로 민감하고 상황에 맞는 AI 모델을 만드는 것을 목표로 합니다.
윤리적 기준 및 문화적 가치
AI 개발에 베트남의 윤리적 기준과 문화적 가치를 포함시키는 것은 ViGen 프로젝트의 중요한 측면입니다. 이를 통해 AI 기술이 국가의 가치와 우선 순위에 부합하도록 합니다.
- 윤리적 고려 사항: AI 개발은 개인 정보 보호, 공정성 및 책임감을 포함한 다양한 윤리적 고려 사항을 제기합니다.
- 문화적 가치: AI 시스템은 배포되는 사회의 문화적 가치를 반영하고 존중해야 합니다.
ViGen은 이러한 고려 사항을 데이터 세트에 통합함으로써 베트남에서 책임감 있고 윤리적인 AI 개발을 촉진하는 것을 목표로 합니다.