Совместные усилия по развитию ИИ во Вьетнаме
14 марта в Ханое было заключено знаковое партнерство, ознаменовавшее собой значительный шаг вперед в развитии искусственного интеллекта (ИИ) во Вьетнаме. Технологический гигант Meta объединил усилия с Национальным инновационным центром (NIC), подведомственным Министерству финансов, для запуска конкурса Vietnam Innovation Challenge 2025. Это совместное предприятие, которое проводится уже третий год, подчеркивает неизменную приверженность делу содействия развитию ИИ в стране.
Проект ViGen: краеугольный камень развития ИИ
В рамках конкурса 2025 года особое внимание уделяется проекту ViGen, амбициозной инициативе с далеко идущими последствиями. ViGen нацелен на создание крупномасштабного, высококачественного набора данных на вьетнамском языке с открытым исходным кодом. Этот набор данных специально разработан для того, чтобы служить важнейшим ресурсом для обучения и разработки больших языковых моделей (LLM).
Основная цель ViGen — значительно улучшить способность моделей ИИ понимать тонкости вьетнамской культуры, контекста и языковых нюансов. Достигнув этого, проект стремится открыть волну новаторских приложений ИИ, специально адаптированных к растущей цифровой экономике Вьетнама.
Роли и обязанности: синергетическое партнерство
Проект ViGen представляет собой синергию опыта и ресурсов, где каждый партнер играет определенную роль:
- NIC: Национальный инновационный центр берет на себя ведущую роль в надзоре, координации и обеспечении соответствия проекта более широким национальным стратегиям развития Вьетнама.
- AI for Vietnam: Этой организации, при технической и финансовой поддержке Meta, поручено выполнение конкретных компонентов инициативы.
- Стратегические партнеры: Проект также выигрывает от вклада ключевых стратегических партнеров, включая NVIDIA, Viettel и Вьетнамскую академию наук и технологий. Эти партнеры вносят вклад в создание динамичной и устойчивой экосистемы сотрудничества.
Расширение возможностей ИИ с глубоким пониманием вьетнамского языка
В основе ViGen лежит миссия по разработке высококачественного набора данных на вьетнамском языке с открытым исходным кодом, который достаточно велик, чтобы облегчить обучение и оценку передовых моделей ИИ. Это начинание выходит за рамки простого предоставления системам ИИ возможности обрабатывать вьетнамский язык естественным образом. Оно также гарантирует, что этические стандарты и культурные ценности Вьетнама глубоко укоренились в самой структуре развития ИИ.
Национальный приоритет: стимулирование технологических прорывов
Во Суан Хоай, заместитель директора NIC, подчеркнул преобразующий потенциал ИИ, заявив: «ИИ трансформирует мир каждый день». Далее он подчеркнул исключительную важность проекта ViGen для Вьетнама: «Для Вьетнама разработка высококачественных наборов данных на вьетнамском языке с открытым исходным кодом является ключевым приоритетом для стимулирования технологических прорывов, инноваций и национальной цифровой трансформации».
Роль Вьетнама в глобальном ландшафте ИИ
Профессор Янн ЛеКун, вице-президент и главный научный сотрудник по ИИ в Meta, сформулировал более широкое значение ViGen и Vietnam Innovation Challenge. Он отметил, что эти инициативы выходят за рамки простых технологических достижений. Они служат мощным подтверждением растущей роли Вьетнама в глобальном ландшафте ИИ, одновременно сохраняя и продвигая вьетнамский язык и культуру в эпоху ИИ.
«Мы не просто создаем технологии, — подчеркнул Янн ЛеКун, — мы строим инклюзивное будущее ИИ, которое остается верным местным ценностям».
Вклад Meta: открытые наборы данных для пользы сообщества
Приверженность Meta проекту ViGen распространяется на предоставление открытых наборов данных в рамках программы ‘AI and Data for Community Benefit’. Эти наборы данных охватывают обширную информацию, включая данные о мобильности, социальных связях и карты населения на основе ИИ. Этот вклад призван стимулировать исследования и приложения ИИ в самых разных областях.
Улучшение представленности вьетнамского языка в глобальном ИИ
Тран Вьет Хунг, генеральный директор AI for Vietnam, подчеркнул глубокое влияние, которое ViGen окажет на представление вьетнамского языка в глобальных наборах данных ИИ. Он также отметил, что ViGen будет активно участвовать в Инициативе открытых и надежных данных (OTDI), ключевом компоненте Глобального партнерства по ИИ, в котором AI for Vietnam играет жизненно важную роль.
Запуск руководства ‘Инновации государственного сектора в Азиатско-Тихоокеанском регионе с помощью ИИ с открытым исходным кодом’
Помимо проекта ViGen, Meta и Deloitte выбрали Вьетнам в качестве первой страны в Азиатско-Тихоокеанском регионе для запуска важного руководства под названием ‘Public Sector Innovation in Asia-Pacific with Open-Source AI: Unlocking Transformational Potential with Llama’.
Это руководство призвано предоставить неоценимую поддержку государственным учреждениям, позволяя им эффективно внедрять ИИ с открытым исходным кодом. Оно служит практическим руководством по внедрению моделей ИИ, которые точно адаптированы к местным условиям и конкретным потребностям.
Использование всего потенциала ИИ
Сарим Азиз, директор по вопросам государственной политики в Meta, подчеркнул приверженность компании расширению возможностей вьетнамских организаций и предприятий: «С помощью моделей с открытым исходным кодом, таких как Llama, Meta надеется помочь вьетнамским организациям и предприятиям полностью раскрыть потенциал ИИ».
Реальные приложения: трансформация государственных операций
В отчете, опубликованном на мероприятии, были представлены два убедительных примера успешного внедрения модели Llama во Вьетнаме:
- Министерство науки и технологий: В сотрудничестве с MISA министерство разработало виртуального помощника, который значительно сокращает время, необходимое чиновникам для поиска информации. Это привело к значительному сокращению времени поиска на 98%, что существенно повысило эффективность работы.
- Министерство юстиции и Viettel: Эти организации совместно применили Llama для создания юридического помощника, оптимизирующего процесс поиска документов. Это приложение привело к сокращению времени поиска документов на 30%.
ИИ с открытым исходным кодом: движущая сила цифровой трансформации
Крис Льюин, руководитель отдела возможностей ИИ и данных в Азиатско-Тихоокеанском регионе в Deloitte, подчеркнул ключевую роль ИИ с открытым исходным кодом в стимулировании цифровой трансформации в государственном секторе. Он заявил: «С помощью этого отчета Deloitte стремится помочь руководящим органам и организациям во Вьетнаме получить более глубокое понимание приложений ИИ следующего поколения, основанных на принципах прозрачности и надежности».
Подробное объяснение ключевых концепций и инициатив:
Большие языковые модели (LLM)
В основе многих достижений ИИ лежат большие языковые модели — сложные системы ИИ. Они обучаются на огромных наборах данных текста и кода, что позволяет им выполнять различные задачи, в том числе:
- Генерация текста: Создание текста, сравнимого по качеству с человеческим, в различных форматах.
- Перевод: Точный перевод языков.
- Ответы на вопросы: Предоставление исчерпывающих и информативных ответов на широкий круг вопросов.
- Суммаризация: Сжатие больших объемов текста в краткие сводки.
- Генерация кода: Написание кода на различных языках программирования.
Эффективность LLM сильно зависит от качества и размера набора данных, на котором она обучается. Именно здесь фокус проекта ViGen на создании высококачественного, крупномасштабного набора данных на вьетнамском языке становится решающим.
ИИ с открытым исходным кодом
Концепция ИИ с открытым исходным кодом занимает центральное место в проекте ViGen и более широком сотрудничестве. ИИ с открытым исходным кодом относится к моделям ИИ, наборам данных и инструментам, которые находятся в свободном доступе для общественности. Этот подход предлагает несколько преимуществ:
- Прозрачность: Базовый код и данные открыты для проверки, что способствует доверию и подотчетности.
- Сотрудничество: Разработчики и исследователи со всего мира могут внести свой вклад в улучшение и совершенствование моделей ИИ.
- Инновации: Открытый доступ способствует более быстрому темпу инноваций, поскольку любой может опираться на существующие модели и наборы данных.
- Доступность: ИИ с открытым исходным кодом снижает барьеры для входа для организаций и частных лиц, делая технологию ИИ более широко доступной.
- Настройка: Пользователи могут адаптировать и модифицировать модели ИИ с открытым исходным кодом в соответствии со своими конкретными потребностями и требованиями.
Vietnam Innovation Challenge
Vietnam Innovation Challenge — это ежегодная программа, целью которой является:
- Выявление и поддержка инновационных решений ключевых проблем, стоящих перед Вьетнамом.
- Содействие сотрудничеству и обмену знаниями между заинтересованными сторонами в инновационной экосистеме.
- Содействие разработке и внедрению передовых технологий, особенно в области ИИ.
Значение наборов данных
Наборы данных — это источник жизненной силы ИИ. Они предоставляют исходный материал, который модели ИИ используют для обучения и совершенствования. Качество, размер и разнообразие набора данных напрямую влияют на производительность и возможности модели ИИ.
- Качество: Высококачественный набор данных является точным, последовательным и репрезентативным для реальных явлений, которые он призван отражать.
- Размер: Большие наборы данных, как правило, приводят к лучшей производительности моделей ИИ, поскольку они предоставляют больше примеров для обучения модели.
- Разнообразие: Разнообразный набор данных включает в себя широкий спектр примеров, гарантируя, что модель ИИ не будет предвзятой по отношению к определенным группам или точкам зрения.
Культурные и языковые нюансы
Особое значение имеет акцент проекта ViGen на учете вьетнамских культурных и языковых нюансов. Язык — это не просто инструмент общения; он тесно переплетен с культурой, контекстом и идентичностью.
- Культурный контекст: Модели ИИ должны понимать культурный контекст, в котором используется язык, чтобы точно интерпретировать значение и избегать недоразумений.
- Языковые нюансы: Вьетнамский, как и любой другой язык, имеет свой собственный уникальный набор языковых нюансов, включая идиомы, выражения и грамматические структуры, которые модели ИИ должны уметь понимать.
Включая эти нюансы в набор данных, ViGen стремится создать модели ИИ, которые не только свободно владеют вьетнамским языком, но и являются культурно чувствительными и контекстуально осведомленными.
Этические стандарты и культурные ценности
Внедрение этических стандартов и культурных ценностей Вьетнама в разработку ИИ является важнейшим аспектом проекта ViGen. Это гарантирует, что технология ИИ соответствует ценностям и приоритетам страны.
- Этические соображения: Разработка ИИ поднимает ряд этических вопросов, включая конфиденциальность, справедливость и подотчетность.
- Культурные ценности: Системы ИИ должны отражать и уважать культурные ценности общества, в котором они развернуты.
Включая эти соображения в набор данных, ViGen стремится содействовать ответственному и этичному развитию ИИ во Вьетнаме.