Возможности Малайзии: AI с открытым кодом

Наступление эры больших языковых моделей (LLM), таких как DeepSeek R1 в начале этого года, ознаменовало собой переломный момент для генеративного искусственного интеллекта (Gen AI). Это событие стало значительным скачком вперед не только в технологическом, но и в коммерческом и стратегическом плане. DeepSeek продемонстрировала, что сложные LLM могут быть разработаны при значительно более низких затратах, чем считалось ранее, и, что крайне важно, что эта инновация не ограничивается Силиконовой долиной.

Появление DeepSeek имеет глубокие последствия для малазийской экосистемы AI, выходя за рамки продолжающегося технологического соперничества между США и Китаем, и временного охлаждения энтузиазма малазийского фондового рынка в отношении центров обработки данных.

Значение открытого исходного кода

Ключевым аспектом LLM DeepSeek является их основа на технологии с открытым исходным кодом. Модели, такие как DeepSeek R1, доступны по лицензиям с открытым исходным кодом или открытыми весами, что означает, что их можно свободно загружать, изменять и использовать. Этот открытый исходный код имеет существенные последствия для эволюции и коммерциализации LLM.

В течение многих лет китайские технологические гиганты, такие как Baidu, Alibaba и Tencent, активно разрабатывают модели AI с открытым исходным кодом. Эта стратегия, поддерживаемая китайскими университетами и правительственными инициативами, принимает подход «открытых инноваций», направленный на ускорение исследований и разработок и потенциально превосходящий Соединенные Штаты в возможностях AI.

Однако приверженность AI с открытым исходным кодом выходит за рамки Китая. Meta и Google также выпустили LLM с открытыми весами, мотивированные конкурентными факторами. Обоснование этого коренится в бизнес-стратегии “коммодитизации дополнения”. Если компания в значительной степени полагается на Gen AI, может быть более выгодно инвестировать в альтернативы с открытым исходным кодом, чем полагаться исключительно на проприетарные модели, такие как ChatGPT. Даже если проприетарные LLM все еще используются, наличие хороших моделей с открытым исходным кодом ослабляет ценовую власть ключевых поставщиков, таких как OpenAI.

Эта стратегия отражает действия, предпринятые Oracle, производителем серверов и сетевого оборудования. Oracle поддержала операционную систему Linux с открытым исходным кодом, чтобы обуздать ценовое доминирование Windows OS от Microsoft.

Независимо от мотивов, наличие высококачественных LLM с открытыми весами значительно снижает затраты для таких стран, как Малайзия, открывая новые двери для инноваций.

Преимущества для правительства и бизнеса

Для малазийского правительства LLM с открытым исходным кодом предлагают возможность управлять своими собственными моделями AI без необходимости передавать конфиденциальные данные коммерческим третьим лицам или иностранным государствам. Это укрепляет автономию и суверенитет данных.

Для малазийских компаний, особенно стартапов, LLM с открытыми весами создают равные условия игры. Они могут получить доступ к тем же фундаментальным LLM, что и их коллеги в Китае и США, способствуя инновациям и конкуренции.

Устранение культурных и политических предубеждений

Рост китайского AI также высвечивает серьезную проблему: культурные и политические предубеждения. Китайские LLM часто обучаются отражать историческую перспективу и политические взгляды Коммунистической партии Китая (КПК), придерживаясь норм цензуры в материковом Китае.

Даже без явной цензуры модели AI по своей сути несут предубеждения, присутствующие в их обучающих данных. Если они в основном обучены на английских текстах, модели будут отражать западные культурные точки зрения и предубеждения.

Хорошей новостью является то, что LLM можно относительно легко переобучить. Подобно тому, как китайские LLM получают ограждения для содействия лояльности КПК, другие проекты с открытым исходным кодом продемонстрировали, что DeepSeek R1 можно дополнительно обучить для смягчения предполагаемых предубеждений.

Локализация и культурная чувствительность

Этот опыт подчеркивает необходимость для таких стран, как Малайзия, развивать свой собственный потенциал для локализации, обучения и постобработки LLM, чтобы они соответствовали местным условиям. Модели, которые не учитывают расовую и религиозную чувствительность Малайзии, социальные иерархии или местный сленг, могут работать хуже или генерировать вредоносный контент.

Малайзия уже обладает некоторыми возможностями разработки LLM. Например, местный стартап Mesolitica выпустил LLM MaLLaM с открытым исходным кодом в январе, демонстрируя более тонкое понимание Bahasa Malaysia, чем основные LLM, такие как ChatGPT.

Однако осведомленность среди малазийских политиков относительно потенциала AI с открытым исходным кодом и важности местной разработки LLM остается неясной.

Национальная стратегия AI

В Национальной дорожной карте AI, разработанной в 2021 году, мало упоминается об открытом исходном коде. Точно так же, недавние документы из нового Национального офиса AI (NAIO) также не подчеркивают AI с открытым исходным кодом.

Хотя прогнозировать будущее развития AI остается сложной задачей, открытый исходный код нынешнего поколения LLM предоставляет Малайзии исключительную возможность догнать технологических лидеров.

Использование возможности

Чтобы извлечь выгоду из этого, Малайзии необходимо обновить свою политику, чтобы учесть появление LLM меньшего размера и тех, которые более доступны. Это включает в себя упрощение внедрения этих моделей, повышение доступности Gen AI для малых и средних предприятий и обеспечение локального развертывания, особенно в сельских районах с ограниченным доступом в Интернет.

Расширение возможностей Малайзии по разработке LLM, делая их более релевантными для местных языков и учитывая местную культуру, имеет решающее значение. Инвестиции в обучение LLM, потенциально закрепленные в местных университетах, можно рассматривать как общественное благо, способствующее развитию отечественных талантов и продвижению местных исследований и разработок.

Автономия данных и национальная безопасность

Размещение собственных LLM жизненно важно для обеспечения национальной автономии данных. Данные, собранные LLM, могут быть ценными, и вместо того, чтобы эксплуатироваться иностранными организациями, эта информация должна храниться и использоваться местными организациями.

Вот более подробная разбивка того, как Малайзия может конкретно извлечь выгоду из движения AI с открытым исходным кодом:

  • Обновления политики: Существующие стратегии должны быть рассмотрены и обновлены, чтобы отражать текущую среду AI, с конкретным акцентом на возможностях и преимуществах LLM с открытым исходным кодом. Это включает в себя упрощение правил использования данных (при сохранении надлежащих мер защиты конфиденциальности), предоставление финансирования и стимулов для исследований и разработок AI с открытым исходным кодом и содействие внедрению решений AI с открытым исходным кодом во всем государственном секторе.

  • Инвестиции в развитие талантов: Создание квалифицированной рабочей силы имеет решающее значение. Малайзии необходимо инвестировать в образовательные программы и учебные инициативы, ориентированные на AI, машинное обучение и обработку естественного языка. Эти программы должны подчеркивать инструменты и технологии с открытым исходным кодом, гарантируя, что выпускники будут хорошо подготовлены для внесения вклада в местную экосистему AI. Стипендии, исследовательские субсидии и отраслевые партнерства могут еще больше стимулировать студентов к построению карьеры в AI.

  • Университетские исследования: Местные университеты должны быть в авангарде исследований и разработок AI. Правительство может предоставить финансирование для создания исследовательских центров AI в университетах, ориентируясь на такие области, как настройка LLM, культурная адаптация и разработка новых инструментов AI с открытым исходным кодом, адаптированных к конкретным потребностям Малайзии. Создание платформ сотрудничества между университетами и промышленностью может ускорить передачу знаний и технологий.

  • Поддержка стартапов и МСП: AI с открытым исходным кодом предлагает стартапам и МСП значительную возможность для инноваций и конкуренции. Малайзия должна оказывать целевую поддержку этим предприятиям, включая доступ к финансированию, наставничеству и технической экспертизе. Эта поддержка может включать гранты на разработку продуктов и услуг на основе AI, инкубаторы и акселераторы, ориентированные на AI, и программы, которые связывают стартапы с потенциальными клиентами и инвесторами.

  • Структура управления данными: Создание надежной структуры управления данными имеет важное значение для обеспечения ответственного и этичного использования AI. Эта структура должна решать такие вопросы, как конфиденциальность данных, безопасность и предвзятость, и должна соответствовать передовой международной практике. Она также должна способствовать обмену данными в экосистеме AI, защищая конфиденциальную информацию. Это может быть достигнуто за счет создания национального хранилища данных и установления четких правил доступа и использования данных.

  • Партнерство государственного и частного секторов: Сотрудничество между государственным и частным секторами имеет решающее значение для стимулирования инноваций в области AI. Правительство может сотрудничать с частными компаниями для разработки и развертывания решений AI в таких областях, как здравоохранение, образование и транспорт. Эти партнерства могут использовать опыт и ресурсы обоих секторов, приводя к более эффективным и результативным результатам.

  • Национальная инфраструктура AI: Инвестиции в национальную инфраструктуру AI, включая высокопроизводительные вычислительные ресурсы и средства хранения данных, необходимы для поддержки исследований и разработок AI. Эта инфраструктура должна быть доступна исследователям, стартапам и предприятиям по всей стране, предоставляя им инструменты, необходимые для инноваций и конкуренции.

  • Культурная адаптация LLM: Малайзия должна инвестировать в проекты, направленные на адаптацию LLM с открытым исходным кодом, чтобы они отражали уникальный культурный и лингвистический ландшафт страны. Это включает в себя разработку моделей, которые свободно владеют Bahasa Malaysia и другими местными языками, и которые чувствительны к разнообразным культурам и традициям Малайзии. Это требует междисциплинарного подхода с участием лингвистов, экспертов по культуре и инженеров AI.

  • Соображения кибербезопасности: Поскольку AI все больше интегрируется в критически важную инфраструктуру, кибербезопасность должна быть главным приоритетом. Малайзии необходимо инвестировать в исследования и разработки решений по кибербезопасности, специфичных для AI, и установить четкие правила для защиты систем AI. Это включает в себя разработку надежных механизмов для обнаружения и смягчения угроз, связанных с AI.

*Содействие этическому AI: Обеспечение того, чтобы AI разрабатывался и использовался этичным и ответственным образом, имеет важное значение. Малайзия должна создать национальную структуру этики AI, в которой изложены принципы и ценности, которые должны направлять разработку и развертывание AI. Эта структура должна решать такие вопросы, как справедливость, прозрачность и подотчетность.

Предпринимая эти упреждающие шаги, Малайзия может использовать возможности AI с открытым исходным кодом для стимулирования экономического роста, улучшения государственных услуг и решения некоторых из наиболее острых проблем страны. Окно возможностей открыто, и Малайзия должна действовать решительно, чтобы воспользоваться им. Приверженность развитию сильной, инклюзивной и этичной экосистемы AI будет иметь решающее значение для реализации всего потенциала этой преобразующей технологии. В центре внимания всегда должны быть расширение прав и возможностей, инновации и долгосрочное устойчивое развитие.