Tag: Fine-Tuning

SK Telecom A.X 4.0: Тихий запуск

SK Telecom тихо представила A.X 4.0, большую языковую модель, разработанную с использованием корейского языка на основе open-source. Планируется выпуск модели AOTX 4.1 в мае.

SK Telecom A.X 4.0: Тихий запуск

DMind-1: Открытая LLM для Web3

DMind представила DMind-1, open-source LLM, разработанную для Web3. Модель достигла SOTA в 9 категориях, включая DeFi и NFT, с низкой стоимостью.

DMind-1: Открытая LLM для Web3

Alibaba: ZEROSEARCH снижает затраты на AI на 90%

Alibaba утверждает, что ZEROSEARCH снижает затраты на обучение AI на 90%, имитируя поисковые операции без API, улучшая качество документов и снижая затраты.

Alibaba: ZEROSEARCH снижает затраты на AI на 90%

Прорыв в AI от Shanghai Goku: Вызов DeepSeek 2.0?

Шанхайский фонд заявил о прорыве в обучении AI, бросающем вызов DeepSeek 2.0. Новая техника SASR претендует на превосходство над SFT и RL, используемыми OpenAI.

Прорыв в AI от Shanghai Goku: Вызов DeepSeek 2.0?

Mistral Medium 3: Решение для бизнеса на базе ИИ

Mistral AI представила Medium 3, языковую модель, разработанную для нужд предприятий. Она предлагает баланс между стоимостью, производительностью и возможностями развертывания, что делает её привлекательным выбором для бизнеса.

Mistral Medium 3: Решение для бизнеса на базе ИИ

Инновации NVIDIA: Llama Nemotron Ultra и Parakeet

Интервью с Джои Конвеем об Llama Nemotron Ultra и Parakeet TDT: открытый исходный код, высокая скорость, пропускная способность и экономичность.

Инновации NVIDIA: Llama Nemotron Ultra и Parakeet

Триумф RL: Phi-4 Reasoning Plus от Microsoft

Microsoft's Phi-4 Reasoning Plus демонстрирует мощь обучения с подкреплением (RL), превосходя модели большего размера в кодировании, математике и науке благодаря высококачественным данным и стратегической оптимизации.

Триумф RL: Phi-4 Reasoning Plus от Microsoft

Google Gemma: 150 млн загрузок

Модели Gemma от Google достигли 150 миллионов загрузок. Обзор роста, сравнение с Llama, лицензионные вопросы и потенциал.

Google Gemma: 150 млн загрузок

Революция в использовании инструментов LLM: Nemotron-Tool-N1

Nemotron-Tool-N1 использует обучение с подкреплением для улучшения LLM.

Революция в использовании инструментов LLM: Nemotron-Tool-N1

Возможности Малайзии: AI с открытым кодом

Малайзия может использовать AI с открытым кодом для экономического роста, улучшения услуг и решения проблем. Нужна политика, инвестиции в обучение, исследования и поддержка стартапов

Возможности Малайзии: AI с открытым кодом