Tag: Fine-Tuning

Тихият старт на A.X 4.0 на SK Telecom

SK Telecom пусна тихо своя голям езиков модел A.X 4.0, усъвършенстван с корейски езикови данни и базиран на Qwen 2.5. Предстои пускането на AOTX 4.1, конкурент на DeepSeek R1.

Тихият старт на A.X 4.0 на SK Telecom

DMind представи DMind-1: Open-Source LLM за Web3

DMind представи DMind-1, отворен голям езиков модел (LLM) за Web3. Базиран на Qwen3-32B, моделът постига SOTA производителност в девет Web3 категории и е изключително ефикасен.

DMind представи DMind-1: Open-Source LLM за Web3

Alibaba намалява разходите за AI с 90% със ZEROSEARCH

Alibaba твърди, че ZEROSEARCH намалява разходите за обучение на AI с 90%, като симулира търсения без API calls. Целта е да се подобри качеството на документите и да се намалят високите разходи.

Alibaba намалява разходите за AI с 90% със ZEROSEARCH

Пробив в AI: Goku предизвиква DeepSeek?

Шанхайски фонд твърди, че има пробив в AI обучението, който може да надмине DeepSeek 2.0, използвайки техника, наречена SASR, за стъпково адаптивно хибридно обучение.

Пробив в AI: Goku предизвиква DeepSeek?

Mistral Medium 3: AI за бизнеса

Mistral AI представи Medium 3 – езиков модел, предназначен за предприятия. Балансира цена, производителност и гъвкавост, достъпен чрез Mistral и Amazon SageMaker.

Mistral Medium 3: AI за бизнеса

Иновациите на NVIDIA: Llama Nemotron Ultra и Parakeet

Джоуи Конуей от NVIDIA разкрива Llama Nemotron Ultra и Parakeet, демонстрирайки ангажимента на компанията към AI технологията.

Иновациите на NVIDIA: Llama Nemotron Ultra и Parakeet

Триумфът на RL продължава с Phi-4 на Microsoft

Phi-4 Reasoning Plus на Microsoft демонстрира мощта на обучението с подсилване (RL), постигайки забележителни резултати на бенчмарк тестове, надминавайки по-големи модели с по-малко ресурси.

Триумфът на RL продължава с Phi-4 на Microsoft

Gemma AI: 150 милиона сваляния

Gemma на Google достигна 150 милиона сваляния, стимулирайки иновации в ИИ. Сравнение с Llama, лицензионни предизвикателства и мултимодални възможности.

Gemma AI: 150 милиона сваляния

Революция в LLM: Nemotron-Tool-N1 и RL

Nemotron-Tool-N1 променя използването на инструменти в LLM чрез обучение с подсилване, преодолявайки ограниченията на традиционното фино настройване и подобрявайки способността за разсъждение.

Революция в LLM: Nemotron-Tool-N1 и RL

Възможност за Малайзия: AI с отворен код от Китай

Малайзия може да се възползва от AI революцията с отворен код от Китай, като обнови политиките си, инвестира в обучение и адаптира модели към местната култура.

Възможност за Малайзия: AI с отворен код от Китай