Тихият старт на A.X 4.0 на SK Telecom
SK Telecom пусна тихо своя голям езиков модел A.X 4.0, усъвършенстван с корейски езикови данни и базиран на Qwen 2.5. Предстои пускането на AOTX 4.1, конкурент на DeepSeek R1.
SK Telecom пусна тихо своя голям езиков модел A.X 4.0, усъвършенстван с корейски езикови данни и базиран на Qwen 2.5. Предстои пускането на AOTX 4.1, конкурент на DeepSeek R1.
DMind представи DMind-1, отворен голям езиков модел (LLM) за Web3. Базиран на Qwen3-32B, моделът постига SOTA производителност в девет Web3 категории и е изключително ефикасен.
Alibaba твърди, че ZEROSEARCH намалява разходите за обучение на AI с 90%, като симулира търсения без API calls. Целта е да се подобри качеството на документите и да се намалят високите разходи.
Шанхайски фонд твърди, че има пробив в AI обучението, който може да надмине DeepSeek 2.0, използвайки техника, наречена SASR, за стъпково адаптивно хибридно обучение.
Mistral AI представи Medium 3 – езиков модел, предназначен за предприятия. Балансира цена, производителност и гъвкавост, достъпен чрез Mistral и Amazon SageMaker.
Джоуи Конуей от NVIDIA разкрива Llama Nemotron Ultra и Parakeet, демонстрирайки ангажимента на компанията към AI технологията.
Phi-4 Reasoning Plus на Microsoft демонстрира мощта на обучението с подсилване (RL), постигайки забележителни резултати на бенчмарк тестове, надминавайки по-големи модели с по-малко ресурси.
Gemma на Google достигна 150 милиона сваляния, стимулирайки иновации в ИИ. Сравнение с Llama, лицензионни предизвикателства и мултимодални възможности.
Nemotron-Tool-N1 променя използването на инструменти в LLM чрез обучение с подсилване, преодолявайки ограниченията на традиционното фино настройване и подобрявайки способността за разсъждение.
Малайзия може да се възползва от AI революцията с отворен код от Китай, като обнови политиките си, инвестира в обучение и адаптира модели към местната култура.