Tag: Fine-Tuning

Ефектът Deepseek-R1: Катализатор за разсъждения

Анализът подчертава ролята на Deepseek-R1 в ускоряването на разсъждаващите езикови модели чрез качество на данните, RL и иновативни стратегии за обучение.

Ефектът Deepseek-R1: Катализатор за разсъждения

Персонализиран AI: Фина настройка с RFT

OpenAI позволява фина настройка на o4-mini с RFT, за AI, адаптиран към нуждите на вашата фирма.

Персонализиран AI: Фина настройка с RFT

Разгадаване на дестилацията на знания

Как моделите на изкуствен интелект се учат един от друг чрез дестилация на знания, подобрявайки ефективността и достъпността на AI системите.

Разгадаване на дестилацията на знания

Нов модел на Nvidia надминава DeepSeek-R1

Новият open-source модел на Nvidia превъзхожда DeepSeek-R1, благодарение на 140 000 часа обучение на H100. Nvidia разкри детайли за обучението и архитектурата, показващи как е постигната по-висока производителност.

Нов модел на Nvidia надминава DeepSeek-R1

Малък модел на Microsoft краде шоуто

Малките модели на Microsoft впечатляват с разсъждения, обучени на малък набор данни. Phi-4 надминава DeepSeek-R1 в математически разсъждения, демонстрирайки силата на по-малките модели.

Малък модел на Microsoft краде шоуто

LlamaCon на Meta: Поглед в LLM

LlamaCon на Meta беше важен форум за LLM. Не представи нови модели, но разгледа бъдещето на технологията, мултимодалността на Llama 4 и отвореността на API. Дискусиите обхванаха теми като по-малки модели, етика и въздействие върху работата.

LlamaCon на Meta: Поглед в LLM

DeepSeek: Преход към AI за бизнеса

DeepSeek променя AI с достъпни модели, като намалява разходите и ускорява възприемането от фирмите, отваряйки врати за иновации и конкуренция.

DeepSeek: Преход към AI за бизнеса

Phi-4-Reasoning-Plus на Microsoft: Компактна сила

Microsoft представи Phi-4-reasoning-plus, езиков модел с отворен код, предназначен за задачи, изискващи задълбочено и структурирано разсъждение. Моделът надгражда Phi-4, интегрирайки контролирано обучение и обучение с подсилване. Това води до значителен скок в производителността.

Phi-4-Reasoning-Plus на Microsoft: Компактна сила

Подобряване на инструменти с Amazon Nova

Персонализиране на Amazon Nova модели за по-добра употреба на инструменти чрез Amazon Bedrock, повишавайки точността и ефективността на AI решенията.

Подобряване на инструменти с Amazon Nova

GPT-4.1 на OpenAI: Крачка назад?

Новият GPT-4.1 на OpenAI, рекламиран като по-добър в следването на инструкции, може да е по-малко надежден от своите предшественици. Независими оценки показват потенциални проблеми с подравняването и повдигат въпроси за етичните компромиси в развитието на AI.

GPT-4.1 на OpenAI: Крачка назад?