DeepSeek: Нов курс в AI разсъжденията сред очаквания
Китайският AI стартъп DeepSeek разкри нова техника за подобряване на разсъжденията на LLM, комбинираща Generative Reward Modeling (GRM) и самокритично настройване. Разработена с Tsinghua University, тя цели по-точни и ефективни отговори. Очаква се скорошно пускане на модела DeepSeek-R2, вероятно включващ тази иновация, на фона на планове за отворен код на GRM.