DeepSeek: Nieuwe Koers in AI-Redeneren te Midden van Hoge Verwachtingen
DeepSeek onthult een nieuwe techniek voor AI-redeneren, die Generative Reward Modeling (GRM) combineert met zelf-principiële kritiekafstemming. Deze aanpak, ontwikkeld met Tsinghua University, belooft de nauwkeurigheid en efficiëntie van LLM's te verbeteren, te midden van speculaties over het aanstaande DeepSeek-R2 model. DeepSeek overweegt de GRM-modellen open-source te maken.