DeepSeek-R1 dalam Paket 32B?
Tim Qwen Alibaba merilis QwQ, model yang menantang model lebih besar. Dengan 32 miliar parameter, QwQ diklaim unggul dalam matematika, pengkodean, dan pemanggilan fungsi. Reinforcement learning dengan verifikator akurasi dan server eksekusi kode adalah kunci performanya. Bagaimana performa QwQ dalam pengujian langsung?