Microsofts Phi-4-Reasoning-Plus: Compacte Krachtpatser
Microsoft Research heeft Phi-4-reasoning-plus onthuld, een compact taalmodel voor geavanceerde redeneertaken. Het bouwt voort op Phi-4 en gebruikt supervised fine-tuning en reinforcement learning. Dit resulteert in betere prestaties op diverse benchmarks, waaronder wiskunde, wetenschap, codering en logica.