Microsoft’un Phi-4 Muhakeme modeli, ileri düzeyde akıl yürütme yeteneğine sahip, kompakt, açık ağırlıklı (MIT lisanslı), hızlı ve verimli SLM’ler sunar.
Microsoft, OpenAI’nin ayrıcalıklı bir ortağı ve AI modellerini Azure AI Foundry’ye entegre etmek için çoğu oyuncuyla birlikte çalışırken, kendi teknolojik yollarını izlemekten çekinmiyor. Buna, Trit tabanlı ilgi çekici BitNet b1.58 modeli, kendi açık kaynaklı SLM’leri ve hatta gizli tutulan sınır modelleri (Project MAI-1) gibi sinir ağlarının özündeki yenilikler üzerinde çalışmak da dahildir.
Küçük AI modelleri (SLM’ler) serisi Phi-3‘ü piyasaya sürdükten bir yıl ve çok modlu bir SLM (Phi-4-Multimodal) ve küçük bir model (Phi-4-mini) ile 4. nesli tanıttıktan iki ay sonra Microsoft, en yeni nesil SLM’sinin üç yeni çeşidini duyurdu: Phi-4-reasoning, Phi-4-reasoning-plus ve Phi-4-mini-reasoning.
30 Nisan 2025’te yayınlanan bu "akıl yürütme entegreli" sürümler, karmaşık akıl yürütme gerektirirken düşük gecikmeyi koruması gereken geliştiriciler için kompakt modellerin açık ağırlık teklifini genişletiyor.
Microsoft mühendislerinin SLM’lerini "akıl yürütme" yapma yaklaşımının özünde: OpenAI’nin akıl yürütme zincirleri o3-mini’den ince taneli denetim (SFT) kullanmak ve "artı" sürümü için pekiştirmeli öğrenmeden (RL) yararlanmak yer alıyor. Microsoft, "Damıtma, pekiştirmeli öğrenme ve yüksek kaliteli veriler yoluyla bu modeller boyut ve performansı uzlaştırıyor" diye açıklıyor.
Küçük Ama Yetenekli
Piyasadaki çeşitli önde gelen kıyaslama testlerindeki sonuçlar, rekabeti soldurmaya yetiyor: tipik olarak yalnızca 14 milyar parametre ile Phi-4-reasoning, AIME 2025, MMLU-Pro veya HumanEval-Plus serisinde DeepSeek-R1-Distill-Llama-70B’den (70 milyar parametre) daha iyi performans gösteriyor ve eksiksiz DeepSeek-R1 modeline (671 milyar parametre) yaklaşıyor! Aynı 14 milyar parametre üzerinde hizalanan ancak 1,5 kat daha fazla token ile eğitilen Phi-4-reasoning-plus çeşidi, OmniMath’ta neredeyse OpenAI’nin o3-mini puanlarıyla eşleşiyor! Bilgi için Phi-4-reasoning, Phi-4-reasoning-plus sürümü için 256.000 token’a genişletilen klasik 128.000 token bağlam penceresinden yararlanıyor.
Gömülü sistemler için tasarlanan Phi-4-mini-reasoning 3,8 milyar parametre, DeepSeek-R1 tarafından oluşturulan bir milyon matematiksel problemden oluşan sentetik bir set sergiliyor ve Math-500’de o1-mini performansı elde ederken 7 ila 8 milyar parametreye sahip çeşitli modelleri geride bırakıyor. Ultra küçük boyutuyla bu model, mobil cihazlar da dahil olmak üzere yerel yürütme ve neredeyse anında yanıt ihtiyacını karşılamak için idealdir. Özellikle eğitim amaçlı kullanımlara ve yerel sohbet robotlarına uygundur.
Çeşitli Kullanımlar İçin Açık Modeller
Dağıtım tarafında, CISO’lar bu modelleri zaten Copilot+ PC’ler için optimize edilmiş bulacaklar: NPU çeşidi "Phi Silica" belleğe önceden yüklenmiş ve enerji verimli bir şekilde iş uygulamalarıyla birlikte yaşamayı garanti ederek neredeyse anında yanıt süresi sağlıyor. Windows API’leri, çevrimdışı üretimi Outlook’a veya dahili araçlara entegre etmeye izin veriyor.
Güvenlik açısından Microsoft, sorumluluk ilkeleriyle uyumlu bir boru hattı olduğunu iddia ediyor - hesap verebilirlik, adalet, güvenilirlik, güvenlik ve kapsayıcılık. Modeller, genel ve dahili "yardımseverlik/zararsızlık" odaklı setlerden SFT, Doğrudan Tercih Optimizasyonu ve RLHF’yi birleştiren eğitim sonrası işlemden geçiyor. Microsoft ayrıca, artık sınırlamaları ve azaltma önlemlerini ayrıntılarıyla anlatan modellerinin "Kartlarını" da yayınlıyor.
Azure AI Foundry, Hugging Face ve GitHub Models’de şu anda mevcut olan üç model, çok izinli MIT lisansı altında yayınlanarak yerel çıkarımın yanı sıra karma bulut dağıtımlarının yolunu açıyor. Güvenlik ve mimari ekipleri için bu yeni nesil SLM’ler, daha düşük bir TCO, yerel olarak olduğu kadar Edge’de de yürütme ve artırılmış veri kontrolü ile devasa LLM’lere güvenilir bir alternatif sunuyor. Bu modeller, SLM’lerin bir yılda kaydettiği inanılmaz ilerlemenin ve daha ucuz ve daha enerji ve kaynak tasarrufu sağlayan bir AI arayışındaki bir evrende inanılmaz potansiyellerinin kanıtıdır.
Phi-4’ün Akıl Yürütme Yeteneklerine Daha Derin Bir Bakış
Phi-4 model ailesinin gelişi, küçük dil modellerinin (SLM’ler) geliştirilmesinde önemli bir adımı temsil ediyor. Bu modelleri farklı kılan şey, yenilikçi eğitim teknikleri ve yüksek kaliteli verilere odaklanarak elde edilen gelişmiş akıl yürütme yetenekleridir. Microsoft’un açık kaynak ilkelerine olan bağlılığı, bu güçlü araçlara erişimi daha da demokratikleştirerek geliştiricilerin gelişmiş AI yeteneklerini çok çeşitli uygulamalara entegre etmelerini sağlıyor.
Mimarinin Anlaşılması
Phi-4 modelleri, doğal dil işleme için kanıtlanmış bir çerçeve olan bir dönüştürücü mimarisi üzerine inşa edilmiştir. Ancak Microsoft, modelleri akıl yürütme görevleri için optimize etmek için çeşitli önemli yenilikler uygulamıştır.
- İnce Taneli Denetim (SFT): Modeller, OpenAI’nin o3-mini modeli tarafından oluşturulan ayrıntılı akıl yürütme zincirlerinden öğrenmeyi içeren ince taneli denetim (SFT) adı verilen bir teknik kullanılarak eğitilir. Bu, Phi-4 modellerinin karmaşık akıl yürütme süreçlerinde yer alan adımları öğrenmesini sağlar.
- Pekiştirmeli Öğrenme (RL): Phi-4 modelinin "artı" çeşidi olan Phi-4-reasoning-plus, akıl yürütme yeteneklerini daha da geliştirmek için pekiştirmeli öğrenmeyi (RL) kullanır. RL, bu durumda akıl yürütmesinin doğruluğuna ve verimliliğine dayanan bir ödül sinyalini en üst düzeye çıkarmak için modeli eğitmeyi içerir.
- Damıtma: Damıtma, daha büyük, daha karmaşık modellerden bilgiyi daha küçük Phi-4 modellerine aktarmak için kullanılır. Bu, SLM’lerin kompakt boyutlarını ve verimliliklerini korurken çok daha büyük modellere kıyasla performans düzeyleri elde etmelerini sağlar.
Performansın Kıyaslanması
Phi-4 modelleri, bazı durumlarda daha büyük modelleri geride bırakarak çeşitli akıl yürütme kıyaslama testlerinde etkileyici bir performans sergilemiştir. Örneğin, yalnızca 14 milyar parametreye sahip olan Phi-4-reasoning, AIME 2025, MMLU-Pro ve HumanEval-Plus dahil olmak üzere çeşitli zorlu veri kümelerinde DeepSeek-R1-Distill-Llama-70B’den (70 milyar parametre) daha iyi performans gösterir. Bu, Phi-4’ün mimarisinin ve eğitim tekniklerinin verimliliğini ve etkinliğini vurgular.
1,5 kat daha fazla token ile eğitilen Phi-4-reasoning-plus çeşidi, OmniMath kıyaslama testinde OpenAI’nin o3-mini’sine yakın puanlar elde ederek karmaşık matematiksel akıl yürütme sorunlarını çözme yeteneğini gösterir.
Uygulamalar ve Kullanım Durumları
Phi-4 modelleri, gelişmiş akıl yürütme yetenekleri gerektiren çeşitli uygulamalar için çok uygundur.
- Eğitim Araçları: Küçük boyutu ve yüksek performansı ile Phi-4-mini-reasoning modeli, eğitim uygulamaları için idealdir. Öğrencilere kişiselleştirilmiş geri bildirim ve destek sağlayan etkileşimli öğrenme araçları oluşturmak için kullanılabilir.
- Yerel Sohbet Robotları: Phi-4 modelleri, kullanıcılara bilgiye ve desteğe anında erişim sağlayan yerel sohbet robotları oluşturmak için kullanılabilir. Küçük boyutları, mobil cihazlara ve diğer kaynak kısıtlı ortamlara dağıtılmalarını sağlar.
- Copilot+ PC’ler: Phi-4 modelleri, kullanıcılara sorunsuz bir AI deneyimi sağlayan Copilot+ PC’ler için optimize edilmiştir. "Phi Silica" çeşidi belleğe önceden yüklenmiştir ve neredeyse anında yanıt süreleri sağlar.
- Çevrimdışı Üretim: Windows API’leri, kullanıcıların internete bağlı olmadıklarında bile AI yeteneklerine erişmelerini sağlayarak çevrimdışı üretimi Outlook’a veya dahili araçlara entegre etmeye izin verir.
Güvenlik ve Sorumluluk
Microsoft, AI modellerini sorumlu ve etik bir şekilde geliştirmeye ve dağıtmaya kararlıdır. Phi-4 modelleri de bir istisna değildir.
- Sorumluluk İlkeleri: Microsoft’un AI geliştirme hattı, hesap verebilirlik, adalet, güvenilirlik, güvenlik ve kapsayıcılık içeren sorumluluk ilkeleriyle uyumludur.
- Eğitim Sonrası: Phi-4 modelleri, kamuya açık ve dahili "yardımseverlik/zararsızlık" odaklı veri kümelerinden SFT, Doğrudan Tercih Optimizasyonu ve RLHF kullanılarak eğitim sonrası işlemden geçirilir. Bu, modellerin güvenli ve güvenilir olmasını sağlamaya yardımcı olur.
- Model Kartları: Microsoft, artık sınırlamaları ve azaltma önlemlerini ayrıntılarıyla anlatan modelleri için "Kartlar" yayınlar. Bu, kullanıcılara şeffaflık sağlar ve modelleri nasıl kullanacakları konusunda bilinçli kararlar almalarını sağlar.
SLM’lerin Geleceği
Phi-4 modelleri, küçük dil modellerinin (SLM’ler) geliştirilmesinde önemli bir adımı temsil ediyor. Gelişmiş akıl yürütme yetenekleri, küçük boyutları ve verimlilikleriyle birleştiğinde, onları birçok uygulamada daha büyük dil modellerine (LLM’ler) cazip bir alternatif haline getiriyor.
SLM’ler gelişmeye devam ettikçe, AI ortamında giderek daha önemli bir rol oynamaları muhtemeldir. Kaynak kısıtlı cihazlarda çalışma ve hızlı, verimli performans sağlama yetenekleri, onları eğitim araçlarından yerel sohbet robotlarına ve uç bilişim cihazlarına kadar çok çeşitli uygulamalar için çok uygun hale getiriyor.
Microsoft’un açık kaynak ilkelerine ve sorumlu AI geliştirmeye olan bağlılığı, Phi-4 modellerini AI topluluğu için değerli bir kaynak olarak daha da konumlandırıyor. Microsoft, bu güçlü araçlara erişimi demokratikleştirerek geliştiricilerin toplumun bir bütün olarak faydalanabileceği yenilikçi ve etkili uygulamalar oluşturmalarını sağlıyor.
Teknik Yönlere Daha Yakından Bir Bakış
Phi-4 mimarisinin ve eğitiminin özelliklerine daha derinlemesine bakmak, bu SLM’lerin bu kadar etkileyici akıl yürütme yetenekleri elde etmesini sağlayan yenilikçi teknikleri ortaya koyuyor. Dikkatle seçilmiş veri kümeleri, gelişmiş eğitim algoritmaları ve verimliliğe odaklanmanın birleşimi, hem güçlü hem de pratik bir model ailesiyle sonuçlanmıştır.
Veri Seçimi ve Hazırlığı
Herhangi bir makine öğrenimi modelinin başarısı, üzerinde eğitildiği verilerin kalitesine ve alaka düzeyine bağlıdır. Microsoft, Phi-4 modellerini eğitmek için kullanılan veri kümelerini seçmeye ve hazırlamaya önemli çaba harcamıştır.
- OpenAI’nin o3-mini’sinden Akıl Yürütme Zincirleri: Modeller, karmaşık akıl yürütme süreçlerinde yer alan adımları öğrenmek için OpenAI’nin o3-mini modeli tarafından oluşturulan akıl yürütme zincirlerinden yararlanır. Bu zincirler, SLM’lerin takip etmesi için ayrıntılı bir yol haritası sağlayarak temel mantığı daha derinlemesine anlamalarını sağlar.
- Sentetik Matematiksel Problemler: Phi-4-mini-reasoning modeli, DeepSeek-R1 tarafından oluşturulan bir milyon matematiksel problemden oluşan sentetik bir veri kümesi üzerinde eğitilmiştir. Bu veri kümesi, modelin güçlü problem çözme becerileri geliştirmesini sağlayan çeşitli matematiksel zorluklar sağlar.
- Yardımseverlik/Zararsızlık Veri Kümeleri: Modeller, yardımseverliği ve zararsızlığı teşvik etmek için tasarlanmış veri kümeleri kullanılarak eğitim sonrası işlemden geçirilir. Bu, modellerin güvenli ve sorumlu çıktılar üretmesini sağlamaya yardımcı olur.
Eğitim Algoritmaları
Phi-4 modelleri, denetimli öğrenme, pekiştirmeli öğrenme ve damıtmanın bir kombinasyonu kullanılarak eğitilmiştir. Bu teknikler, modelleri akıl yürütme görevleri için optimize etmek ve hem doğru hem de verimli olmalarını sağlamak için birlikte çalışır.
- Denetimli İnce Ayar (SFT): SFT, modelleri OpenAI’nin o3-mini modeli tarafından oluşturulan akıl yürütme zincirleri üzerinde ince ayarlamak için kullanılır. Bu, modellerin karmaşık akıl yürütme süreçlerinin karakteristik özelliği olan belirli kalıpları ve ilişkileri öğrenmesini sağlar.
- Pekiştirmeli Öğrenme (RL): RL, Phi-4-reasoning-plus modelini, akıl yürütmesinin doğruluğuna ve verimliliğine dayalı bir ödül sinyalini en üst düzeye çıkarmak için eğitmek için kullanılır. Bu, modeli hem etkili hem de hesaplama açısından verimli olan problem çözme stratejileri geliştirmeye teşvik eder.
- Damıtma: Damıtma, daha büyük, daha karmaşık modellerden bilgiyi daha küçük Phi-4 modellerine aktarmak için kullanılır. Bu, SLM’lerin kompakt boyutlarını ve verimliliklerini korurken çok daha büyük modellere kıyasla performans düzeyleri elde etmelerini sağlar.
Verimlilik İçin Optimizasyon
Phi-4 modellerini geliştirmenin temel hedeflerinden biri, onları verimlilik için optimize etmekti. Bu, tasarımlarının ve eğitimlerinin çeşitli yönlerine yansımıştır.
- Kompakt Mimari: Phi-4 modelleri, gerekli parametre sayısını en aza indiren kompakt bir mimari ile tasarlanmıştır. Bu, modelleri çalıştırmanın hesaplama maliyetini azaltır ve onları kaynak kısıtlı cihazlarda dağıtıma uygun hale getirir.
- Niceleme: Niceleme, modellerin bellek ayak izini azaltmak ve çıkarım hızlarını iyileştirmek için kullanılır. Bu, modelin parametrelerini daha az bit kullanarak temsil etmeyi içerir ve bu da modeli çalıştırmanın hesaplama maliyetini önemli ölçüde azaltabilir.
- Donanım Hızlandırma: Phi-4 modelleri, CPU’lar, GPU’lar ve NPU’lar dahil olmak üzere çeşitli platformlarda donanım hızlandırma için optimize edilmiştir. Bu, çok çeşitli cihazlarda maksimum performans elde etmelerini sağlar.
AI’nin Geleceği İçin Etkileri
Phi-4 modelleri, AI’nin geliştirilmesinde önemli bir adımı temsil ediyor ve tasarlanmış oldukları belirli uygulamaların çok ötesine uzanan etkileri var. Nispeten küçük boyut ve hesaplama kaynaklarıyla yüksek performans elde etme yetenekleri, AI’nin çok çeşitli ortamlarda dağıtılması için yeni olanaklar sunuyor.
AI’nin Demokratikleştirilmesi
Phi-4 modelleri, güçlü AI yeteneklerinin devasa hesaplama kaynakları veya tescilli veri kümelerine erişim gerektirmeden elde edilebileceğinin bir kanıtıdır. Bu, AI’ye erişimi demokratikleştirerek geliştiricilerin ve araştırmacıların sınırlı kaynaklarla bile yenilikçi uygulamalar oluşturmalarını sağlıyor.
Uç Bilişim
Phi-4 modellerinin küçük boyutu ve verimliliği, onları uç bilişim uygulamaları için çok uygun hale getiriyor. Bu, AI’nin veri kaynağına daha yakın dağıtılmasını sağlayarak gecikmeyi azaltır ve yanıt verme hızını iyileştirir. Uç bilişim, üretimden sağlığa ve ulaşıma kadar çok çeşitli endüstrilerde devrim yaratma potansiyeline sahiptir.
Kişiselleştirilmiş AI
Phi-4 modelleri, bireysel kullanıcıların veya kuruluşların özel ihtiyaçlarını karşılamak için özelleştirilebilir ve uyarlanabilir. Bu, her kullanıcının benzersiz gereksinimlerine göre uyarlanmış kişiselleştirilmiş AI deneyimleri oluşturulmasını sağlar. Kişiselleştirilmiş AI, üretkenliği artırma, öğrenmeyi geliştirme ve genel refahı iyileştirme potansiyeline sahiptir.
Sürdürülebilir AI
Phi-4 modelleri, daha az enerji ve hesaplama kaynağı gerektiren daha büyük dil modellerine daha sürdürülebilir bir alternatiftir. Bu, AI’nin çevresel etkisini azaltmak ve sorumlu ve sürdürülebilir bir şekilde dağıtılabilmesini sağlamak için önemlidir.
Microsoft Phi-4-Reasoning modelleri, sürekli gelişen AI dünyasında sadece bir yineleme değil; onlar bir paradigma değişimidir. Zekanın sadece boyutun ve hesaplama gücünün bir işlevi olmadığını, akıllı tasarım, verilerin dikkatli bir şekilde seçimi ve yenilikçi eğitim teknikleriyle elde edilebileceğini gösteriyorlar. Bu modeller gelişmeye devam ederken, AI için yeni olanakların kilidini açmaya ve teknolojiyle etkileşim şeklimizi dönüştürmeye hazırlanıyorlar.