تُظهر Phi-4 من Microsoft قدرات استدلالية متقدمة في نماذج لغوية صغيرة (SLMs) تتميز بأنها مضغوطة ومفتوحة المصدر (مرخصة بموجب MIT) وسريعة وفعالة.
على الرغم من كونها شريكًا متميزًا لـ OpenAI وتعمل مع معظم اللاعبين لدمج نماذج الذكاء الاصطناعي الخاصة بهم في Azure AI Foundry، إلا أن Microsoft لا تتردد في السعي وراء طرقها التكنولوجية الخاصة. يتضمن ذلك العمل على ابتكارات في صميم الشبكات العصبية، مثل نموذج BitNet b1.58 المثير للاهتمام القائم على Trit، ونماذج SLM مفتوحة المصدر الخاصة بها، وحتى النماذج الرائدة التي يتم الاحتفاظ بها سرًا (Project MAI-1).
بعد عام من تقديم مجموعتها من نماذج الذكاء الاصطناعي الصغيرة (SLMs) Phi-3 وشهرين بعد ظهور الجيل الرابع مع نموذج SLM متعدد الوسائط (Phi-4-Multimodal) ونموذج صغير (Phi-4-mini)، تعلن Microsoft عن ثلاثة متغيرات جديدة من أحدث جيل من نماذج SLM الخاصة بها: Phi-4-reasoning و Phi-4-reasoning-plus و Phi-4-mini-reasoning.
تم إصدار هذه الإصدارات “المتكاملة مع الاستدلال” في 30 أبريل 2025، وتوسع نطاق النماذج المدمجة مفتوحة المصدر للمطورين الذين يحتاجون إلى الحفاظ على زمن انتقال منخفض مع الحاجة إلى استدلال معقد.
في صميم نهج مهندسي Microsoft لجعل نماذج SLM الخاصة بها “تستدل”: الاعتماد على إشراف دقيق (SFT) من سلاسل الاستدلال o3-mini من OpenAI، والاستفادة من التعلم المعزز (RL) لإصدار “plus”. تشرح Microsoft: “من خلال التقطير والتعلم المعزز والبيانات عالية الجودة، توفق هذه النماذج بين الحجم والأداء”.
صغيرة لكنها موهوبة
النتائج على المعايير الرائدة المختلفة في السوق كافية لجعل المنافسة باهتة: عادةً مع 14 مليار معلمة فقط، يتفوق Phi-4-reasoning على DeepSeek-R1-Distill-Llama-70B (70 مليار معلمة) في AIME 2025 أو MMLU-Pro أو سلسلة HumanEval-Plus، ويقترب من نموذج DeepSeek-R1 الكامل (671 مليار معلمة)! يتطابق متغير Phi-4-reasoning-plus، المحاذي على نفس 14 مليار معلمة ولكنه مدرب بـ 1.5 مرة أكثر من الرموز، تقريبًا مع نتائج o3-mini من OpenAI في OmniMath! للعلم، يستفيد Phi-4-reasoning من نافذة سياق كلاسيكية تبلغ 128000 رمز تم توسيعها إلى 256000 رمز لإصدار Phi-4-reasoning-plus.
تم تصميم Phi-4-mini-reasoning للأنظمة المدمجة، ويعرض 3.8 مليار معلمة، ومجموعة تركيبية من مليون مسألة رياضية تم إنشاؤها بواسطة DeepSeek-R1، ويحقق أداءً مكافئًا لأداء o1-mini على Math-500 بينما يتجاوز العديد من النماذج التي تحتوي على 7 إلى 8 مليارات معلمة. بفضل حجمه الصغير للغاية، يعد هذا النموذج مثاليًا للتنفيذ المحلي، بما في ذلك على الأجهزة المحمولة، ولتلبية الحاجة إلى استجابات شبه فورية. إنه مناسب بشكل خاص للاستخدامات التعليمية وروبوتات المحادثة المحلية.
نماذج مفتوحة لاستخدامات متنوعة
على جانب النشر، سيجد مدراء أمن المعلومات أن هذه النماذج مُحسَّنة بالفعل لأجهزة الكمبيوتر الشخصية Copilot+: يتم تحميل متغير NPU “Phi Silica” مسبقًا في الذاكرة ويوفر وقت استجابة شبه فوري، مما يضمن التعايش الموفر للطاقة مع تطبيقات الأعمال. تسمح واجهات برمجة تطبيقات Windows بدمج التوليد دون اتصال بالإنترنت في Outlook أو الأدوات الداخلية.
من حيث الأمان، تدعي Microsoft وجود خط أنابيب يتماشى مع مبادئها في المسؤولية - المساءلة والعدالة والموثوقية والسلامة والشمول. تخضع النماذج لتدريب ما بعد التدريب يجمع بين SFT والتحسين المباشر للتفضيل و RLHF من مجموعات عامة وداخلية موجهة نحو “المساعدة / عدم الإضرار”. تنشر Microsoft أيضًا “بطاقات” نماذجها، والتي تفصل القيود المتبقية وتدابير التخفيف.
تتوفر النماذج الثلاثة الآن على Azure AI Foundry و Hugging Face و GitHub Models، ويتم نشرها بموجب ترخيص MIT شديد التساهل، مما يفتح الطريق للاستدلال المحلي بالإضافة إلى عمليات النشر السحابية الهجينة. بالنسبة لفرق الأمن والهندسة المعمارية، يوفر هذا الجيل الجديد من نماذج SLM بديلاً ذا مصداقية لنماذج LLM الضخمة، مع تقليل التكلفة الإجمالية للملكية والتنفيذ محليًا وكذلك على الحافة وزيادة التحكم في البيانات. هذه النماذج هي دليل على التقدم المذهل الذي أحرزته نماذج SLM في عام واحد وإمكاناتها المذهلة في عالم يبحث عن ذكاء اصطناعي أقل تكلفة وأكثر اقتصادا في استخدام الطاقة والموارد.
نظرة أكثر تعمقًا على قدرات الاستدلال في Phi-4
يمثل وصول عائلة نماذج Phi-4 خطوة مهمة إلى الأمام في تطوير النماذج اللغوية الصغيرة (SLMs). ما يميز هذه النماذج هو قدراتها الاستدلالية المحسنة، والتي تم تحقيقها من خلال تقنيات تدريب مبتكرة والتركيز على البيانات عالية الجودة. إن التزام Microsoft بمبادئ المصادر المفتوحة يزيد من إضفاء الطابع الديمقراطي على الوصول إلى هذه الأدوات القوية، مما يمكّن المطورين من دمج قدرات الذكاء الاصطناعي المتقدمة في مجموعة واسعة من التطبيقات.
فهم الهندسة المعمارية
تعتمد نماذج Phi-4 على هندسة المحولات، وهو إطار عمل مثبت لمعالجة اللغة الطبيعية. ومع ذلك، قامت Microsoft بتنفيذ العديد من الابتكارات الرئيسية لتحسين النماذج لمهام الاستدلال.
- الإشراف الدقيق (SFT): يتم تدريب النماذج باستخدام تقنية تسمى الإشراف الدقيق (SFT)، والتي تتضمن التعلم من سلاسل الاستدلال التفصيلية التي تم إنشاؤها بواسطة نموذج o3-mini من OpenAI. يتيح ذلك لنماذج Phi-4 تعلم الخطوات المتضمنة في عمليات الاستدلال المعقدة.
- التعلم المعزز (RL): يستخدم متغير “plus” من نموذج Phi-4، Phi-4-reasoning-plus، التعلم المعزز (RL) لزيادة تحسين قدراته الاستدلالية. يتضمن RL تدريب النموذج لزيادة إشارة المكافأة إلى أقصى حد، والتي تعتمد في هذه الحالة على دقة وكفاءة استدلاله.
- التقطير: يتم استخدام التقطير لنقل المعرفة من النماذج الأكبر والأكثر تعقيدًا إلى نماذج Phi-4 الأصغر. يتيح ذلك لنماذج SLM تحقيق مستويات أداء مماثلة للنماذج الأكبر حجمًا، مع الحفاظ على حجمها وكفاءتها.
قياس أداء الأداء
أظهرت نماذج Phi-4 أداءً مثيرًا للإعجاب في مجموعة متنوعة من معايير الاستدلال، وتجاوزت النماذج الأكبر حجمًا في بعض الحالات. على سبيل المثال، يتفوق Phi-4-reasoning، الذي يحتوي على 14 مليار معلمة فقط، على DeepSeek-R1-Distill-Llama-70B (70 مليار معلمة) في العديد من مجموعات البيانات الصعبة، بما في ذلك AIME 2025 و MMLU-Pro و HumanEval-Plus. هذا يسلط الضوء على كفاءة وفعالية بنية Phi-4 وتقنيات التدريب.
يحقق متغير Phi-4-reasoning-plus، الذي تم تدريبه بـ 1.5 مرة أكثر من الرموز، نتائج قريبة من o3-mini من OpenAI على معيار OmniMath، مما يدل على قدرته على معالجة مشاكل الاستدلال الرياضي المعقدة.
التطبيقات وحالات الاستخدام
تعتبر نماذج Phi-4 مناسبة تمامًا لمجموعة متنوعة من التطبيقات التي تتطلب قدرات استدلالية متقدمة.
- الأدوات التعليمية: يعتبر نموذج Phi-4-mini-reasoning، بحجمه الصغير وأدائه العالي، مثاليًا للتطبيقات التعليمية. يمكن استخدامه لإنشاء أدوات تعليمية تفاعلية توفر للطلاب ملاحظات ودعمًا مخصصًا.
- روبوتات المحادثة المحلية: يمكن استخدام نماذج Phi-4 لبناء روبوتات محادثة محلية تزود المستخدمين بوصول فوري إلى المعلومات والدعم. يسمح حجمها الصغير بنشرها على الأجهزة المحمولة والبيئات الأخرى ذات الموارد المحدودة.
- أجهزة الكمبيوتر Copilot+: تم تحسين نماذج Phi-4 لأجهزة الكمبيوتر Copilot+، مما يوفر للمستخدمين تجربة ذكاء اصطناعي سلسة. يتم تحميل متغير “Phi Silica” مسبقًا في الذاكرة ويوفر أوقات استجابة شبه فورية.
- التوليد دون اتصال بالإنترنت: تسمح واجهات برمجة تطبيقات Windows بدمج التوليد دون اتصال بالإنترنت في Outlook أو الأدوات الداخلية، مما يتيح للمستخدمين الوصول إلى قدرات الذكاء الاصطناعي حتى عندما لا يكونون متصلين بالإنترنت.
الأمن والمسؤولية
تلتزم Microsoft بتطوير ونشر نماذج الذكاء الاصطناعي بطريقة مسؤولة وأخلاقية. نماذج Phi-4 ليست استثناء.
- مبادئ المسؤولية: يتماشى خط أنابيب تطوير الذكاء الاصطناعي في Microsoft مع مبادئ المسؤولية الخاصة بها، والتي تشمل المساءلة والعدالة والموثوقية والسلامة والشمول.
- ما بعد التدريب: تخضع نماذج Phi-4 لتدريب ما بعد التدريب باستخدام SFT والتحسين المباشر للتفضيل و RLHF من مجموعات بيانات عامة وداخلية موجهة نحو “المساعدة / عدم الإضرار”. يساعد ذلك على ضمان أن النماذج آمنة وموثوقة.
- بطاقات النموذج: تنشر Microsoft “بطاقات” لنماذجها، والتي تفصل القيود المتبقية وتدابير التخفيف. يوفر ذلك للمستخدمين الشفافية ويسمح لهم باتخاذ قرارات مستنيرة بشأن كيفية استخدام النماذج.
مستقبل SLMs
تمثل نماذج Phi-4 خطوة مهمة إلى الأمام في تطوير النماذج اللغوية الصغيرة (SLMs). إن قدراتها الاستدلالية المحسنة، جنبًا إلى جنب مع حجمها الصغير وكفاءتها، تجعلها بديلاً مقنعًا للنماذج اللغوية الأكبر حجمًا (LLMs) في العديد من التطبيقات.
مع استمرار تحسن SLMs، فمن المحتمل أن تلعب دورًا متزايد الأهمية في مشهد الذكاء الاصطناعي. إن قدرتها على التشغيل على الأجهزة ذات الموارد المحدودة وتوفير أداء سريع وفعال تجعلها مناسبة تمامًا لمجموعة واسعة من التطبيقات، من الأدوات التعليمية إلى روبوتات المحادثة المحلية إلى أجهزة الحوسبة الحافة.
إن التزام Microsoft بمبادئ المصادر المفتوحة وتطوير الذكاء الاصطناعي المسؤول يزيد من مكانة نماذج Phi-4 كمورد قيم لمجتمع الذكاء الاصطناعي. من خلال إضفاء الطابع الديمقراطي على الوصول إلى هذه الأدوات القوية، تمكّن Microsoft المطورين من إنشاء تطبيقات مبتكرة ومؤثرة يمكن أن تفيد المجتمع ككل.
نظرة فاحصة على الجوانب الفنية
إن التعمق أكثر في تفاصيل بنية Phi-4 والتدريب يكشف عن التقنيات المبتكرة التي تمكن SLMs هذه من تحقيق مثل هذه القدرات الاستدلالية الرائعة. إن الجمع بين مجموعات البيانات المنسقة بعناية وخوارزميات التدريب المتطورة والتركيز على الكفاءة قد أسفر عن عائلة من النماذج القوية والعملية على حد سواء.
تنسيق البيانات وإعدادها
يعتمد نجاح أي نموذج للتعلم الآلي على جودة وأهمية البيانات التي يتم تدريبه عليها. استثمرت Microsoft جهدًا كبيرًا في تنسيق وإعداد مجموعات البيانات المستخدمة لتدريب نماذج Phi-4.
- سلاسل الاستدلال من o3-mini من OpenAI: تستفيد النماذج من سلاسل الاستدلال التي تم إنشاؤها بواسطة نموذج o3-mini من OpenAI لتعلم الخطوات المتضمنة في عمليات الاستدلال المعقدة. توفر هذه السلاسل خريطة طريق مفصلة لـ SLMs لمتابعتها، مما يمكنها من تطوير فهم أعمق للمنطق الأساسي.
- المسائل الرياضية التركيبية: يتم تدريب نموذج Phi-4-mini-reasoning على مجموعة بيانات تركيبية تتكون من مليون مسألة رياضية تم إنشاؤها بواسطة DeepSeek-R1. توفر مجموعة البيانات هذه مجموعة متنوعة من التحديات الرياضية، مما يسمح للنموذج بتطوير مهارات قوية في حل المشكلات.
- مجموعات بيانات المساعدة / عدم الإضرار: تخضع النماذج لتدريب ما بعد التدريب باستخدام مجموعات بيانات مصممة لتعزيز المساعدة وعدم الإضرار. يساعد ذلك على ضمان أن النماذج تولد مخرجات آمنة ومسؤولة.
خوارزميات التدريب
يتم تدريب نماذج Phi-4 باستخدام مزيج من التعلم الخاضع للإشراف والتعلم المعزز والتقطير. تعمل هذه التقنيات معًا لتحسين النماذج لمهام الاستدلال والتأكد من أنها دقيقة وفعالة.
- الضبط الدقيق الخاضع للإشراف (SFT): يتم استخدام SFT لضبط النماذج بدقة على سلاسل الاستدلال التي تم إنشاؤها بواسطة نموذج o3-mini من OpenAI. يتيح ذلك للنماذج تعلم الأنماط والعلاقات المحددة التي تميز عمليات الاستدلال المعقدة.
- التعلم المعزز (RL): يتم استخدام RL لتدريب نموذج Phi-4-reasoning-plus لزيادة إشارة المكافأة إلى أقصى حد بناءً على دقة وكفاءة استدلاله. يشجع هذا النموذج على تطوير استراتيجيات لحل المشكلات تكون فعالة وفعالة من الناحية الحسابية.
- التقطير: يتم استخدام التقطير لنقل المعرفة من النماذج الأكبر والأكثر تعقيدًا إلى نماذج Phi-4 الأصغر. يتيح ذلك لـ SLMs تحقيق مستويات أداء مماثلة للنماذج الأكبر حجمًا، مع الحفاظ على حجمها وكفاءتها.
التحسين من أجل الكفاءة
كان أحد الأهداف الرئيسية في تطوير نماذج Phi-4 هو تحسينها من أجل الكفاءة. وينعكس ذلك في العديد من جوانب تصميمها وتدريبها.
- هندسة معمارية مضغوطة: تم تصميم نماذج Phi-4 بهندسة معمارية مضغوطة تقلل من عدد المعلمات المطلوبة. هذا يقلل من التكلفة الحسابية لتشغيل النماذج ويجعلها مناسبة تمامًا للنشر على الأجهزة ذات الموارد المحدودة.
- التكميم: يتم استخدام التكميم لتقليل حجم الذاكرة للنماذج وتحسين سرعة الاستدلال الخاصة بها. يتضمن ذلك تمثيل معلمات النموذج باستخدام عدد أقل من البتات، مما قد يقلل بشكل كبير من التكلفة الحسابية لتشغيل النموذج.
- تسريع الأجهزة: تم تحسين نماذج Phi-4 لتسريع الأجهزة على مجموعة متنوعة من الأنظمة الأساسية، بما في ذلك وحدات المعالجة المركزية ووحدات معالجة الرسومات ووحدات NPU. يتيح لهم ذلك تحقيق أقصى أداء على مجموعة واسعة من الأجهزة.
الآثار المترتبة على مستقبل الذكاء الاصطناعي
تمثل نماذج Phi-4 خطوة مهمة إلى الأمام في تطوير الذكاء الاصطناعي، مع آثار تمتد إلى ما هو أبعد من التطبيقات المحددة التي صممت من أجلها. إن قدرتها على تحقيق أداء عالٍ بحجم صغير نسبيًا وموارد حسابية تفتح إمكانيات جديدة لنشر الذكاء الاصطناعي في مجموعة واسعة من الإعدادات.
إضفاء الطابع الديمقراطي على الذكاء الاصطناعي
تعد نماذج Phi-4 شهادة على حقيقة أن قدرات الذكاء الاصطناعي القوية يمكن تحقيقها دون الحاجة إلى موارد حسابية ضخمة أو الوصول إلى مجموعات بيانات خاصة. هذا يضفي الطابع الديمقراطي على الوصول إلى الذكاء الاصطناعي، وتمكين المطورين والباحثين من إنشاء تطبيقات مبتكرة حتى مع الموارد المحدودة.
الحوسبة الحافة
إن الحجم الصغير وكفاءة نماذج Phi-4 تجعلها مناسبة تمامًا لتطبيقات الحوسبة الحافة. يتيح ذلك نشر الذكاء الاصطناعي بالقرب من مصدر البيانات، مما يقلل من زمن الانتقال ويحسن الاستجابة. تتمتع الحوسبة الحافة بالقدرة على إحداث ثورة في مجموعة واسعة من الصناعات، من التصنيع إلى الرعاية الصحية إلى النقل.
الذكاء الاصطناعي الشخصي
يمكن تخصيص نماذج Phi-4 وتكييفها لتلبية الاحتياجات المحددة للمستخدمين أو المنظمات الفردية. يتيح ذلك إنشاء تجارب ذكاء اصطناعي شخصية مصممة خصيصًا للمتطلبات الفريدة لكل مستخدم. يتمتع الذكاء الاصطناعي الشخصي بالقدرة على تحسين الإنتاجية وتعزيز التعلم وتحسين الرفاهية العامة.
الذكاء الاصطناعي المستدام
تعد نماذج Phi-4 بديلاً أكثر استدامة للنماذج اللغوية الأكبر حجمًا، وتتطلب طاقة وموارد حسابية أقل. هذا مهم للحد من التأثير البيئي للذكاء الاصطناعي والتأكد من إمكانية نشره بطريقة مسؤولة ومستدامة.
نماذج Microsoft Phi-4-Reasoning ليست مجرد تكرار آخر في عالم الذكاء الاصطناعي المتطور باستمرار؛ إنها تحول نموذجي. إنها تثبت أن الذكاء ليس مجرد وظيفة للحجم والقوة الحسابية، ولكن يمكن تحقيقه من خلال التصميم الذكي والتنسيق الدقيق للبيانات وتقنيات التدريب المبتكرة. مع استمرار تطور هذه النماذج، فإنها على وشك إطلاق إمكانيات جديدة للذكاء الاصطناعي وتحويل الطريقة التي نتفاعل بها مع التكنولوجيا.