Microsoft Phi: قفزة نماذج اللغة الصغيرة في الذكاء الاصطناعي

بعد عام من تقديم مجموعتها من نماذج اللغة الصغيرة (SLMs) مع إصدار Phi-3 على Azure AI Foundry، كشفت Microsoft عن نماذج الجيل التالي: Phi-4-reasoning، و Phi-4-reasoning-plus، و Phi-4-mini-reasoning. تمثل هذه الابتكارات نقطة تحول بالنسبة لنماذج اللغة الصغيرة (SLMs)، وتعيد تعريف ما يمكن تحقيقه من خلال الذكاء الاصطناعي المدمج والفعال.

فجر نماذج Phi-Reasoning

تم تصميم نماذج Phi-reasoning الجديدة لتسخير قياس وقت الاستدلال للمهام المعقدة التي تتطلب تفكيكًا متعدد الخطوات وانعكاسًا داخليًا. تُظهر هذه النماذج قدرات استثنائية في الاستدلال الرياضي، مما يجعلها الأساس للتطبيقات الشبيهة بالوكلاء التي تتعامل مع المهام المعقدة والمتعددة الأوجه. تاريخيًا، كانت هذه القدرات حصرية للنماذج الأكبر حجمًا بشكل ملحوظ. تقدم نماذج Phi-reasoning فئة جديدة من نماذج اللغة الصغيرة (SLMs) التي تستفيد من التقطير والتعلم المعزز والبيانات عالية الجودة لتحقيق التوازن بين الحجم والأداء. حجمها الصغير يجعلها مناسبة للبيئات منخفضة الكمون، بينما تتنافس قدراتها الاستدلالية القوية مع تلك الخاصة بالنماذج الأكبر حجمًا. يسمح هذا المزيج من الكفاءة والقدرة حتى للأجهزة ذات الموارد المحدودة بتنفيذ مهام الاستدلال المعقدة بفعالية.

Phi-4-Reasoning و Phi-4-Reasoning-Plus: نظرة أكثر تعمقًا

Phi-4-Reasoning: نموذج الاستدلال مفتوح الوزن

يبرز Phi-4-reasoning كنموذج استدلال مفتوح الوزن مع 14 مليار معلمة. وهو مصمم للتنافس مع النماذج الأكبر حجمًا بشكل ملحوظ في مهام الاستدلال المعقدة. تم تدريب هذا النموذج من خلال الضبط الدقيق الخاضع للإشراف لـ Phi-4 على أمثلة استدلال مُنسقة بدقة مشتقة من o3-mini الخاص بـ OpenAI. يولد Phi-4-reasoning سلاسل استدلال مفصلة، ويستخدم بشكل فعال وقت حساب إضافي أثناء الاستدلال. يؤكد هذا الإنجاز على كيف أن تنسيق البيانات الدقيق ومجموعات البيانات الاصطناعية عالية الجودة تمكن النماذج الأصغر من منافسة نظيراتها الأكبر.

Phi-4-Reasoning-Plus: تعزيز الاستدلال بالتعلم المعزز

بالاعتماد على قدرات Phi-4-reasoning، يخضع Phi-4-reasoning-plus لمزيد من التدريب باستخدام التعلم المعزز لاستغلال وقت الحساب الإضافي أثناء الاستدلال. يعالج 1.5 مرة من الرموز المميزة أكثر من Phi-4-reasoning، مما يؤدي إلى تحسين الدقة.

معايير الأداء

على الرغم من حجمها الأصغر بشكل ملحوظ، فإن كلاً من Phi-4-reasoning و Phi-4-reasoning-plus يتفوقان على o1-mini الخاص بـ OpenAI و DeepSeek-R1-Distill-Llama-70B عبر معايير مختلفة، بما في ذلك الاستدلال الرياضي والاستفسارات العلمية على مستوى الدكتوراه. والمثير للإعجاب أنهم يتجاوزون حتى نموذج DeepSeek-R1 الكامل (مع 671 مليار معلمة) في اختبار AIME 2025، والذي يعمل بمثابة المسابقة المؤهلة لأولمبياد الرياضيات الأمريكي لعام 2025. كلا النموذجين متاحان بسهولة على Azure AI Foundry و Hugging Face.

Phi-4-Mini-Reasoning: قوة مدمجة للبيئات المحدودة

تم تصميم Phi-4-mini-reasoning خصيصًا لتلبية الطلب على نموذج استدلال مدمج. تم تحسين نموذج اللغة القائم على المحولات للاستدلال الرياضي ويوفر قدرات عالية الجودة لحل المشكلات خطوة بخطوة في البيئات التي تكون فيها قوة الحوسبة أو الكمون محدودة. بفضل الضبط الدقيق باستخدام البيانات الاصطناعية التي تم إنشاؤها بواسطة نموذج Deepseek-R1، فإنه يوازن بشكل فعال بين الكفاءة وقدرات الاستدلال المتقدمة. وهذا يجعلها مثالية للتطبيقات التعليمية وأنظمة التدريس المضمنة وعمليات النشر خفيفة الوزن على الحافة أو الأنظمة المحمولة. تم تدريب النموذج على أكثر من مليون مشكلة رياضية متنوعة، تتراوح في صعوبتها من المدرسة الإعدادية إلى مستوى الدكتوراه، مما يضمن تنوعه وفعاليته عبر مجموعة واسعة من السياقات التعليمية.

Phi في العمل: آفاق متوسعة

لقد دفعت تطورات Phi على مدار العام الماضي باستمرار حدود الجودة نسبة إلى الحجم، مع توسع العائلة لتشمل ميزات جديدة مصممة خصيصًا لتلبية الاحتياجات المتنوعة. يمكن تشغيل هذه النماذج محليًا على كل من وحدات المعالجة المركزية ووحدات معالجة الرسومات عبر مجموعة متنوعة من أجهزة Windows 11، مما يوفر المرونة وإمكانية الوصول للمستخدمين بتكوينات الأجهزة المختلفة.

التكامل مع أجهزة الكمبيوتر Copilot+: حقبة جديدة من الحوسبة المدعومة بالذكاء الاصطناعي

تشكل نماذج Phi جزءًا لا يتجزأ من أجهزة الكمبيوتر Copilot+، حيث تستفيد من متغير Phi Silica المحسن NPU. تم تصميم هذا الإصدار عالي الكفاءة من Phi، الذي تديره نظام التشغيل، ليتم تحميله مسبقًا في الذاكرة، مما يوفر أوقات استجابة سريعة وإنتاجية رمزية موفرة للطاقة. وهذا يجعله قادرًا على الاستدعاء بالتزامن مع التطبيقات الأخرى على جهاز الكمبيوتر، مما يعزز قدرات تعدد المهام وأداء النظام بشكل عام.

تطبيقات في العالم الحقيقي

تستخدم نماذج Phi بالفعل في التجارب الأساسية مثل Click to Do، والتي توفر أدوات نصية ذكية لجميع المحتويات التي تظهر على الشاشة. وهي متوفرة أيضًا كواجهات برمجة تطبيقات للمطورين للتكامل السلس في التطبيقات. تُستخدم النماذج حاليًا في العديد من تطبيقات الإنتاجية مثل Outlook، حيث توفر ميزات تلخيص Copilot في وضع عدم الاتصال. تستفيد نماذج Phi-4-reasoning و Phi-4-mini-reasoning من تحسينات البتات المنخفضة لـ Phi Silica وستكون متاحة قريبًا للتشغيل على Copilot+ PC NPUs.

التزام Microsoft بالذكاء الاصطناعي المسؤول والسلامة

في Microsoft، يعد الذكاء الاصطناعي المسؤول مبدأً أساسيًا يوجه تطوير ونشر أنظمة الذكاء الاصطناعي، بما في ذلك نماذج Phi. تم تطوير نماذج Phi بما يتماشى مع مبادئ Microsoft AI: المساءلة والشفافية والإنصاف والموثوقية والسلامة والخصوصية والأمن والشمولية. تستخدم عائلة نماذج Phi نهجًا قويًا لسلامة ما بعد التدريب، باستخدام مزيج من الضبط الدقيق الخاضع للإشراف (SFT) وتحسين التفضيل المباشر (DPO) والتعلم المعزز من تقنيات ردود الفعل البشرية (RLHF) لضمان استخدامها المسؤول والأخلاقي.

الأسس التقنية لنماذج Phi: فحص مفصل

تمثل نماذج Phi من Microsoft تقدمًا كبيرًا في مجال نماذج اللغة الصغيرة، لا سيما في قدرتها على أداء مهام الاستدلال المعقدة بعدد قليل نسبيًا من المعلمات. يتعمق هذا القسم في التفاصيل التقنية التي تمكن هذه النماذج من تحقيق مثل هذا الأداء المثير للإعجاب.

الابتكارات المعمارية

تعتمد نماذج Phi على بنية المحولات، وهو نموذج للتعلم العميق أحدث ثورة في معالجة اللغة الطبيعية. يتفوق المحولات في التقاط تبعيات طويلة المدى في النص، مما يسمح للنماذج بفهم سياق وفروق اللغة.

  • آلية الانتباه: جوهر بنية المحولات هو آلية الانتباه، التي تسمح للنموذج بالتركيز على الأجزاء الأكثر صلة من الإدخال عند إنشاء الإخراج. وهذا مهم بشكل خاص لمهام الاستدلال، حيث يحتاج النموذج إلى تحديد المعلومات والعلاقات الرئيسية للوصول إلى استنتاج صحيح.

  • الانتباه المقاس لناتج النقطة: تستخدم نماذج Phi الانتباه المقاس لناتج النقطة، وهو نسخة محسنة من آلية الانتباه التي تتضمن عامل قياس لمنع نواتج النقطة من أن تصبح كبيرة جدًا، مما قد يؤدي إلى عدم الاستقرار أثناء التدريب.

  • الانتباه متعدد الرؤوس: لالتقاط جوانب مختلفة من الإدخال، تستخدم نماذج Phi الانتباه متعدد الرؤوس، حيث تعمل آليات انتباه متعددة بالتوازي. تركز كل رأس على مجموعة فرعية مختلفة من الإدخال، مما يسمح للنموذج بتعلم تمثيلات أكثر تعقيدًا.

  • شبكات التغذية الأمامية: بعد طبقات الانتباه، تشتمل بنية المحولات على شبكات تغذية أمامية تقوم بمعالجة المعلومات بشكل أكبر. تتكون هذه الشبكات من طبقات متعددة من الخلايا العصبية التي تتعلم استخراج الميزات من مخرجات الانتباه.

منهجيات التدريب: نهج متعدد الأوجه

يتضمن تدريب نماذج Phi مجموعة من التقنيات، بما في ذلك الضبط الدقيق الخاضع للإشراف والتعلم المعزز وتقطير البيانات.

  • الضبط الدقيق الخاضع للإشراف (SFT): يتضمن الضبط الدقيق الخاضع للإشراف تدريب النموذج على مجموعة بيانات مسماة، حيث يكون الإدخال عبارة عن سؤال أو مشكلة، والإخراج هو الإجابة أو الحل الصحيح. يساعد هذا النموذج على تعلم ربط مدخلات محددة بالمخرجات المقابلة.

  • التعلم المعزز (RL): التعلم المعزز هو تقنية يتعلم فيها النموذج اتخاذ القرارات من خلال التفاعل مع بيئة وتلقي مكافآت أو عقوبات على أفعاله. في سياق نماذج اللغة، يمكن أن تكون البيئة عبارة عن مجموعة من القواعد أو القيود، ويمكن أن تستند المكافأة إلى دقة استجابات النموذج.

  • تقطير البيانات: تقطير البيانات هو تقنية يتم فيها تدريب نموذج أصغر لتقليد سلوك نموذج أكبر وأكثر تعقيدًا. يسمح هذا للنموذج الأصغر بتحقيق أداء مماثل للنموذج الأكبر، مع طلب موارد أقل.

تنسيق البيانات: حجر الزاوية في الأداء

يعتمد أداء نماذج Phi بشكل كبير على جودة البيانات المستخدمة للتدريب. استثمرت Microsoft جهدًا كبيرًا في تنسيق مجموعات بيانات عالية الجودة مصممة خصيصًا لمهام الاستدلال.

  • توليد البيانات الاصطناعية: لزيادة البيانات المتاحة، طورت Microsoft تقنيات لتوليد بيانات اصطناعية تحاكي خصائص بيانات العالم الحقيقي. يسمح هذا بتدريب النماذج على مجموعة بيانات أكبر وأكثر تنوعًا، مما يحسن قدرتها على التعميم.

  • تصفية البيانات: تستخدم Microsoft تقنيات صارمة لتصفية البيانات لإزالة البيانات الصاخبة أو غير ذات الصلة من مجموعة بيانات التدريب. يضمن ذلك تدريب النماذج على بيانات نظيفة ودقيقة، مما يؤدي إلى أداء أفضل.

  • زيادة البيانات: تُستخدم تقنيات زيادة البيانات لزيادة تنوع مجموعة بيانات التدريب عن طريق تطبيق تحويلات على البيانات الموجودة. يساعد هذا النماذج على أن تكون أكثر قوة في مواجهة الاختلافات في الإدخال.

تقنيات التحسين: الموازنة بين الكفاءة والدقة

تم تحسين نماذج Phi لكل من الكفاءة والدقة، مما يسمح لها بالعمل على الأجهزة ذات الموارد المحدودة دون التضحية بالأداء.

  • التكميم: التكميم هو تقنية يتم فيها تقليل دقة معلمات النموذج، مما يقلل من حجم الذاكرة ومتطلبات الحساب للنموذج.

  • التقليم: التقليم هو تقنية يتم فيها إزالة الاتصالات الأقل أهمية في النموذج، مما يقلل من حجم وتعقيد النموذج.

  • تقطير المعرفة: يتضمن تقطير المعرفة نقل المعرفة من نموذج أكبر وأكثر تعقيدًا إلى نموذج أصغر. يسمح هذا للنموذج الأصغر بتحقيق أداء مماثل للنموذج الأكبر، مع طلب موارد أقل.

Phi Silica NPU: نهج تآزري للأجهزة والبرامج

تم تصميم نماذج Phi من Microsoft لتتكامل بشكل وثيق مع Phi Silica NPU (وحدة المعالجة العصبية)، وهي مسرع أجهزة متخصص تم تحسينه لأحمال عمل التعلم العميق.

  • تحسين البت المنخفض: يدعم Phi Silica NPU تحسين البت المنخفض، مما يسمح للنماذج بالعمل بدقة منخفضة، مما يقلل من حجم الذاكرة ومتطلبات الحساب.

  • التحميل المسبق في الذاكرة: تم تصميم نماذج Phi ليتم تحميلها مسبقًا في الذاكرة، مما يسمح باستدعائها بسرعة وكفاءة.

  • إدارة نظام التشغيل: تتم إدارة Phi Silica NPU بواسطة نظام التشغيل، مما يسمح بدمجها بسلاسة في تجربة المستخدم.

باختصار، تمثل نماذج Phi من Microsoft إنجازًا كبيرًا في مجال نماذج اللغة الصغيرة. من خلال الجمع بين التصميمات المعمارية المبتكرة ومنهجيات التدريب الصارمة وتنسيق البيانات الدقيق والتصميم المشترك للأجهزة والبرامج، أنشأت Microsoft عائلة من النماذج القوية والفعالة على حد سواء، مما يتيح مجموعة واسعة من التطبيقات المدعومة بالذكاء الاصطناعي.