الكشف عن الأداء المتفوق لـ 2.5 Pro
تم تحديث نموذج 2.5 Pro مؤخرًا لتمكين المطورين من إنشاء تطبيقات ويب أكثر تفاعلية وغنية بالميزات. التقييمات الإيجابية التي تلقيناها من المستخدمين والمطورين محل تقدير كبير، وسيستمر تنفيذ التحسينات المستمرة بناءً على مدخلات المستخدم.
بالإضافة إلى أدائه المتميز في المعايير الأكاديمية، فقد استحوذ أحدث تكرار لـ 2.5 Pro على المركز الأول في قائمة المتصدرين الشهيرة للترميز، WebDev Arena، مع درجة ELO مثيرة للإعجاب تبلغ 1415. كما أنه يتصدر جميع قوائم المتصدرين في LMArena، التي تقيم تفضيلات الإنسان بناءً على معايير مختلفة. علاوة على ذلك، مزودًا بنافذة سياق رمزية مليونية، يوفر 2.5 Pro أداءً متطورًا في فهم السياق الطويل والفيديو.
من خلال دمج LearnLM، وهي عائلة من النماذج طورت بالتعاون مع خبراء التعليم، أصبح 2.5 Pro النموذج الرائد للتعلم. في المقارنات المباشرة التي تقيم علم أصول التدريس وفعاليته، فضل المعلمون والخبراء Gemini 2.5 Pro على النماذج الأخرى عبر مجموعة متنوعة من السيناريوهات. كما أنه تجاوز النماذج العليا عبر جميع المبادئ الخمسة لعلم التعلم، والتي تستخدم لبناء أنظمة الذكاء الاصطناعي للتعلم. هذا يسلط الضوء على فعاليته في السياقات التعليمية، حيث يقدم استراتيجيات تدريس مصممة وفعالة.
التفكير العميق: دفع حدود التفكير
تستكشف Google بنشاط حدود القدرات المعرفية لـ Gemini وبدأت في تجربة وضع تفكير محسّن يسمى Deep Think. يستخدم هذا الوضع المبتكر تقنيات بحث متطورة، مما يمكّن النموذج من تقييم فرضيات متعددة قبل صياغة استجابة. يعزز هذا النهج عمليات صنع القرار، مما يسمح بنتائج أكثر تعقيدًا ودقة في المواقف المعقدة.
حقق Gemini 2.5 Pro Deep Think درجة رائعة في USAMO 2025، المعترف بها على نطاق واسع كأحد أصعب المعايير الرياضية. كما أنه يتفوق في LiveCodeBench، وهو معيار صعب للترميز على مستوى المنافسة، ويحقق درجة 84.0٪ في MMMU، والذي يقيم التفكير متعدد الوسائط. تؤكد هذه النتائج الأداء الاستثنائي لـ Deep Think في التعامل مع المهام المعقدة، مما يشير إلى مستقبل واعد لحل مشاكل الذكاء الاصطناعي المتقدم.
بالنظر إلى أن 2.5 Pro Deep Think يدفع حدود ما هو ممكن، فإن Google تستغرق وقتًا إضافيًا لإجراء تقييمات سلامة شاملة وطلب المزيد من المدخلات من خبراء السلامة. ستقدم الشركة أيضًا لمختبرين محددين إمكانية الوصول إلى Gemini API لجمع التعليقات قبل إتاحتها على نطاق واسع. يهدف هذا النهج الحذر والمتعمد إلى ضمان النشر المسؤول لتكنولوجيا الذكاء الاصطناعي المتقدمة.
تقديم 2.5 Flash المحسن
تم تحسين نموذج 2.5 Flash، المعروف بكفاءته وفعاليته من حيث التكلفة، عبر أبعاد عديدة. وقد أظهر تحسينات عبر المعايير الهامة للتفكير والوسائط المتعددة والتعامل مع التعليمات البرمجية والسياق الطويل، بينما أصبح في نفس الوقت أكثر كفاءة، باستخدام ما بين 20-30٪ رموز أقل في التقييمات. هذا يسلط الضوء على أدائه الأمثل وإدارة الموارد.
يتوفر الإصدار الجديد 2.5 Flash حاليًا للمعاينة في Google AI Studio للمطورين، وفي Vertex AI لتطبيقات المؤسسات، وفي تطبيق Gemini للمستخدمين العاديين. ومن المقرر أن يكون متاحًا بشكل عام في أوائل شهر يونيو، مما يجعله متاحًا لبيئات الإنتاج.
إمكانات جديدة في Gemini 2.5
تحسينات على إخراج الصوت الأصلي و Live API
يقدم Live API إصدار معاينة للإدخال السمعي البصري وحوار إخراج الصوت الأصلي، مما يمكّن المستخدمين من إنشاء تجارب محادثة مع Gemini أكثر طبيعية وتعبيرية. تتيح هذه الميزة تطبيقات أكثر جاذبية وتفاعلية. تعزز قدرة الذكاء الاصطناعي على إنتاج استجابات صوتية نابضة بالحياة بشكل كبير تفاعل المستخدم من خلال إنشاء طريقة أكثر سهولة للتواصل.
يمكّن Live API المستخدمين من توجيه نبرة النموذج ولهجتهوأسلوب تحدثه. على سبيل المثال، يمكن توجيه النموذج لتبني صوتًا دراميًا عند سرد قصة. كما أنه يدعم استخدام الأدوات، مما يسمح له بإجراء عمليات بحث نيابة عن المستخدم. إن المرونة في التحكم الصوتي والوصول إلى الأدوات الخارجية تجعل النموذج متعدد الاستخدامات وقيِّمًا بشكل غير عادي عبر سيناريوهات التطبيق المتنوعة.
يمكن للمستخدمين تجربة ميزات أولية متنوعة، بما في ذلك:
الحوار العاطفي: يكتشف النموذج العاطفة في صوت المستخدم ويستجيب وفقًا لذلك. تضيف هذه الوظيفة طبقات من الذكاء العاطفي إلى الذكاء الاصطناعي، مما يجعل التفاعل أكثر تخصيصًا.
الصوت الاستباقي: يتجاهل النموذج المحادثات الخلفية ويعرف متى يستجيب، مما يقلل من الانقطاعات ويحسن الوضوح. تعمل هذه الميزة على تحسين جودة التفاعل، مما يسمح بتواصل أكثر كفاءة وتركيزًا.
التفكير في Live API: يستفيد النموذج من قدرات التفكير في Gemini لدعم المهام الأكثر تعقيدًا. يتيح ذلك إجراء تحليل أعمق ومراعاة عند معالجة المهام المعقدة، مما يجعله ذا قيمة استثنائية في المجالات التي تتطلب حلولًا دقيقة وبصيرة.
تطلق Google أيضًا معاينات جديدة لوظائف تحويل النص إلى كلام في كل من 2.5 Pro و 2.5 Flash. توفر هذه الوظائف دعمًا فريدًا من نوعه لمتحدثين متعددين، مما يتيح تحويل النص إلى كلام بصوتين عبر إخراج الصوت الأصلي. هذه الميزة ذات قيمة خاصة لإنشاء روايات وحوارات جذابة في تطبيقات الوسائط المتعددة.
مثل حوار الصوت الأصلي، فإن تحويل النص إلى كلام معبر ويمكن أن يلتقط الفروق الدقيقة مثل الهمسات. وهو يدعم أكثر من 24 لغة وينتقل بينها بسلاسة، مما يجعله أداة متعددة الاستخدامات للتواصل العالمي. هذه الدقة في استخدام اللغة تثري تجربة المستخدم، مما يسهل عملية تواصل أكثر دقة وتخصيصًا.
ستكون هذه القدرة على تحويل النص إلى كلام متاحة في وقت لاحق اليوم في Gemini API.
واجهة كمبيوتر محسنة
تقدم Google إمكانات استخدام الكمبيوتر في Project Mariner في Gemini API و Vertex AI. تستكشف الشركات ذات التفكير المستقبلي مثل Automation Anywhere و UiPath و Browserbase و Autotab و The Interaction Company و Cartwheel إمكاناتها. تتطلع Google إلى طرح أوسع للمطورين لتجربة هذه الإمكانية هذا الصيف، مما يمهد الطريق للمشاريع والحلول المبتكرة. تؤدي القدرة على دمج نماذج الذكاء الاصطناعي مباشرة مع واجهات الكمبيوتر إلى حلول سير عمل أكثر انسيابية وإنتاجية عبر الصناعات المتنوعة.
تدابير أمنية فائقة
عززت Google بشكل كبير حمايتها من التهديدات الأمنية، مثل عمليات حقن المطالبات غير المباشرة. يتضمن ذلك تضمين تعليمات برمجية ضارة في البيانات التي يتم استردادها بواسطة نموذج الذكاء الاصطناعي. لقد زاد نهج الأمان الجديد من Google بشكل كبير من معدل حماية Gemini ضد هجمات حقن المطالبات غير المباشرة أثناء استخدام الأدوات، مما يجعل Gemini 2.5 أكثر عائلات النماذج أمانًا حتى الآن. يضمن هذا الأمان المحسن للمستخدمين تجربة آمنة وموثوقة عند اعتماد حلول تعتمد على الذكاء الاصطناعي.
تجربة مطور محسنة
ملخصات الأفكار
ستتضمن الآن كل من 2.5 Pro و Flash ملخصات للأفكار في Gemini API وفي Vertex AI. تأخذ هذه الملخصات أفكار النموذج الأولية وتنظمها في تنسيق واضح مع رؤوس وتفاصيل رئيسية ومعلومات حول إجراءات النموذج، مثل وقت استخدام الأدوات. من خلال تقديم رؤى حول العملية التحليلية للذكاء الاصطناعي، تساعد ملخصات الأفكار في فهم وتصحيح المشكلات داخل أنظمة الذكاء الاصطناعي، وتحسين الكفاءة وتصميم النظام.
بفضل التنسيق الأكثر تنظيمًا وانسيابية لعملية التفكير في النموذج، سيجد المطورون والمستخدمون التفاعلات مع نماذج Gemini أسهل في الفهم والتصحيح.
ميزانيات التفكير
أطلقت Google 2.5 Flash بميزانيات تفكير لمنح المطورين تحكمًا أكبر في التكاليف عن طريق موازنة زمن الوصول والجودة. تم الآن تمديد هذه الإمكانية إلى 2.5 Pro، مما يمنحك خيارات ضبط دقيقة أكبر. من خلال التحكم في الرموز المميزة المستخدمة وتحسين الموارد، يمكن للمطورين تحقيق التوازن المناسب بين التكلفة الحاسوبية وفعالية الحل، مما يجعل تنفيذ الذكاء الاصطناعي اقتصاديًا وفعالًا.
يتيح ذلك التحكم الكامل في عدد الرموز التي يستخدمها النموذج للتفكير قبل الاستجابة، أو حتى إيقاف قدرات التفكير الخاصة به.
سيكون Gemini 2.5 Pro مع الميزانيات متاحًا بشكل عام للاستخدام المستقر في الإنتاج في الأسابيع القادمة، جنبًا إلى جنب مع النموذج المتاح بشكل عام.
دعم أدوات MCP
أضافت Google دعم SDK الأصلي لتعريفات Model Context Protocol (MCP) في Gemini API لتسهيل التكامل مع الأدوات مفتوحة المصدر. يتم استكشاف طرق نشر مختلفة، مثل خوادم MCP والأدوات المستضافة، لتسهيل بناء تطبيقات الوكيل على المستخدمين. هذا يحسن بيئة تطوير الذكاء الاصطناعي من خلال مجموعة واسعة من الخيارات لتكامل Tool والتعاون في المشاريع.
الابتكار المستمر هو المفتاح في الالتزام المستمر بتحسين النماذج وتجربة المطور، مما يجعلها أكثر كفاءة وأداء واستجابة لملاحظات المطورين. ضاعف من اتساع وعمق البحث الأساسي لدفع حدود قدرات Gemini. هناك المزيد في المستقبل.