شهد مشهد نماذج اللغة الكبيرة (LLMs) تحولًا كبيرًا، حيث برزت جوجل كلاعب رئيسي بينما تواجه ميتا و OpenAI تحديات ملحوظة. في البداية، هيمنت OpenAI على هذا المجال بنماذج GPT الرائدة الخاصة بها، ووضعت معايير جديدة لأداء LLM. كما ضمنت ميتا مكانة كبيرة من خلال تقديم نماذج ذات أوزان مفتوحة تتميز بقدرات رائعة وتسمح بالاستخدام غير المقيد والتعديل والنشر للتعليمات البرمجية المتاحة للجمهور.
ومع ذلك، تركت هذه الهيمنة المبكرة عمالقة التكنولوجيا الآخرين، بما في ذلك جوجل، في وضع اللحاق بالركب. على الرغم من ورقة بحث جوجل المحورية لعام 2017 حول بنية المحولات التي تدعم LLMs، إلا أن جهود الشركة الأولية طغى عليها الإطلاق الذي تعرض لانتقادات واسعة لـ Bard في عام 2023.
في الآونة الأخيرة، تغيرت الأمور مع طرح LLMs جديدة قوية من جوجل، إلى جانب النكسات التي واجهتها ميتا و OpenAI. وقد أدى هذا التحول إلى تغيير كبير في ديناميكيات مشهد LLM.
Llama 4 من ميتا: هل هي خطوة خاطئة؟
أثار الإطلاق غير المتوقع لـ Llama 4 من ميتا يوم السبت الموافق 5 أبريل/نيسان علامات استفهام في جميع أنحاء الصناعة.
اعتُبر قرار إطلاق نموذج رئيسي في عطلة نهاية الأسبوع غير تقليدي، مما أدى إلى استقبال خافت وحجب الإعلان وسط تدفق الأخبار في الأسبوع التالي.
في حين أن Llama 4 يمتلك نقاط قوة معينة، بما في ذلك قدراته متعددة الوسائط (التعامل مع الصور والصوت والوسائط الأخرى) وتوافره في ثلاثة إصدارات (Llama 4 Behemoth و Maverick و Scout) بأحجام وقوى متفاوتة، إلا أن طرحه قوبل بانتقادات. يتميز إصدار Llama 4 Scout، على وجه الخصوص، بنافذة سياق كبيرة تصل إلى 10 ملايين رمز، مما يمكّن النموذج من معالجة وإنشاء كميات هائلة من النص في جلسة واحدة.
ومع ذلك، تدهور استقبال النموذج عندما ظهرت اختلافات فيما يتعلق بنهج الترتيب الخاص بـ ميتا على LMArena، وهي منصة تصنف LLMs بناءً على أصوات المستخدمين. تم اكتشاف أن نموذج Llama 4 المحدد المستخدم في التصنيفات يختلف عن النموذج الذي تم توفيره لعامة الناس. ذكرت LMArena أن ميتا قدمت ‘نموذجًا مخصصًا لتحسين تفضيلات الإنسان’.
علاوة على ذلك، قوبلت ادعاءات ميتا بشأن نافذة سياق Llama 4 Scout التي تبلغ 10 ملايين رمز بالتشكيك. على الرغم من الدقة الفنية لهذا الرقم، كشفت المعايير أن Llama 4 متخلف عن النماذج المنافسة في أداء السياق الطويل.
ومما زاد من المخاوف أن ميتا امتنعت عن إصدار نموذج Llama 4 ‘للاستدلال’ أو ‘التفكير’ وحجبت المتغيرات الأصغر، على الرغم من أن الشركة أشارت إلى أن نموذج الاستدلال قادم.
لاحظ بن لوريكا، مؤسس شركة الاستشارات في مجال الذكاء الاصطناعي Gradient Flow، أن ميتا انحرفت عن الممارسة القياسية للإصدار الأكثر منهجية، حيث تكون جميع المكونات مُجهزة بالكامل. يشير هذا إلى أن ميتا ربما كانت حريصة على عرض نموذج جديد، حتى لو كان يفتقر إلى العناصر الأساسية مثل نموذج الاستدلال والإصدارات الأصغر.
GPT-4.5 من OpenAI: تراجع مبكر
واجهت OpenAI أيضًا تحديات في الأشهر الأخيرة.
تم الكشف عن GPT-4.5، باعتباره معاينة بحثية في 27 فبراير/شباط، ووُصف بأنه ‘أكبر وأفضل نموذج للشركة للدردشة حتى الآن’. أشارت معايير OpenAI إلى أن GPT-4.5 تفوق بشكل عام على سابقه، GPT-4o.
ومع ذلك، أثار هيكل تسعير النموذج انتقادات. حددت OpenAI سعر الوصول إلى واجهة برمجة التطبيقات (API) بمبلغ 150 دولارًا أمريكيًا لكل مليون رمز إخراج، وهي زيادة مذهلة قدرها 15 ضعفًا مقارنة بسعر GPT-4o البالغ 10 دولارات أمريكية لكل مليون رمز. تتيح واجهة برمجة التطبيقات (API) للمطورين دمج نماذج OpenAI في تطبيقاتهم وخدماتهم.
قدر آلان د. طومسون، وهو مستشار ومحلل في مجال الذكاء الاصطناعي في Life Architect، أن GPT-4.5 كان على الأرجح أكبر نموذج LLM تقليدي تم إصداره خلال الربع الأول من عام 2025، مع ما يقرب من 5.4 تريليون معلمة. وجادل بأنه من الصعب تبرير هذا الحجم الهائل نظرًا للقيود الحالية للأجهزة ويمثل تحديات كبيرة في خدمة قاعدة كبيرة من المستخدمين.
في 14 أبريل/نيسان، أعلنت OpenAI عن قرارها بوقف الوصول إلى GPT-4.5 عبر واجهة برمجة التطبيقات (API) بعد أقل من ثلاثة أشهر. في حين أن GPT-4.5 سيظل متاحًا، إلا أنه سيقتصر على مستخدمي ChatGPT من خلال واجهة ChatGPT.
تزامن هذا الإعلان مع طرح GPT-4.1، وهو نموذج أكثر اقتصادا بسعر 8 دولارات أمريكية لكل مليون رمز. تشير معايير OpenAI إلى أن GPT-4.1 ليس بنفس قدرات GPT-4.5 بشكل عام، على الرغم من أنه يظهر أداءً متفوقًا في بعض معايير الترميز.
أصدرت OpenAI أيضًا مؤخرًا نماذج استدلال جديدة، o3 و o4-mini، حيث أظهر نموذج o3 أداءً قويًا بشكل خاص في المعايير. ومع ذلك، لا تزال التكلفة مصدر قلق، حيث أن الوصول إلى واجهة برمجة التطبيقات (API) لـ o3 مُسعَّر بـ 40 دولارًا أمريكيًا لكل مليون رمز إخراج.
صعود جوجل: اغتنام الفرصة
أدى الاستقبال المختلط لـ Llama 4 و ChatGPT-4.5 إلى خلق فرصة للمنافسين للاستفادة منها، وقد اغتنموا هذه الفرصة.
من غير المرجح أن يثني إطلاق Llama 4 المضطرب من ميتا المطورين عن تبني بدائل مثل DeepSeek-V3 و Gemma من جوجل و Qwen2.5 من علي بابا. أصبحت LLMs هذه، التي تم طرحها في أواخر عام 2024، هي النماذج ذات الأوزان المفتوحة المفضلة على لوحات المتصدرين LMArena و HuggingFace. إنها تنافس أو تتفوق على Llama 4 في المعايير الشائعة، وتوفر وصولاً ميسور التكلفة إلى واجهة برمجة التطبيقات (API)، وفي بعض الحالات، تتوفر للتنزيل والاستخدام على أجهزة من الدرجة الاستهلاكية.
ومع ذلك، فإن LLM المتطور من جوجل، Gemini 2.5 Pro، هو الذي استحوذ حقًا على الاهتمام.
تم إطلاق Google Gemini 2.5 Pro في 25 مارس/آذار، وهو ‘نموذج تفكير’ مشابه لـ GPT-o1 و DeepSeek-R1، يستخدم المطالبة الذاتية للتفكير في المهام. Gemini 2.5 Pro متعدد الوسائط، ويتميز بنافذة سياق تبلغ مليون رمز، ويدعم البحث المتعمق.
حقق Gemini 2.5 بسرعة انتصارات قياسية، بما في ذلك المركز الأول في SimpleBench (على الرغم من أنه تنازل عن هذا المركز لـ o3 من OpenAI في 16 أبريل/نيسان) وعلى مؤشر الذكاء الاصطناعي المدمج لتحليلات الذكاء الاصطناعي. يحتل Gemini 2.5 Pro حاليًا المركز الأول في LMArena. اعتبارًا من 14 أبريل/نيسان، احتلت نماذج جوجل 5 من أفضل 10 مراكز في LMArena، بما في ذلك Gemini 2.5 Pro، وثلاثة متغيرات من Gemini 2.0، و Gemma 3-27B.
بالإضافة إلى أدائه المثير للإعجاب، تعد جوجل أيضًا رائدة في الأسعار. يتوفر Google Gemini 2.5 حاليًا للاستخدام المجاني من خلال تطبيق Gemini من جوجل وموقع AI Studio من جوجل. كما أن أسعار واجهة برمجة التطبيقات (API) من جوجل تنافسية أيضًا، حيث تم تسعير Gemini 2.5 Pro بـ 10 دولارات أمريكية لكل مليون رمز إخراج و Gemini 2.0 Flash بسعر 40 سنتًا فقط لكل مليون رمز.
يشير لوريكا إلى أنه بالنسبة لمهام الاستدلال ذات الحجم الكبير، غالبًا ما يختار DeepSeek-R1 أو Google Gemini، بينما يتطلب استخدام نماذج OpenAI دراسة متأنية للتسعير.
في حين أن ميتا و OpenAI ليستا بالضرورة على وشك الانهيار، إلا أن OpenAI تستفيد من شعبية ChatGPT، التي يُقال إنها تضم مليار مستخدم. ومع ذلك، يشير الترتيب القوي وأداء المعايير لـ Gemini إلى تحول في مشهد LLM، والذي يفضل حاليًا جوجل.