Google تحدد سعراً جديداً: تفاصيل تكلفة Gemini 2.5 Pro

شهد مجال الذكاء الاصطناعي تطورًا هامًا آخر حيث كشفت Google رسميًا عن هيكل التسعير للوصول إلى محركها المتقدم للاستدلال بالذكاء الاصطناعي، Gemini 2.5 Pro، عبر واجهة برمجة التطبيقات (API). أثار هذا النموذج ضجة كبيرة، حيث أظهر أداءً استثنائيًا عبر مختلف معايير الصناعة، لا سيما في المهام التي تتطلب ترميزًا متطورًا، واستدلالًا منطقيًا، وقدرات حل المشكلات الرياضية. يوفر الكشف عن هيكل تكلفته رؤى حاسمة حول استراتيجية Google التنافسية ضمن المشهد المتزايد التنافس لنماذج الذكاء الاصطناعي واسعة النطاق ويشير إلى الاتجاهات المحتملة للسوق الأوسع.

نهج متدرج للوصول إلى الذكاء الاصطناعي المتميز

طبقت Google نظام تسعير من مستويين لـ Gemini 2.5 Pro، يربط التكلفة مباشرة بتعقيد وحجم المهام التي يعتزم المطورون تنفيذها، مقاسة بـ ‘tokens’ - وهي الوحدات الأساسية للبيانات (مثل المقاطع أو الكلمات أو أجزاء من الكود) التي تعالجها هذه النماذج.

  • فئة الاستخدام القياسي (حتى 200,000 Tokens): بالنسبة للمطالبات التي تقع ضمن نافذة السياق الكبيرة هذه، ولكن القياسية، سيتحمل المطورون رسومًا قدرها 1.25 دولار لكل مليون token إدخال يقومون بتغذيتها للنموذج. لوضع هذا الحجم في منظوره الصحيح، يعادل مليون token تقريبًا 750,000 كلمة إنجليزية، وهو حجم يتجاوز النص الكامل لأعمال ملحمية مثل ثلاثية ‘The Lord of the Rings’. تم تحديد تكلفة المخرجات التي تم إنشاؤها في هذه الفئة بشكل أعلى بكثير، عند 10 دولارات لكل مليون token إخراج. يعكس هذا التسعير التفاضلي الكثافة الحسابية التي ينطوي عليها إنشاء استجابات متماسكة وذات صلة وعالية الجودة مقارنة بمجرد معالجة المدخلات.

  • فئة السياق الممتد (أكثر من 200,000 Tokens): إدراكًا للحاجة المتزايدة لنماذج قادرة على التعامل مع كميات كبيرة جدًا من المعلومات في مطالبة واحدة - وهي قدرة لا يوفرها المنافسون عالميًا - أنشأت Google نقطة سعر مميزة وأعلى لاستخدام نافذة السياق الممتدة لـ Gemini 2.5 Pro. بالنسبة للمطالبات التي تتجاوز عتبة 200,000 token، تتضاعف تكلفة الإدخال إلى 2.50 دولار لكل مليون token، بينما تشهد تكلفة الإخراج زيادة بنسبة 50٪ لتصل إلى 15 دولارًا لكل مليون token إخراج. يعترف هذا السعر المتميز بالقدرة المتقدمة ومتطلبات الموارد المرتبطة بها اللازمة للحفاظ على الأداء والتماسك عبر مساحات الإدخال الواسعة هذه. تستفيد المهام مثل تحليل المستندات القانونية الطويلة، أو تلخيص الأوراق البحثية الشاملة، أو الانخراط في محادثات معقدة متعددة الأدوار ذات ذاكرة عميقة بشكل كبير من سعة السياق الممتدة هذه.

تجدر الإشارة إلى أن Google توفر أيضًا فئة وصول مجانية لـ Gemini 2.5 Pro، وإن كان ذلك مع حدود صارمة لمعدل الاستخدام. يتيح ذلك للمطورين الأفراد والباحثين والهواة تجربة قدرات النموذج وتقييم أدائه لحالات استخدام محددة وتطوير نماذج أولية دون التزام مالي أولي. ومع ذلك، بالنسبة لأي تطبيق يتطلب إنتاجية كبيرة أو توفرًا ثابتًا، يصبح الانتقال إلى واجهة برمجة التطبيقات المدفوعة ضروريًا.

الموقع ضمن محفظة Google للذكاء الاصطناعي

يؤكد تقديم تسعير Gemini 2.5 Pro بقوة مكانته كـ العرض المتميز ضمن تشكيلة نماذج الذكاء الاصطناعي الحالية من Google المتاحة من خلال الوصول عبر واجهة برمجة التطبيقات (API). تتجاوز تكلفته بشكل كبير تكلفة النماذج الأخرى التي طورتها Google، مما يسلط الضوء على استراتيجية تقسيم عروضها بناءً على القدرة والأداء.

لنأخذ على سبيل المثال Gemini 2.0 Flash. يتم وضع هذا النموذج كبديل أخف وأسرع، ومُحسَّن للمهام التي تكون فيها السرعة وكفاءة التكلفة أمرًا بالغ الأهمية. يعكس سعره هذا التموضع، حيث يكلف 0.10 دولار فقط لكل مليون token إدخال و 0.40 دولار لكل مليون token إخراج. يمثل هذا فرقًا في التكلفة يزيد عن عشرة أضعاف مقارنة بالفئة القياسية لـ Gemini 2.5 Pro للمدخلات وخمسة وعشرين ضعفًا للمخرجات.

يؤكد هذا التباين الصارخ على التطبيقات المستهدفة المختلفة:

  • Gemini 2.0 Flash: مناسب للمهام ذات الحجم الكبير وزمن الاستجابة المنخفض مثل إنشاء المحتوى الأساسي، والأسئلة والأجوبة البسيطة، وتطبيقات الدردشة حيث تكون الاستجابات السريعة هي المفتاح، واستخراج البيانات حيث لا يكون الاستدلال من الدرجة الأولى هو المطلب الأساسي.
  • Gemini 2.5 Pro: موجه نحو حل المشكلات المعقدة، وإنشاء وتصحيح الأكواد المعقدة، والاستدلال الرياضي المتقدم، والتحليل المتعمق لمجموعات البيانات أو المستندات الكبيرة، والتطبيقات التي تتطلب أعلى مستويات الدقة والفروق الدقيقة.

يجب على المطورين الآن الموازنة بعناية بين المقايضات. هل يستحق الاستدلال المتفوق، والبراعة في الترميز، ونافذة السياق الممتدة لـ Gemini 2.5 Pro القيمة السعرية الكبيرة مقارنة بسرعة وتكلفة Gemini 2.0 Flash؟ ستعتمد الإجابة كليًا على المتطلبات المحددة لتطبيقهم والقيمة المستمدة من القدرات المحسنة. يشير هيكل التسعير هذا بوضوح إلى نية Google في تلبية احتياجات شرائح مختلفة من سوق المطورين بأدوات متميزة مُحسَّنة لتلبية احتياجات مختلفة.

التنقل في المشهد التنافسي

بينما يمثل Gemini 2.5 Pro أغلى نموذج ذكاء اصطناعي متاح للجمهور من Google حتى الآن، فإن سعره لا يوجد في فراغ. يكشف تقييم تكلفته بالنسبة للنماذج الرائدة من المنافسين الرئيسيين مثل OpenAI و Anthropic عن صورة معقدة لتحديد المواقع الاستراتيجية والقيمة المتصورة.

حيث يبدو Gemini 2.5 Pro أكثر تكلفة:

  • o3-mini من OpenAI: يتم تسعير هذا النموذج من OpenAI بسعر 1.10 دولار لكل مليون token إدخال و 4.40 دولار لكل مليون token إخراج. مقارنة بالفئة القياسية لـ Gemini 2.5 Pro (1.25 دولار للإدخال / 10 دولارات للإخراج)، يحمل عرض Google تكلفة إدخال أعلى قليلاً وتكلفة إخراج أعلى بكثير. غالبًا ما تشير تسمية ‘mini’ إلى نموذج أصغر، ربما أسرع ولكنه أقل قدرة من نظيره ‘pro’ أو الرائد، مما يجعل هذه المقارنة بين مستويات مختلفة من القدرة.
  • R1 من DeepSeek: يقدم هذا النموذج من DeepSeek، وهو لاعب أقل شهرة عالميًا ولكنه لا يزال ذا صلة، خيارًا أكثر اقتصادا بسعر 0.55 دولار لكل مليون token إدخال و 2.19 دولار لكل مليون token إخراج. هذا يقلل بشكل كبير من سعر Gemini 2.5 Pro، مما يضع R1 على الأرجح للمستخدمين الذين يعطون الأولوية للتكلفة قبل كل شيء، وربما يقبلون مقايضات في الأداء أو مجموعات الميزات مثل نوافذ السياق الممتدة.

حيث يقدم Gemini 2.5 Pro أسعارًا تنافسية أو أقل:

  • Claude 3.7 Sonnet من Anthropic: منافس مباشر غالبًا ما يُستشهد به لأدائه القوي، يأتي Claude 3.7 Sonnet بسعر 3 دولارات لكل مليون token إدخال و 15 دولارًا لكل مليون token إخراج. هنا، تعتبر الفئة القياسية لـ Gemini 2.5 Pro (1.25 دولار / 10 دولارات) أرخص بكثير لكل من المدخلات والمخرجات. حتى فئة السياق الممتد لـ Gemini 2.5 Pro (2.50 دولار / 15 دولارًا) أرخص في الإدخال وتطابق تكلفة إخراج Sonnet، بينما من المحتمل أن تقدم نافذة سياق أكبر أو خصائص أداء مختلفة. هذا يجعل Gemini 2.5 Pro يبدو بسعر تنافسي قوي مقابل نموذج Anthropic المحدد هذا.
  • GPT-4.5 من OpenAI: غالبًا ما يُعتبر أحد قمم قدرات الذكاء الاصطناعي الحالية، يتطلب GPT-4.5 سعرًا أعلى بكثير: 75 دولارًا لكل مليون token إدخال و 150 دولارًا لكل مليون token إخراج. مقابل هذا المعيار، يبدو Gemini 2.5 Pro، حتى في فئته المتميزة، ميسور التكلفة بشكل ملحوظ، حيث يكلف أقل بحوالي 30 مرة للمدخلات و 10 مرات أقل للمخرجات. يسلط هذا الضوء على التقسيم الطبقي الكبير للتكلفة حتى بين النماذج من الدرجة الأولى.

يشير هذا التحليل المقارن إلى أن Google قد وضعت Gemini 2.5 Pro استراتيجيًا في منطقة وسط تنافسية. إنه ليس الخيار الأرخص، مما يعكس قدراته المتقدمة، ولكنه يقلل بشكل كبير من تكلفة بعض أقوى النماذج (وأكثرها تكلفة) في السوق، بهدف تقديم توازن مقنع بين الأداء والتكلفة، لا سيما عند مقارنته بنماذج مثل Claude 3.7 Sonnet و GPT-4.5.

استقبال المطورين والقيمة المتصورة

على الرغم من كونه أغلى نموذج من Google، كانت ردود الفعل الأولية الناشئة من مجتمعات التكنولوجيا والمطورين إيجابية في الغالب. وصف العديد من المعلقين والمتبنين الأوائل التسعير بأنه ‘معقول’ أو ‘منطقي’ عند النظر إليه في ضوء القدرات التي أظهرها النموذج.

من المحتمل أن ينبع هذا التصور من عدة عوامل:

  1. أداء المعايير: لم يكن Gemini 2.5 Pro أفضل بشكل تدريجي فحسب؛ بل حقق نتائج رائدة في الصناعة على معايير مصممة خصيصًا لاختبار حدود الذكاء الاصطناعي في توليد الأكواد، والاستنتاج المنطقي، والمهام الرياضية المعقدة. قد يرى المطورون الذين يعملون على تطبيقات تعتمد بشكل كبير على هذه القدرات أن السعر مبرر بالإمكانات للحصول على نتائج متفوقة، أو معدلات خطأ أقل، أو القدرة على معالجة المشكلات التي كانت مستعصية سابقًا على النماذج الأقل قدرة.
  2. نافذة السياق الممتدة: تعد القدرة على معالجة المطالبات الأكبر من 200,000 token عامل تمييز مهم. بالنسبة لحالات الاستخدام التي تتضمن تحليل المستندات الكبيرة، أو الحفاظ على سجلات المحادثات الطويلة، أو معالجة قواعد الأكواد الشاملة، يمكن لهذه الميزة وحدها أن توفر قيمة هائلة، مما يبرر التكلفة المتميزة المرتبطة بالفئة الأعلى. تفتقر العديد من النماذج المنافسة إما إلى هذه القدرة أو تقدمها بتكاليف ضمنية أعلى.
  3. التسعير التنافسي (نسبيًا): كما تم تسليط الضوء عليه سابقًا، عند مقارنته بـ Sonnet من Anthropic أو نماذج OpenAI الأعلى مثل GPT-4.5 أو o1-pro الأكثر تكلفة، يبدو تسعير Gemini 2.5 Pro تنافسيًا، إن لم يكن مفيدًا بشكل صريح. قد يرى المطورون الذين يقارنون هذه النماذج عالية الأداء المحددة أن عرض Google يوفر نتائج من الدرجة الأولى دون التكلفة الأعلى المطلقة.
  4. توفر الفئة المجانية: يتيح وجود فئة مجانية محدودة المعدل للمطورين التحقق من ملاءمة النموذج لاحتياجاتهم قبل الالتزام بالاستخدام المدفوع، مما يقلل من حاجز الدخول ويعزز حسن النية.

يشير الاستقبال الإيجابي إلى أن Google قد نجحت في توصيل عرض القيمة - حيث وضعت Gemini 2.5 Pro ليس فقط كنموذج ذكاء اصطناعي واحد، ولكن كأداة عالية الأداء تتوافق تكلفتها مع قدراتها المتقدمة ومكانتها التنافسية.

التكلفة المتزايدة للذكاء الاصطناعي المتطور

الاتجاه الأساسي الملحوظ عبر صناعة الذكاء الاصطناعي هو ضغط تصاعدي ملحوظ على تسعير النماذج الرائدة. بينما أدى قانون مور تاريخيًا إلى خفض تكاليف الحوسبة، يبدو أن تطوير ونشر أحدث وأقوى نماذج اللغة الكبيرة يتحدى هذا الاتجاه، على الأقل في الوقت الحالي. بشكل عام، تطلبت الإصدارات الأخيرة من الدرجة الأولى من مختبرات الذكاء الاصطناعي الكبرى مثل Google و OpenAI و Anthropic أسعارًا أعلى من سابقاتها أو أشقائها من الفئات الأدنى.

يعد o1-pro الذي أطلقته OpenAI مؤخرًا مثالًا صارخًا على هذه الظاهرة. إنه يمثل أغلى عرض API للشركة حتى الآن، بسعر مذهل يبلغ 150 دولارًا لكل مليون token إدخال و 600 دولار لكل مليون token إخراج. هذا التسعير يتضاءل أمامه حتى سعر GPT-4.5 ويجعل Gemini 2.5 Pro يبدو اقتصاديًا بالمقارنة.

تساهم عدة عوامل على الأرجح في مسار الأسعار المتصاعد هذا للنماذج الحديثة:

  • المتطلبات الحسابية المكثفة: يتطلب تدريب هذه النماذج الضخمة قوة حاسوبية هائلة، غالبًا ما تتضمن آلاف المعالجات المتخصصة (مثل GPUs أو TPUs من Google) تعمل لأسابيع أو أشهر. يؤدي هذا إلى تكاليف كبيرة من حيث اقتناء الأجهزة وصيانتها، وبشكل حاسم، استهلاك الطاقة.
  • تكاليف الاستدلال (Inference): يستهلك تشغيل النماذج للمستخدمين (الاستدلال) أيضًا موارد حسابية كبيرة. يعني الطلب المرتفع توسيع البنية التحتية للخوادم، مما يترجم مرة أخرى إلى نفقات تشغيلية أعلى. يمكن أن تكون النماذج ذات عدد المعلمات الأكبر أو البنى المتقدمة مثل Mixture-of-Experts (MoE) مكلفة بشكل خاص للتشغيل على نطاق واسع.
  • استثمار البحث والتطوير: يتطلب دفع حدود الذكاء الاصطناعي استثمارًا ضخمًا ومستمرًا في البحث واكتساب المواهب والتجريب. تحتاج الشركات إلى استرداد تكاليف البحث والتطوير الكبيرة هذه من خلال عروضها التجارية.
  • ارتفاع الطلب في السوق: مع إدراك الشركات والمطورين بشكل متزايد للإمكانات التحويلية للذكاء الاصطناعي المتقدم، يتزايد الطلب على النماذج الأكثر قدرة. تملي أساسيات الاقتصاد أن الطلب المرتفع، إلى جانب التكلفة العالية للعرض (موارد الحوسبة)، يمكن أن يؤدي إلى ارتفاع الأسعار، خاصة للمنتجات المتميزة.
  • التسعير على أساس القيمة: قد تقوم مختبرات الذكاء الاصطناعي بتسعير نماذجها العليا بناءً على القيمة المتصورة التي تقدمها بدلاً من مجرد استرداد التكاليف. إذا كان بإمكان النموذج تحسين الإنتاجية بشكل كبير، أو أتمتة المهام المعقدة، أو تمكين تطبيقات جديدة تمامًا، فقد يكون المستخدمون على استعداد لدفع علاوة مقابل هذه القدرة.

يعطي تعليق الرئيس التنفيذي لشركة Google، Sundar Pichai، وزنًا لعامل الطلب. وأشار إلى أن Gemini 2.5 Pro هو حاليًا نموذج الذكاء الاصطناعي الأكثر طلبًا من الشركة بين المطورين. أدت هذه الشعبية إلى زيادة بنسبة 80٪ في الاستخدام داخل منصة Google AI Studio ومن خلال Gemini API في الشهر الحالي وحده. يؤكد هذا التبني السريع على شهية السوق لأدوات الذكاء الاصطناعي القوية ويوفر مبررًا لهيكل التسعير المتميز.

يشير هذا الاتجاه إلى تجزئة محتملة للسوق حيث تأتي القدرات المتطورة بعلاوة كبيرة، بينما تصبح النماذج الأكثر رسوخًا أو الأقل قوة سلعية بشكل متزايد وبأسعار معقولة. سيكون التحدي للمطورين والشركات هو التقييم المستمر لنسبة التكلفة إلى الفائدة، وتحديد متى تبرر الميزات المتقدمة للنماذج الرائدة الإنفاق الأعلى مقارنة بالبدائل ‘الجيدة بما فيه الكفاية’. يعد تسعير Gemini 2.5 Pro نقطة بيانات واضحة في هذا التطور المستمر لسوق الذكاء الاصطناعي.