يتطور مشهد الذكاء الاصطناعي بوتيرة متسارعة، مع ظهور نماذج وقدرات جديدة بين عشية وضحاها على ما يبدو. من بين عمالقة الصناعة، أحدثت Google مؤخرًا ضجة كبيرة من خلال تقديم نموذجها المتطور Gemini 2.5 مجانًا للجمهور، وهو تحول كبير عن توفره السابق فقط من خلال اشتراك مميز. وضع هذا التحرك Gemini 2.5، الذي تم الإشادة به لقدراته المعززة في الاستدلال، وبراعته في البرمجة، ووظائفه متعددة الوسائط، كمنافس مباشر في مجال الذكاء الاصطناعي المتاح. أشارت معايير Google الخاصة إلى أداء مثير للإعجاب، لا سيما في التقييمات المعقدة القائمة على المعرفة، مما يجعله أداة هائلة.
ومع ذلك، في الساحة الديناميكية لمقارنات الذكاء الاصطناعي، لا تتوافق التوقعات دائمًا مع النتائج. كانت سلسلة سابقة من الاختبارات قد توجت بشكل مفاجئ DeepSeek، وهو اسم أقل شهرة عالميًا، كأداء قادر بشكل ملحوظ عبر مهام مختلفة. نشأ السؤال الطبيعي: كيف سيكون أداء أحدث عرض مجاني من Google، Gemini 2.5، ضد هذا البطل غير المتوقع عند إخضاعه لنفس المجموعة الصارمة من المطالبات؟ يتعمق هذا التحليل في مقارنة مباشرة عبر تسعة تحديات مميزة، مصممة لاستكشاف أعماق قدرات كل ذكاء اصطناعي في الإبداع، والاستدلال، والفهم التقني، والمزيد، مما يوفر وصفًا تفصيليًا لنقاط القوة والضعف لكل منهما.
التحدي 1: صياغة قصة خيالية للأطفال
غامر الاختبار الأول في عالم الكتابة الإبداعية، مستهدفًا بشكل خاص القدرة على تبني نبرة لطيفة وخيالية مناسبة لقصة ما قبل النوم للأطفال. طلبت المطالبة الفقرة الافتتاحية لحكاية عن روبوت متوتر يكتشف الشجاعة داخل غابة تسكنها حيوانات مغنية. لا تقيم هذه المهمة توليد اللغة فحسب، بل تقيم أيضًا الفروق الدقيقة العاطفية، واتساق النبرة، وبناء العالم الخيالي المصمم خصيصًا لجمهور صغير.
أنتج Gemini 2.5 سردًا كان بالتأكيد كفؤًا. قدم Bolt، الروبوت، ونقل قلقه بشكل فعال. أظهر إدراج التفاصيل البيئية مثل ‘الفطر المتوهج’ و ‘الجداول الهامسة’ قدرة على بناء العالم، مما أضاف نسيجًا إلى المشهد. ومع ذلك، بدت النثر مطولة إلى حد ما ومائلة نحو الشرح بدلاً من السحر. على الرغم من كونه سليمًا من الناحية الوظيفية، إلا أن الفقرة افتقرت إلى جودة غنائية معينة؛ بدا الإيقاع وصفيًا أكثر منه موسيقيًا، ومن المحتمل أن يفتقد الإيقاع المهدئ المثالي لقصة ما قبل النوم. لقد أسس الشخصية والإعداد بوضوح، لكن التنفيذ بدا إجرائيًا أكثر بقليل من كونه شاعريًا.
على النقيض من ذلك، غمر DeepSeek القارئ على الفور في بيئة أكثر ثراءً من الناحية الحسية ومشبعة بالموسيقى. استخدم وصفه للغابة استعارات ولغة استحضرت الصوت والضوء بطريقة تشبه الحلم، متوافقة تمامًا مع النبرة الخيالية المطلوبة. بدا النثر نفسه يمتلك إيقاعًا لطيفًا، مما يجعله مناسبًا بطبيعته للقراءة بصوت عالٍ في وقت النوم. كان هناك صدى عاطفي في تصويره للروبوت المتوتر داخل هذا الإعداد الساحر الذي بدا أكثر بديهية وجاذبية للطفل. رسمت الخيارات اللغوية مشهدًا لم يتم وصفه فحسب، بل تم الشعور به، مما يدل على فهم أقوى للنسيج الجوي والعاطفي المطلوب.
الحكم: لتفوقه في إتقان اللغة الشعرية، وخلقه جوًا خياليًا حقيقيًا من خلال التفاصيل الحسية والاستعارات الموسيقية، وإيقاعه المناسب لوقت النوم، برز DeepSeek كفائز في هذا التحدي الإبداعي. لم يروِ بداية قصة فحسب؛ بل صاغ دعوة إلى عالم لطيف وسحري.
التحدي 2: تقديم إرشادات عملية لقلق طفولي شائع
بالانتقال من التعبير الإبداعي إلى حل المشكلات العملية، تناولت المطالبة الثانية سيناريو شائعًا في تربية الأبناء: مساعدة طفل يبلغ من العمر 10 سنوات على التغلب على التوتر بشأن التحدث أمام فصله. كان الطلب هو ثلاث استراتيجيات قابلة للتنفيذ يمكن للوالد تعليمها لطفله لتعزيز الثقة. يختبر هذا التحدي قدرة الذكاء الاصطناعي على تقديم نصائح متعاطفة ومناسبة للعمر ومفيدة حقًا.
قدم Gemini 2.5 استراتيجيات كانت سليمة بشكل أساسي ومنطقية. النصيحة - التي من المحتمل أن تتضمن الممارسة، والحديث الذاتي الإيجابي، وربما التركيز على الرسالة - تمثل تقنيات قياسية وفعالة لإدارة قلق التحدث أمام الجمهور. سيجد الوالد الذي يتلقى هذه النصيحة أنها معقولة وصحيحة. ومع ذلك، بدت النبرة والعرض موجهين بشكل واضح للبالغين. افتقرت اللغة المستخدمة إلى العناصر الخيالية أو المرحة التي غالبًا ما يكون لها صدى أكثر فعالية لدى طفل يبلغ من العمر 10 سنوات. الاستراتيجيات، على الرغم من صحتها، تم تقديمها كتعليمات أكثر من كونها أنشطة جذابة، مما قد يفوت فرصة لجعل العملية أقل صعوبة للطفل. كان التركيز على الجوانب المعرفية بدلاً من دمج الأساليب اللمسية أو القائمة على الفكاهة التي يمكن أن تكون فعالة بشكل خاص في نزع فتيل مخاوف الطفولة.
اتبع DeepSeek نهجًا مختلفًا بشكل ملحوظ. في حين أن استراتيجياته المقترحة كانت عملية أيضًا، فقد تم تأطيرها بطريقة أكثر انسجامًا مع منظور الطفل. لم يقتصر الأمر على سرد التقنيات؛ بل اقترح كيفية ممارستها بطرق يمكن اعتبارها ممتعة أو تفاعلية، مما يحول مهمة مرهقة محتملة إلى شيء أكثر ودية. على سبيل المثال، قد يقترح الممارسة أمام الحيوانات المحشوة أو استخدام أصوات مضحكة. بشكل حاسم، بدا أن DeepSeek يستهدف الأسس العاطفية المحددة لخوف الطفل من التحدث أمام الجمهور، معترفًا بالتوتر وتقديم آليات التكيف (مثل التنفس العميق المقدم كلعبة) جنبًا إلى جنب مع استراتيجيات الممارسة. تضمن نصائح إضافية تركز على تقنيات التهدئة الفورية، مما يدل على فهم أكثر شمولية لإدارة القلق لدى شخص صغير. كانت اللغة مشجعة ومصممة بشكل مثالي لينقلها الوالد إلى طفله البالغ من العمر 10 سنوات.
الحكم: ضمن DeepSeek الفوز في هذه الجولة بسبب إرشاداته الأكثر إبداعًا وتعاطفًا وملاءمة للعمر. لقد أظهر قدرة فائقة على تكييف النصائح العملية مع الاحتياجات العاطفية والمعرفية المحددة للطفل، مقدمًا استراتيجيات لم تكن فعالة فحسب، بل تم تقديمها أيضًا بطريقة جذابة ومطمئنة.
التحدي 3: تحليل أساليب القيادة – Mandela مقابل Jobs
انتقل التحدي الثالث إلى التفكير التحليلي، طالبًا مقارنة بين أساليب القيادة لدى Nelson Mandela و Steve Jobs. تطلبت المطالبة تحديد ما جعل كل قائد فعالًا وتحديد اختلافاتهم الرئيسية. تقيم هذه المهمة قدرة الذكاء الاصطناعي على تجميع المعلومات حول الشخصيات المعقدة، وإجراء مقارنات دقيقة، وتحديد السمات الأساسية، والتعبير عن تحليله بوضوح.
قدم Gemini 2.5 استجابة كانت جيدة التنظيم وشاملة ودقيقة من الناحية الواقعية، تشبه إدخالًا مكتوبًا جيدًا في كتاب مدرسي للأعمال أو تقريرًا مدرسيًا شاملاً. لقد حدد بشكل صحيح الجوانب الرئيسية لأسلوب كل قائد، ومن المحتمل أن يشير إلى مفاهيم مثل قيادة الخدمة لدى Mandela ونهج Jobs البصري، والمتطلب أحيانًا. ساعد استخدام عناوين واضحة مثل ‘الفعالية’ و ‘الاختلافات الرئيسية’ في التنظيم وسهولة القراءة. ومع ذلك، فإن التحليل، على الرغم من صحته، بدا سريريًا إلى حد ما وافتقر إلى طبقة تفسيرية أعمق. لقد حدد ووصف سمات القيادة ولكنه قدم رؤية أقل حول تأثير أو صدى هذه الأساليب بما يتجاوز المستوى السطحي. كانت النبرة إعلامية ولكنها افتقرت إلى القوة المقنعة أو العمق العاطفي الذي قد تحققه مقارنة أكثر تبصرًا.
اقترب DeepSeek من المقارنة بدرجة أكبر من البراعة التحليلية والذوق السردي. لقد نظم تحليله على طول أبعاد محددة وثاقبة - مثل الرؤية، والاستجابة للشدائد، وأسلوب الاتصال، وعمليات صنع القرار، والإرث - مما سمح بمقارنة أكثر تفصيلاً ومباشرة عبر جوانب القيادة ذات الصلة. وفر هذا الإطار الوضوح والعمق في وقت واحد. الأهم من ذلك، تمكن DeepSeek من الموازنة بين الإعجاب بكلا الشخصيتين بمنظور نقدي، متجنبًا التقديس البسيط. كانت اللغة المستخدمة أكثر إيحاءً وتفسيرًا، ولم تهدف فقط إلى الوصف ولكن إلى إلقاء الضوء على جوهر مقارباتهما وتأثيراتهما المختلفة. لم ينقل الحقائق فحسب، بل نقل أيضًا إحساسًا بالدراما الإنسانية والأهمية التاريخية المعنية، مما جعل المقارنة لا تُنسى وجذابة أكثر.
الحكم: لتفوق هيكله التحليلي، ورؤاه التفسيرية الأعمق، وأسلوبه السردي الأكثر إقناعًا، وقدرته على نقل الصدى العاطفي والتاريخي جنبًا إلى جنب مع المقارنة الواقعية، فاز DeepSeek بهذا التحدي. لقد تجاوز مجرد الوصف ليقدم فهمًا أعمق لنموذجي القيادة المتميزين.
التحدي 4: شرح التكنولوجيا المعقدة – حالة Blockchain
اختبرت المهمة الرابعة القدرة على تبسيط موضوع تقني معقد: blockchain. تطلبت المطالبة شرحًا بسيطًا لكيفية عمل blockchain، متبوعًا بشرح لتطبيقه المحتمل في تتبع سلسلة التوريد. يقيم هذا الوضوح، والاستخدام الفعال للقياس، والقدرة على ربط المفاهيم المجردة بالاستخدامات الملموسة في العالم الحقيقي.
استخدم Gemini 2.5 استعارة دفتر الملاحظات الرقمي لشرح مفهوم blockchain، وهي نقطة انطلاق مفيدة محتملة. كان شرحه دقيقًا وغطى العناصر الأساسية للسجلات الموزعة والربط المشفر. ومع ذلك، مال الشرح نحو جمل أطول ونبرة رسمية تشبه الكتب المدرسية، والتي لا يزال من الممكن أن تبدو كثيفة أو ثقيلة إلى حد ما للمبتدئ الحقيقي. عند مناقشة تطبيق سلسلة التوريد، قدم أمثلة صحيحة مثل تتبع القهوة أو الأدوية، لكن الوصف ظل عالي المستوى ومفاهيميًا نسبيًا، ربما لم ينقل الفوائد الملموسة أو جانب ‘الكيفية’ بطريقة حية. كان الشرح صحيحًا ولكنه أقل جاذبية مما كان يمكن أن يكون.
على العكس من ذلك، تناول DeepSeek الشرح بمزيد من الحيوية والمهارة التربوية. لقد استخدم استعارات واضحة وقوية بدت أكثر بديهية ومتاحة على الفور لجمهور غير تقني، مما أدى إلى اختراق المصطلحات بسرعة. تم تقسيم شرح blockchain نفسه إلى خطوات سهلة الهضم، مع الحفاظ على الدقة دون التبسيط المفرط لدرجة فقدان المعنى. بشكل حاسم، عند شرح تطبيق سلسلة التوريد، قدم DeepSeek أمثلة مقنعة وملموسة أعادت المفهوم إلى الحياة. لقد رسم صورة أوضح لـ كيفية توفير تتبع العناصر على blockchain لفوائد مثل الشفافية والأمن، مما يجعل التكنولوجيا تبدو مفيدة وذات صلة بدلاً من مجرد كونها معقدة. كانت النبرة العامة أكثر نشاطًا وتوضيحًا.
الحكم: حقق DeepSeek النصر في هذه الجولة من خلال تقديم شرح أكثر جاذبية وتوضيحًا وملاءمة للمبتدئين. إن استخدامه المتفوق للاستعارات والسرد الملموس جعل موضوع blockchain المعقد أكثر سهولة بشكل كبير وتطبيقاته العملية أسهل في الفهم.
التحدي 5: التنقل في الفروق الدقيقة في الترجمة الشعرية
تعمق هذا التحدي في خفايا اللغة والثقافة، طالبًا ترجمة سطر Emily Dickinson، ‘Hope is the thing with feathers that perches in the soul’، إلى الفرنسية واليابانية والعربية. بشكل حاسم، تطلب أيضًا شرحًا للتحديات الشعرية التي تمت مواجهتها في كل ترجمة. لا يختبر هذا قدرات الترجمة متعددة اللغات فحسب، بل يختبر أيضًا الحساسية الأدبية والفهم بين الثقافات.
قدم Gemini 2.5 ترجمات دقيقة للعبارة إلى اللغات المطلوبة. ركزت تفسيراته المصاحبة بشكل كبير على الهياكل النحوية، والتحولات المحتملة في المعنى الحرفي، وجوانب مثل النطق أو اختيار الكلمات من وجهة نظر لغوية. قدم تفصيلات مفصلة ستكون مفيدة لشخص يدرس اللغات نفسها. ومع ذلك، بدت الاستجابة أشبه بتمرين تعليم لغة تقني أكثر من كونها استكشافًا للفن الشعري. لقد عالج آليات الترجمة بفعالية ولكنه أعطى تركيزًا أقل على فقدان أو تحويل شعور الاستعارة الأصلية، أو الرنين الثقافي، أو الجودة الشعرية الفريدة عبر سياقات لغوية وثقافية مختلفة. كان التركيز ميكانيكيًا أكثر منه غنائيًا.
قدم DeepSeek أيضًا ترجمات دقيقة ولكنه تفوق في معالجة الجزء الثاني الأكثر دقة من المطالبة. تعمق شرحه بشكل أعمق في التحديات الكامنة في ترجمة الشعر، مناقشًا كيف أن الدلالات المحددة لـ ‘feathers’ و ‘perches’ و ‘soul’ قد لا يكون لها معادلات مباشرة أو قد تحمل وزنًا ثقافيًا مختلفًا في الفرنسية واليابانية والعربية. استكشف الفقدان المحتمل للصور المجازية المحددة لـ Dickinson والصعوبات في تكرار نبرة الأصل وإيقاعه الدقيق. تطرق تحليل DeepSeek إلى النقاط الفلسفية والثقافية المتعلقة بمفهوم الأمل في كل سياق، مقدمًا تعليقًا أكثر ثراءً وتبصرًا على الصعوبات الشعرية، وليس فقط اللغوية. واختتم بملخص مدروس أكد على التعقيدات التي ينطوي عليها الأمر.
الحكم: نظرًا لبصيرته الأدبية الأعمق، وحساسيته الثقافية الأكبر في شرح تحديات الترجمة، والتركيز الذي يتوافق بشكل أفضل مع طلب المطالبة لاستكشاف ‘التحديات الشعرية’، فاز DeepSeek بهذه الجولة. لقد أظهر تقديرًا متفوقًا للفن والفروق الدقيقة التي تنطوي عليها ترجمة اللغة المجازية عبر الثقافات.
التحدي 6: إنشاء وشرح كود Python للأعداد الأولية
دخل التحدي السادس في مجال البرمجة، متطلبًا إنشاء دالة Python لتحديد الأعداد الأولية ضمن قائمة. بنفس القدر من الأهمية كان طلب شرح بسيط لكيفية عمل الدالة. يختبر هذا الكفاءة في البرمجة، والالتزام بأفضل الممارسات، والقدرة على شرح المنطق التقني بوضوح لغير المبرمج.
أنتج DeepSeek نص Python وظيفيًا حدد الأعداد الأولية بشكل صحيح. تم تنظيم شرحه المصاحب بعناوين أقسام وتعليقات توضيحية واضحة، مقدمًا المفاهيم بشكل منطقي. لقد حرص على شرح سبب تخطي الأرقام الأقل من 2، وهو توضيح مفيد للمبتدئين. كان الكود نفسه واضحًا، وهدف الشرح خطوة بخطوة إلى سهولة الوصول، مقسمًا منطق التحقق من العوامل. كانت استجابة قوية وكفؤة تلبي جميع جوانب المطالبة.
ومع ذلك، تميز Gemini 2.5 في وضوح وجودة شرحه التربوية. بينما قدم أيضًا كود Python صحيحًا وفعالًا، اعتمد شرحه نبرة صبورة بشكل استثنائي، تشبه البرنامج التعليمي تقريبًا. لقد استعرض المنطق بدقة، مما جعل حتى المفاهيم التي يحتمل أن تكون مربكة، مثل تحسين التحقق من العوامل حتى الجذر التربيعي للرقم فقط، تبدو بديهية ومفهومة لشخص جديد في البرمجة أو نظرية الأعداد. كان الهيكل نظيفًا، وكانت اللغة مناسبة بشكل خاص للمبتدئ الذي يسعى إلى فهم سبب عمل الكود حقًا، وليس فقط أنه يعمل. الطبيعة الشاملة والميسرة للشرح أعطته ميزة.
الحكم: في انعكاس للاتجاه السائد، ضمن Gemini 2.5 الفوز في هذا التحدي. بينما قام كلا الذكاءين الاصطناعيين بإنشاء كود صحيح وقدموا تفسيرات، اعتبر شرح Gemini متفوقًا لوضوحه الاستثنائي، وملاءمته للمبتدئين، ونبرته التربوية الصبورة التي جعلت المنطق المعقد متاحًا بشكل ملحوظ.
التحدي 7: استكشاف المناطق الرمادية الأخلاقية – تبرير الكذب
بالعودة إلى التفكير الأكثر تجريدًا، تناول التحدي السابع مسألة أخلاقية: ‘هل من الأخلاقي الكذب على الإطلاق؟’ طلب مثالًا واحدًا حيث قد يكون الكذب مبررًا أخلاقيًا، جنبًا إلى جنب مع المنطق وراء هذا التبرير. يستكشف هذا قدرة الذكاء الاصطناعي على التفكير الأخلاقي، والحجج الدقيقة، واستخدام الأمثلة المقنعة لدعم موقف أخلاقي.
عالج Gemini 2.5 السؤال بالإشارة إلى المفاهيم الأخلاقية ذات الصلة، ومن المحتمل أن يذكر أطرًا مثل العواقبية (الحكم على الأفعال من خلال نتائجها) مقابل الأخلاق الواجبة (اتباع الواجبات أو القواعد الأخلاقية). مال نهجه نحو النظري، مقدمًا مناقشة سليمة، وإن كانت أكاديمية إلى حد ما، حول سبب كون الكذب خاطئًا بشكل عام ولكنه قد يكون مسموحًا به في مواقف معينة. ومع ذلك، فإن المثال الذي قدمه لتوضيح كذبة مبررة وُصف بأنه خيالي ومعتدل التأثير فقط. على الرغم من كونه متماسكًا منطقيًا، إلا أنه افتقر إلى الوزن العاطفي أو القوة المقنعة التي يمكن أن يقدمها مثال أكثر قوة.
على النقيض تمامًا، استخدم DeepSeek معضلة أخلاقية كلاسيكية وقوية من العالم الحقيقي: سيناريو الكذب على السلطات النازية خلال الحرب العالمية الثانية لحماية اللاجئين اليهود المختبئين في منزل المرء. هذا المثال يمكن التعرف عليه على الفور، ومشحون عاطفيًا، ويقدم صراعًا واضحًا بين واجب قول الحقيقة والضرورة الأخلاقية العليا لإنقاذ الأرواح البريئة. أدى استخدام هذا السياق التاريخي المحدد عالي المخاطر إلى تعزيز الحجة بشكل كبير لصالح الكذب المبرر. لقد كان له صدى على المستويين الأخلاقي والعاطفي، مما جعل التبرير أكثر إقناعًا ولا يُنسى. ربط DeepSeek بفعالية المبدأ الأخلاقي المجرد بموقف ملموس حيث يفضل الحساب الأخلاقي بشدة الخداع من أجل الصالح العام.
الحكم: فاز DeepSeek بهذه الجولة بشكل مقنع. إن استخدامه لمثال قوي، قائم على أسس تاريخية، وله صدى عاطفي جعل حجته أكثر إقناعًا وإلزامًا من الناحية الأخلاقية من نهج Gemini الأكثر نظرية وأقل تأثيرًا. لقد أظهر سيطرة أقوى على استخدام السيناريوهات التوضيحية لاستكشاف التفكير الأخلاقي المعقد.
التحدي 8: تصور مدينة مستقبلية – اختبار للقوة الوصفية
استغل التحدي قبل الأخير الخيال البصري والكتابة الوصفية. طلبت المطالبة وصفًا لمدينة مستقبلية بعد 150 عامًا من الآن، مع التركيز على النقل والاتصالات وتكامل الطبيعة، وكل ذلك يتم نقله باستخدام لغة حية. يختبر هذا الإبداع، والتماسك في بناء العالم، والقدرة على رسم صورة مقنعة بالكلمات.
أنشأ Gemini 2.5 استجابة مفصلة، متطرقًا إلى العناصر المطلوبة للنقل والاتصالات والطبيعة في المدينة المستقبلية. تضمن مفاهيم مستقبلية مختلفة. ومع ذلك، بدا الوصف العام عامًا إلى حد ما، معتمدًا على استعارات الخيال العلمي الشائعة دون بالضرورة صياغة رؤية فريدة أو لا تُنسى حقًا. كان الهيكل أقل تنظيمًا مقارنة بمنافسه، وأحيانًا انحرفت اللغة إلى صياغة كثيفة أو منمقة بشكل مفرط (‘overwrought’)، مما قد ينتقص من الوضوح ومشاركة القارئ بدلاً من تعزيز الصور. على الرغم من وجود المكونات، إلا أن النسيج العام بدا أقل تماسكًا وتميزًا بصريًا.
من ناحية أخرى، صاغ DeepSeek رؤية بدت أكثر سينمائية ومتعددة الحواس. لقد استخدم صورًا ملموسة ومبتكرة لتصوير وسائل النقل المستقبلية (ربما كبسولات مغناطيسية صامتة، مركبات جوية شخصية)، والاتصالات (واجهات ثلاثية الأبعاد مدمجة بسلاسة)، والطبيعة (غابات عمودية، حدائق ذات إضاءة حيوية). وُصفت الأوصاف بأنها مرحة ولكنها واقعية، مما يشير إلى مستقبل متقدم تقنيًا ولكنه أيضًا مدروس من الناحية الجمالية وربما له صدى عاطفي. كان الهيكل واضحًا، يوجه القارئ عبر جوانب مختلفة من المدينة بطريقة منظمة. حققت اللغة توازنًا أفضل بين الوصف الخيالي والوضوح، مما خلق مستقبلاً بدا مذهلاً ومعقولاً إلى حد ما أو على الأقل متصورًا بوضوح.
الحكم: برز DeepSeek منتصرًا في هذا التحدي لتقديمه رؤية أكثر توازنًا، مكتوبة بشكل جميل، ومنظمة بوضوح، ومتميزة من الناحية الخيالية للمدينة المستقبلية. إن قدرته على إنشاء صور أصلية متعددة الحواس مع الحفاظ على التماسك أعطت استجابته قوة وصفية ورنينًا عاطفيًا متفوقين.
التحدي 9: إتقان التلخيص والتكيف النغمي
اختبر التحدي الأخير مهارتين متميزتين ولكنهما مرتبطتان: تلخيص نص تاريخي مهم (خطاب Gettysburg Address) بإيجاز (في ثلاث جمل) ثم إعادة كتابة هذا الملخص بنبرة مختلفة تمامًا ومحددة (نبرة قرصان). يقيم هذا الفهم، وتقطير الأفكار الأساسية، والمرونة الإبداعية في تبني صوت مميز.
أدى Gemini 2.5 كلا الجزأين من المهمة بنجاح. أنتج ملخصًا لخطاب Gettysburg Address استحوذ بدقة على النقاط الرئيسية المتعلقة بالمساواة، والغرض من الحرب الأهلية (Civil War)، والدعوة إلى التفاني في الديمقراطية. اتبعت إعادة كتابة القرصان أيضًا التعليمات، معتمدة مفردات وعبارات تشبه القراصنة (‘Ahoy’، ‘mateys’، إلخ) لنقل محتوى الملخص. كانت الاستجابة كفؤة و फुलफिलدت متطلبات المطالبة حرفيًا. ومع ذلك، فإن الملخص، على الرغم من دقته، ربما افتقر إلى وزن بلاغي معين أو عمق عاطفي يلتقط التأثير العميق للخطاب. بدت نسخة القرصان نمطية إلى حد ما، حيث أصابت استعارات القراصنة دون بالضرورة تحقيق فكاهة أو شخصية حقيقية.
قدم DeepSeek أيضًا ملخصًا دقيقًا من ثلاث جمل لخطاب Gettysburg Address، ولكن لوحظ أن ملخصه كان ثاقبًا بشكل خاص، حيث لم يلتقط المحتوى الواقعي فحسب، بل التقط أيضًا النبرة العاطفية والأهمية التاريخية لكلمات Lincoln بشكل أكثر فعالية. ومع ذلك، حيث تألق DeepSeek حقًا كان في إعادة كتابة القرصان. لم يقتصر الأمر على رش مصطلحات القراصنة على الملخص؛ بل بدا أنه يتبنى الشخصية بالكامل، منتجًا نسخة وُصفت بأنها مضحكة وجريئة وخيالية حقًا. بدت اللغة أشبه بلغة القراصنة بشكل طبيعي، مشبعة بالطاقة المرحة والشخصية، مما جعل التحول النغمي أكثر إقناعًا وتسلية.
الحكم: فاز DeepSeek بالجولة النهائية، متفوقًا في كلا جانبي التحدي. اعتبر ملخصه أكثر تبصرًا، وأظهرت إعادة كتابته بأسلوب القرصان إبداعًا وفكاهة وإتقانًا متفوقًا للتكيف النغمي، مما جعله أكثر جرأة وخيالًا من أداء منافسه.