انثروبيك وغزو الشركات: كلود 3.7 وكيل الترميز المفضل

كلود 3.7 سونيت: معيار جديد في براعة الترميز

يعد الإصدار الأخير من Claude 3.7 Sonnet، قبل أسبوعين فقط، بمثابة دليل مقنع. لقد حطم هذا التكرار الأخير الأرقام القياسية الحالية لأداء الترميز. وبالتزامن مع ذلك، كشفت Anthropic النقاب عن Claude Code، وهو وكيل ذكاء اصطناعي يعمل بسطر الأوامر ومصمم لتسريع تطوير التطبيقات للمبرمجين. وبالإضافة إلى هذا الزخم، ورد أن Cursor، وهو محرر أكواد مدعوم بالذكاء الاصطناعي ويعتمد افتراضيًا على نموذج Claude الخاص بـ Anthropic، قد ارتفع بشكل كبير ليصل إلى 100 مليون دولار من الإيرادات السنوية المتكررة في غضون 12 شهرًا فقط.

يتزامن تركيز Anthropic المتعمد على الترميز مع الاعتراف المتزايد بين الشركات بالإمكانات التحويلية لوكلاء ترميز الذكاء الاصطناعي. يمكّن هؤلاء الوكلاء كلاً من المطورين ذوي الخبرة والأفراد الذين ليس لديهم خبرة في الترميز من إنشاء تطبيقات بسرعة وكفاءة غير مسبوقتين. وكما صرح غييرمو راوش، الرئيس التنفيذي لشركة Vercel، وهي شركة سريعة التوسع تمكن المطورين (بما في ذلك غير المبرمجين) من نشر تطبيقات الواجهة الأمامية، بشكل مناسب، ‘تواصل Anthropic التفوق’. قرار Vercel في العام الماضي بتحويل نموذج الترميز الأساسي الخاص بها من GPT الخاص بـ OpenAI إلى Claude الخاص بـ Anthropic، بعد إجراء تقييم شامل لأدائهم في مهام الترميز الحاسمة، يؤكد هذه النقطة.

لقد أثبت Claude 3.7 Sonnet، الذي تم إطلاقه في 24 فبراير، أنه قد أخذ زمام المبادرة في جميع معايير الترميز تقريبًا. لقد حقق نسبة رائعة بلغت 70.3٪ في معيار SWE-bench ذي الأهمية الكبيرة، وهو مقياس لقدرات تطوير البرامج الخاصة بالوكيل. تتجاوز هذه النتيجة بشكل كبير نتائج أقرب منافسيها، o1 من OpenAI (48.9٪) و DeepSeek-R1 (49.2٪). علاوة على ذلك، يُظهر Claude 3.7 أداءً فائقًا في المهام الوكيلة.

تم التحقق من صحة نتائج المعايير هذه بسرعة من قبل مجتمعات المطورين من خلال الاختبارات الواقعية. المناقشات عبر الإنترنت، لا سيما على منصات مثل Reddit، التي تقارن Claude 3.7 بـ Grok 3 (أحدث طراز من xAI الخاص بـ Elon Musk)، تفضل باستمرار نموذج Anthropic لمهام الترميز. لخص أحد كبار المعلقين هذا الشعور: ‘بناءً على ما اختبرته، يبدو أن Claude 3.7 هو الأفضل لكتابة التعليمات البرمجية (على الأقل بالنسبة لي)’. من المهم جدًا الإشارة إلى أنه حتى Manus، الوكيل الصيني الجديد متعدد الأغراض الذي اجتاح العالم في وقت سابق من هذا الأسبوع، قال إنه أفضل من Deep Research الخاص بـ Open AI والمهام المستقلة الأخرى، تم بناؤه إلى حد كبير على Claude.

التركيز الاستراتيجي: مسرحية Anthropic المؤسسية

إن تركيز Anthropic الثابت على قدرات الترميز ليس مصادفة على الإطلاق. تشير التوقعات المسربة التي أبلغت عنها The Information إلى أن Anthropic تهدف إلى تحقيق إيرادات مذهلة تبلغ 34.5 مليار دولار بحلول عام 2027. ويمثل هذا زيادة قدرها 86 ضعفًا عن مستوياتها الحالية. من المتوقع أن ينبع جزء كبير (حوالي 67٪) من هذه الإيرادات المتوقعة من أعمال API، مع تطبيقات الترميز المؤسسية التي تعمل كمحرك النمو الأساسي. في حين أن Anthropic لم تكشف عن أرقام إيرادات دقيقة، فقد أبلغت عن زيادة ملحوظة بنسبة 1000٪ في إيرادات الترميز خلال الربع الأخير من عام 2024. وبالإضافة إلى هذا الزخم المالي، أعلنت Anthropic مؤخرًا عن جولة تمويل بقيمة 3.5 مليار دولار، مما يقدر قيمة الشركة بمبلغ مثير للإعجاب. 61.5 مليار دولار.

تتوافق هذه الاستراتيجية التي تركز على الترميز مع نتائج مؤشر Anthropic الاقتصادي الخاص. كشف المؤشر أن 37.2٪ من الاستعلامات الموجهة إلى Claude تندرج ضمن فئة ‘الكمبيوتر والرياضيات’. شملت هذه الاستعلامات في المقام الأول مهام هندسة البرمجيات مثل تعديل التعليمات البرمجية وتصحيح الأخطاء واستكشاف أخطاء الشبكة وإصلاحها.

يبرز نهج Anthropic وسط المشهد التنافسي، حيث غالبًا ما يقع المنافسون في دوامة من النشاط، في محاولة لتلبية احتياجات كل من المؤسسات والمستهلكين بمجموعة واسعة من الميزات. تواجه OpenAI، مع الحفاظ على تقدم قوي بسبب اعتراف المستهلك المبكر واعتماده، تحدي خدمة كل من المستخدمين العاديين والشركات بمجموعة متنوعة من النماذج والوظائف. وبالمثل، تتبع Google استراتيجية تتمثل في تقديم مجموعة واسعة من المنتجات.

ينعكس نهج Anthropic المنضبط نسبيًا أيضًا في قرارات منتجاتها. بدلاً من مطاردة حصة السوق الاستهلاكية، أعطت الشركة الأولوية للميزات على مستوى المؤسسة مثل تكامل GitHub وسجلات التدقيق والأذونات القابلة للتخصيص وضوابط الأمان الخاصة بالمجال. قبل ستة أشهر، قدمت نافذة سياق ضخمة مكونة من 500000 رمز للمطورين، وهو تناقض صارخ مع قرار Google بقصر نافذة المليون رمز على المختبرين الخاصين. وقد أدى هذا التركيز الاستراتيجي إلى عرض شامل يركز على الترميز ويلقى صدى متزايدًا لدى المؤسسات.

إن تقديم الشركة الأخير للميزات التي تمكن غير المبرمجين من نشر التطبيقات التي تم إنشاؤها بواسطة الذكاء الاصطناعي داخل مؤسساتهم، إلى جانب ترقية وحدة التحكم الأسبوع الماضي التي تتميز بقدرات تعاون محسنة (بما في ذلك المطالبات والقوالب القابلة للمشاركة)، يوضح هذا الاتجاه بشكل أكبر. تعكس هذه الديمقراطية استراتيجية ‘حصان طروادة’: تمكين المطورين في البداية من بناء أسس قوية، يليه توسيع نطاق الوصول إلى القوى العاملة الأوسع في المؤسسة، والوصول في النهاية إلى جناح الشركة.

تجربة عملية مع كلود: تجربة عملية

لتقييم القدرات الواقعية لوكلاء الترميز هؤلاء، تم إجراء تجربة عملية، مع التركيز على بناء قاعدة بيانات لتخزين المقالات. تم استخدام ثلاثة أساليب متميزة: Claude 3.7 Sonnet من خلال تطبيق Anthropic، ووكيل الترميز الخاص بـ Cursor، و Claude Code.

باستخدام Claude 3.7 مباشرةً من خلال تطبيق Anthropic، كانت الإرشادات المقدمة ثاقبة بشكل ملحوظ، خاصةً بالنسبة لشخص ليس لديه خبرة واسعة في الترميز. قدم النموذج العديد من الخيارات، بدءًا من الحلول القوية التي تستخدم قواعد بيانات PostgreSQL إلى بدائل أخف مثل Airtable. باختيار الحل الخفيف، وجه Claude بشكل منهجي عملية استخراج المقالات من واجهة برمجة التطبيقات ودمجها في Airtable باستخدام خدمة موصل. في حين استغرقت العملية حوالي ساعتين، ويرجع ذلك أساسًا إلى تحديات المصادقة، فقد بلغت ذروتها في نظام وظيفي. بشكل أساسي، بدلاً من كتابة جميع التعليمات البرمجية بشكل مستقل، قدم Claude مخططًا شاملاً لتحقيق النتيجة المرجوة.

قدم Cursor، باعتماده الافتراضي على نماذج Claude، تجربة محرر أكواد كاملة وأظهر ميلًا أكبر نحو الأتمتة. ومع ذلك، فقد تطلب الأمر إذنًا في كل خطوة، مما أدى إلى سير عمل تكراري إلى حد ما.

قدم Claude Code نهجًا مختلفًا، حيث يعمل مباشرةً داخل المحطة الطرفية ويستخدم SQLite لإنشاء قاعدة بيانات محلية مليئة بالمقالات من موجز RSS. أثبت هذا الحل أنه أبسط وأكثر موثوقية في تحقيق الهدف النهائي، وإن كان أقل قوة وغنى بالميزات مقارنةً بتنفيذ Airtable. يسلط هذا الضوء على المقايضات المتأصلة ويؤكد على أهمية اختيار وكيل ترميز بناءً على متطلبات المشروع المحددة.

الاستنتاج الرئيسي من هذه التجربة هو أنه حتى كمطور غير مطور، كان من الممكن إنشاء تطبيقات قواعد بيانات وظيفية باستخدام جميع الأساليب الثلاثة. كان هذا سيكون أمرًا لا يمكن تصوره تقريبًا قبل عام واحد فقط. والجدير بالذكر أن جميع الأساليب الثلاثة اعتمدت على قدرات Claude الأساسية.

النظام البيئي لوكيل الترميز: Cursor وما بعده

ربما يكون المؤشر الأكثر إقناعًا لنجاح Anthropic هو النمو الهائل لـ Cursor، وهو محرر أكواد AI. تشير التقارير إلى أن Cursor قد جمع 360.000 مستخدم، مع أكثر من 40.000 منهم من العملاء الذين يدفعون، في غضون 12 شهرًا فقط. من المحتمل أن يضع مسار النمو السريع هذا Cursor كأسرع شركة SaaS تصل إلى هذا الإنجاز.

يرتبط نجاحCursor ارتباطًا جوهريًا بـ Claude. كما لاحظ سام ويتفين، المؤسس المشارك لـ Red Dragon (مطور مستقل لوكلاء الذكاء الاصطناعي)، ‘عليك أن تعتقد أن عميلهم الأول هو Cursor. كان معظم الأشخاص في [Cursor] يستخدمون نموذج Claude Sonnet - نماذج 3.5 - بالفعل. والآن يبدو أن الجميع ينتقلون إلى 3.7.’

تمتد العلاقة بين Anthropic ونظامها البيئي إلى ما هو أبعد من الشركات الفردية مثل Cursor. في نوفمبر، قدمت Anthropic بروتوكول سياق النموذج (MCP) كمعيار مفتوح، مما يمكّن المطورين من إنشاء أدوات تتفاعل بسلاسة مع نماذج Claude. وقد اكتسب هذا المعيار اعتمادًا واسع النطاق داخل مجتمع المطورين.

أوضح ويتفين أهمية هذا النهج: ‘من خلال إطلاق هذا كبروتوكول مفتوح، فإنهم يقولون نوعًا ما، ‘مرحبًا بالجميع، تفضلوا. يمكنك تطوير ما تريد أن يناسب هذا البروتوكول. سنقوم بدعم هذا البروتوكول.’’

تخلق هذه الاستراتيجية حلقة حميدة: يقوم المطورون ببناء أدوات خصيصًا لـ Claude، مما يعزز عرض القيمة الخاص به للمؤسسات، والذي بدوره يدفع إلى مزيد من التبني ويجذب المزيد من المطورين.

المشهد التنافسي: Microsoft و OpenAI و Google والمصدر المفتوح

في حين أن Anthropic قد نحتت مكانة خاصة بها من خلال نهجها المركز، فإن المنافسين يتبعون استراتيجيات متنوعة بدرجات متفاوتة من النجاح.

تحتفظ Microsoft بموطئ قدم قوي من خلال GitHub Copilot الخاص بها، حيث تفتخر بـ 1.3 مليون مستخدم مدفوع الأجر واعتمادها من قبل أكثر من 77000 مؤسسة في غضون عامين تقريبًا. الشركات البارزة مثل Honeywell و State Street و TD Bank Group و Levi’s هي من بين مستخدميها. يُعزى هذا التبني الواسع النطاق إلى حد كبير إلى علاقات Microsoft الحالية مع المؤسسات وميزة المحرك الأول، النابعة من استثمارها المبكر في OpenAI واستخدام نماذج OpenAI لتشغيل Copilot.

ومع ذلك، حتى Microsoft اعترفت بنقاط قوة Anthropic. في أكتوبر، مكّنت مستخدمي GitHub Copilot من تحديد نماذج Anthropic كبديل لعروض OpenAI. علاوة على ذلك، لم تُظهر نماذج OpenAI الحديثة، o1 و o3 الأحدث (التي تؤكد على التفكير من خلال التفكير الممتد)، مزايا خاصة في الترميز أو المهام الوكيلة.

قامت Google بخطوتها الخاصة من خلال تقديم Code Assist مجانًا مؤخرًا، ولكن يبدو أن هذا يمثل مناورة دفاعية أكثر من كونه مبادرة استراتيجية.

تمثل حركة المصدر المفتوح قوة مهمة أخرى في هذا المشهد. حازت نماذج Llama الخاصة بـ Meta على قوة جذب كبيرة للمؤسسات، حيث قامت شركات كبرى مثل AT&T و DoorDash و Goldman Sachs بنشر نماذج قائمة على Llama لتطبيقات مختلفة. يوفر نهج المصدر المفتوح للمؤسسات تحكمًا أكبر وخيارات تخصيص وفوائد تكلفة لا يمكن للنماذج المغلقة غالبًا مطابقتها.

بدلاً من اعتبار هذا تهديدًا مباشرًا، يبدو أن Anthropic تضع نفسها على أنها مكملة للمصدر المفتوح. يمكن لعملاء المؤسسات الاستفادة من Claude جنبًا إلى جنب مع نماذج المصدر المفتوح اعتمادًا على متطلباتهم الخاصة، واعتماد نهج هجين يزيد من نقاط القوة لكل منها.

في الواقع، اعتمدت العديد من شركات المؤسسات الكبيرة نهجًا متعدد الوسائط، باستخدام أي نموذج هو الأنسب لمهمة معينة. على سبيل المثال، اعتمدت Intuit في البداية على OpenAI كإعداد افتراضي لتطبيقات الإقرار الضريبي الخاصة بها ولكنها تحولت لاحقًا إلى Claude نظرًا لأدائها المتفوق في سيناريوهات معينة. أدت هذه التجربة إلى قيام Intuit بتطوير إطار عمل لتنسيق الذكاء الاصطناعي سهل التبديل السلس بين النماذج.

منذ ذلك الحين، اعتمدت معظم شركات المؤسسات الأخرى ممارسة مماثلة، حيث تستخدم النموذج الأنسب لكل حالة استخدام محددة، وغالبًا ما تدمج النماذج من خلال استدعاءات API بسيطة. في حين أن نموذجًا مفتوح المصدر مثل Llama قد يكون مناسبًا في بعض الحالات، غالبًا ما يكون Claude هو الخيار المفضل للمهام التي تتطلب دقة عالية، مثل العمليات الحسابية.

الآثار المترتبة على المؤسسة: التنقل في التحول إلى وكلاء الترميز

بالنسبة لصناع القرار في المؤسسات، يقدم هذا المشهد سريع التطور فرصًا وتحديات.

لا يزال الأمن يمثل مصدر قلق بالغ، لكن تقريرًا مستقلاً حديثًا حدد Claude 3.7 Sonnet باعتباره النموذج الأكثر أمانًا حتى الآن، كونه النموذج الوحيد الذي تم اختباره والذي أثبت أنه ‘مقاوم للكسر’. يضع هذا الموقف الأمني، جنبًا إلى جنب مع دعم Anthropic من كل من Google و Amazon (والتكامل في AWS Bedrock)، في مكانة مواتية لاعتماد المؤسسة.

إن انتشار وكلاء الترميز لا يغير فقط كيفية تطوير التطبيقات؛ إنه يضفي الديمقراطية على العملية. وفقًا لـ GitHub، كان 92٪ من المطورين المقيمين في الولايات المتحدة في شركات المؤسسات يستخدمون بالفعل أدوات ترميز مدعومة بالذكاء الاصطناعي في العمل قبل 18 شهرًا. من المحتمل أن يكون هذا الرقم قد زاد بشكل كبير منذ ذلك الحين.

سلط ويتفين الضوء على سد الفجوة بين أعضاء الفريق الفنيين وغير الفنيين: ‘التحدي الذي يواجهه الأشخاص [بسبب] عدم كونهم مبرمجين هو أنهم لا يعرفون الكثير من المصطلحات. إنهم لا يعرفون أفضل الممارسات.’ تعالج وكلاء ترميز الذكاء الاصطناعي هذا التحدي بشكل متزايد، مما يتيح تعاونًا أكثر فعالية.

بالنسبة لاعتماد المؤسسة، يدعو ويتفين إلى اتباع نهج متوازن: ‘إنه التوازن بين الأمن والتجريب في الوقت الحالي. من الواضح، من جانب المطور، أن الناس بدأوا في بناء تطبيقات حقيقية باستخدام هذه الأشياء.’

يمثل ظهور وكلاء ترميز الذكاء الاصطناعي تحولًا جوهريًا في تطوير برامج المؤسسات. عند نشر هذه الأدوات بفعالية، فإنها لا تحل محل المطورين بل تحول أدوارهم، مما يسمح لهم بالتركيز على البنية والابتكار بدلاً من تفاصيل التنفيذ.

يبدو أن نهج Anthropic المنضبط، الذي يركز بشكل خاص على قدرات الترميز بينما يتابع المنافسون أولويات متعددة، يحقق مزايا كبيرة. بحلول نهاية عام 2025، قد يُنظر إلى هذه الفترة بأثر رجعي على أنها اللحظة المحورية التي أصبحت فيها وكلاء ترميز الذكاء الاصطناعي أدوات مؤسسية لا غنى عنها، مع قيادة Claude.

بالنسبة لصناع القرار التقنيين، فإن الضرورة واضحة: ابدأ التجريب بهذه الأدوات على الفور أو خاطر بالتخلف عن المنافسين الذين يستفيدون منها بالفعل لتسريع دورات التطوير بشكل كبير. يشبه هذا الموقف الأيام الأولى لثورة iPhone، حيث حاولت الشركات في البداية تقييد الأجهزة ‘غير المصرح بها’ من شبكاتها المؤسسية، فقط لتبني سياسات BYOD في النهاية حيث أصبح طلب الموظفين ساحقًا. حاولت بعض الشركات، مثل Honeywell، مؤخرًا إيقاف الاستخدام ‘المارق’ لأدوات ترميز الذكاء الاصطناعي التي لم توافق عليها تكنولوجيا المعلومات.

تقوم الشركات الذكية بالفعل بإنشاء بيئات اختبار معزولة آمنة لتسهيل التجريب الخاضع للرقابة. ستحصد المنظمات التي تضع حواجز حماية واضحة مع تعزيز الابتكار فوائد حماس الموظفين والرؤى حول كيفية خدمة هذه الأدوات لاحتياجاتهم الفريدة على أفضل وجه، مما يضع أنفسهم في صدارة المنافسين الذين يقاومون التغيير. و Anthropic’s Claude، على الأقل في الوقت الحاضر، هو المستفيد الرئيسي من هذه الحركة التحويلية.