تحسين سلسلة Granite: قدرة مركزة، بصمة أقل
تمثل نماذج Granite 3.2 من IBM استمرارًا لاستراتيجية الشركة لتطوير نماذج أصغر. تم تصميم هذه النماذج لتقديم إمكانات محددة دون فرض متطلبات مفرطة على موارد الحوسبة. يتماشى هذا النهج مع الاحتياجات العملية للعديد من الشركات التي تتطلب حلول ذكاء اصطناعي قوية وفعالة من حيث التكلفة.
هذه النماذج متاحة بشكل مفتوح بموجب ترخيص Apache 2.0 على Hugging Face. يمكن أيضًا الوصول إلى إصدارات محددة من خلال نظام watsonx.ai الأساسي الخاص بشركة IBM، بالإضافة إلى Ollama و Replicate و LM Studio. يتم تعزيز إمكانية الوصول الواسعة هذه من خلال خطط لدمج هذه النماذج في Red Hat Enterprise Linux AI 1.5 في الأشهر المقبلة، مما يعزز التزام IBM بالذكاء الاصطناعي مفتوح المصدر.
إحداث ثورة في معالجة المستندات: نموذج Granite Vision
من الميزات البارزة في هذا الإصدار نموذج لغة رؤية جديد مصمم خصيصًا لمهام فهم المستندات. يمثل هذا النموذج تقدمًا كبيرًا في كيفية تفاعل الشركات مع المعلومات واستخراجها من المستندات. وفقًا لاختبارات قياس الأداء الداخلية لشركة IBM، فإن هذا النموذج الجديد يعمل على قدم المساواة مع، أو حتى يتفوق على، نماذج منافسة أكبر بكثير في الاختبارات المصممة خصيصًا لتعكس أعباء العمل على مستوى المؤسسة.
تضمن تطوير هذه القدرة الاستفادة من مجموعة أدوات Docling مفتوحة المصدر من IBM. تم استخدام مجموعة الأدوات هذه لمعالجة 85 مليون مستند PDF، مما أدى إلى إنشاء 26 مليون زوج من الأسئلة والأجوبة الاصطناعية. يضمن هذا الإعداد المكثف أن النموذج مجهز جيدًا للتعامل مع سير العمل المكثف للمستندات والذي يميز العديد من بيئات المؤسسات، بما في ذلك الخدمات المالية والرعاية الصحية والخدمات القانونية.
تسلط الإحصائيات الرئيسية الضوء على الحجم والكفاءة:
- 85 مليون: عدد مستندات PDF التي تمت معالجتها باستخدام مجموعة أدوات Docling من IBM لتدريب نموذج الرؤية الجديد. تؤكد مجموعة البيانات الضخمة هذه على استعداد النموذج لتحديات معالجة المستندات في العالم الحقيقي.
- 30٪: تقليل الحجم الذي تم تحقيقه في نماذج أمان Granite Guardian مع الحفاظ على مستويات الأداء. يوضح هذا التزام IBM بتحسين الكفاءة دون التضحية بالسلامة.
- سنتان: الحد الأقصى لنطاق التنبؤ لنماذج TinyTimeMixers من IBM، على الرغم من وجود أقل من 10 ملايين معلمة. يعرض هذا القدرة الرائعة لهذه النماذج المتخصصة للتنبؤ طويل الأجل.
الاستدلال المحسن: سلسلة الفكر وتوسيع نطاق الاستدلال
قامت IBM أيضًا بدمج استدلال “سلسلة الفكر” في إصدارات 2B و 8B من Granite 3.2. تسمح هذه الميزة للنماذج بمعالجة المشكلات بطريقة منظمة ومنهجية، وتقسيمها إلى خطوات تعكس عمليات التفكير البشري. يعزز هذا قدرة النماذج على معالجة المهام المعقدة التي تتطلب استنتاجًا منطقيًا.
بشكل حاسم، يتمتع المستخدمون بالمرونة لتنشيط هذه القدرة أو إلغاء تنشيطها اعتمادًا على مدى تعقيد المهمة. هذه القدرة على التكيف هي عامل تمييز رئيسي، مما يسمح للمؤسسات بتحسين استخدام الموارد بناءً على احتياجاتها الخاصة. بالنسبة للمهام الأبسط، يمكن تعطيل استدلال سلسلة الفكر للحفاظ على قوة الحوسبة، بينما بالنسبة للمشكلات الأكثر تعقيدًا، يمكن تمكينه للاستفادة من إمكانات الاستدلال الكاملة للنموذج.
أدت هذه التحسينات إلى تحسينات كبيرة في أداء نموذج 8B في معايير تتبع التعليمات، متجاوزة الإصدارات السابقة. من خلال طرق “توسيع نطاق الاستدلال” المبتكرة، أثبتت IBM أنه حتى هذا النموذج الصغير نسبيًا يمكنه التنافس بفعالية مع أنظمة أكبر بكثير في معايير التفكير الرياضي. يسلط هذا الضوء على إمكانات النماذج الأصغر والمحسّنة لتقديم أداء مثير للإعجاب في مجالات محددة.
السلامة والفروق الدقيقة: تحديثات Granite Guardian
خضعت نماذج أمان Granite Guardian، المصممة لمراقبة وتخفيف المخاطر المحتملة المرتبطة بالمحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي، لتحديثات مهمة أيضًا. تم تقليل حجم هذه النماذج بنسبة 30٪ مع الحفاظ على مستويات أدائها. يساهم هذا التحسين في زيادة الكفاءة وتقليل استهلاك الموارد.
علاوة على ذلك، تتضمن هذه النماذج الآن ميزة تسمى “الثقة اللفظية”. توفر هذه الميزة تقييمًا أكثر دقة للمخاطر من خلال الاعتراف بدرجات عدم اليقين في مراقبة السلامة. بدلاً من مجرد توفير تصنيف ثنائي آمن / غير آمن، يمكن للنماذج التعبير عن مستويات متفاوتة من الثقة في تقييماتها، مما يوفر للمستخدمين تقييمًا أكثر إفادة وشفافية.
TinyTimeMixers: التنبؤ بعيد المدى للتخطيط الاستراتيجي
بالإضافة إلى تحديثات Granite، أصدرت IBM أيضًا الجيل التالي من نماذج TinyTimeMixers الخاصة بها. هذه النماذج صغيرة بشكل ملحوظ، وتحتوي على أقل من 10 ملايين معلمة - وهو جزء صغير من حجم العديد من النماذج الأخرى في الصناعة. على الرغم من حجمها الصغير، فإن هذه النماذج المتخصصة قادرة على التنبؤ ببيانات السلاسل الزمنية حتى عامين في المستقبل.
هذه القدرة ذات قيمة خاصة لمجموعة من تطبيقات الأعمال، بما في ذلك:
- تحليل الاتجاه المالي: التنبؤ بتحركات السوق وتحديد فرص الاستثمار.
- تخطيط سلسلة التوريد: تحسين مستويات المخزون وتوقع تقلبات الطلب.
- إدارة مخزون التجزئة: ضمان مستويات مخزون كافية لتلبية طلب العملاء مع تقليل النفايات.
تعتمد كل هذه التطبيقات على القدرة على اتخاذ قرارات مستنيرة بناءً على توقعات طويلة الأجل، مما يجعل نماذج TinyTimeMixers أداة قوية لتخطيط الأعمال الاستراتيجي.
معالجة قيود الأعمال في العالم الحقيقي
تعالج القدرة على تبديل إمكانات الاستدلال داخل نماذج Granite بشكل مباشر تحديًا عمليًا في تنفيذ الذكاء الاصطناعي. تتطلب مناهج الاستدلال خطوة بخطوة، على الرغم من قوتها، قوة حوسبة كبيرة ليست ضرورية دائمًا. من خلال جعل هذه الميزة اختيارية، تمكن IBM المؤسسات من تقليل تكاليف الحوسبة للمهام الأبسط مع الاحتفاظ بخيار الاستدلال المتقدم للمشكلات الأكثر تعقيدًا.
يعكس هذا النهج فهمًا عميقًا لقيود الأعمال في العالم الحقيقي، حيث غالبًا ما تكون الكفاءة والفعالية من حيث التكلفة بنفس أهمية الأداء الخام. يعد تركيز IBM على تقديم حلول عملية يمكن تكييفها مع احتياجات العمل المحددة عاملاً مميزًا رئيسيًا في سوق الذكاء الاصطناعي المزدحم بشكل متزايد.
اكتساب قوة جذب: دليل على التأثير العملي
يبدو أن استراتيجية IBM لتطوير نماذج أصغر ومتخصصة تلقى صدى لدى السوق. حقق نموذج Granite 3.1 8B السابق مؤخرًا أداءً قويًا في معيار Salesforce LLM لإدارة علاقات العملاء (CRM). تم تصميم هذا المعيار خصيصًا لتقييم أداء LLMs في المهام ذات الصلة بـ CRM، مثل تحليل تفاعل العملاء وإنشاء محتوى مخصص.
يشير الأداء القوي لنموذج Granite 3.1 8B في هذا المعيار إلى أن النماذج الأصغر والمتخصصة يمكنها بالفعل تلبية احتياجات العمل المحددة بفعالية. يوفر هذا دليلًا إضافيًا على أن نهج IBM ليس سليمًا من الناحية النظرية فحسب، بل إنه قابل للتطبيق عمليًا أيضًا.
التركيز على الكفاءة والتكامل والتأثير في العالم الحقيقي
يلخص Sriram Raghavan، نائب رئيس IBM AI Research، فلسفة الشركة بإيجاز: “يدور العصر التالي للذكاء الاصطناعي حول الكفاءة والتكامل والتأثير في العالم الحقيقي - حيث يمكن للمؤسسات تحقيق نتائج قوية دون إنفاق مفرط على الحوسبة. تركز أحدث تطورات Granite من IBM على الحلول المفتوحة التي تُظهر خطوة أخرى إلى الأمام في جعل الذكاء الاصطناعي أكثر سهولة وفعالية من حيث التكلفة وقيمة للمؤسسات الحديثة.”
يجسد هذا البيان التزام IBM بتطوير حلول ذكاء اصطناعي ليست متقدمة تقنيًا فحسب، بل إنها أيضًا عملية ويمكن الوصول إليها ومتوافقة مع احتياجات الأعمال في العالم الحقيقي. يؤكد التركيز على الحلول المفتوحة أيضًا على تفاني IBM في تعزيز التعاون والابتكار داخل مجتمع الذكاء الاصطناعي. يتحول التركيز من مجرد بناء أكبر النماذج إلى إنشاء أدوات ذكاء اصطناعي تقدم قيمة ملموسة وتمكن الشركات من تحقيق أهدافها الاستراتيجية.