صعود نماذج اللغة الصغيرة: إعادة تشكيل مشهد الذكاء الاصطناعي

شهد الذكاء الاصطناعي، وخاصة الفرع الذي يتعامل مع اللغة، هيمنة في السنوات الأخيرة من خلال الحجم الهائل وقوة نماذج اللغة الكبيرة (LLMs). أظهرت هذه الكيانات الضخمة، التي تم تدريبها على محيطات شاسعة من البيانات، قدرات ملحوظة، واستحوذت على خيال الجمهور ودولارات الاستثمار. ومع ذلك، تحت العناوين الرئيسية التي تبشر بنماذج أكبر من أي وقت مضى، تتشكل ثورة أكثر هدوءًا ولكنها قد تكون أكثر تحولًا: صعود نماذج اللغة الصغيرة (SLMs). تعمل أنظمة الذكاء الاصطناعي الأصغر حجمًا والأكثر تركيزًا هذه على اقتطاع مكانة مهمة بسرعة، واعدة بجلب قدرات الذكاء الاصطناعي المتطورة إلى البيئات التي لا تستطيع فيها نظيراتها الأكبر العمل بكفاءة أو اقتصادية.

الاهتمام المتزايد بنماذج SLMs ليس مجرد اهتمام أكاديمي؛ إنه يترجم إلى زخم ملموس في السوق. يتوقع محللو الصناعة صعودًا كبيرًا لقطاع SLM، متوقعين توسعًا من حجم سوق يقدر بحوالي 0.93 مليار دولار في عام 2025 إلى 5.45 مليار دولار بحلول عام 2032. يمثل هذا المسار معدل نمو سنوي مركب (CAGR) قويًا يبلغ حوالي 28.7٪ خلال فترة التوقعات. مثل هذا النمو الهائل لا يحدث في فراغ؛ إنه مدفوع بتقاطع قوى تكنولوجية وسوقية قوية.

على رأس هذه الدوافع الطلب المتواصل على Edge AI و الذكاء على الجهاز. تسعى الشركات عبر قطاعات لا حصر لها بشكل متزايد إلى حلول الذكاء الاصطناعي التي يمكن أن تعمل مباشرة على الهواتف الذكية وأجهزة الاستشعار والمعدات الصناعية والأنظمة المدمجة الأخرى، دون زمن الوصول أو التكلفة أو مخاوف الخصوصية المرتبطة بالاتصال السحابي المستمر. يتيح تشغيل الذكاء الاصطناعي محليًا استجابة في الوقت الفعلي ضرورية للتطبيقات التي تتراوح من أنظمة المركبات ذاتية القيادة إلى المساعدين المحمولين التفاعليين وأتمتة المصانع الذكية. نماذج SLMs، ببصمتها الحاسوبية الأصغر بكثير مقارنة بنماذج LLMs، مناسبة بشكل مثالي لهذه البيئات محدودة الموارد.

في الوقت نفسه، عملت الخطوات الكبيرة في تقنيات ضغط النماذج كمسرع قوي. تسمح الابتكارات مثل التكميم (تقليل دقة الأرقام المستخدمة في النموذج) والتقليم (إزالة الاتصالات الأقل أهمية داخل الشبكة العصبية) للمطورين بتقليص حجم النموذج وزيادة سرعة المعالجة بشكل كبير. والأهم من ذلك، أن هذه التقنيات تتطور لتحقيق كفاءة أكبر مع تقليل التأثير على أداء النموذج ودقته. هذه الفائدة المزدوجة - الحجم الأصغر والقدرة المحتفظ بها - تجعل نماذج SLMs بدائل قابلة للتطبيق بشكل متزايد لنماذج LLMs لمجموعة متزايدة من المهام.

علاوة على ذلك، تدرك المؤسسات القيمة العملية لدمج نماذج SLMs في عملياتها الأساسية. من أتمتة تكنولوجيا المعلومات، حيث يمكن لنماذج SLMs تحليل السجلات والتنبؤ بفشل النظام، إلى الأمن السيبراني، حيث يمكنها اكتشاف الحالات الشاذة في حركة مرور الشبكة، و تطبيقات الأعمال المتنوعة التي تهدف إلى تعزيز الإنتاجية وتحسين عمليات صنع القرار، فإن التأثير المحتمل هائل. توفر نماذج SLMs مسارًا لنشر الذكاء الاصطناعي على نطاق أوسع، لا سيما في السيناريوهات الحساسة للتكلفة أو الخصوصية أو التي تتطلب معالجة شبه فورية. هذا التقاطع بين احتياجات الحوسبة الطرفية، ومكاسب الكفاءة من خلال الضغط، وحالات الاستخدام الواضحة للمؤسسات يضع نماذج SLMs ليس فقط كإصدارات أصغر من نماذج LLMs، ولكن كفئة متميزة وحيوية من الذكاء الاصطناعي تستعد لتأثير كبير.

الانقسام الاستراتيجي: التحكم في النظام البيئي مقابل التخصص المتعمق

مع تشكل مشهد SLM، تظهر مناهج استراتيجية متميزة بين اللاعبين الرئيسيين المتنافسين على الهيمنة. تتجمع الديناميكيات التنافسية إلى حد كبير حول فلسفتين أساسيتين، تعكس كل منهما نماذج أعمال مختلفة ورؤى طويلة الأجل لكيفية الحصول على قيمة الذكاء الاصطناعي.

أحد المسارات البارزة هو استراتيجية التحكم في النظام البيئي الخاص. يفضل هذا النهج العديد من عمالقة التكنولوجيا ومختبرات الذكاء الاصطناعي الممولة جيدًا الذين يهدفون إلى بناء حدائق مسورة حول عروض SLM الخاصة بهم. شركات مثل OpenAI، بمتغيراتها المشتقة من سلالة GPT (مثل عائلة GPT-4 mini المتوقعة)، و Google بنماذج Gemma الخاصة بها، و Anthropic التي تدعم Claude Haiku، و Cohere التي تروج لـ Command R+، هي أمثلة رئيسية. تتضمن استراتيجيتهم عادةً تسويق نماذج SLMs كمكونات أساسية لمنصات أوسع، غالبًا ما يتم تقديمها عبر واجهات برمجة التطبيقات (APIs) القائمة على الاشتراك، أو الخدمات السحابية المتكاملة (مثل Azure AI أو Google Cloud AI)، أو من خلال اتفاقيات ترخيص المؤسسات.

يكمن جاذبية هذه الاستراتيجية في إمكانية التكامل المحكم، والأداء المتسق، والأمان المعزز، والنشر المبسط ضمن تدفقات عمل المؤسسة القائمة. من خلال التحكم في النظام البيئي، يمكن لهؤلاء المزودين تقديم ضمانات بشأن الموثوقية والدعم، مما يجعل نماذج SLMs الخاصة بهم جذابة للشركات التي تسعى إلى أتمتة قوية تعتمد على الذكاء الاصطناعي، ومساعدين ‘copilot’ متطورين مدمجين في مجموعات البرامج، وأدوات دعم قرار يمكن الاعتماد عليها. يعطي هذا النموذج الأولوية للحصول على القيمة من خلال تقديم الخدمات والارتباط بالمنصة، مستفيدًا من البنية التحتية الحالية للمزودين ومدى وصولهم إلى السوق. إنه يلبي بشكل فعال احتياجات المنظمات التي تعطي الأولوية للتكامل السلس وخدمات الذكاء الاصطناعي المُدارة.

تتناقض بشكل حاد مع لعبة النظام البيئي استراتيجية النموذج المتخصص الخاص بالمجال. يركز هذا النهج على تطوير نماذج SLMs مصممة بدقة ومضبوطة لتلبية المتطلبات الفريدة والمفردات والقيود التنظيمية لصناعات محددة. بدلاً من استهداف قابلية التطبيق الواسعة، يتم صقل هذه النماذج لتحقيق أداء عالٍ ضمن قطاعات رأسية مثل التمويل أو الرعاية الصحية أو الخدمات القانونية أو حتى المجالات التقنية المتخصصة مثل تطوير البرمجيات.

يشمل الرواد في هذا المجال منصات مثل Hugging Face، التي تستضيف نماذج مثل Zephyr 7B المحسّنة بشكل صريح لمهام الترميز، واللاعبين المؤسسيين الراسخين مثل IBM، التي تم تصميم عائلة نماذج Granite الخاصة بها مع مراعاة احتياجات الذكاء الاصطناعي للمؤسسات، بما في ذلك حوكمة البيانات والامتثال، في جوهرها. تكمن الميزة الاستراتيجية هنا في العمق بدلاً من الاتساع. من خلال تدريب النماذج على مجموعات بيانات خاصة بالصناعة وتحسينها لمهام معينة (مثل فهم المصطلحات المالية، وتفسير الملاحظات الطبية، وصياغة البنود القانونية)، يمكن لنماذج SLMs هذه تحقيق دقة فائقة وملاءمة سياقية ضمن مجالاتها المخصصة. يتردد صدى هذه الاستراتيجية بقوة لدى المنظمات في القطاعات المنظمة أو كثيفة المعرفة حيث قد تفشل النماذج العامة، مما يمكنها من نشر حلول ذكاء اصطناعي عالية الدقة ومدركة للسياق لحالات الاستخدام المتخصصة ذات المهام الحرجة. إنه يعزز التبني من خلال معالجة نقاط الألم المحددة ومتطلبات الامتثال التي قد تتجاهلها النماذج واسعة النطاق.

هاتان الاستراتيجيتان المهيمنتان ليستا بالضرورة متعارضتين تمامًا للسوق بأكمله، لكنهما تمثلان التوترات الرئيسية التي تشكل المنافسة. يراهن لاعبو النظام البيئي على الحجم والتكامل وقوة المنصة، بينما يركز المتخصصون على العمق والدقة والخبرة الصناعية. من المرجح أن يتضمن تطور سوق SLM تفاعلًا ومنافسة بين هذه الأساليب، مما قد يؤدي إلى نماذج هجينة أو مزيد من التنويع الاستراتيجي مع نضوج التكنولوجيا.

دخول العمالقة إلى الحلبة: دليل لعب الشركات القائمة

لم يمر الاضطراب المحتمل والفرص التي تقدمها نماذج اللغة الصغيرة مرور الكرام على عمالقة عالم التكنولوجيا الراسخين. مستفيدين من مواردها الهائلة، وعلاقات العملاء الحالية، والبنية التحتية الواسعة، تقوم هذه الشركات القائمة بمناورات استراتيجية لتأمين مكانة رائدة في هذا المجال المزدهر.

Microsoft

تقوم Microsoft، وهي قوة دائمة في برامج المؤسسات والحوسبة السحابية، بنسج نماذج SLMs بقوة في نسيجها التكنولوجي. بتبني استراتيجية التحكم في النظام البيئي الخاص، تقوم العملاقة في ريدموند بدمج هذه النماذج الأكثر مرونة بعمق داخل منصة Azure السحابية الخاصة بها ومجموعة أوسع من حلول المؤسسات. تمثل العروض مثل سلسلة Phi (بما في ذلك Phi-2) و عائلة Orca نماذج SLMs متاحة تجاريًا ومحسّنة خصيصًا لمهام الذكاء الاصطناعي للمؤسسات، مما يدعم الميزات داخل مساعدي Copilot ويوفر أدوات قوية للمطورين الذين يبنون على حزمة Microsoft.

الكفاءة الأساسية التي تدعم دفعة Microsoft هي قسم أبحاث الذكاء الاصطناعي الهائل المقترن بـ بنية Azure السحابية التي تمتد عبر العالم. يتيح هذا المزيج لـ Microsoft ليس فقط تطوير نماذج متطورة ولكن أيضًا تقديمها كخدمات قابلة للتطوير وآمنة وموثوقة لقاعدة عملائها الضخمة من المؤسسات. تعد الشراكة الاستراتيجية بمليارات الدولارات مع OpenAI حجر الزاوية في استراتيجية الذكاء الاصطناعي الخاصة بها، مما يمنحها وصولاً مميزًا إلى نماذج OpenAI (بما في ذلك متغيرات SLM المحتملة) وتمكين تكاملها المحكم في منتجات Microsoft مثل Office 365 و Bing وخدمات Azure AI المختلفة. توفر هذه العلاقة التكافلية لـ Microsoft كلاً من نماذج SLMs المطورة داخليًا والوصول إلى العلامة التجارية الأكثر شهرة في الذكاء الاصطناعي التوليدي.

علاوة على ذلك، تعزز عمليات الاستحواذ الاستراتيجية مكانة Microsoft. أدى شراء Nuance Communications، الشركة الرائدة في مجال الذكاء الاصطناعي للمحادثات وتكنولوجيا توثيق الرعاية الصحية، إلى تعزيز قدراتها بشكل كبير في تطبيقات الذكاء الاصطناعي الخاصة بالقطاعات، لا سيما في سيناريوهات الرعاية الصحية وأتمتة المؤسسات حيث يكون فهم اللغة المتخصص أمرًا بالغ الأهمية. هذه التحركات المحسوبة - التي تمزج بين التطوير الداخلي والشراكات الاستراتيجية وعمليات الاستحواذ والتكامل العميق مع منصاتها السحابية والبرمجية المهيمنة - تضع Microsoft كقوة هائلة تهدف إلى جعل نظامها البيئي الخيار الافتراضي لتبني SLM للمؤسسات عبر صناعات متنوعة.

IBM

تقترب شركة International Business Machines (IBM)، بتاريخها الطويل المتجذر بعمق في حوسبة المؤسسات، من سوق SLM بتركيز مميز على التطبيقات الموجهة للأعمال والثقة والحوكمة. تعمل Big Blue بنشاط على تطوير وتحسين نماذج SLMs ضمن منصة watsonx.ai الخاصة بها، وتأطيرها كحلول ذكاء اصطناعي فعالة من حيث التكلفة وفعالة ومدركة للمجال ومصممة خصيصًا لاحتياجات المؤسسات.

تتناقض استراتيجية IBM عمدًا مع الأساليب التي تعطي الأولوية للنماذج الموجهة للمستهلك أو للأغراض العامة. بدلاً من ذلك، ينصب التركيز بشكل مباشر على السمات الحاسمة لنشر المؤسسات: الموثوقية، وحوكمة البيانات، والالتزام بمبادئ أخلاقيات الذكاء الاصطناعي. وهذا يجعل عروض SLM من IBM، مثل نماذج Granite، مناسبة بشكل خاص للنشر في البيئات الآمنة والصناعات الخاضعة للامتثال التنظيمي الصارم. تدرك IBM أنه بالنسبة للعديد من المؤسسات الكبيرة، لا سيما في قطاعي التمويل والرعاية الصحية، فإن القدرة على التدقيق والتحكم وضمان الاستخدام المسؤول للذكاء الاصطناعي أمر غير قابل للتفاوض.

من خلال دمج نماذج SLMs التي تركز على الحوكمة في حلولها السحابية الهجينة وخدماتها الاستشارية، تهدف IBM إلى تمكين الشركات من تعزيز الأتمتة، وتحسين عملية صنع القرار المستندة إلى البيانات، وتبسيط الكفاءة التشغيلية دون المساس بالأمن أو المعايير الأخلاقية. تعمل علاقاتها المؤسسية العميقة وسمعتها في الموثوقية كأصول رئيسية في الترويج لنماذج SLMs كأدوات عملية وجديرة بالثقة للتحول الرقمي داخل الهياكل التنظيمية المعقدة. تراهن IBM على أنه بالنسبة للعديد من الشركات، فإن ‘كيفية’ نشر الذكاء الاصطناعي - بأمان ومسؤولية - لا تقل أهمية عن ‘ماذا’.

Google

بينما قد ترتبط Google بشكل أكثر وضوحًا بنماذجها واسعة النطاق مثل Gemini، إلا أنها لاعب مهم أيضًا في ساحة SLM، مستفيدة بشكل أساسي من نظامها البيئي وقدراتها البحثية الواسعة. من خلال نماذج مثل Gemma (على سبيل المثال، Gemma 7B)، تقدم Google نماذج مفتوحة خفيفة الوزن نسبيًا ولكنها قادرة، بهدف تعزيز تبني المطورين والتكامل داخل نظامها البيئي الخاص، لا سيما Google Cloud Platform (GCP).

يبدو أن استراتيجية Google تمزج بين عناصر التحكم في النظام البيئي وتعزيز مجتمع أوسع. من خلال إصدار نماذج مثل Gemma، تشجع على التجريب وتسمح للمطورين ببناء تطبيقات تستفيد من البنية التحتية الأساسية لـ Google (مثل TPUs للتدريب والاستدلال الفعال). يساعد هذا النهج في زيادة استخدام خدمات GCP AI ويضع Google كمزود لكل من النماذج التأسيسية والأدوات اللازمة لنشرها بفعالية. توفر خبرتها العميقة في البحث والجوال (Android) والبنية التحتية السحابية طرقًا عديدة لدمج نماذج SLMs لتعزيز المنتجات الحالية أو إنشاء تجارب جديدة على الجهاز. تضمن مشاركة Google أن يظل سوق SLM تنافسيًا بشدة، مما يدفع حدود الكفاءة وإمكانية الوصول.

AWS

تقوم Amazon Web Services (AWS)، اللاعب المهيمن في البنية التحتية السحابية، بدمج نماذج SLMs بشكل طبيعي في محفظتها الشاملة للذكاء الاصطناعي والتعلم الآلي. من خلال خدمات مثل Amazon Bedrock، توفر AWS للشركات إمكانية الوصول إلى مجموعة مختارة من النماذج التأسيسية، بما في ذلك نماذج SLMs من مختلف المزودين (ربما بما في ذلك نماذجها الخاصة، مثل نماذج Nova المفاهيمية المذكورة في بعض السياقات، على الرغم من أن التفاصيل قد تختلف).

تتركز استراتيجية AWS إلى حد كبير على توفير الخيار والمرونة ضمن بيئتها السحابية القوية. من خلال تقديم نماذج SLMs عبر Bedrock، تسمح AWS لعملائها بتجربة هذه النماذج وتخصيصها ونشرها بسهولة باستخدام أدوات وبنية تحتية مألوفة لـ AWS. يركز هذا النهج المرتكز على المنصة على جعل نماذج SLMs متاحة كخدمات مُدارة، مما يقلل العبء التشغيلي على الشركات التي ترغب في الاستفادة من الذكاء الاصطناعي دون إدارة الأجهزة الأساسية أو خطوط أنابيب نشر النماذج المعقدة. تهدف AWS إلى أن تكون المنصة التأسيسية حيث يمكن للمؤسسات بناء وتشغيل تطبيقات الذكاء الاصطناعي الخاصة بها، بغض النظر عما إذا كانت تختار نماذج كبيرة أو صغيرة، مستفيدة من حجمها وأمنها وعروض خدماتها الواسعة للحفاظ على ريادتها السحابية في عصر الذكاء الاصطناعي.

المبتكرون والمتخصصون: شق مسارات جديدة

إلى جانب عمالقة التكنولوجيا الراسخين، تؤثر مجموعة نابضة بالحياة من الوافدين الجدد والشركات المتخصصة بشكل كبير على اتجاه وديناميكية سوق نماذج اللغة الصغيرة. غالبًا ما تجلب هذه الشركات وجهات نظر جديدة، مع التركيز على مبادئ المصدر المفتوح، أو مجالات صناعية محددة، أو مناهج تكنولوجية فريدة.

OpenAI

تحتل OpenAI، التي يمكن القول إنها المحفز للزيادة الأخيرة في الاهتمام بالذكاء الاصطناعي التوليدي، حضورًا قويًا في مجال SLM، بناءً على أبحاثها الرائدة واستراتيجيات النشر الناجحة. بينما تشتهر بنماذجها الكبيرة، تعمل OpenAI بنشاط على تطوير ونشر متغيرات أصغر وأكثر كفاءة، مثل عائلات GPT-4o mini و o1-mini و o3-mini المتوقعة. يعكس هذا فهمًا استراتيجيًا بأن حالات الاستخدام المختلفة تتطلب أحجام نماذج وخصائص أداء مختلفة.

كرائدة في معالجة اللغة الطبيعية، تنبع الميزة التنافسية لـ OpenAI من خبرتها البحثية العميقة وقدرتها المثبتة على ترجمة البحث إلى منتجات قابلة للتطبيق تجاريًا. يمتد تركيزها إلى ما هو أبعد من القدرة الخام ليشمل جوانب حاسمة مثل الكفاءة والسلامة والنشر الأخلاقي للذكاء الاصطناعي، وهي أمور ذات أهمية خاصة مع انتشار النماذج على نطاق أوسع. كان نموذج التسليم القائم على API للشركة فعالاً في إضفاء الطابع الديمقراطي على الوصول إلى الذكاء الاصطناعي القوي، مما سمح للمطورين والشركات في جميع أنحاء العالم بدمج تقنيتها. توفر الشراكة الاستراتيجية مع Microsoft رأس مال كبير ومدى وصول لا مثيل له إلى السوق، مما يدمج تقنية OpenAI ضمن نظام بيئي واسع للمؤسسات.

تواصل OpenAI دفع الحدود من خلال استكشاف تقنيات ضغط النماذج المتقدمة بنشاط والتحقيق في البنى الهجينة التي قد تجمع بين نقاط القوة لأحجام النماذج المختلفة لتعزيز الأداء مع تقليل المتطلبات الحسابية. تتيح ريادتها في تطوير تقنيات الضبط الدقيق والتخصيص للنماذج للمؤسسات تكييف نماذج OpenAI الأساسية القوية لتلبية احتياجات الصناعة المحددة ومجموعات البيانات الخاصة، مما يزيد من ترسيخ مكانتها في السوق كمبتكر وممكّن رئيسي للذكاء الاصطناعي التطبيقي.

Anthropic

نحتت Anthropic هوية مميزة في مشهد الذكاء الاصطناعي من خلال وضع السلامة والموثوقية والاعتبارات الأخلاقية في طليعة فلسفتها التنموية. ينعكس هذا التركيز بوضوح في نهجها تجاه نماذج SLMs، والذي يتجسد في نماذج مثل Claude Haiku. تم تصميم Haiku بشكل صريح للأداء الآمن والموثوق به في سياقات المؤسسات، ويهدف إلى توفير قدرات ذكاء اصطناعي مفيدة مع تقليل مخاطر توليد محتوى ضار أو متحيز أو غير صحيح.

من خلال وضع نفسها كمزود لـ الذكاء الاصطناعي الجدير بالثقة، تجذب Anthropic بشكل خاص المنظمات العاملة في مجالات حساسة أو تلك التي تعطي الأولوية لتبني الذكاء الاصطناعي المسؤول. يميزهم تركيزهم على الذكاء الاصطناعي الدستوري واختبارات السلامة الصارمة عن المنافسين الذين قد يعطون الأولوية للأداء الخام قبل كل شيء. من خلال تقديم نماذج SLMs ليست قادرة فحسب، بل مصممة أيضًا بحواجز حماية ضد سوء الاستخدام، تلبي Anthropic الطلب المتزايد على حلول الذكاء الاصطناعي التي تتماشى مع قيم الشركات والتوقعات التنظيمية، مما يجعلها منافسًا رئيسيًا، خاصة للشركات التي تبحث عن شركاء ذكاء اصطناعي موثوقين وأخلاقيين.

Mistral AI

برزت Mistral AI بسرعة من المشهد التكنولوجي الأوروبي، وهي شركة فرنسية تأسست في عام 2023، وأحدثت موجات كبيرة في قطاع SLM. تدور استراتيجيتها الأساسية حول إنشاء نماذج ذكاء اصطناعي مدمجة وعالية الكفاءة مصممة بشكل صريح للأداء وقابلية النشر، حتى على الأجهزة المحلية أو داخل بيئات الحوسبة الطرفية. حظيت نماذج مثل Mistral 7B (التي تم إصدارها مبدئيًا) باهتمام واسع النطاق لتقديم أداء ملحوظ بالنسبة لحجمها المتواضع (7 مليارات معلمة)، مما يجعلها مناسبة للغاية للسيناريوهات التي تكون فيها الموارد الحسابية محدودة.

أحد العوامل المميزة الرئيسية لـ Mistral AI هو التزامها القوي بـ تطوير المصدر المفتوح. من خلال إصدار العديد من نماذجها وأدواتها بموجب تراخيص متساهلة، تعزز Mistral AI التعاون والشفافية والابتكار السريع داخل مجتمع الذكاء الاصطناعي الأوسع. يتناقض هذا النهج مع الأنظمة البيئية الخاصة لبعض اللاعبين الكبار وقد بنى بسرعة متابعين مخلصين بين المطورين والباحثين. بالإضافة إلى نماذجها التأسيسية، أظهرت الشركة تنوعًا من خلال إنتاج متغيرات مثل Mistral Saba، المصممة خصيصًا للغات الشرق الأوسط وجنوب آسيا، واستكشاف القدرات متعددة الوسائط بمفاهيم مثل Pixtral (التي تهدف إلى فهم الصور)، مما يدل على طموحها لتلبية الاحتياجات اللغوية والوظيفية المتنوعة. يسلط صعود Mistral AI السريع الضوء على الشهية الكبيرة للبدائل عالية الأداء والفعالة وغالبًا ما تكون مفتوحة المصدر في سوق الذكاء الاصطناعي.

Infosys

تستفيد Infosys، وهي شركة عالمية رائدة في خدمات تكنولوجيا المعلومات والاستشارات، من خبرتها الصناعية العميقة وعلاقاتها مع العملاء لاقتطاع مكانة في سوق SLM، مع التركيز على الحلول الخاصة بالصناعة. يجسد إطلاق Infosys Topaz BankingSLM و Infosys Topaz ITOpsSLM هذه الاستراتيجية. تم تصميم هذه النماذج خصيصًا لمواجهة التحديات الفريدة وتدفقات العمل داخل قطاعي البنوك وعمليات تكنولوجيا المعلومات، على التوالي.

أحد الممكنات الرئيسية لـ Infosys هو شراكتها الاستراتيجية مع NVIDIA، باستخدام حزمة الذكاء الاصطناعي من NVIDIA كأساس لهذه النماذج SLMs المتخصصة. تم تصميم النماذج للتكامل السلس مع أنظمة المؤسسات الحالية، بما في ذلك منصة Finacle المصرفية المستخدمة على نطاق واسع من Infosys نفسها. تم تطوير هذه النماذج SLMs داخل مركز امتياز مخصص يركز على تقنيات NVIDIA، وتم تعزيزها بشكل أكبر من خلال التعاون مع شركاء مثل Sarvam AI، وتستفيد من التدريب على البيانات ذات الأغراض العامة والبيانات الخاصة بالقطاع. والأهم من ذلك، أن Infosys لا توفر النماذج فحسب؛ بل تقدم أيضًا خدمات التدريب المسبق والضبط الدقيق، مما يمكّن المؤسسات من إنشاء نماذج ذكاء اصطناعي مخصصة مصممة خصيصًا لبياناتها الخاصة واحتياجاتها التشغيلية المحددة، مع ضمان الأمان والامتثال للمعايير الصناعية ذات الصلة. يضع هذا النهج الموجه نحو الخدمة Infosys كشركة تكامل ومخصص لتقنية SLM للمؤسسات الكبيرة.

لاعبون بارزون آخرون

مجال SLM أوسع من مجرد هذه الشركات البارزة. يساهم مساهمون مهمون آخرون في دفع الابتكار وتشكيل قطاعات سوق محددة:

  • Cohere: تركز على الذكاء الاصطناعي للمؤسسات، وتقدم نماذج مثل Command R+ المصممة لحالات استخدام الأعمال وغالبًا ما تؤكد على خصوصية البيانات ومرونة النشر (على سبيل المثال، على سحابات مختلفة أو في أماكن العمل).
  • Hugging Face: بينما تُعرف في المقام الأول كمنصة ومركز مجتمعي، تساهم Hugging Face أيضًا في تطوير النماذج (مثل Zephyr 7B للترميز) وتلعب دورًا حاسمًا في إضفاء الطابع الديمقراطي على الوصول إلى آلاف النماذج، بما في ذلك العديد من نماذج SLMs، مما يسهل البحث وتطوير التطبيقات.
  • Stability AI: اشتهرت Stability AI في البداية بعملها في توليد الصور (Stable Diffusion)، وتقوم بتوسيع محفظتها لتشمل نماذج اللغة، واستكشاف نماذج SLMs مدمجة وفعالة مناسبة للنشر على الجهاز وتطبيقات المؤسسات المختلفة، مستفيدة من خبرتها في الذكاء الاصطناعي التوليدي.

تساهم هذه الشركات، جنبًا إلى جنب مع اللاعبين الكبار، في نظام بيئي ديناميكي وسريع التطور. إن استراتيجياتها المتنوعة - التي تشمل المصدر المفتوح، والمنصات الخاصة، والتخصص الصناعي، والبحث التأسيسي - تدفع بشكل جماعي التقدم في كفاءة SLM وإمكانية الوصول إليها وقدرتها، مما يضمن أن تلعب هذه النماذج الأصغر دورًا مركزيًا متزايدًا في مستقبل الذكاء الاصطناعي عبر عدد لا يحصى من التطبيقات والصناعات.