إنجاز تدريب الذكاء الاصطناعي: منافس لـ DeepSeek 2.0؟ | ar

فك شفرة إطار SASR الخاص بـ Goku

قدمت Shanghai Goku Technologies، التي تأسست في عام 2015، إطارًا تدريبيًا جديدًا للذكاء الاصطناعي يطلق عليه SASR، أو التدريب الهجين التكيفي خطوة بخطوة. يهدف هذا النهج إلى معالجة القيود المتصورة للطرق السائدة مثل الضبط الدقيق الخاضع للإشراف (SFT) والتعلم المعزز (RL). تجادل Goku بأن SASR، المستوحاة من الطريقة التي يطور بها البشر مهارات التفكير، تقدم مسارًا أكثر تكيفًا وكفاءة لبناء نماذج ذكاء اصطناعي متقدمة.

تعتبر SFT وRL حجر الزاوية في عملية تدريب الذكاء الاصطناعي، وتستخدمهما الشركات العملاقة في الصناعة مثل OpenAI وDeepSeek. أكدت DeepSeek صراحة على الدور الحاسم لهذه التقنيات في تحسين أداء نموذج V3 الخاص بها، والذي تم إصداره في ديسمبر وأثار اهتمامًا كبيرًا داخل قطاع التكنولوجيا.

وفقًا للورقة البحثية لشركة Goku، التي شارك في تأليفها باحثون من جامعة Shanghai Jiao Tong التابعة لها وشركة Shanghai AllMind Artificial Intelligence Technology التابعة لها التي تم تشكيلها حديثًا، يُظهر SASR أداءً فائقًا مقارنة بمنهجيات SFT وRL والتدريب الهجين الثابت. أكد فريق Goku في ورقتهم البحثية: “تظهر النتائج التجريبية أن SASR يتفوق على طرق SFT وRL والتدريب الهجين الثابت”.

الآثار المترتبة على تقدم Goku

يقال إن اختراق Goku في تدريب الذكاء الاصطناعي يؤكد على التقدم المستمر للصين في مجال الذكاء الاصطناعي. إنه يسلط الضوء بشكل محتمل على القيود المفروضة على السياسات الحالية التي تنفذها حكومة الولايات المتحدة، والتي تهدف إلى عرقلة تقدم الصين في مجال الذكاء الاصطناعي من خلال القيود المفروضة على الأجهزة. علق جنسن هوانغ، الرئيس التنفيذي لشركة Nvidia، مؤخرًا على عدم فعالية هذه القيود المتصورة، قائلاً إن “الصين لديها 50 بالمائة من مطوري الذكاء الاصطناعي في العالم”.

اكتسبت DeepSeek، وهي شركة صينية ناشئة في مجال الذكاء الاصطناعي ظهرت من صندوق التحوط High-Flyer، اعترافًا واسع النطاق لعرضها لإمكانات الصين في قيادة الذكاء الاصطناعي من خلال الخوارزميات المتقدمة وتكامل الأجهزة والبرامج.

دور AllMind في استراتيجية Goku للذكاء الاصطناعي

يشير تأسيس AllMind، بالتزامن مع نشر بحث Goku، إلى خطوة استراتيجية لتخصيص الموارد للبحث والتطوير في مجال الذكاء الاصطناعي. تشير سجلات الأعمال الصينية إلى أن AllMind تم تسجيلها رسميًا في نفس اليوم الذي أصدرت فيه Goku بحثها.

ذكر Wang Xiao، مؤسس Goku والممثل القانوني لشركة AllMind، أن الكيان الجديد تم إنشاؤه لاستكشاف حدود جديدة للذكاء الاصطناعي. يعكس هذا النهج الذي اتخذته High-Flyer، التي أسست DeepSeek ككيان منفصل في عام 2023.

اعتبارًا من نهاية العام الماضي، أدارت Goku أكثر من 15 مليار يوان (حوالي 2.1 مليار دولار أمريكي) من الأصول المحلية والدولية، باستخدام استراتيجيات تعتمد على الذكاء الاصطناعي، وفقًا للمعلومات المتاحة على موقعها الرسمي على الإنترنت.

التعمق في SASR: إطار تدريب هجين تكيفي خطوة بخطوة

يقدم إطار SASR الخاص بـ Goku بديلاً مثيرًا للاهتمام في مشهد تدريب نماذج الذكاء الاصطناعي. لتقدير تأثيرها المحتمل حقًا، من الضروري فهم أكثر تفصيلاً لمكوناته وطريقة عمله.

يشير جانب “الخطوة بخطوة” في SASR إلى عملية تدريب متعددة المراحل حيث يخضع نموذج الذكاء الاصطناعي لتحسينات متكررة. من المحتمل أن تتضمن كل خطوة أهدافًا محددة وتستخدم بيانات تدريب متميزة لرعاية قدرات معينة داخل النموذج. يمكن أن يوفر هذا النهج التدريجي فوائد مثل التخفيف من تحديات تدريب النماذج المعقدة من البداية والسماح بالتحسين المخصص في كل مرحلة.

يشير عنصر “التكيف” إلى أن عملية التدريب ليست ثابتة ولكنها تستجيب ديناميكيًا لأداء النموذج وخصائصه. يمكن أن يشمل هذا التكيف تعديل المعلمات الفائقة أو تعديل توزيع بيانات التدريب أو ترجيح مساهمة أهداف التدريب المختلفة ديناميكيًا. تسمح العملية التكيفية للذكاء الاصطناعي بالتعلم والتحسين بشكل أكثر فعالية.

تكشف الطبيعة “الهجينة” لـ SASR أنها تجمع بين عناصر من منهجيات التدريب المختلفة. هذا جانب حيوي لأن هناك نقاط قوة وضعف في SFT وRL. تمكن مزيج من الطرق النموذج من الاستفادة من فوائد كل نهج مع معالجة قيوده. من خلال دمج هذه الخصائص الثلاث، فإن SARS من الناحية النظرية أفضل في تطوير المنطق والاستدلال.

مقارنة SASR بالطرق التقليدية

يعتمد الضبط الدقيق الخاضع للإشراف (SFT) تقليديًا على مجموعة بيانات كبيرة ومصنفة حيث يتعلم نموذج الذكاء الاصطناعي تعيين المدخلات على المخرجات المرغوبة. يتضمن التعلم المعزز (RL) تدريب النموذج من خلال التجربة والخطأ، ومكافأة أو معاقبة الإجراءات لزيادة هدف معين إلى أقصى حد.

تحاول SASR دمج الاثنين مع التغلب على قيود كل طريقة. على سبيل المثال، يمكن أن يعتمد SFT بشكل كبير على جودة وشمولية البيانات المصنفة. في العديد من سينariوهات العالم الحقيقي، يمكن أن يكون الحصول على بيانات كافية ودقيقة أمرًا مستهلكًا للوقت ومكلفًا. يمكن أن يكون RL، على الرغم من أنه لا يتطلب بيانات مصنفة، غير مستقر وعرضة لاختراق المكافآت. يحدث اختراق المكافآت عندما يكتشف نموذج الذكاء الاصطناعي طرقًا غير مقصودة لزيادة مكافأته إلى أقصى حد، مما قد يؤدي إلى سلوك غير مرغوب فيه.

إطار Goku لديه إمكانية أن يكون تحسينًا على قيود SFT وRL. ومع ذلك، يلزم إجراء المزيد والمستمر من الاختبارات للتحقق من النتائج الأولية الموثقة في ورقة الشركة.

الابتكار الخوارزمي وقيود الأجهزة

أخبار إطار SASR الخاص بـ Goku ذات صلة خاصة في سياق العلاقات التقنية بين الولايات المتحدة والصين. لبعض الوقت، حاولت حكومة الولايات المتحدة تقليل صعود الصين في مجال الذكاء الاصطناعي من خلال تقييد الوصول إلى أجهزة الحوسبة المتقدمة، وخاصة وحدات معالجة الرسومات المتطورة من شركات مثل Nvidia. الفكرة وراء هذه القيود هي أن تقييد وصول الصين إلى الأجهزة القوية سيؤدي إلى إبطاء جهود تطوير الذكاء الاصطناعي الخاصة بها.

ومع ذلك، يبدو أن التعليقات التي أدلى بها جنسن هوانغ، الرئيس التنفيذي لشركة Nvidia، والتطورات الناشئة عن مختبرات الذكاء الاصطناعي الصينية تشير إلى أن هذه السياسات قد لا تكون فعالة كما هو مقصود. لاحظ هوانغ بشكل مشهور أن الصين تمتلك جزءًا كبيرًا من موهبة مطوري الذكاء الاصطناعي في العالم، وأن تقييد الوصول إلى الأجهزة قد يحفزهم على إيجاد حلول بديلة.

يشير اختراق Goku المزعوم في الذكاء الاصطناعي إلى أن الابتكار الخوارزمي يمكن أن يعوض قيود الأجهزة المحتملة، ولو إلى حد ما. إذا تمكن الباحثون الصينيون من تطوير خوارزميات تدريب أكثر كفاءة، فقد يتمكنون من تحقيق أداء ذكاء اصطناعي مماثل بأجهزة أقل قوة. يمكن أن يكون لهذا آثار كبيرة على المشهد العالمي للذكاء الاصطناعي، لأنه يشير إلى أن الصين قد تكون قادرة على مواصلة تطوير قدراتها في مجال الذكاء الاصطناعي على الرغم من القيود المستمرة.

هذا لا يعني أن الأجهزة غير ذات صلة. لا تزال وحدات معالجة الرسومات المتقدمة ضرورية لتدريب نماذج الذكاء الاصطناعي المتطورة، ولا شك أن الوصول إلى أحدث الأجهزة يوفر ميزة تنافسية كبيرة. ومع ذلك، يوضح عمل Goku أهمية الاستثمار في كل من الأجهزة والبرامج، وأن التقدم في أحد المجالات يمكن أن يعوض القيود في المجال الآخر.

صعود الذكاء الاصطناعي الصيني: ما وراء DeepSeek

كان ظهور DeepSeek كلاعب بارز في ساحة الذكاء الاصطناعي بمثابة حافز، مما يدل على تصميم الصين على أن تصبح رائدة عالمية في هذه التكنولوجيا التحويلية. ومع ذلك، فإن DeepSeek هي مجرد مثال واحد، وصعود Goku، مع إطار التدريب SASR الخاص بها، يوضح بشكل أكبر القوة والابتكار المتزايدين داخل النظام البيئي للذكاء الاصطناعي الصيني.

تساهم عدة عوامل في هذا الزخم.أولاً، لدى الصين مجموعة واسعة من البيانات، وهي ضرورية لتدريب نماذج الذكاء الاصطناعي. مع وجود عدد كبير من السكان والاعتماد الواسع النطاق على التقنيات الرقمية، تتمتع الشركات الصينية بإمكانية الوصول إلى مجموعات بيانات ضخمة يمكن استخدامها لتطوير وتحسين خوارزميات الذكاء الاصطناعي الخاصة بهم.

ثانيًا، تركز الصين بقوة على تعليم العلوم والتكنولوجيا والهندسة والرياضيات، مما ينتج عددًا كبيرًا من المهندسين والعلماء الموهوبين. وقد أدى ذلك إلى خلق قوة عاملة ذات مهارات عالية قادرة على دفع الابتكار في الذكاء الاصطناعي والمجالات ذات الصلة.

ثالثًا، جعلت الحكومة الصينية الذكاء الاصطناعي أولوية استراتيجية، حيث قدمت تمويلًا ودعمًا كبيرين للبحث والتطوير. وقد أدى ذلك إلى خلق بيئة خصبة للشركات الناشئة في مجال الذكاء الاصطناعي وتعزيز التعاون بين الأوساط الأكاديمية والصناعة.

أخيرًا، غالبًا ما تكون الشركات الصينية على استعداد لاتخاذ نهج عملي وأكثر تحملًا للمخاطر في الابتكار، مما يسمح لها بالتحرك بسرعة وتجربة أفكار جديدة.

نتيجة لهذه العوامل، تلحق الصين بسرعة بالولايات المتحدة من حيث قدرات الذكاء الاصطناعي. في حين أن الولايات المتحدة لا تزال تحتل الصدارة في بعض المجالات، مثل البحث الأساسي والأجهزة المتطورة، فإن الصين تحقق خطوات كبيرة في مجالات مثل رؤية الكمبيوتر ومعالجة اللغة الطبيعية والروبوتات.

يشير ظهور شركات مثل Goku وDeepSeek إلى أن الصين في وضع جيد لمواصلة صعودها في مجال الذكاء الاصطناعي في السنوات القادمة.

Shanghai Goku Technologies: الشركة التي تقف وراء الابتكار

Shanghai Goku Technologies هي صندوق تداول كمي تأسس في عام 2015. وهي تدير أصولًا كبيرة باستخدام استراتيجيات تعتمد على الذكاء الاصطناعي. تتمثل مهمة الشركة المعلنة في “الجمع بين التكنولوجيا والتحليل الأساسي” لمنح عائدات أفضل لعملائها. إلى جانب أعمالها الأساسية في إدارة الأصول، أظهرت Goku التزامًا بتجاوز حدود أبحاث الذكاء الاصطناعي. تمثل AllMind Artificial Intelligence Technology، وهي شركة فرعية متخصصة في الذكاء الاصطناعي، خطوة استراتيجية لإضفاء الطابع الرسمي على جهودها البحثية في مجال الذكاء الاصطناعي وتسريعها.

لا تزال التفاصيل المتعلقة بالهيكل الداخلي للشركة وديناميكيات التشغيل نادرة نسبيًا. ومع ذلك، فإن تصريحاتها العامة وأنشطتها الأخيرة تقدم رؤى حول نهجها. يعكس شعار الشركة، الذي يُترجم إلى “المنطق والحقيقة هما المبدأان الوحيدان اللذان نطيعهما”، ثقافة تحليلية تعتمد على البيانات. يشير الاستثمار في البحث والتطوير في مجال الذكاء الاصطناعي إلى رؤية طويلة الأجل وإدراك للإمكانات التحويلية للذكاء الاصطناعي، ليس فقط داخل القطاع المالي ولكن أيضًا عبر مختلف الصناعات. من المحتمل أن Goku تعتزم الاستفادة من الرؤى المستمدة من أبحاث الذكاء الاصطناعي لتحسين استراتيجيات التداول الخاصة بها واكتساب ميزة تنافسية في السوق.

تم التحديث في ٢٠٢٥-٠٥-٢٣

# AI # LLM # Fine-Tuning