في حين أن خطوات الصين الأخيرة في مجال الذكاء الاصطناعي، وخاصةً مع إطلاق DeepSeek-R1، قد استحوذت على اهتمام عالمي، فإن تايوان ترسم مسارًا مختلفًا، وهو مسار يعطي الأولوية لتطوير نماذج لغوية تعكس هويتها الثقافية الفريدة وقيمها الديمقراطية. يهدف هذا المسعى إلى إيجاد ثقل موازن لأنظمة الذكاء الاصطناعي المتأثرة بالأنظمة الاستبدادية.
تحدي DeepSeek
أثار الكشف عن DeepSeek-R1 في يناير اهتمامًا كبيرًا داخل مجتمع التكنولوجيا. أظهرت نماذج اللغة الصينية السابقة، مثل Ernie من Baidu و Doubao من ByteDance، وعدًا في تطبيقات اللغة الصينية والرياضيات والترميز، لكنها كانت محدودة بسبب ضعف الكفاءة في اللغة الإنجليزية ومحدودية إمكانية الوصول. ومع ذلك، فقد مثّل DeepSeek-R1 علامة فارقة مهمة باعتباره أول نموذج لغوي صيني كبير يحظى باعتراف دولي.
كان أحد أبرز جوانب DeepSeek-R1 هو تكلفة التطوير المنخفضة المبلغ عنها. على عكس GPT-4o من OpenAI، والذي يُزعم أنه كلف أكثر من 100 مليون دولار أمريكي للتدريب، ادعى باحثو DeepSeek أن برنامج الدردشة الآلي الخاص بهم تم تطويره مقابل 5.6 مليون دولار أمريكي فقط. ومما زاد من تأجيج سرد الكفاءة، قام مهندسو DeepSeek بتدريب نموذج R1 باستخدام وحدات معالجة مركزية متوسطة المدى مثل Nvidia H800، بدلاً من الرقائق عالية المستوى المستخدمة في نماذج مثل GPT-4o أو Claude من Anthropic. على الرغم من القيود الأمريكية المفروضة على تصدير الرقائق عالية الأداء إلى الصين، تمكن DeepSeek-R1 من التفوق على الروبوتات الرائدة الأخرى باستخدام 2048 معالجًا فقط موزعة عبر 256 خادمًا.
تعزى هذه الكفاءة الرائعة وتكلفة التطوير المنخفضة إلى حد كبير إلى تقنيات البرمجة المتطورة، بما في ذلك PTX، وهي لغة تشبه التجميع تتيح للمطورين ضبط الأداء بدقة وزيادة استخدام الأجهزة إلى أقصى حد.
بعد وقت قصير من إطلاقه، ارتفع تطبيق DeepSeek-R1 إلى قمة تصنيفات التنزيل المجاني لمتجر تطبيقات Apple الأمريكي، متجاوزًا ChatGPT و TikTok ومنصات التواصل الاجتماعي الخاصة بـ Meta. شهد مؤشر Nasdaq انخفاضًا، وانخفضت أسهم Nvidia في أعقاب ظهور DeepSeek-R1.
التشكيك في ادعاءات DeepSeek
على الرغم من الحماس الأولي، أثار العديد من المراقبين تساؤلات حول صحة ادعاءات DeepSeek بشأن نموذجها اللغوي الكبير. اقترح المحللون أن الأرقام المذكورة من المحتمل أن تمثل فقط التكاليف الحسابية، في حين تستبعد أو تقلل من شأن البنية التحتية والأجهزة ونفقات الموارد البشرية.
وردد ويسلي كو، المؤسس والرئيس التنفيذي لشركة Ubitus، وهي شركة مقرها تايبيه لخدمات الذكاء الاصطناعي التوليدية والحوسبة السحابية للألعاب، هذه المخاوف، مشيرًا إلى أن التكلفة الفعلية من المحتمل أن تكون أعلى بكثير مما يتم الإبلاغ عنه. دعمت Ubitus، بدعم من Nvidia، مشروع TAME، وهو نموذج لغوي كبير محلي باستخدام الأحرف الصينية التقليدية. لقد وفروا وحدات معالجة مركزية H100 وبيانات الألعاب. تعاونت Ubitus أيضًا مع Foxlink و Shinfox Energy لإنشاء Ubilink.AI، وبناء أكبر مركز خدمة حوسبة فائقة للذكاء الاصطناعي يعمل بالطاقة الخضراء في تايوان بالتعاون مع Asus.
يؤكد كو على مشاركة الشركة في تطوير تطبيقات ونماذج LLM للحكومات، بما في ذلك الحكومة اليابانية، عبر قطاعات مثل الألعاب والسياحة والتجزئة، مما يسلط الضوء على إمكانات الذكاء الاصطناعي في معالجة نقص العمالة وشيخوخة السكان.
مخاوف بشأن سلامة البيانات
يتفق كو مع OpenAI و Microsoft في اقتراح أن DeepSeek ربما تكون قد حصلت على البيانات من خلال تقطير النموذج. تتضمن هذه العملية تدريب نماذج لغوية أصغر لتقليد مخرجات النماذج الأكبر. تزعم OpenAI و Microsoft أن DeepSeek استخدمت واجهة برمجة تطبيقات OpenAI لتسهيل تطويرها.
يؤكد كو أن DeepSeek حصلت على بيانات من OpenAI وأن هناك سوء فهم يحيط بادعاءات الشركة بشأن الكفاءة. ويشير إلى أن DeepSeek-R1، بمعامِلاته البالغة 670 مليار، أكبر بكثير من Llama 3.1 405B من Meta AI. المعامِلات هي قيم رقمية داخلية يتعلمها النموذج أثناء التدريب لعمل تنبؤات. يشير كو أيضًا إلى أن نماذج DeepSeek ربما تم تقطيرها من Llama 3.1.
بالإضافة إلى هذه الردود، ظهرت أيضًا مخاوف بشأن قدرات DeepSeek-R1. يقترح الخبراء أنه، مثل سابقاته، يتفوق R1 في وظائف متخصصة ومحددة المهام ولكنه يتخلف عن إصدارات GPT-4o في الأداء للأغراض العامة.
أحد القيود الرئيسية لنماذج DeepSeek هو القيود المفروضة على الوصول المجاني إلى المعلومات. اكتشف المستخدمون أن الاستفسارات حول الموضوعات السياسية الحساسة قوبلت بردود مراوغة. في موضوعات مثل وضع أقلية الأويغور في شينجيانغ وتايوان، تعكس ردود DeepSeek المواقف الرسمية للحزب الشيوعي الصيني. تشير الأبحاث إلى أن جزءًا كبيرًا من مخرجات DeepSeek يتم حجبه لقمع المعلومات المتعلقة بالديمقراطية وحقوق الإنسان ومطالبات الصين المتنازع عليها بالسيادة.
بديل تايوان: TAIDE وما بعده
رداً على ذلك، ظهرت نماذج LLM المطورة في تايوان، مثل TAME، كبدائل لـ DeepSeek داخل Sinosphere. يهدف محرك الحوار الموثوق به للذكاء الاصطناعي (TAIDE)، الذي أطلقه المعهد الوطني للبحوث التطبيقية في يونيو 2023، إلى تطوير نموذج يتماشى مع المعايير الاجتماعية والثقافية واللغوية في تايوان.
في حين أن العمل على TAIDE يبدو أنه قد توقف، إلا أنه كان بمثابة معيار مهم لمشروع TAME. تم تدريب TAME، الذي طوره مختبر Machine Intelligence and Understanding Laboratory (MiuLab) في جامعة National Taiwan University، بتمويل من مختلف المنظمات، على 500 مليار رمز. لقد تفوقت على المنافسين، بما في ذلك GPT-4o، في 39 تقييمًا، وحققت درجات أعلى في امتحانات القبول بالجامعة والمحاماة وامتحانات الطب الصيني التقليدي.
أحد أهداف TAME هو تعزيز الثقافة المحلية. يعد إطلاق العنان لقدرات اللغة المحلية خطوة مهمة. يذكر كو تطوير نموذج LLM الصوتي التايواني استنادًا إلى Whisper، والذي حقق نتائج إيجابية في فهم اللغة التايوانية المنطوقة. تُبذل جهود لتطوير التعرف على لغة الهاكا.
وقد لقيت هذه الجهود استحساناً من المؤسسات في المناطق التي تنتشر فيها هذه اللغات. هناك أيضًا جهود لتدريب النموذج على التعرف على لغة السكان الأصليين، ولكن البيانات المحدودة لا تزال تشكل عقبة. يتطلب تدريب الذكاء الاصطناعي لتعلم لغة جديدة كمية كبيرة من التسجيلات الصوتية المقترنة بالنص.
يمثل الوصول إلى البيانات التاريخية في المحفوظات الحكومية فرصة أخرى. ومع ذلك، فإن بعض البيانات محمية بموجب حقوق النشر. يتيح ظهور الذكاء الاصطناعي العام إمكانية المساعدة في إحياء اللغات المهددة بالانقراض والمنقرضة.
السعي نحو السيادة في الذكاء الاصطناعي
يؤكد تقاطع اللغة والثقافة على أهمية السيادة في الذكاء الاصطناعي كوسيلة لتعزيز الهوية التايوانية، وتوصيل سرد تايوان، وحماية بيئتها المعلوماتية.
يؤكد جوليان تشو، المستشار الصناعي والمدير في معهد Market Intelligence & Consulting Institute (MIC)، على إمكانية التحيز في نماذج LLM وبيانات التدريب. ويشير إلى أنه حتى عند استخدام الأحرف التقليدية، يمكن أن تعكس مخرجات LLM أسلوب جمهورية الصين الشعبية وتفشل في التقاط ثقافة تايوان. الهدف هو أن تستخدم الشركات التايوانية اللغة أو البيانات التايوانية لتدريب LLM وبناء السيادة في الذكاء الاصطناعي.
يذكر تشو نموذج Formosa Foundation Model (FFM-Llama2) كنموذج LLM تايواني واعد آخر. تم إصداره في سبتمبر 2023 بواسطة Taiwan Web Service، وكان يهدف إلى إضفاء الطابع الديمقراطي على الذكاء الاصطناعي. أطلقت Foxconn أيضًا نموذج LLM الخاص بها، FoxBrain، في مارس. ومع ذلك، لا يزال بعض المعلقين متشككين في مشاريع الشركات الكبرى في LLM.
تؤكد Lin Yen-ting، وهي عضو في فريق MiuLab الذي طور TAME، على الحاجة إلى معالجة الفجوة في البيئة المعلوماتية فيما يتعلق بتايوان. ويشير إلى أن DeepSeek-R1 ونماذج LLM الصينية الأخرى تقدم رؤية مشوهة لتايوان. يمكن أيضًا للنماذج المطورة في الولايات المتحدة أن تسيء في بعض الأحيان تمثيل تايوان. قد لا تعطي النماذج مفتوحة المصدر الأولوية لتايوان، وتهيمن الصين على بيانات التدريب.
لذلك، من المهم دمج المحتوى التايواني بشكل انتقائي وإعادة تدريبه في النموذج. يضمن هذا النهج الاستباقي تمثيل المشهد الثقافي واللغوي الفريد لتايوان بدقة في العالم الرقمي، مما يعزز الشعور بالهوية الوطنية ويحافظ على تراثها المتميز في مواجهة التطور العالمي للذكاء الاصطناعي. يضمن هذا التفاني في الحفاظ على الهوية التايوانية عدم حجب ثقافة وقيم الدولة الجزيرة الفريدة بسبب الروايات المهيمنة.
التحديات الكامنة في هذا المسعى كبيرة. يتطلب بناء نموذج ذكاء اصطناعي تمثيلي حقًا استثمارًا كبيرًا للموارد، بما في ذلك الوصول إلى مجموعات بيانات واسعة من المحتوى المحلي والخبرة في معالجة اللغة الطبيعية. علاوة على ذلك، فإن الحاجة المستمرة لمواجهة المعلومات المضللة والمعلومات المتحيزة تستلزم عملية مستمرة من التحسين والتكيف.
على الرغم من هذه التحديات، يظل التزام تايوان بالسيادة في الذكاء الاصطناعي ثابتًا. يمثل تطوير TAME ونماذج LLM المحلية الأخرى خطوة حاسمة نحو ضمان أن يعكس مستقبل الذكاء الاصطناعي الهوية الثقافية الفريدة للجزيرة وقيمها الديمقراطية والتزامها الثابت بالحفاظ على مكانتها المتميزة في العالم. من خلال إعطاء الأولوية للسيادة في الذكاء الاصطناعي، فإن تايوان لا تحمي تراثها الثقافي فحسب، بل تضع نفسها أيضًا كلاعب رئيسي في المشهد العالمي للذكاء الاصطناعي، مما يدل على أن التقدم التكنولوجي يمكن أن يتماشى مع الحفاظ على الهوية الثقافية والمبادئ الديمقراطية.
مواصلة الرحلة
إن الرحلة نحو السيادة الكاملة في الذكاء الاصطناعي مستمرة. المزيد من البحث والتطوير والتعاون أمر بالغ الأهمية للتغلب على التحديات وضمان النجاح طويل الأجل لهذه المبادرات. من خلال الاستمرار في إعطاء الأولوية للسيادة في الذكاء الاصطناعي، يمكن لتايوان إنشاء مشهد رقمي يعكس حقًا هويتها الثقافية الفريدة وقيمها الديمقراطية، وتقديم مثال للدول الأخرى التي تسعى جاهدة للحفاظ على مكانتها المتميزة في عالم مترابط بشكل متزايد.