تلاش تایوان برای حاکمیت هوش مصنوعی در برابر DeepSeek

در حالی که پیشرفت‌های اخیر چین در زمینه هوش مصنوعی، به ویژه با راه‌اندازی DeepSeek-R1، توجه جهانی را به خود جلب کرده است، تایوان مسیری متفاوت را ترسیم می‌کند، مسیری که اولویت را به توسعه مدل‌های زبانی می‌دهد که منعکس کننده هویت فرهنگی منحصر به فرد و ارزش‌های دموکراتیک آن است. این تلاش با هدف ایجاد وزنه تعادلی در برابر سیستم‌های هوش مصنوعی با نفوذ رژیم‌های اقتدارگرا انجام می‌شود.

چالش DeepSeek

رونمایی از DeepSeek-R1 در ماه ژانویه، علاقه قابل توجهی را در جامعه فناوری برانگیخت. مدل‌های زبانی چینی قبلی، مانند Ernie Baidu و Doubao ByteDance، نویدهایی را در برنامه‌های زبان چینی، ریاضیات و کدنویسی نشان دادند، اما به دلیل مهارت ضعیف‌تر انگلیسی و دسترسی محدود، محدود بودند. با این حال، DeepSeek-R1 نقطه عطفی مهم را به عنوان اولین LLM چینی که به رسمیت شناخته شده بین المللی دست یافت، نشان داد.

یکی از بارزترین جنبه های DeepSeek-R1، هزینه توسعه پایین آن بود. در مقایسه با GPT-4o OpenAI، که گفته می‌شود بیش از 100 میلیون دلار آمریکا برای آموزش هزینه داشته است، محققان DeepSeek ادعا کردند که ربات چت آنها تنها با 5.6 میلیون دلار آمریکا توسعه یافته است. مهندسان DeepSeek علاوه بر تقویت روایت کارایی، مدل R1 را با استفاده از CPUهای میان رده مانند Nvidia H800، به جای تراشه های رده بالا مورد استفاده در مدل هایی مانند GPT-4o یا Claude Anthropic آموزش دادند. علیرغم محدودیت‌های ایالات متحده در صادرات تراشه‌های با کارایی بالا به چین، DeepSeek-R1 با استفاده از تنها 2048 پردازنده توزیع شده در 256 سرور، توانست از دیگر ربات‌های پیشرو بهتر عمل کند.

این راندمان قابل توجه و هزینه توسعه کمتر، عمدتاً به تکنیک‌های برنامه‌نویسی پیچیده، از جمله PTX، یک زبان شبیه به اسمبلی که توسعه‌دهندگان را قادر می‌سازد تا عملکرد را تنظیم کرده و استفاده از سخت‌افزار را به حداکثر برسانند، نسبت داده شد.

اندکی پس از انتشار، اپلیکیشن DeepSeek-R1 به صدر رتبه بندی دانلود رایگان اپ استور اپل ایالات متحده صعود کرد و از ChatGPT، TikTok و پلتفرم های رسانه های اجتماعی Meta پیشی گرفت. Nasdaq با کاهش مواجه شد و سهام Nvidia پس از اولین نمایش DeepSeek-R1 سقوط کرد.

تردید در ادعاهای DeepSeek

علیرغم اشتیاق اولیه، بسیاری از ناظران در مورد اعتبار ادعاهای DeepSeek در مورد LLM خود سؤالاتی را مطرح کرده اند. تحلیلگران پیشنهاد کرده اند که ارقام ذکر شده احتمالاً فقط هزینه های محاسباتی را شامل می شود، در حالی که هزینه های زیرساخت، سخت افزار و منابع انسانی را حذف یا کم اهمیت جلوه می دهند.

وسلی کوو، بنیانگذار و مدیرعامل Ubitus، یک ارائه دهنده خدمات بازی ابری و هوش مصنوعی مولد مستقر در تایپه، این نگرانی ها را تکرار کرد و اظهار داشت که هزینه واقعی احتمالاً بسیار بیشتر از آن چیزی است که گزارش می شود. Ubitus، با حمایت Nvidia، از Project TAME، یک LLM محلی شده با استفاده از کاراکترهای سنتی چینی پشتیبانی کرد. آنها CPUهای H100 و داده های بازی را ارائه کردند. Ubitus همچنین با Foxlink و Shinfox Energy برای تأسیس Ubilink.AI همکاری کرد و بزرگترین مرکز خدمات ابررایانه هوش مصنوعی با انرژی سبز تایوان را با همکاری Asus ساخت.

کوو بر مشارکت این شرکت در توسعه برنامه‌ها و مدل‌های LLM برای دولت‌ها، از جمله دولت ژاپن، در بخش‌هایی مانند بازی، گردشگری و خرده‌فروشی تأکید می‌کند و بر پتانسیل هوش مصنوعی برای رفع کمبود نیروی کار و جمعیت پیر تأکید می‌کند.

نگرانی های مربوط به یکپارچگی داده

کوو با OpenAI و Microsoft همسو است و پیشنهاد می کند که DeepSeek ممکن است داده ها را از طریق تقطیر مدل به دست آورده باشد. این فرآیند شامل آموزش مدل‌های زبان کوچکتر برای تقلید از خروجی‌های مدل‌های بزرگتر است. OpenAI و Microsoft ادعا می‌کنند که DeepSeek از رابط برنامه نویسی برنامه OpenAI برای تسهیل توسعه خود استفاده کرده است.

کوو ادعا می‌کند که DeepSeek داده‌ها را از OpenAI به دست آورده است و سوءتفاهم‌هایی در مورد ادعاهای این شرکت در مورد کارایی وجود دارد. او اشاره می‌کند که DeepSeek-R1، با 670 میلیارد پارامتر خود، به طور قابل توجهی بزرگتر از Llama 3.1 405B Meta AI است. پارامترها مقادیر عددی داخلی هستند که یک مدل در طول آموزش برای پیش‌بینی یاد می‌گیرد. کوو همچنین پیشنهاد می‌کند که مدل‌های DeepSeek ممکن است از Llama 3.1 تقطیر شده باشند.

فراتر از این تکذیب‌ها، نگرانی‌هایی نیز در مورد قابلیت‌های DeepSeek-R1 پدید آمده است. کارشناسان پیشنهاد می کنند که R1 مانند مدل‌های قبلی خود، در عملکردهای تخصصی و خاص وظیفه برتری دارد، اما از نسخه های GPT-4o در عملکرد عمومی عقب است.

یکی از محدودیت‌های اصلی مدل‌های DeepSeek، محدودیت در دسترسی آزاد به اطلاعات است. کاربران دریافتند که پرس و جوها در مورد موضوعات حساس سیاسی با پاسخ های طفره آمیز مواجه می شوند. در مورد موضوعاتی مانند وضعیت اقلیت اویغور شین جیانگ و تایوان، پاسخ‌های DeepSeek منعکس کننده مواضع رسمی حزب کمونیست چین است. تحقیقات نشان می دهد که بخش قابل توجهی از خروجی های DeepSeek برای سرکوب اطلاعات مربوط به دموکراسی، حقوق بشر و ادعاهای حاکمیتی مورد مناقشه چین سانسور می شوند.

جایگزین تایوان: TAIDE و فراتر از آن

در پاسخ، LLMهای توسعه یافته در تایوان، مانند TAME، به عنوان جایگزینی برای DeepSeek در حوزه Sinosphere ظاهر شده اند. موتور گفتگوی هوش مصنوعی قابل اعتماد (TAIDE) که در ژوئن 2023 توسط موسسه ملی تحقیقات کاربردی راه اندازی شد، هدف از توسعه مدلی همسو با هنجارهای اجتماعی، فرهنگی و زبانی تایوان است.

در حالی که به نظر می‌رسد کار روی TAIDE متوقف شده است، اما به عنوان معیار مهمی برای Project TAME عمل کرد. TAME، که توسط آزمایشگاه هوش ماشین و درک (MiuLab) در دانشگاه ملی تایوان، با بودجه سازمان‌های مختلف توسعه یافته است، بر روی 500 میلیارد نشانه آموزش داده شد. این شرکت از رقبای خود، از جمله GPT-4o، در 39 ارزیابی پیشی گرفت و نمرات بالاتری در امتحانات ورودی دانشگاه، وکالت و طب سنتی چینی به دست آورد.

یکی از اهداف TAME ترویج فرهنگ محلی است. باز کردن قابلیت های زبان محلی گام مهمی است. کوو به توسعه یک LLM صوتی تایوانی مبتنی بر Whisper اشاره می‌کند که نتایج مثبتی در درک تایوانی شفاهی به دست آورده است. تلاش هایی برای توسعه تشخیص زبان هاکا در حال انجام است.

این تلاش ها با استقبال خوبی از سوی موسسات در مناطقی که این زبان ها در آن رواج دارند، مواجه شده است. همچنین تلاش هایی برای آموزش مدل در تشخیص زبان بومی وجود دارد، اما داده های محدود همچنان یک مانع است. آموزش هوش مصنوعی برای یادگیری یک زبان جدید به مقدار قابل توجهی از ضبط‌های صوتی همراه با متن نیاز دارد.

دسترسی به داده های تاریخی در بایگانی های دولتی فرصت دیگری را ارائه می دهد. با این حال، برخی از داده ها توسط حق چاپ محافظت می شوند. ظهور هوش مصنوعی عمومی پتانسیل کمک به احیای زبان های در معرض خطر و منقرض شده را ارائه می دهد.

پیگیری حاکمیت هوش مصنوعی

تلاقی زبان و فرهنگ بر اهمیت حاکمیت هوش مصنوعی به عنوان ابزاری برای تقویت هویت تایوانی، انتقال روایت تایوان و محافظت از محیط اطلاعاتی آن تأکید می کند.

جولیان چو، مشاور صنعت و مدیر موسسه اطلاعات و مشاوره بازار (MIC)، بر پتانسیل سوگیری در مدل‌های LLM و داده‌های آموزشی تأکید می‌کند. او خاطرنشان می‌کند که حتی هنگام استفاده از کاراکترهای سنتی، خروجی‌های LLM می‌توانند سبک جمهوری خلق چین را منعکس کنند و فرهنگ تایوان را ثبت نکنند. هدف این است که شرکت‌های تایوانی از زبان یا داده‌های تایوانی برای آموزش LLM و ایجاد حاکمیت هوش مصنوعی استفاده کنند.

چو به مدل بنیاد فرموسا (FFM-Llama2) به عنوان یکی دیگر از LLM های امیدوارکننده تایوان اشاره می کند. این مدل که در سپتامبر 2023 توسط خدمات وب تایوان منتشر شد، با هدف دموکراتیک کردن هوش مصنوعی بود. Foxconn نیز LLM خود، FoxBrain را در ماه مارس راه اندازی کرد. با این حال، برخی از مفسران نسبت به سرمایه گذاری شرکت های بزرگ در LLM ها همچنان بدبین هستند.

لین ین تینگ، یکی از اعضای تیم MiuLab که TAME را توسعه داده است، بر لزوم رفع شکاف در محیط اطلاعاتی در مورد تایوان تأکید می‌کند. او خاطرنشان می‌کند که DeepSeek-R1 و دیگر LLM‌های چینی دیدگاه تحریف شده‌ای از تایوان ارائه می‌دهند. مدل‌های توسعه یافته در ایالات متحده نیز گاهی اوقات ممکن است تایوان را نادرست نشان دهند. مدل‌های متن باز ممکن است تایوان را در اولویت قرار ندهند و داده‌های آموزشی تحت سلطه چین هستند.

بنابراین، مهم است که محتوای تایوانی را به طور انتخابی در مدل بگنجانیم و آن را دوباره آموزش دهیم. این رویکرد فعال تضمین می‌کند که چشم‌انداز منحصربه‌فرد فرهنگی و زبانی تایوان به طور دقیق در حوزه دیجیتال نشان داده شود و حس هویت ملی را تقویت کرده و میراث متمایز آن را در مواجهه با توسعه جهانی هوش مصنوعی حفظ کند. این فداکاری برای حفظ هویت تایوانی تضمین می کند که فرهنگ و ارزش های منحصر به فرد این کشور جزیره ای تحت الشعاع روایات غالب قرار نگیرند.

چالش های ذاتی در این تلاش اساسی است. ایجاد یک مدل هوش مصنوعی واقعاً نماینده نیاز به سرمایه گذاری قابل توجهی در منابع دارد، از جمله دسترسی به مجموعه داده های گسترده از محتوای محلی شده و تخصص در پردازش زبان طبیعی. علاوه بر این، نیاز مداوم برای مقابله با اطلاعات نادرست و اطلاعات مغرضانه مستلزم یک فرآیند مداوم پالایش و سازگاری است.

علیرغم این چالش‌ها، تعهد تایوان به حاکمیت هوش مصنوعی ثابت قدم باقی مانده است. توسعه TAME و دیگر LLMهای محلی گامی حیاتی در جهت تضمین این است که آینده هوش مصنوعی منعکس کننده هویت فرهنگی منحصر به فرد، ارزش‌های دموکراتیک و تعهد تزلزل ناپذیر این جزیره به حفظ جایگاه متمایز خود در جهان باشد. تایوان با اولویت دادن به حاکمیت هوش مصنوعی، نه تنها از میراث فرهنگی خود محافظت می‌کند، بلکه خود را به عنوان یک بازیگر کلیدی در چشم‌انداز جهانی هوش مصنوعی معرفی می‌کند و نشان می‌دهد که پیشرفت‌های فناوری می‌تواند با حفظ هویت فرهنگی و اصول دموکراتیک همسو باشد.

ادامه سفر

سفر به سوی حاکمیت کامل هوش مصنوعی در حال انجام است. تحقیقات، توسعه و همکاری بیشتر برای غلبه بر چالش‌ها و تضمین موفقیت بلندمدت این ابتکارات بسیار مهم است. تایوان با ادامه اولویت دادن به حاکمیت هوش مصنوعی، می‌تواند چشم‌انداز دیجیتالی ایجاد کند که حقیقتاً منعکس کننده هویت فرهنگی منحصربه‌فرد و ارزش‌های دموکراتیک آن باشد و الگویی برای سایر کشورهایی باشد که در تلاشند جایگاه متمایز خود را در دنیایی که به طور فزاینده‌ای به هم پیوسته است، حفظ کنند.