در حالی که پیشرفتهای اخیر چین در زمینه هوش مصنوعی، به ویژه با راهاندازی DeepSeek-R1، توجه جهانی را به خود جلب کرده است، تایوان مسیری متفاوت را ترسیم میکند، مسیری که اولویت را به توسعه مدلهای زبانی میدهد که منعکس کننده هویت فرهنگی منحصر به فرد و ارزشهای دموکراتیک آن است. این تلاش با هدف ایجاد وزنه تعادلی در برابر سیستمهای هوش مصنوعی با نفوذ رژیمهای اقتدارگرا انجام میشود.
چالش DeepSeek
رونمایی از DeepSeek-R1 در ماه ژانویه، علاقه قابل توجهی را در جامعه فناوری برانگیخت. مدلهای زبانی چینی قبلی، مانند Ernie Baidu و Doubao ByteDance، نویدهایی را در برنامههای زبان چینی، ریاضیات و کدنویسی نشان دادند، اما به دلیل مهارت ضعیفتر انگلیسی و دسترسی محدود، محدود بودند. با این حال، DeepSeek-R1 نقطه عطفی مهم را به عنوان اولین LLM چینی که به رسمیت شناخته شده بین المللی دست یافت، نشان داد.
یکی از بارزترین جنبه های DeepSeek-R1، هزینه توسعه پایین آن بود. در مقایسه با GPT-4o OpenAI، که گفته میشود بیش از 100 میلیون دلار آمریکا برای آموزش هزینه داشته است، محققان DeepSeek ادعا کردند که ربات چت آنها تنها با 5.6 میلیون دلار آمریکا توسعه یافته است. مهندسان DeepSeek علاوه بر تقویت روایت کارایی، مدل R1 را با استفاده از CPUهای میان رده مانند Nvidia H800، به جای تراشه های رده بالا مورد استفاده در مدل هایی مانند GPT-4o یا Claude Anthropic آموزش دادند. علیرغم محدودیتهای ایالات متحده در صادرات تراشههای با کارایی بالا به چین، DeepSeek-R1 با استفاده از تنها 2048 پردازنده توزیع شده در 256 سرور، توانست از دیگر رباتهای پیشرو بهتر عمل کند.
این راندمان قابل توجه و هزینه توسعه کمتر، عمدتاً به تکنیکهای برنامهنویسی پیچیده، از جمله PTX، یک زبان شبیه به اسمبلی که توسعهدهندگان را قادر میسازد تا عملکرد را تنظیم کرده و استفاده از سختافزار را به حداکثر برسانند، نسبت داده شد.
اندکی پس از انتشار، اپلیکیشن DeepSeek-R1 به صدر رتبه بندی دانلود رایگان اپ استور اپل ایالات متحده صعود کرد و از ChatGPT، TikTok و پلتفرم های رسانه های اجتماعی Meta پیشی گرفت. Nasdaq با کاهش مواجه شد و سهام Nvidia پس از اولین نمایش DeepSeek-R1 سقوط کرد.
تردید در ادعاهای DeepSeek
علیرغم اشتیاق اولیه، بسیاری از ناظران در مورد اعتبار ادعاهای DeepSeek در مورد LLM خود سؤالاتی را مطرح کرده اند. تحلیلگران پیشنهاد کرده اند که ارقام ذکر شده احتمالاً فقط هزینه های محاسباتی را شامل می شود، در حالی که هزینه های زیرساخت، سخت افزار و منابع انسانی را حذف یا کم اهمیت جلوه می دهند.
وسلی کوو، بنیانگذار و مدیرعامل Ubitus، یک ارائه دهنده خدمات بازی ابری و هوش مصنوعی مولد مستقر در تایپه، این نگرانی ها را تکرار کرد و اظهار داشت که هزینه واقعی احتمالاً بسیار بیشتر از آن چیزی است که گزارش می شود. Ubitus، با حمایت Nvidia، از Project TAME، یک LLM محلی شده با استفاده از کاراکترهای سنتی چینی پشتیبانی کرد. آنها CPUهای H100 و داده های بازی را ارائه کردند. Ubitus همچنین با Foxlink و Shinfox Energy برای تأسیس Ubilink.AI همکاری کرد و بزرگترین مرکز خدمات ابررایانه هوش مصنوعی با انرژی سبز تایوان را با همکاری Asus ساخت.
کوو بر مشارکت این شرکت در توسعه برنامهها و مدلهای LLM برای دولتها، از جمله دولت ژاپن، در بخشهایی مانند بازی، گردشگری و خردهفروشی تأکید میکند و بر پتانسیل هوش مصنوعی برای رفع کمبود نیروی کار و جمعیت پیر تأکید میکند.
نگرانی های مربوط به یکپارچگی داده
کوو با OpenAI و Microsoft همسو است و پیشنهاد می کند که DeepSeek ممکن است داده ها را از طریق تقطیر مدل به دست آورده باشد. این فرآیند شامل آموزش مدلهای زبان کوچکتر برای تقلید از خروجیهای مدلهای بزرگتر است. OpenAI و Microsoft ادعا میکنند که DeepSeek از رابط برنامه نویسی برنامه OpenAI برای تسهیل توسعه خود استفاده کرده است.
کوو ادعا میکند که DeepSeek دادهها را از OpenAI به دست آورده است و سوءتفاهمهایی در مورد ادعاهای این شرکت در مورد کارایی وجود دارد. او اشاره میکند که DeepSeek-R1، با 670 میلیارد پارامتر خود، به طور قابل توجهی بزرگتر از Llama 3.1 405B Meta AI است. پارامترها مقادیر عددی داخلی هستند که یک مدل در طول آموزش برای پیشبینی یاد میگیرد. کوو همچنین پیشنهاد میکند که مدلهای DeepSeek ممکن است از Llama 3.1 تقطیر شده باشند.
فراتر از این تکذیبها، نگرانیهایی نیز در مورد قابلیتهای DeepSeek-R1 پدید آمده است. کارشناسان پیشنهاد می کنند که R1 مانند مدلهای قبلی خود، در عملکردهای تخصصی و خاص وظیفه برتری دارد، اما از نسخه های GPT-4o در عملکرد عمومی عقب است.
یکی از محدودیتهای اصلی مدلهای DeepSeek، محدودیت در دسترسی آزاد به اطلاعات است. کاربران دریافتند که پرس و جوها در مورد موضوعات حساس سیاسی با پاسخ های طفره آمیز مواجه می شوند. در مورد موضوعاتی مانند وضعیت اقلیت اویغور شین جیانگ و تایوان، پاسخهای DeepSeek منعکس کننده مواضع رسمی حزب کمونیست چین است. تحقیقات نشان می دهد که بخش قابل توجهی از خروجی های DeepSeek برای سرکوب اطلاعات مربوط به دموکراسی، حقوق بشر و ادعاهای حاکمیتی مورد مناقشه چین سانسور می شوند.
جایگزین تایوان: TAIDE و فراتر از آن
در پاسخ، LLMهای توسعه یافته در تایوان، مانند TAME، به عنوان جایگزینی برای DeepSeek در حوزه Sinosphere ظاهر شده اند. موتور گفتگوی هوش مصنوعی قابل اعتماد (TAIDE) که در ژوئن 2023 توسط موسسه ملی تحقیقات کاربردی راه اندازی شد، هدف از توسعه مدلی همسو با هنجارهای اجتماعی، فرهنگی و زبانی تایوان است.
در حالی که به نظر میرسد کار روی TAIDE متوقف شده است، اما به عنوان معیار مهمی برای Project TAME عمل کرد. TAME، که توسط آزمایشگاه هوش ماشین و درک (MiuLab) در دانشگاه ملی تایوان، با بودجه سازمانهای مختلف توسعه یافته است، بر روی 500 میلیارد نشانه آموزش داده شد. این شرکت از رقبای خود، از جمله GPT-4o، در 39 ارزیابی پیشی گرفت و نمرات بالاتری در امتحانات ورودی دانشگاه، وکالت و طب سنتی چینی به دست آورد.
یکی از اهداف TAME ترویج فرهنگ محلی است. باز کردن قابلیت های زبان محلی گام مهمی است. کوو به توسعه یک LLM صوتی تایوانی مبتنی بر Whisper اشاره میکند که نتایج مثبتی در درک تایوانی شفاهی به دست آورده است. تلاش هایی برای توسعه تشخیص زبان هاکا در حال انجام است.
این تلاش ها با استقبال خوبی از سوی موسسات در مناطقی که این زبان ها در آن رواج دارند، مواجه شده است. همچنین تلاش هایی برای آموزش مدل در تشخیص زبان بومی وجود دارد، اما داده های محدود همچنان یک مانع است. آموزش هوش مصنوعی برای یادگیری یک زبان جدید به مقدار قابل توجهی از ضبطهای صوتی همراه با متن نیاز دارد.
دسترسی به داده های تاریخی در بایگانی های دولتی فرصت دیگری را ارائه می دهد. با این حال، برخی از داده ها توسط حق چاپ محافظت می شوند. ظهور هوش مصنوعی عمومی پتانسیل کمک به احیای زبان های در معرض خطر و منقرض شده را ارائه می دهد.
پیگیری حاکمیت هوش مصنوعی
تلاقی زبان و فرهنگ بر اهمیت حاکمیت هوش مصنوعی به عنوان ابزاری برای تقویت هویت تایوانی، انتقال روایت تایوان و محافظت از محیط اطلاعاتی آن تأکید می کند.
جولیان چو، مشاور صنعت و مدیر موسسه اطلاعات و مشاوره بازار (MIC)، بر پتانسیل سوگیری در مدلهای LLM و دادههای آموزشی تأکید میکند. او خاطرنشان میکند که حتی هنگام استفاده از کاراکترهای سنتی، خروجیهای LLM میتوانند سبک جمهوری خلق چین را منعکس کنند و فرهنگ تایوان را ثبت نکنند. هدف این است که شرکتهای تایوانی از زبان یا دادههای تایوانی برای آموزش LLM و ایجاد حاکمیت هوش مصنوعی استفاده کنند.
چو به مدل بنیاد فرموسا (FFM-Llama2) به عنوان یکی دیگر از LLM های امیدوارکننده تایوان اشاره می کند. این مدل که در سپتامبر 2023 توسط خدمات وب تایوان منتشر شد، با هدف دموکراتیک کردن هوش مصنوعی بود. Foxconn نیز LLM خود، FoxBrain را در ماه مارس راه اندازی کرد. با این حال، برخی از مفسران نسبت به سرمایه گذاری شرکت های بزرگ در LLM ها همچنان بدبین هستند.
لین ین تینگ، یکی از اعضای تیم MiuLab که TAME را توسعه داده است، بر لزوم رفع شکاف در محیط اطلاعاتی در مورد تایوان تأکید میکند. او خاطرنشان میکند که DeepSeek-R1 و دیگر LLMهای چینی دیدگاه تحریف شدهای از تایوان ارائه میدهند. مدلهای توسعه یافته در ایالات متحده نیز گاهی اوقات ممکن است تایوان را نادرست نشان دهند. مدلهای متن باز ممکن است تایوان را در اولویت قرار ندهند و دادههای آموزشی تحت سلطه چین هستند.
بنابراین، مهم است که محتوای تایوانی را به طور انتخابی در مدل بگنجانیم و آن را دوباره آموزش دهیم. این رویکرد فعال تضمین میکند که چشمانداز منحصربهفرد فرهنگی و زبانی تایوان به طور دقیق در حوزه دیجیتال نشان داده شود و حس هویت ملی را تقویت کرده و میراث متمایز آن را در مواجهه با توسعه جهانی هوش مصنوعی حفظ کند. این فداکاری برای حفظ هویت تایوانی تضمین می کند که فرهنگ و ارزش های منحصر به فرد این کشور جزیره ای تحت الشعاع روایات غالب قرار نگیرند.
چالش های ذاتی در این تلاش اساسی است. ایجاد یک مدل هوش مصنوعی واقعاً نماینده نیاز به سرمایه گذاری قابل توجهی در منابع دارد، از جمله دسترسی به مجموعه داده های گسترده از محتوای محلی شده و تخصص در پردازش زبان طبیعی. علاوه بر این، نیاز مداوم برای مقابله با اطلاعات نادرست و اطلاعات مغرضانه مستلزم یک فرآیند مداوم پالایش و سازگاری است.
علیرغم این چالشها، تعهد تایوان به حاکمیت هوش مصنوعی ثابت قدم باقی مانده است. توسعه TAME و دیگر LLMهای محلی گامی حیاتی در جهت تضمین این است که آینده هوش مصنوعی منعکس کننده هویت فرهنگی منحصر به فرد، ارزشهای دموکراتیک و تعهد تزلزل ناپذیر این جزیره به حفظ جایگاه متمایز خود در جهان باشد. تایوان با اولویت دادن به حاکمیت هوش مصنوعی، نه تنها از میراث فرهنگی خود محافظت میکند، بلکه خود را به عنوان یک بازیگر کلیدی در چشمانداز جهانی هوش مصنوعی معرفی میکند و نشان میدهد که پیشرفتهای فناوری میتواند با حفظ هویت فرهنگی و اصول دموکراتیک همسو باشد.
ادامه سفر
سفر به سوی حاکمیت کامل هوش مصنوعی در حال انجام است. تحقیقات، توسعه و همکاری بیشتر برای غلبه بر چالشها و تضمین موفقیت بلندمدت این ابتکارات بسیار مهم است. تایوان با ادامه اولویت دادن به حاکمیت هوش مصنوعی، میتواند چشمانداز دیجیتالی ایجاد کند که حقیقتاً منعکس کننده هویت فرهنگی منحصربهفرد و ارزشهای دموکراتیک آن باشد و الگویی برای سایر کشورهایی باشد که در تلاشند جایگاه متمایز خود را در دنیایی که به طور فزایندهای به هم پیوسته است، حفظ کنند.