مسیر هوش مصنوعی چین: اولویت ادغام عملی بر قدرت خام

گفتگوی جهانی پیرامون هوش مصنوعی (Artificial intelligence) اغلب به نظر می‌رسد بر یک مسابقه تسلیحاتی بی‌امان متمرکز شده است – چه کسی می‌تواند بزرگترین و قدرتمندترین مدل زبان بزرگ (LLM) را بسازد؟ پیشرفت‌های اخیر، مانند قابلیت‌های چشمگیر نشان داده شده توسط مدل‌هایی مانند DeepSeek در چین، قطعاً این روایت را تقویت می‌کنند. در بحبوحه چشم‌انداز اقتصادی چالش‌برانگیز، چه در سطح جهانی و چه در داخل، چنین جهش‌های فناورانه‌ای نگاهی وسوسه‌انگیز به پتانسیل آینده و شاید، کاتالیزوری بسیار مورد نیاز برای رشد ارائه می‌دهند. با این حال، تمرکز صرف بر این LLMهای خبرساز، به معنای ندیدن جنگل به خاطر درختان است. هوش مصنوعی، به روش‌هایی کمتر پر زرق و برق اما عمیقاً تأثیرگذار، سال‌هاست که عمیقاً در تار و پود زندگی دیجیتال ما تنیده شده است.

پلتفرم‌های همه‌جایی را در نظر بگیرید که بر تعامل و تجارت آنلاین تسلط دارند. آیا TikTok یا همتای چینی آن Douyin می‌توانستند بدون الگوریتم‌های پیچیده توصیه‌گر که دائماً فیدهای محتوا را تنظیم می‌کنند، به چنین گستره جهانی حیرت‌انگیزی دست یابند؟ به طور مشابه، پیروزی‌های غول‌های تجارت الکترونیک، چه بازیگران بین‌المللی مانند Amazon، Shein و Temu، یا نیروگاه‌های داخلی مانند Taobao و JD.com، بر چیزی بسیار فراتر از تأمین منابع و لجستیک کارآمد بنا شده‌اند. AI به عنوان دست نامرئی عمل می‌کند و به طور نامحسوس انتخاب‌های ما را هدایت می‌کند. از کتاب‌هایی که برای خرید در نظر می‌گیریم تا روندهای مدی که اتخاذ می‌کنیم، عادات مصرف ما به طور فزاینده‌ای توسط سیستم‌هایی شکل می‌گیرد که خریدهای گذشته، تاریخچه مرور و الگوهای کلیک ما را تجزیه و تحلیل می‌کنند. مدت‌ها قبل از اینکه AI محاوره‌ای بتواند شعر زیبایی را بر اساس تقاضا بسازد، شرکت‌هایی مانند Amazon و Google پیشگام استفاده از AI برای درک و پیش‌بینی رفتار مصرف‌کننده بودند و اساساً بازار را تغییر دادند. این شکل آرام‌تر و فراگیرتر AI دهه‌هاست که تجارت و مصرف رسانه را تغییر شکل داده است و اغلب در زیر آستانه آگاهی عمل می‌کند.

شمشیر دولبه مدل‌های زبان بزرگ

ظهور LLMهای قدرتمندی مانند DeepSeek بدون شک نشان‌دهنده یک نقطه عطف مهم فناوری است. توانایی آنها در تولید متن شبیه به انسان، ترجمه زبان‌ها و حتی نوشتن محتوای خلاقانه مانند شعر قابل توجه است. این ابزارها نویدبخش بزرگی به عنوان دستیاران شخصی، کمک‌های تحقیقاتی و شرکای خلاق هستند. تصور کنید از چنین مدلی برای پیش‌نویس ایمیل‌ها، خلاصه کردن اسناد طولانی یا طوفان فکری ایده‌ها استفاده کنید – پتانسیل افزایش بهره‌وری فردی واضح است.

با این حال، این قدرت با هشدارهای قابل توجهی همراه است که ریشه در ماهیت عملکرد این مدل‌ها دارد. LLMها بر اساس روش‌های آماری پیچیده و شبکه‌های عصبی وسیعی ساخته شده‌اند که بر روی مجموعه داده‌های عظیم آموزش دیده‌اند. آنها در شناسایی الگوها و پیش‌بینی محتمل‌ترین توالی کلمات برتری دارند، اما فاقد درک یا آگاهی واقعی هستند. این پایه آماری منجر به یک آسیب‌پذیری حیاتی می‌شود: توهمات (hallucinations). هنگامی که LLMها با موضوعاتی خارج از داده‌های آموزشی خود یا پرس‌وجوهایی که نیاز به قضاوت دقیق دارند مواجه می‌شوند، می‌توانند با اطمینان اطلاعاتی قابل قبول اما کاملاً نادرست یا گمراه‌کننده تولید کنند.

یک LLM را نه به عنوان یک پیشگوی خطاناپذیر، بلکه شاید به عنوان یک متخصص فوق‌العاده باسواد، سخنور، اما گاهی اوقات داستان‌سرا در نظر بگیرید. در حالی که DeepSeek ممکن است یک غزل شورانگیز بسازد، اتکا به آن برای تفسیر حقوقی حیاتی، تشخیص‌های دقیق پزشکی یا مشاوره‌های مالی پرمخاطره عمیقاً نابخردانه خواهد بود. موتور احتمال آماری که به آن اجازه می‌دهد متن روان تولید کند، همچنین آن را مستعد اختراع ‘حقایق’ در زمانی می‌کند که فاقد دانش قطعی است. در حالی که معماری‌های جدیدتر و مدل‌های استدلال (مانند R1 DeepSeek یا o1/o3 شایعه شده OpenAI) با هدف کاهش این مشکل هستند، اما آن را از بین نبرده‌اند. یک LLM بی‌عیب و نقص، که تضمین شود در هر نمونه دقیق باشد، همچنان دست نیافتنی است. بنابراین، در حالی که LLMها می‌توانند ابزارهای قدرتمندی برای افراد باشند، استفاده از آنها باید با ارزیابی انتقادی تعدیل شود، به خصوص زمانی که تصمیمات مبتنی بر خروجی آنها وزن قابل توجهی دارند. آنها قابلیت انسانی را تقویت می‌کنند؛ آنها جایگزین قضاوت انسانی در حوزه‌های حیاتی نمی‌شوند.

پیمایش پیاده‌سازی AI در شرکت‌ها و دولت‌ها

علیرغم محدودیت‌های ذاتی آنها برای پرس‌وجوهای پرمخاطره و باز، LLMها ارزش پیشنهادی قابل توجهی برای شرکت‌ها و نهادهای دولتی، به ویژه در محیط‌های کنترل شده، ارائه می‌دهند. نقاط قوت آنها نه در جایگزینی تصمیم‌گیری قطعی، بلکه در ساده‌سازی فرآیندها و استخراج بینش‌ها نهفته است. کاربردهای کلیدی عبارتند از:

  • اتوماسیون فرآیند: رسیدگی به وظایف معمول مانند ورود داده‌ها، پیش‌غربالگری خدمات مشتری، خلاصه‌سازی اسناد و تولید گزارش.
  • بهینه‌سازی گردش کار: شناسایی گلوگاه‌ها، پیشنهاد بهبود کارایی و مدیریت جدول زمانی پروژه‌های پیچیده بر اساس تجزیه و تحلیل داده‌ها.
  • تجزیه و تحلیل داده‌ها: پردازش مجموعه داده‌های وسیع برای کشف روندها، همبستگی‌ها و ناهنجاری‌هایی که ممکن است از دید انسان پنهان بمانند، و کمک به برنامه‌ریزی استراتژیک و تخصیص منابع.

یک جنبه حیاتی برای استفاده دولتی و شرکتی، امنیت داده‌ها و محرمانگی است. در دسترس بودن مدل‌های منبع باز مانند DeepSeek در اینجا یک مزیت است. این مدل‌ها به طور بالقوه می‌توانند در زیرساخت‌های دیجیتال دولتی یا شرکتی اختصاصی و امن میزبانی شوند. این رویکرد ‘on-premises’ یا ‘private cloud’ اجازه می‌دهد تا اطلاعات حساس یا محرمانه بدون قرار گرفتن در معرض سرورهای خارجی یا ارائه‌دهندگان شخص ثالث پردازش شوند و خطرات قابل توجه حریم خصوصی و امنیتی را کاهش دهند.

با این حال، محاسبات به طور چشمگیری هنگام در نظر گرفتن برنامه‌های کاربردی دولتی رو به عموم تغییر می‌کند، جایی که اطلاعات ارائه شده باید معتبر و بدون ابهام دقیق باشد. تصور کنید یک شهروند از یک پورتال دولتی مجهز به LLM در مورد واجد شرایط بودن برای مزایای اجتماعی، مقررات مالیاتی یا رویه‌های اضطراری سؤال می‌کند. حتی اگر AI در 99٪ مواقع پاسخ‌های کاملاً صحیحی تولید کند، 1٪ باقیمانده پاسخ‌های گمراه‌کننده یا نادرست می‌تواند عواقب شدیدی داشته باشد، اعتماد عمومی را از بین ببرد، باعث مشکلات مالی شود یا حتی ایمنی را به خطر بیندازد.

این امر مستلزم اجرای حفاظت‌های قوی است. راه‌حل‌های بالقوه عبارتند از:

  • فیلتر کردن پرس‌وجو: طراحی سیستم‌هایی برای شناسایی پرس‌وجوهایی که خارج از محدوده از پیش تعریف شده پاسخ‌های ایمن و قابل تأیید قرار می‌گیرند.
  • نظارت انسانی: علامت‌گذاری پرس‌وجوهای پیچیده، مبهم یا پرخطر برای بررسی و پاسخ توسط یک متخصص انسانی.
  • امتیازدهی اطمینان: برنامه‌ریزی AI برای نشان دادن سطح اطمینان خود در مورد یک پاسخ، و ترغیب کاربران به جستجوی تأیید برای پاسخ‌های با اطمینان پایین.
  • اعتبارسنجی پاسخ: ارجاع متقابل پاسخ‌های تولید شده توسط AI در برابر پایگاه‌های داده سرپرستی شده از اطلاعات شناخته شده و دقیق قبل از ارائه آنها به عموم.

این اقدامات تنش اساسی ذاتی در فناوری LLM فعلی را برجسته می‌کند: مبادله بین قدرت تولیدی چشمگیر آنها و نیاز مطلق به دقت و قابلیت اطمینان در زمینه‌های حیاتی. مدیریت این تنش کلید استقرار مسئولانه AI در بخش عمومی است.

به سوی AI قابل اعتماد: رویکرد گراف دانش

به نظر می‌رسد رویکرد چین به طور فزاینده‌ای بر پیمایش این تنش با ادغام AI در برنامه‌های کاربردی خاص و کنترل شده متمرکز شده است، در حالی که فعالانه به دنبال راه‌هایی برای افزایش قابلیت اطمینان است. یک مثال قانع‌کننده، ابتکار شهر هوشمند است که در Zhuhai، شهری در منطقه خلیج بزرگ، در حال گسترش است. دولت شهرداری اخیراً سرمایه‌گذاری استراتژیک قابل توجهی (حدود 500 میلیون یوان یا 69 میلیون دلار آمریکا) در Zhipu AI انجام داده است که نشان‌دهنده تعهد به جاسازی AI پیشرفته در زیرساخت‌های شهری است.

جاه‌طلبی‌های Zhuhai فراتر از اتوماسیون ساده است. هدف، پیاده‌سازی جامع و لایه‌ای AI با هدف بهبودهای ملموس در خدمات عمومی است. این شامل بهینه‌سازی جریان ترافیک از طریق تجزیه و تحلیل داده‌های بلادرنگ، ادغام جریان‌های داده ناهمگون در بخش‌های مختلف دولتی برای تصمیم‌گیری جامع‌تر، و در نهایت، ایجاد یک محیط شهری کارآمدتر و پاسخگوتر برای شهروندان است.

محور این تلاش، مدل زبان عمومی GLM-4 Zhipu AI است. در حالی که در رسیدگی به وظایف چینی و انگلیسی مهارت دارد و دارای قابلیت‌های چندوجهی (پردازش اطلاعات فراتر از متن) است، وجه تمایز کلیدی آن در معماری آن نهفته است. Zhipu AI، یک شرکت منشعب از گروه مهندسی دانش (Knowledge Engineering Group) مشهور دانشگاه Tsinghua، مجموعه داده‌های ساختاریافته و گراف‌های دانش را در فرآیند یادگیری خود گنجانده است. برخلاف LLMهای معمولی که عمدتاً از مقادیر زیادی متن بدون ساختار (مانند وب‌سایت‌ها و کتاب‌ها) یاد می‌گیرند، Zhipu AI به صراحت از گراف‌های دانش سرپرستی شده و با دقت بالا - نمایش‌های ساختاریافته از حقایق، موجودیت‌ها و روابط آنها - استفاده می‌کند.

این شرکت ادعا می‌کند که این رویکرد به طور قابل توجهی نرخ توهم مدل را کاهش می‌دهد و طبق گزارش‌ها، کمترین نرخ را در یک مقایسه جهانی اخیر به دست آورده است. با پایه‌گذاری استنتاج‌های آماری AI در چارچوبی از دانش تأیید شده و ساختاریافته (همانطور که از منشأ ‘مهندسی دانش’ استنباط می‌شود)، Zhipu AI قصد دارد یک موتور شناختی قابل اعتمادتر بسازد. این نشان‌دهنده یک گام عملی دور شدن از مدل‌های صرفاً آماری به سمت سیستم‌هایی است که پایه‌گذاری واقعی را ادغام می‌کنند و قابلیت اطمینان را برای برنامه‌های کاربردی خاص مانند آنچه در پروژه شهر هوشمند Zhuhai پیش‌بینی شده است، افزایش می‌دهند.

تلاش برای ادغام عصبی-نمادین

مثال Zhipu AI به یک تغییر گسترده‌تر و بنیادی‌تر اشاره دارد که در تکامل هوش مصنوعی پیش‌بینی می‌شود: ادغام شبکه‌های عصبی آماری با استدلال منطقی نمادین. در حالی که LLMهای فعلی عمدتاً نشان‌دهنده پیروزی شبکه‌های عصبی هستند - عالی در تشخیص الگو، پردازش داده‌های حسی و تولید خروجی‌های آماری محتمل - مرحله بعدی احتمالاً شامل ترکیب این قابلیت ‘شهودی’ با استدلال ساختاریافته و مبتنی بر قانون مشخصه AI نمادین سنتی است.

این ادغام عصبی-نمادین (neuro-symbolic integration) اغلب به عنوان ‘جام مقدس’ در تحقیقات AI توصیف می‌شود، دقیقاً به این دلیل که نویدبخش بهترین‌های هر دو جهان است: قابلیت‌های یادگیری و انطباق شبکه‌های عصبی همراه با شفافیت، قابلیت تأیید و استدلال صریح سیستم‌های نمادین. یک AI را تصور کنید که نه تنها الگوها را در داده‌ها تشخیص می‌دهد، بلکه می‌تواند استدلال خود را بر اساس قوانین، مقررات یا اصول منطقی تثبیت شده توضیح دهد.

دستیابی به ادغام یکپارچه چالش‌های پیچیده متعددی را ایجاد می‌کند که چارچوب‌های نظری، کارایی محاسباتی و پیاده‌سازی عملی را در بر می‌گیرد. با این حال، ساخت گراف‌های دانش قوی نشان‌دهنده یک نقطه شروع ملموس است. این پایگاه‌های داده ساختاریافته از حقایق و روابط، پایه‌گذاری نمادین مورد نیاز برای لنگر انداختن استنتاج‌های شبکه عصبی را فراهم می‌کنند.

می‌توان یک تلاش بزرگ و تحت حمایت دولت در چین را تصور کرد، شاید بازتابی از اقدام عظیم گردآوری دایره‌المعارف Yongle Dadian در دوران سلسله مینگ. با کدگذاری دیجیتالی مقادیر زیادی از اطلاعات تأیید شده در حوزه‌های حیاتی که در آنها دقت غیرقابل مذاکره است - مانند پزشکی، حقوق، مهندسی و علم مواد - چین می‌تواند ساختارهای دانش بنیادی ایجاد کند. لنگر انداختن مدل‌های AI آینده در این پایگاه‌های دانش کدگذاری شده و ساختاریافته، گامی مهم در جهت قابل اعتمادتر کردن آنها، کمتر مستعد توهم بودن، و در نهایت، قابل اعتمادتر بودن برای کاربردهای حیاتی خواهد بود و به طور بالقوه مرزهای این رشته‌ها را در این فرآیند پیش می‌برد.

رانندگی خودران: مزیت اکوسیستم چین

شاید قانع‌کننده‌ترین عرصه‌ای که به نظر می‌رسد چین آماده استفاده از تمرکز خود بر AI یکپارچه و قابل اعتماد است، رانندگی خودران (autonomous driving) باشد. این برنامه کاربردی از مدل‌های زبان عمومی متمایز است زیرا ایمنی فقط مطلوب نیست؛ بلکه امری حیاتی است. کارکردن یک وسیله نقلیه در محیط‌های پیچیده و غیرقابل پیش‌بینی دنیای واقعی، بیش از تشخیص الگو نیاز دارد؛ نیازمند تصمیم‌گیری‌های آنی بر اساس قوانین راهنمایی و رانندگی، محدودیت‌های فیزیکی، ملاحظات اخلاقی و استدلال پیش‌بینی‌کننده در مورد رفتار سایر کاربران جاده است.

بنابراین، سیستم‌های رانندگی خودران، نیازمند یک معماری عصبی-نمادین واقعی هستند.

  • شبکه‌های عصبی برای پردازش سیل داده‌های حسی از دوربین‌ها، lidar و رادار، شناسایی اشیایی مانند عابران پیاده، دوچرخه‌سواران و سایر وسایل نقلیه، و درک محیط اطراف ضروری هستند.
  • منطق نمادین برای اجرای قوانین راهنمایی و رانندگی (توقف در چراغ قرمز، رعایت حق تقدم)، پایبندی به محدودیت‌های فیزیکی (مسافت ترمز، شعاع چرخش)، اتخاذ تصمیمات شفاف و قابل تأیید در سناریوهای پیچیده، و به طور بالقوه حتی پیمایش معضلات اخلاقی (مانند انتخاب‌های تصادف اجتناب‌ناپذیر، اگرچه این یک حوزه عمیقاً پیچیده باقی می‌ماند) حیاتی است.

یک وسیله نقلیه خودران باید به طور مؤثر ‘شهود’ مبتنی بر داده را با استدلال مبتنی بر قانون ترکیب کند و به طور مداوم و قابل پیش‌بینی عمل کند تا ایمنی تطبیقی را در موقعیت‌های پویا تضمین کند. نمی‌تواند نوع ‘توهمات’ یا خطاهای احتمالی قابل قبول در برنامه‌های کاربردی AI کمتر حیاتی را تحمل کند.

در اینجا، چین دارای تلاقی منحصربه‌فردی از عواملی است که یک اکوسیستم بارور برای توسعه و استقرار رانندگی خودران ایجاد می‌کند و مسلماً از سایر قدرت‌های جهانی پیشی می‌گیرد:

  1. زنجیره تأمین پیشرو جهانی خودروهای برقی (EV): چین بر تولید خودروهای الکتریکی و اجزای آنها، به ویژه باتری‌ها، تسلط دارد و پایه صنعتی قوی را فراهم می‌کند.
  2. زیرساخت شارژ گسترده: شبکه به سرعت در حال گسترش ایستگاه‌های شارژ، اضطراب برد را کاهش می‌دهد و از پذیرش گسترده EV پشتیبانی می‌کند.
  3. شبکه‌های پیشرفته 5G: ارتباطات با پهنای باند بالا و تأخیر کم برای ارتباطات وسیله نقلیه به همه چیز (V2X) حیاتی است و هماهنگی بین وسایل نقلیه و زیرساخت‌ها را امکان‌پذیر می‌سازد.
  4. ادغام شهر هوشمند: ابتکاراتی مانند Zhuhai نشان‌دهنده تمایل به ادغام سیستم‌های حمل و نقل با شبکه‌های داده شهری گسترده‌تر، بهینه‌سازی جریان ترافیک و فعال کردن ویژگی‌های پیشرفته AV است.
  5. تاکسی اینترنتی گسترده: پذیرش بالای مصرف‌کننده از برنامه‌های تاکسی اینترنتی، بازار آماده‌ای برای خدمات روبوتاکسی ایجاد می‌کند و مسیر روشنی برای تجاری‌سازی وسایل نقلیه خودران فراهم می‌کند.
  6. نرخ پذیرش بالای EV: مصرف‌کنندگان چینی خودروهای الکتریکی را آسان‌تر از بسیاری از کشورهای غربی پذیرفته‌اند و بازار داخلی بزرگی ایجاد کرده‌اند.
  7. محیط نظارتی حمایتی: در حالی که ایمنی کلیدی باقی می‌ماند، به نظر می‌رسد حمایت دولتی برای آزمایش و استقرار فناوری‌های خودران وجود دارد که با عملیات روبوتاکسی که قبلاً در شهرهایی مانند Wuhan در حال انجام است، مشهود است.

این را با مناطق دیگر مقایسه کنید. ایالات متحده، علیرغم تلاش‌های پیشگامانه Tesla، در پذیرش کلی EV در میان کشورهای توسعه یافته به طور قابل توجهی عقب است، روندی که به طور بالقوه با تغییرات سیاست تشدید می‌شود. اروپا دارای پذیرش قوی EV است اما فاقد همان تمرکز تولیدکنندگان داخلی غالب EV یا غول‌های پیشرو جهانی AI متمرکز بر این ادغام است.

بنابراین، مزیت استراتژیک چین به نظر می‌رسد کمتر مربوط به داشتن قدرتمندترین LLM منفرد و بیشتر مربوط به سازماندهی این اکوسیستم پیچیده باشد. قطعات در حال کنار هم قرار گرفتن هستند - از قدرت تولیدی گرفته تا زیرساخت‌های دیجیتال و پذیرش مصرف‌کننده - تا به طور بالقوه به وسایل نقلیه خودران اجازه دهند از آزمایش‌های محدود به پذیرش جریان اصلی در طول دهه حرکت کنند، شاید حتی شاهد جهش قابل توجهی در سال جاری باشند. قدرت تحول‌آفرین کامل با ادغام یکپارچه این وسایل نقلیه با زیرساخت‌های شهر هوشمند در حال تکامل باز خواهد شد.

تغییر تمرکز: از قدرت محاسباتی به اکوسیستم‌های یکپارچه

در حالی که ایالات متحده و سایر بازیگران اغلب به نظر می‌رسد در یک ‘مسابقه محاسباتی’ قفل شده‌اند، و بر برتری تراشه، زیرساخت سرور عظیم و دستیابی به رهبری معیار با LLMهای بزرگتر تمرکز می‌کنند، به نظر می‌رسد چین در حال دنبال کردن یک استراتژی مکمل، شاید در نهایت تأثیرگذارتر است. این استراتژی بر ادغام AI در برنامه‌های کاربردی ملموس و تحول‌آفرین اجتماعی تأکید می‌کند و قابلیت اطمینان و هم‌افزایی اکوسیستم را در اولویت قرار می‌دهد، به ویژه در حوزه‌هایی مانند رانندگی خودران و شهرهای هوشمند.

این شامل یک حرکت عمدی به سمت رویکردهای عصبی-نمادین است که حوزه‌های خاص با ارزش بالا و حیاتی برای ایمنی را هدف قرار می‌دهد که در آنها مدل‌های آماری صرف کوتاهی می‌کنند. مزیت رقابتی واقعی ممکن است در هیچ الگوریتم یا مدل منفردی، صرف نظر از قدرت یا مقرون به صرفه بودن آن، نهفته نباشد، بلکه در توانایی بافتن AI در چشم‌انداز فیزیکی و اقتصادی از طریق اکوسیستم‌های جامع و یکپارچه باشد. چین در حال برداشتن گام‌های آرامی به سوی ادغام عملی و خاص دامنه عصبی-نمادین است و فراتر از شیفتگی فعلی به LLMها به سمت برنامه‌های کاربردی نگاه می‌کند که می‌توانند اساساً زندگی شهری و حمل و نقل را تغییر شکل دهند. آینده تأثیر واقعی AI در دنیای واقعی ممکن است کمتر در فصاحت چت‌بات‌ها و بیشتر در عملکرد قابل اعتماد این سیستم‌های پیچیده و جاسازی شده با AI نهفته باشد.