চীনের AI পথ: কাঁচা শক্তির চেয়ে বাস্তব একীকরণকে অগ্রাধিকার

কৃত্রিম বুদ্ধিমত্তা নিয়ে বিশ্বব্যাপী আলোচনা প্রায়শই একটি নিরলস অস্ত্র প্রতিযোগিতার উপর কেন্দ্রীভূত বলে মনে হয় – কে সবচেয়ে বড়, সবচেয়ে শক্তিশালী লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) তৈরি করতে পারে? সাম্প্রতিক অগ্রগতি, যেমন চীনের DeepSeek-এর মতো মডেলগুলির দ্বারা প্রদর্শিত চিত্তাকর্ষক ক্ষমতা, অবশ্যই এই আখ্যানকে উস্কে দেয়। বিশ্বব্যাপী এবং অভ্যন্তরীণভাবে একটি চ্যালেঞ্জিং অর্থনৈতিক প্রেক্ষাপটের মধ্যে, এই ধরনের প্রযুক্তিগত উল্লম্ফন ভবিষ্যতের সম্ভাবনার একটি আকর্ষণীয় আভাস দেয় এবং সম্ভবত, প্রবৃদ্ধির জন্য একটি অত্যন্ত প্রয়োজনীয় অনুঘটক। তবুও, শুধুমাত্র এই শিরোনাম-দখলকারী LLMগুলির উপর ফোকাস করা মানে গাছের জন্য বনকে উপেক্ষা করা। কৃত্রিম বুদ্ধিমত্তা, কম জাঁকজমকপূর্ণ কিন্তু গভীরভাবে প্রভাবশালী উপায়ে, বছরের পর বছর ধরে আমাদের ডিজিটাল জীবনের বুননে গভীরভাবে জড়িত।

অনলাইন মিথস্ক্রিয়া এবং বাণিজ্যে আধিপত্য বিস্তারকারী সর্বব্যাপী প্ল্যাটফর্মগুলি বিবেচনা করুন। TikTok, বা এর চীনা প্রতিপক্ষ Douyin, কি অত্যাধুনিক সুপারিশ অ্যালগরিদম ছাড়া এমন বিস্ময়কর বিশ্বব্যাপী নাগাল অর্জন করতে পারত যা ক্রমাগত বিষয়বস্তু ফিডগুলিকে উপযোগী করে? একইভাবে, ই-কমার্স জায়ান্টদের বিজয়, তা Amazon, Shein, এবং Temu-এর মতো আন্তর্জাতিক খেলোয়াড় হোক বা Taobao এবং JD.com-এর মতো দেশীয় পাওয়ার হাউস হোক, শুধুমাত্র দক্ষ সোর্সিং এবং লজিস্টিকসের চেয়ে অনেক বেশি কিছুর উপর নির্মিত। AI অদৃশ্য হাত হিসাবে কাজ করে, সূক্ষ্মভাবে আমাদের পছন্দগুলিকে চালিত করে। আমরা যে বইগুলি কেনার কথা বিবেচনা করি থেকে শুরু করে আমরা যে ফ্যাশন প্রবণতাগুলি গ্রহণ করি, আমাদের ভোগের অভ্যাসগুলি ক্রমবর্ধমানভাবে আমাদের অতীতের কেনাকাটা, ব্রাউজিং ইতিহাস এবং ক্লিক প্যাটার্ন বিশ্লেষণকারী সিস্টেম দ্বারা আকৃতি পাচ্ছে। কথোপকথনমূলক AI চাহিদা অনুযায়ী মার্জিত কবিতা তৈরি করার অনেক আগে, Amazon এবং Google-এর মতো কোম্পানিগুলি ভোক্তা আচরণ বোঝা এবং ভবিষ্যদ্বাণী করার জন্য AI ব্যবহার করার পথপ্রদর্শক ছিল, যা মৌলিকভাবে বাজারকে পরিবর্তন করে। AI-এর এই শান্ত, আরও বিস্তৃত রূপটি কয়েক দশক ধরে বাণিজ্য এবং মিডিয়া ব্যবহারকে নতুন আকার দিয়েছে, প্রায়শই সচেতন সচেতনতার সীমার নীচে কাজ করে।

লার্জ ল্যাঙ্গুয়েজ মডেলের দ্বি-ধারী তলোয়ার

DeepSeek-এর মতো শক্তিশালী LLM-এর উত্থান নিঃসন্দেহে একটি উল্লেখযোগ্য প্রযুক্তিগত মাইলফলক। মানুষের মতো পাঠ্য তৈরি করা, ভাষা অনুবাদ করা এবং এমনকি কবিতার মতো সৃজনশীল বিষয়বস্তু লেখার ক্ষমতা অসাধারণ। এই সরঞ্জামগুলি ব্যক্তিগত সহকারী, গবেষণা সহায়ক এবং সৃজনশীল অংশীদার হিসাবে প্রচুর প্রতিশ্রুতি ধারণ করে। ইমেল খসড়া তৈরি করতে, দীর্ঘ নথি সংক্ষিপ্ত করতে বা ধারণা তৈরি করতে এই জাতীয় মডেল ব্যবহার করার কল্পনা করুন – ব্যক্তিগত উত্পাদনশীলতা বাড়ানোর সম্ভাবনা স্পষ্ট।

যাইহোক, এই শক্তি উল্লেখযোগ্য সতর্কতার সাথে আসে, যা এই মডেলগুলি কীভাবে কাজ করে তার প্রকৃতির মধ্যে নিহিত। LLMগুলি জটিল পরিসংখ্যানগত পদ্ধতি এবং বিশাল ডেটাসেটের উপর প্রশিক্ষিত বিশাল নিউরাল নেটওয়ার্কের উপর নির্মিত। তারা নিদর্শন সনাক্ত করতে এবং শব্দের সবচেয়ে সম্ভাব্য ক্রম ভবিষ্যদ্বাণী করতে পারদর্শী, কিন্তু তাদের প্রকৃত বোঝাপড়া বা চেতনা নেই। এই পরিসংখ্যানগত ভিত্তি একটি গুরুতর দুর্বলতার দিকে নিয়ে যায়: হ্যালুসিনেশন (hallucinations)। যখন তাদের প্রশিক্ষণের ডেটার বাইরের বিষয় বা সূক্ষ্ম বিচারের প্রয়োজন হয় এমন প্রশ্নের মুখোমুখি হয়, তখন LLMগুলি আত্মবিশ্বাসের সাথে বিশ্বাসযোগ্য-শব্দযুক্ত কিন্তু সম্পূর্ণ ভুল বা বিভ্রান্তিকর তথ্য তৈরি করতে পারে।

একটি LLM-কে একটি অভ্রান্ত ওরাকল হিসাবে ভাববেন না, বরং সম্ভবত একজন অবিশ্বাস্যভাবে ভাল-পড়া, বাকপটু, তবুও কখনও কখনও কল্পনাকারী বিশেষজ্ঞ হিসাবে ভাবুন। যদিও DeepSeek একটি আলোড়ন সৃষ্টিকারী সনেট রচনা করতে পারে, তবে গুরুত্বপূর্ণ আইনি ব্যাখ্যা, সুনির্দিষ্ট চিকিৎসা নির্ণয় বা উচ্চ-ঝুঁকির আর্থিক পরামর্শের জন্য এটির উপর নির্ভর করা গভীরভাবে অবিবেচক হবে। পরিসংখ্যানগত সম্ভাব্যতা ইঞ্জিন যা এটিকে সাবলীল পাঠ্য তৈরি করতে দেয় তা এটিকে ‘তথ্য’ উদ্ভাবন করতেও প্রবণ করে তোলে যখন এটির নির্দিষ্ট জ্ঞানের অভাব থাকে। যদিও নতুন আর্কিটেকচার এবং রিজনিং মডেলগুলি (যেমন DeepSeek-এর R1 বা OpenAI-এর গুজবযুক্ত o1/o3) এই সমস্যাটি প্রশমিত করার লক্ষ্য রাখে, তারা এটিকে নির্মূল করেনি। একটি ফুলপ্রুফ LLM, প্রতিটি দৃষ্টান্তে নির্ভুল হওয়ার নিশ্চয়তা, অধরা থেকে যায়। অতএব, যদিও LLMগুলি ব্যক্তিদের জন্য শক্তিশালী সরঞ্জাম হতে পারে, তাদের ব্যবহার অবশ্যই সমালোচনামূলক মূল্যায়নের সাথে সংযত হতে হবে, বিশেষ করে যখন তাদের আউটপুটের উপর ভিত্তি করে সিদ্ধান্তগুলি উল্লেখযোগ্য ওজন বহন করে। তারা মানুষের ক্ষমতা বৃদ্ধি করে; তারা গুরুত্বপূর্ণ ডোমেনে মানুষের বিচার প্রতিস্থাপন করে না।

কর্পোরেট এবং সরকারী AI বাস্তবায়ন নেভিগেট করা

উচ্চ-ঝুঁকি, উন্মুক্ত প্রশ্নের জন্য তাদের অন্তর্নিহিত সীমাবদ্ধতা সত্ত্বেও, LLMগুলি উদ্যোগ এবং সরকারী সংস্থাগুলির জন্য যথেষ্ট মূল্যবান প্রস্তাব দেয়, বিশেষ করে নিয়ন্ত্রিত পরিবেশে। তাদের শক্তিগুলি নির্দিষ্ট সিদ্ধান্ত গ্রহণ প্রতিস্থাপনের মধ্যে নয়, বরং প্রক্রিয়াগুলিকে সুবিন্যস্ত করা এবং অন্তর্দৃষ্টি আহরণ এর মধ্যে নিহিত। মূল অ্যাপ্লিকেশনগুলির মধ্যে রয়েছে:

  • প্রসেস অটোমেশন (Process Automation): ডেটা এন্ট্রি, গ্রাহক পরিষেবা প্রি-স্ক্রিনিং, ডকুমেন্ট সংক্ষিপ্তকরণ এবং রিপোর্ট তৈরির মতো রুটিন কাজগুলি পরিচালনা করা।
  • ওয়ার্কফ্লো অপ্টিমাইজেশন (Workflow Optimisation): ডেটা বিশ্লেষণের ভিত্তিতে বাধাগুলি চিহ্নিত করা, দক্ষতার উন্নতির পরামর্শ দেওয়া এবং জটিল প্রকল্পের সময়সীমা পরিচালনা করা।
  • ডেটা অ্যানালিটিক্স (Data Analytics): কৌশলগত পরিকল্পনা এবং সম্পদ বরাদ্দে সহায়তা করে এমন প্রবণতা, পারস্পরিক সম্পর্ক এবং অসঙ্গতিগুলি উন্মোচন করার জন্য বিশাল ডেটাসেট প্রক্রিয়াকরণ যা মানুষের সনাক্তকরণ এড়াতে পারে।

সরকারী এবং কর্পোরেট ব্যবহারের জন্য একটি গুরুত্বপূর্ণ দিক হল ডেটা নিরাপত্তা এবং গোপনীয়তা। DeepSeek-এর মতো ওপেন-সোর্স মডেলগুলির প্রাপ্যতা এখানে একটি সুবিধা উপস্থাপন করে। এই মডেলগুলি সম্ভাব্যভাবে ডেডিকেটেড, সুরক্ষিত সরকারী বা কর্পোরেট ডিজিটাল অবকাঠামোর মধ্যে হোস্ট করা যেতে পারে। এই ‘অন-প্রিমিসেস’ বা ‘প্রাইভেট ক্লাউড’ পদ্ধতি সংবেদনশীল বা গোপনীয় তথ্যকে বাহ্যিক সার্ভার বা তৃতীয় পক্ষের প্রদানকারীদের কাছে প্রকাশ না করেই প্রক্রিয়া করার অনুমতি দেয়, যা উল্লেখযোগ্য গোপনীয়তা এবং নিরাপত্তা ঝুঁকি হ্রাস করে।

যাইহোক, জনসাধারণ-মুখী সরকারী অ্যাপ্লিকেশনগুলি বিবেচনা করার সময় গণনা নাটকীয়ভাবে পরিবর্তিত হয় যেখানে প্রদত্ত তথ্য অবশ্যই প্রামাণিক এবং দ্ব্যর্থহীনভাবে সঠিক হতে হবে। কল্পনা করুন একজন নাগরিক সামাজিক সুবিধা, কর প্রবিধান বা জরুরি পদ্ধতির জন্য যোগ্যতা সম্পর্কে একটি LLM-চালিত সরকারী পোর্টালকে জিজ্ঞাসা করছেন। এমনকি যদি AI 99% সময় পুরোপুরি সঠিক প্রতিক্রিয়া তৈরি করে, তবে অবশিষ্ট 1% বিভ্রান্তিকর বা ভুল উত্তরগুলির গুরুতর পরিণতি হতে পারে, জনসাধারণের আস্থা নষ্ট করতে পারে, আর্থিক কষ্টের কারণ হতে পারে বা এমনকি নিরাপত্তাকে বিপন্ন করতে পারে।

এর জন্য শক্তিশালী সুরক্ষা ব্যবস্থা (safeguards) বাস্তবায়ন প্রয়োজন। সম্ভাব্য সমাধানগুলির মধ্যে রয়েছে:

  • কোয়েরি ফিল্টারিং (Query Filtering): নিরাপদ, যাচাইযোগ্য উত্তরগুলির একটি পূর্বনির্ধারিত সুযোগের বাইরে পড়ে এমন অনুসন্ধানগুলি সনাক্ত করার জন্য সিস্টেম ডিজাইন করা।
  • হিউম্যান ওভারসাইট (Human Oversight): একজন মানব বিশেষজ্ঞ দ্বারা পর্যালোচনা এবং প্রতিক্রিয়ার জন্য জটিল, অস্পষ্ট বা উচ্চ-ঝুঁকির প্রশ্নগুলি ফ্ল্যাগ করা।
  • কনফিডেন্স স্কোরিং (Confidence Scoring): একটি উত্তর সম্পর্কে তার নিশ্চিততার স্তর নির্দেশ করার জন্য AI প্রোগ্রামিং করা, ব্যবহারকারীদের কম-আত্মবিশ্বাসের প্রতিক্রিয়াগুলির জন্য যাচাইকরণ চাইতে অনুরোধ করা।
  • উত্তর যাচাইকরণ (Answer Validation): জনসাধারণের কাছে উপস্থাপন করার আগে পরিচিত, সঠিক তথ্যের কিউরেটেড ডেটাবেসের বিরুদ্ধে AI-উত্পন্ন প্রতিক্রিয়াগুলি ক্রস-রেফারেন্স করা।

এই ব্যবস্থাগুলি বর্তমান LLM প্রযুক্তিতে অন্তর্নিহিত মৌলিক উত্তেজনাকে তুলে ধরে: তাদের চিত্তাকর্ষক জেনারেটিভ শক্তি এবং গুরুত্বপূর্ণ প্রেক্ষাপটে নির্ভুলতা এবং নির্ভরযোগ্যতার পরম প্রয়োজনীয়তার মধ্যে লেনদেন। এই উত্তেজনা পরিচালনা করা পাবলিক সেক্টরে দায়িত্বশীল AI স্থাপনার চাবিকাঠি।

বিশ্বাসযোগ্য AI-এর দিকে: নলেজ গ্রাফ অ্যাপ্রোচ

চীনের দৃষ্টিভঙ্গি ক্রমবর্ধমানভাবে নির্ভরযোগ্যতা বাড়ানোর উপায়গুলি সক্রিয়ভাবে সন্ধান করার সময় নির্দিষ্ট, নিয়ন্ত্রিত অ্যাপ্লিকেশনগুলিতে AI সংহত করে এই উত্তেজনা নেভিগেট করার উপর দৃষ্টি নিবদ্ধ করে বলে মনে হচ্ছে। একটি আকর্ষণীয় উদাহরণ হল গ্রেটার বে এরিয়ার একটি শহর Zhuhai-তে স্মার্ট সিটি উদ্যোগ। পৌর সরকার সম্প্রতি Zhipu AI-তে একটি উল্লেখযোগ্য কৌশলগত বিনিয়োগ করেছে (প্রায় 500 মিলিয়ন ইউয়ান বা US$69 মিলিয়ন), যা শহুরে অবকাঠামোতে উন্নত AI এম্বেড করার প্রতিশ্রুতি নির্দেশ করে।

Zhuhai-এর উচ্চাকাঙ্ক্ষা সাধারণ অটোমেশনের বাইরেও প্রসারিত। লক্ষ্য হল AI-এর একটি ব্যাপক, স্তরযুক্ত বাস্তবায়ন যা জনসেবার বাস্তব উন্নতির লক্ষ্যে। এর মধ্যে রয়েছে রিয়েল-টাইম ডেটা বিশ্লেষণের মাধ্যমে ট্র্যাফিক প্রবাহকে অপ্টিমাইজ করা, আরও সামগ্রিক সিদ্ধান্ত গ্রহণের জন্য বিভিন্ন সরকারী বিভাগ জুড়ে ভিন্ন ভিন্ন ডেটা স্ট্রিমগুলিকে একীভূত করা এবং শেষ পর্যন্ত নাগরিকদের জন্য আরও দক্ষ এবং প্রতিক্রিয়াশীল শহুরে পরিবেশ তৈরি করা।

এই প্রচেষ্টার কেন্দ্রবিন্দু হল Zhipu AI-এর GLM-4 জেনারেল ল্যাঙ্গুয়েজ মডেল। যদিও চীনা এবং ইংরেজি উভয় কাজ পরিচালনায় পারদর্শী এবং মাল্টি-মোডাল ক্ষমতা (শুধু পাঠ্যের বাইরে তথ্য প্রক্রিয়াকরণ) ধারণ করে, এর মূল পার্থক্যকারী এর আর্কিটেকচারে নিহিত। Zhipu AI, Tsinghua University-র বিখ্যাত Knowledge Engineering Group-এর একটি স্পিন-অফ, তার শেখার প্রক্রিয়ায় কাঠামোগত ডেটাসেট এবং নলেজ গ্রাফ (knowledge graphs) অন্তর্ভুক্ত করে। প্রচলিত LLMগুলির বিপরীতে যা প্রাথমিকভাবে বিপুল পরিমাণ অসংগঠিত পাঠ্য (যেমন ওয়েবসাইট এবং বই) থেকে শেখে, Zhipu AI স্পষ্টভাবে কিউরেটেড, উচ্চ-নির্ভুল নলেজ গ্রাফ – তথ্য, সত্তা এবং তাদের সম্পর্কের কাঠামোগত উপস্থাপনা – ব্যবহার করে।

কোম্পানি দাবি করে যে এই পদ্ধতিটি মডেলের হ্যালুসিনেশন হারকে উল্লেখযোগ্যভাবে হ্রাস করে, যা সম্প্রতি একটি বিশ্বব্যাপী তুলনায় সর্বনিম্ন হার অর্জন করেছে বলে জানা গেছে। যাচাইকৃত, কাঠামোগত জ্ঞানের (যেমন ‘Knowledge Engineering’ উৎস দ্বারা উহ্য) একটি কাঠামোর মধ্যে AI-এর পরিসংখ্যানগত অনুমানগুলিকে ভিত্তি করে, Zhipu AI একটি আরও নির্ভরযোগ্য জ্ঞানীয় ইঞ্জিন তৈরি করার লক্ষ্য রাখে। এটি সম্পূর্ণরূপে পরিসংখ্যানগত মডেলগুলি থেকে দূরে সরে গিয়ে এমন সিস্টেমগুলির দিকে একটি বাস্তব পদক্ষেপের প্রতিনিধিত্ব করে যা বাস্তবসম্মত ভিত্তি সংহত করে, Zhuhai-এর স্মার্ট সিটি প্রকল্পে পরিকল্পিত নির্দিষ্ট অ্যাপ্লিকেশনগুলির জন্য বিশ্বাসযোগ্যতা বাড়ায়।

নিউরো-সিম্বলিক ইন্টিগ্রেশনের অনুসন্ধান

Zhipu AI উদাহরণটি কৃত্রিম বুদ্ধিমত্তার বিবর্তনে প্রত্যাশিত একটি বিস্তৃত, আরও মৌলিক পরিবর্তনের ইঙ্গিত দেয়: প্রতীকী যৌক্তিক যুক্তির সাথে পরিসংখ্যানগত নিউরাল নেটওয়ার্কগুলির একীকরণ। যদিও বর্তমান LLMগুলি প্রাথমিকভাবে নিউরাল নেটওয়ার্কগুলির বিজয়ের প্রতিনিধিত্ব করে – প্যাটার্ন স্বীকৃতি, সংবেদনশীল ডেটা প্রক্রিয়াকরণ এবং পরিসংখ্যানগতভাবে সম্ভাব্য আউটপুট তৈরিতে দুর্দান্ত – পরবর্তী পর্যায়ে সম্ভবত ঐতিহ্যগত প্রতীকী AI-এর কাঠামোগত, নিয়ম-ভিত্তিক যুক্তির বৈশিষ্ট্যের সাথে এই ‘স্বজ্ঞাত’ ক্ষমতাকে একত্রিত করা জড়িত।

এই নিউরো-সিম্বলিক ইন্টিগ্রেশন (neuro-symbolic integration) প্রায়শই AI গবেষণায় একটি ‘হোলি গ্রেইল’ হিসাবে বর্ণনা করা হয় কারণ এটি উভয় জগতের সেরা প্রতিশ্রুতি দেয়: নিউরাল নেটওয়ার্কগুলির শেখার এবং অভিযোজন ক্ষমতা যা প্রতীকী সিস্টেমগুলির স্বচ্ছতা, যাচাইযোগ্যতা এবং সুস্পষ্ট যুক্তির সাথে মিলিত হয়। এমন একটি AI কল্পনা করুন যা কেবল ডেটাতে নিদর্শনগুলি সনাক্ত করে না বরং প্রতিষ্ঠিত নিয়ম, আইন বা যৌক্তিক নীতির উপর ভিত্তি করে তার যুক্তি ব্যাখ্যা করতে পারে।

নির্বিঘ্ন একীকরণ অর্জন করা তাত্ত্বিক কাঠামো, গণনামূলক দক্ষতা এবং বাস্তব বাস্তবায়ন জুড়ে অসংখ্য জটিল চ্যালেঞ্জ উপস্থাপন করে। যাইহোক, শক্তিশালী নলেজ গ্রাফ (knowledge graphs) তৈরি করা একটি বাস্তব সূচনা বিন্দু প্রতিনিধিত্ব করে। তথ্য এবং সম্পর্কের এই কাঠামোগত ডেটাবেসগুলি নিউরাল নেটওয়ার্ক অনুমানগুলিকে নোঙ্গর করার জন্য প্রয়োজনীয় প্রতীকী ভিত্তি সরবরাহ করে।

কেউ চীনে একটি বৃহৎ আকারের, রাষ্ট্র-স্পন্সরড প্রচেষ্টার কল্পনা করতে পারে, সম্ভবত মিং রাজবংশের সময় বিশ্বকোষীয় Yongle Dadian সংকলনের বিশাল উদ্যোগের প্রতিধ্বনি করে। গুরুত্বপূর্ণ ডোমেনগুলিতে যেখানে নির্ভুলতা অ-আলোচনাযোগ্য – যেমন চিকিৎসা, আইন, প্রকৌশল এবং পদার্থ বিজ্ঞান – যাচাইকৃত তথ্যের বিশাল পরিমাণকে ডিজিটালভাবে কোডিফাই করে, চীন ভিত্তিগত জ্ঞান কাঠামো তৈরি করতে পারে। এই কোডিফাইড, কাঠামোগত জ্ঞান ভিত্তিতে ভবিষ্যতের AI মডেলগুলিকে নোঙ্গর করা তাদের আরও নির্ভরযোগ্য, হ্যালুসিনেশনের কম প্রবণ এবং শেষ পর্যন্ত, গুরুত্বপূর্ণ অ্যাপ্লিকেশনগুলির জন্য আরও বিশ্বাসযোগ্য করে তোলার দিকে একটি উল্লেখযোগ্য পদক্ষেপ হবে, সম্ভাব্যভাবে এই ক্ষেত্রগুলির সীমানাকে এগিয়ে নিয়ে যাবে।

স্বায়ত্তশাসিত ড্রাইভিং: চীনের ইকোসিস্টেম সুবিধা

সম্ভবত সবচেয়ে আকর্ষণীয় ক্ষেত্র যেখানে চীন সমন্বিত, নির্ভরযোগ্য AI-এর উপর তার ফোকাসকে কাজে লাগাতে প্রস্তুত বলে মনে হচ্ছে তা হল স্বায়ত্তশাসিত ড্রাইভিং (autonomous driving)। এই অ্যাপ্লিকেশনটি সাধারণ-উদ্দেশ্য ভাষা মডেল থেকে আলাদা কারণ নিরাপত্তা কেবল কাঙ্ক্ষিত নয়; এটি সর্বাগ্রে। জটিল, অপ্রত্যাশিত বাস্তব-বিশ্ব পরিবেশে একটি যানবাহন পরিচালনা করার জন্য কেবল প্যাটার্ন স্বীকৃতির চেয়ে বেশি প্রয়োজন; এর জন্য ট্র্যাফিক আইন, শারীরিক সীমাবদ্ধতা, নৈতিক বিবেচনা এবং অন্যান্য রাস্তা ব্যবহারকারীদের আচরণ সম্পর্কে ভবিষ্যদ্বাণীমূলক যুক্তির উপর ভিত্তি করে বিভক্ত-সেকেন্ডের সিদ্ধান্ত প্রয়োজন।

স্বায়ত্তশাসিত ড্রাইভিং সিস্টেম, অতএব, একটি সত্যিকারের নিউরো-সিম্বলিক আর্কিটেকচার (neuro-symbolic architecture) প্রয়োজন।

  • নিউরাল নেটওয়ার্ক (Neural networks) ক্যামেরা, লিডার এবং রাডার থেকে সংবেদনশীল ডেটার স্রোত প্রক্রিয়াকরণের জন্য অপরিহার্য, পথচারী, সাইকেল চালক এবং অন্যান্য যানবাহনের মতো বস্তু সনাক্ত করা এবং তাৎক্ষণিক পরিবেশ বোঝা।
  • সিম্বলিক লজিক (Symbolic logic) ট্র্যাফিক নিয়ম বাস্তবায়নের জন্য (লাল আলোতে থামা, পথের অধিকার দেওয়া), শারীরিক সীমাবদ্ধতা মেনে চলা (ব্রেকিং দূরত্ব, টার্নিং ব্যাসার্ধ), জটিল পরিস্থিতিতে স্বচ্ছ, যাচাইযোগ্য সিদ্ধান্ত নেওয়া এবং সম্ভাব্য এমনকি নৈতিক দ্বিধা নেভিগেট করার জন্য (যেমন অনিবার্য দুর্ঘটনা পছন্দ, যদিও এটি একটি গভীরভাবে জটিল ক্ষেত্র হিসাবে রয়ে গেছে) অত্যন্ত গুরুত্বপূর্ণ।

একটি স্বায়ত্তশাসিত গাড়িকে অবশ্যই ডেটা-চালিত ‘স্বজ্ঞা’কে নিয়ম-ভিত্তিক যুক্তির সাথে কার্যকরভাবে মিশ্রিত করতে হবে, গতিশীল পরিস্থিতিতে অভিযোজিত নিরাপত্তা নিশ্চিত করার জন্য ধারাবাহিকভাবে এবং অনুমানযোগ্যভাবে কাজ করতে হবে। এটি কম সমালোচনামূলক AI অ্যাপ্লিকেশনগুলিতে গ্রহণযোগ্য ‘হ্যালুসিনেশন’ বা संभाव্য ত্রুটির মতো সামর্থ্য রাখে না।

এখানে, চীন স্বায়ত্তশাসিত ড্রাইভিং উন্নয়ন এবং স্থাপনার জন্য একটি উর্বর ইকোসিস্টেম তৈরি করে এমন কারণগুলির একটি অনন্য সঙ্গম ধারণ করে, যা তর্কযোগ্যভাবে অন্যান্য বিশ্ব শক্তিকে ছাড়িয়ে যায়:

  1. বিশ্ব-নেতৃস্থানীয় EV সাপ্লাই চেইন (World-Leading EV Supply Chain): চীন বৈদ্যুতিক যানবাহন এবং তাদের উপাদান, বিশেষ করে ব্যাটারির উৎপাদনে আধিপত্য বিস্তার করে, একটি শক্তিশালী শিল্প ভিত্তি প্রদান করে।
  2. বিস্তৃত চার্জিং পরিকাঠামো (Extensive Charging Infrastructure): চার্জিং স্টেশনগুলির একটি দ্রুত সম্প্রসারিত নেটওয়ার্ক পরিসীমা উদ্বেগ দূর করে এবং ব্যাপক EV গ্রহণকে সমর্থন করে।
  3. উন্নত 5G নেটওয়ার্ক (Advanced 5G Networks): যানবাহন-থেকে-সবকিছু (V2X) যোগাযোগের জন্য উচ্চ-ব্যান্ডউইথ, কম-বিলম্বিত যোগাযোগ অত্যন্ত গুরুত্বপূর্ণ, যা যানবাহন এবং অবকাঠামোর মধ্যে সমন্বয় সক্ষম করে।
  4. স্মার্ট সিটি ইন্টিগ্রেশন (Smart City Integration): Zhuhai-এর মতো উদ্যোগগুলি বৃহত্তর শহুরে ডেটা নেটওয়ার্কগুলির সাথে পরিবহন ব্যবস্থাগুলিকে একীভূত করার ইচ্ছা প্রদর্শন করে, ট্র্যাফিক প্রবাহকে অপ্টিমাইজ করে এবং উন্নত AV বৈশিষ্ট্যগুলি সক্ষম করে৷
  5. ব্যাপক রাইড-হেইলিং (Widespread Ride-Hailing): রাইড-হেইলিং অ্যাপগুলির উচ্চ ভোক্তা গ্রহণ রোবোট্যাক্সি পরিষেবাগুলির জন্য একটি প্রস্তুত বাজার তৈরি করে, স্বায়ত্তশাসিত যানবাহন বাণিজ্যিকীকরণের জন্য একটি স্পষ্ট পথ প্রদান করে।
  6. উচ্চ EV গ্রহণ হার (High EV Adoption Rate): চীনা ভোক্তারা অনেক পশ্চিমা দেশের তুলনায় বৈদ্যুতিক যানবাহনগুলিকে আরও সহজে গ্রহণ করেছে, একটি বৃহৎ দেশীয় বাজার তৈরি করেছে।
  7. সহায়ক নিয়ন্ত্রক পরিবেশ (Supportive Regulatory Environment): যদিও নিরাপত্তা মূল বিষয়, তবে স্বায়ত্তশাসিত প্রযুক্তি পরীক্ষা এবং স্থাপনের জন্য সরকারী সমর্থন রয়েছে বলে মনে হচ্ছে, যা Wuhan-এর মতো শহরগুলিতে ইতিমধ্যে চলমান রোবোট্যাক্সি অপারেশন দ্বারা প্রমাণিত।

অন্যান্য অঞ্চলের সাথে এর বৈপরীত্য করুন। মার্কিন যুক্তরাষ্ট্র, Tesla-র অগ্রণী প্রচেষ্টা সত্ত্বেও, উন্নত দেশগুলির মধ্যে সামগ্রিক EV গ্রহণে উল্লেখযোগ্যভাবে পিছিয়ে রয়েছে, একটি প্রবণতা যা নীতি পরিবর্তনের দ্বারা সম্ভাব্যভাবে আরও বেড়েছে। ইউরোপ শক্তিশালী EV গ্রহণ নিয়ে গর্ব করে কিন্তু প্রভাবশালী দেশীয় EV নির্মাতাদের একই ঘনত্ব বা এই একীকরণের উপর দৃষ্টি নিবদ্ধকারী বিশ্বব্যাপী নেতৃস্থানীয় AI জায়ান্টদের অভাব রয়েছে।

চীনের কৌশলগত সুবিধা, অতএব, একক সবচেয়ে শক্তিশালী LLM থাকার চেয়ে এই জটিল ইকোসিস্টেমটি অর্কেস্ট্রেট করার বিষয়ে বেশি বলে মনে হচ্ছে। টুকরোগুলি যথাস্থানে পড়ছে – উত্পাদন দক্ষতা থেকে ডিজিটাল অবকাঠামো এবং ভোক্তা গ্রহণযোগ্যতা পর্যন্ত – সম্ভাব্যভাবে স্বায়ত্তশাসিত যানবাহনগুলিকে কুলুঙ্গি পরীক্ষা থেকে মূলধারার গ্রহণে স্থানান্তরিত করার অনুমতি দেওয়ার জন্য, সম্ভবত এই বছর এমনকি উল্লেখযোগ্য টেক-অফ দেখতে পাবে। সম্পূর্ণ রূপান্তরকারী শক্তি আনলক করা হবে কারণ এই যানবাহনগুলি বিকশিত স্মার্ট সিটি পরিকাঠামোর সাথে নির্বিঘ্নে সংহত হবে।

ফোকাস স্থানান্তর: কম্পিউটেশনাল পাওয়ার থেকে ইন্টিগ্রেটেড ইকোসিস্টেমে

যদিও মার্কিন যুক্তরাষ্ট্র এবং অন্যান্য খেলোয়াড়রা প্রায়শই একটি ‘কম্পিউটেশনাল রেস’-এ আবদ্ধ বলে মনে হয়, চিপ আধিপত্য, বিশাল সার্ভার পরিকাঠামো এবং ক্রমবর্ধমান বড় LLMগুলির সাথে বেঞ্চমার্ক নেতৃত্ব অর্জনের উপর দৃষ্টি নিবদ্ধ করে, চীন একটি পরিপূরক, সম্ভবত শেষ পর্যন্ত আরও প্রভাবশালী, কৌশল অনুসরণ করছে বলে মনে হচ্ছে। এই কৌশলটি বাস্তব, সামাজিকভাবে রূপান্তরকারী অ্যাপ্লিকেশনগুলিতে AI-এর একীকরণ-এর উপর জোর দেয়, নির্ভরযোগ্যতা এবং ইকোসিস্টেম সিনার্জিকে অগ্রাধিকার দেয়, বিশেষ করে স্বায়ত্তশাসিত ড্রাইভিং এবং স্মার্ট সিটির মতো ডোমেনগুলিতে।

এর মধ্যে নিউরো-সিম্বলিক পদ্ধতির দিকে একটি ইচ্ছাকৃত পদক্ষেপ জড়িত, নির্দিষ্ট উচ্চ-মূল্য, নিরাপত্তা-গুরুত্বপূর্ণ ডোমেনগুলিকে লক্ষ্য করে যেখানে বিশুদ্ধ পরিসংখ্যানগত মডেলগুলি কম পড়ে। সত্যিকারের প্রতিযোগিতামূলক প্রান্তটি কোনও একক অ্যালগরিদম বা মডেলের মধ্যে নাও থাকতে পারে, তার শক্তি বা ব্যয়-কার্যকারিতা নির্বিশেষে, তবে ব্যাপক, সমন্বিত ইকোসিস্টেমের মাধ্যমে ভৌত এবং অর্থনৈতিক ল্যান্ডস্কেপে AI বুননের ক্ষমতার মধ্যে। চীন নীরবে ব্যবহারিক, ডোমেন-নির্দিষ্ট নিউরো-সিম্বলিক ইন্টিগ্রেশনের দিকে অগ্রসর হচ্ছে, LLMগুলির সাথে বর্তমান মুগ্ধতার বাইরে এমন অ্যাপ্লিকেশনগুলির দিকে তাকিয়ে যা মৌলিকভাবে শহুরে জীবন এবং পরিবহনকে নতুন আকার দিতে পারে। AI-এর বাস্তব-বিশ্বের প্রভাবের ভবিষ্যত চ্যাটবটগুলির বাগ্মিতার চেয়ে এই জটিল, AI-এমবেডেড সিস্টেমগুলির নির্ভরযোগ্য কার্যকারিতার মধ্যে কম থাকতে পারে।