ডিজিটাল সার্বভৌমত্ব: ভারতের নিজস্ব AI মডেল তৈরি করা আবশ্যক

জাতীয় নিরাপত্তার প্রয়োজনীয়তা

কৃত্রিম বুদ্ধিমত্তার (AI) দ্রুত অগ্রগতির সাথে সাথে বিশ্বজুড়ে একটি গুরুত্বপূর্ণ প্রশ্ন উঠেছে, আর ভারতের ক্ষেত্রে এই প্রশ্নটি আরও বেশি প্রাসঙ্গিক: বিশ্বের সর্বাধিক জনবহুল গণতন্ত্র কি সত্যিই তার ডিজিটাল ভবিষ্যৎকে বিদেশী AI সিস্টেমের উপর ছেড়ে দিতে পারে? ChatGPT, Google-এর Gemini এবং সাম্প্রতিক অর্থনৈতিক মডেল DeepSeek-এর মতো রূপান্তরমূলক মডেলগুলির উত্থান স্বাস্থ্যসেবা থেকে শুরু করে শাসনব্যবস্থা পর্যন্ত বিভিন্ন ক্ষেত্রকে পুনর্গঠিত করছে। এই পরিস্থিতিতে, বৃহৎ ভাষা মডেল (LLM) উন্নয়নের ক্ষেত্রে ভারতের অনুপস্থিতি কেবল একটি প্রযুক্তিগত ব্যবধান নয়—এটি একটি কৌশলগত দুর্বলতা।

ভারত বিশ্বের ২০% এর বেশি ডিজিটাল ডেটা তৈরি করে। ২০২৬ সালের মধ্যে এই সংখ্যা ২৫% এ পৌঁছাবে বলে ধারণা করা হচ্ছে। বৃহৎ ভাষা মডেল (LLM)-এর ক্ষেত্রে এই ডেটার অধিকাংশই বিদেশী AI সিস্টেম দ্বারা প্রক্রিয়া করা হয়। এটি উল্লেখযোগ্য সার্বভৌমত্ব ঝুঁকি তৈরি করে, যার জন্য অবিলম্বে মনোযোগ দেওয়া প্রয়োজন।

এর প্রভাবগুলি বিবেচনা করুন: সংবেদনশীল সরকারি যোগাযোগ, ব্যক্তিগত স্বাস্থ্যসেবার রেকর্ড এবং গুরুত্বপূর্ণ আর্থিক লেনদেন— সবই বিদেশী AI মডেলের মাধ্যমে পরিচালিত হয়। এটি ভারতকে যথেষ্ট বিচারব্যবস্থার ঝুঁকির মধ্যে ফেলে। U.S. CLOUD Act-এর মতো আইনের অধীনে, আমেরিকান LLM দ্বারা প্রক্রিয়াকৃত ডেটা মার্কিন আইনি অনুরোধের অধীন হতে পারে।

ফেব্রুয়ারি ২০২৪-এর জাতীয় সাইবার নিরাপত্তা কৌশল প্রতিবেদনে এই দুর্বলতা স্পষ্টভাবে তুলে ধরা হয়েছে। সেখানে বলা হয়েছে, কীভাবে AI-নির্ভরতা ‘ভূ-রাজনৈতিক উত্তেজনার সময় কাজে লাগানোর মতো গুরুত্বপূর্ণ লিভারেজ পয়েন্ট’ তৈরি করে। এটি কেবল একটি তাত্ত্বিক উদ্বেগ নয়।

অন্যদিকে, চীন সক্রিয়ভাবে সরকারি কার্যক্রমে ৫০টিরও বেশি দেশীয় LLM স্থাপন করেছে। এই কৌশলগত পদক্ষেপ সংবেদনশীল ক্ষেত্রগুলিতে বিদেশী AI-এর উপর নির্ভরতা কার্যকরভাবে দূর করেছে। চীনের এই পদক্ষেপটি ছিল মার্কিন যুক্তরাষ্ট্রের উন্নত AI চিপ রপ্তানির উপর নিষেধাজ্ঞার প্রতিক্রিয়া—এমন একটি পরিস্থিতি ভারতকেও মোকাবিলা করতে হতে পারে।

ভাষাগত বিভাজন: অগ্রগতির পথে বাধা

ভারতে, সম্ভবত ভাষা প্রক্রিয়াকরণের ক্ষেত্রেই দেশীয় AI-এর প্রয়োজনীয়তা সবচেয়ে বেশি অনুভূত হয়। ভারতের ভাষাগত বৈচিত্র্য ২২টি সরকারিভাবে স্বীকৃত ভাষা এবং ১২০টিরও বেশি প্রধান উপভাষার সমন্বয়ে গঠিত। এই বৈচিত্র্য একটি সাংস্কৃতিক সম্পদ হলেও, AI উন্নয়নের ক্ষেত্রে এটি একটি অনন্য চ্যালেঞ্জ উপস্থাপন করে।

AI4Bharat-এর সাম্প্রতিক বেঞ্চমার্ক পরীক্ষায় দেখা গেছে, শীর্ষস্থানীয় গ্লোবাল LLM-গুলি ইংরেজির তুলনায় ভারতীয় ভাষাগুলি প্রক্রিয়াকরণের ক্ষেত্রে ৩০-৪০% কম পারফর্ম করে। অসমীয়া, মৈথিলী এবং ডোগরির মতো ভাষাগুলির ক্ষেত্রে, কার্যকারিতা ব্যবহারযোগ্য সীমার নিচে নেমে যায়।

মূল সমস্যা হল, বিদেশী AI মডেলগুলির প্রায়শই ভারতীয় ভাষাগুলির অন্তর্নিহিত সাংস্কৃতিক প্রেক্ষাপট এবং ভাষাগত সূক্ষ্মতা সম্পর্কে গভীর জ্ঞানের অভাব থাকে। এটি একটি ডিজিটাল বিভাজন তৈরি করে, যা কার্যকরভাবে অ-ইংরেজিভাষী জনগোষ্ঠীকে—ভারতের জনসংখ্যার বৃহত্তর অংশকে— উদীয়মান AI যুগে দ্বিতীয় শ্রেণীর নাগরিকে পরিণত করে।

ন্যাশনাল ডিজিটাল লাইব্রেরির ফলাফল এই বৈষম্যকে আরও স্পষ্ট করে তোলে। AI-সহায়ক শিক্ষা সরঞ্জামগুলি ভাষাগত বাধার কারণে অ-ইংরেজিভাষী অঞ্চলগুলিতে ৭৮% কম ব্যবহৃত হয়।

অর্থনৈতিক সার্বভৌমত্ব: একটি আসন্ন হুমকি

AI-নির্ভরতার অর্থনৈতিক প্রভাবও অনেক গভীর। ২০২৩ সালে ভারতের ডিজিটাল অর্থনীতির মূল্য ছিল ২০০ বিলিয়ন ডলার, যা ২০৩০ সালের মধ্যে ৮০০ বিলিয়ন ডলারে পৌঁছবে বলে ধারণা করা হচ্ছে। তবে, AI অ্যাপ্লিকেশন থেকে উৎপন্ন অর্থনৈতিক মূল্যের একটি উল্লেখযোগ্য অংশ বর্তমানে বিদেশী প্রযুক্তি সরবরাহকারীদের কাছে চলে যাচ্ছে।

শুধুমাত্র ২০২৩ সালে, ভারতীয় ব্যবসাগুলি বিদেশী AI API পরিষেবাগুলিতে প্রায় ৩,৭০০ কোটি টাকা ব্যয় করেছে। NASSCOM-এর অনুমান অনুযায়ী, ২০২৬ সালের মধ্যে এই সংখ্যা ১৭,৫০০ কোটি টাকায় পৌঁছবে। বিদেশী AI কোম্পানিগুলি বর্তমানে ভারতের এন্টারপ্রাইজ AI বাজারের ৯৪% নিয়ন্ত্রণ করে।

অন্যান্য দেশগুলির অভিজ্ঞতা একটি আকর্ষণীয় তথ্য দেয়। যেসব দেশে দেশীয় AI মডেল রয়েছে, সেখানে AI স্টার্টআপ গঠনের হার ৩-৪ গুণ বেশি দেখা গেছে। ২০২৩ সালে ভারতের AI স্টার্টআপ ইকোসিস্টেমের মূল্য ছিল ৩.৫ বিলিয়ন ডলার, যা দেশীয় ফাউন্ডেশন মডেলগুলির বিকাশের সাথে ২০২৭ সালের মধ্যে ১৬ বিলিয়ন ডলারে পৌঁছতে পারে।

বর্তমান প্রচেষ্টা এবং প্রতিবন্ধকতা

ভারতে বেশ কয়েকটি প্রতিশ্রুতিশীল উদ্যোগ চালু থাকলেও, সেগুলি প্রায়শই বিশ্ব নেতাদের তুলনায় পিছিয়ে রয়েছে:

  • AI4Bharat-এর Indic-LLMs: এই মডেলগুলি ভারতীয় ভাষাগুলিতে শক্তিশালী পারফরম্যান্স প্রদর্শন করে, কিন্তু যুক্তির ক্ষমতার (reasoning capabilities) ক্ষেত্রে এখনও পিছিয়ে রয়েছে।
  • C-DAC-এর Sajag প্রকল্প: এই উচ্চাভিলাষী প্রকল্পের লক্ষ্য হল ২০২৬ সালের মধ্যে ১০০ বিলিয়ন প্যারামিটার বিশিষ্ট একটি মডেল তৈরি করা।
  • কর্পোরেট উদ্যোগ: Reliance Jio (BharatGPT-এর সাথে) এবং Tata (Project Indus-এর সাথে) এর মতো কোম্পানিগুলি উল্লেখযোগ্য পদক্ষেপ নিচ্ছে, তবে এই প্রচেষ্টাগুলি এখনও প্রাথমিক পর্যায়ে রয়েছে।

চ্যালেঞ্জ এবং সরকারের রোডম্যাপ

সরকারের জোরালো সমর্থন সত্ত্বেও, ভারতে একটি দেশীয় LLM তৈরি করতে উল্লেখযোগ্য বাধার সম্মুখীন হতে হচ্ছে। দেশের উচ্চ-ক্ষমতাসম্পন্ন কম্পিউটিং ক্ষমতা বর্তমানে প্রায় ৬.৪ পেটাফ্লপস, যা প্রতিযোগিতামূলক AI মডেলগুলিকে প্রশিক্ষণ দেওয়ার জন্য প্রয়োজনের ২% এরও কম।

২০২৪-২৫ বাজেটে AI-এর জন্য সরকার ৭,৫০০ কোটি টাকা বরাদ্দ করেছে। এটি একটি ইতিবাচক পদক্ষেপ হলেও, গ্লোবাল AI ফার্মগুলি প্রতি বছর মডেল তৈরিতে যে ১০-২৫ বিলিয়ন ডলার বিনিয়োগ করে, তার তুলনায় এটি খুবই কম।

আরেকটি গুরুত্বপূর্ণ চ্যালেঞ্জ হল উচ্চ-মানের, টীকাযুক্ত ডেটাসেটের (annotated datasets) প্রাপ্যতা, বিশেষ করে আঞ্চলিক ভাষাগুলিতে। এই ডেটাসেটগুলি প্রতিযোগিতামূলক AI মডেল প্রশিক্ষণের জন্য অপরিহার্য। এছাড়াও, ভারতে মৌলিক AI গবেষণা এবং বৃহৎ আকারের মডেল প্রশিক্ষণে প্রতিভার অভাব রয়েছে।

এই বহুমুখী চ্যালেঞ্জগুলি মোকাবিলা করার জন্য, সরকার বেশ কয়েকটি উদ্যোগ চালু করেছে:

  • AI Kosha: এই উদ্যোগের লক্ষ্য LLM গবেষণাকে সমর্থন করা।
  • ১৮,০০০ শেয়ার্ড GPUs: এটি গুরুত্বপূর্ণ কম্পিউটিং পরিকাঠামো সরবরাহ করে।
  • Bhashini: এই প্রকল্পটি AI-চালিত ভাষা মডেল তৈরির উপর দৃষ্টি নিবদ্ধ করে।
  • Semicon India এবং Supercomputing Mission: এই প্রোগ্রামগুলি AI হার্ডওয়্যারের ক্ষমতা বাড়ানোর জন্য ডিজাইন করা হয়েছে।

রিলায়েন্স জিও, টিসিএস এবং ইনফোসিসের মতো বড় ভারতীয় কর্পোরেশনগুলিও LLM উন্নয়নে দেশের অগ্রগতি ত্বরান্বিত করতে AI গবেষণায় প্রচুর বিনিয়োগ করছে।

নিষ্ক্রিয়তার মূল্য: একটি কঠোর সতর্কবার্তা

দেশীয় LLM ক্ষমতা তৈরি করতে ব্যর্থতার পরিণতি কেবল প্রযুক্তিগত নির্ভরতার চেয়েও অনেক বেশি বিস্তৃত।

২০৩০ সালের মধ্যে, AI ভারতে প্রায় ৪৫০-৫০০ বিলিয়ন ডলারের অর্থনৈতিক মূল্য তৈরি করবে বলে অনুমান করা হচ্ছে। দেশীয় মডেল ছাড়া, এই মূল্যের একটি উল্লেখযোগ্য অংশ বিদেশী প্রযুক্তি সরবরাহকারীদের কাছে চলে যাবে।

তবে, আরও একটি উদ্বেগের বিষয় হল, গবেষকরা যাকে ‘অ্যালগরিদমিক উপনিবেশ’ বলছেন। এটি ভারতের তথ্য ইকোসিস্টেম, সাংস্কৃতিক আখ্যান এবং সিদ্ধান্ত গ্রহণের প্রক্রিয়াগুলির উপর বিদেশী AI সিস্টেমগুলির ক্রমবর্ধমান প্রভাবকে বোঝায়।

অন্যান্য দেশগুলি যখন AI উন্নয়নে আগ্রাসীভাবে কাজ করছে, তখন ভারত একটি গুরুত্বপূর্ণ সন্ধিক্ষণে দাঁড়িয়ে আছে। দেশীয় LLM-গুলির বিকাশ কেবল একটি প্রযুক্তিগত আকাঙ্ক্ষা নয়; এটি ভারতের সার্বভৌমত্ব রক্ষা এবং ডিজিটাল যুগে তার ভবিষ্যৎ সুরক্ষিত করার জন্য একটি কৌশলগত অপরিহার্যতা। এর মাধ্যমে এটি নিশ্চিত করা যাবে যে, ভারতের অনন্য ভাষাগত ও সাংস্কৃতিক বৈচিত্র্য কেবল সংরক্ষিতই থাকবে না, AI দ্বারা ক্ষমতায়িতও হবে। এটি এমন অর্থনৈতিক প্রবৃদ্ধি উৎসাহিত করবে, যা ভারতীয় ব্যবসা এবং নাগরিকদের উপকৃত করবে। এবং, শেষ পর্যন্ত, এটি ভারতের ডিজিটাল নিয়তির উপর নিয়ন্ত্রণ বজায় রাখার বিষয়ে কাজ করবে। সামনের পথে প্রয়োজন টেকসই বিনিয়োগ, সরকার, শিল্প এবং একাডেমিয়ার মধ্যে সহযোগিতা এবং উদ্ভাবনের উপর নিরলস মনোযোগ। বাজি ধরার পরিমাণ এতটাই বেশি যে, একে উপেক্ষা করা অসম্ভব।

দেশীয় LLM-এর বিকাশ অত্যন্ত গুরুত্বপূর্ণ:

১. জাতীয় নিরাপত্তা রক্ষা: বিদেশী AI সিস্টেমের উপর নির্ভরতা কমানো ডেটা এখতিয়ার এবং ভূ-রাজনৈতিক উত্তেজনার সময় সম্ভাব্য শোষণ সম্পর্কিত ঝুঁকি হ্রাস করে।

২. ভাষাগত ব্যবধান দূর করা: ভারতীয় ভাষাগুলি বুঝতে ও প্রক্রিয়া করতে পারে এমন AI মডেল তৈরি করা সমস্ত নাগরিকের জন্য AI-চালিত প্রযুক্তিতে অন্তর্ভুক্তি এবং সমান অ্যাক্সেস নিশ্চিত করে।

৩. অর্থনৈতিক প্রবৃদ্ধি সুরক্ষিত করা: একটি দেশীয় AI শিল্পের বিকাশ উদ্ভাবনকে উৎসাহিত করে, কর্মসংস্থান সৃষ্টি করে এবং বিদেশী প্রযুক্তি সরবরাহকারীদের কাছে অর্থনৈতিক মূল্যের বহিঃপ্রবাহ রোধ করে।

৪. অ্যালগরিদমিক উপনিবেশ প্রতিরোধ: AI সিস্টেমের উপর নিয়ন্ত্রণ বজায় রাখা নিশ্চিত করে যে ভারতের তথ্য ইকোসিস্টেম, সাংস্কৃতিক আখ্যান এবং সিদ্ধান্ত গ্রহণের প্রক্রিয়াগুলি বিদেশী সংস্থাগুলির দ্বারা অযাচিতভাবে প্রভাবিত না হয়।

৫. উদ্ভাবনকে উৎসাহিত করা: দেশীয় AI মডেলগুলিকে ভারতের নির্দিষ্ট চাহিদা এবং প্রেক্ষাপটের সাথে খাপ খাইয়ে নেওয়া যেতে পারে, যা আরও কার্যকর এবং প্রাসঙ্গিক সমাধানের দিকে পরিচালিত করে।

৬. ডেটা গোপনীয়তা: ভারতীয় নাগরিক এবং ব্যবসার সংবেদনশীল ডেটা দেশের ভিতরে থাকে এবং ভারতীয় আইন দ্বারা পরিচালিত হয় তা নিশ্চিত করুন।

৭. কৌশলগত স্বায়ত্তশাসন শক্তিশালী করা: বিদেশী প্রযুক্তির উপর নির্ভরতা হ্রাস করে, ভারত ডিজিটাল যুগে বিশ্ব নেতা হিসাবে তার অবস্থান জাহির করতে পারে।

৮. প্রতিযোগিতা বাড়ানো: দেশীয় AI মডেলগুলিতে অ্যাক্সেস সহ ভারতীয় কোম্পানিগুলি বিশ্ব বাজারে আরও কার্যকরভাবে প্রতিদ্বন্দ্বিতা করতে পারে।

৯. গবেষণা ও উন্নয়নে উৎসাহ: LLM উন্নয়নে বিনিয়োগ কম্পিউটার বিজ্ঞান, ভাষাবিজ্ঞান এবং ডেটা বিশ্লেষণের মতো সম্পর্কিত ক্ষেত্রগুলিতে গবেষণা এবং উদ্ভাবনকে উদ্দীপিত করে।

১০. ডিজিটাল ইন্ডিয়াকে শক্তিশালী করা: দেশীয় LLM হল ডিজিটাল ইন্ডিয়া উদ্যোগের একটি ভিত্তি, যা বিভিন্ন ক্ষেত্রে ডিজিটাল রূপান্তরকে চালিত করে।

এখন প্রয়োজন একটি সমন্বিত এবং সহযোগিতামূলক জাতীয় প্রচেষ্টা, যা একাডেমিয়া, শিল্প এবং সরকারের সেরা প্রতিভাদের একত্রিত করবে। এটি কেবল প্রযুক্তিগত অগ্রগতির বিষয় নয়; এটি একবিংশ শতাব্দীতে জাতীয় আত্মনিয়ন্ত্রণের বিষয়। ডিজিটাল যুগে ভারতের ভবিষ্যৎ নির্ভর করছে AI-এর ক্ষমতাকে নিজস্ব শর্তে কাজে লাগানোর ক্ষমতার উপর। এখনই কাজ করার সময়। পছন্দটি পরিষ্কার: দেশীয় AI উন্নয়নকে আলিঙ্গন করুন অথবা নতুন বিশ্ব ব্যবস্থায় একটি ডিজিটাল উপনিবেশে পরিণত হওয়ার ঝুঁকি নিন। ভারতকে অবশ্যই প্রথমটি বেছে নিতে হবে, এমন একটি ভবিষ্যতের দিকে অগ্রসর হতে হবে যেখানে এর ডিজিটাল সার্বভৌমত্ব সুরক্ষিত, এর ভাষাগত বৈচিত্র্য উদযাপিত এবংএর অর্থনৈতিক সমৃদ্ধি স্ব-নির্ধারিত।