ডিপসিক এআই: কম চিপ, বেশি স্থায়ীত্ব?

এআই সরঞ্জামগুলির কার্বন নিঃসরণ একটি গুরুত্বপূর্ণ উদ্বেগের বিষয়। DeepSeek AI দাবি করেছে তাদের মডেলগুলি অন্যান্য মডেলের তুলনায় বেশি দক্ষ, যা নিঃসন্দেহে শিল্পে আলোড়ন সৃষ্টি করেছে। ফ্রান্সের স্থিতিশীলতা বিষয়ক সফটওয়্যার কোম্পানি গ্রিনলি সম্প্রতি একটি গবেষণায় DeepSeek-এর এই দাবির সত্যতা যাচাই করেছে।

গ্রিনলির গবেষণা অনুযায়ী, DeepSeek মডেলগুলি প্রশিক্ষণের জন্য কম সময় নেয় এবং কম Nvidia চিপ ব্যবহার করে। একই পরিস্থিতিতে DeepSeek-এর V3 মডেল এবং Meta-এর Llama 3.1 মডেলকে প্রশিক্ষণ দেওয়ার সময় DeepSeek ২.৭৮ মিলিয়ন গ্রাফিক্স প্রসেসিং ইউনিট (GPU) ঘণ্টা ব্যবহার করেছে, যেখানে Meta-র মডেল ৩০.৮ মিলিয়ন GPU ঘণ্টা ব্যবহার করেছে। প্রশিক্ষণ সাধারণত এআই মডেল পরিচালনার ক্ষেত্রে কার্বন নিঃসরণের সবচেয়ে গুরুত্বপূর্ণ অংশ, তাই DeepSeek-এর দ্রুত প্রশিক্ষণ নিঃসন্দেহে এর দক্ষতা বাড়ায়। এছাড়াও, DeepSeek ২০০০টি Nvidia চিপ ব্যবহার করেছে, যেখানে Meta-র মডেল ১৬০০০-এর বেশি এবং ChatGPT ২৫০০০-এর বেশি চিপ ব্যবহার করেছে। DeepSeek যে চিপ ব্যবহার করেছে, তা ChatGPT-র চিপের চেয়ে কম “শক্তি-ঘন”।

গ্রিনলির গবেষণা বলছে, “মার্কিন যুক্তরাষ্ট্রের নিষেধাজ্ঞার কারণে DeepSeek Nvidia-র অত্যাধুনিক এআই চিপগুলিতে প্রবেশাধিকার সীমিত করতে বাধ্য হয়েছে। তাই কোম্পানিটি এমন উদ্ভাবনী প্রযুক্তি তৈরি করেছে। এই সীমাবদ্ধতা DeepSeek-কে গণন ক্ষমতার ওপর নির্ভর না করে এমন মডেল ডিজাইন করতে বাধ্য করেছে যা দক্ষতা সর্বাধিক করতে পারে।”

ডিপসিকের প্রযুক্তিগত উদ্ভাবন: মিশ্র বিশেষজ্ঞ মডেল

DeepSeek-এর ডিজাইন মডেলগুলোর মধ্যে অন্যতম হলো মিক্সচার-অব-এক্সপার্টস (mixture-of-experts) ডিজাইন। এই ডিজাইন টুলটিকে ব্যবহারকারীর কাজগুলো সাব-মডেলগুলোতে অর্পণ করতে সক্ষম করে। এর ফলে “শুধুমাত্র নির্দিষ্ট অনুরোধের জন্য প্রয়োজনীয় গণনা শক্তি সক্রিয়” হয়। এই পদ্ধতিটি অনেকটা একটি বড় দলের মতো, যেখানে প্রতিটি সদস্য নির্দিষ্ট ক্ষেত্রে বিশেষজ্ঞ। যখন কোনো নতুন সমস্যা আসে, তখন দলের প্রধান পুরো দলকে অন্তর্ভুক্ত না করে, সমস্যা সমাধানের জন্য সবচেয়ে উপযুক্ত বিশেষজ্ঞকে সেই কাজটি দেন।

DeepSeek-এর মিক্সচার-অব-এক্সপার্টস মডেলে, একটি বৃহৎ এআই মডেলকে ছোট, আরও বিশেষায়িত সাব-মডেলে বিভক্ত করা হয়। প্রতিটি সাব-মডেলকে নির্দিষ্ট ধরনের কাজে পারদর্শী হওয়ার জন্য প্রশিক্ষণ দেওয়া হয়। উদাহরণস্বরূপ, একটি সাব-মডেল প্রাকৃতিক ভাষা প্রক্রিয়াকরণে (natural language processing) দক্ষ হতে পারে, আবার অন্য একটি সাব-মডেল ইমেজ শনাক্তকরণে (image recognition task) দক্ষ হতে পারে।

যখন কোনো ব্যবহারকারী DeepSeek AI-এর কাছে কোনো অনুরোধ করে, তখন সিস্টেমটি সেই অনুরোধটি বিশ্লেষণ করে এবং নির্ধারণ করে কোন সাব-মডেল সেই অনুরোধটি প্রক্রিয়াকরণের জন্য সবচেয়ে উপযুক্ত। এরপর সিস্টেমটি সেই অনুরোধটিকে উপযুক্ত সাব-মডেলের কাছে পাঠিয়ে দেয়, যা অনুরোধটি প্রক্রিয়াকরণ করে ফলাফল ফিরিয়ে দেয়।

এই পদ্ধতির বেশ কয়েকটি সুবিধা রয়েছে:

  • দক্ষতা বৃদ্ধি: শুধুমাত্র একটি নির্দিষ্ট অনুরোধের জন্য প্রয়োজনীয় গণনা শক্তি সক্রিয় করার মাধ্যমে, মিক্সচার-অব-এক্সপার্টস মডেল দক্ষতা উল্লেখযোগ্যভাবে বৃদ্ধি করতে পারে। পুরো মডেলটিকে সক্রিয় করার প্রয়োজনীয়তা সম্পন্ন ঐতিহ্যবাহী এআই মডেলগুলোর তুলনায়, এটি প্রচুর পরিমাণে কম্পিউটিং রিসোর্স সাশ্রয় করতে পারে।
  • Accuracy বৃদ্ধি: যে সাব-মডেলটি কোনো কাজ প্রক্রিয়াকরণের জন্য সবচেয়ে উপযুক্ত, সেই মডেলে কাজটি অর্পণ করার মাধ্যমে, মিক্সচার-অব-এক্সপার্টস মডেল নির্ভুলতা বাড়াতে পারে। প্রতিটি সাব-মডেল বিশেষভাবে প্রশিক্ষিত এবং তাদের নির্দিষ্ট ক্ষেত্রে পারদর্শী হওয়ার জন্য তৈরি করা হয়, তাই তাদের কাছ থেকে সঠিক ফলাফল পাওয়ার সম্ভাবনা বেশি।
  • সম্প্রসারণযোগ্যতা বৃদ্ধি: মিক্সচার-অব-এক্সপার্টস মডেলকে সহজেই সম্প্রসারণ করা যায়, কারণ নতুন কাজগুলো করার জন্য প্রয়োজন অনুযায়ী নতুন সাব-মডেল যুক্ত করা যেতে পারে। এটি সিস্টেমকে ক্রমাগত পরিবর্তনশীল চাহিদার সঙ্গে খাপ খাইয়ে নিতে সক্ষম করে।

ডাটা সেন্টারের সঙ্গে DeepSeek-এর সম্পর্ক: স্থিতিশীলতার গুরুত্বপূর্ণ বিষয়

গ্রিনলির গবেষণা আরও উল্লেখ করে যে, ডেটা সেন্টারের সঙ্গে DeepSeek-এর সম্পর্ক (বা সম্ভাব্য অভাব) এর স্থিতিশীলতা বাড়াতে সহায়ক। যেহেতু DeepSeek একটি ওপেন ওয়েট মডেল অথবা বলা যায়, এটি প্রকাশ্যে উপলব্ধ, তাই গ্রিনলি উল্লেখ করেছে যে এটি শুধুমাত্র ক্লাউড কম্পিউটিং বা ডেটা সেন্টারের মাধ্যমে নয়, ফিজিক্যাল ডিভাইসেও চালানো যেতে পারে। ডেটা সেন্টারের প্রয়োজনীয়তা কমিয়ে DeepSeek পরোক্ষভাবে সুবিধাগুলোর শক্তি খরচ কমাতে পারে, যা পাঁচ বছরের মধ্যে দ্বিগুণ হওয়ার সম্ভবনা রয়েছে।

ডেটা সেন্টার হলো এমন একটি বৃহৎ বিল্ডিং, যেখানে প্রচুর পরিমাণে কম্পিউটার সার্ভার এবং অন্যান্য সরঞ্জাম থাকে। এই সার্ভারগুলো ডেটা সংরক্ষণ, প্রক্রিয়াকরণ এবং বিতরণের জন্য ব্যবহৃত হয়। ডেটা সেন্টারগুলি চালানোর জন্য প্রচুর শক্তির প্রয়োজন হয়, কারণ সার্ভারগুলি প্রচুর তাপ উৎপন্ন করে, যা কুলিং সিস্টেমের মাধ্যমে নির্গত করতে হয়।

ডেটা সেন্টারের প্রয়োজনীয়তা কমিয়ে DeepSeek বিশ্বব্যাপী শক্তি খরচ এবং কার্বন নিঃসরণ কমাতে সাহায্য করতে পারে। জলবায়ু পরিবর্তনের মোকাবিলা করার জন্য এটি অত্যন্ত গুরুত্বপূর্ণ।

জেভনস প্যারাডক্স: দক্ষতা বৃদ্ধির কারণে সম্ভাব্য ঝুঁকি

তা সত্ত্বেও, গ্রিনলির গবেষণা সতর্ক করে দিয়ে বলেছে, “এই লাভগুলো ক্ষণস্থায়ী হতে পারে”। এর কারণ হলো জেভনস প্যারাডক্স। জেভনস প্যারাডক্স অনুযায়ী, কোনো কিছু যত বেশি দক্ষ হবে, সেটি তত বেশি ব্যবহৃত হবে, যার ফলে আরও বেশি নিঃসরণ হবে।

জেভনস প্যারাডক্স ১৯ শতকে ব্রিটিশ অর্থনীতিবিদ উইলিয়াম স্ট্যানলি জেভনস দ্বারা প্রস্তাবিত হয়েছিল। জেভনস পর্যবেক্ষণ করেছিলেন যে কয়লা পোড়ানোর দক্ষতা বাড়ার সঙ্গে সঙ্গে কয়লার ব্যবহার কমার পরিবর্তে বেড়েছে। তিনি যুক্তি দিয়েছিলেন, দক্ষতার উন্নতির কারণে কয়লার দাম কমেছে, যা চাহিদাকে আরও বাড়িয়ে তুলেছে।

এআইয়ের ক্ষেত্রে, জেভনস প্যারাডক্সের অর্থ হলো, DeepSeek-এর মতো এআই মডেলগুলোর দক্ষতা বাড়ানো সত্ত্বেও, এআইয়ের ব্যাপক ব্যবহারের কারণে সামগ্রিক কার্বন নিঃসরণের পরিমাণ বাড়তে পারে। উদাহরণস্বরূপ, যদি এআই আরও দক্ষ হয়ে ওঠে, তাহলে কোম্পানিগুলো আরও বেশি কাজ স্বয়ংক্রিয় করার জন্য এআই ব্যবহার করতে বেশি উৎসাহিত হতে পারে, যার ফলে এআইয়ের ব্যবহার দ্রুত বাড়তে পারে। এই বৃদ্ধি দক্ষতার উন্নতির সুফলগুলোকে নষ্ট করে দিতে পারে, এমনকি কার্বন নিঃসরণের পরিমাণও বাড়িয়ে দিতে পারে।

দায়িত্বশীল এআই স্থাপন: স্থিতিশীলতা নিশ্চিত করার মূল চাবিকাঠি

জেভনস প্যারাডক্স এড়াতে, গ্রিনলির গবেষণা “দায়িত্বশীল স্থাপনার” ওপর জোর দিয়েছে। এর মানে হলো, কোম্পানি এবং ব্যক্তি উভয়কেই এআই ব্যবহারের সময় কার্বন ফুটপ্রিন্ট কমাতে পদক্ষেপ নিতে হবে। এখানে কিছু পদক্ষেপ উল্লেখ করা হলো যা গ্রহণ করা যেতে পারে:

  • দক্ষ এআই মডেল ব্যবহার করুন: DeepSeek-এর মতো দক্ষ এআই মডেল নির্বাচন করলে শক্তি খরচ এবং কার্বন নিঃসরণ কমানো যায়।
  • এআই মডেলের ব্যবহার অপ্টিমাইজ করুন: নিশ্চিত করুন যে এআই মডেল শুধুমাত্র প্রয়োজনের সময় চলছে এবং অতিরিক্ত ব্যবহার এড়িয়ে চলুন।
  • নবায়নযোগ্য শক্তি ব্যবহার করুন: ডেটা সেন্টার এবং ফিজিক্যাল ডিভাইসকে শক্তি সরবরাহ করার জন্য নবায়নযোগ্য শক্তি ব্যবহার করলে কার্বন নিঃসরণ কমানো যায়।
  • স্থিতিশীল এআই উন্নয়নকে সমর্থন করুন: যে কোম্পানি এবং সংস্থাগুলো স্থিতিশীল এআই প্রযুক্তি তৈরি এবং স্থাপনের জন্য কাজ করছে, তাদের সমর্থন করুন।

এই পদক্ষেপগুলো গ্রহণের মাধ্যমে, আমরা নিশ্চিত করতে পারি যে এআইয়ের সুবিধা পরিবেশের ক্ষতি করে অর্জিত হবে না।

ডিপসিক এআই এর ওপেন সোর্স কৌশল: উদ্ভাবন এবং স্থিতিশীল উন্নয়নের গতি বৃদ্ধি

ডিপসিক এআই তার কিছু মডেল ওপেন সোর্স করার সিদ্ধান্ত নিয়েছে। এটি শুধুমাত্র এআই প্রযুক্তির উদ্ভাবনকে ত্বরান্বিত করে না, বরং এটি এআই স্থিতিশীল উন্নয়নেও গুরুত্বপূর্ণ ভূমিকা রাখে। ওপেন সোর্স মানে হলো যে কেউ DeepSeek AI-এর মডেল কোড অ্যাক্সেস, ব্যবহার, পরিবর্তন এবং বিতরণ করতে পারবে। এই ধরনের উন্মুক্ততা নিম্নলিখিত সুবিধাগুলো নিয়ে আসে:

  • উদ্ভাবনের গতি বৃদ্ধি: ওপেন সোর্সের মাধ্যমে DeepSeek AI মডেলের উন্নতি এবং অপ্টিমাইজেশনের জন্য আরও বেশি সংখ্যক ডেভেলপারকে আকৃষ্ট করতে সক্ষম। বিশ্বজুড়ে ডেভেলপাররা একসঙ্গে কাজ করে মডেলের ত্রুটিগুলো খুঁজে বের করতে এবং নতুন সমাধান প্রস্তাব করতে পারে। এই ধরনের উন্মুক্ত সহযোগী পদ্ধতি এআই প্রযুক্তির উদ্ভাবনকে ত্বরান্বিত করে এবং বিভিন্ন ক্ষেত্রে এআইয়ের প্রয়োগকে উৎসাহিত করে।
  • উন্নয়ন খরচ হ্রাস: অন্যান্য কোম্পানি এবং গবেষণা প্রতিষ্ঠানের জন্য, DeepSeek AI-এর ওপেন সোর্স মডেল ব্যবহার করলে এআই উন্নয়নের খরচ অনেক কমে যায়। তাদের নিজেদের মডেল তৈরি করার জন্য নতুন করে শুরু করতে হয় না, বরং তারা সরাসরি DeepSeek AI-এর মডেলের ওপর ভিত্তি করে পরিবর্তন এবং কাস্টমাইজ করতে পারে। এর ফলে প্রচুর সময় এবং রিসোর্স সাশ্রয় হয়।
  • মডেলের অ্যাক্সেসযোগ্যতা বৃদ্ধি: ওপেন সোর্স DeepSeek AI-এর মডেলগুলোকে আরও বেশি মানুষের কাছে অ্যাক্সেসযোগ্য করে তোলে। এটি এআই প্রযুক্তির বিস্তারকে উৎসাহিত করে, যাতে আরও বেশি মানুষ এর থেকে উপকৃত হতে পারে।
  • স্থিতিশীল উন্নয়ন প্রচার: ওপেন সোর্সের মাধ্যমে, আরও বেশি ডেভেলপার মডেলের দক্ষতা বাড়ানোর জন্য DeepSeek AI-এর প্রচেষ্টা সম্পর্কে জানতে পারে। এটি স্থিতিশীল এআই উন্নয়ন ধারণা প্রচার করতে সাহায্য করে, যা ডেভেলপারদের এআইয়ের পরিবেশগত প্রভাব সম্পর্কে সচেতন হতে এবং আরও দক্ষ ও পরিবেশ-বান্ধব এআই মডেল তৈরি করতে উৎসাহিত করে।

তবে ওপেন সোর্সের কিছু চ্যালেঞ্জও রয়েছে। উদাহরণস্বরূপ, ওপেন সোর্স মডেলের নিরাপত্তা একটি গুরুত্বপূর্ণ বিষয়। যদি মডেলে কোনো দুর্বলতা থাকে, তবে সেটি বিদ্বেষপূর্ণ আক্রমণকারীদের দ্বারা কাজে লাগানো হতে পারে। এছাড়াও, ওপেন সোর্স মডেলের মেধাস্বত্ব সুরক্ষা একটি উদ্বেগের বিষয়।

কিছু চ্যালেঞ্জ থাকা সত্ত্বেও, DeepSeek AI-এর ওপেন সোর্স কৌশল মূলত উপকারী। এটি এআই প্রযুক্তির উদ্ভাবনকে ত্বরান্বিত করে, এআই উন্নয়নের খরচ কমায়, মডেলের অ্যাক্সেসযোগ্যতা বাড়ায় এবং স্থিতিশীল উন্নয়নকে উৎসাহিত করে।

বিভিন্ন শিল্পে ডিপসিক এআই এর প্রয়োগের সম্ভাবনা

DeepSeek AI-এর দক্ষতা এবং স্থিতিশীলতা এটিকে বিভিন্ন শিল্পে ব্যবহারের জন্য ব্যাপক সম্ভাবনা তৈরি করেছে। নিচে কিছু ক্ষেত্র উল্লেখ করা হলো যেখানে DeepSeek AI গুরুত্বপূর্ণ ভূমিকা রাখতে পারে:

  • স্বাভাবিক ভাষা প্রক্রিয়াকরণ (NLP): DeepSeek AI আরও দক্ষ এবং নির্ভুল NLP মডেল তৈরি করতে ব্যবহার করা যেতে পারে। এর মাধ্যমে মেশিন অনুবাদ, টেক্সট সারাংশ তৈরি এবং আবেগের বিশ্লেষণ-এর মতো অ্যাপ্লিকেশনগুলোর উন্নতি ঘটানো সম্ভব।
  • কম্পিউটার ভিশন: DeepSeek AI আরও দক্ষ এবং নির্ভুল কম্পিউটার ভিশন মডেল তৈরি করতে ব্যবহার করা যেতে পারে। এর মাধ্যমে ছবি শনাক্তকরণ, বস্তু সনাক্তকরণ এবং ভিডিও বিশ্লেষণ-এর মতো অ্যাপ্লিকেশনগুলোর উন্নতি ঘটানো সম্ভব।
  • সুপারিশ সিস্টেম: DeepSeek AI আরও দক্ষ এবং ব্যক্তিগতকৃত সুপারিশ সিস্টেম তৈরি করতে ব্যবহার করা যেতে পারে। এর মাধ্যমে ব্যবহারকারীর অভিজ্ঞতা এবং ব্যবসায়িক লাভ বাড়ানো সম্ভব।
  • স্বাস্থ্যসেবা: DeepSeek AI রোগ নির্ণয়, ওষুধ তৈরি এবং ব্যক্তিগতকৃত চিকিৎসার ক্ষেত্রে সহায়তা করতে পারে। এর মাধ্যমে স্বাস্থ্যসেবার দক্ষতা বাড়ানো এবং রোগীদের জন্য ভালো ফল আনা সম্ভব।
  • আর্থিক পরিষেবা: DeepSeek AI ঝুঁকি মূল্যায়ন, জালিয়াতি সনাক্তকরণ এবং পরিমাণগত ট্রেডিং-এর মতো ক্ষেত্রে ব্যবহার করা যেতে পারে। এর মাধ্যমে আর্থিক পরিষেবাগুলোর দক্ষতা এবং নিরাপত্তা বাড়ানো সম্ভব।
  • উৎপাদন: DeepSeek AI উৎপাদন প্রক্রিয়া অপ্টিমাইজ করতে, গুণগত মান নিয়ন্ত্রণ করতে এবং ত্রুটি পূর্বাভাস দিতে ব্যবহার করা যেতে পারে। এর মাধ্যমে উৎপাদনশীলতা বাড়ানো এবং উৎপাদন খরচ কমানো সম্ভব।

ভবিষ্যতের এআই উন্নয়নের ধারা: দক্ষতা, স্থিতিশীলতা এবং দায়িত্বশীল স্থাপন

DeepSeek AI-এর উদাহরণ থেকে বোঝা যায় যে ভবিষ্যতের এআই উন্নয়নে দক্ষতা, স্থিতিশীলতা এবং দায়িত্বশীল স্থাপনের ওপর আরও বেশি গুরুত্ব দেওয়া হবে। এআই প্রযুক্তির ক্রমাগত উন্নয়নের সঙ্গে সঙ্গে, পরিবেশ এবং সমাজের ওপর এআইয়ের প্রভাব সম্পর্কে আমাদের আরও বেশি সচেতন হতে হবে এবং এমন পদক্ষেপ নিতে হবে যাতে এআইয়ের সুবিধাগুলো সম্পূর্ণরূপে কাজে লাগানো যায়, পাশাপাশি এর নেতিবাচক প্রভাব কমানো যায়।

ভবিষ্যতের এআই উন্নয়নের কিছু ধারা নিচে উল্লেখ করা হলো:

  • মডেল সংকোচন এবং অপ্টিমাইজেশন: গবেষকরা এআই মডেলগুলোকে সংকুচিত এবং অপ্টিমাইজ করার জন্য নতুন পদ্ধতি আবিষ্কার করতে থাকবেন। এর মাধ্যমে মডেলের কম্পিউটিং চাহিদা এবং শক্তি খরচ কমানো সম্ভব হবে।
  • এজ কম্পিউটিং: এআই মডেলগুলোকে প্রান্তীয় ডিভাইসে (যেমন স্মার্টফোন, সেন্সর ইত্যাদি) স্থাপন করলে ডেটা সেন্টারের ওপর নির্ভরতা কমবে। এর ফলে শক্তি খরচ এবং বিলম্ব কমানো সম্ভব হবে।
  • সবুজ এআই: ক্রমবর্ধমান সংখ্যক গবেষক সবুজ এআই উন্নয়নের দিকে মনোযোগ দেবেন। সবুজ এআই হলো এমন এআই প্রযুক্তি তৈরি করা, যা পরিবেশ-বান্ধব এবং স্থিতিশীল।
  • এআই নৈতিকতা এবং নিরাপত্তা: এআইয়ের নৈতিকতা এবং নিরাপত্তা সংক্রান্ত বিষয়গুলো আরও বেশি গুরুত্ব পাবে। এআইয়ের নিরাপত্তা, নির্ভরযোগ্যতা এবং ন্যায্য ব্যবহারের জন্য আমাদের যথাযথ নীতি এবং নিয়ম তৈরি করতে হবে।

DeepSeek AI-এর অনুসন্ধান আমাদের একটি ভালো উদাহরণ দিয়েছে। এটি দেখিয়েছে কিভাবে এআইয়ের দক্ষতা বাড়ানোর পাশাপাশি এর স্থিতিশীল উন্নয়নের দিকে মনোযোগ দেওয়া যায়। ভবিষ্যতে আমরা DeepSeek AI-এর মতো আরও উদ্ভাবনী কোম্পানি দেখতে পাব, যারা একটি সবুজ এবং স্থিতিশীল এআই ইকোসিস্টেম তৈরিতে অবদান রাখবে।