Facebook, Instagram, এবং WhatsApp-এর পেছনের প্রযুক্তি জায়ান্ট Meta Platforms, তার Llama 4 সিরিজ প্রবর্তনের মাধ্যমে কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে তার অবস্থান উল্লেখযোগ্যভাবে উন্নত করেছে। এই লঞ্চটি কোম্পানির প্রভাবশালী Llama পরিবারের ওপেন মডেলগুলির পরবর্তী পুনরাবৃত্তি চিহ্নিত করে, যা AI বিকাশের অগ্রভাগে প্রতিযোগিতা করার এবং সম্ভাব্যভাবে শিল্পের মধ্যে প্রতিযোগিতামূলক গতিশীলতা পুনর্নির্মাণ করার একটি অব্যাহত প্রতিশ্রুতি নির্দেশ করে। এই রিলিজে তিনটি স্বতন্ত্র মডেলের একটি ত্রয়ী উপস্থাপন করা হয়েছে, যার প্রতিটি নির্দিষ্ট ক্ষমতা এবং কম্পিউটেশনাল আর্কিটেকচার দিয়ে ডিজাইন করা হয়েছে, যার লক্ষ্য সাধারণ চ্যাট কার্যকারিতা থেকে জটিল ডেটা প্রক্রিয়াকরণ কাজ পর্যন্ত বিভিন্ন ধরণের অ্যাপ্লিকেশন পূরণ করা।
Llama 4 পরিবারের পরিচিতি: Scout, Maverick, এবং Behemoth
Llama 4 প্রজন্মের প্রাথমিক রোলআউটে তিনটি নির্দিষ্ট নামের মডেল অন্তর্ভুক্ত রয়েছে: Llama 4 Scout, Llama 4 Maverick, এবং এখনও বিকাশে থাকা Llama 4 Behemoth। Meta ইঙ্গিত দিয়েছে যে এই মডেলগুলির ভিত্তি বিশাল পরিমাণে লেবেলবিহীন টেক্সট, চিত্রাবলী এবং ভিডিও সামগ্রী সমন্বিত বিস্তৃত প্রশিক্ষণ ডেটাসেটের উপর নির্ভর করে। এই মাল্টি-মোডাল প্রশিক্ষণ পদ্ধতির উদ্দেশ্য হল মডেলগুলিকে একটি পরিশীলিত এবং ‘বিস্তৃত ভিজ্যুয়াল বোঝাপড়া’ দিয়ে সজ্জিত করা, তাদের ক্ষমতাগুলি সম্পূর্ণরূপে টেক্সট-ভিত্তিক মিথস্ক্রিয়া ছাড়িয়ে প্রসারিত করা।
Llama 4-এর বিকাশের গতিপথ দ্রুত বিকশিত AI সেক্টরের মধ্যে প্রতিযোগিতামূলক চাপ দ্বারা প্রভাবিত হয়েছে বলে মনে হচ্ছে। রিপোর্টগুলি পরামর্শ দেয় যে আন্তর্জাতিক AI ল্যাবরেটরিগুলি থেকে ওপেন মডেলগুলির উত্থান এবং উল্লেখযোগ্য দক্ষতা, বিশেষ করে চীনা ল্যাব DeepSeek-এর উদ্ধৃতি দিয়ে, Meta-কে তার নিজস্ব উন্নয়ন প্রচেষ্টা ত্বরান্বিত করতে প্ররোচিত করেছে। এটা বোঝা যায় যে Meta উল্লেখযোগ্য সংস্থান উৎসর্গ করেছে, সম্ভাব্যভাবে বিশেষায়িত দল বা ‘ওয়ার রুম’ প্রতিষ্ঠা করেছে, DeepSeek-এর মতো প্রতিযোগীদের দ্বারা নিযুক্ত পদ্ধতিগুলি বিশ্লেষণ এবং বোঝার জন্য, বিশেষ করে এমন কৌশলগুলিতে ফোকাস করে যা সফলভাবে উন্নত AI মডেলগুলি চালানো এবং স্থাপন করার সাথে সম্পর্কিত কম্পিউটেশনাল খরচ কমিয়েছে। এই প্রতিযোগিতামূলক অন্তর্নিহিত স্রোত প্রধান প্রযুক্তি খেলোয়াড় এবং গবেষণা প্রতিষ্ঠানগুলির মধ্যে AI কর্মক্ষমতা এবং অপারেশনাল দক্ষতা উভয় ক্ষেত্রেই যুগান্তকারী অর্জনের তীব্র দৌড়কে তুলে ধরে।
নতুন Llama 4 লাইনআপ জুড়ে অ্যাক্সেসযোগ্যতা পরিবর্তিত হয়। Scout এবং Maverick ডেভেলপার সম্প্রদায় এবং জনসাধারণের জন্য প্রতিষ্ঠিত চ্যানেলগুলির মাধ্যমে খোলাখুলিভাবে উপলব্ধ করা হচ্ছে, যার মধ্যে Meta-র নিজস্ব Llama.com পোর্টাল এবং অংশীদার প্ল্যাটফর্ম যেমন বহুল ব্যবহৃত AI ডেভেলপমেন্ট হাব, Hugging Face অন্তর্ভুক্ত রয়েছে। এই উন্মুক্ত প্রাপ্যতা Meta-র তার Llama মডেলগুলির চারপাশে একটি বৃহত্তর ইকোসিস্টেম গড়ে তোলার কৌশলকে জোরদার করে। যাইহোক, Behemoth, বর্তমান সিরিজের সবচেয়ে শক্তিশালী মডেল হিসাবে অবস্থান করছে, এটি এখনও বিকাশের অধীনে রয়েছে এবং সাধারণ ব্যবহারের জন্য এখনও প্রকাশ করা হয়নি। একই সাথে, Meta এই নতুন ক্ষমতাগুলিকে তার ব্যবহারকারী-মুখী পণ্যগুলিতে একীভূত করছে। কোম্পানি ঘোষণা করেছে যে তার মালিকানাধীন AI সহকারী, Meta AI, যা WhatsApp, Messenger, এবং Instagram-এর মতো তার অ্যাপ্লিকেশনগুলির স্যুট জুড়ে কাজ করে, Llama 4-এর শক্তিকে কাজে লাগানোর জন্য আপগ্রেড করা হয়েছে। এই ইন্টিগ্রেশনটি চল্লিশটি দেশে রোল আউট করা হচ্ছে, যদিও উন্নত মাল্টিমোডাল বৈশিষ্ট্যগুলি (টেক্সট, চিত্র এবং সম্ভাব্য অন্যান্য ডেটা প্রকারের সমন্বয়) প্রাথমিকভাবে মার্কিন যুক্তরাষ্ট্রের মধ্যে ইংরেজি ভাষার ব্যবহারকারীদের জন্য সীমাবদ্ধ।
লাইসেন্সিং ল্যান্ডস্কেপ নেভিগেট করা
কিছু মডেলের জন্য উন্মুক্ততার উপর জোর দেওয়া সত্ত্বেও, Llama 4-এর স্থাপন এবং ব্যবহার নির্দিষ্ট লাইসেন্সিং শর্তাবলী দ্বারা পরিচালিত হয় যা নির্দিষ্ট ডেভেলপার এবং সংস্থাগুলির জন্য বাধা সৃষ্টি করতে পারে। একটি উল্লেখযোগ্য বিধিনিষেধ স্পষ্টভাবে European Union-এর মধ্যে অবস্থিত বা তাদের প্রধান ব্যবসার স্থান থাকা ব্যবহারকারী এবং সংস্থাগুলিকে Llama 4 মডেলগুলি ব্যবহার বা বিতরণ করতে নিষেধ করে। এই ভৌগলিক সীমাবদ্ধতা সম্ভবত EU-এর ব্যাপক AI Act এবং GDPR-এর মতো বিদ্যমান ডেটা গোপনীয়তা প্রবিধান দ্বারা বাধ্যতামূলক কঠোর শাসনের প্রয়োজনীয়তার প্রত্যক্ষ পরিণতি। এই জটিল নিয়ন্ত্রক কাঠামো নেভিগেট করা অঞ্চলে Meta-র স্থাপন কৌশলকে রূপদানকারী একটি উল্লেখযোগ্য বিবেচনা বলে মনে হচ্ছে।
অধিকন্তু, পূর্ববর্তী Llama পুনরাবৃত্তিগুলির লাইসেন্সিং কাঠামোর প্রতিধ্বনি করে, Meta বৃহৎ আকারের উদ্যোগগুলির উপর একটি শর্ত আরোপ করে। 700 মিলিয়নেরও বেশি মাসিক সক্রিয় ব্যবহারকারীর গর্বকারী সংস্থাগুলিকে সরাসরি Meta-র কাছ থেকে একটি বিশেষ লাইসেন্সের জন্য আনুষ্ঠানিকভাবে অনুরোধ করতে হবে। গুরুত্বপূর্ণভাবে, এই লাইসেন্স মঞ্জুর বা অস্বীকার করার সিদ্ধান্ত সম্পূর্ণরূপে Meta-র ‘একক বিবেচনার’ মধ্যে থাকে। এই ধারাটি কার্যকরভাবে Meta-কে নিয়ন্ত্রণ দেয় যে কীভাবে তার সবচেয়ে উন্নত মডেলগুলি সম্ভাব্য প্রতিযোগিতামূলক বৃহৎ প্রযুক্তি সংস্থাগুলি দ্বারা ব্যবহার করা হয়, Llama ইকোসিস্টেমের অংশগুলির ‘উন্মুক্ত’ প্রকৃতি সত্ত্বেও কৌশলগত তত্ত্বাবধানের একটি ডিগ্রি বজায় রাখে। এই লাইসেন্সিং সূক্ষ্মতাগুলি উচ্চ-স্টেকের AI ডোমেনে উন্মুক্ত উদ্ভাবনকে উৎসাহিত করা এবং কৌশলগত নিয়ন্ত্রণ বজায় রাখার মধ্যে জটিল মিথস্ক্রিয়াকে জোরদার করে।
লঞ্চের সাথে তার অফিসিয়াল যোগাযোগে, Meta Llama 4 রিলিজকে একটি গুরুত্বপূর্ণ মুহূর্ত হিসাবে ফ্রেম করেছে। ‘এই Llama 4 মডেলগুলি Llama ইকোসিস্টেমের জন্য একটি নতুন যুগের সূচনা চিহ্নিত করে,’ কোম্পানি একটি ব্লগ পোস্টে বলেছে, আরও যোগ করেছে, ‘এটি Llama 4 সংগ্রহের জন্য কেবল শুরু।’ এই দূরদর্শী বিবৃতিটি Llama 4 প্রজন্মের মধ্যে অব্যাহত উন্নয়ন এবং সম্প্রসারণের জন্য একটি রোডম্যাপের পরামর্শ দেয়, এই লঞ্চটিকে চূড়ান্ত গন্তব্য হিসাবে নয় বরং AI অগ্রগতির একটি চলমান যাত্রায় একটি উল্লেখযোগ্য মাইলফলক হিসাবে অবস্থান করে।
আর্কিটেকচারাল উদ্ভাবন: Mixture of Experts (MoE) পদ্ধতি
Llama 4 সিরিজকে আলাদা করার একটি মূল প্রযুক্তিগত বৈশিষ্ট্য হল এর Mixture of Experts (MoE) আর্কিটেকচার গ্রহণ। Meta হাইলাইট করে যে এটি Llama পরিবারের মধ্যে প্রথম দল যা এই নির্দিষ্ট ডিজাইন প্যারাডাইম ব্যবহার করে। MoE পদ্ধতিটি বৃহৎ ভাষা মডেলগুলি কীভাবে গঠন এবং প্রশিক্ষিত হয় তার একটি উল্লেখযোগ্য পরিবর্তন উপস্থাপন করে, যা সম্পদ-নিবিড় প্রশিক্ষণ পর্ব এবং ব্যবহারকারীর প্রশ্নের প্রতিক্রিয়া জানানোর সময় অপারেশনাল পর্ব উভয় ক্ষেত্রেই কম্পিউটেশনাল দক্ষতার ক্ষেত্রে উল্লেখযোগ্য সুবিধা প্রদান করে।
এর মূলে, একটি MoE আর্কিটেকচার জটিল ডেটা প্রক্রিয়াকরণ কাজগুলিকে ছোট, আরও পরিচালনাযোগ্য সাবটাস্কে পচিয়ে কাজ করে। এই সাবটাস্কগুলি তখন বুদ্ধিমত্তার সাথে ‘experts’ হিসাবে উল্লেখ করা ছোট, বিশেষায়িত নিউরাল নেটওয়ার্ক উপাদানগুলির একটি সংগ্রহে রুট বা অর্পণ করা হয়। প্রতিটি expert সাধারণত নির্দিষ্ট ধরণের ডেটা বা কাজগুলিতে দক্ষতা অর্জনের জন্য প্রশিক্ষিত হয়। আর্কিটেকচারের মধ্যে একটি গেটিং মেকানিজম নির্ধারণ করে যে কোন expert বা experts-এর সংমিশ্রণ ইনপুট ডেটা বা কোয়েরির একটি নির্দিষ্ট অংশ পরিচালনা করার জন্য সবচেয়ে উপযুক্ত। এটি ঐতিহ্যগত ডেনস মডেল আর্কিটেকচারের সাথে বৈপরীত্যপূর্ণ যেখানে পুরো মডেলটি ইনপুটের প্রতিটি অংশ প্রক্রিয়া করে।
দক্ষতার লাভ এই সত্য থেকে উদ্ভূত হয় যে মডেলের মোট প্যারামিটারের কেবল একটি উপসেট (নির্বাচিত experts-এর অন্তর্গত ‘সক্রিয়’ প্যারামিটার) যে কোনও প্রদত্ত কাজের জন্য নিযুক্ত থাকে। এই নির্বাচনী অ্যাক্টিভেশন একটি বিশাল, ডেনস মডেলের সম্পূর্ণতা সক্রিয় করার তুলনায় কম্পিউটেশনাল লোডকে উল্লেখযোগ্যভাবে হ্রাস করে।
Meta এই আর্কিটেকচারটি কার্যকরভাবে চিত্রিত করার জন্য নির্দিষ্ট বিবরণ প্রদান করেছে:
- Maverick: এই মডেলটির একটি উল্লেখযোগ্য মোট প্যারামিটার সংখ্যা 400 বিলিয়ন। যাইহোক, 128টি স্বতন্ত্র ‘experts’ অন্তর্ভুক্ত MoE ডিজাইনের জন্য ধন্যবাদ, প্রক্রিয়াকরণের সময় যে কোনও নির্দিষ্ট সময়ে কেবল 17 বিলিয়ন প্যারামিটার সক্রিয়ভাবে নিযুক্ত থাকে। প্যারামিটারগুলি প্রায়শই শেখার এবং সমস্যা সমাধানের জটিলতার জন্য একটি মডেলের ক্ষমতার একটি রুক্ষ প্রক্সি হিসাবে বিবেচিত হয়।
- Scout: একইভাবে গঠিত, Scout-এর 109 বিলিয়ন মোট প্যারামিটার রয়েছে যা 16টি ‘experts’-এর মধ্যে বিতরণ করা হয়েছে, যার ফলে Maverick-এর মতো একই 17 বিলিয়ন সক্রিয় প্যারামিটার রয়েছে।
এই আর্কিটেকচারাল পছন্দ Meta-কে বিশাল সামগ্রিক ক্ষমতা (উচ্চ মোট প্যারামিটার সংখ্যা) সহ মডেল তৈরি করতে দেয় যখন ইনফারেন্স (কোয়েরি প্রক্রিয়াকরণ) এর জন্য পরিচালনাযোগ্য কম্পিউটেশনাল চাহিদা বজায় রাখে, যা তাদের স্কেলে স্থাপন এবং পরিচালনা করার জন্য সম্ভাব্যভাবে আরও ব্যবহারিক করে তোলে।
পারফরম্যান্স বেঞ্চমার্ক এবং মডেল স্পেশালাইজেশন
Meta তার নতুন মডেলগুলিকে প্রতিযোগিতামূলকভাবে অবস্থান করিয়েছে, OpenAI, Google, এবং Anthropic-এর মতো প্রতিদ্বন্দ্বীদের বিশিষ্ট মডেলগুলির বিরুদ্ধে Llama 4-এর তুলনা করে অভ্যন্তরীণ বেঞ্চমার্ক ফলাফল প্রকাশ করেছে।
Maverick, Meta দ্বারা ‘সাধারণ সহকারী এবং চ্যাট’ অ্যাপ্লিকেশনগুলির জন্য সর্বোত্তম হিসাবে মনোনীত, যার মধ্যে সৃজনশীল লেখা এবং কোড জেনারেশনের মতো কাজগুলি অন্তর্ভুক্ত রয়েছে, নির্দিষ্ট বেঞ্চমার্কগুলিতে OpenAI-এর GPT-4o এবং Google-এর Gemini 2.0-এর মতো মডেলগুলির তুলনায় উচ্চতর কর্মক্ষমতা প্রদর্শন করে বলে জানা গেছে। এই বেঞ্চমার্কগুলি কোডিং দক্ষতা, যৌক্তিক যুক্তি, বহুভাষিক ক্ষমতা, পাঠ্যের দীর্ঘ ক্রম পরিচালনা (লং-কনটেক্সট), এবং চিত্র বোঝার মতো ক্ষেত্রগুলিকে কভার করে। যাইহোক, Meta-র নিজস্ব ডেটা ইঙ্গিত দেয় যে Maverick বর্তমানে উপলব্ধ সবচেয়ে সাম্প্রতিক এবং সবচেয়ে শক্তিশালী মডেলগুলির ক্ষমতাকে ধারাবাহিকভাবে ছাড়িয়ে যায় না, যেমন Google-এর Gemini 2.5 Pro, Anthropic-এর Claude 3.7 Sonnet, বা OpenAI-এর প্রত্যাশিত GPT-4.5। এটি পরামর্শ দেয় যে Maverick উচ্চ-পারফরম্যান্স স্তরে একটি শক্তিশালী অবস্থানের লক্ষ্য রাখে তবে প্রতিযোগীদের নতুন ফ্ল্যাগশিপ মডেলগুলির বিরুদ্ধে সমস্ত মেট্রিক জুড়ে পরম শীর্ষস্থান দাবি নাও করতে পারে।
Scout, অন্যদিকে, বিভিন্ন শক্তির জন্য তৈরি করা হয়েছে। এর ক্ষমতাগুলি বিস্তৃত নথিগুলির সংক্ষিপ্তকরণ এবং বৃহৎ, জটিল কোডবেসগুলির উপর যুক্তি প্রয়োগ করার মতো কাজগুলিতে হাইলাইট করা হয়েছে। Scout-এর একটি বিশেষভাবে অনন্য এবং সংজ্ঞায়িত বৈশিষ্ট্য হল এর ব্যতিক্রমীভাবে বড় কনটেক্সট উইন্ডো, যা 10 মিলিয়ন টোকেন পর্যন্ত পরিচালনা করতে সক্ষম। টোকেন হল টেক্সট বা কোডের মৌলিক একক যা ভাষা মডেলগুলি প্রক্রিয়া করে (যেমন, একটি শব্দ ‘un-der-stand-ing’-এর মতো বেশ কয়েকটি টোকেনে বিভক্ত হতে পারে)। একটি 10-মিলিয়ন-টোকেন কনটেক্সট উইন্ডো, ব্যবহারিক পরিভাষায়, একই সাথে বিপুল পরিমাণ তথ্য গ্রহণ এবং প্রক্রিয়া করার ক্ষমতার অনুবাদ করে – সম্ভাব্যভাবে লক্ষ লক্ষ শব্দ বা কোডের সম্পূর্ণ লাইব্রেরির সমতুল্য। এটি Scout-কে অত্যন্ত দীর্ঘ নথি বা জটিল প্রোগ্রামিং প্রকল্প জুড়ে সুসংগততা এবং বোঝাপড়া বজায় রাখতে দেয়, যা ছোট কনটেক্সট উইন্ডো সহ মডেলগুলির জন্য একটি চ্যালেঞ্জিং কীর্তি। এটি এই বিশাল পাঠ্য ইনপুটের পাশাপাশি চিত্রগুলিও প্রক্রিয়া করতে পারে।
এই মডেলগুলি চালানোর জন্য হার্ডওয়্যার প্রয়োজনীয়তাগুলি তাদের স্কেল এবং আর্কিটেকচারকে প্রতিফলিত করে। Meta-র অনুমান অনুসারে:
- Scout তুলনামূলকভাবে দক্ষ, একটি একক হাই-এন্ড Nvidia H100 GPU-তে চলতে সক্ষম।
- Maverick, MoE দক্ষতা সত্ত্বেও এর বৃহত্তর মোট প্যারামিটার সংখ্যার সাথে, আরও উল্লেখযোগ্য সংস্থান দাবি করে, যার জন্য একটি Nvidia H100 DGX সিস্টেম (যাতে সাধারণত একাধিক H100 GPU থাকে) বা সমতুল্য কম্পিউটেশনাল শক্তি প্রয়োজন।
আসন্ন Behemoth মডেলটির জন্য আরও শক্তিশালী হার্ডওয়্যার পরিকাঠামোর প্রয়োজন হবে বলে আশা করা হচ্ছে। Meta প্রকাশ করেছে যে Behemoth 288 বিলিয়ন সক্রিয় প্যারামিটার (প্রায় দুই ট্রিলিয়ন মোট প্যারামিটারের মধ্যে, 16টি experts জুড়ে বিস্তৃত) দিয়ে ডিজাইন করা হয়েছে। প্রাথমিক অভ্যন্তরীণ বেঞ্চমার্কগুলি Behemoth-কে GPT-4.5, Claude 3.7 Sonnet, এবং Gemini 2.0 Pro (যদিও উল্লেখযোগ্যভাবে, আরও উন্নত Gemini 2.5 Pro নয়) এর মতো মডেলগুলিকে STEM (Science, Technology, Engineering, and Mathematics) দক্ষতার উপর দৃষ্টি নিবদ্ধ করা বেশ কয়েকটি মূল্যায়নে ছাড়িয়ে যাওয়ার অবস্থান দেয়, বিশেষ করে জটিল গাণিতিক সমস্যা সমাধানের মতো ক্ষেত্রগুলিতে।
এটি লক্ষণীয়, যাইহোক, বর্তমানে ঘোষিত Llama 4 মডেলগুলির কোনওটিই OpenAI-এর উন্নয়নমূলক o1 এবং o3-mini ধারণার মতো ‘রিজনিং’ মডেল হিসাবে স্পষ্টভাবে ডিজাইন করা হয়নি। এই বিশেষায়িত রিজনিং মডেলগুলি সাধারণত তাদের উত্তরগুলির অভ্যন্তরীণ ফ্যাক্ট-চেকিং এবং পুনরাবৃত্তিমূলক পরিমার্জনের জন্য প্রক্রিয়াগুলিকে অন্তর্ভুক্ত করে, যা সম্ভাব্যভাবে আরও নির্ভরযোগ্য এবং নির্ভুল প্রতিক্রিয়ার দিকে পরিচালিত করে, বিশেষ করে ফ্যাকচুয়াল প্রশ্নের জন্য। ট্রেড-অফ প্রায়শই বিলম্বিতা বৃদ্ধি করে, যার অর্থ হল Llama 4 পরিবারের মতো আরও ঐতিহ্যবাহী বৃহৎ ভাষা মডেলগুলির তুলনায় প্রতিক্রিয়া তৈরি করতে তাদের বেশি সময় লাগে, যা দ্রুত প্রজন্মকে অগ্রাধিকার দেয়।
কথোপকথনের সীমানা সামঞ্জস্য করা: বিতর্কিত বিষয়
Llama 4 লঞ্চের একটি আকর্ষণীয় দিক হল Meta-র মডেলগুলির প্রতিক্রিয়া আচরণের ইচ্ছাকৃত টিউনিং, বিশেষ করে সংবেদনশীল বা বিতর্কিত বিষয়গুলির বিষয়ে। কোম্পানি স্পষ্টভাবে বলেছে যে এটি Llama 4 মডেলগুলিকে তাদের পূর্বসূরি Llama 3 পরিবারের তুলনায় ‘বিতর্কিত’ প্রশ্নের উত্তর দিতে অস্বীকার করার সম্ভাবনা কম করার জন্য সামঞ্জস্য করেছে।
Meta অনুসারে, Llama 4 এখন ‘বিতর্কিত’ রাজনৈতিক এবং সামাজিক বিষয়গুলির সাথে জড়িত হতে বেশি আগ্রহী যেখানে পূর্ববর্তী সংস্করণগুলি আপত্তি জানাতে পারত বা একটি জেনেরিক প্রত্যাখ্যান প্রদান করত। অধিকন্তু, কোম্পানি দাবি করে যে Llama 4 কোন ধরণের প্রম্পটগুলির সাথে জড়িত হতে সম্পূর্ণ অস্বীকার করবে সে সম্পর্কে একটি ‘নাটকীয়ভাবে আরও ভারসাম্যপূর্ণ’ পদ্ধতি প্রদর্শন করে। বিবৃত লক্ষ্য হল বিচার আরোপ না করে সহায়ক এবং বাস্তবসম্মত প্রতিক্রিয়া প্রদান করা।
একজন Meta মুখপাত্র TechCrunch-কে এই পরিবর্তনের বিষয়ে বিস্তারিত জানিয়েছেন: ‘[Y]ou can count on [Llama 4] to provide helpful, factual responses without judgment… [W]e’re continuing to make Llama more responsive so that it answers more questions, can respond to a variety of different viewpoints […] and doesn’t favor some views over others.’
এই সামঞ্জস্যটি কৃত্রিম বুদ্ধিমত্তা সিস্টেমে অনুভূত পক্ষপাতকে ঘিরে চলমান জন এবং রাজনৈতিক বিতর্কের পটভূমিতে ঘটে। নির্দিষ্ট রাজনৈতিক দল এবং ভাষ্যকাররা, যার মধ্যে Trump প্রশাসনের সাথে যুক্ত বিশিষ্ট ব্যক্তিরা যেমন Elon Musk এবং ভেঞ্চার ক্যাপিটালিস্ট David Sacks অন্তর্ভুক্ত, অভিযোগ করেছেন যে জনপ্রিয় AI চ্যাটবটগুলি একটি রাজনৈতিক পক্ষপাত প্রদর্শন করে, যা প্রায়শই ‘woke’ হিসাবে বর্ণনা করা হয়, অভিযোগ করা হয় যে রক্ষণশীল দৃষ্টিভঙ্গি সেন্সর করে বা একটি উদার দৃষ্টিভঙ্গির দিকে তির্যক তথ্য উপস্থাপন করে। Sacks, উদাহরণস্বরূপ, অতীতে OpenAI-এর ChatGPT-কে বিশেষভাবে সমালোচনা করেছেন, দাবি করেছেন যে এটি ‘woke হতে প্রোগ্রাম করা হয়েছিল’ এবং রাজনৈতিক বিষয়ে অবিশ্বস্ত ছিল।
যাইহোক, AI-তে সত্যিকারের নিরপেক্ষতা অর্জন এবং পক্ষপাত দূর করার চ্যালেঞ্জটি প্রযুক্তিগত সম্প্রদায়ের মধ্যে একটি অবিশ্বাস্যভাবে জটিল এবং অবিরাম সমস্যা (‘intractable’) হিসাবে ব্যাপকভাবে স্বীকৃত। AI মডেলগুলি তারা যে বিশাল ডেটাসেটগুলিতে প্রশিক্ষিত হয় সেগুলি থেকে প্যাটার্ন এবং অ্যাসোসিয়েশনগুলি শেখে এবং এই ডেটাসেটগুলি অনিবার্যভাবে মানব-উত্পাদিত পাঠ্য এবং চিত্রগুলিতে উপস্থিত পক্ষপাতগুলিকে প্রতিফলিত করে। নিখুঁতভাবে নিরপেক্ষ বা রাজনৈতিকভাবে নিরপেক্ষ AI তৈরি করার প্রচেষ্টা, এমনকি স্পষ্টভাবে এটির জন্য লক্ষ্যযুক্ত সংস্থাগুলির দ্বারাও, কঠিন প্রমাণিত হয়েছে। Elon Musk-এর নিজস্ব AI উদ্যোগ, xAI, একটি চ্যাটবট বিকাশে চ্যালেঞ্জের মুখোমুখি হয়েছে বলে জানা গেছে যা অন্যদের উপর নির্দিষ্ট রাজনৈতিক অবস্থানকে সমর্থন করা এড়িয়ে যায়।
অন্তর্নিহিত প্রযুক্তিগত অসুবিধা সত্ত্বেও, Meta এবং OpenAI সহ প্রধান AI ডেভেলপারদের মধ্যে প্রবণতা বিতর্কিত বিষয়গুলি এড়াতে মডেলগুলিকে সামঞ্জস্য করার দিকে অগ্রসর হচ্ছে বলে মনে হচ্ছে। এর মধ্যে ক্ষতিকারক বা প্রকাশ্যে পক্ষপাতদুষ্ট বিষয়বস্তুর প্রজন্মকে প্রশমিত করার চেষ্টা করার সময় পূর্বের অনুমোদিত সীমার চেয়ে বিস্তৃত প্রশ্নের সাথে জড়িত থাকার অনুমতি দেওয়ার জন্য সুরক্ষা ফিল্টার এবং প্রতিক্রিয়া নির্দেশিকাগুলি সাবধানে ক্যালিব্রেট করা জড়িত। এই ফাইন-টিউনিং সূক্ষ্ম ভারসাম্যমূলক কাজটি প্রতিফলিত করে যা AI সংস্থাগুলিকে উন্মুক্ত আলোচনা প্রচার, ব্যবহারকারীর নিরাপত্তা নিশ্চিত করা এবং তাদের শক্তিশালী প্রযুক্তিগুলির আশেপাশের জটিল সামাজিক-রাজনৈতিক প্রত্যাশাগুলি নেভিগেট করার মধ্যে সম্পাদন করতে হবে। Llama 4-এর প্রকাশ, বিতর্কিত প্রশ্নগুলি পরিচালনা করার ক্ষেত্রে এর স্পষ্টভাবে উল্লিখিত সামঞ্জস্য সহ, এই জটিল ল্যান্ডস্কেপ নেভিগেট করার ক্ষেত্রে Meta-র সর্বশেষ পদক্ষেপকে প্রতিনিধিত্ব করে।