লার্জ ল্যাঙ্গুয়েজ মডেলের (এলএলএম) ক্ষেত্রে একটি গুরুত্বপূর্ণ পরিবর্তন দেখা গেছে, যেখানে গুগল একটি বিশিষ্ট খেলোয়াড় হিসেবে আত্মপ্রকাশ করেছে, অন্যদিকে মেটা এবং ওপেনএআই উল্লেখযোগ্য চ্যালেঞ্জের সম্মুখীন হচ্ছে। প্রাথমিকভাবে, ওপেনএআই তার যুগান্তকারী জিপিটি মডেলগুলির সাথে ক্ষেত্রটিতে আধিপত্য বিস্তার করেছিল, এলএলএম কর্মক্ষমতার জন্য নতুন মানদণ্ড স্থাপন করে। মেটা তাদের উন্মুক্ত-ওজন মডেলগুলি সরবরাহ করে একটি বড় স্থান অর্জন করেছে যা চিত্তাকর্ষক ক্ষমতার জাহির করে এবং তাদের সর্বজনীনভাবে অ্যাক্সেসযোগ্য কোডের অবাধ ব্যবহার, পরিবর্তন এবং স্থাপনার অনুমতি দিয়েছে।
তবে, এই প্রাথমিক আধিপত্য গুগল সহ অন্যান্য প্রযুক্তি জায়ান্টদের পিছিয়ে ফেলেছিল। এলএলএম-এর ভিত্তি স্থাপনকারী ট্রান্সফরমার আর্কিটেকচারের উপর গুগলের ২০১৭ সালের গুরুত্বপূর্ণ গবেষণা পত্র থাকা সত্ত্বেও, কোম্পানির প্রাথমিক প্রচেষ্টা ২০২৩ সালে বার্ডের বহুল সমালোচিত লঞ্চের কারণে চাপা পড়ে যায়।
সম্প্রতি, গুগলের কাছ থেকে শক্তিশালী নতুন এলএলএমের প্রবর্তনের সাথে সাথে মেটা এবং ওপেনএআই-এর অভিজ্ঞতার কারণে পরিস্থিতি পরিবর্তিত হয়েছে। এই পরিবর্তন এলএলএম ল্যান্ডস্কেপের গতিশীলতাকে উল্লেখযোগ্যভাবে পরিবর্তন করেছে।
মেটার লামা ৪: একটি ভুল পদক্ষেপ?
মেটা কর্তৃক শনিবার, ৫ই এপ্রিল লামা ৪-এর অপ্রত্যাশিত মুক্তি পুরো শিল্প জুড়ে ভ্রু কুঁচকে দিয়েছে।
সাপ্তাহিক ছুটির দিনে একটি প্রধান মডেল চালু করার সিদ্ধান্তটি প্রচলিত ছিল না, যার ফলে একটি নীরব অভ্যর্থনা হয়েছিল এবং পরবর্তী সপ্তাহের খবরের প্রবাহের মধ্যে ঘোষণাটি অস্পষ্ট হয়ে গিয়েছিল।
লামা ৪-এর কিছু শক্তি রয়েছে, যার মধ্যে এর মাল্টিমোডাল ক্ষমতা (ছবি, অডিও এবং অন্যান্য মোডালিটি পরিচালনা করা) এবং বিভিন্ন আকার এবং শক্তির সাথে তিনটি সংস্করণে (লামা ৪ বেহেমথ, ম্যাভেরিক এবং স্কাউট) এর উপলব্ধতা রয়েছে, তবে এর রোলআউট সমালোচিত হয়েছে। বিশেষত লামা ৪ স্কাউট সংস্করণে ১০ মিলিয়ন টোকেন পর্যন্ত একটি বড় প্রেক্ষাপট উইন্ডো রয়েছে, যা মডেলটিকে একক সেশনে প্রচুর পরিমাণে টেক্সট প্রক্রিয়া এবং তৈরি করতে সক্ষম করে।
তবে, এলএমএরেনা-তে মেটার র্যাঙ্কিং পদ্ধতি সম্পর্কে যখন অসঙ্গতি দেখা গিয়েছিল তখন মডেলটির অভ্যর্থনা তিক্ত হয়ে যায়, এটি এমন একটি প্ল্যাটফর্ম যা ব্যবহারকারীর ভোটের ভিত্তিতে এলএলএমগুলিকে স্থান দেয়। এটি আবিষ্কৃত হয়েছিল যে র্যাঙ্কিংয়ের জন্য ব্যবহৃত নির্দিষ্ট লামা ৪ মডেলটি সাধারণ জনগণের জন্য উপলব্ধ করা মডেল থেকে পৃথক ছিল। এলএমএরেনা জানিয়েছে যে মেটা ‘মানুষের পছন্দ অপ্টিমাইজ করার জন্য একটি কাস্টমাইজড মডেল’ সরবরাহ করেছে।
তদুপরি, লামা ৪ স্কাউটের ১০ মিলিয়ন-টোকেন প্রেক্ষাপট উইন্ডো সম্পর্কে মেটার দাবিগুলি সংশয়ের সাথে দেখা হয়েছিল। এই চিত্রের প্রযুক্তিগত নির্ভুলতা সত্ত্বেও, বেঞ্চমার্কগুলি প্রকাশ করেছে যে লামা ৪ দীর্ঘ-প্রসঙ্গ কর্মক্ষমতায় প্রতিদ্বন্দ্বী মডেলগুলির থেকে পিছিয়ে রয়েছে।
উদ্বেগ বাড়িয়ে মেটা লামা ৪ ‘যুক্তি’ বা ‘চিন্তাভাবনা’ মডেল প্রকাশ করা থেকে বিরত ছিল এবং ছোট রূপগুলি আটকে রেখেছিল, যদিও সংস্থাটি ইঙ্গিত দিয়েছে যে একটি যুক্তি মডেল আসছে।
এআই পরামর্শক সংস্থা গ্র্যাGradient ফ্লো-এর প্রতিষ্ঠাতা বেন লরিকা উল্লেখ করেছেন যে মেটা একটি আরও নিয়মতান্ত্রিক প্রকাশের স্ট্যান্ডার্ড অনুশীলন থেকে বিচ্যুত হয়েছে, যেখানে সমস্ত উপাদান সম্পূর্ণরূপে প্রস্তুত। এটি ইঙ্গিত দেয় যে মেটা সম্ভবত একটি নতুন মডেল প্রদর্শন করতে আগ্রহী ছিল, এমনকি যদি এতে যুক্তি মডেল এবং ছোট সংস্করণগুলির মতো প্রয়োজনীয় উপাদানগুলির অভাব থাকে।
ওপেনএআই-এর জিপিটি-৪.৫: একটি অকাল পশ্চাদপসরণ
ওপেনএআই সাম্প্রতিক মাসগুলোতে চ্যালেঞ্জের মুখোমুখি হয়েছে।
জিপিটি-৪.৫, ২৭শে ফেব্রুয়ারি একটি গবেষণা প্রিভিউ হিসাবে উন্মোচিত হয়েছিল, এটিকে কোম্পানির ‘এখনও পর্যন্ত চ্যাটের জন্য বৃহত্তম এবং সেরা মডেল’ হিসাবে অভিহিত করা হয়েছিল। ওপেনএআই-এর বেঞ্চমার্কগুলি ইঙ্গিত দিয়েছে যে জিপিটি-৪.৫ সাধারণত এর পূর্বসূরি জিপিটি-৪ও-এর চেয়ে ভাল পারফর্ম করেছে।
তবে, মডেলটির মূল্য কাঠামো সমালোচিত হয়েছিল। ওপেনএআই এপিআই অ্যাক্সেসের মূল্য প্রতি মিলিয়ন আউটপুট টোকেনের জন্য ১৫০ মার্কিন ডলার নির্ধারণ করেছে, যা জিপিটি-৪ও-এর প্রতি মিলিয়ন টোকেনের জন্য ১০ ডলার দামের তুলনায় ১৫ গুণ বেশি। এপিআই ডেভেলপারদের তাদের অ্যাপ্লিকেশন এবং পরিষেবাগুলিতে ওপেনএআই মডেলগুলি সংহত করতে সক্ষম করে।
লাইফ আর্কিটেক্টের এআই পরামর্শক এবং বিশ্লেষক অ্যালান ডি. থম্পসন অনুমান করেছেন যে জিপিটি-৪.৫ সম্ভবত ২০২৫ সালের প্রথম ত্রৈমাসিকে প্রকাশিত বৃহত্তম ঐতিহ্যবাহী এলএলএম ছিল, যার আনুমানিক ৫.৪ ট্রিলিয়ন প্যারামিটার ছিল। তিনি যুক্তি দিয়েছিলেন যে বর্তমান হার্ডওয়্যার সীমাবদ্ধতা বিবেচনা করে এত বিশাল স্কেলকে ন্যায্যতা দেওয়া কঠিন এবং একটি বৃহৎ ব্যবহারকারী বেসকে পরিবেশন করার ক্ষেত্রে উল্লেখযোগ্য চ্যালেঞ্জ তৈরি করে।
১৪ই এপ্রিল, ওপেনএআই এপিআই-এর মাধ্যমে তিন মাসেরও কম সময়ের মধ্যে জিপিটি-৪.৫ অ্যাক্সেস বন্ধ করার সিদ্ধান্ত ঘোষণা করেছে। জিপিটি-৪.৫ অ্যাক্সেসযোগ্য থাকবে, তবে এটি চ্যাটজিপিটি ইন্টারফেসের মাধ্যমে চ্যাটজিপিটি ব্যবহারকারীদের মধ্যে সীমাবদ্ধ থাকবে।
এই ঘোষণাটি জিপিটি-৪.১-এর প্রবর্তনের সাথে মিলে যায়, যা প্রতি মিলিয়ন টোকেনের জন্য ৮ ডলার মূল্যের একটি আরও সাশ্রয়ী মডেল। ওপেনএআই-এর বেঞ্চমার্কগুলি ইঙ্গিত দেয় যে জিপিটি-৪.১ সামগ্রিকভাবে জিপিটি-৪.৫ এর মতো সক্ষম নয়, যদিও এটি নির্দিষ্ট কোডিং বেঞ্চমার্কে উন্নত পারফরম্যান্স প্রদর্শন করে।
ওপেনএআই সম্প্রতি নতুন যুক্তিময় মডেল, o3 এবং o4-mini প্রকাশ করেছে, o3 মডেলটি বিশেষভাবে শক্তিশালী বেঞ্চমার্ক কর্মক্ষমতা প্রদর্শন করে। তবে, ব্যয় একটি উদ্বেগ রয়ে গেছে, কারণ o3-তে এপিআই অ্যাক্সেসের মূল্য প্রতি মিলিয়ন আউটপুট টোকেনের জন্য ৪০ ডলার।
গুগলের উত্থান: সুযোগ গ্রহণ
লামা ৪ এবং চ্যাটজিপিটি-৪.৫ এর মিশ্র অভ্যর্থনা প্রতিযোগীদের পুঁজি করার জন্য একটি সুযোগ তৈরি করেছে এবং তারা সেই সুযোগটি গ্রহণ করেছে।
লামা ৪-এর মেটার ঝামেলাপূর্ণ লঞ্চ ডেভেলপারদের ডিপসিক-ভি৩, গুগলের জেমিনি এবং আলিবাবার কুইন২.৫-এর মতো বিকল্প গ্রহণ করা থেকে বিরত করার সম্ভাবনা কম। এই এলএলএমগুলি, যা ২০২৪ সালের শেষের দিকে প্রবর্তিত হয়েছিল, এলএমএরেনা এবং HuggingFace লিডারবোর্ডগুলিতে পছন্দের উন্মুক্ত-ওজন মডেল হয়ে উঠেছে। তারা জনপ্রিয় বেঞ্চমার্কে লামা ৪-এর সাথে প্রতিদ্বন্দ্বিতা করে বা ছাড়িয়ে যায়, সাশ্রয়ী মূল্যের এপিআই অ্যাক্সেস সরবরাহ করে এবং কিছু ক্ষেত্রে ভোক্তা-গ্রেডের হার্ডওয়্যারে ডাউনলোড এবং ব্যবহারের জন্য উপলব্ধ।
তবে, এটি গুগলের কাটিং-এজ এলএলএম, জেমিনি ২.৫ প্রো যা সত্যিকারের মনোযোগ আকর্ষণ করেছে।
২৫শে মার্চ চালু হওয়া গুগল জেমিনি ২.৫ প্রো একটি ‘চিন্তাভাবনার মডেল’ যা জিপিটি-o1 এবং ডিপসিক-আর১-এর মতো, কার্যগুলি সম্পাদন করার জন্য স্ব-প্রম্পটিং ব্যবহার করে যুক্তি দেয়। জেমিনি ২.৫ প্রো মাল্টিমোডাল, এতে এক মিলিয়ন টোকেনের প্রেক্ষাপট উইন্ডো রয়েছে এবং এটি গভীর গবেষণা সমর্থন করে।
জেমিনি ২.৫ দ্রুত বেঞ্চমার্কে বিজয় অর্জন করেছে, যার মধ্যে সিম্পলবেঞ্চে শীর্ষ স্থান (যদিও এটি ১৬ই এপ্রিল ওপেনএআই-এর o3-এর কাছে সেই অবস্থানটি ছেড়ে দিয়েছে) এবং আর্টিফিশিয়াল অ্যানালাইসিসের সম্মিলিত এআই ইন্টেলিজেন্স ইনডেক্সে শীর্ষ স্থান অর্জন করেছে। জেমিনি ২.৫ প্রো বর্তমানে এলএমএরেনাতে শীর্ষস্থান ধরে রেখেছে। ১৪ই এপ্রিল পর্যন্ত, গুগল মডেলগুলি এলএমএরেনার শীর্ষ ১০টি স্লটের মধ্যে ৫টি দখল করেছে, যার মধ্যে রয়েছে জেমিনি ২.৫ প্রো, জেমিনি ২.০-এর তিনটি রূপ এবং জেমিনি ৩-২৭বি।
এর চিত্তাকর্ষক পারফরম্যান্স ছাড়াও, গুগল একটি মূল্য নেতাও। গুগল জেমিনি ২.৫ বর্তমানে গুগল এর জেমিনি অ্যাপ এবং গুগল এর এআই স্টুডিও ওয়েবসাইটের মাধ্যমে বিনামূল্যে ব্যবহারের জন্য উপলব্ধ। গুগল এর এপিআই মূল্যও প্রতিযোগিতামূলক, জেমিনি ২.৫ প্রো প্রতি মিলিয়ন আউটপুট টোকেনের জন্য ১০ ডলার এবং জেমিনি ২.০ ফ্ল্যাশ প্রতি মিলিয়ন টোকেনের জন্য মাত্র ৪০ সেন্ট মূল্যে উপলব্ধ।
লরিকা উল্লেখ করেছেন যে উচ্চ-ভলিউম যুক্তির কাজের জন্য, তিনি প্রায়শই ডিপসিক-আর১ বা গুগল জেমিনি বেছে নেন, তবে ওপেনএআই মডেলগুলি ব্যবহার করার জন্য মূল্যের আরও যত্ন সহকারে বিবেচনা করা প্রয়োজন।
মেটা এবং ওপেনএআই অগত্যা পতনের দ্বারপ্রান্তে না থাকলেও, ওপেনএআই চ্যাটজিপিটির জনপ্রিয়তা থেকে উপকৃত হয়েছে, যা রিপোর্ট অনুসারে এক বিলিয়ন ব্যবহারকারীকে গর্বিত করে। তা সত্ত্বেও, জেমিনির শক্তিশালী র্যাঙ্কিং এবং বেঞ্চমার্ক পারফরম্যান্স এলএলএম ল্যান্ডস্কেপের একটি পরিবর্তন নির্দেশ করে, যা বর্তমানে গুগলকে সমর্থন করে।