সর্বম এআই-এর যুগান্তকারী এলএলএম

সারভাম এআই (Sarvam AI), বেঙ্গালুরু-ভিত্তিক একটি উদ্ভাবনী স্টার্টআপ, ভারতীয় সরকারের মর্যাদাপূর্ণ ইন্ডিয়াএআই (IndiaAI) মিশনের অধীনে নির্বাচিত হয়ে এআই (AI) ল্যান্ডস্কেপে নিজেকে অগ্রগামী হিসেবে প্রতিষ্ঠিত করেছে। সংস্থাটি সম্প্রতি তাদের ফ্ল্যাগশিপ লার্জ ল্যাঙ্গুয়েজ মডেল (LLM), সারভাম-এম (Sarvam-M) উন্মোচন করেছে, যা ভারতীয় প্রেক্ষাপটে এআই (AI) সক্ষমতার একটি উল্লেখযোগ্য অগ্রগতি।

২৪ বিলিয়ন প্যারামিটারের এই বহুভাষিক এলএলএম (LLM) এআই (AI) প্রযুক্তির সীমানা প্রসারিত করতে সারভাম এআই-এর (Sarvam AI) প্রতিশ্রুতির প্রমাণ। ফরাসি এআই (AI) পাওয়ার হাউস মিস্ট্রাল এআই (Mistral AI) দ্বারা ডেভেলপ করা একটি ওপেন-ওয়েট এআই (AI) মডেল মিস্ট্রাল স্মলের (Mistral Small) ভিত্তির ওপর নির্মিত, সারভাম-এম (Sarvam-M) একটি হাইব্রিড-রিজনিং পদ্ধতি অন্তর্ভুক্ত করে, যা এটিকে বিভিন্ন টেক্সট-ভিত্তিক কাজগুলিতে দক্ষতা অর্জনে সক্ষম করে।

সারভাম-এম (Sarvam-M)-এর ডিজাইনটি বিভিন্ন ধরনের ব্যবহারের ক্ষেত্রে পূরণ করার জন্য তৈরি করা হয়েছে, যা বিভিন্ন শিল্পে একটি মূল্যবান টুল হিসাবে এর বহুমুখিতা প্রতিষ্ঠা করে। অত্যাধুনিক কথোপকথনমূলক এজেন্টদের ক্ষমতা দেওয়া থেকে শুরু করে, যা স্বাভাবিক এবং প্রসঙ্গ-সচেতন সংলাপে জড়িত হতে পারে,seamless অনুবাদ পরিষেবা প্রদান করে যা ভাষাগত বিভাজন দূর করে, সারভাম-এম (Sarvam-M) যোগাযোগ এবং তথ্যের অ্যাক্সেসে বিপ্লব ঘটাতে প্রস্তুত।

তাছাড়া, মডেলটির সম্ভাবনা শিক্ষার ক্ষেত্রেও বিস্তৃত, যেখানে এটি একটি গতিশীল শিক্ষামূলক সরঞ্জাম হিসাবে কাজ করতে পারে, ব্যক্তিগতকৃত শিক্ষণ অভিজ্ঞতা প্রদান করতে পারে এবং জটিল বিষয়গুলির গভীরতর বোঝাপড়া তৈরি করতে সহায়তা করতে পারে। এই অভিযোজনযোগ্যতা সারভাম-এমকে (Sarvam-M) ব্যক্তি এবং সংস্থা উভয়ের জন্যই একটি শক্তিশালী সম্পদে পরিণত করেছে, যারা এআই-এর (AI) পরিবর্তনমূলক ক্ষমতাকে কাজে লাগাতে চায়।

কার্যকারিতা

সারভাম-এম (Sarvam-M) বেশ কয়েকটি গুরুত্বপূর্ণ ক্ষেত্রে ব্যতিক্রমী দক্ষতা প্রদর্শন করেছে, ভারতীয় ভাষা, গাণিতিক যুক্তি এবং প্রোগ্রামিংয়ের কাজগুলিতে নতুন পারফরম্যান্সের মানদণ্ড তৈরি করেছে। এই অর্জনগুলি ভারতীয় বাজারের নির্দিষ্ট চাহিদা এবং চ্যালেঞ্জগুলি পূরণ করার মডেলটির ক্ষমতাকে আরও শক্তিশালী করে।

ভারতীয় ভাষা, গণিত এবং প্রোগ্রামিংয়ে শ্রেষ্ঠত্ব

এআই (AI) মডেলটি ভারতীয় ভাষার মানদণ্ডে তার বেস মডেলের তুলনায় গড়ে ২০% উন্নতি দেখিয়েছে, যা এই ভাষাগুলির উন্নত বোঝাপড়া এবং সাবলীলতাকে তুলে ধরে। এই উন্নতি বিভিন্ন ভাষাগত প্রেক্ষাপটে আরও নির্ভুল এবং সূক্ষ্ম যোগাযোগ নিশ্চিত করে।

গাণিতিক সমস্যা সমাধানে, সারভাম-এম (Sarvam-M) গণিত-সম্পর্কিত কাজগুলিতে ২১.৬% উল্লেখযোগ্য উন্নতি দেখিয়েছে, যা এটিকে উন্নত নির্ভুলতা এবং দক্ষতার সাথে জটিল সমীকরণ এবং যৌক্তিক যুক্তির চ্যালেঞ্জগুলি মোকাবেলা করতে সক্ষম করে। এই বৈশিষ্ট্যটি সারভাম-এমকে (Sarvam-M) বিভিন্ন বৈজ্ঞানিক এবং প্রকৌশল অ্যাপ্লিকেশনের জন্য একটি মূল্যবান সরঞ্জামে পরিণত করেছে।

তাছাড়া, মডেলটি কোডিংয়ের মানদণ্ডে ১৭.৬% উল্লেখযোগ্য উন্নতি প্রদর্শন করে, যা পরিষ্কার, দক্ষ এবং ত্রুটিমুক্ত কোড তৈরি করার ক্ষমতা প্রদর্শন করে। এই ক্ষমতা সারভাম-এমকে (Sarvam-M) সফ্টওয়্যার ডেভেলপার এবং প্রোগ্রামারদের জন্য একটি মূল্যবান সম্পদ হিসাবে স্থান দিয়েছে, যারা তাদের কর্মপ্রবাহকে স্বয়ংক্রিয় এবং সুবিন্যস্ত করতে চায়।

ভারতীয় ভাষা এবং গণিতের সংযোগস্থলে, সারভাম-এম (Sarvam-M) রোমানাইজড ইন্ডিয়ান ল্যাঙ্গুয়েজ জিএসএম-৮কে (GSM-8K) মানদণ্ডে +৮৬% এর চিত্তাকর্ষক উন্নতি অর্জন করেছে। এই অর্জনটি বিভিন্ন ভাষাগত এবং গাণিতিক ডোমেনের মধ্যে ব্যবধান পূরণ করার মডেলটির ক্ষমতাকে তুলে ধরে, যা সমস্যা সমাধানে একটি ব্যাপক এবং সমন্বিত পদ্ধতির প্রস্তাব করে।

সারভাম-এম (Sarvam-M)-এর প্রকাশ বুলবুলের (Bulbul) প্রকাশের ধারাবাহিকতায় এসেছে, সারভাম এআই-এর (Sarvam AI) নতুন স্পিচ মডেল যাতে খাঁটি ভারতীয় উচ্চারণ রয়েছে। এটি আরও প্রমাণ করে যে সংস্থাটি এআই (AI) সমাধান তৈরি করতে নিবেদিত, যা সাংস্কৃতিকভাবে প্রাসঙ্গিক এবং ভারতীয় বাজারের সূক্ষ্মতার সাথে সঙ্গতিপূর্ণ।

তুলনা

সারভাম এআই (Sarvam AI) আত্মবিশ্বাসের সাথে দাবি করে যে সারভাম-এম (Sarvam-M) বেশিরভাগ মানদণ্ডে মেটার (Meta) এলএলএএমএ-৪ (LLaMA-4) স্কাউটকে (Scout) ছাড়িয়ে গেছে। কোম্পানিটি আরও দাবি করে যে মডেলটির কার্যকারিতা উল্লেখযোগ্যভাবে বড় ডেন্স মডেল যেমন এলএলএএমএ-৩ ৭০বি (LLaMA-3 70B) এবং গুগলের জেম্মা ৩ ২৭বি (Gemma 3 27B) এর সাথে তুলনীয়। এটি লক্ষণীয় যে এই মডেলগুলি উল্লেখযোগ্য সংখ্যক টোকেনের ওপর প্রি-ট্রেইন করা হয়েছে।

সারভাম-এম (Sarvam-M): এলএলএএমএ-৪ (LLaMA-4) স্কাউটের (Scout) প্রতিদ্বন্দ্বী এবং বৃহত্তর মডেলের সাথে তুলনীয়

কম প্যারামিটার সহ এই বৃহত্তর মডেলগুলির মতো একই পারফরম্যান্স স্তর অর্জনের সারভাম-এমের (Sarvam-M) ক্ষমতা এর দক্ষ আর্কিটেকচার এবং অপ্টিমাইজড ট্রেনিং মেথডোলজির প্রমাণ। এটি ছোট, আরও ক্ষিপ্র মডেলগুলির বৃহত্তর, আরও সম্পদ-নিবিড় প্রতিপক্ষের সাথে কার্যকরভাবে প্রতিযোগিতা করার সম্ভাবনাকে তুলে ধরে।

তবে, কোম্পানিটি স্বীকার করে যে “ইংরেজিতে জ্ঞান-সম্পর্কিত মানদণ্ডে” উন্নতির সুযোগ রয়েছে, যেখানে সারভাম-এম (Sarvam-M) বেসলাইন মডেল এমএমএলইউ-এর (MMLU) ওপর প্রায় ১% পয়েন্ট কমে যায়। এটি এমন একটি ক্ষেত্র যা সারভাম এআই (Sarvam AI) সক্রিয়ভাবে সমাধানের জন্য কাজ করছে, মডেলটির সামগ্রিক কার্যকারিতা এবং বহুমুখিতাকে আরও বাড়িয়ে তুলছে।

সারভাম-এম (Sarvam-M) ওপেন সোর্স এবং এআই (AI) কমিউনিটি প্ল্যাটফর্ম হাগিং ফেসে (Hugging Face) বিনামূল্যে পাওয়া যায়। ডেভেলপারদের জন্য এপিআইও (APIs) উপলব্ধ রয়েছে যারা তাদের পণ্যগুলিতে এটিকে সংহত করতে চান। এই অ্যাক্সেসিবিলিটি ডেভেলপারদের জন্য মডেলটি ব্যবহার করা এবং উদ্ভাবনী অ্যাপ্লিকেশনগুলি অন্বেষণ করা সহজ করে তোলে।

বৈশিষ্ট্য

সারভাম-এম (Sarvam-M) একটি বহুমুখী মডেল যা উন্নত ইন্ডিক দক্ষতা দিয়ে ডিজাইন করা হয়েছে। মডেলটি নির্বিঘ্নে “থিংক” (Think) এবং “নন-থিংক” (Non-Think) উভয় মোড সমর্থন করে, যা সহজেই বিভিন্ন কাজের প্রয়োজনীয়তার সাথে খাপ খাইয়ে নেয়।

সারভাম-এম (Sarvam-M): উন্নত ইন্ডিক দক্ষতা সহ একটি বহুমুখী এআই (AI) মডেল

“থিংক” (Think) মোড জটিল যৌক্তিক যুক্তি, গাণিতিক সমস্যা এবং কোডিংয়ের কাজের জন্য। এটি মডেলটিকে জটিল সমস্যাগুলি বিশ্লেষণ এবং সমাধান করতে সক্ষম করে যার জন্য গভীর জ্ঞানীয় প্রক্রিয়াকরণের প্রয়োজন।

“নন-থিংক” (Non-Think) মোডটি দক্ষ সাধারণ-উদ্দেশ্য কথোপকথনের জন্য। এটি মডেলটিকে আরও স্বচ্ছন্দ এবং স্বতঃস্ফূর্ত সংলাপে জড়িত হতে দেয় যার জন্য একই স্তরের বিশ্লেষণাত্মক কঠোরতার প্রয়োজন হয় না।

মডেলটিকে বিশেষভাবে ইংরেজি সহ ভারতীয় ভাষায় পোস্ট-ট্রেইন করা হয়েছে, যা খাঁটিভাবে ভারতীয় সাংস্কৃতিক মূল্যবোধকে প্রতিফলিত করে। এটি নিশ্চিত করে যে মডেলটি বিভিন্ন সাংস্কৃতিক প্রেক্ষাপটে কার্যকরভাবে এবং শ্রদ্ধার সাথে যোগাযোগ করতে পারে।

এটি ইন্ডিক স্ক্রিপ্টগুলির পাশাপাশি ভারতীয় ভাষাগুলির রোমানাইজড সংস্করণগুলির জন্য সম্পূর্ণ সমর্থন প্রদান করে। এই বৈশিষ্ট্যটি ভারতীয় বাজারের নির্দিষ্ট চাহিদা পূরণের মডেলটির ক্ষমতাকে আরও বাড়িয়ে তোলে।