Tag: AIGC

ডিফিউশন মডেল ইনফারেন্স স্কেলিং নতুন দৃষ্টান্ত

সাম্প্রতিককালে লার্জ ল্যাঙ্গুয়েজ মডেলগুলির (LLMs) ইনফারেন্সের সময় স্কেলিংয়ের কার্যকারিতা দেখা গিয়েছে। বিভিন্ন মডেল যেমন o1, o3, DeepSeek R1, QwQ, এবং Step Reasoner mini প্রমাণ করেছে যে ইনফারেন্সের সময় বেশি কম্পিউটেশন ব্যবহার করলে কর্মক্ষমতা উল্লেখযোগ্যভাবে বাড়ে। এই বিষয়টি মাথায় রেখে, নিউ ইয়র্ক ইউনিভার্সিটির একদল গবেষক একটি সাধারণ অনুসন্ধান কাঠামোর মাধ্যমে অনুসন্ধান করে দেখেছেন যে, ডিফিউশন মডেলের ক্ষেত্রেও ইনফারেন্স-টাইম স্কেলিং কার্যকর। ইনফারেন্সের সময় কম্পিউটেশন বাড়ানো হলে জেনারেটেড স্যাম্পেলের গুণমান উল্লেখযোগ্যভাবে বৃদ্ধি পায়। এই গবেষণায় আরও দেখা গেছে, ইমেজের জটিলতা বিভিন্ন অ্যাপ্লিকেশন পরিস্থিতির জন্য ফ্রেমওয়ার্কের মধ্যে বিভিন্ন উপাদানের সংমিশ্রণ তৈরি করতে সহায়ক। এই ফ্রেমওয়ার্ক দুটি মূল ডিজাইন অক্ষের উপর দৃষ্টি নিবদ্ধ করে: যাচাইকারী এবং অ্যালগরিদম। যাচাইকারীরা অনুসন্ধান প্রক্রিয়ার সময় প্রতিক্রিয়া প্রদান করে এবং অ্যালগরিদমগুলি আরও ভালো নয়েজ ক্যান্ডিডেট খুঁজে বের করে। এই গবেষণায় তিনটি ভিন্ন পরিস্থিতিতে যাচাইকারীদের ব্যবহার করা হয়েছে, যেখানে বিভিন্ন ব্যবহারের ক্ষেত্রগুলি অনুকরণ করা হয়েছে। অ্যালগরিদমের জন্য, তারা র্যান্ডম সার্চ, জিরো-অর্ডার সার্চ এবং পাথ সার্চ নিয়ে কাজ করেছেন। এই গবেষণাটি মূলত একটি সাধারণ ইমেজনেট ক্লাস-কন্ডিশনাল জেনারেশন সেটআপে ডিজাইন করা হয়েছিল, পরবর্তীতে বৃহত্তর টেক্সট-কন্ডিশনাল জেনারেশনেও এর প্রয়োগ করা হয়েছে। এছাড়াও, এই গবেষণাটি ছোট ডিফিউশন মডেলগুলিতে ইনফারেন্স-টাইম স্কেলিংয়ের কার্যকারিতা নিয়েও আলোচনা করেছে।

ডিফিউশন মডেল ইনফারেন্স স্কেলিং নতুন দৃষ্টান্ত

বৃহৎ ভাষা মডেলে কর্মদক্ষতা বৃদ্ধির নতুন কৌশল

বৃহৎ ভাষা মডেলগুলির (LLM) কর্মদক্ষতা এবং কার্যকারিতা বাড়ানোর জন্য মাল্টি-ম্যাট্রিক্স ফ্যাক্টরাইজেশন অ্যাটেনশন (MFA) এবং MFA-কী-রিইউজ (MFA-KR) নামক দুটি নতুন অ্যাটেনশন মেকানিজম নিয়ে আলোচনা করা হয়েছে। এই মেকানিজমগুলি মেমরি ব্যবহার কমিয়ে এবং কর্মক্ষমতা উন্নত করে LLM-এর প্রসারে সাহায্য করে।

বৃহৎ ভাষা মডেলে কর্মদক্ষতা বৃদ্ধির নতুন কৌশল

প্রোটিন গবেষণায় ইএসএম 3 একটি বিশাল পদক্ষেপ

ইভোলিউশনারিস্কেল এর ইএসএম3 একটি যুগান্তকারী বায়োলজিক্যাল মডেল যা 98 বিলিয়ন প্যারামিটার নিয়ে গঠিত, যা প্রোটিন গবেষণা এবং চিকিৎসাক্ষেত্রে এক নতুন দিগন্ত উন্মোচন করেছে। এই মডেলে প্রোটিনের ত্রিমাত্রিক গঠন এবং কাজকে একটি স্বতন্ত্র বর্ণমালায় রূপান্তরিত করা হয়। এর মাধ্যমে প্রোটিনের সিকোয়েন্স, গঠন এবং কাজ একই সাথে প্রক্রিয়া করা যায়। সম্প্রতি, ইএসএম3 এর এপিআই বিনামূল্যে পাওয়া যাচ্ছে, যা বিশ্বজুড়ে বিজ্ঞানীদের প্রোটিন নিয়ে গবেষণায় সাহায্য করবে। ইয়ান লেকুন এই উদ্ভাবনকে 'অসাধারণ' বলে উল্লেখ করেছেন। এই মডেলটি শুধু একটি মডেল নয়, এটি প্রোটিন বোঝা এবং তৈরি করার ক্ষেত্রে একটি বিশাল অগ্রগতি।

প্রোটিন গবেষণায় ইএসএম 3 একটি বিশাল পদক্ষেপ