Nvidia
বৃহত্তর ল্যাঙ্গুয়েজ মডেল ডেভেলপারদের কাছ থেকে ক্রমবর্ধমান অত্যাধুনিক AI সিস্টেমের অনুসন্ধান ক্রমাগত যথেষ্ট বিনিয়োগ চালাচ্ছে। তবে, একটি কোম্পানি ইতিমধ্যেই এই AI বিপ্লবের ফল উপভোগ করছে: Nvidia। গ্রাফিক্স প্রসেসিং ইউনিট (GPU) গুলির সাথে AI দৌড় শুরু করার পরে, Nvidia এখন তার যুগান্তকারী Blackwell প্রসেসর এবং প্ল্যাটফর্মের সাথে মানব-স্তরের বুদ্ধিমত্তা অর্জনের জন্য পুরোপুরি প্রস্তুত।
Blackwell তার পূর্বসূরি, H100-কে ছাড়িয়ে গেছে, সাধারণ মডেল-প্রশিক্ষণ কাজের জন্য 2.5 গুণ বেশি শক্তি সরবরাহ করে, একই সাথে উল্লেখযোগ্যভাবে কম শক্তি খরচ করে। Google, Meta, Microsoft, OpenAI, Tesla, এবং xAI-এর মতো শিল্পের জায়ান্ট সহ প্রধান ডেটা সেন্টার অপারেটর এবং AI ল্যাবগুলি কয়েক হাজার Blackwell GPU কেনার প্রতিশ্রুতি দিয়েছে।
যদিও DeepSeek এবং Alibaba-এর মতো চীনা কোম্পানিগুলির সাম্প্রতিক মডেলগুলি পুরানো, কম শক্তিশালী Nvidia GPU ব্যবহার করে চিত্তাকর্ষক ক্ষমতা প্রদর্শন করেছে, Nvidia কেবল তার সাফল্যের উপর নির্ভর করে বসে নেই। কোম্পানিটি ড্রাগ আবিষ্কার (বায়োফার্মার জন্য ক্লারা) এবং স্বায়ত্তশাসিত যানবাহন (ড্রাইভ AGX) থেকে শুরু করে ভিডিও উত্পাদন (হোলোস্ক্যান) এবং ডিজিটাল টুইনস (ওমনিভার্স) পর্যন্ত বিভিন্ন অ্যাপ্লিকেশনের জন্য সক্রিয়ভাবে প্ল্যাটফর্ম তৈরি করছে। বাস্তব-বিশ্বের পরিস্থিতিতে বিস্তৃত বর্ণালী জুড়ে AI অগ্রগতি বৃদ্ধি করে, Nvidia কৌশলগতভাবে নিজেকে টেকসই বৃদ্ধির জন্য স্থাপন করছে, এমনকি ভবিষ্যতের মডেলগুলি যদি নিছক গণনামূলক শক্তির উপর কম নির্ভরতা প্রদর্শন করে তবুও।
OpenAI
2019 সাল থেকে, OpenAI ক্রমাগত তার মডেলগুলিকে প্রশিক্ষণ ডেটা এবং কম্পিউটিং সংস্থানগুলি প্রসারিত করে উন্নত করেছে, একটি কৌশল যা শিল্প জুড়ে ব্যাপকভাবে গৃহীত হয়েছে। যাইহোক, এই স্কেলিং পদ্ধতির থেকে কমতে থাকা রিটার্নগুলি স্পষ্ট হওয়ার সাথে সাথে, OpenAI AGI অর্জনের জন্য একটি নতুন পথের প্রয়োজনীয়তা উপলব্ধি করেছে – এমন মডেল যা বেশিরভাগ কাজে মানুষের বুদ্ধিমত্তাকে ছাড়িয়ে যায়।
OpenAI-এর সমাধান o1 মডেলের আকারে এসেছিল। প্রিট্রেনিংয়ের সময় কেবল সংস্থানগুলিকে স্কেল করার উপর ফোকাস করার পরিবর্তে, OpenAI o1-কে ইনফারেন্সের সময় আরও বেশি সময় এবং কম্পিউটিং পাওয়ার বরাদ্দ করার জন্য ইঞ্জিনিয়ার করেছে, যে পর্যায়ে মডেলটি সক্রিয়ভাবে স্থাপন করা হয় এবং ব্যবহারকারীর প্রম্পটের প্রতিক্রিয়া জানায়। এই প্রক্রিয়া চলাকালীন, o1 ব্যবহারকারী এবং প্রাসঙ্গিক ডেটা উত্স উভয় থেকেই প্রাসঙ্গিক তথ্য সংগ্রহ করে এবং ধরে রাখে। এটি একটি উত্তরের সর্বোত্তম পথ নির্ধারণ করতে একটি ট্রায়াল-এবং-ত্রুটি পদ্ধতি ব্যবহার করে। ফলাফল হল জটিল প্রশ্নের পিএইচডি-স্তরের প্রতিক্রিয়া তৈরি করা, যা o1 কে পারফরম্যান্স বেঞ্চমার্ক র্যাঙ্কিংয়ের শীর্ষে নিয়ে যায়।
OpenAI ChatGPT Plus গ্রাহকদের o1-এর ‘পরীক্ষামূলক’ এবং ‘মিনি’ সংস্করণ অফার করে। উপরন্তু, ChatGPT Pro নামক একটি প্রিমিয়াম পরিষেবা $200 প্রতি মাসে সম্পূর্ণ o1 মডেলে সীমাহীন অ্যাক্সেস সরবরাহ করে। ডিসেম্বর 2024-এ, OpenAI o1-এর উত্তরসূরি, o3 উন্মোচন করে এবং ফেব্রুয়ারি 2025-এ, অর্থপ্রদানকারী ব্যবহারকারীদের o3-মিনিতে অ্যাক্সেস দেয়, বিজ্ঞান, গণিত এবং কোডিংয়ের জন্য অপ্টিমাইজ করা একটি ছোট, দ্রুততর ভেরিয়েন্ট। OpenAI-এর নতুন রিজনিং মডেলগুলির সবচেয়ে গভীর প্রভাব হল AGI-এর পথে বুদ্ধিমত্তার আরও সাফল্যের জন্য একটি প্রতিশ্রুতিশীল উপায় হিসাবে ইনফারেন্সের সময় কম্পিউটিংকে স্কেল করার বৈধতা।
Google DeepMind
আজকের চ্যাটবটগুলির পথ প্রশস্ত করা মৌলিক গবেষণাটি 2010 এর দশকের শেষের দিকে Google-এ উদ্ভূত হয়েছিল। ChatGPT-এর উত্থানের অনেক আগেই Google একটি বৃহৎ ভাষা মডেল-চালিত চ্যাটবট তৈরি করেছিল। যাইহোক, নিরাপত্তা, গোপনীয়তা এবং আইনি প্রভাব সম্পর্কিত উদ্বেগের কারণে একটি সতর্কতামূলক পদ্ধতির ফলে এর প্রকাশে বিলম্ব হয়েছিল। এই দ্বিধার ফলে ChatGPT-এর লঞ্চের ফলে সৃষ্ট AI দৌড়ে Google প্রাথমিকভাবে পিছিয়ে পড়ে।
2024 সালে Google DeepMind-এর Gemini 2.0-এর প্রকাশ Google-এর চূড়ান্ত প্রত্যাবর্তনের সংকেত দেয়। Gemini 2.0 হল প্রথম ভর-বাজারের AI মডেল যা অন্তর্নিহিতভাবে মাল্টিমোডাল, টেক্সটের মতোই সাবলীলতার সাথে ছবি, ভিডিও, অডিও এবং কম্পিউটার কোড প্রক্রিয়া ও তৈরি করতে সক্ষম। এই ক্ষমতা মডেলটিকে ভিডিও ক্লিপগুলি, এমনকি ফোন ক্যামেরা থেকে লাইভ ভিডিও ফিডগুলিকেও অসাধারণ গতি এবং নির্ভুলতার সাথে বিশ্লেষণ এবং যুক্তিযুক্ত করতে সক্ষম করে।
Gemini অন্যান্য Google পরিষেবা, যেমন Maps এবং Search নিয়ন্ত্রণ করার ক্ষমতার জন্যও আলাদা। এই ইন্টিগ্রেশনটি Google-এর কৌশলগত সুবিধা প্রদর্শন করে, তার AI গবেষণাকে তার প্রতিষ্ঠিত তথ্য এবং উত্পাদনশীলতা সরঞ্জামগুলির সাথে একত্রিত করে। Gemini হল প্রথম AI মডেলগুলির মধ্যে একটি যা ব্যবহারকারীর পক্ষে স্বায়ত্তশাসিত অপারেশন এবং জটিল সমস্যাগুলির মাধ্যমে যুক্তি করার ক্ষমতা প্রদর্শন করে। Gemini 2.0 Flash Thinking পরীক্ষামূলক মডেলটি ব্যবহারকারীদের একটি উত্তরে পৌঁছানোর জন্য নিযুক্ত চিন্তাভাবনার প্রক্রিয়া সম্পর্কে অন্তর্দৃষ্টি প্রদান করে। উপরন্তু, ডিসেম্বরে, Google প্রজেক্ট মেরিনার চালু করেছে, একটি Gemini-ভিত্তিক এজেন্টিক AI বৈশিষ্ট্য যা অনলাইন মুদি কেনাকাটার মতো কাজগুলি স্বায়ত্তশাসিতভাবে সম্পাদন করার জন্য ডিজাইন করা হয়েছে।
Anthropic
জেনারেটিভ AI-এর প্রাথমিক অ্যাপ্লিকেশনগুলি এখনও পর্যন্ত টেক্সট লেখা, সংক্ষিপ্তকরণ এবং চিত্র তৈরির চারপাশে কেন্দ্রীভূত। পরবর্তী বিবর্তনীয় পদক্ষেপের মধ্যে রয়েছে বৃহৎ ভাষা মডেলগুলিকে যুক্তিযুক্ত করার ক্ষমতা এবং সরঞ্জামগুলি ব্যবহার করার ক্ষমতা দিয়ে সজ্জিত করা। Anthropic-এর ‘কম্পিউটার ব্যবহার’ মডেল এই ভবিষ্যতের একটি প্রাথমিক ঝলক প্রদান করেছে।
2024 সালে Claude 3.5 Sonnet-এর সাথে শুরু করে, Anthropic-এর মডেল ইন্টারনেট সামগ্রী সহ অন-স্ক্রিন কার্যকলাপ উপলব্ধি করতে পারে। এটি একটি কার্সার ম্যানিপুলেট করতে পারে, বোতামে ক্লিক করতে পারে এবং টেক্সট ইনপুট করতে পারে। একটি প্রদর্শনী ভিডিওতে দেখানো হয়েছে যে Claude ব্রাউজার ট্যাবে খোলা ওয়েবসাইটগুলিতে উপলব্ধ তথ্য ব্যবহার করে একটি ফর্ম পূরণ করতে সক্ষম। এটি একটি ব্যক্তিগত ওয়েবসাইট তৈরি করা বা একটি দিনের ভ্রমণের জন্য লজিস্টিক সংগঠিত করার মতো কাজগুলি সম্পন্ন করতে পারে। AI-এর স্বায়ত্তশাসিত ক্রিয়া, যেমন নতুন ট্যাব খোলা, অনুসন্ধান পরিচালনা করা এবং ডেটা ক্ষেত্রগুলি পূরণ করা সত্যিই অসাধারণ।
যদিও মডেলটি বর্তমানে ধীর গতিতে কাজ করে এবং সর্বদা সঠিক উত্তর নাও দিতে পারে, তবে Anthropic তার সীমাবদ্ধতাগুলি চিহ্নিত এবং সমাধান করার সাথে সাথে দ্রুত উন্নতির আশা করা হচ্ছে। Google-এর পূর্বোক্ত প্রজেক্ট মেরিনার ডিসেম্বরে Anthropic-এর নেতৃত্ব অনুসরণ করে এবং OpenAI জানুয়ারী 2025-এ তার নিজস্ব কম্পিউটার ব্যবহার মডেল, অপারেটর চালু করে। ফেব্রুয়ারী 2025-এ, Anthropic তার পরবর্তী প্রধান পুনরাবৃত্তি, Claude 3.7 Sonnet উন্মোচন করে, একটি বৃহত্তর মডেল যা চ্যালেঞ্জিং প্রশ্নের জন্য স্বয়ংক্রিয়ভাবে রিজনিং মোড নিযুক্ত করতে সক্ষম।
Microsoft
Microsoft-এর Phi মডেলগুলির বিকাশ 2023 সালে কোম্পানির গবেষকদের দ্বারা উত্থাপিত একটি মৌলিক প্রশ্ন থেকে উদ্ভূত হয়েছিল: ‘উদীয়মান বুদ্ধিমত্তার লক্ষণগুলি প্রদর্শন করতে পারে এমন ক্ষুদ্রতম মডেলের আকার কী?’ এই অনুসন্ধানটি ‘ছোট ভাষা মডেল’-এর বিবর্তনের একটি গুরুত্বপূর্ণ মুহূর্ত চিহ্নিত করেছে, সীমিত মেমরি, প্রক্রিয়াকরণ ক্ষমতা বা সংযোগ সহ পরিস্থিতিতে সর্বোত্তম পারফরম্যান্সের জন্য ডিজাইন করা মডেল, যেখানে দ্রুত প্রতিক্রিয়ার সময় অত্যন্ত গুরুত্বপূর্ণ।
2024 সাল জুড়ে, Microsoft ছোট মডেলের দুটি প্রজন্ম প্রকাশ করেছে যা যুক্তি এবংযুক্তির ক্ষমতা প্রদর্শন করেছে যা প্রশিক্ষণের সময় স্পষ্টভাবে অন্তর্ভুক্ত করা হয়নি। এপ্রিলে, কোম্পানিটি Phi-3 মডেলগুলির একটি সিরিজ উন্মোচন করেছে যা ভাষা, যুক্তি, কোডিং এবং গণিত বেঞ্চমার্কে சிற சிற, সম্ভবত উল্লেখযোগ্যভাবে বৃহত্তর এবং আরও সক্ষম LLM দ্বারা উত্পন্ন সিন্থেটিক ডেটার উপর তাদের প্রশিক্ষণের কারণে। ওপেন-সোর্স Phi-3-এর ভেরিয়েন্টগুলি 2024 সালে Hugging Face-এ 4.5 মিলিয়নেরও বেশি বার ডাউনলোড করা হয়েছিল।
2024 সালের শেষের দিকে, Microsoft তার Phi-4 ছোট ভাষা মডেলগুলি চালু করেছে, যা যুক্তি-কেন্দ্রিক কাজগুলিতে Phi-3 মডেলগুলিকে ছাড়িয়ে গেছে এবং এমনকি GPQA (বৈজ্ঞানিক প্রশ্ন) এবং MATH বেঞ্চমার্কে OpenAI-এর GPT-4o-কে ছাড়িয়ে গেছে। Microsoft একটি ওপেন-সোর্স এবং ওপেন-ওয়েট লাইসেন্সের অধীনে মডেলটি প্রকাশ করেছে, ডেভেলপারদের ফোন বা ল্যাপটপের জন্য এজ মডেল বা অ্যাপ্লিকেশন তৈরি করার ক্ষমতা দিয়েছে। এক মাসেরও কম সময়ের মধ্যে, Phi-4 Hugging Face-এ 375,000 ডাউনলোড সংগ্রহ করেছে।
Amazon
Amazon AWS সম্প্রতি Trainium2 চালু করেছে, AI-এর জন্য তার Trainium প্রসেসরের একটি নতুন সংস্করণ, যা নির্দিষ্ট সেটিংসে Nvidia GPU-এর আধিপত্যকে সম্ভাব্যভাবে চ্যালেঞ্জ করতে পারে। Trainium2 সবচেয়ে বড় জেনারেটিভ AI মডেলগুলিকে প্রশিক্ষণ দেওয়ার জন্য এবং মডেল স্থাপনার পরে ইনফারেন্স-টাইম অপারেশনের জন্য প্রয়োজনীয় বিশাল কম্পিউটিং পাওয়ার সরবরাহ করার জন্য ইঞ্জিনিয়ার করা হয়েছে। AWS দাবি করে যে Trainium তুলনামূলক কাজের জন্য GPU-এর চেয়ে 30% থেকে 40% বেশি সাশ্রয়ী।
Trainium2 প্রথম Trainium চিপে পরিলক্ষিত শক্তি এবং সফ্টওয়্যার ইন্টিগ্রেশন ত্রুটিগুলি সমাধান করে, যা Amazon-কে Nvidia-এর সাথে ব্যবধান কমানোর জন্য অবস্থান করে। (এটি লক্ষণীয় যে AWS নিজেই GPU-এর জন্য Nvidia-এর উপর ব্যাপকভাবে নির্ভরশীল।) Nvidia-কে স্থানচ্যুত করা একটি কঠিন চ্যালেঞ্জ কারণ গ্রাহকরা Nvidia-এর CUDA সফ্টওয়্যার স্তরের সাথে লক-ইন করে, যা গবেষকদের তাদের মডেলগুলি কীভাবে চিপের সংস্থানগুলি ব্যবহার করে তার উপর দানাদার নিয়ন্ত্রণ সরবরাহ করে। Amazon তার নিজস্ব কার্নেল কন্ট্রোল সফ্টওয়্যার লেয়ার, নিউরন কার্নেল ইন্টারফেস (NKI) অফার করে, যা CUDA-এর মতো, গবেষকদের চিপ কার্নেল ইন্টারঅ্যাকশনের উপর সূক্ষ্ম-নিয়ন্ত্রণ দেয়।
এটি লক্ষ করা গুরুত্বপূর্ণ যে Trainium2 এখনও স্কেলে পরীক্ষা করা হয়নি। AWS বর্তমানে Anthropic-এর জন্য 400,000 Trainium2 চিপ সহ একটি সার্ভার ক্লাস্টার তৈরি করছে, যা বৃহৎ আকারের স্থাপনায় এর AI চিপগুলির কর্মক্ষমতা অপ্টিমাইজ করার জন্য মূল্যবান অন্তর্দৃষ্টি প্রদান করতে পারে।
Arm
ব্রিটিশ সেমিকন্ডাক্টর ডিজাইনার Arm দীর্ঘদিন ধরে ফোন, সেন্সর এবং IoT হার্ডওয়্যারের মতো ছোট ডিভাইসগুলিকে শক্তিশালী করার জন্য ব্যবহৃত চিপগুলিতে ব্যবহৃত আর্কিটেকচারের একটি মূল প্রদানকারী। এই ভূমিকাটি উদীয়মান যুগে আরও বেশি তাৎপর্য গ্রহণ করে যেখানে এজ ডিভাইস চিপগুলি AI মডেলগুলি সম্পাদন করবে। ডেটা সেন্টারগুলিও এই বিবর্তনে একটি গুরুত্বপূর্ণ ভূমিকা পালন করবে, প্রায়শই সবচেয়ে চাহিদাপূর্ণ AI প্রক্রিয়াকরণের কিছু বা সমস্ত পরিচালনা করে এবং প্রান্ত ডিভাইসগুলিতে ফলাফল সরবরাহ করে।
বিশ্বব্যাপী ডেটা সেন্টারগুলি প্রসারিত হওয়ার সাথে সাথে তাদের বৈদ্যুতিক শক্তি খরচ একটি ক্রমবর্ধমান গুরুত্বপূর্ণ উদ্বেগের বিষয় হয়ে উঠবে। এই ফ্যাক্টরটি Arm-এর সর্বশেষ Neoverse CPU আর্কিটেকচারে দক্ষতার উপর জোর দেওয়ার ক্ষেত্রে অবদান রাখে। কোম্পানির মতে, এটি পূর্ববর্তী প্রজন্মের তুলনায় 50% কর্মক্ষমতা উন্নতি এবং প্রতিদ্বন্দ্বী x86 আর্কিটেকচার ব্যবহার করে প্রসেসরের তুলনায় ওয়াট প্রতি 20% ভাল পারফরম্যান্স নিয়ে গর্ব করে।
Arm রিপোর্ট করেছে যে Amazon, Microsoft, Google এবং Oracle সকলেই সাধারণ-উদ্দেশ্যের কম্পিউটিং এবং CPU-ভিত্তিক AI ইনফারেন্স এবং প্রশিক্ষণ উভয়ের জন্য Arm Neoverse গ্রহণ করেছে। উদাহরণস্বরূপ, 2024 সালে, Microsoft ঘোষণা করেছে যে ক্লাউডের জন্য ডিজাইন করা তার প্রথম কাস্টম সিলিকন, Cobalt 100 প্রসেসর, Arm Neoverse-এর উপর নির্মিত হয়েছিল। কিছু বৃহত্তম AI ডেটা সেন্টার NVIDIA-এর Grace Hopper Superchip-এর উপর নির্ভর করবে, যা Neoverse-এর উপর ভিত্তি করে একটি Hopper GPU এবং একটি Grace CPU-কে একত্রিত করে। Arm এই বছর তার নিজস্ব CPU চালু করার জন্য নির্ধারিত রয়েছে, Meta তার প্রাথমিক গ্রাহকদের মধ্যে একজন।
Gretel
গত এক বছরে, AI কোম্পানিগুলি ওয়েব থেকে স্ক্র্যাপ করা ডেটার ক্রমবর্ধমান ভলিউমের সাথে তাদের মডেলগুলিকে প্রশিক্ষণ দেওয়ার ফলে কমতে থাকা রিটার্নের অভিজ্ঞতা অর্জন করেছে। ফলস্বরূপ, তারা প্রশিক্ষণের ডেটার নিছক পরিমাণ থেকে তার মানের দিকে তাদের মনোযোগ সরিয়ে নিয়েছে। এর ফলে প্রকাশক অংশীদারদের কাছ থেকে লাইসেন্সপ্রাপ্ত অ-পাবলিক এবং বিশেষ সামগ্রীতে বিনিয়োগ বেড়েছে। AI গবেষকদের তাদের মানব-উত্পাদিত বা মানব-টীকাযুক্ত প্রশিক্ষণ ডেটার মধ্যে ফাঁক বা অন্ধ দাগগুলিও সমাধান করতে হবে। এই উদ্দেশ্যে, তারা ক্রমবর্ধমানভাবে বিশেষ AI মডেল দ্বারা উত্পন্ন সিন্থেটিক প্রশিক্ষণ ডেটার দিকে ঝুঁকছে।
Gretel 2024 সালে সিন্থেটিক প্রশিক্ষণ ডেটা তৈরি এবং পরিচালনার ক্ষেত্রে বিশেষীকরণের মাধ্যমে বিশিষ্টতা অর্জন করেছে। কোম্পানিটি তার ফ্ল্যাগশিপ পণ্য, Gretel Navigator-এর সাধারণ উপলব্ধতার ঘোষণা করেছে, যা ডেভেলপারদের সূক্ষ্ম-টিউনিং এবং পরীক্ষার জন্য সিন্থেটিক প্রশিক্ষণ ডেটাসেট তৈরি, বৃদ্ধি, সম্পাদনা এবং পরিচালনা করতে প্রাকৃতিক ভাষা বা SQL প্রম্পট ব্যবহার করতে সক্ষম করে। প্ল্যাটফর্মটি ইতিমধ্যেই 150,000-এরও বেশি ডেভেলপারের একটি সম্প্রদায়কে আকৃষ্ট করেছে যারা 350 বিলিয়নেরও বেশি প্রশিক্ষণ ডেটা সংশ্লেষিত করেছে।
অন্যান্য শিল্প খেলোয়াড়রা Gretel-এর ক্ষমতা সম্পর্কে অবগত হয়েছে। Gretel Google-এর সাথে অংশীদারিত্ব করেছে যাতে Google ক্লাউড গ্রাহকদের কাছে তার সিন্থেটিক প্রশিক্ষণ ডেটা সহজেই অ্যাক্সেসযোগ্য করা যায়। Databricks-এর সাথে একটি অনুরূপ অংশীদারিত্ব জুনে ঘোষণা করা হয়েছিল, Databricks-এর এন্টারপ্রাইজ গ্রাহকদের Databricks ক্লাউডের মধ্যে চলমান তাদের মডেলগুলির জন্য সিন্থেটিক প্রশিক্ষণ ডেটাতে অ্যাক্সেস দেওয়া হয়েছিল।
Mistral AI
Mistral AI, জেনারেটিভ AI ক্ষেত্রে ফ্রান্সের প্রতিযোগী, ক্রমাগত OpenAI, Anthropic এবং Google-এর উপর চাপ প্রয়োগ করেছে ফ্রন্টিয়ার AI মডেল বিকাশের অগ্রভাগে। Mistral AI 2024 সালে উল্লেখযোগ্য প্রযুক্তিগত অগ্রগতি অন্তর্ভুক্ত করে নতুন মডেলগুলির একটি সিরিজ প্রকাশ করেছে, তার API-গুলির সরাসরি বিপণন এবং কৌশলগত অংশীদারিত্ব উভয়ের মাধ্যমে দ্রুত ব্যবসার বৃদ্ধি প্রদর্শন করেছে।
বছরের শুরুতে, কোম্পানিটি Mixtral নামক ওপেন-সোর্স মডেলগুলির একটি জোড়া চালু করেছিল, যা ‘মিক্সচার অফ এক্সপার্টস’ আর্কিটেকচারের উদ্ভাবনী ব্যবহারের জন্য উল্লেখযোগ্য, যেখানে মডেলের প্যারামিটারগুলির একটি বিশেষ উপসেট একটি প্রশ্নের পরিচালনার জন্য নিযুক্ত করা হয়, দক্ষতা বাড়ায়। জুলাই 2024-এ, Mistral Mistral Large 2 ঘোষণা করেছে, যা 123 বিলিয়ন প্যারামিটারে, কোড জেনারেশন, গণিত, যুক্তি এবং ফাংশন কলিংয়ে উল্লেখযোগ্য উন্নতি প্রদর্শন করেছে। ফরাসি কোম্পানিটি Ministral 3B এবং Ministral 8B প্রকাশ করেছে, ছোট মডেলগুলি ল্যাপটপ বা ফোনে সম্পাদনের জন্য ডিজাইন করা হয়েছে, যা ব্যবহারকারীর দ্বারা প্রদত্ত প্রায় 50 টেক্সট পৃষ্ঠার প্রাসঙ্গিক তথ্য সংরক্ষণ করতে সক্ষম।
Mistral ইউরোপে OpenAI-এর মতো মার্কিন AI কোম্পানিগুলির কম খরচে এবং নমনীয় বিকল্প হিসাবে নিজেকে অবস্থান করে সাফল্য অর্জন করেছে। এটি 2024 সালের মধ্যে মার্কিন এন্টারপ্রাইজ বাজারে তার সম্প্রসারণ অব্যাহত রেখেছে। জুনে, কোম্পানিটি ভেঞ্চার ক্যাপিটাল ফার্ম জেনারেল ক্যাটালিস্টের নেতৃত্বে $640 মিলিয়ন তহবিল রাউন্ড সুরক্ষিত করেছে, যা Mistral-এর মূল্যায়ন প্রায় $6.2 বিলিয়ন বাড়িয়েছে।
Fireworks AI
Fireworks একটি কাস্টম রানটাইম পরিবেশ অফার করে যা AI স্থাপনার জন্য পরিকাঠামো নির্মাণের সাথে যুক্ত প্রায়শই জটিল ইঞ্জিনিয়ারিং কাজকে স্ট্রিমলাইন করে। Fireworks প্ল্যাটফর্ম ব্যবহার করে, এন্টারপ্রাইজগুলি 100 টিরও বেশি AI মডেলকে সংহত করতে পারে এবং তারপরে তাদের নির্দিষ্ট ব্যবহারের ক্ষেত্রে কাস্টমাইজ এবং সূক্ষ্ম-টিউন করতে পারে।
কোম্পানিটি 2024 সালের মধ্যেনতুন পণ্য চালু করেছে যা এটিকে AI শিল্পের মূল প্রবণতাগুলির উপর পুঁজি করার জন্য অবস্থান করবে। প্রথমত, ডেভেলপাররা AI-চালিত মডেল এবং অ্যাপ্লিকেশনগুলির প্রতিক্রিয়াশীলতার উপর ক্রমবর্ধমানভাবে দৃষ্টি নিবদ্ধ করেছে। Fireworks FireAttention V2, অপ্টিমাইজেশান এবং কোয়ান্টাইজেশন সফ্টওয়্যার চালু করেছে যা মডেলের কর্মক্ষমতা বাড়ায় এবং নেটওয়ার্ক বিলম্ব কমায়। দ্বিতীয়ত, AI সিস্টেমগুলি ক্রমবর্ধমানভাবে ‘পাইপলাইন’-এ বিকশিত হচ্ছে যা API-এর মাধ্যমে বিভিন্ন মডেল এবং সরঞ্জামগুলিকে আহ্বান করে। নতুন FireFunction V2 সফ্টওয়্যার এই ক্রমবর্ধমান জটিল সিস্টেমগুলির মধ্যে সমস্ত উপাদানগুলির জন্য একটি অর্কেস্ট্রেটর হিসাবে কাজ করে, বিশেষ করে যখন এন্টারপ্রাইজগুলি আরও স্বায়ত্তশাসিত AI অ্যাপ্লিকেশন স্থাপন করে।
Fireworks 2024 সালে রাজস্ব বৃদ্ধিতে 600% বৃদ্ধির রিপোর্ট করেছে। এর গ্রাহক বেসে Verizon, DoorDash, Uber, Quora এবং Upwork-এর মতো বিশিষ্ট কোম্পানিগুলি অন্তর্ভুক্ত রয়েছে।
Snorkel AI
এন্টারপ্রাইজগুলি বুঝতে পেরেছে যে তাদের AI সিস্টেমগুলির কার্যকারিতা তাদের ডেটার গুণমানের সাথে সরাসরি সম্পর্কিত। Snorkel AI এন্টারপ্রাইজগুলিকে AI মডেলগুলিতে ব্যবহারের জন্য তাদের মালিকানাধীন ডেটা প্রস্তুত করতে সহায়তা করে একটি সমৃদ্ধ ব্যবসা তৈরি করেছে। কোম্পানির Snorkel Flow AI ডেটা ডেভেলপমেন্ট প্ল্যাটফর্ম কোম্পানিগুলিকে তাদের মালিকানাধীন ডেটা লেবেল এবং কিউরেট করার জন্য একটি সাশ্রয়ী পদ্ধতি সরবরাহ করে, তাদের নির্দিষ্ট ব্যবসার প্রয়োজনের জন্য AI মডেলগুলিকে কাস্টমাইজ এবং মূল্যায়ন করার জন্য এর ব্যবহার সক্ষম করে।
2024 সালে, Snorkel ছবিগুলি অন্তর্ভুক্ত করার জন্য তার সমর্থন প্রসারিত করেছে, কোম্পানিগুলিকে তাদের নিজস্ব মালিকানাধীন ছবি ব্যবহার করে মাল্টিমোডাল AI মডেল এবং ইমেজ জেনারেটরকে প্রশিক্ষণ দেওয়ার অনুমতি দেয়। এটি তার প্ল্যাটফর্মে পুনরুদ্ধার অগমেন্টেড জেনারেশন (RAG) অন্তর্ভুক্ত করেছে, গ্রাহকদের AI প্রশিক্ষণে ব্যবহারের জন্য মালিকানাধীন নলেজ বেস সামগ্রীর মতো দীর্ঘ নথিগুলি থেকে তথ্যের সবচেয়ে প্রাসঙ্গিক অংশগুলি পুনরুদ্ধার করতে সক্ষম করে। Snorkel Custom, একটি নতুন, উচ্চ-টাচ পরিষেবা স্তর, Snorkel-এর মেশিন লার্নিং বিশেষজ্ঞদের সরাসরি গ্রাহকদের সাথে প্রকল্পগুলিতে সহযোগিতা করা জড়িত।
Snorkel বলেছে যে 2024 সালের মধ্যে এর বার্ষিক বুকিং দ্বিগুণ হয়েছে, গত তিন বছরের প্রতিটি বছরে বার্ষিক বুকিংয়ে তিন অঙ্কের বৃদ্ধি সহ। কোম্পানির মতে, ছয়টি বৃহত্তম ব্যাংক এখন Snorkel Flow ব্যবহার করে, Chubb, Wayfair এবং Experian-এর মতো ব্র্যান্ডগুলির সাথে।
CalypsoAI
যেহেতু AI সমালোচনামূলক সিদ্ধান্ত গ্রহণের প্রক্রিয়াগুলিতে ক্রমবর্ধমান গুরুত্বপূর্ণ ভূমিকা পালন করে, তাই এন্টারপ্রাইজগুলি মডেলগুলির অভ্যন্তরীণ কার্যকারিতা সম্পর্কে বর্ধিত দৃশ্যমানতা চাইছে। নিয়ন্ত্রিত শিল্পগুলির জন্য এই প্রয়োজনটি বিশেষভাবে উচ্চারিত হয় যেগুলিকে অবশ্যই পক্ষপাত এবং অন্যান্য অনিচ্ছাকৃত আউটপুটগুলির জন্য ক্রমাগত নিরীক্ষণ করতে হবে। CalypsoAI এই উদীয়মান প্রয়োজনীয়তাটি প্রথম সনাক্তকারীদের মধ্যে ছিল এবং তার AI পরিকাঠামো প্ল্যাটফর্মে বর্ধিত ব্যাখ্যামূলক বৈশিষ্ট্যগুলির সাথে দ্রুত প্রতিক্রিয়া জানায়।
যা Calypso-কে আলাদা করে তা হল এর পর্যবেক্ষণযোগ্যতা প্রযুক্তির বিস্তৃতি। 2024 সালে, কোম্পানিটি তার AI সিকিউরিটি প্ল্যাটফর্ম চালু করেছে, যা এন্টারপ্রাইজ ডেটাকে সুরক্ষিত করে, অডিট করে এবং একটি কোম্পানি ব্যবহার করতে পারে এমন সমস্ত সক্রিয় জেনারেটিভ AI মডেল নিরীক্ষণ করে, মডেল বিক্রেতা নির্বিশেষে বা মডেলটি অভ্যন্তরীণভাবে বা বাহ্যিকভাবে হোস্ট করা হোক না কেন। Calypso নতুন ভিজ্যুয়ালাইজেশন সরঞ্জামও চালু করেছে যা ব্যবহারকারীদের রিয়েল টাইমে AI সিদ্ধান্তের অন্তর্নিহিত যুক্তি পর্যবেক্ষণ করতে দেয়।
বাজার Calypso-এর AI পর্যবেক্ষণযোগ্যতার উপর জোর দেওয়ার জন্য ইতিবাচকভাবে সাড়া দিচ্ছে। কোম্পানিটি 2024 সালের মধ্যে আয়ে দশগুণ বৃদ্ধির রিপোর্ট করেছে এবং 2025 সালে আরও পাঁচগুণ বৃদ্ধির প্রত্যাশা করেছে।
Galileo
যদিও AI সিস্টেমগুলি এক বছর আগের তুলনায় বাস্তব হ্যালুসিনেশন এবং পক্ষপাতের কম দৃষ্টান্ত প্রদর্শন করে, তবুও তারা এই সমস্যাগুলির জন্য সংবেদনশীল। এটি AI ব্যবহার করে এমন কোনও ব্যবসার জন্য একটি উল্লেখযোগ্য উদ্বেগের বিষয়, বিশেষ করে স্বাস্থ্যসেবা এবং ব্যাঙ্কিংয়ের মতো নিয়ন্ত্রিত ক্ষেত্রগুলিতে। AI ডেভেলপমেন্ট টিমগুলি তাদের মডেল এবং অ্যাপ্লিকেশনগুলির নির্ভুলতা পরিমাপ, অপ্টিমাইজ এবং নিরীক্ষণ করতে Galileo-এর AI প্ল্যাটফর্ম ব্যবহার করে।
2024 সালের প্রথম দিকে, দুই বছরের গবেষণার পর, Galileo ক্ষতিকারক আউটপুট সনাক্ত করার জন্য প্রশিক্ষিত মূল্যায়ন মডেলগুলির একটি স্যুট Luna প্রকাশ করেছে। এই মডেলগুলি Galileo-এর প্ল্যাটফর্মকে দ্রুত যাচাই করতে এবং একটি LLM-এর কাজকে স্কোর করতে সক্ষম করে কারণ এটি টোকেনগুলিকে একত্রিত করে যা এর প্রতিক্রিয়া গঠন করে। এই প্রক্রিয়াটি প্রায় 200 মিলিসেকেন্ড সময় নেয়, AI-এর আউটপুট ব্যবহারকারীর কাছে প্রদর্শিত হওয়া থেকে পতাকাঙ্কিত এবং প্রতিরোধ করার জন্য যথেষ্ট সময় দেয়। যদিও একটি স্ট্যান্ডার্ড LLM এই কাজটি সম্পাদন করতে পারে, তবে এটি যথেষ্ট বেশি ব্যয়বহুল হবে। Galileo-এর উদ্দেশ্য-নির্মিত মডেলগুলি উচ্চতর নির্ভুলতা, সাশ্রয়ীতা এবং, গুরুত্বপূর্ণভাবে, গতি অফার করে।
Galileo 2024 সালে তার গ্রাহক বেস চারগুণ হওয়ার রিপোর্ট করেছে, যার মধ্যে রয়েছে Twilio, Reddit, Chegg, Comcast এবং JPMorgan Chase-এর মতো ক্লায়েন্ট। স্টার্টআপটি Hugging Face CEO Clément Delangue-এর মতো বিনিয়োগকারীদের কাছ থেকে $68 মিলিয়ন তহবিল রাউন্ডও সুরক্ষিত করেছে।
Runway
AI-কে ঘিরে সবচেয়ে উল্লেখযোগ্য আকাঙ্ক্ষা—এবং উদ্বেগগুলির মধ্যে একটি হল—চলচ্চিত্র নির্মাণের শিল্প এবং অর্থনীতিতে বিপ্লব ঘটানোর জন্য যথেষ্ট মানের ভিডিও তৈরি করার সম্ভাবনা। প্রযুক্তিটি 2024 সালে এই ভবিষ্যতের দিকে উল্লেখযোগ্য পদক্ষেপ নিয়েছে, নিউইয়র্ক-ভিত্তিক ভিডিও জেনারেশন স্টার্টআপ Runway একটি অগ্রণী ভূমিকা পালন করেছে। জুন 2024-এ Runway-এর Gen-3 Alpha মডেলের প্রকাশ জেনারেট করা ভিডিওর উল্লেখযোগ্যভাবে উন্নত বিশ্বাসযোগ্যতার জন্য AI সম্প্রদায়ের মধ্যে ব্যাপক প্রশংসা অর্জন করেছে।
Runway AI ভিডিওর নান্দনিকতা নিয়ন্ত্রণের জন্য তার সরঞ্জামগুলিতে প্রধান উন্নতিগুলিও প্রয়োগ করেছে। মডেলটি ছবি এবং ভিডিও উভয়ের উপর প্রশিক্ষিত হয়েছিল এবং টেক্সট বা ইমেজ ইনপুটগুলির উপর ভিত্তি করে ভিডিও তৈরি করতে পারে। কোম্পানিটি পরবর্তীকালে Gen-3 Alpha Turbo প্রকাশ করেছে, Gen-3-এর একটি আরও সাশ্রয়ী এবং দ্রুত সংস্করণ।
হলিউড জেনারেটিভ AI-এর অগ্রগতি ঘনিষ্ঠভাবে পর্যবেক্ষণ করছে এবং Runway রিপোর্ট করেছে যে এটি বিনোদন শিল্পের খেলোয়াড়দের জন্য তার মডেলগুলির কাস্টম সংস্করণ তৈরি করা শুরু করেছে। এটি সেপ্টেম্বর 2024-এ Lionsgate Studios-এর সাথে একটি আনুষ্ঠানিক অংশীদারিত্বে প্রবেশ করেছে। Runway প্রোডাকশন কোম্পানির জন্য একটি কাস্টম মডেল তৈরি করেছে এবং Lionsgate-এর ফিল্ম ক্যাটালগের উপর এটিকে প্রশিক্ষণ দিয়েছে। Runway বলেছে যে মডেলটি Lionsgate-এর চলচ্চিত্র নির্মাতা, পরিচালক এবং অন্যান্য সৃজনশীলদের ‘তাদের কাজকে বাড়িয়ে তুলতে’ এবং ‘সময়, অর্থ এবং সম্পদ সাশ্রয় করতে’ সহায়তা করার উদ্দেশ্যে তৈরি করা হয়েছে। Runway বিশ্বাস করে যে Lionsgate-এর সাথে এর ব্যবস্থা অন্যান্য প্রোডাকশন কোম্পানিগুলির সাথে অনুরূপ সহযোগিতার জন্য একটি ব্লুপ্রিন্ট হিসাবে কাজ করতে পারে।
Cerebras Systems
AI সিস্টেম, বিশেষ করে বৃহৎ ফ্রন্টিয়ার মডেল, স্কেলে কাজ করার জন্য প্রচুর কম্পিউটিং পাওয়ার দাবি করে। এটি কাজের চাপ বিতরণ করার জন্য হাজার হাজার বা লক্ষ লক্ষ চিপের আন্তঃসংযোগের প্রয়োজন। যাইহোক, চিপগুলির মধ্যে নেটওয়ার্ক সংযোগগুলি কর্মক্ষমতা বাধা প্রবর্তন করতে পারে। Cerebras Systems-এর প্রযুক্তি একটি একক, ব্যতিক্রমীভাবে বড় চিপে প্রচুর পরিমাণে কম্পিউটিং পাওয়ার সংহত করার গতি এবং দক্ষতার সুবিধাগুলিকে কাজে লাগানোর জন্য ডিজাইন করা হয়েছে।
উদাহরণস্বরূপ, কোম্পানির সর্বশেষ WSE-3 (তৃতীয় প্রজন্মের ওয়েফার স্কেল ইঞ্জিন) চিপের পরিমাপ 814 বর্গ মিলিমিটার, একটি ডিনার প্লেটের আকার এবং Nvidia-এর বাজার-নেতৃস্থানীয় H100 চিপগুলির চেয়ে 56 গুণ বড়। চিপটিতে একটি বিস্ময়কর 4 ট্রিলিয়ন ট্রানজিস্টর রয়েছে এবং 44 গিগাবিট মেমরি অফার করে। এই চিপগুলিকে সুপার কম্পিউটার গঠনের জন্য ক্লাস্টার করা যেতে পারে, যেমন কন্ডোর গ্যালাক্সি, সংযুক্ত সুপার কম্পিউটারগুলির একটি ‘নক্ষত্রপুঞ্জ’ যা Cerebras তার বৃহত্তম গ্রাহক, G42, একটি UAE-ভিত্তিক AI এবং ক্লাউড কম্পিউটিং কোম্পানির সহযোগিতায় তৈরি করছে।
আজ অবধি, Cerebras মেয়ো ক্লিনিক, স্যান্ডিয়া ন্যাশনাল ল্যাবরেটরিজ, লরেন্স লিভারমোর ন্যাশনাল ল্যাবরেটরি এবং লস আলামোস ন্যাশনাল ল্যাবরেটরি সহ বৃহৎ গবেষণা সংস্থাগুলিতে একটি বিশেষ স্থান খুঁজে পেয়েছে। কোম্পানিটি সেপ্টেম্বর 2024-এ একটি IPO-এর জন্য ফাইল করেছে। প্রসপেক্টাস ইঙ্গিত দেয় যে কোম্পানির বিক্রয় 2023 সালে তিনগুণেরও বেশি বেড়ে $78.7 মিলিয়নে পৌঁছেছে এবং 2024 সালের প্রথমার্ধে $136.4 মিলিয়নে উন্নীত হয়েছে।