কৃত্রিম বুদ্ধিমত্তার (AI) আধিপত্য অর্জনের জন্য উচ্চ ঝুঁকি এবং বিপুল ব্যয়ের প্রতিযোগিতায়, প্রচলিত ধারণা প্রায়শই বলে যে নেতৃত্ব দেওয়াই বিজয়ের একমাত্র পথ। তবুও, Microsoft, জেনারেটিভ AI বিপ্লবের গভীরে প্রোথিত এক দৈত্য, একটি ভিন্ন পথ অনুসরণ করছে। Microsoft AI CEO Mustafa Suleyman-এর নির্দেশনায়, Redmond-এর এই বিশাল সংস্থাটি বিচক্ষণ দ্বিতীয় চালকের ভূমিকা গ্রহণ করেছে, অন্যদের পথ তৈরি করতে এবং বিপুল খরচ বহন করতে দিচ্ছে, যখন কৌশলগতভাবে তাদের সাফল্যের উপর ভিত্তি করে নিজেদের অবস্থান তৈরি করছে। এটি পিছিয়ে পড়া নয়; এটি দক্ষতা, অপ্টিমাইজেশন এবং শেষ পর্যন্ত বাজার একীকরণের একটি হিসাব করা কৌশল।
নেতাকে অনুসরণ করার অর্থনীতি
Mustafa Suleyman, যিনি DeepMind (পরে Google দ্বারা অধিগ্রহণকৃত) সহ-প্রতিষ্ঠার সময় থেকেই AI উদ্ভাবনের সাথে সমার্থক একটি নাম, Microsoft-এর দর্শন ব্যাখ্যা করতে দ্বিধা করেননি। সাম্প্রতিক পাবলিক ডিসকোর্সে, তিনি যুক্তিটি স্পষ্ট করেছেন: AI মডেল বিকাশের একেবারে কাটিং এজ থেকে ইচ্ছাকৃতভাবে তিন থেকে ছয় মাসের ব্যবধানে পিছিয়ে থাকা মৌলিকভাবে বেশি সাশ্রয়ী। সত্যিকারের ‘ফ্রন্টিয়ার’ মডেল—অ্যালগরিদম যা AI ক্ষমতার সীমানাকে ঠেলে দিচ্ছে—প্রশিক্ষণের জন্য প্রয়োজনীয় মূলধনের তীব্রতা বিশাল, যা বিলিয়ন ডলারে পৌঁছায় এবং তাৎক্ষণিক বাজার সাফল্য বা প্রয়োগযোগ্যতার কোনও গ্যারান্টি থাকে না।
‘আমাদের কৌশল হল এই মডেলগুলির মূলধন নিবিড়তার কারণে খুব কাছাকাছি দ্বিতীয় স্থানে থাকা,’ Suleyman অকপটে বলেছেন। এই পদ্ধতি একটি গুরুত্বপূর্ণ আর্থিক সুবিধা প্রদান করে। এই ভিত্তি মডেলগুলি তৈরি করার জন্য বিশাল ডেটাসেট, অত্যন্ত বিশেষায়িত ইঞ্জিনিয়ারদের বাহিনী এবং সবচেয়ে গুরুত্বপূর্ণভাবে, কম্পিউটিং পাওয়ারের বিশাল রিজার্ভে অ্যাক্সেস প্রয়োজন, যা প্রাথমিকভাবে ব্যয়বহুল, শক্তি-ক্ষুধার্ত GPU ক্লাস্টার দ্বারা চালিত হয়। OpenAI-এর মতো অগ্রগামীদের—একটি কোম্পানি যেখানে Microsoft বিলিয়ন ডলার বিনিয়োগ করেছে এবং যথেষ্ট ক্লাউড পরিকাঠামো সরবরাহ করে—উন্নয়নের প্রাথমিক, সবচেয়ে ঝুঁকিপূর্ণ পর্যায়গুলি মোকাবেলা করতে দিয়ে, Microsoft কার্যকরভাবে গবেষণা ও উন্নয়ন (R&D) বোঝা এবং আর্থিক ঝুঁকির একটি উল্লেখযোগ্য অংশ আউটসোর্স করে।
এই সাময়িক বাফার, তবে, কেবল অর্থ সাশ্রয়ের জন্য নয়। Suleyman জোর দিয়েছিলেন যে অতিরিক্ত মাসগুলি Microsoft-কে নির্দিষ্ট, বাস্তব গ্রাহক অ্যাপ্লিকেশনগুলির জন্য এই শক্তিশালী প্রযুক্তিগুলিকে পরিমার্জন এবং অপ্টিমাইজ করার জন্য অমূল্য সময় দেয়। ফ্রন্টিয়ার মডেলগুলি প্রায়শই শক্তিশালী কিন্তু কিছুটা সাধারণ সরঞ্জাম হিসাবে আবির্ভূত হয়। Microsoft-এর কৌশল এটিকে পর্যবেক্ষণ করতে দেয় কী কাজ করে, উদীয়মান ক্ষমতাগুলি বুঝতে পারে এবং তারপরে এর বিশাল এন্টারপ্রাইজ এবং ভোক্তা বেসের প্রয়োজন অনুসারে সরাসরি বাস্তবায়নগুলিকে তৈরি করতে পারে। এই ফোকাসটি বিশুদ্ধ প্রযুক্তিগত দক্ষতা থেকে ব্যবহারিক উপযোগিতায় স্থানান্তরিত হয় – AI-কে Windows, Office (Microsoft 365), Azure ক্লাউড পরিষেবা এবং এর ক্রমবর্ধমান Copilot সহকারীর স্যুটের মতো পণ্যগুলিতে নির্বিঘ্নে একীভূত করা। লক্ষ্য শুধু নতুনতম মডেল থাকা নয়, বরং বাস্তব-বিশ্বের কাজের জন্য সবচেয়ে দরকারী পুনরাবৃত্তি থাকা। এই গ্রাহক-কেন্দ্রিক অপ্টিমাইজেশন নিজেই একটি প্রতিযোগিতামূলক পার্থক্যকারক হয়ে ওঠে, যা প্রযুক্তিগত ফিনিশ লাইন জুড়ে একেবারে প্রথম হওয়ার চেয়ে দীর্ঘমেয়াদে সম্ভাব্যভাবে আরও মূল্যবান।
OpenAI সিম্বিওসিস: একটি কৌশলগত নির্ভরতা
Microsoft-এর বর্তমান AI অবস্থান OpenAI-এর সাথে এর গভীর এবং বহুমুখী সম্পর্কের সাথে অবিচ্ছেদ্যভাবে যুক্ত। এটি কেবল একটি নিষ্ক্রিয় বিনিয়োগ নয়; এটি Redmond-এর AI পণ্য কৌশলের একটি ভিত্তিপ্রস্তর। Microsoft OpenAI-কে বিশাল পরিমাণে Azure ক্লাউড কম্পিউট রিসোর্স সরবরাহ করে, যা GPT সিরিজের মতো মডেলগুলির প্রশিক্ষণ এবং চালানোর জন্য অপরিহার্য জ্বালানী। বিনিময়ে, Microsoft এই অত্যাধুনিক মডেলগুলিকে তার নিজস্ব ইকোসিস্টেমে একীভূত করার জন্য বিশেষাধিকারপ্রাপ্ত অ্যাক্সেস এবং লাইসেন্সিং অধিকার লাভ করে। এই সিম্বিওটিক ব্যবস্থা Microsoft-কে তার পণ্য ল্যান্ডস্কেপ জুড়ে কাটিং-এজ AI বৈশিষ্ট্যগুলি অফার করতে দেয়, সম্পূর্ণভাবে স্ক্র্যাচ থেকে তুলনীয় মডেলগুলি বিকাশের সম্পূর্ণ, অগ্রিম খরচ এবং ঝুঁকি বহন না করে।
Microsoft-এর দৃষ্টিকোণ থেকে, Sam Altman-এর দল OpenAI-তে ইতিমধ্যে যে হারকিউলিয়ান প্রচেষ্টা এবং ব্যয় করছে তা কেন প্রতিলিপি করবে, বিশেষ করে যখন অংশীদারিত্ব সেই শ্রমের ফলগুলিতে সরাসরি অ্যাক্সেস সরবরাহ করে? এটি একটি বাস্তববাদী পদ্ধতি যা OpenAI-এর কেন্দ্রীভূত গবেষণা ক্ষমতাগুলিকে কাজে লাগায় এবং Microsoft-কে বৃহত্তর একীকরণ, প্ল্যাটফর্ম নির্মাণ এবং বাজার স্থাপনার উপর মনোনিবেশ করতে দেয়। Microsoft-এর Copilot উদ্যোগগুলির সাফল্য, যা কোডিং থেকে স্প্রেডশীট পর্যন্ত সবকিছুতে AI সহায়তা যুক্ত করে, মূলত এই ভিত্তির উপর নির্মিত।
এই নির্ভরতা, যদিও কৌশলগত হতে পারে, স্বাভাবিকভাবেই দীর্ঘমেয়াদী স্বাধীনতা সম্পর্কে প্রশ্ন উত্থাপন করে। যদিও অংশীদারিত্ব বর্তমানে অত্যন্ত উপকারী, এটি একটি বাহ্যিক সত্তার উপর একটি উল্লেখযোগ্য নির্ভরতার প্রতিনিধিত্ব করে, যদিও বিনিয়োগ এবং পরিকাঠামো বিধানের মাধ্যমে ঘনিষ্ঠভাবে সংযুক্ত। এই সম্পর্কের গতিশীলতা জটিল এবং ক্রমাগত বিকশিত হচ্ছে, যা সমগ্র AI শিল্পের প্রতিযোগিতামূলক ল্যান্ডস্কেপকে আকার দিচ্ছে।
ঝুঁকি কমানো: Phi মডেলগুলির উত্থান
যদিও OpenAI অংশীদারিত্ব এর উচ্চ-প্রান্তের AI অফারগুলির ভিত্তি তৈরি করে, Microsoft তার সমস্ত চিপ এক নম্বরে রাখছে না। কোম্পানি একই সাথে একটি সমান্তরাল ট্র্যাক অনুসরণ করছে, Phi কোডনামের অধীনে তার নিজস্ব ছোট, আরও বিশেষায়িত ভাষা মডেলগুলির পরিবার তৈরি করছে। এই উদ্যোগটি তার সামগ্রিক AI কৌশলের একটি ভিন্ন, তবুও পরিপূরক, দিক উপস্থাপন করে।
GPT-4-এর মতো বিশাল, সাধারণ-উদ্দেশ্য মডেলগুলির বিপরীতে, Phi সিরিজের মডেলগুলি ইচ্ছাকৃতভাবে কমপ্যাক্ট এবং দক্ষ হওয়ার জন্য ডিজাইন করা হয়েছে। সাধারণত একক-অঙ্কের থেকে নিম্ন দ্বি-অঙ্কের বিলিয়ন প্যারামিটার কাউন্টে থাকে, এগুলি তাদের ফ্রন্টিয়ার প্রতিরূপগুলির চেয়ে কয়েকগুণ ছোট। এই ছোট আকার স্বতন্ত্র সুবিধা নিয়ে আসে:
- দক্ষতা: এগুলি চালানোর জন্য উল্লেখযোগ্যভাবে কম কম্পিউটেশনাল পাওয়ার প্রয়োজন, যা এগুলিকে স্কেলে পরিচালনা করার জন্য নাটকীয়ভাবে সস্তা করে তোলে।
- এজ কম্পিউটিং: তাদের পরিমিত রিসোর্সের প্রয়োজনীয়তা এগুলিকে স্থানীয় ডিভাইসগুলিতে, যেমন ল্যাপটপ বা এমনকি স্মার্টফোনগুলিতে স্থাপনার জন্য উপযুক্ত করে তোলে, শুধুমাত্র শক্তিশালী ক্লাউড-ভিত্তিক GPU ক্লাস্টারগুলির উপর নির্ভর না করে। এটি অফলাইন AI ক্ষমতা, উন্নত গোপনীয়তা এবং কম লেটেন্সি অ্যাপ্লিকেশনগুলির জন্য সম্ভাবনা উন্মুক্ত করে।
- অনুমোদনমূলক লাইসেন্সিং: Microsoft উল্লেখযোগ্যভাবে অনেক Phi মডেলকে অনুমোদনমূলক লাইসেন্সের (যেমন MIT লাইসেন্স) অধীনে প্রকাশ করেছে, যা এগুলিকে Hugging Face-এর মতো প্ল্যাটফর্মের মাধ্যমে বৃহত্তর গবেষণা ও উন্নয়ন সম্প্রদায়ের জন্য অবাধে উপলব্ধ করে তুলেছে। এটি উদ্ভাবনকে উৎসাহিত করে এবং বাহ্যিক ডেভেলপারদের Microsoft-এর কাজের উপর ভিত্তি করে তৈরি করতে দেয়।
যদিও এই Phi মডেলগুলি সাধারণত OpenAI-এর শীর্ষ-স্তরের অফারগুলির মতো একই বৈশিষ্ট্যের ব্যাপ্তি বা কাঁচা পারফরম্যান্স বেঞ্চমার্ক নিয়ে গর্ব করে না (সম্প্রতি পর্যন্ত, বৃহত্তর মডেলগুলিতে পাওয়া মাল্টি-মোডালিটি বা জটিল Mixture of Experts আর্কিটেকচারের মতো উন্নত বৈশিষ্ট্যগুলির অভাব ছিল), তারা তাদের আকারের জন্য উল্লেখযোগ্যভাবে সক্ষম প্রমাণিত হয়েছে। তারা প্রায়শই তাদের ওজন শ্রেণীর উপরে উল্লেখযোগ্যভাবে পারফর্ম করে, তাদের সীমাবদ্ধ প্যারামিটার সংখ্যার প্রেক্ষিতে নির্দিষ্ট কাজগুলিতে চিত্তাকর্ষক পারফরম্যান্স সরবরাহ করে। উদাহরণস্বরূপ, Phi-4-এর মতো একটি মডেল, সম্ভাব্য 14 বিলিয়ন প্যারামিটারে তুলনামূলকভাবে ছোট হওয়া সত্ত্বেও, একটি একক হাই-এন্ড GPU-তে কার্যকরভাবে কাজ করতে পারে, যা এর আকারের অনেক গুণ বড় মডেলগুলির জন্য একটি অসম্ভব কৃতিত্ব যা প্রায়শই GPU-তে পরিপূর্ণ পুরো সার্ভারের দাবি করে।
Phi পরিবারের উন্নয়ন একাধিক কৌশলগত উদ্দেশ্য পরিবেশন করে। এটি Microsoft-কে মডেল তৈরিতে অভ্যন্তরীণ দক্ষতা প্রদান করে, নির্দিষ্ট ধরণের অ্যাপ্লিকেশনগুলির জন্য বাহ্যিক অংশীদারদের উপর নির্ভরতা হ্রাস করে, দক্ষ এজ AI-এর ক্রমবর্ধমান চাহিদা পূরণ করে এবং ওপেন-সোর্স সম্প্রদায়ের মধ্যে সদিচ্ছা তৈরি করে। এটি একটি হেজ, একটি বিকল্প পথ, এবং সম্ভাব্যভাবে, বৃহত্তর AI স্বায়ত্তশাসনের দিকে একটি সোপান।
দীর্ঘমেয়াদী দৃষ্টিভঙ্গি: স্বনির্ভরতার দিকে
‘ফাস্ট ফলোয়ার’ কৌশলের বর্তমান কার্যকারিতা এবং OpenAI-এর সাথে গভীর একীকরণ সত্ত্বেও, Mustafa Suleyman Microsoft-এর চূড়ান্ত উচ্চাকাঙ্ক্ষা সম্পর্কে স্পষ্ট: দীর্ঘমেয়াদী AI স্বনির্ভরতা। তিনি এই দৃষ্টিভঙ্গিটি দ্ব্যর্থহীনভাবে ব্যক্ত করেছেন, বলেছেন, ‘এটি একেবারে মিশন ক্রিটিক্যাল যে দীর্ঘমেয়াদে আমরা Microsoft-এ AI স্বনির্ভরভাবে করতে সক্ষম হব।’ এটি ইঙ্গিত দেয় যে অংশীদারদের উপর বর্তমান নির্ভরতা, এখন যতই উপকারী হোক না কেন, একটি স্থায়ী অবস্থার পরিবর্তে একটি ক্রান্তিকালীন পর্যায় হিসাবে দেখা হয়।
এই লক্ষ্য অর্জনের জন্য গবেষণা, প্রতিভা অর্জন এবং পরিকাঠামো উন্নয়নে টেকসই, যথেষ্ট অভ্যন্তরীণ বিনিয়োগের প্রয়োজন হবে, যা Phi মডেল পরিবারের মতো প্রকল্পগুলির দ্বারা স্থাপিত ভিত্তির উপর নির্মিত হবে। এর অর্থ হল ফাউন্ডেশনাল মডেল তৈরি থেকে অ্যাপ্লিকেশন স্থাপন পর্যন্ত সমগ্র AI স্ট্যাক জুড়ে সক্ষমতা বিকাশ করা, সম্ভাব্যভাবে সেই অংশীদারদের প্রতিদ্বন্দ্বিতা করা যাদের উপর এটি বর্তমানে নির্ভর করে।
তবে, এই রূপান্তর আসন্ন নয়। Suleyman নিজেই প্রত্যাশাগুলিকে সংযত করেছেন, বিদ্যমান মূল অংশীদারিত্বের দীর্ঘায়ু উল্লেখ করে: ‘অন্তত 2030 সাল পর্যন্ত, আমরা OpenAI-এর সাথে গভীরভাবে অংশীদার, যাদের সাথে আমাদের জন্য একটি অত্যন্ত সফল সম্পর্ক রয়েছে।’ এই টাইমলাইনটি একটি আকস্মিক পরিবর্তনের পরিবর্তে একটি ধীরে ধীরে, বহু-বছরের বিবর্তনের পরামর্শ দেয়। পরবর্তী পাঁচ থেকে ছয় বছরে সম্ভবত Microsoft OpenAI-এর অগ্রগতিগুলিকে কাজে লাগাতে থাকবে এবং একই সাথে তার নিজস্ব অভ্যন্তরীণ শক্তি তৈরি করবে।
প্রাসঙ্গিক কারণগুলিও একটি ভূমিকা পালন করে। Microsoft-OpenAI ক্লাউড সম্পর্কের একচেটিয়াতা নিয়ে উদ্বেগ দেখা দেয় যখন OpenAI Oracle এবং Softbank জড়িত সহযোগিতার ঘোষণা দেয়, যা ইঙ্গিত দেয় যে Microsoft আর AI গবেষণা ল্যাবের একমাত্র ক্লাউড প্রদানকারী থাকবে না। যদিও মূল অংশীদারিত্ব শক্তিশালী রয়েছে, এই উন্নয়নগুলি দ্রুত পরিবর্তনশীল AI ল্যান্ডস্কেপে জোটের গতিশীল প্রকৃতিকে তুলে ধরে এবং সম্ভবত স্বাধীন সক্ষমতা গড়ে তোলার জন্য Microsoft-এর কৌশলগত অপরিহার্যতাকে শক্তিশালী করে। স্বনির্ভরতার পথ একটি দীর্ঘমেয়াদী কৌশলগত উদ্দেশ্য, যা ভবিষ্যতের স্বাধীনতার সাথে বর্তমান সুবিধাগুলির ভারসাম্য বজায় রাখে।
একটি বিস্তৃত প্রবণতা: ফলোয়ার প্যাক
কৌশলগত অনুসরণকারী হিসাবে Microsoft-এর হিসাব করা পদ্ধতি কোনও বিচ্ছিন্ন ঘটনা নয়। AI-এর একেবারে সীমানাকে ঠেলে দেওয়ার অন্তর্নিহিত বিপুল খরচ এবং অনিশ্চয়তা অন্যান্য প্রধান প্রযুক্তি খেলোয়াড়দের অনুরূপ, যদিও ভিন্ন, কৌশল গ্রহণ করতে পরিচালিত করেছে। এটি পরামর্শ দেয় যে জেনারেটিভ AI অঙ্গনে ‘ফাস্ট ফলোয়ার’ হওয়া একটি স্বীকৃত এবং টেকসই প্লেবুক হয়ে উঠছে।
Amazon Web Services (AWS) একটি আকর্ষণীয় সমান্তরাল উপস্থাপন করে। Microsoft-এর OpenAI-এর সাথে সম্পর্কের মতো, AWS Anthropic-এ প্রচুর পরিমাণে (বিলিয়ন ডলার) বিনিয়োগ করেছে, যা OpenAI-এর একটি বিশিষ্ট প্রতিদ্বন্দ্বী এবং তার Claude মডেল পরিবারের জন্য পরিচিত। AWS যথেষ্ট ক্লাউড কম্পিউট রিসোর্স সরবরাহ করে, যার মধ্যে তার Project Rainier ক্লাস্টারের মতো ডেডিকেটেড পরিকাঠামো রয়েছে, যা Anthropic-কে তার প্ল্যাটফর্মে একটি মূল অংশীদার হিসাবে অবস্থান করে। একই সাথে, AWS তার নিজস্ব ভাষা মডেলগুলির পরিবার তৈরি করছে, যা রিপোর্ট অনুযায়ী Nova কোডনামে পরিচিত। যাইহোক, Phi-এর সাথে Microsoft-এর তুলনামূলকভাবে উন্মুক্ত পদ্ধতির বিপরীতে, AWS দৃশ্যত Nova-কে মালিকানাধীন রাখছে, এটিকে প্রাথমিকভাবে তার নিজস্ব ইকোসিস্টেম এবং পরিষেবাগুলির মধ্যে একীভূত করছে। এটি ফলোয়ার কৌশলকে প্রতিফলিত করে: অভ্যন্তরীণ সক্ষমতা তৈরি করার সময় একটি নেতৃস্থানীয় অংশীদারকে কাজে লাগানো, যদিও Microsoft-এর ওপেন-সোর্স অবদানের তুলনায় আরও বন্ধ পদ্ধতির সাথে।
এই প্রবণতা Silicon Valley-এর বাইরেও বিস্তৃত। চীনা প্রযুক্তি জায়ান্টরাও এই কৌশলে দক্ষতা প্রদর্শন করেছে। Alibaba, তার Qwen টিমের মাধ্যমে, উল্লেখযোগ্য মনোযোগ আকর্ষণ করেছে। Qwen মডেল পরিবার, Microsoft-এর Phi-এর মতোই, তাদের আকারের মডেলগুলির জন্য প্রায়শই প্রত্যাশা ছাড়িয়ে যাওয়া পারফরম্যান্স অর্জনের জন্য পরিচিত। তারা অগত্যা প্রযুক্তিগতভাবে সম্পূর্ণ নতুন ভিত্তি স্থাপন করেনি তবে অন্যদের দ্বারা প্রবর্তিত ধারণাগুলিকে দ্রুত পুনরাবৃত্তি এবং অপ্টিমাইজ করতে পারদর্শী হয়েছে। উদাহরণস্বরূপ, Qwen টিম OpenAI ধারণাটিকে জনপ্রিয় করার পরে তুলনামূলকভাবে দ্রুত উন্নত যুক্তি ক্ষমতা অন্তর্ভুক্ত করে মডেলগুলি প্রকাশ করেছে, সেই প্রতিষ্ঠিত দৃষ্টান্তের মধ্যে দক্ষতা এবং পারফরম্যান্সের উপর ফোকাস করে। Alibaba, Microsoft-এর মতো, একটি তুলনামূলকভাবে উন্মুক্ত পদ্ধতিও গ্রহণ করেছে, অনেক Qwen মডেল জনসাধারণের জন্য প্রকাশ করেছে।
একইভাবে, DeepSeek, আরেকটি চীনা AI সত্তা, কেন্দ্রীভূত পুনরাবৃত্তির শক্তি প্রদর্শন করেছে। একবার যুক্তি-কেন্দ্রিক ভাষা মডেলগুলির ধারণা অগ্রগামীদের দ্বারা বৈধ হয়ে গেলে, DeepSeek এই আর্কিটেকচারগুলিকে অপ্টিমাইজ করার উপর মনোনিবেশ করে, এই জাতীয় মডেলগুলির প্রশিক্ষণ এবং চালানোর জন্য কম্পিউটেশনাল প্রয়োজনীয়তাগুলি উল্লেখযোগ্যভাবে হ্রাস করে। এটি তাদের অত্যন্ত সক্ষম মডেলগুলি অফার করতে দেয় যা তুলনামূলকভাবে কম রিসোর্স-ইনটেনসিভ ছিল, দক্ষতা এবং অ্যাক্সেসযোগ্যতার উপর ভিত্তি করে একটি কুলুঙ্গি তৈরি করে।
এই উদাহরণগুলি চিত্রিত করে যে ‘ফাস্ট ফলোয়ার’ কৌশল বিশ্বব্যাপী নিযুক্ত হচ্ছে। কোম্পানিগুলি যুগান্তকারী ঘটনাগুলি পর্যবেক্ষণ করে, অগ্রগামীদের সাফল্য এবং ভুল পদক্ষেপ থেকে শেখে এবং তারপরে তাদের সংস্থানগুলিকে অপ্টিমাইজ, পরিমার্জন এবং এই অগ্রগতিগুলিকে এমনভাবে একীভূত করার উপর ফোকাস করে যা তাদের নির্দিষ্ট বাজারের অবস্থান, গ্রাহক বেস এবং ব্যবসায়িক মডেলগুলির জন্য সবচেয়ে উপযুক্ত। এটি স্বীকার করে যে এমন একটি ক্ষেত্রে যেখানে এত বিশাল সংস্থান প্রয়োজন, কৌশলগত অনুকরণ এবং অভিযোজন ধ্রুবক উদ্ভাবনের চেয়ে ঠিক ততটাই শক্তিশালী এবং অনেক বেশি অর্থনৈতিক হতে পারে।
মডেলের বাইরে: AI ইকোসিস্টেম তৈরি করা
Microsoft-এর কৌশলের একটি গুরুত্বপূর্ণ, প্রায়শই অবমূল্যায়িত, সুবিধা হল সংস্থান এবং ফোকাসের মুক্তি। পরবর্তী যুগান্তকারী ভিত্তি মডেলের দৌড়ে প্রতিটি উপলব্ধ ডলার এবং ইঞ্জিনিয়ার ঢেলে না দিয়ে, Microsoft ব্যাপক AI গ্রহণের জন্য সবচেয়ে গুরুত্বপূর্ণ চ্যালেঞ্জ হতে পারে এমন বিষয়ে উল্লেখযোগ্য শক্তি উৎসর্গ করতে পারে: পার্শ্ববর্তী ইকোসিস্টেম তৈরি করা এবং ব্যবহারিক প্রয়োগ সক্ষম করা।
বিশ্বের সবচেয়ে শক্তিশালী AI মডেল সীমিত মূল্যের যদি এটি বিদ্যমান ওয়ার্কফ্লো, ব্যবসায়িক প্রক্রিয়া এবং সফ্টওয়্যার পণ্যগুলিতে কার্যকরভাবে একীভূত করা না যায়। এটি স্বীকার করে, Microsoft সরঞ্জাম, ফ্রেমওয়ার্ক এবং পরিকাঠামোর উপর অধ্যবসায়ের সাথে কাজ করছে যা কাঁচা AI ক্ষমতা এবং বাস্তব ব্যবসায়িক মূল্যের মধ্যে ব্যবধান পূরণ করার জন্য প্রয়োজন। AI বাস্তবায়নের এই ‘শেষ মাইল’-এর উপর ফোকাস যুক্তিযুক্তভাবে যেখানে এন্টারপ্রাইজ সফ্টওয়্যার এবং ক্লাউড প্ল্যাটফর্মে Microsoft-এর শক্তি একটি উল্লেখযোগ্য প্রতিযোগিতামূলক সুবিধা প্রদান করে।
বেশ কয়েকটি মূল উদ্যোগ এই ফোকাসকে তুলে ধরে:
- Autogen: এই ফ্রেমওয়ার্কটি একাধিক AI এজেন্ট একসাথে কাজ করে এমন অ্যাপ্লিকেশনগুলির তৈরি এবং অর্কেস্ট্রেশনকে সহজ করার জন্য ডিজাইন করা হয়েছে। জটিল কাজগুলির জন্য প্রায়শই সেগুলিকে বিশেষায়িত AI এজেন্টদের দ্বারা পরিচালিত উপ-কাজগুলিতে বিভক্ত করার প্রয়োজন হয়; Autogen এই মিথস্ক্রিয়াগুলি কার্যকরভাবে পরিচালনা করার জন্য কাঠামো সরবরাহ করে।
- KBLaM (Knowledge Base Language Model): ঘোষিত গবেষণা কাঠামোগত, বাহ্যিক ডেটা উত্স (যেমন ডেটাবেস) ব্যবহার করে একটি ভাষা মডেলের জ্ঞান বৃদ্ধি করার সাথে যুক্ত কম্পিউটেশনাল খরচ এবং জটিলতা হ্রাস করার উপর দৃষ্টি নিবদ্ধ করে। এটি এন্টারপ্রাইজ অ্যাপ্লিকেশনগুলির জন্য অত্যাবশ্যক যেখানে AI-কে নির্দিষ্ট কোম্পানির ডেটার উপর নির্ভুলভাবে এবং দক্ষতার সাথে যুক্তি দিতে হবে।
- VidTok: এই সম্প্রতি প্রবর্তিত ওপেন-সোর্স ভিডিও টোকেনাইজারটির লক্ষ্য হল ভিডিও বিষয়বস্তুকে এমন একটি ফর্ম্যাটে রূপান্তর করার উপায়কে মানসম্মত করা যা মেশিন লার্নিং মডেলগুলি সহজেই প্রক্রিয়া করতে এবং বুঝতে পারে। যেহেতু AI ক্রমবর্ধমানভাবে মাল্টি-মোডাল কাজগুলি (টেক্সট, ছবি, ভিডিও) মোকাবেলা করছে, VidTok-এর মতো সরঞ্জামগুলি অত্যাধুনিক ভিডিও-সচেতন অ্যাপ্লিকেশন তৈরির জন্য অপরিহার্য প্লাম্বিং হয়ে ওঠে।
এগুলি একটি বৃহত্তর প্রচেষ্টার কয়েকটি উদাহরণ মাত্র। Microsoft ডেভেলপার এবং ব্যবসার জন্য AI একীকরণকে সহজ, আরও দক্ষ এবং আরও নির্ভরযোগ্য করার লক্ষ্যে গবেষণা পত্র, সফ্টওয়্যার লাইব্রেরি এবং প্ল্যাটফর্ম বৈশিষ্ট্যগুলি ক্রমাগত প্রকাশ করছে। এর Phi মডেল ডেভেলপমেন্ট এবং OpenAI অংশীদারিত্বের পাশাপাশি এই সক্ষমকারী প্রযুক্তিগুলিতে ফোকাস করে, Microsoft কেবল AI মডেল তৈরি করছে না, বরং একটি ব্যাপক প্ল্যাটফর্ম তৈরি করছে যা তার বিশাল গ্রাহক বেস জুড়ে AI-কে অ্যাক্সেসযোগ্য, পরিচালনাযোগ্য এবং প্রকৃতপক্ষে দরকারী করার জন্য ডিজাইন করা হয়েছে। অ্যাপ্লিকেশন এবং একীকরণের উপর এই কৌশলগত জোর, ফ্রন্টিয়ার মডেল ডেভেলপমেন্টে ‘ফাস্ট ফলোয়ার’ হওয়ার খরচ সাশ্রয়ের দ্বারা সহজতর, শেষ পর্যন্ত দীর্ঘমেয়াদী AI দৌড়ে নির্ধারক ফ্যাক্টর হতে পারে।