বাইদু আনলো নতুন AI, দাবি বেঞ্চমার্কে সেরা

Ernie 4.5: একটি মাল্টিমোডাল পাওয়ারহাউস

Ernie 4.5, ছবি, অডিও এবং ভিডিও সহ বিস্তৃত মাল্টিমোডাল ক্ষমতা সহ, OpenAI-এর GPT-4o-এর তুলনায় উন্নত পারফরম্যান্স প্রদর্শন করেছে। বাইদুর মতে, CCBench এবং OCRBench-এর মতো বেঞ্চমার্ক প্ল্যাটফর্মে এই মডেলটি GPT-4o-কে ছাড়িয়ে গেছে। WeChat প্ল্যাটফর্মে প্রকাশিত একটি বিবৃতিতে বাইদু এই তথ্য জানিয়েছে। এছাড়াও, কোম্পানির দাবি, Ernie 4.5 ফাউন্ডেশনাল মডেলের টেক্সট-হ্যান্ডলিং ক্ষমতা শুধুমাত্র DeepSeek V3-এর চেয়ে বেশি নয়, বেঞ্চমার্ক মূল্যায়নের ভিত্তিতে OpenAI-এর GPT-4.5-এর সমতুল্য পারফরম্যান্স অর্জন করে।

বাইদুর অগ্রণী ভূমিকা এবং প্রতিযোগিতার উত্থান

চীনে প্রথম সারির প্রযুক্তি সংস্থা হিসেবে বাইদু প্রথম LLM চালু করে। OpenAI-এর ChatGPT লঞ্চের সাফল্যের পর, ২০২৩ সালের মার্চ মাসে বাইদু এই পদক্ষেপ নেয়। তবে, গত দুই বছরে চীনের অন্যান্য AI সংস্থাগুলি বাইদুর এই প্রাথমিক সুবিধাকে চ্যালেঞ্জ করে চলেছে। DeepSeek যখন একটি ওপেন-সোর্স প্রবণতা শুরু করেছে, তখন বাইদু চীনের AI বাজারে নিজেদের অবস্থানকে আরও শক্তিশালী করার জন্য এই কৌশলগত পদক্ষেপ নিয়েছে। একই সময়ে, Alibaba, Tencent এবং ByteDance-এর মতো শিল্প জায়ান্টরা তাদের নিজ নিজ AI মডেলগুলির জন্য ব্যবসা এবং ভোক্তা উভয় ব্যবহারকারীদের আকৃষ্ট করার জন্য আগ্রাসীভাবে চেষ্টা চালাচ্ছে।

Ernie X1: পারফরম্যান্স এবং মূল্য

বাইদু তার নতুন রিজনিং মডেল Ernie X1-এর জন্য নির্দিষ্ট বেঞ্চমার্ক ফলাফল প্রকাশ করেনি। তবে, কোম্পানি জানিয়েছে যে এটি ‘DeepSeek R1-এর সমতুল্য পারফরম্যান্স দেয়, কিন্তু খরচে অর্ধেক।’ এই বিবৃতিটি খরচের দিক থেকে একটি উল্লেখযোগ্য প্রতিযোগিতামূলক সুবিধার ইঙ্গিত দেয়।

যেসব ব্যবসা Ernie X1-এর ক্ষমতাগুলিকে একত্রিত করতে চায়, তাদের জন্য এর অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেস (API) অ্যাক্সেসের মূল্য নির্ধারণ করা হয়েছে: প্রতি মিলিয়ন ইনপুট টোকেনের জন্য ২ ইউয়ান (প্রায় US$0.28) এবং প্রতি মিলিয়ন আউটপুট টোকেনের জন্য ৮ ইউয়ান। অন্যদিকে, DeepSeek বর্তমানে তার DeepSeek-reasoner-এর জন্য প্রতি মিলিয়ন ইনপুট টোকেনের জন্য US$0.55 এবং প্রতি মিলিয়ন আউটপুট টোকেনের জন্য US$2.19 চার্জ করে, যা তার R1 রিজনিং মডেল দ্বারা চালিত। উল্লেখ্য, হ্যাংজু-ভিত্তিক স্টার্ট-আপ DeepSeek সম্প্রতি চাহিদার ব্যাপক বৃদ্ধির প্রতিক্রিয়ায় তার API-এর দাম বাড়িয়েছে।

বাইদুর ওপেন সোর্সের দিকে যাত্রা

বাইদুর প্রতিষ্ঠাতা, চেয়ারম্যান এবং সিইও রবিন লি ইয়ানহং গত মাসে Ernie 4.5-এর ভবিষ্যৎ সম্পর্কে একটি উল্লেখযোগ্য ঘোষণা করেছিলেন। তিনি প্রকাশ করেছেন যে মডেলটি ৩০শে জুন থেকে ওপেন সোর্স করা হবে। এটি তার পূর্বে ক্লোজড-সোর্স AI ডেভেলপমেন্টের প্রতি কট্টর সমর্থন থেকে একটি উল্লেখযোগ্য পরিবর্তন, তার দৃষ্টিভঙ্গিতে ১৮০-ডিগ্রি পরিবর্তনের ইঙ্গিত দেয়।

ফেব্রুয়ারিতে বিশ্লেষকদের সাথে একটি আর্নিং কলে লি এই কৌশলগত পরিবর্তনের বিষয়ে বিস্তারিত জানান, ‘DeepSeek থেকে আমরা একটি জিনিস শিখেছি তা হল সেরা মডেলগুলিকে ওপেন সোর্স করা গ্রহণের ক্ষেত্রে ব্যাপকভাবে সাহায্য করতে পারে।’ তিনি আরও ব্যাখ্যা করেন, ‘যখন মডেলটি ওপেন সোর্স হয়, তখন লোকেরা স্বাভাবিকভাবেই কৌতূহল থেকে এটি ব্যবহার করে দেখতে চায়, যা ব্যাপক গ্রহণে সহায়তা করে।’ ওপেন-সোর্স ডেভেলপমেন্টের সুবিধাগুলির এই স্বীকৃতি প্রতিযোগিতামূলক AI ল্যান্ডস্কেপে বাইদুর বিবর্তিত কৌশলকে তুলে ধরে।

AI অগ্রগতির মধ্যে বাইদুর ব্যবসায়িক পারফরম্যান্স

আর্টিফিশিয়াল ইন্টেলিজেন্সের ক্ষেত্রে বাইদু উল্লেখযোগ্য অগ্রগতি অর্জন করলেও, দুর্বল বিজ্ঞাপনের আয়ের কারণে কোম্পানির সামগ্রিক ব্যবসা বাধার সম্মুখীন হচ্ছে। সাম্প্রতিক আর্থিক প্রতিবেদনগুলি ইঙ্গিত দেয় যে চতুর্থ প্রান্তিকে বাইদুর মোট আয় বছরে ২ শতাংশ হ্রাস পেয়েছে। উপরন্তু, পুরো বছরের আয়ও ১ শতাংশ কমেছে। এই পরিসংখ্যানগুলি অত্যাধুনিক AI প্রযুক্তিতে বিনিয়োগ এবং শক্তিশালী আর্থিক পারফরম্যান্স বজায় রাখার প্রয়োজনের মধ্যে ভারসাম্য বজায় রাখতে বাইদুর চ্যালেঞ্জগুলিকে তুলে ধরে।

মূল দিকগুলির উপর সম্প্রসারণ

আরও বিস্তৃত ধারণা দেওয়ার জন্য, আসুন বাইদুর ঘোষণা এবং চীনের AI ল্যান্ডস্কেপের বৃহত্তর প্রেক্ষাপটের কিছু গুরুত্বপূর্ণ দিক নিয়ে আলোচনা করি।

মাল্টিমোডালিটির তাৎপর্য:

Ernie 4.5 এবং Ernie X1 উভয় ক্ষেত্রেই ‘মাল্টিমোডাল’ ক্ষমতার উপর জোর দেওয়া অত্যন্ত গুরুত্বপূর্ণ। ঐতিহ্যবাহী LLM গুলি প্রাথমিকভাবে টেক্সট-ভিত্তিক প্রক্রিয়াকরণের উপর দৃষ্টি নিবদ্ধ করত। যাইহোক, বিভিন্ন মাধ্যম – ছবি, অডিও এবং ভিডিও – থেকে তথ্য প্রক্রিয়া এবং বোঝার ক্ষমতা নতুন সম্ভাবনার দ্বার উন্মোচন করে। এর মধ্যে রয়েছে:

  • উন্নত চিত্র শনাক্তকরণ (Enhanced Image Recognition): AI মডেলগুলি এখন কেবল ছবিগুলিতে থাকা বস্তুগুলিকেই চিনতে পারে না, তাদের মধ্যেকার সম্পর্ক এবং প্রসঙ্গও বুঝতে পারে।
  • উন্নত অডিও ট্রান্সক্রিপশন এবং বিশ্লেষণ (Improved Audio Transcription and Analysis): কথ্য ভাষাকে আরও নির্ভুলতার সাথে প্রতিলিপি করা এবং এমনকি অডিও রেকর্ডিংয়ে আবেগ এবং অভিপ্রায়ের মতো সূক্ষ্মতাগুলি সনাক্ত করা।
  • ভিডিও বোঝা (Video Understanding): ভিডিও বিষয়বস্তু বিশ্লেষণ করে দৃশ্য, ক্রিয়া শনাক্ত করা এবং এমনকি ভবিষ্যতের ঘটনাগুলির পূর্বাভাস দেওয়া।

ওপেন-সোর্স বিতর্ক:

রবিন লি-এর Ernie 4.5-কে ওপেন-সোর্স করার সিদ্ধান্ত ক্লোজড-সোর্স এবং ওপেন-সোর্স AI ডেভেলপমেন্টের মধ্যে চলমান বিতর্কে একটি উল্লেখযোগ্য ঘটনা।

  • ক্লোজড-সোর্স (Closed-Source): এই পদ্ধতির সমর্থকরা যুক্তি দেন যে এটি প্রযুক্তির উপর আরও ভাল নিয়ন্ত্রণের অনুমতি দেয়, এর দায়িত্বশীল ব্যবহার নিশ্চিত করে এবং অপব্যবহার রোধ করে। এটি কোম্পানিগুলিকে তাদের বৌদ্ধিক সম্পত্তি রক্ষা করতে এবং প্রতিযোগিতামূলক সুবিধা বজায় রাখতে সহায়তা করে।
  • ওপেন-সোর্স (Open-Source): ওপেন-সোর্স ডেভেলপমেন্টের সমর্থকরা বিশ্বাস করেন যে এটি সহযোগিতা বাড়ায়, উদ্ভাবনকে ত্বরান্বিত করে এবং স্বচ্ছতা প্রচার করে। এটি বিশ্বব্যাপী গবেষক এবং ডেভেলপারদের AI প্রযুক্তির অগ্রগতিতে অবদান রাখতে দেয়।

বাইদুর ওপেন-সোর্সিংয়ের দিকে যাত্রা, অন্তত Ernie 4.5-এর জন্য, ওপেন-সোর্স আন্দোলনের ক্রমবর্ধমান গতি এবং এর সম্ভাব্য সুবিধাগুলির স্বীকৃতি સૂચવે છે।

প্রতিযোগিতামূলক ল্যান্ডস্কেপ:

চীনের AI প্রতিযোগিতা তীব্র, যেখানে অসংখ্য কোম্পানি আধিপত্যের জন্য প্রতিদ্বন্দ্বিতা করছে।

  • Alibaba: আলিবাবার Tongyi Qianwen LLM একটি প্রধান প্রতিযোগী, এবং কোম্পানিটি সক্রিয়ভাবে তার বিভিন্ন ব্যবসায়িক ইউনিট, যেমন ই-কমার্স, ক্লাউড কম্পিউটিং এবং লজিস্টিক্সে AI-কে একীভূত করছে।
  • Tencent: টেনসেন্টের Hunyuan LLM আরেকটি উল্লেখযোগ্য প্রতিযোগী, এবং কোম্পানিটি তার সোশ্যাল মিডিয়া প্ল্যাটফর্ম, গেমিং অফার এবং ক্লাউড পরিষেবাগুলিকে উন্নত করতে AI-এর সুবিধা নিচ্ছে।
  • ByteDance: TikTok-এর মূল কোম্পানি ByteDance-ও AI-তে প্রচুর বিনিয়োগ করছে, তার সুপারিশ অ্যালগরিদমগুলিকে শক্তিশালী করতে এবং নতুন পণ্য তৈরি করতে এটি ব্যবহার করছে।
  • DeepSeek: DeepSeek, LLM এর ক্ষেত্রে একটি শক্তিশালী প্রতিযোগী।

মূল্যের প্রভাব:

Ernie X1-এর জন্য বাইদুর আক্রমণাত্মক মূল্য নির্ধারণের কৌশল, DeepSeek-এর মূল্যকে অর্ধেকেরও কমিয়ে দেওয়া, বাজারে শেয়ার অর্জনের অভিপ্রায়ের একটি স্পষ্ট ইঙ্গিত। এই মূল্য যুদ্ধ সম্ভাব্যভাবে ব্যবসা এবং ভোক্তাদের AI প্রযুক্তিকে আরও সহজলভ্য এবং সাশ্রয়ী করে তোলার মাধ্যমে উপকৃত করতে পারে।

বিস্তৃত প্রভাব:

AI-তে বাইদুর অগ্রগতি, চীনের বাজারে তীব্র প্রতিযোগিতার সাথে, সুদূরপ্রসারী প্রভাব ফেলেছে:

  • প্রযুক্তিগত অগ্রগতি (Technological Advancement): উদ্ভাবনের দ্রুত গতি আরও বিস্তৃত ক্ষমতা সহ ক্রমবর্ধমান অত্যাধুনিক AI মডেলগুলির বিকাশের দিকে পরিচালিত করছে।
  • অর্থনৈতিক প্রভাব (Economic Impact): AI বিভিন্ন শিল্পকে রূপান্তরিত করতে, উৎপাদনশীলতা বাড়াতে, নতুন কর্মসংস্থান তৈরি করতে এবং সম্ভাব্যভাবে বিশ্ব অর্থনীতির ল্যান্ডস্কেপকে পুনর্গঠিত করতে প্রস্তুত।
  • সামাজিক প্রভাব (Societal Impact): AI-এর ব্যাপক গ্রহণ গুরুত্বপূর্ণ নৈতিক ও সামাজিক প্রশ্ন উত্থাপন করে, যার মধ্যে পক্ষপাত, গোপনীয়তা এবং কর্মসংস্থান হারানোর মতো বিষয়গুলি অন্তর্ভুক্ত রয়েছে।

বাইদুর কৌশল সম্পর্কে আরও বিশদ বিবরণ

বাইদুর কৌশলটি প্রযুক্তিগত উদ্ভাবন এবং বাজারের অবস্থান উভয়কেই অন্তর্ভুক্ত করে বহুমুখী বলে মনে হচ্ছে।

1. প্রযুক্তিগত দক্ষতা (Technological Prowess):

  • মাল্টিমোডালিটির উপর ফোকাস: বাইদু স্পষ্টতই মাল্টিমোডাল AI মডেলগুলির বিকাশের উপর জোর দিচ্ছে, নতুন অ্যাপ্লিকেশন এবং ক্ষমতা আনলক করার ক্ষেত্রে এই প্রযুক্তির সম্ভাবনাকে স্বীকৃতি দিচ্ছে।
  • ক্রমাগত উন্নতি (Continuous Improvement): Ernie 4.5 এবং Ernie X1-এর প্রকাশ AI-এর পারফরম্যান্সের সীমানা ক্রমাগত প্রসারিত করে, চলমান গবেষণা ও উন্নয়নের প্রতি বাইদুর প্রতিশ্রুতি প্রদর্শন করে।
  • ওপেন-সোর্স গ্রহণ (Open-Source Embrace): Ernie 4.5-কে ওপেন-সোর্স করার সিদ্ধান্ত বৃহত্তর AI সম্প্রদায়ের সাথে যুক্ত হওয়ার এবং ক্ষেত্রের সম্মিলিত অগ্রগতিতে অবদান রাখার ইচ্ছার ইঙ্গিত দেয়।

2. বাজারের অবস্থান (Market Positioning):

  • প্রতিযোগিতামূলক মূল্য (Competitive Pricing): Ernie X1-এর আক্রমণাত্মক মূল্য নির্ধারণ অত্যন্ত প্রতিযোগিতামূলক LLM ল্যান্ডস্কেপে ব্যবহারকারীদের আকৃষ্ট করতে এবং বাজারের শেয়ার অর্জনের একটি কৌশলগত পদক্ষেপ।
  • ব্যবসাগুলিকে লক্ষ্য করা (Targeting Businesses): API অ্যাক্সেসের উপর ফোকাস ইঙ্গিত দেয় যে বাইদু সক্রিয়ভাবে সেই ব্যবসাগুলিকে লক্ষ্য করছে যারা তাদের কার্যক্রমে AI-কে একীভূত করতে চাইছে।
  • দুর্বলতাগুলি সমাধান করা (Addressing Weaknesses): কোম্পানিটি তার দুর্বলতাগুলি, যেমন বিজ্ঞাপনের আয় হ্রাস, স্বীকার করছে এবং তার AI অগ্রগতিগুলিকে কাজে লাগিয়ে তার অফারগুলিকে বৈচিত্র্যময় করতে এবং নতুন আয়ের উৎস অন্বেষণ করতে চাইছে।

3. দীর্ঘমেয়াদী দৃষ্টিভঙ্গি (Long-Term Vision):

  • AI নেতৃত্ব (AI Leadership): বাইদুর পদক্ষেপগুলি কেবল চীনের মধ্যেই নয়, বিশ্বব্যাপী AI ল্যান্ডস্কেপে একজন নেতা হওয়ার একটি স্পষ্ট উচ্চাকাঙ্ক্ষা સૂચવે છે।
  • রূপান্তরমূলক প্রযুক্তি (Transformative Technology): কোম্পানিটি AI-কে একটি রূপান্তরমূলক প্রযুক্তি হিসাবে দেখছে বলে মনে হচ্ছে, যার মধ্যে তার ব্যবসাকে পুনর্গঠিত করার এবং বৃহত্তর সামাজিক অগ্রগতিতে অবদান রাখার সম্ভাবনা রয়েছে।
  • অভিযোজনযোগ্যতা (Adaptability): ওপেন-সোর্স ডেভেলপমেন্টের দিকে পরিবর্তনের মাধ্যমে প্রমাণিত বাইদুর কৌশল পরিবর্তন করার ইচ্ছা, AI শিল্পের বিবর্তিত গতিশীলতার প্রতি তার তৎপরতা এবং প্রতিক্রিয়াশীলতা প্রদর্শন করে।

সংक्षेप, বাইদু নিজেকে AI বিপ্লবের একটি প্রধান শক্তি হিসাবে প্রতিষ্ঠিত করছে, তার উচ্চাভিলাষী লক্ষ্য অর্জনের জন্য কৌশলগত বাজারের কৌশলের সাথে প্রযুক্তিগত উদ্ভাবনকে একত্রিত করছে। কোম্পানির অগ্রগতি এবং চীনা AI বাজারে চলমান প্রতিযোগিতা নিবিড়ভাবে পর্যবেক্ষণ করা হবে, কারণ এগুলি বিশ্বব্যাপী AI-এর ভবিষ্যতের জন্য তাৎপর্যপূর্ণ প্রভাব ফেলবে।