ERNIE X1 এবং ERNIE 4.5: AI এরিনাতে বাইদুর নতুন প্রতিযোগী
বাইদু, চীনের প্রযুক্তি ক্ষেত্রের একটি প্রভাবশালী শক্তি, তার ERNIE (Enhanced Representation through Knowledge Integration) ফাউন্ডেশন মডেলে দুটি গুরুত্বপূর্ণ আপডেট চালু করেছে। এই নতুন সংস্করণগুলি, ERNIE X1 এবং ERNIE 4.5, বাইদুর ক্রমবর্ধমান প্রতিযোগিতামূলক বিশ্বব্যাপী AI ভূদৃশ্যের প্রতি কৌশলগত প্রতিক্রিয়া উপস্থাপন করে, বিশেষ করে চীনা এবং আমেরিকান উভয় কোম্পানির দ্বারা করা অগ্রগতির প্রতি। এই মডেলগুলি নিছক ক্রমবর্ধমান আপগ্রেড নয়; এগুলি উপলব্ধ সবচেয়ে উন্নত কিছু AI সিস্টেমের সাথে সরাসরি প্রতিদ্বন্দ্বিতা করার জন্য ডিজাইন করা হয়েছে, বাইদুর মতে, তাদের প্রতিদ্বন্দ্বীদের ক্ষমতাগুলির সাথে মেলে বা অতিক্রম করে এমন ক্ষমতা নিয়ে গর্ব করে৷ উভয় মডেলই ERNIE বট চ্যাটবটের মাধ্যমে ব্যবহারকারীদের কাছে অ্যাক্সেসযোগ্য, এবং বাইদু তার ফ্ল্যাগশিপ বাইদু সার্চ সহ তার বিস্তৃত পণ্য পরিসরে একটি পর্যায়ক্রমিক ইন্টিগ্রেশন পরিকল্পনা করেছে।
এই রিলিজের সময় অত্যন্ত গুরুত্বপূর্ণ। জেনারেটিভ AI সেক্টর দ্রুত উদ্ভাবন এবং তীব্র প্রতিদ্বন্দ্বিতার একটি সময় অনুভব করছে, বিশেষ করে চীন এবং মার্কিন যুক্তরাষ্ট্রের মধ্যেকার গতির উপর। ডিপসিক, একটি চীনা AI স্টার্টআপ, 2025 সালের প্রথম দিকে R1 এর সাথে শিল্পের মনোযোগ আকর্ষণ করেছিল, একটি ওপেন-সোর্স রিজনিং মডেল যা উল্লেখযোগ্যভাবে কম খরচে শীর্ষস্থানীয় AI মডেলগুলিকে ছাড়িয়ে গেছে বলে জানা গেছে। এই পদক্ষেপটি ডিপসিককে চীন এবং মার্কিন যুক্তরাষ্ট্র উভয় দেশের প্রতিযোগীদের, বাইদু সহ, এগিয়ে নিয়ে গেছে। বাইদু, যাইহোক, চ্যাটজিপিটি প্রতিযোগী, ERNIE বট চালু করার জন্য প্রথম চীনা কোম্পানিগুলির মধ্যে একটি ছিল।
ERNIE X1 এবং ERNIE 4.5: বাইদুর নতুন মডেলগুলির একটি ঘনিষ্ঠ পর্যবেক্ষণ
ERNIE X1 এবং ERNIE 4.5, উভয়ই বাইদু দ্বারা বিকশিত, স্বতন্ত্র ফাউন্ডেশন মডেল যা বিভিন্ন অ্যাপ্লিকেশনের জন্য তৈরি:
ERNIE X1: এই মডেলটি একটি উচ্চ-দক্ষতা সম্পন্ন রিজনিং ইঞ্জিন হিসাবে অবস্থান করছে, যা সরাসরি ডিপসিক R1 এবং OpenAI-এর o3 মিনির মতো মডেলগুলিকে চ্যালেঞ্জ করে৷ এটি জটিল লজিক্যাল প্রসেসিং এবং মাল্টি-স্টেপ সমস্যা সমাধানের প্রয়োজনীয় কাজগুলির জন্য ডিজাইন করা হয়েছে।
ERNIE 4.5: এই মডেলটি একটি বৃহৎ মাল্টিমোডাল AI, যা বিভিন্ন ধরণের মিডিয়া – টেক্সট, ছবি, অডিও এবং ভিডিও – প্রক্রিয়া এবং বুঝতে সক্ষম। এটি GPT-4o এবং Google-এর Gemini-এর মতো মডেলগুলির সাথে প্রতিযোগিতা করে।
ডিপসিকের R1-এর উত্থান গুগল, ওপেনএআই, অ্যানথ্রপিক এবং xAI-এর মতো প্রধান AI খেলোয়াড়দের অগ্রাধিকারের ক্ষেত্রে একটি পরিবর্তন এনেছে। এই কোম্পানিগুলি কাঁচা মডেল স্কেলের পাশাপাশি দক্ষতা এবং সাশ্রয়ী মূল্যের উপর ফোকাস করতে শুরু করে। বাইদুর ERNIE X1-এর প্রবর্তন, বিশেষ করে, এই গ্লোবাল AI রেসে তার প্রবেশকে নির্দেশ করে, যা R1 এবং অন্যান্য মডেলের সাথে তুলনীয় পারফরম্যান্স অফার করে, সম্ভাব্যভাবে আরও প্রতিযোগিতামূলক মূল্যে।
বাইদু জোর দেয় যে 2025 সাল বৃহৎ ভাষা মডেল এবং সম্পর্কিত প্রযুক্তিগুলির বিবর্তনের জন্য একটি গুরুত্বপূর্ণ বছর। কোম্পানির প্রেস রিলিজ কৃত্রিম বুদ্ধিমত্তা, ডেটা সেন্টার এবং ক্লাউড পরিকাঠামোতে বিনিয়োগ করার জন্য তার চলমান প্রতিশ্রুতি তুলে ধরে, যার লক্ষ্য তার AI ক্ষমতা আরও বাড়ানো এবং আরও শক্তিশালী পরবর্তী প্রজন্মের মডেল তৈরি করা।
ERNIE X1: ডিপ-থিংকিং রিজনিং-এ অনুসন্ধান
ERNIE X1 হল একটি ভাষা মডেল যা বিশেষভাবে “ডিপ-থিংকিং রিজনিং” এর জন্য ইঞ্জিনিয়ার করা হয়েছে। এটি এটিকে ঐতিহ্যবাহী ভাষা মডেলগুলি থেকে আলাদা করে যা দ্রুত, প্যাটার্ন-ভিত্তিক প্রতিক্রিয়া তৈরিতে পারদর্শী। বিপরীতে, রিজনিং মডেলগুলি জটিল সমস্যাগুলিকে লজিক্যাল ধাপগুলির একটি সিরিজে বিভক্ত করার জন্য ডিজাইন করা হয়েছে। তারা বিভিন্ন সম্ভাব্য সমাধান মূল্যায়ন করে এবং একটি চূড়ান্ত আউটপুট উপস্থাপন করার আগে তাদের উত্তরগুলিকে পরিমার্জিত করে। এটি তাদের এমন কাজগুলির জন্য বিশেষভাবে উপযুক্ত করে তোলে যেগুলিতে মাল্টি-স্টেপ প্ল্যানিং, লজিক্যাল ডিডাকশন এবং জটিল সমস্যা-সমাধান জড়িত।
বাইদু ERNIE X1-এর রিজনিং সক্ষমতাকে বেশ কয়েকটি উন্নত কৌশলের জন্য দায়ী করে, যার মধ্যে রয়েছে:
- প্রগ্রেসিভ রিইনফোর্সমেন্ট লার্নিং: এটি একটি পুনরাবৃত্তিমূলক শেখার প্রক্রিয়া নির্দেশ করে যেখানে মডেল প্রতিক্রিয়ার মাধ্যমে ক্রমাগত তার কর্মক্ষমতা উন্নত করে।
- এন্ড-টু-এন্ড ট্রেনিং: এটি একটি সামগ্রিক প্রশিক্ষণ পদ্ধতির ইঙ্গিত দেয় যেখানে পুরো মডেলটি পৃথক পর্যায়ে না হয়ে একযোগে অপ্টিমাইজ করা হয়।
- চেইন অফ থট অ্যান্ড অ্যাকশন: এই কৌশলটি সম্ভবত মডেলটিকে লজিক্যাল ধাপগুলির একটি ক্রম অনুসরণ করতে সক্ষম করে, মানুষের চিন্তার প্রক্রিয়াগুলির অনুকরণ করে।
- ইউনিফায়েড মাল্টি-ফেসেটেড রিওয়ার্ড সিস্টেম: এটি রিজনিং-এর বিভিন্ন দিক জুড়ে মডেলের কর্মক্ষমতা মূল্যায়ন এবং পুরস্কৃত করার জন্য একটি অত্যাধুনিক সিস্টেমের পরামর্শ দেয়।
যদিও বাইদু বিস্তারিত প্রযুক্তিগত বিবরণ প্রকাশ করেনি, এই পদ্ধতিগুলি পুনরাবৃত্তিমূলক শিক্ষা, প্রাসঙ্গিক বোঝাপড়া এবং কাঠামোগত রিজনিং-এর উপর ফোকাস করার দিকে নির্দেশ করে – এমন শক্তি যা অন্যান্য সফল রিজনিং মডেলগুলিরও বৈশিষ্ট্য।
ব্যবহারিক প্রয়োগের ক্ষেত্রে, বাইদু দাবি করে যে ERNIE X1 “বোঝা, পরিকল্পনা, প্রতিফলন এবং বিবর্তনের ক্ষেত্রে বর্ধিত ক্ষমতা” প্রদর্শন করে। কোম্পানিটি নিম্নলিখিত ক্ষেত্রগুলিতে তার দক্ষতা তুলে ধরে:
- সাহিত্য সৃষ্টি: সৃজনশীল টেক্সট ফরম্যাট তৈরি করা।
- পাণ্ডুলিপি লেখা: দীর্ঘ নথির খসড়া তৈরিতে সহায়তা করা।
- সংলাপ: স্বাভাবিক এবং সুসংগত কথোপকথনে জড়িত হওয়া।
- লজিক্যাল রিজনিং: লজিক্যাল ডিডাকশন প্রয়োজনীয় সমস্যা সমাধান করা।
- জটিল গণনা: জটিল গাণিতিক অপারেশন সম্পাদন করা।
- “চাইনিজ নলেজ”: এই অনির্দিষ্ট ক্ষমতা সম্ভবত চীনা ভাষা, সংস্কৃতি এবং প্রেক্ষাপট সম্পর্কে গভীর জ্ঞানকে বোঝায়।
ফলস্বরূপ, ERNIE X1 বিভিন্ন ধরণের অ্যাপ্লিকেশানকে শক্তিশালী করার জন্য কল্পনা করা হয়েছে, যার মধ্যে রয়েছে:
- সার্চ ইঞ্জিন: আরও সূক্ষ্ম বোধগম্যতা সহ অনুসন্ধানের ফলাফলগুলিকে উন্নত করা।
- ডকুমেন্ট সামারাইজেশন এবং Q&A: সংক্ষিপ্ত সারসংক্ষেপ এবং প্রশ্নের সঠিক উত্তর প্রদান করা।
- ইমেজ আন্ডারস্ট্যান্ডিং এবং জেনারেশন: ভিজ্যুয়াল বিষয়বস্তু ব্যাখ্যা করা এবং তৈরি করা।
- কোড ইন্টারপ্রিটেশন: প্রোগ্রামিং কোড বিশ্লেষণ এবং বোঝা।
- ওয়েবপেজ বিশ্লেষণ: ওয়েব পেজ থেকে মূল তথ্য বের করা।
- মাইন্ড ম্যাপিং: ধারণা এবং ধারণার ভিজ্যুয়াল উপস্থাপনা তৈরি করা।
- একাডেমিক রিসার্চ: বিভিন্ন শাখায় গবেষণার কাজে সহায়তা করা।
- ব্যবসা এবং ফ্র্যাঞ্চাইজি তথ্য অনুসন্ধান: ব্যবসার অনুসন্ধানের জন্য প্রাসঙ্গিক তথ্য প্রদান করা।
ERNIE X1: প্রতিযোগিতার বিরুদ্ধে বেঞ্চমার্কিং
যদিও বাইদু ERNIE X1-এর জন্য নির্দিষ্ট বেঞ্চমার্ক স্কোর বা বিস্তারিত মূল্যায়ন প্রকাশ করেনি, এটি জোর দিয়ে বলে যে মডেলটির কর্মক্ষমতা ডিপসিক R1-এর “সমতুল্য”, যেখানে “অর্ধেক দামে” অফার করা হচ্ছে। বর্তমানে, বাইদু বাজারের অন্যান্য রিজনিং মডেলগুলির সাথে তুলনা প্রদান করেনি। এই বিস্তারিত তুলনামূলক ডেটার অভাব ERNIE X1-এর প্রতিযোগিতামূলক অবস্থানকে সম্পূর্ণরূপে মূল্যায়ন করা কঠিন করে তোলে, তবে কম খরচে তুলনীয় পারফরম্যান্সের দাবি অবশ্যই উল্লেখযোগ্য।
ERNIE 4.5: নেটিভ মাল্টিমোডাল ক্ষমতা আলিঙ্গন
ERNIE 4.5 বাইদু দ্বারা একটি “নেটিভ মাল্টিমোডাল মডেল” হিসাবে উপস্থাপিত হয়েছে। এর মানে হল এটি একটি ইউনিফায়েড ফ্রেমওয়ার্কের মধ্যে বিভিন্ন ধরণের মিডিয়া – টেক্সট, ছবি, অডিও এবং ভিডিও – নির্বিঘ্নে সংহত এবং বোঝার জন্য ডিজাইন করা হয়েছে। অনেক AI সিস্টেমের বিপরীতে যা বিভিন্ন মিডিয়ার প্রকারগুলিকে আলাদাভাবে প্রক্রিয়া করে, ERNIE 4.5 এই পদ্ধতিগুলিকে একত্রিত করার জন্য এবং এমনকি তাদের মধ্যে রূপান্তর করার জন্য ইঞ্জিনিয়ার করা হয়েছে (যেমন, টেক্সট থেকে অডিও এবং তদ্বিপরীত)।
বাইদু হাইলাইট করে যে ERNIE 4.5 “একাধিক পদ্ধতির যৌথ মডেলিংয়ের মাধ্যমে সহযোগী অপ্টিমাইজেশান অর্জন করে, ব্যতিক্রমী মাল্টিমোডাল বোধগম্যতা ক্ষমতা প্রদর্শন করে।” এটি একটি অত্যাধুনিক পদ্ধতির পরামর্শ দেয় যেখানে মডেলটি বিভিন্ন মিডিয়ার প্রকার জুড়ে তথ্য বুঝতে এবং সম্পর্কিত করতে শেখে।
তার মাল্টিমোডাল দক্ষতার পাশাপাশি, ERNIE 4.5 “পরিমার্জিত ভাষা দক্ষতা” নিয়ে গর্ব করে, এর বোধগম্যতা এবং প্রজন্মের ক্ষমতা, সেইসাথে এর লজিক্যাল রিজনিং, মেমরি এবং কোডিং ক্ষমতা বাড়ায়। বাইদু মডেলের “শক্তিশালী বুদ্ধি” এবং “প্রাসঙ্গিক সচেতনতা” এর উপরও জোর দেয়, বিশেষ করে ইন্টারনেট মেম এবং ব্যঙ্গাত্মক কার্টুনের মতো সূক্ষ্ম বিষয়বস্তু চিনতে পারার ক্ষমতার উপর। এটি কেবল বিষয়বস্তুর আক্ষরিক অর্থ নয়, এর সাংস্কৃতিক ও সামাজিক প্রেক্ষাপট বোঝার উপরও ফোকাস নির্দেশ করে।
অধিকন্তু, বাইদু দাবি করে যে ERNIE 4.5 “হ্যালুসিনেশন” -এর প্রতি কম সংবেদনশীল – AI-তে একটি সাধারণ সমস্যা যেখানে মডেলগুলি মিথ্যা বা বিভ্রান্তিকর তথ্য তৈরি করে যা প্রথম নজরে যুক্তিসঙ্গত বলে মনে হতে পারে। এটি একটি গুরুত্বপূর্ণ উন্নতি, কারণ হ্যালুসিনেশন AI সিস্টেমের নির্ভরযোগ্যতা এবং বিশ্বাসযোগ্যতাকে ক্ষুণ্ণ করতে পারে।
বাইদু এই অগ্রগতিগুলিকে বেশ কয়েকটি মূল প্রযুক্তির জন্য দায়ী করে, যার মধ্যে রয়েছে:
- স্প্যাটিওটেম্পোরাল রিপ্রেজেন্টেশন কম্প্রেশন: এটি সম্ভবত এমন কৌশলগুলিকে বোঝায় যা সময় এবং স্থানের সাথে পরিবর্তিত তথ্য, যেমন ভিডিও সামগ্রী, দক্ষতার সাথে উপস্থাপন এবং প্রক্রিয়া করার জন্য।
- নলেজ-সেন্ট্রিক ট্রেনিং ডেটা কনস্ট্রাকশন: এটি এমন প্রশিক্ষণ ডেটাসেট তৈরির উপর ফোকাস করার পরামর্শ দেয় যা বাস্তব তথ্যে সমৃদ্ধ।
- সেল্ফ-ফিডব্যাক এনহ্যান্সড পোস্ট-ট্রেনিং: এটি এমন একটি ব্যবস্থার ইঙ্গিত দেয় যেখানে মডেলটি তার নিজস্ব আউটপুট থেকে শিখতে পারে এবং সময়ের সাথে সাথে তার কর্মক্ষমতা উন্নত করতে পারে।
- হেটেরোজেনিয়াস মাল্টিমোডাল মিক্সচার-অফ-এক্সপার্টস (MoE): এই পদ্ধতিটি ছোট, বিশেষায়িত “বিশেষজ্ঞ” মডেল ব্যবহার করে যা শুধুমাত্র প্রয়োজনের সময় সক্রিয় হয়। এটি কর্মক্ষমতা অপ্টিমাইজ করে এবং গণনামূলক খরচ কমায়। MoE মডেলগুলি প্রায়শই ঐতিহ্যবাহী ট্রান্সফরমার-ভিত্তিক মডেলগুলির চেয়ে ছোট এবং আরও সাশ্রয়ী হয়, তবুও তারা তুলনামূলক বা এমনকি উচ্চতর কর্মক্ষমতা অর্জন করতে পারে, যা তাদের AI বিকাশের জন্য একটি আকর্ষণীয় বিকল্প করে তোলে।
সামনের দিকে তাকিয়ে, রিপোর্টগুলি ইঙ্গিত দেয় যে বাইদু 2025 সালে ERNIE 5 প্রকাশ করার পরিকল্পনা করেছে, তার মাল্টিমোডাল ক্ষমতাগুলিতে “বড় বর্ধিতকরণ” করার প্রতিশ্রুতি দিয়েছে। এটি মাল্টিমোডাল AI-এর সীমানা ঠেলে দেওয়ার জন্য একটি অব্যাহত প্রতিশ্রুতির পরামর্শ দেয়।
ERNIE 4.5: একটি তুলনামূলক বিশ্লেষণ
বাইদু সরাসরি ERNIE 4.5-এর মাল্টিমোডাল ক্ষমতাগুলিকে OpenAI-এর GPT-4o-এর সাথে তুলনা করেছে। কোম্পানিটি দাবি করে যে ERNIE 4.5 প্রায় প্রতিটি বেঞ্চমার্কে GPT-4o-কে ছাড়িয়ে গেছে, MMU (ম্যাসিভ মাল্টি-ডিসিপ্লিন আন্ডারস্ট্যান্ডিং) ব্যতীত। MMU কলেজ-স্তরের বিভিন্ন ধরণের কাজের উপর মডেলগুলি মূল্যায়ন করে যার জন্য গভীর বিষয় জ্ঞান এবং ইচ্ছাকৃত যুক্তির প্রয়োজন। এটি পরামর্শ দেয় যে ERNIE 4.5 অনেক ক্ষেত্রে পারদর্শী হলেও, GPT-4o এখনও বিশেষ একাডেমিক জ্ঞানের প্রয়োজনীয় কাজগুলিতে একটি সুবিধা ধরে রাখতে পারে।
বাইদু বেঞ্চমার্ক ফলাফলও উপস্থাপন করে যা নির্দেশ করে যে ERNIE 4.5 OpenAI-এর GPT-4o এবং GPT-4.5, পাশাপাশি ডিপসিকের V3-কে ছাড়িয়ে গেছে, আরও বেশ কয়েকটি ক্ষেত্রে, যার মধ্যে রয়েছে:
- C-Eval: এই বেঞ্চমার্কটি মানবিকতা থেকে বিজ্ঞান এবং প্রকৌশল পর্যন্ত বিভিন্ন শাখায় উন্নত জ্ঞান এবং যুক্তির ক্ষমতা মূল্যায়ন করে। এখানে ERNIE 4.5-এর শক্তিশালী কর্মক্ষমতা বিভিন্ন বিষয়ের বিস্তৃত বোধগম্যতার পরামর্শ দেয়।
- CMMLU: এই বেঞ্চমার্কটি চীনা ভাষা এবং সংস্কৃতির নির্দিষ্ট প্রেক্ষাপটে জ্ঞান এবং যুক্তির ক্ষমতা মূল্যায়ন করে। এখানে ERNIE 4.5-এর সাফল্য এই ক্ষেত্রে তার দক্ষতা তুলে ধরে।
- GSM8K: এই বেঞ্চমার্কটি গ্রেড স্কুলের গণিত সমস্যা ব্যবহার করে মাল্টি-স্টেপ রিজনিং মূল্যায়ন করে। ERNIE 4.5-এর কর্মক্ষমতা গাণিতিক যুক্তিতে শক্তিশালী ক্ষমতার ইঙ্গিত দেয়।
- DROP: এই বেঞ্চমার্কটি একটি LLM-এর পড়ার বোধগম্যতা ক্ষমতা পরিমাপ করে। ERNIE 4.5-এর ফলাফলগুলি উচ্চ স্তরের টেক্সট বোধগম্যতার পরামর্শ দেয়।
এটি স্বীকার করা গুরুত্বপূর্ণ, যাইহোক, যে অনেকগুলি বেঞ্চমার্ক যেখানে ERNIE 4.5 উচ্চতর কর্মক্ষমতা প্রদর্শন করেছে সেগুলি বিশেষভাবে চীনা ভাষা এবং সংস্কৃতির উপর দৃষ্টি নিবদ্ধ করেছিল। এটি আংশিকভাবে ব্যাখ্যা করতে পারে কেন GPT-4o এবং GPT-4.5, একটি আমেরিকান কোম্পানির দ্বারা বিকশিত মডেলগুলি, ভাল পারফর্ম করেনি। তবুও, ERNIE 4.5 ডিপসিক-V3-কেও ছাড়িয়ে গেছে, একটি চীনা কোম্পানির দ্বারা বিকশিত একটি মডেল, এই বেঞ্চমার্কগুলির অনেকগুলি ক্ষেত্রে, যা চীনা প্রেক্ষাপটে একটি প্রকৃত প্রতিযোগিতামূলক সুবিধার ইঙ্গিত দেয়।
বিপরীতভাবে, ERNIE 4.5 অন্যান্য কিছু বেঞ্চমার্কে ভাল পারফর্ম করেনি বলে জানা গেছে, যার মধ্যে রয়েছে:
- MMLU-Pro: এই বেঞ্চমার্কটি আরও বিস্তৃত এবং চ্যালেঞ্জিং কাজের সেটে ভাষা বোধগম্যতা মূল্যায়ন করে। GPT-4.5 এখানে ERNIE 4.5-কে ছাড়িয়ে গেছে, যা সাধারণ ভাষা বোঝার ক্ষেত্রে একটি সম্ভাব্য সুবিধার পরামর্শ দেয়।
- GPQA: এই বেঞ্চমার্কটিতে জীববিজ্ঞান, পদার্থবিদ্যা এবং রসায়নের বিশেষজ্ঞদের দ্বারা লিখিত বহু-পছন্দমূলক প্রশ্নের একটি ডেটাসেট রয়েছে। GPT-4.5 আবারও ERNIE 4.5-কে ছাড়িয়ে গেছে, যা বিশেষ বৈজ্ঞানিক জ্ঞানের একটি শক্তিশালী উপলব্ধির ইঙ্গিত দেয়।
- Math-500: এই বেঞ্চমার্কটি চ্যালেঞ্জিং উচ্চ-বিদ্যালয়-স্তরের গণিত সমস্যাগুলি সমাধান করার ক্ষমতা পরীক্ষা করে। ডিপসিক-V3 এবং GPT-4.5 উভয়ই ERNIE 4.5-কে ছাড়িয়ে গেছে, যা উন্নত গাণিতিক যুক্তিতে আরও উন্নতির প্রয়োজনীয়তার পরামর্শ দেয়।
- LiveCodeBench: এই বেঞ্চমার্কটি কোডিং ক্ষমতা পরিমাপ করে। GPT-4.5 ERNIE 4.5-কে ছাড়িয়ে গেছে, যা কোড জেনারেশন এবং বোঝার ক্ষেত্রে একটি সম্ভাব্য সুবিধার ইঙ্গিত দেয়।
কিছু বেঞ্চমার্কে GPT-4.5-এর উচ্চতর কর্মক্ষমতা সত্ত্বেও, বাইদু জোর দেয় যে ERNIE 4.5-এর দাম OpenAI-এর মডেলের মাত্র 1%। এই উল্লেখযোগ্য খরচের পার্থক্য ERNIE 4.5-কে একটি সাশ্রয়ী মাল্টিমোডাল AI সমাধান খুঁজছেন এমন ব্যবসা এবং ডেভেলপারদের জন্য একটি অত্যন্ত আকর্ষণীয় বিকল্প করে তুলতে পারে।
ERNIE X1 এবং ERNIE 4.5 অ্যাক্সেস করা
ERNIE 4.5 বর্তমানে তার API-এর মাধ্যমে এবং বাইদু AI ক্লাউডের MaaS (মডেল-অ্যাজ-এ-সার্ভিস) প্ল্যাটফর্ম, Qianfan-এ অ্যাক্সেসযোগ্য। ইনপুট মূল্য প্রতি হাজার টোকেন RMB 0.004 থেকে শুরু হয় এবং আউটপুট মূল্য প্রতি হাজার টোকেন RMB 0.016 থেকে শুরু হয়। বাইদু জানিয়েছে যে ERNIE X1 “শীঘ্রই” প্ল্যাটফর্মে উপলব্ধ হবে, ইনপুট মূল্য প্রতি হাজার টোকেন RMB 0.002 থেকে শুরু হবে এবং আউটপুট মূল্য প্রতি হাজার টোকেন RMB 0.008 থেকে শুরুহবে।
ব্যবহারকারীরা বাইদুর চ্যাটবট, ERNIE বট-এর মাধ্যমে উভয় মডেলের সাথে ইন্টারঅ্যাক্ট করতে পারে, তাদের ক্ষমতাগুলি অন্বেষণ করার জন্য একটি সুবিধাজনক এবং ব্যবহারকারী-বান্ধব ইন্টারফেস প্রদান করে।
নির্দিষ্ট মূল্যের কাঠামো এবং উপলব্ধতার বিশদ বিবরণ এই উন্নত AI মডেলগুলিকে বিস্তৃত ব্যবহারকারীদের কাছে অ্যাক্সেসযোগ্য করার জন্য বাইদুর প্রতিশ্রুতি তুলে ধরে, স্বতন্ত্র ডেভেলপার থেকে শুরু করে বৃহৎ উদ্যোগ পর্যন্ত। প্রতিযোগিতামূলক মূল্য, বিশেষ করে ERNIE X1-এর জন্য, বাইদুকে গ্লোবাল AI বাজারে একটি শক্তিশালী প্রতিযোগী হিসাবে অবস্থান করে, যা আমেরিকান প্রযুক্তি জায়ান্টদের মডেলগুলির একটি আকর্ষণীয় বিকল্প সরবরাহ করে।