Ernie 4.5: یک نیروگاه چندوجهی
Ernie 4.5، با قابلیتهای گسترده چندوجهی خود که شامل تصاویر، صدا و ویدیو میشود، عملکرد برتری را نسبت به GPT-4o شرکت OpenAI نشان داده است. این برتری در طیف وسیعی از پلتفرمهای محک، از جمله CCBench و OCRBench، همانطور که در بیانیهای که توسط بایدو در پلتفرم WeChat منتشر شد، مشاهده شده است. علاوه بر این، این شرکت ادعا میکند که قابلیتهای پردازش متن مدل پایه Ernie 4.5 نه تنها از DeepSeek V3 فراتر میرود، بلکه بر اساس مجموعهای از ارزیابیهای محک، به سطحی از عملکرد تقریباً قابل مقایسه با GPT-4.5 شرکت OpenAI میرسد.
نقش پیشگام بایدو و ظهور رقابت
بایدو این افتخار را دارد که اولین شرکت بزرگ فناوری چینی است که یک LLM را در چین معرفی میکند. این حرکت پیشگامانه در مارس 2023 رخ داد و سوار بر موج هیجان ناشی از راهاندازی ChatGPT شرکت OpenAI شد. با این حال، مزیت اولیه بایدو طی دو سال گذشته به طور فزایندهای توسط سایر بازیگران نوظهور هوش مصنوعی در چین به چالش کشیده شده است. مانور استراتژیک اخیر این غول جستجو برای تقویت جایگاه خود در بازار هوش مصنوعی چین در زمانی رخ میدهد که DeepSeek یک روند منبع باز را شعلهور کرده است. همزمان، غولهای صنعتی مانند Alibaba، Tencent و ByteDance به طور تهاجمی در حال پیگیری کاربران تجاری و مصرفکننده برای مدلهای هوش مصنوعی مربوطه خود هستند.
Ernie X1: عملکرد و قیمتگذاری
در حالی که بایدو نتایج محک خاصی را برای مدل استدلال تازه معرفی شده خود، Ernie X1، فاش نکرد، این شرکت اظهار داشت که ‘عملکردی همسطح با DeepSeek R1 را تنها با نصف قیمت ارائه میدهد.’ این بیانیه نشاندهنده یک مزیت رقابتی قابل توجه از نظر مقرون به صرفه بودن است.
برای کسبوکارهایی که به دنبال ادغام قابلیتهای Ernie X1 هستند، قیمتگذاری برای دسترسی به رابط برنامهنویسی کاربردی (API) آن به شرح زیر است: 2 یوان (تقریباً 0.28 دلار آمریکا) به ازای هر میلیون توکن ورودی و 8 یوان به ازای هر میلیون توکن خروجی. در مقابل، DeepSeek در حال حاضر برای DeepSeek-reasoner خود، که توسط مدل استدلال R1 آن هدایت میشود، 0.55 دلار آمریکا به ازای هر میلیون توکن ورودی و 2.19 دلار آمریکا به ازای هر میلیون توکن خروجی دریافت میکند. شایان ذکر است که DeepSeek، یک استارتآپ مستقر در هانگژو، اخیراً در پاسخ به افزایش قابل توجه تقاضا، قیمتهای API خود را افزایش داد.
تغییر جهت بایدو به سمت منبع باز
رابین لی یانهونگ، بنیانگذار، رئیس هیئت مدیره و مدیرعامل بایدو، ماه گذشته اعلامیه قابل توجهی در مورد آینده Ernie 4.5 ارائه کرد. او فاش کرد که این مدل از 30 ژوئن منبع باز خواهد شد. اینتصمیم نشاندهنده یک انحراف قابل توجه از حمایت قاطعانه قبلی او از توسعه هوش مصنوعی منبع بسته است و یک چرخش 180 درجهای در رویکرد او را نشان میدهد.
لی در طول یک تماس تلفنی با تحلیلگران در ماه فوریه، در مورد این تغییر استراتژیک توضیح داد و گفت: ‘چیزی که ما از DeepSeek آموختیم این است که منبع باز کردن بهترین مدلها میتواند به پذیرش گسترده کمک کند.’ او در ادامه توضیح داد: ‘وقتی مدل منبع باز است، مردم طبیعتاً میخواهند آن را از روی کنجکاوی امتحان کنند، که به پذیرش گستردهتر کمک میکند.’ این اذعان به مزایای توسعه منبع باز، بر استراتژی در حال تکامل بایدو در چشمانداز رقابتی هوش مصنوعی تأکید میکند.
عملکرد تجاری بایدو در میان پیشرفتهای هوش مصنوعی
با وجود پیشرفت قابل توجهی که بایدو در زمینه هوش مصنوعی داشته است، تجارت کلی این شرکت به دلیل ضعیفتر شدن درآمد تبلیغات با مشکلاتی روبرو است. گزارشهای مالی اخیر نشان میدهد که کل درآمد بایدو برای سه ماهه چهارم، 2 درصد کاهش سالانه را تجربه کرده است. علاوه بر این، درآمد کل سال نیز شاهد کاهش 1 درصدی بود. این ارقام چالشهایی را که بایدو در متعادل کردن سرمایهگذاریهای خود در فناوری پیشرفته هوش مصنوعی با نیاز به حفظ عملکرد مالی قوی با آن مواجه است، برجسته میکند.
گسترش جنبههای کلیدی
برای ارائه درک جامعتر، بیایید عمیقتر به برخی از جنبههای حیاتی اعلامیه بایدو و زمینه گستردهتر چشمانداز هوش مصنوعی در چین بپردازیم.
اهمیت چندوجهی بودن:
تاکید بر قابلیتهای ‘چندوجهی’ در هر دو Ernie 4.5 و Ernie X1 بسیار مهم است. LLM های سنتی عمدتاً بر پردازش مبتنی بر متن متمرکز بودند. با این حال، توانایی پردازش و درک اطلاعات از حالتهای مختلف - تصاویر، صدا و ویدیو - طیف وسیعی از امکانات جدید را باز میکند. این شامل:
- تشخیص تصویر پیشرفته: مدلهای هوش مصنوعی اکنون نه تنها میتوانند اشیاء را در تصاویر شناسایی کنند، بلکه زمینه و روابط بین آنها را نیز درک میکنند.
- بهبود رونویسی و تجزیه و تحلیل صوتی: رونویسی زبان گفتاری با دقت بیشتر و حتی تشخیص تفاوتهای ظریف مانند احساسات و مقاصد در ضبطهای صوتی.
- درک ویدیو: تجزیه و تحلیل محتوای ویدیویی برای شناسایی صحنهها، اقدامات و حتی پیشبینی رویدادهای آینده.
بحث منبع باز:
تصمیم رابین لی برای منبع باز کردن Ernie 4.5 یک پیشرفت مهم در بحث مداوم بین توسعه هوش مصنوعی منبع بسته و منبع باز است.
- منبع بسته: طرفداران این رویکرد استدلال میکنند که این امر امکان کنترل بهتر بر فناوری را فراهم میکند، استفاده مسئولانه از آن را تضمین میکند و از سوء استفاده جلوگیری میکند. همچنین به شرکتها اجازه میدهد تا از مالکیت معنوی خود محافظت کنند و مزیت رقابتی خود را حفظ کنند.
- منبع باز: طرفداران توسعه منبع باز معتقدند که این امر همکاری را تقویت میکند، نوآوری را تسریع میبخشد و شفافیت را ارتقا میدهد. این به محققان و توسعهدهندگان در سراسر جهان اجازه میدهد تا در پیشرفت فناوری هوش مصنوعی مشارکت کنند.
تغییر جهت بایدو به سمت منبع باز، حداقل برای Ernie 4.5، نشاندهنده شناخت فزاینده جنبش منبع باز و مزایای بالقوه آن است.
چشمانداز رقابتی:
رقابت هوش مصنوعی در چین شدید است و شرکتهای متعددی برای تسلط بر آن رقابت میکنند.
- Alibaba: LLM Tongyi Qianwen شرکت Alibaba یک رقیب اصلی است و این شرکت به طور فعال هوش مصنوعی را در واحدهای تجاری مختلف خود، از جمله تجارت الکترونیک، رایانش ابری و لجستیک، ادغام میکند.
- Tencent: LLM Hunyuan شرکت Tencent یکی دیگر از بازیگران مهم است و این شرکت از هوش مصنوعی برای بهبود پلتفرمهای رسانههای اجتماعی، پیشنهادات بازی و خدمات ابری خود استفاده میکند.
- ByteDance: شرکت مادر TikTok، ByteDance، نیز سرمایهگذاری زیادی در هوش مصنوعی انجام میدهد و از آن برای تقویت الگوریتمهای توصیه خود و توسعه محصولات جدید استفاده میکند.
- DeepSeek: دیپسیک رقیبی قدرتمند در فضای LLM است.
تاثیر قیمتگذاری:
استراتژی قیمتگذاری تهاجمی بایدو برای Ernie X1، که قیمت DeepSeek را به نصف کاهش میدهد، نشانه روشنی از قصد آن برای به دست آوردن سهم بازار است. این جنگ قیمت میتواند به طور بالقوه به نفع کسبوکارها و مصرفکنندگان باشد و فناوری هوش مصنوعی را در دسترستر و مقرون به صرفهتر کند.
پیامدهای گستردهتر:
پیشرفتهای بایدو در هوش مصنوعی، همراه با رقابت شدید در بازار چین، پیامدهای گستردهای دارد:
- پیشرفت فناوری: سرعت سریع نوآوری باعث توسعه مدلهای هوش مصنوعی به طور فزایندهای پیچیده با قابلیتهای گستردهتر میشود.
- تاثیر اقتصادی: هوش مصنوعی آماده است تا صنایع مختلف را متحول کند، بهرهوری را افزایش دهد، مشاغل جدید ایجاد کند و به طور بالقوه چشمانداز اقتصادی جهانی را تغییر دهد.
- تاثیر اجتماعی: پذیرش گسترده هوش مصنوعی سوالات مهم اخلاقی و اجتماعی را مطرح میکند که باید به آنها پرداخته شود، از جمله مسائل مربوط به سوگیری، حریم خصوصی و جابجایی شغلی.
توضیحات بیشتر در مورد استراتژی بایدو
به نظر میرسد استراتژی بایدو چندوجهی باشد و هم نوآوری تکنولوژیکی و هم موقعیتیابی در بازار را در بر میگیرد.
1. مهارت تکنولوژیکی:
- تمرکز بر چندوجهی بودن: بایدو به وضوح توسعه مدلهای هوش مصنوعی چندوجهی را در اولویت قرار میدهد و پتانسیل این فناوری را برای باز کردن برنامهها و قابلیتهای جدید تشخیص میدهد.
- بهبود مستمر: انتشار Ernie 4.5 و Ernie X1 تعهد بایدو به تحقیق و توسعه مداوم را نشان میدهد و دائماً مرزهای عملکرد هوش مصنوعی را جابجا میکند.
- پذیرش منبع باز: تصمیم به منبع باز کردن Ernie 4.5 نشاندهنده تمایل به تعامل با جامعه گستردهتر هوش مصنوعی و کمک به پیشرفت جمعی این حوزه است.
2. موقعیتیابی در بازار:
- قیمتگذاری رقابتی: قیمتگذاری تهاجمی Ernie X1 یک حرکت استراتژیک برای جذب کاربران و به دست آوردن سهم بازار در چشمانداز LLM بسیار رقابتی است.
- هدف قرار دادن کسبوکارها: تمرکز بر دسترسی API نشان میدهد که بایدو به طور فعال کسبوکارهایی را که به دنبال ادغام هوش مصنوعی در عملیات خود هستند، هدف قرار میدهد.
- رسیدگی به نقاط ضعف: این شرکت با استفاده از پیشرفتهای هوش مصنوعی خود برای متنوعسازی پیشنهادات خود و کشف جریانهای درآمدی جدید، چالشهای خود، مانند کاهش درآمد تبلیغات را تصدیق و به آنها رسیدگی میکند.
3. چشمانداز بلندمدت:
- رهبری هوش مصنوعی: اقدامات بایدو نشاندهنده یک جاهطلبی روشن برای تبدیل شدن به یک رهبر در چشمانداز جهانی هوش مصنوعی است، نه فقط در چین.
- فناوری تحولآفرین: به نظر میرسد این شرکت هوش مصنوعی را به عنوان یک فناوری تحولآفرین با پتانسیل تغییر شکل کسبوکار خود و کمک به پیشرفت گستردهتر اجتماعی میبیند.
- سازگاری: تمایل بایدو به انطباق استراتژی خود، همانطور که با تغییر جهت به سمت توسعه منبع باز مشهود است، چابکی و پاسخگویی آن را به پویاییهای در حال تحول صنعت هوش مصنوعی نشان میدهد.
در اصل، بایدو خود را به عنوان یک نیروی اصلی در انقلاب هوش مصنوعی معرفی میکند و نوآوری تکنولوژیکی را با مانورهای استراتژیک بازار ترکیب میکند تا به اهداف بلندپروازانه خود دست یابد. پیشرفت این شرکت و رقابت مداوم در بازار هوش مصنوعی چین به دقت مورد توجه قرار خواهد گرفت زیرا پیامدهای مهمی برای آینده هوش مصنوعی در سطح جهانی دارند.