عرصه هوش مصنوعی، چشماندازی که با نوآوری سریع و رقابت شدید مشخص میشود، شاهد ظهور رقبای جدیدی است که غولهای تثبیتشده را به چالش میکشند. در میان این نیروهای نوظهور، Zhipu AI قرار دارد، شرکتی که گامهای مهمی برداشته است، بهویژه با معرفی مدل GLM-4 خود. سوال اصلی که در راهروهای فناوری طنینانداز شده این است که این محصول جدید چگونه در برابر معیار قدرتمندی که توسط GPT-4 شناختهشده OpenAI تعیین شده، قرار میگیرد. بررسی معیارهای عملکرد مربوطه، رویکردهای بازار، بنیادهای فناورانه و پشتوانه مالی آنها، دوئل جذابی را در رقابت جهانی هوش مصنوعی آشکار میکند.
سنجش غولها: معیارها و ادعاهای عملکرد
در قلب این مقایسه، جنبه حیاتی عملکرد نهفته است. Zhipu AI ادعاهای جسورانهای در مورد مدل GLM-4 خود مطرح کرده و مدعی است که نه تنها با GPT-4 شرکت OpenAI رقابت میکند، بلکه در طیفی از معیارهای ارزیابی استاندارد شده، از آن پیشی میگیرد. این ادعای کوچکی نیست؛ این یک چالش مستقیم برای مدلی است که اغلب به عنوان استاندارد طلایی صنعت تلقی میشود. معیارهای خاص ذکر شده – MMLU (Massive Multitask Language Understanding)، GSM8K (Grade School Math 8K)، MATH (Measuring Mathematical Problem Solving)، BBH (Big-Bench Hard)، GPQA (Graduate-Level Google-Proof Q&A) و HumanEval (Human-Level Programming Evaluation) – طیف متنوعی از وظایف شناختی پیچیده را نشان میدهند.
- MMLU گستره دانش و تواناییهای حل مسئله یک مدل را در دهها موضوع آزمایش میکند و یک آزمون جامع دانشگاهی را شبیهسازی میکند. برتری در اینجا نشاندهنده درک عمومی قوی از جهان است.
- GSM8K به طور خاص بر روی مسائل استدلال ریاضی چند مرحلهای تمرکز دارد که معمولاً در اواخر دوره ابتدایی یا اوایل دوره راهنمایی با آنها مواجه میشویم و استنتاج منطقی و دستکاری عددی را آزمایش میکند.
- MATH این پیچیدگی را افزایش میدهد و به مسائلی از پیشحسابان تا حساب دیفرانسیل و انتگرال و فراتر از آن میپردازد و نیازمند بینش ریاضی پیچیده است.
- BBH شامل مجموعهای از وظایف است که به طور خاص از معیار بزرگتر Big-Bench انتخاب شدهاند زیرا برای مدلهای هوش مصنوعی قبلی بسیار چالشبرانگیز بودند و حوزههایی مانند استدلال منطقی، عقل سلیم و پیمایش ابهام را بررسی میکنند.
- GPQA سوالاتی را ارائه میدهد که به گونهای طراحی شدهاند که حتی برای انسانهای بسیار توانمند نیز پاسخ سریع به آنها با استفاده از موتورهای جستجو دشوار باشد و بر استدلال عمیق و ترکیب دانش به جای بازیابی اطلاعات ساده تأکید دارد.
- HumanEval توانایی یک مدل در تولید کد عملکردی صحیح از توضیحات (docstrings) را ارزیابی میکند، که یک قابلیت حیاتی برای کاربردهای توسعه نرمافزار است.
ادعای Zhipu AI این است که GLM-4 در این آزمونهای دشوار، امتیازاتی برابر یا برتر از GPT-4 کسب میکند. این ادعا پس از انتشار یک مقاله تحقیقاتی در ژوئن 2024، کشش قابل توجهی پیدا کرد. طبق گزارشهای پیرامون این مقاله، یافتهها نشان داد که GLM-4 سطوح عملکردی را نشان میدهد که در چندین معیار ارزیابی عمومی، بسیار شبیه به GPT-4 بوده و در برخی موارد از آن فراتر رفته است.
با این حال، بسیار مهم است که با دقت تحلیلی به چنین ادعاهایی نزدیک شویم. معیارهای عملکرد، اگرچه ارزشمند هستند، اما تنها تصویری جزئی ارائه میدهند. نسخههای خاص مدلهای آزمایششده (هم GLM-4 و هم GPT-4 تکامل مییابند)، شرایط دقیق آزمایش، و پتانسیل ‘آموزش برای آزمون’ (بهینهسازی مدلها به طور خاص برای عملکرد در معیارها به جای کاربرد در دنیای واقعی) همگی عواملی هستند که نیاز به بررسی دارند. علاوه بر این، ادعاهایی که از تحقیقات مستقیماً مرتبط با توسعهدهنده مدل نشأت میگیرند، طبیعتاً بررسی در مورد سوگیری بالقوه را ایجاب میکنند. تأیید مستقل و شخص ثالث تحت شرایط استاندارد برای اعتبارسنجی قطعی چنین مزایای عملکردی ضروری است. OpenAI نیز در گذشته نتایج معیارهای خود را منتشر کرده است که اغلب نقاط قوت GPT-4 را به نمایش میگذارد و به روایتی پیچیده و گاه بحثبرانگیز از قابلیتهای مدل کمک میکند. جامعه هوش مصنوعی مشتاقانه منتظر تحلیلهای مقایسهای گستردهتر و مستقل است تا ادعاهای عملکرد Zhipu AI را در سلسله مراتب رقابتی به طور کامل زمینهسازی کند. با این وجود، صرف ادعای برابری یا برتری، با پشتوانه تحقیقات اولیه، نشاندهنده جاهطلبی و اعتماد Zhipu AI به پیشرفتهای فناورانه خود است.
مانورهای استراتژیک: ورود به بازار و دسترسی کاربر
فراتر از عملکرد خام، استراتژیهای به کار گرفته شده برای رساندن این ابزارهای قدرتمند هوش مصنوعی به کاربران، تفاوت قابل توجهی دارند و فلسفهها و اهداف بازار متمایزی را آشکار میکنند. Zhipu AI با ارائه عامل هوش مصنوعی جدید خود، AutoGLM Rumination، به صورت کاملاً رایگان، یک استراتژی جذب کاربر بسیار تهاجمی را اتخاذ کرده است. این اقدام مانع اشتراکی را که اغلب دسترسی به پیشرفتهترین ویژگیهای ارائه شده توسط رقبا، از جمله OpenAI، را محدود میکند، از بین میبرد. Zhipu AI با ارائه قابلیتهای پیچیده هوش مصنوعی بدون هزینه اولیه، به طور بالقوه قصد دارد به سرعت پایگاه کاربری بزرگی ایجاد کند، دادههای استفاده ارزشمندی را برای بهبود بیشتر مدل جمعآوری کند و جای پای محکمی در بازارهای حساس به هزینه یا به دنبال جایگزینهایی برای پلتفرمهای غالب غربی ایجاد کند. این رویکرد دسترسی باز میتواند به ویژه در جذب کاربران فردی، دانشجویان، محققان و کسبوکارهای کوچکتر که به دنبال ادغام هوش مصنوعی بدون تعهد مالی قابل توجه هستند، مؤثر باشد.
این در تضاد کامل با مدل تثبیتشده OpenAI است. در حالی که OpenAI دسترسی رایگان به نسخههای قبلی مدلهای خود (مانند GPT-3.5 از طریق ChatGPT) و دسترسی محدود به قابلیتهای جدیدتر را ارائه میدهد، باز کردن قفل قدرت کامل و آخرین ویژگیهای GPT-4 معمولاً به اشتراک پولی (مانند ChatGPT Plus) نیاز دارد یا شامل قیمتگذاری مبتنی بر استفاده از طریق API آن برای توسعهدهندگان و مشتریان سازمانی میشود. این استراتژی ممتاز از مزیت عملکردی درک شده و شهرت تثبیتشده GPT-4 استفاده میکند و کاربران و سازمانهایی را هدف قرار میدهد که مایل به پرداخت هزینه برای قابلیتهای پیشرفته، قابلیت اطمینان و اغلب، پشتیبانی بهتر یکپارچهسازی هستند. درآمد حاصل از اشتراک، تحقیقات و توسعه مداوم را تأمین میکند، از زیرساختهای محاسباتی عظیم پشتیبانی میکند و مسیر روشنی را برای سودآوری فراهم میکند.
پیامدهای این استراتژیهای متفاوت عمیق است. ارائه رایگان Zhipu AI میتواند دسترسی به ابزارهای پیشرفته هوش مصنوعی را دموکراتیک کند، آزمایش گستردهتری را تقویت کند و به طور بالقوه پذیرش هوش مصنوعی را در بخشها یا مناطق خاصی تسریع کند. با این حال، پایداری مالی بلندمدت چنین مدلی یک سوال باقی میماند. کسب درآمد ممکن است در نهایت از طریق ویژگیهای ممتاز، راهحلهای سازمانی، دسترسی به API یا سایر راههایی که هنوز به طور کامل آشکار نشدهاند، حاصل شود. در مقابل، مدل پولی OpenAI جریان درآمد مستقیمی را تضمین میکند اما به طور بالقوه دسترسی آن را در مقایسه با یک رقیب رایگان، به ویژه در میان کاربران آگاه به هزینه، محدود میکند. موفقیت هر استراتژی به عواملی مانند ارزش درک شده، عملکرد واقعی مدل در وظایف دنیای واقعی (فراتر از معیارها)، تجربه کاربر، اعتماد و چشمانداز نظارتی در حال تحول حاکم بر استقرار هوش مصنوعی بستگی دارد. نبرد برای کاربران فقط مربوط به ویژگیها نیست، بلکه اساساً در مورد دسترسی و مدلهای کسبوکار است.
زیر پوست فناوری: تمایزات تکنولوژیکی
در حالی که معیارهای عملکرد و استراتژیهای بازار دیدگاههای خارجی را ارائه میدهند، فناوری زیربنایی بینشی از رویکردهای منحصر به فرد اتخاذ شده توسط هر شرکت را فراهم میکند. Zhipu AI بر فناوری اختصاصی خود تأکید میکند و اجزای خاصی مانند مدل استدلال GLM-Z1-Air و مدل پایه GLM-4-Air-0414 را برجسته میکند. این نامها نشاندهنده یک معماری سفارشی هستند که با قابلیتهای خاصی در ذهن طراحی شده است. نامگذاری ‘مدل استدلال’ بر تمرکز بر وظایفی دلالت دارد که نیازمند استنتاج منطقی، استنتاج چند مرحلهای و حل مسئله بالقوه پیچیدهتر از تطبیق الگو یا تولید متن ساده هستند. جفت کردن این با یک مدل پایه بهینهسازی شده برای کاربردهایی مانند جستجوهای وب و نوشتن گزارش نشاندهنده تلاش استراتژیک برای ساخت عوامل هوش مصنوعی ماهر در جمعآوری اطلاعات، ترکیب و تولید خروجی ساختاریافته است – وظایفی که برای بسیاری از کاربردهای عملی تجاری و تحقیقاتی حیاتی هستند.
توسعه اجزای متمایز و نامگذاری شده مانند GLM-Z1-Air نشاندهنده یک رویکرد ماژولار است که به طور بالقوه به Zhipu AI اجازه میدهد تا بخشهای مختلف فرآیند شناختی را به طور مستقل بهینه کند. این میتواند منجر به کارایی یا قابلیتهای افزایش یافته در حوزههای هدفمند شود. در حالی که جزئیات مربوط به معماریهای خاص اختصاصی باقی میماند، تمرکز بر ‘استدلال’ و مدلهای پایه متمرکز بر کاربرد، اشارهای به تلاش برای فراتر رفتن از تسلط بر زبان عمومی به سمت هوش تخصصیتر و وظیفهمحور دارد.
GPT-4 شرکت OpenAI، در حالی که تا حد زیادی یک جعبه سیاه در مورد عملکرد داخلی خود است، به طور کلی به عنوان یک مدل عظیم مبتنی بر ترانسفورمر شناخته میشود. گمانهزنیها و برخی گزارشها حاکی از آن است که ممکن است از تکنیکهایی مانند Mixture of Experts (MoE) استفاده کند، جایی که بخشهای مختلف شبکه در مدیریت انواع مختلف دادهها یا وظایف تخصص دارند و امکان مقیاس و کارایی بیشتر را بدون فعال کردن کل تعداد پارامترهای عظیم برای هر پرسوجو فراهم میکنند. تمرکز OpenAI اغلب به عنوان پیش بردن مرزهای مدلهای زبان بزرگ و عمومی به تصویر کشیده شده است که قادر به انجام طیف فوقالعاده وسیعی از وظایف، از نوشتن خلاقانه و مکالمه گرفته تا کدنویسی و تحلیل پیچیده هستند.
مقایسه پایههای فناورانه بدون شفافیت کامل چالشبرانگیز است. با این حال، ذکر صریح Zhipu از یک ‘مدل استدلال’ و مدلهای پایه متمرکز بر کاربرد با درک عمومیتر از معماری GPT-4 در تضاد است. این میتواند نشاندهنده فلسفههای طراحی متفاوت باشد: Zhipu به طور بالقوه بر بهینهسازی گردشهای کاری پیچیده خاص (مانند تحقیق و گزارشدهی از طریق AutoGLM Rumination) تمرکز دارد، در حالی که OpenAI به مقیاسبندی یک هوش سازگارتر جهانی ادامه میدهد. اثربخشی این شرطبندیهای فناورانه متفاوت با اعمال مدلها در طیف وسیعتری از مشکلات دنیای واقعی روشنتر خواهد شد و نشان میدهد که آیا معماریهای تخصصی یا عمومی در نهایت سودمندتر هستند یا اینکه رویکردهای مختلف در حوزههای متمایز برتری دارند. سرمایهگذاری در فناوری اختصاصی بر تلاش شدید تحقیق و توسعه مورد نیاز برای رقابت در بالاترین سطح توسعه هوش مصنوعی تأکید میکند.
تغذیه صعود: تأمین مالی و مسیر رشد
توسعه مدلهای هوش مصنوعی پیشرفته مانند GLM-4 و GPT-4 به منابع عظیمی نیاز دارد – برای تحقیق، جذب استعداد، و به طور حیاتی، قدرت محاسباتی گسترده مورد نیاز برای آموزش و استنتاج. ظهور Zhipu AI به عنوان یک رقیب جدی به طور قابل توجهی توسط پشتوانه مالی قابل توجه تقویت شده است. گزارشها نشان میدهد که این شرکت سرمایهگذاریهای قابل توجهی را تضمین کرده است و آن را به شدت در چشمانداز بسیار رقابتی هوش مصنوعی، به ویژه در چین، قرار داده است. در حالی که سرمایهگذاران خاص و ارقام دقیق اغلب محرمانه باقی میمانند، تضمین دورهای تأمین مالی بزرگ، اعتبار سنجی حیاتی پتانسیل یک شرکت است و سوخت لازم برای رشد و نوآوری پایدار را فراهم میکند.
این بودجه به Zhipu AI اجازه میدهد تا برای استعدادهای برتر هوش مصنوعی رقابت کند، به شدت در تحقیق و توسعه برای بهبود مدلهای خود و کشف معماریهای جدید سرمایهگذاری کند، و خوشههای گران قیمت GPU ضروری برای آموزش مدل در مقیاس بزرگ را تهیه کند. همچنین این شرکت را قادر میسازد تا استراتژیهای تهاجمی بازار را دنبال کند، مانند ارائه دسترسی رایگان به ابزارهای خاصی مانند AutoGLM Rumination، که ممکن است بدون پشتوانه قوی از نظر مالی چالشبرانگیز باشد. حمایتی که Zhipu AI به دست آورده است، نشاندهنده اعتماد جامعه سرمایهگذاری است که به طور بالقوه شامل شرکتهای سرمایهگذاری خطرپذیر، شرکای استراتژیک شرکتی یا حتی صندوقهای وابسته به دولت میشود و با تمرکز استراتژیک ملی چین بر پیشبرد قابلیتهای هوش مصنوعی همسو است.
این وضعیت، اگرچه متفاوت است، اما شبیه به محیط تأمین مالی برای همتایان غربی مانند OpenAI است. OpenAI به طور مشهور از یک آزمایشگاه تحقیقاتی غیرانتفاعی به یک نهاد با سود محدود تبدیل شد و سرمایهگذاریهای عظیمی را تضمین کرد، به ویژه مشارکت چند میلیارد دلاری با Microsoft. این مشارکت نه تنها سرمایه بلکه دسترسی به زیرساخت ابری Azure مایکروسافت را نیز فراهم میکند که برای مدیریت تقاضاهای محاسباتی مدلهایی مانند GPT-4 حیاتی است. سایر آزمایشگاههای پیشرو هوش مصنوعی، مانند Anthropic و Google DeepMind، نیز از حمایت مالی قابل توجه شرکتها یا سرمایهگذاری خطرپذیر بهرهمند میشوند.
بنابراین، چشمانداز تأمین مالی یک میدان نبرد حیاتی در رقابت جهانی هوش مصنوعی است. دسترسی به سرمایه مستقیماً به توانایی ساخت مدلهای بزرگتر و توانمندتر و استقرار آنها در مقیاس تبدیل میشود. تأمین مالی موفق Zhipu AI توانایی آن را در پیمایش این محیط پرمخاطره نشان میدهد و آن را به عنوان یک بازیگر کلیدی در اکوسیستم رو به رشد هوش مصنوعی چین قرار میدهد. این قدرت مالی برای به چالش کشیدن بازیگران تثبیتشده مانند OpenAI و به دست آوردن سهم قابل توجهی از بازار جهانی هوش مصنوعی که به سرعت در حال گسترش است، ضروری است. منابع و مقیاس تأمین مالی همچنین میتوانند به طور ظریف بر جهتگیری استراتژیک، اولویتهای تحقیقاتی و موقعیتیابی بازار یک شرکت تأثیر بگذارند و لایه دیگری از پیچیدگی را به پویایی رقابتی اضافه کنند.
چالش تکاملی هوش مصنوعی: نگاهی رقابتی گستردهتر
در حالی که مقایسه مستقیم بین GLM-4 شرکت Zhipu AI و GPT-4 شرکت OpenAI قانعکننده است، این مقایسه در یک اکوسیستم هوش مصنوعی جهانی بسیار گستردهتر و به شدت رقابتی رخ میدهد. پیشرفتها و موقعیتیابی استراتژیک Zhipu AI چالشی قابل توجه نه تنها برای OpenAI بلکه برای کل رده بالای توسعهدهندگان هوش مصنوعی در سراسر جهان است. این چشمانداز به هیچ وجه یک مسابقه دو اسبه نیست. Google DeepMind با سری Gemini خود به پیشبرد مرزها ادامه میدهد، Anthropic با مدلهای Claude خود که بر ایمنی و اصول هوش مصنوعی قانون اساسی تأکید دارند، کشش پیدا میکند، Metaبا مدلهای قدرتمند منبع باز Llama خود به طور قابل توجهی مشارکت میکند، و تعداد زیادی آزمایشگاه تحقیقاتی و شرکتهای فناوری دیگر دائماً در حال نوآوری هستند.
در خود چین، Zhipu AI در میان صحنه هوش مصنوعی پر جنب و جوش و به سرعت در حال توسعه فعالیت میکند و با دیگر بازیگران بزرگ داخلی که توسط غولهای فناوری مانند Alibaba، Baidu و Tencent پشتیبانی میشوند، رقابت میکند که هر کدام به شدت در مدلهای زبان بزرگ و برنامههای کاربردی هوش مصنوعی سرمایهگذاری میکنند. این رقابت داخلی نوآوری را بیشتر تقویت میکند و شرکتهایی مانند Zhipu AI را وادار میکند تا خود را از طریق عملکرد، قابلیتهای تخصصی یا استراتژی بازار متمایز کنند.
ظهور رقبای معتبری مانند Zhipu AI اساساً صنعت هوش مصنوعی را در حال تغییر شکل دادن است. این امر فشار بر رهبران تثبیتشده مانند OpenAI را برای نوآوری مداوم و توجیه قیمتگذاری ممتاز یا تسلط بر بازار خود تشدید میکند. این به کاربران و کسبوکارها گزینههای بیشتری میدهد و به طور بالقوه منجر به رقابت قیمتی و تنوع ابزارهای هوش مصنوعی متناسب با نیازها، زبانها یا زمینههای فرهنگی مختلف میشود. تمرکز Zhipu، با بهرهگیری بالقوه از نقاط قوت خود در درک زبان و فرهنگ چینی، میتواند به آن در بازارهای منطقهای خاص برتری دهد.
علاوه بر این، رقابت فراتر از قابلیتهای مدل گسترش مییابد و شامل جذب استعداد، دسترسی به دادههای آموزشی با کیفیت بالا، توسعه سختافزار کارآمد (مانند GPU ها و شتابدهندههای تخصصی هوش مصنوعی) و پیمایش چارچوبهای نظارتی پیچیده و در حال تحول در حوزههای قضایی مختلف میشود. ملاحظات ژئوپلیتیکی نیز نقش انکارناپذیری ایفا میکنند و منافع ملی بر سیاستهای تأمین مالی، همکاری و انتقال فناوری تأثیر میگذارند.
استراتژی Zhipu AI، که ترکیبی از ادعاهای عملکرد برتر با یک مدل دسترسی باز برای ابزارهای خاص است، ترکیبی قدرتمند برای برهم زدن وضعیت موجود است. اینکه آیا GLM-4 به طور مداوم در آزمایشهای گسترده و مستقل به ادعاهای عملکرد خود عمل میکند و آیا استراتژی بازار Zhipu AI پایدار و مؤثر است، سوالات بازی باقی میمانند. با این حال، ظهور آن بدون شک نشان میدهد که رقابت برای برتری هوش مصنوعی در حال چندقطبیتر، پویاتر و به شدت رقابتیتر شدن است. صنعت، سرمایهگذاران و کاربران در سراسر جهان از نزدیک نظارهگر رقابت این غولهای هوش مصنوعی برای رهبری فناورانه و سهم بازار در زمینهای هستند که آماده بازتعریف جنبههای بیشماری از اقتصاد و جامعه جهانی است. محیط دیگ بخار تضمین میکند که سرعت نوآوری احتمالاً سرسامآور باقی خواهد ماند و به نفع کاربران نهایی با قابلیتهای هوش مصنوعی به طور فزاینده قدرتمند و در دسترس خواهد بود.