دوراهی هوش مصنوعی: ببرهای کوچک چین

از دیدگاه های بزرگ تا چرخش های استراتژیک

نامه داخلی اخیر از مدیرعامل یکی از ‘ببرهای کوچک هوش مصنوعی’ چین، Baichuan Intelligent، دومین سالگرد این شرکت را نشان داد و تغییر استراتژیک را برجسته کرد. تمرکز محدودتر می شود و کاربردهای پزشکی را در اولویت قرار می دهد. این در تضاد شدید با ماموریت اولیه آن برای ایجاد یک مدل پایه پیشگامانه شبیه OpenAI، کامل با برنامه های نوآورانه بود.

به طور مشابه، لی کایفو، بنیانگذار یکی دیگر از ‘ببرهای کوچک’، 01.AI، در ژانویه اعلام کرد که شرکتش رویکردی ‘کوچک اما زیبا’ را در پیش خواهد گرفت. این یک انحراف قابل توجه از دیدگاه بزرگ ساختن پلتفرم AI 2.0 برای تسریع در ورود AGI بود.

این عقب نشینی های استراتژیک گمانه زنی ها را برانگیخته است، به طوری که برخی از ناظران پیشنهاد می کنند که این ‘ببرهای کوچک’ بیشتر شبیه ‘گربه های بیمار’ می شوند. در محیطی که با تغییرات مداوم مشخص می شود، چگونه این شرکت ها می توانند آینده خود را تامین کنند؟

برای پاسخ به این سوال، تیم تحریریه Zhiwei به دنبال بینش از متخصصان مختلف، از جمله متخصصان فناوری مدل بزرگ، کارشناسان هوش مصنوعی در امور مالی و بهداشت و درمان، و کارشناسان فناوری هوش مصنوعی از شرکت های پیشرو بود.

اثر DeepSeek و تغییر استراتژی ها

چشم انداز هوش مصنوعی به طور چشمگیری پس از محبوبیت انفجاری DeepSeek، مدلی که بازار را تکان داد، تغییر کرد. DeepSeek مانند یک جنگجوی مهیب، چشم انداز را مختل کرد و بسیاری از شرکت های هوش مصنوعی را مجبور به ارزیابی مجدد موقعیت خود و دنبال کردن مسیرهای مختلف کرد.

با این حال، این تحول حتی زودتر از آنچه بسیاری متوجه شدند، آغاز شد. به گفته وانگ ونگوانگ، یک متخصص فناوری مدل بزرگ، برخی از شرکت‌های هوش مصنوعی چینی حتی قبل از انتشار DeepSeek V3 و R1، از پیگیری آموزش مدل بزرگ دست کشیدند. هزینه‌ها به سادگی بسیار بالا بود، و این شرکت‌ها احساس می‌کردند که نمی‌توانند با جایگزین‌های رایگان و منبع باز مانند DeepSeek V2.5 و Qwen 70B Alibaba رقابت کنند.

لیانگ هه، کارشناسی از یک شرکت خدمات فناوری هوش مصنوعی، افزود که در حالی که بیشتر ‘ببرهای کوچک’ هنوز در اواسط سال 2024 مدل های بزرگ را آموزش می دادند، سرمایه گذاری آنها به طور قابل توجهی کاهش یافته بود. تا ژانویه 2025، با انتشار DeepSeek R1، بسیاری از شرکت های کوچکتر متوجه شدند که نمی توانند ادامه دهند.

این تغییر ناگهانی باعث تغییر عمده در جهت ‘ببرهای کوچک’ شد و از توسعه AGI به سمت رویکردهای تخصصی تر حرکت کرد.

Baichuan و 01.AI پیش آموزش مدل های بزرگ را کنار گذاشته اند و به ترتیب بر هوش مصنوعی پزشکی و کاربرد صنعتی تمرکز می کنند. MiniMax در حال کاهش عملیات B2B خود و تمرکز بر بازارهای خارج از کشور با تولید ویدیو C-end و سایر برنامه ها است. Zhipu، Moonshot AI و StepUp هنوز در جامعه منبع باز فعال هستند، اما هیچ مدل جدیدی تولید نکرده اند که از DeepSeek R1 بهتر عمل کند. Zhipu بودجه قابل توجه و مشارکت های دولتی-سازمانی را تامین کرده است و بقای خود را تضمین می کند. محصول اصلی Moonshot AI، Kimi، موقعیت خود را توسط Yuanbao تهدید شده است و موقعیت آن را به طور فزاینده ای ناخوشایند می کند.

به طور کلی، ‘ببرهای کوچک’ به طور فزاینده ای با بازار SaaS B2B همگرا می شوند، که برخی آن را ‘غیرقابل تصور’ می دانند.

جذابیت و محدودیت های بازار B2B

01.AI اخیراً قصد خود را برای ادغام کامل DeepSeek برای ایجاد یک پلتفرم مدل بزرگ سازمانی یکپارچه برای صنایع مختلف اعلام کرده است. با این حال، این اقدام با بدبینی روبرو شده است.

جیانگ شائو، کارشناس هوش مصنوعی مالی، بر این باور است که آینده 01.AI به دلیل تمرکز گسترده، عدم رقابت فناوری پس از ظهور DeepSeek و قابلیت های تجاری محدود، نامشخص است.

وانگ ونگوانگ این احساس را تکرار کرد و خاطرنشان کرد که مانع فنی برای ورود به یک پلتفرم مدل بزرگ یک مرحله ای نسبتاً کم است.

وانگ تجربه خود را در توسعه مستقل چنین پلتفرمی در حدود شش ماه به اشتراک گذاشت و آن را از طریق کانال های شخصی به فروش رساند. او استدلال کرد که در حالی که سود بردن از این محصول به عنوان یک شرکت دشوار است، اما می تواند به عنوان یک سرمایه گذاری انفرادی سودآور باشد.

وانگ با چندین شرکت B2B همکاری می کند که خدمات مدل بزرگ را ارائه می دهند اما فاقد یک پلتفرم فنی هستند. او پلتفرم خود را با هزینه کم، حدود 40000 تا 50000 یوان در هر مجوز، به طور قابل توجهی زیر قیمت شرکت های بزرگتر ارائه می دهد.

پلتفرم او، KAF (کارخانه عامل مبتنی بر دانش)، از نمودارهای دانش، پایگاه‌های داده برداری و موتورهای جستجو برای ارائه مدل بزرگ و برنامه‌های عامل استفاده می‌کند. این به کاربران امکان می‌دهد تا بدون کدنویسی از طریق مدیریت سریع و مدل، دستیاران دانش یا عوامل سفارشی ایجاد کنند. وانگ به رواج پلتفرم های مشابه در بازار اشاره کرد که کپی کردن آن را آسان می کند.

به گفته وانگ، یک شرکت به دنبال توسعه یک برنامه مدل بزرگ B2B می تواند به سرعت با استخدام یک تیم کوچک از افراد ماهر یا مشارکت با یک شرکت هوش مصنوعی خارجی، یک محصول ایجاد کند. این رویکرد به طور قابل توجهی ارزان تر از آموزش یک مدل بزرگ است.

علاوه بر مدل پلتفرم، راه حل های یکپارچه سخت افزار، نرم افزار و محیط های اجرایی را ارائه می دهند که عملکردی خارج از جعبه ارائه می دهند. ژانگ سنسن، رئیس گروه پلتفرم فناوری در Ping An Insurance، بر این باور است که راه حل های یکپارچه بازار قابل دوامی دارند، به ویژه در میان موسسات دولتی و آموزشی با قابلیت های استقرار فنی محدود. این راه حل ها سهولت استفاده و استقلال فنی را در اولویت قرار می دهند و مزایایی مانند امنیت داده ها، انطباق با حریم خصوصی و بهینه سازی سخت افزار و نرم افزار را ارائه می دهند. آنها همچنین می توانند از تراشه های تولید داخل استفاده کنند، محدودیت ها را دور بزنند و کارایی را بهبود بخشند. شرکت هایی که به هزینه حساس هستند و بر ROI متمرکز هستند، ممکن است راه حل های یکپارچه را به دلیل چرخه عمر طولانی تر آنها جذاب بدانند.

بازار داخلی SaaS از نظر تاریخی با چالش هایی مانند الزامات سفارشی سازی بالا، محصولات عمومی و همگن، رقابت شدید، استراتژی های قیمت گذاری پایین و تمرکز بر کسب درآمد کوتاه مدت روبرو بوده است. مشتریان در این بازار اغلب سطوح پایین دیجیتالی شدن و تمایل محدودی برای پرداخت دارند.

در مقابل، بازار بین‌المللی SaaS بر تخصص تأکید دارد، به طوری که شرکت‌ها بر حوزه‌های خاص تمرکز می‌کنند و خدمات عمیق به مشتریان بزرگ و متوسط ​​با تمایل بیشتری به پرداخت ارائه می‌کنند.

حوزه مدل بزرگ این روندها را منعکس می کند. رویدادهای اخیر در بازار بین المللی SaaS این موضوع را نشان می دهد:

  • در فوریه 2025، MongoDB، Voyage AI، یک استارت آپ هوش مصنوعی 17 ماهه را که بر مدل های جاسازی و رتبه بندی مجدد متمرکز بود، به قیمت 220 میلیون دلار خریداری کرد.
  • در سال 2024، آمازون توافقنامه صدور مجوز فناوری با Adept، یک استارت آپ عامل هوش مصنوعی دو ساله، اعلام کرد که برخی از اعضای Adept به تیم AGI آمازون می پیوندند.

این استارت آپ ها با تمرکز بر یک جایگاه خاص در فناوری مدل بزرگ به موفقیت دست یافتند. چنین نمونه هایی در چین نادر است. بسیاری از شرکت های کوچک و متوسط ​​باید دائماً در برابر ورود شرکت های بزرگتر به فضای خود محافظت کنند.

وانگ ونگوانگ، با تکیه بر تجربه گسترده خود در بازار B2B، واقعیت های سخت آن را توصیف کرد. او خاطرنشان کرد که در حالی که بازار بزرگی برای پلتفرم های یک مرحله ای وجود دارد، اما پراکنده است. شرکت‌های کوچک‌تر با هزینه‌های عملیاتی کمتر می‌توانند قیمت‌های رقابتی را ارائه دهند و شرکت‌های بزرگ‌تر را تضعیف کنند. این امر قیمت خدمات برنامه را کاهش می دهد. حتی شرکت های بزرگ نیز با رقابت از سوی سایر استارت آپ ها و یکپارچه سازان سنتی روبرو هستند. شرکت های بزرگ ممکن است مدل های بزرگ و مزایای برند خود را داشته باشند، اما با استراتژی های تجاری مشابه B2B روبرو هستند.

همانطور که وانگ اظهار داشت، ‘من نیز از DeepSeek استفاده می کنم، و بسیاری از شرکت های دیگر از DeepSeek استفاده می کنند، بنابراین هیچ تمایزی وجود ندارد. تعداد زیادی فروشنده ابری در چین وجود دارد، بنابراین حداقل به همین تعداد رقیب وجود خواهد داشت. بازار داخلی B2B همیشه اینگونه بوده است. برای زنده ماندن، شما یا باید ارتباطات قوی، خدمات خوب یا قیمت های پایین داشته باشید.’

لیانگ هه ارزیابی مختصری از انتخاب های فعلی و چشم اندازهای آینده 01.AI ارائه کرد:

  • تصمیم لی کایفو برای انتقال کامل تجارت 01.AI به برنامه های B2B و ترویج یک پلتفرم مدل بزرگ سازمانی یک مرحله ای از نظر تجاری منطقی است اما منجر به رقابت شدید خواهد شد.
  • نیاز 01.AI به ارائه محصولات مدل بزرگ با قیمت پایین تر از شرکت های بزرگتر ناشی از فقدان مزایای منحصر به فرد آن در لایه برنامه است.
  • حرکت 01.AI به B2B نشانه از دست دادن تخیل و پروژه های ‘کمتر جذاب’ است. این شبیه به سرنوشت بسیاری از شرکت های بینایی کامپیوتری از موج قبلی هوش مصنوعی در سال 2017 است.
  • 01.AI ممکن است فرصت هایی داشته باشد اگر بازارهای خارج از کشور را بررسی کند.

در مقایسه با 01.AI، نظرات در مورد آینده Baichuan کمتر بدبینانه است.

با این حال، ورود Baichuan به حوزه پزشکی فاقد مزایای منحصر به فرد، به ویژه در داده ها است.

جیانگ شائو گفت که تغییر Baichuan به پزشکی صرفاً راهی برای زنده ماندن است. با این حال، در مقایسه با 01.AI، Baichuan حداقل در تلاش است تا وارد یک بازار تخصصی شود.

ژانگ سنسن اظهار داشت که او نسبت به شرکت هایی که دارای داده های پزشکی هستند و مدل های بزرگ پزشکی را توسعه می دهند، خوشبین تر از شرکت های فناوری است. این امر در مورد هر شرکتی که به دنبال ایجاد یک مدل بزرگ خاص صنعت است، صدق می کند. چالش اصلی در ایجاد مدل های بزرگ پزشکی در داده ها نهفته است، نه خود مدل. بیمارستان های عالی زیادی در چین وجود دارند که می توانند یک مدل بزرگ را با استفاده از DeepSeek برای استفاده خود تنظیم کنند.

چگونه می توان داده های پزشکی را به طور موثر به دست آورد؟ جیانگ شائو گفت که استارت آپ های فناوری هوش مصنوعی در داده ها فاقد مزیت هستند. برای ایجاد مدل های بزرگ پزشکی، ممکن است نیاز به همکاری با شرکت هایی داشته باشند که در حال حاضر خدمات فناوری اطلاعات را به بیمارستان ها ارائه می دهند.

گزارش شده است که یکی از ‘ببرهای کوچک’ به طور انحصاری با یک انجمن بزرگ تبادل پزشک داخلی برای آموزش مدل ها با استفاده از تعداد زیادی از موارد تولید شده از تبادلات پزشک شریک شده است.

علاوه بر چشم انداز خوش بینانه تر در مورد بازارهای تخصصی، کارشناسان صنعت به بنیانگذار Baichuan، وانگ شیائوشوان، امیدوار هستند.

لیانگ هه بر این باور است که موفقیت وانگ شیائوشوان در تخصص در پزشکی بستگی به این دارد که آیا او می خواهد یک ایده آل را دنبال کند یا پول در بیاورد. او معتقد است که وانگ بیشتر متمایل به دنبال کردن یک ایده آل است و نتایج تحقیقاتی پیشگامانه هوش مصنوعی پزشکی را ایجاد می کند.

وانگ ونگوانگ بر منسوخ شدن این بازار تاکید کرد. او اظهار داشت که اگر هدف تجاری سازی کوتاه مدت باشد، زمینه پزشکی نیز بسیار رقابتی است، شبیه به بازار کلی B2B. بسیاری از شرکت ها می توانند از نمودارهای دانش، جستجوهای برداری و مدل های بزرگ برای برنامه های پزشکی استفاده کنند.

طبق بحث های Zhiwei با کارشناسان هوش مصنوعی پزشکی، تحقیقات پزشکی خود دارای شکاف های دانش قابل توجهی است و دانش جدید به سرعت در حال رشد است. بنابراین، پتانسیل قابل توجهی برای استفاده از مدل های بزرگ برای انجام تحقیقات پایه پزشکی وجود دارد. به عنوان مثال، مدل AlphaFold برای پیش بینی ساختار پروتئین توسط بیش از 1.8 میلیون دانشمند در سراسر جهان برای تسریع در تحقیقات، از جمله توسعه مواد زیستی تجدید پذیر و پیشبرد تحقیقات ژنتیکی، مورد استفاده قرار گرفته است.

علاوه بر دنبال کردن یک ایده آل یا پول درآوردن، استارت آپ هوش مصنوعی پزشکی نیز با این سوال روبرو است که آیا یک مدل بزرگ پزشکی عمومی ایجاد کند یا خیر.

ژانگ سنسن اظهار داشت که هیچ پیشرفتی در مدل های بزرگ پزشکی عمومی در بازار داخلی وجود نداشته است، در درجه اول به دلیل تکیه بر تجهیزات پزشکی قدرتمند برای جمع آوری و استفاده از داده ها در مقیاس بزرگ. بسیاری از امکانات پزشکی در چین به طور گسترده ای رایج نشده اند و تشخیص دقیق را برای هوش مصنوعی دشوار می کنند. با این حال، برخی از بیمارستان های قوی، مانند کلینیک مایو، شروع به بررسی راه اندازی مدل های بزرگ خود کرده اند. اگرچه دیدن فرصت‌های سود در کوتاه‌مدت دشوار است، اما این نوع مدل‌های بزرگ ممکن است تأثیر عمیقی بر صنعت پزشکی در بلندمدت داشته باشند.

صنعت پزشکی نیز با چالش تشخیص کاملاً خودکار، به ویژه در بازار داخلی، روبرو است، جایی که تجهیزات ناکافی است و هوش مصنوعی نمی تواند به طور کامل جایگزین روش های تشخیصی سنتی شود. عدم وجود تجهیزات پزشکی گسترده، به ویژه در مناطق دور افتاده، پوشش کامل فناوری پزشکی را دشوار می کند، بنابراین تشخیص کاملاً خودکار همچنان یک چالش مهم است.

صنعت پزشکی دارای الزامات مجوز و انطباق سختگیرانه است و مدل های بزرگ باید هنگام ورود به زمینه پزشکی به مسائل انطباق رسیدگی کنند. خدمات پزشکی C-end آینده ممکن است تکنیک های پزشکان و هوش مصنوعی را برای بهبود کارایی تشخیص و درمان، به ویژه برای نسل های جوان، ترکیب کند.

در نهایت، حتی بدون در نظر گرفتن ویژگی های بازار داخلی B2B، رقابت در برنامه های کاربردی مدل بزرگ، زنده ماندن در بازار To B را چالش برانگیز می کند. وانگ ونگوانگ اظهار داشت که در حالی که مدل های طراحی برای محصولات مدل بزرگ To B هنوز در حال بررسی هستند، در نهایت همگرا می شوند. این نه تنها در چین بلکه در شرکت های فناوری سیلیکون ولی مانند OpenAI، Anthropic و Google نیز صادق است. تا زمانی که تفاوت قابل توجهی در عملکرد خود مدل ها وجود نداشته باشد، کسب درآمد در این بازار غیرممکن است و در نهایت همه در یک سطح خواهند بود.

به همین دلیل است که DeepSeek R1 بیشترین تأثیر خود را نه در چین بلکه در خارج از کشور، به ویژه بر شرکت های فناوری سیلیکون ولی گذاشته است. بازار سهام ایالات متحده پس از انتشار R1 شروع به تجربه نوسانات بالا و سپس کاهش کرد. منطق اصلی ساده است: مدل های بزرگ سیلیکون ولی توسط چین گرفتار شده اند. در حالی که از آنها پیشی نگرفته است، ناتوانی در گسترش شکاف باعث شده است که حمایت از چنین ارزش های بالایی غیرممکن شود و منجر به کاهش قیمت سهام شود.

البته، راه دیگری نیز برای جذب مشتری در بازار To B وجود دارد: منبع باز. مدل های سود اصلی برای منبع باز شامل ارائه عملکردهای سطح پولی، میزبانی ابری و خدمات ارزش افزوده مانند مشاوره و آموزش در سطح سازمانی بر اساس فناوری منبع باز است.

مستقیم‌ترین اثر مدل‌های بزرگ منبع باز، ترویج رایج شدن فناوری است. ژانگ سنسن اظهار داشت که منبع باز DeepSeek به طور قابل توجهی کاربرد مدل های بزرگ توسط شرکت ها را تسریع کرده است. مدیریت ارشد از کاربرد مدل های بزرگ بسیار حمایت می کند. از آنجایی که مدل های بزرگ در برنامه های کاربردی عملی، به ویژه در کاهش دخالت انسان و افزایش کارایی، عملکرد خوبی دارند، پشتیبانی همچنان افزایش خواهد یافت.

صنعت مالی، به عنوان صنعتی با بهترین کیفیت داده، همیشه دارای انباشت فنی غنی در هوش مصنوعی بوده است و می تواند به سرعت همگام شود. صرف نظر از DeepSeek، امور مالی فناوری هوش مصنوعی را پیاده سازی خواهد کرد. با این حال، با DeepSeek، هوش مصنوعی نه تنها تجارت اصلی صنعت مالی را فعال می کند، بلکه در وظایف و عملیات روزانه اداری که قبلاً انجام آنها دشوار بود نیز استفاده می شود.

عملیات раньше بسیار پرهزینه بود. به عنوان مثال، تجزیه و تحلیل علت اصلی قبلاً نیاز به نظارت بر عملیات سنتی و AIOps و همچنین آموزش مدل های کوچک داشت. اکنون، DeepSeek را می توان در ارتباط با پایگاه های دانش برای تولید برنامه های کاربردی برای رسیدگی به نظارت، هشدارها، تجزیه و تحلیل سلف سرویس و قابلیت ردیابی، پردازش خودکار و بهبود ثبات استفاده کرد، که انعطاف پذیرتر از AIOps است.

علاوه بر این، پوشش هوش مصنوعی از عملیات گسترده تر شده است و توجه بیشتری به تعامل و ابتکار دارد. ابتکار به معنای اجازه دادن به هوش مصنوعی برای انجام فعالانه عملیات است. با تغییر از تکیه بر قوانین، انسان ها یا حتی تجربه شخصی، جایی که سطح تجربه انسانی سطح قابلیت های عملیاتی را تعیین می کرد، اکنون می توان از مدل های هوش مصنوعی سبک تر برای دستیابی مستقیم به این هدف استفاده کرد.

اگرچه نرخ توهم DeepSeek هنوز بالاست، حتی تفاوت چندانی با سایر مدل های مشابه ندارد، اما قابلیت های استدلال و کاربرد عملی آن می تواند اثرات منفی توهمات را جبران کند. این مشکل به تدریج از طریق تنظیم دقیق و بهینه سازی با استفاده از RAG و سایر فناوری های مرتبط بهبود می یابد.

گائو پنگ، کارشناس فناوری مدل بزرگ Alibaba بر این باور است که تأثیر DeepSeek برای شرکت های بزرگ و کوچک متفاوت است:

مدل‌های بزرگ مورد استفاده داخلی توسط Alibaba همیشه پیشرفته‌ترین مدل‌ها در این صنعت بوده‌اند، بنابراین ظهور DeepSeek تأثیر قابل‌توجهی نداشته است. Alibaba از DeepSeek برای ارزیابی عملکرد و مقایسه استفاده می کند و الهام فنی بیشتری را ارائه می دهد. پیاده سازی DeepSeek در استدلال نسبتاً سریع است و جزئیات فنی رایج تر است. DeepSeek نیز تحت تأثیر Qianwen قرار گرفته است.

در مقابل، DeepSeek تأثیر بیشتری بر شرکت‌های کوچک و متوسط ​​دارد، زیرا قبلاً هیچ مدلی وجود نداشت که بتواند به اثر DeepSeek دست یابد و در عین حال استقرار خصوصی با هزینه کم ارائه دهد. پس از انتشار DeepSeek، شرکت‌های زیادی که ماشین‌های یکپارچه DeepSeek را می‌فروشند، ظهور کرده‌اند. با این حال، DeepSeek در مقایسه با بسیاری از ماشین‌های یکپارچه مدل منبع باز ارزان‌ترین نیست و بسته به استانداردهای خاص دارد.

در هر صورت، مدل بزرگ منبع باز داخلی اکنون در حال شکوفایی است و می تواند به طور جهانی رقابت کند. با این حال، بر اساس پیاده سازی مدل های بزرگ بیمه پینگ آن، ژانگ سنسن بر این باور است که مدل های بزرگ منبع باز هنوز محدودیت های غیرقابل عبور دارند:

برای ما، DeepSeek در درجه اول دارای مزیت هزینه زیادی است. از نظر قابلیت ها، ممکن است در سناریوهای عملیاتی از نظر استدلال، توانایی تعمیم و درک متنی بهتر از سایر مدل ها باشد. با این حال، DeepSeek در سناریوهای پیچیده تری مانند کنترل ریسک مالی عملکرد خوبی ندارد. این به این دلیل است که تنظیم دقیق تر یا حتی بهینه سازی در ارتباط با سایر مدل ها مورد نیاز است. بنابراین، برای بهبود بیشتر عملکرد مدل، تنظیم دقیق هدفمند بر اساس سناریوهای کاربردی خاص مورد نیاز است.

مدل های بزرگ خود توسعه یافته Ping An به دو لایه تقسیم می شوند: مدل بزرگ پایه زیربنایی و مدل های دامنه مسئول بانکداری، بیمه و سایر مشاغل. مدل های بزرگ مورد استفاده داخلی در زمینه دانش حرفه ای، به ویژه در زمینه های خاص مانند مالی و پزشکی، که مدل ها دقیق تر هستند، عملکرد بهتری نسبت به DeepSeek دارند. با این حال، DeepSeek همچنان در توانایی استدلال مزیت قوی دارد. در برخی سناریوها، ما می‌خواهیم از DeepSeek برای یک تلاش در مقیاس کوچک استفاده کنیم تا ببینیم آیا می‌توان آن را اجرا کرد یا خیر.

هیچ تفاوت قابل توجهی بین Alibaba Qianwen، Baidu Wenxin و Zhipu ChatGLM و DeepSeek در این زمینه وجود ندارد. قضاوت بر این اساس است که این مدل ها هیچ تفاوت قابل توجهی با DeepSeek در توانایی استدلال و ساختار پایگاه دانش ندارند.

به طور کلی، تأثیر مدل های بزرگ منبع باز در حال حاضر محدود است و سرعت رقابت بین آنها شدید است.

خطرات بازار To C

در حالی که رقابت در بازار To B شدید است، این بدان معنا نیست که مسیر To C امید بیشتری ارائه می دهد.

رقابت در بازار To C برای مدل های بزرگ نیز بسیار شدید است، اما با بازار To B بسیار متفاوت است.

چشم انداز بازار دائما در حال تغییر است.

تجاری سازی To C دشوار است.

محبوب ترین برنامه ها لزوماً بیشترین درآمد را ایجاد نمی کنند. به عنوان مثال، ChatGPT بیشترین درآمد را دارد، اما OpenAI همچنان 5 میلیارد دلار در سال ضرر می کند، در حالی که بسیاری از برنامه های ‘تقلید’ ChatGPT احتمالاً به سودآوری سریع دست یافته اند. پس از محبوبیت DeepSeek، مقلدان و جاعلان به صورت دسته جمعی وارد شدند.

مشاهده وضعیت ‘ببرهای کوچک’ از بازار C-end نیز خوش بینانه نیست. ارتباط Zhiwei با کارشناسان صنعت عموماً بر این باور است که تولیدکنندگان بزرگ فشار بقای زیادی را وارد خواهند کرد.

جیانگ شائو اظهار داشت که بهترین عملکرد ‘ببرهای کوچک’ در بازار مصرف کننده، Kimi Moonshot AI است. اما اکنون، Yuanbao Tencent رتبه اول، DeepSeek رتبه دوم و Doubao رتبه سوم را دارند. سه شرکت برتر تقریباً بیشتر سهم بازار را اشغال کرده اند. Yuanbao Tencent با کمک اکوسیستم WeChat تعداد زیادی از ترافیک مشتری را به دست آورده است، در حالی که DeepSeek با نوآوری های فناوری و عملکرد عالی در چندین سناریو برجسته شده است.

لیانگ هه اظهار داشت که فناوری مدل بزرگ Kimi تفاوت چندانی با رقبای خود ندارد، بنابراین فقط می تواند رایگان باشد، که باعث می شود تجاری سازی برای Moonshot بسیار دشوار شود. به عنوان یک برنامه کاربردی To C، مشخص نیست که چه تفاوتی با Yuanbao و Doubao دارد. علاوه بر این، Doubao می تواند توسط سایر مشاغل Byte پشتیبانی شود و Yuanbao می تواند توسط سایر مشاغل Tencent پشتیبانی شود. آنها می توانند 100 میلیارد سرمایه گذاری کنند تا از این برنامه ها پشتیبانی کنند.

جیانگ شائو افزود که کاربران C-end بیشتر به سهولت استفاده از محصول اهمیت می دهند، که Tencent و Byte در آن بهتر هستند. البته، Alibaba نیز فرصت هایی دارد. Alibaba در حال ایجاد یک برنامه کاربردی به نام ‘AI Listening’ است که از هوش مصنوعی برای چت و تعامل استفاده می کند و هدف آن جایگزینی Douyin در پلتفرم ویدیوی کوتاه است. اگرچه Douyin تعداد زیادی از سازندگان را برای تولید محتوای با کیفیت بالا جذب می کند، برنامه های چت هوش مصنوعی این پتانسیل را دارند که با ارائه تجربیات شخصی و تعاملی تر، گروه های کاربر را جذب کنند. تفاوت بین این دو در ایجاد محتوا و تعامل است. اگر Alibaba بتواند از این طریق پیشرفت کند، این شانس را نیز دارد که اوضاع را تغییر دهد، اما نمی توان گفت اگر Tencent از آن پیروی کند.

در مورد MiniMax، نظرات صنعت کمی متفاوت است.

لیانگ هه بر این باور است که Conch AI MiniMax در حال حاضر سود خوبی دارد. این شرکت راه خود را پیدا کرده است، اما هنوز مشخص نیست که آیا این مسیر به MiniMax اجازه می دهد تا ارزش گذاری خود را به اندازه کافی افزایش دهد یا خیر. با توجه به جهت گیری برنامه، MiniMax پس از خروج DeepSeek آرام تر است. اگر آنها از مدل های DeepSeek استفاده کنند، در هزینه های تحقیق و توسعه مدل صرفه جویی می کند و برنامه های کاربردی آن می توانند به کسب درآمد ادامه دهند، حتی بیشتر.

جیانگ شائو بر این باور است که MiniMax در صورتی که بتواند بعداً یک برنامه محبوب ایجاد کند، شانس دارد، اما Alibaba ممکن است از آن پیشی بگیرد و ابتدا یک برنامه محبوب ایجاد کند، بنابراین حتی اگر MiniMax شانسی داشته باشد، احتمال آن زیاد نیست.

در نهایت، تمایز محصول همچنان نقطه پیشرفت برای برنامه های کاربردی C-end است.

بر اساس آخرین گزارش a16z ‘100 برنامه برتر مصرف کننده Gen AI’، بسیاری از برنامه های با استفاده کم در واقع درآمد بهتری کسب می کنند. برخی از محصولاتی که تطبیق پذیری ضعیفی دارند، مانند شناسایی گیاهان و تغذیه، بیش از محصولات عمومی، کاربران پولی را جذب می کنند.

تمایز محصولات هوش مصنوعی عمومی دشوار است. کاربران تمایل کمی به پرداخت دارند، چرخه سود طولانی است، بنابراین آنها نمی توانند شرکت های بزرگ را زنده بگذارند.

و اگر تمایز به اندازه کافی عمیق عمودی نباشد، به راحتی می توان آن را از طریق ارتقاء ظرفیت توسط مدل بزرگ پایه درونی کرد. به عنوان مثال، قابلیت های تولید تصویر GPT-4o اخیراً ضربه ای کاهش یافته است به استارت آپ های متن به تصویر مانند Midjourney. این قابلیت پوشش اغلب تصادفی و غیرقابل پیش بینی است، همانطور که ضرب المثل می گوید، ‘نابود کردن شما هیچ ربطی به شما ندارد’.

تقلید در سطح پیکسل از رقبا و ارتقاء سریع مدل های بزرگ پایه، منظره استارت آپ های هوش مصنوعی C-end را تقریباً همیشه فقط برای مدت کوتاهی حفظ می کند.

در مورد چگونگی تصاحب احتمال بسیار کم تبدیل شدن به یک ضربه، کارشناسان صنعت به اتفاق آرا بر این باورند که ‘اساساً هیچ تجربه ای برای دنبال کردن وجود ندارد’.

‘ببرهای کوچک’ تا حد زیادی به این دلیل وارد تنگنای امروز شده اند که بیش از حد روی مدل بزرگ پایه سرمایه گذاری کرده اند و نیروی انسانی، منابع مالی و منابع مادی مورد نیاز برای زنده ماندن و برتری در این مسیر را دست کم گرفته اند، در نتیجه تشخیص در مسیر کاربرد دشوار است.

اکنون، ‘ببرهای کوچک’ کمتر و کمتر مصمم به حمله به AGI هستند و لی کایفو به طور علنی اعلام کرده است که فقط DeepSeek، Ali و Byte در مدل بزرگ پایه داخلی باقی خواهند ماند.

در این راستا، کارشناسان صنعت که با Zhiwei ارتباط برقرار کردند، اساساً با این دیدگاه موافق هستند.

جیانگ شائو گفت که استارت آپ های هوش مصنوعی که هنوز به تلاش برای فناوری مدل بزرگ ادامه می دهند، اساساً باید بمیرند. امیدوارکننده ترین قطعا DeepSeek است، دوم Alibaba و سوم ByteDance. انتظار می رود رتبه اول 50٪ -80٪ از ترافیک را به دست آورد و دو مورد آخر ممکن است 10٪ از ترافیک را دریافت کنند. هسته اصلی این است که چه کسی ابتدا AGI را می سازد و چه کسی برنده نهایی است.

DeepSeek در حال حاضر رقابتی ترین در زمینه مدل های بزرگ است و نوآوری های فناوری و عملکرد آن در برنامه های کاربردی عملی بی عیب و نقص است. Alibaba و ByteDance نیز رقابت قوی دارند، به ویژه در برنامه های کاربردی متقابل پلتفرم و منابع داده. رتبه بندی عمدتاً بر اساس قابلیت های نوآوری هر شرکت در فناوری اساسی، قدرت محاسباتی، منابع داده و برنامه های کاربردی عملی است.

تیم های Zhipu و Kimi قاطعانه معتقدند که ادامه بهبود قابلیت های مدل پایه آینده است. در مقابل، من بر این باورم که با تغییر در تقاضای بازار و تنوع سناریوهای کاربردی، مسیر صرفاً تقویت مدل پایه ممکن است محدود شود و مسیرهای توسعه مدل انعطاف پذیرتر و سازگارتر ممکن است در بازار رقابتی تر باشند.

رقابت در فناوری مدل بزرگ بسیار شدید است و شرکت هایی که سرمایه گذاری های هنگفتی دارند باید در نهایت پیشرفت های آشکاری در نوآوری، قدرت محاسباتی، داده و بهینه سازی داشته باشند تا رقابت پذیری را حفظ کنند. سایر شرکت هایی که از پیشرفت های فناوری عقب می مانند یا قادر به مقابله با تقاضای بازار نیستند، به تدریج حذف خواهند شد.

لیانگ هه گفت که فقط DeepSeek، Ali و Byte در شرکت بزرگ مدل پایه داخلی در آینده باقی خواهند ماند، بر اساس این واقعیت که این سه نفر قدرت و عزم راسخ برای سرمایه گذاری منابع فوق العاده در تحقیق و توسعه دارند. برای Byte، از دست دادن فرصت برای مدل های بزرگ غیرممکن است، در غیر این صورت تأثیر زیادی بر کل آن خواهد داشت. و فناوری DeepSeek موانع زیادی برای Byte نخواهد داشت، اما DeepSeek در حال حاضر مزیت بیشتری در راندمان تحقیق و توسعه دارد. مدل منبع باز Qianwen Alibaba خود در سطح بالایی است. قبل از اینکه DeepSeek محبوب شود، Qianwen و Llama اساساً یکدیگر را تعقیب می کردند. برای Alibaba، مدل Qianwen ممکن است درآمدی نداشته باشد، اما مشاغل ابری مرتبط می توانند درآمد کسب کنند و Byte مشابه است و می تواند به استفاده از فناوری مدل بزرگ برای بهینه سازی مداوم تجربه Douyin و سایر برنامه ها ادامه دهد. برای استارت آپ های هوش مصنوعی، اگر خود مدل درآمدی نداشته باشد، ریشه بقا را لمس می کند.

وانگ ونگوانگ گفت که مزیت DeepSeek عمدتاً در ایده آلیسم فناوری است. در عرض دو یا سه ماه قبل و بعد از جشنواره بهار، ترافیک DeepSeek بسیار زیاد بود. اگر می خواست تجاری سازی شود، به زودی در جهان به اوج می رسید و مدل های بزرگ دیگر مانند Doubao اصلاً شانسی نداشتند. تا زمانی که DeepSeek روش‌های بهینه‌سازی مربوط به زیرساخت را در هفته منبع باز اخیر منبع باز نکند، می‌تواند در آینده به این تکیه کند تا درآمد کسب کند، به‌طوری که دیگران شانسی ندارند. DeepSeek بودجه دریافت نکرده است و نیازی نیست که تحت تأثیر سرمایه گذاران قرار گیرد. ایده آلیسم فناوری و استعداد بزرگترین موانع هستند. در مقایسه با OpenAI، نتایجی که OpenAI اکنون می تواند ببیند، اساساً نتایج تحقیقات قبل از اختلاف بین Altman و Ilya است. حداقل نقاط نوآوری مشخص شده اند. اکنون، پس از خروج تیم اصلی ایده آلیست ها، OpenAI تقریباً هیچ نوآوری ندارد. در حال حاضر، نوآوری OpenAI بیشتر در سطح کاربرد است، مانند تحقیقات عمیق. هیچ مانعی برای نوآوری در سطح کاربرد وجود ندارد، بنابراین باید با رقبا رقابت کند.

وانگ مو، یک کارشناس فناوری هوش مصنوعی کارخانه بزرگ، به Zhiwei گفت که مگر اینکه پول، استعداد و سخت افزار وجود داشته باشد، نیازی به اتلاف تلاش برای آموزش مدل های بزرگ وجود ندارد. DeepSeek در اوایل سال 2021 دارای خوشه 10000 کارتی بود و کمبودی در پول ندارد. در مقابل، سایر شرکت های کوچک و متوسط ​​به سختی می توانند این شرایط را جمع آوری کنند.

گائو پنگ اظهار داشت که استارت آپ های هوش مصنوعی می خواهند زنده بمانند، آنها هنوز باید به برنامه های کاربردی روی بیاورند. من یک یا دو سال پیش اینطور فکر می کردم و اکنون ممکن است برای چرخیدن خیلی دیر شده باشد. اولین دسته از شرکت‌های هوش مصنوعی که در مرحله بعد حذف می‌شوند، شرکت‌هایی هستند که مدل‌های بزرگ پایه را می‌سازند. آموزش مدل های بزرگ در واقع جزئیات پیچیده زیادی دارد و به انباشت تجربه بسیار وابسته است. جزئیات داخلی معماری ترانسفورمر عموماً به خوبی درک می شود، اما مقالات مدل های منبع باز یا منبع بسته اساساً به شما نمی گویند که چگونه داده ها آماده می شوند، جزئیات داده چیست، مقیاس داده چقدر بزرگ است و کیفیت داده چقدر خوب است. هیچ استاندارد واحدی در صنعت وجود ندارد.

منبع باز منبع باز همیشه یک عمل معمول در مسیر مدل بزرگ بوده است. در حال حاضر، مدل های بزرگ بسیار کمی وجود دارند که کد، وزن، مجموعه داده ها و فرآیند آموزش را به طور کامل فاش کنند. شناخته شده ترها OLMo، BLOOM و غیره هستند.

با این حال، حتی اگر چرخیدن به برنامه های کاربردی بتواند زنده بماند؟ از تجزیه و تحلیل قبلی مسیر To B و مسیر To C، برای استارت آپ های هوش مصنوعی تقریباً دشوار است که موانع صنعت خود را در برنامه های کاربردی ایجاد کنند. در این راستا، گائو پنگ اظهار داشت که کلید ایجاد موانع صنعت خود در این نهفته است که چه داده ای دارید. مدل ها را می توان توسط هر کسی استفاده کرد. داده ها به دو جنبه تقسیم می شوند: یکی تجربه میدانی کارآفرین و دیگری داده های موجود.

از منظر فرهنگ شرکتی، گائو پنگ بر این باور است که تحقیق و توسعه مدل های بزرگ پایه نیازمند روحیه سخت کوشی تجربی و مهندسی است. ‘برای مدت طولانی قبل از این، بسیاری از استارت آپ های هوش مصنوعی داخلی خیلی پر سر و صدا بودند. هنگام انجام فناوری، ابتدا باید آن را به طور کم سر و صدا انجام دهید و سپس به طور پر سر و صدا تبلیغ کنید. برخی از تیم ها از نظر آکادمیک بیشتر تشکیل شده اند، اما افراد در دانشگاه گاهی اوقات فناوری را بیش از حد نظری مطالعه می کنند. از نظر استعداد یا تیم، موفقیت یک تیم مدل بزرگ عمدتاً به این بستگی دارد که آیا رئیس مدل های بزرگ را درک می کند یا خیر. اگر رئیس فناوری مدل بزرگ را درک نکند یا ایمان به پافشاری نداشته باشد، زیرا درآمدی ندارد، اصلاً کارساز نخواهد بود. موفقیت DeepSeek بیشتر به یک حالت سازماندهی از بالا به پایین متکی است. رئیس جزئیات فنی را به خوبی درک می کند و همه را برای انجام آن با هم هدایت می کند. مدل های داخلی بسیار کمی وجود دارند که با این مدل مطابقت داشته باشند.’

با توجه به بحث داغ صنعت در مورد پیش بینی برنده نهایی مدل بزرگ پایه داخلی، گائو پنگ بر این باور است که این قضاوت خیلی زود است. ‘تفاوت زیادی در مسیرهای فنی بازیکنانی که می توانند در رقابت شرکت کنند، وجود نخواهد داشت. فقط معماری ترانسفورمر را دنبال کنید و بهینه سازی دقیق انجام دهید. Mamba و RWKV نیز امید دارند. نکته کلیدی این است که کارها را به طور پیوسته انجام دهید و زمان همه