DeepSeek، نامی که به سرعت از گمنامی نسبی به یک نقطه کانونی در گفتمان جهانی هوش مصنوعی صعود کرده است، بحث و گمانهزنیهای شدیدی را در بخشهای فناوری و مالی برانگیخته است. آزمایشگاه هوش مصنوعی چینی که پشت این نیروی نوظهور قرار دارد، نظم موجود را مختل کرده و تحلیلگران را بر آن داشته تا در مورد پایداری سلطه ایالات متحده در مسابقه هوش مصنوعی و دوام بلندمدت تقاضای فعلی تراشههای هوش مصنوعی سؤال کنند. اما عوامل کلیدی که DeepSeek را به جایگاه کنونی خود رسانده است، چیست؟
پیدایش DeepSeek: از صندوق پوشش ریسک تا آزمایشگاه هوش مصنوعی
ریشههای DeepSeek عمیقاً با دنیای مالی کمی درهم تنیده است. این شرکت توسط High-Flyer Capital Management، یک صندوق پوشش ریسک چینی مشهور به استفاده از هوش مصنوعی در تصمیمگیریهای تجاری مبتنی بر داده، پشتیبانی میشود.
Liang Wenfeng، یکی از علاقهمندان به هوش مصنوعی که در زمان حضورش در دانشگاه Zhejiang در زمینه تجارت سابقه داشت، در سال 2015 شرکت High-Flyer را تأسیس کرد. در سال 2019، او High-Flyer Capital Management را به عنوان یک صندوق پوشش ریسک با تمرکز ویژه بر توسعه و پیادهسازی الگوریتمهای هوش مصنوعی برای کاربردهای مالی راهاندازی کرد.
در سال 2023، High-Flyer، DeepSeek را به عنوان یک آزمایشگاه تحقیقاتی اختصاصی هوش مصنوعی که مستقل از تجارت اصلی مالی خود فعالیت میکرد، پرورش داد. متعاقباً، با High-Flyer به عنوان یک سرمایهگذار کلیدی، این آزمایشگاه به یک نهاد جداگانه تبدیل شد و نام DeepSeek را حفظ کرد.
DeepSeek از بدو تأسیس، ایجاد خوشههای مرکز داده خود را برای تسهیل آموزش مدل در اولویت قرار داد. با این حال، DeepSeek نیز مانند سایر شرکتهای هوش مصنوعی که در چین فعالیت میکنند، به دلیل محدودیتهای صادرات ایالات متحده در مورد سختافزار پیشرفته با چالشهایی مواجه شده است. در نتیجه، این شرکت برای آموزش مدلهای جدیدتر خود مجبور شد به استفاده از تراشههای Nvidia H800، نوعی ضعیفتر از تراشههای H100 که به راحتی در دسترس شرکتهای ایالات متحده قرار دارند، متوسل شود.
تیم فنی DeepSeek به جوانی و پویایی خود مشهور است. این شرکت به طور فعال محققان هوش مصنوعی دکترا را از دانشگاههای برجسته چینی استخدام میکند. علاوه بر این، DeepSeek افرادی را از زمینههای مختلف، حتی کسانی که تخصص علوم کامپیوتر ندارند، استخدام میکند تا اطمینان حاصل کند که فناوری آن میتواند به طور موثر طیف گستردهای از موضوعات را درک کرده و به آنها رسیدگی کند، همانطور که نیویورک تایمز گزارش داده است.
مدلهای هوش مصنوعی DeepSeek: به چالش کشیدن وضعیت موجود
DeepSeek مجموعه اولیه مدلهای خود – DeepSeek Coder، DeepSeek LLM و DeepSeek Chat – را در نوامبر 2023 رونمایی کرد. با این حال، انتشار نسل بعدی مدلهای DeepSeek-V2 در بهار بود که واقعاً توجه صنعت هوش مصنوعی را به خود جلب کرد.
DeepSeek-V2، یک سیستم همهکاره که قادر به تجزیه و تحلیل متن و تصاویر است، عملکرد چشمگیری را در معیارهای مختلف هوش مصنوعی نشان داد. نکته قابل توجه این است که این عملکرد را با هزینه بسیار کمتری در مقایسه با مدلهای رقیب موجود در آن زمان به دست آورد. این امر رقبای داخلی DeepSeek، از جمله ByteDance و Alibaba را بر آن داشت تا قیمت برخی از مدلهای خود را کاهش داده و برخی دیگر را کاملاً رایگان ارائه دهند.
DeepSeek V3 در مقایسه با مدلهای متنباز قابل دانلود مانند Llama متا و مدلهای "بسته" که فقط از طریق API در دسترس هستند، مانند GPT-4o OpenAI، عملکرد بهتری را به نمایش گذاشته است.
به همان اندازه قابل توجه، مدل "استدلال" R1 DeepSeek است. DeepSeek که در ژانویه راه اندازی شد، ادعا می کند که R1 عملکردی مشابه مدل o1 OpenAI در معیارهای کلیدی دارد.
R1 به عنوان یک مدل استدلال، مکانیسم های خودآزمایی را در خود جای داده و برخی از مشکلات رایج مرتبط با مدل های استاندارد را کاهش می دهد. در حالی که مدلهای استدلال ممکن است به زمان پردازش کمی طولانیتری برای رسیدن به راهحلها (از چند ثانیه تا چند دقیقه) نیاز داشته باشند، اما در حوزههایی مانند فیزیک، علوم و ریاضیات، قابلیت اطمینان بیشتری از خود نشان میدهند.
با این حال، مدلهای DeepSeek، از جمله R1 و DeepSeek V3، تحت نظارت رگولاتور اینترنت چین هستند که اطمینان حاصل میکند پاسخهای آنها با "ارزشهای اصلی سوسیالیستی" همسو باشد. به عنوان مثال، در برنامه چت بات DeepSeek، R1 به سؤالات مربوط به میدان Tiananmen یا خودمختاری تایوان پاسخ نخواهد داد.
در ماه مارس، ترافیک وب سایت DeepSeek از 16.5 میلیون بازدید فراتر رفت. به گفته David Carr، ویراستار Similarweb، علیرغم کاهش 25 درصدی ترافیک در مقایسه با فوریه، DeepSeek از نظر بازدیدهای روزانه در رتبه دوم قرار گرفت. با این حال، این رقم همچنان در مقایسه با ChatGPT، که در ماه مارس از 500 میلیون کاربر فعال هفتگی فراتر رفت، ناچیز است.
رویکرد مخرب به چشم انداز هوش مصنوعی
مدل کسب و کار DeepSeek تا حدودی مرموز باقی مانده است. این شرکت محصولات و خدمات خود را به طور قابل توجهی زیر ارزش بازار قیمتگذاری میکند و حتی برخی را به صورت رایگان ارائه میدهد. علاوه بر این، علیرغم علاقه قابل توجه شرکتهای سرمایهگذاری خطرپذیر، در برابر بودجه خارجی مقاومت کرده است.
DeepSeek رقابت شدید هزینه خود را به پیشرفت در کارایی نسبت میدهد. با این حال، برخی از کارشناسان در مورد صحت ارقام ارائه شده توسط شرکت تردید کردهاند.
صرف نظر از این، توسعه دهندگان از مدل های DeepSeek استقبال کرده اند، که در حالی که به معنای سنتی متن باز نیستند، تحت مجوزهای مجاز که امکان استفاده تجاری را فراهم می کند، در دسترس هستند. به گفته Clem Delangue، مدیر عامل Hugging Face، توسعه دهندگان در این پلتفرم بیش از 500 مدل مشتق از R1 ایجاد کرده اند که در مجموع 2.5 میلیون بار دانلود شده اند.
موفقیت DeepSeek در برابر رقبای بزرگتر و تثبیت شده، هم به عنوان "واژگون کننده هوش مصنوعی" و هم "بیش از حد تبلیغ شده" توصیف شده است. دستاوردهای این شرکت تا حدودی مسئول کاهش 18 درصدی قیمت سهام Nvidia در ژانویه بود و باعث واکنش عمومی از سوی مدیر عامل OpenAI، Sam Altman شد. به گزارش رویترز، در ماه مارس، دفاتر وزارت بازرگانی ایالات متحده گزارش دادند که DeepSeek را در دستگاه های دولتی ممنوع کرده اند.
مایکروسافت DeepSeek را در سرویس Azure AI Foundry خود، پلتفرمی که خدمات هوش مصنوعی را برای شرکت ها ادغام می کند، ادغام کرده است. در جریان تماس تلفنی درآمد سه ماهه اول متا، مدیر عامل Mark Zuckerberg اظهار داشت که سرمایه گذاری در زیرساخت هوش مصنوعی همچنان یک "مزیت استراتژیک" برای این شرکت خواهد بود، زمانی که در مورد تأثیر بالقوه DeepSeek بر هزینه های هوش مصنوعی متا سؤال شد. در ماه مارس، OpenAI DeepSeek را به عنوان "یارانه ای از سوی دولت" و "تحت کنترل دولت" برچسب گذاری کرد و توصیه کرد که دولت ایالات متحده ممنوعیت مدل های خود را در نظر بگیرد.
در جریان تماس تلفنی درآمد سه ماهه چهارم Nvidia، مدیر عامل Jensen Huang بر "نوآوری عالی" DeepSeek تأکید کرد و خاطرنشان کرد که مدل های استدلال آن به طور قابل توجهی به قدرت محاسباتی بیشتری نیاز دارند که به نفع Nvidia است.
برعکس، برخی از شرکتها، کشورها و دولتها، از جمله کره جنوبی و ایالت نیویورک، استفاده از DeepSeek را در دستگاههای دولتی ممنوع کردهاند.
در ماه مه، معاون رئیس مایکروسافت و رئیس جمهور Brad Smith در مقابل سنا شهادت داد که کارمندان مایکروسافت به دلیل نگرانی در مورد امنیت داده ها و تبلیغات احتمالی، از استفاده از DeepSeek منع شده اند.
آینده نامشخص DeepSeek
مسیر آینده DeepSeek نامشخص باقی می ماند. در حالی که انتظار می رود پیشرفت های بیشتری در مدل ایجاد شود، به نظر می رسد دولت ایالات متحده به طور فزاینده ای نسبت به نفوذ خارجی مضر احتمالی محتاط است. در ماه مارس، وال استریت ژورنال گزارش داد که ایالات متحده احتمالاً DeepSeek را در دستگاه های دولتی ممنوع خواهد کرد.
صعود سریع DeepSeek بدون شک پایه های صنعت هوش مصنوعی را متزلزل کرده و باعث ارزیابی مجدد پویایی رقابتی و پتانسیل نوآوری های مخرب شده است. اینکه آیا می تواند حرکت فعلی خود را در مواجهه با افزایش نظارت و چالش های نظارتی حفظ کند یا خیر، باید منتظر ماند. سال های آینده در تعیین تأثیر بلندمدت DeepSeek بر چشم انداز جهانی هوش مصنوعی محوری خواهد بود. توانایی آن در پیمایش در تعامل پیچیده بین پیشرفت های تکنولوژیکی، ملاحظات ژئوپلیتیکی و نگرانی های اخلاقی در نهایت میراث آن را تعیین خواهد کرد. دنیای هوش مصنوعی از نزدیک نظاره گر خواهد بود.
داستان DeepSeek یادآور این است که در دنیای به سرعت در حال تحول هوش مصنوعی، بازیکنان جدید می توانند به سرعت ظهور کرده و نظم موجود را به چالش بکشند. موفقیت این شرکت که ناشی از فناوری نوآورانه و تمایل به برهم زدن مدل های کسب و کار سنتی است، صنعت را مجبور کرده است تا متوجه شود. با ادامه توسعه و گسترش دامنه DeepSeek، بدون شک نقش مهمی در شکل دادن به آینده هوش مصنوعی ایفا خواهد کرد.