DeepSeek: ظهور یک قدرت هوش مصنوعی چینی | fa

DeepSeek، نامی که به سرعت از گمنامی نسبی به یک نقطه کانونی در گفتمان جهانی هوش مصنوعی صعود کرده است، بحث و گمانه‌زنی‌های شدیدی را در بخش‌های فناوری و مالی برانگیخته است. آزمایشگاه هوش مصنوعی چینی که پشت این نیروی نوظهور قرار دارد، نظم موجود را مختل کرده و تحلیلگران را بر آن داشته تا در مورد پایداری سلطه ایالات متحده در مسابقه هوش مصنوعی و دوام بلندمدت تقاضای فعلی تراشه‌های هوش مصنوعی سؤال کنند. اما عوامل کلیدی که DeepSeek را به جایگاه کنونی خود رسانده است، چیست؟

پیدایش DeepSeek: از صندوق پوشش ریسک تا آزمایشگاه هوش مصنوعی

ریشه‌های DeepSeek عمیقاً با دنیای مالی کمی درهم تنیده است. این شرکت توسط High-Flyer Capital Management، یک صندوق پوشش ریسک چینی مشهور به استفاده از هوش مصنوعی در تصمیم‌گیری‌های تجاری مبتنی بر داده، پشتیبانی می‌شود.

Liang Wenfeng، یکی از علاقه‌مندان به هوش مصنوعی که در زمان حضورش در دانشگاه Zhejiang در زمینه تجارت سابقه داشت، در سال 2015 شرکت High-Flyer را تأسیس کرد. در سال 2019، او High-Flyer Capital Management را به عنوان یک صندوق پوشش ریسک با تمرکز ویژه بر توسعه و پیاده‌سازی الگوریتم‌های هوش مصنوعی برای کاربردهای مالی راه‌اندازی کرد.

در سال 2023، High-Flyer، DeepSeek را به عنوان یک آزمایشگاه تحقیقاتی اختصاصی هوش مصنوعی که مستقل از تجارت اصلی مالی خود فعالیت می‌کرد، پرورش داد. متعاقباً، با High-Flyer به عنوان یک سرمایه‌گذار کلیدی، این آزمایشگاه به یک نهاد جداگانه تبدیل شد و نام DeepSeek را حفظ کرد.

DeepSeek از بدو تأسیس، ایجاد خوشه‌های مرکز داده خود را برای تسهیل آموزش مدل در اولویت قرار داد. با این حال، DeepSeek نیز مانند سایر شرکت‌های هوش مصنوعی که در چین فعالیت می‌کنند، به دلیل محدودیت‌های صادرات ایالات متحده در مورد سخت‌افزار پیشرفته با چالش‌هایی مواجه شده است. در نتیجه، این شرکت برای آموزش مدل‌های جدیدتر خود مجبور شد به استفاده از تراشه‌های Nvidia H800، نوعی ضعیف‌تر از تراشه‌های H100 که به راحتی در دسترس شرکت‌های ایالات متحده قرار دارند، متوسل شود.

تیم فنی DeepSeek به جوانی و پویایی خود مشهور است. این شرکت به طور فعال محققان هوش مصنوعی دکترا را از دانشگاه‌های برجسته چینی استخدام می‌کند. علاوه بر این، DeepSeek افرادی را از زمینه‌های مختلف، حتی کسانی که تخصص علوم کامپیوتر ندارند، استخدام می‌کند تا اطمینان حاصل کند که فناوری آن می‌تواند به طور موثر طیف گسترده‌ای از موضوعات را درک کرده و به آنها رسیدگی کند، همانطور که نیویورک تایمز گزارش داده است.

مدل‌های هوش مصنوعی DeepSeek: به چالش کشیدن وضعیت موجود

DeepSeek مجموعه اولیه مدل‌های خود – DeepSeek Coder، DeepSeek LLM و DeepSeek Chat – را در نوامبر 2023 رونمایی کرد. با این حال، انتشار نسل بعدی مدل‌های DeepSeek-V2 در بهار بود که واقعاً توجه صنعت هوش مصنوعی را به خود جلب کرد.

DeepSeek-V2، یک سیستم همه‌کاره که قادر به تجزیه و تحلیل متن و تصاویر است، عملکرد چشمگیری را در معیارهای مختلف هوش مصنوعی نشان داد. نکته قابل توجه این است که این عملکرد را با هزینه بسیار کمتری در مقایسه با مدل‌های رقیب موجود در آن زمان به دست آورد. این امر رقبای داخلی DeepSeek، از جمله ByteDance و Alibaba را بر آن داشت تا قیمت برخی از مدل‌های خود را کاهش داده و برخی دیگر را کاملاً رایگان ارائه دهند.

DeepSeek V3 در مقایسه با مدل‌های متن‌باز قابل دانلود مانند Llama متا و مدل‌های "بسته" که فقط از طریق API در دسترس هستند، مانند GPT-4o OpenAI، عملکرد بهتری را به نمایش گذاشته است.

به همان اندازه قابل توجه، مدل "استدلال" R1 DeepSeek است. DeepSeek که در ژانویه راه اندازی شد، ادعا می کند که R1 عملکردی مشابه مدل o1 OpenAI در معیارهای کلیدی دارد.

R1 به عنوان یک مدل استدلال، مکانیسم های خودآزمایی را در خود جای داده و برخی از مشکلات رایج مرتبط با مدل های استاندارد را کاهش می دهد. در حالی که مدل‌های استدلال ممکن است به زمان پردازش کمی طولانی‌تری برای رسیدن به راه‌حل‌ها (از چند ثانیه تا چند دقیقه) نیاز داشته باشند، اما در حوزه‌هایی مانند فیزیک، علوم و ریاضیات، قابلیت اطمینان بیشتری از خود نشان می‌دهند.

با این حال، مدل‌های DeepSeek، از جمله R1 و DeepSeek V3، تحت نظارت رگولاتور اینترنت چین هستند که اطمینان حاصل می‌کند پاسخ‌های آنها با "ارزش‌های اصلی سوسیالیستی" همسو باشد. به عنوان مثال، در برنامه چت بات DeepSeek، R1 به سؤالات مربوط به میدان Tiananmen یا خودمختاری تایوان پاسخ نخواهد داد.

در ماه مارس، ترافیک وب سایت DeepSeek از 16.5 میلیون بازدید فراتر رفت. به گفته David Carr، ویراستار Similarweb، علیرغم کاهش 25 درصدی ترافیک در مقایسه با فوریه، DeepSeek از نظر بازدیدهای روزانه در رتبه دوم قرار گرفت. با این حال، این رقم همچنان در مقایسه با ChatGPT، که در ماه مارس از 500 میلیون کاربر فعال هفتگی فراتر رفت، ناچیز است.

رویکرد مخرب به چشم انداز هوش مصنوعی

مدل کسب و کار DeepSeek تا حدودی مرموز باقی مانده است. این شرکت محصولات و خدمات خود را به طور قابل توجهی زیر ارزش بازار قیمت‌گذاری می‌کند و حتی برخی را به صورت رایگان ارائه می‌دهد. علاوه بر این، علیرغم علاقه قابل توجه شرکت‌های سرمایه‌گذاری خطرپذیر، در برابر بودجه خارجی مقاومت کرده است.

DeepSeek رقابت شدید هزینه خود را به پیشرفت در کارایی نسبت می‌دهد. با این حال، برخی از کارشناسان در مورد صحت ارقام ارائه شده توسط شرکت تردید کرده‌اند.

صرف نظر از این، توسعه دهندگان از مدل های DeepSeek استقبال کرده اند، که در حالی که به معنای سنتی متن باز نیستند، تحت مجوزهای مجاز که امکان استفاده تجاری را فراهم می کند، در دسترس هستند. به گفته Clem Delangue، مدیر عامل Hugging Face، توسعه دهندگان در این پلتفرم بیش از 500 مدل مشتق از R1 ایجاد کرده اند که در مجموع 2.5 میلیون بار دانلود شده اند.

موفقیت DeepSeek در برابر رقبای بزرگتر و تثبیت شده، هم به عنوان "واژگون کننده هوش مصنوعی" و هم "بیش از حد تبلیغ شده" توصیف شده است. دستاوردهای این شرکت تا حدودی مسئول کاهش 18 درصدی قیمت سهام Nvidia در ژانویه بود و باعث واکنش عمومی از سوی مدیر عامل OpenAI، Sam Altman شد. به گزارش رویترز، در ماه مارس، دفاتر وزارت بازرگانی ایالات متحده گزارش دادند که DeepSeek را در دستگاه های دولتی ممنوع کرده اند.

مایکروسافت DeepSeek را در سرویس Azure AI Foundry خود، پلتفرمی که خدمات هوش مصنوعی را برای شرکت ها ادغام می کند، ادغام کرده است. در جریان تماس تلفنی درآمد سه ماهه اول متا، مدیر عامل Mark Zuckerberg اظهار داشت که سرمایه گذاری در زیرساخت هوش مصنوعی همچنان یک "مزیت استراتژیک" برای این شرکت خواهد بود، زمانی که در مورد تأثیر بالقوه DeepSeek بر هزینه های هوش مصنوعی متا سؤال شد. در ماه مارس، OpenAI DeepSeek را به عنوان "یارانه ای از سوی دولت" و "تحت کنترل دولت" برچسب گذاری کرد و توصیه کرد که دولت ایالات متحده ممنوعیت مدل های خود را در نظر بگیرد.

در جریان تماس تلفنی درآمد سه ماهه چهارم Nvidia، مدیر عامل Jensen Huang بر "نوآوری عالی" DeepSeek تأکید کرد و خاطرنشان کرد که مدل های استدلال آن به طور قابل توجهی به قدرت محاسباتی بیشتری نیاز دارند که به نفع Nvidia است.

برعکس، برخی از شرکت‌ها، کشورها و دولت‌ها، از جمله کره جنوبی و ایالت نیویورک، استفاده از DeepSeek را در دستگاه‌های دولتی ممنوع کرده‌اند.

در ماه مه، معاون رئیس مایکروسافت و رئیس جمهور Brad Smith در مقابل سنا شهادت داد که کارمندان مایکروسافت به دلیل نگرانی در مورد امنیت داده ها و تبلیغات احتمالی، از استفاده از DeepSeek منع شده اند.

آینده نامشخص DeepSeek

مسیر آینده DeepSeek نامشخص باقی می ماند. در حالی که انتظار می رود پیشرفت های بیشتری در مدل ایجاد شود، به نظر می رسد دولت ایالات متحده به طور فزاینده ای نسبت به نفوذ خارجی مضر احتمالی محتاط است. در ماه مارس، وال استریت ژورنال گزارش داد که ایالات متحده احتمالاً DeepSeek را در دستگاه های دولتی ممنوع خواهد کرد.

صعود سریع DeepSeek بدون شک پایه های صنعت هوش مصنوعی را متزلزل کرده و باعث ارزیابی مجدد پویایی رقابتی و پتانسیل نوآوری های مخرب شده است. اینکه آیا می تواند حرکت فعلی خود را در مواجهه با افزایش نظارت و چالش های نظارتی حفظ کند یا خیر، باید منتظر ماند. سال های آینده در تعیین تأثیر بلندمدت DeepSeek بر چشم انداز جهانی هوش مصنوعی محوری خواهد بود. توانایی آن در پیمایش در تعامل پیچیده بین پیشرفت های تکنولوژیکی، ملاحظات ژئوپلیتیکی و نگرانی های اخلاقی در نهایت میراث آن را تعیین خواهد کرد. دنیای هوش مصنوعی از نزدیک نظاره گر خواهد بود.

داستان DeepSeek یادآور این است که در دنیای به سرعت در حال تحول هوش مصنوعی، بازیکنان جدید می توانند به سرعت ظهور کرده و نظم موجود را به چالش بکشند. موفقیت این شرکت که ناشی از فناوری نوآورانه و تمایل به برهم زدن مدل های کسب و کار سنتی است، صنعت را مجبور کرده است تا متوجه شود. با ادامه توسعه و گسترش دامنه DeepSeek، بدون شک نقش مهمی در شکل دادن به آینده هوش مصنوعی ایفا خواهد کرد.

به‌روزرسانی‌شده در ۲۰۲۵-۰۵-۱۰

# LLM # AIGC # DeepSeek