قمار حساب‌شده مایکروسافت: تسلط بر هوش مصنوعی با صبر استراتژیک

در رقابت پرمخاطره و فوق‌العاده گران‌قیمت برای تسلط بر هوش مصنوعی، خرد متعارف اغلب حکم می‌کند که پیشتاز بودن تنها راه پیروزی است. با این حال، Microsoft، غولی که عمیقاً در انقلاب هوش مصنوعی مولد ریشه دوانده است، مسیری کاملاً متفاوت را ترسیم می‌کند. تحت هدایت مصطفی سلیمان، مدیرعامل هوش مصنوعی Microsoft، این غول ردموندی نقش حرکت‌کننده دوم زیرک را پذیرفته است، به دیگران اجازه می‌دهد مسیر را هموار کنند - و هزینه‌های سرسام‌آور را جذب کنند - در حالی که به طور استراتژیک خود را برای بهره‌برداری از پیشرفت‌های آنها موقعیت‌یابی می‌کند. این به معنای عقب ماندن نیست؛ بلکه یک استراتژی حساب‌شده برای کارایی، بهینه‌سازی و در نهایت، ادغام در بازار است.

اقتصاد پیروی از رهبر

مصطفی سلیمان، نامی مترادف با نوآوری در هوش مصنوعی از زمان همکاری در تأسیس DeepMind (که بعداً توسط Google خریداری شد)، از بیان فلسفه Microsoft ابایی نداشته است. او در گفتمان عمومی اخیر، منطق را آشکار کرد: عقب ماندن عمدی از لبه مطلق توسعه مدل هوش مصنوعی با حاشیه سه تا شش ماه، اساساً مقرون به صرفه‌تر است. شدت سرمایه‌گذاری محض در آموزش مدل‌های واقعاً ‘پیشگام’ - الگوریتم‌هایی که مرزهای توانایی هوش مصنوعی را جابجا می‌کنند - بسیار زیاد است و به میلیاردها دلار می‌رسد بدون هیچ تضمینی برای موفقیت فوری در بازار یا کاربردی بودن.

سلیمان صراحتاً اظهار داشت: ‘استراتژی ما این است که با توجه به سرمایه‌بر بودن این مدل‌ها، یک رتبه دوم بسیار نزدیک را بازی کنیم’. این رویکرد یک مزیت مالی حیاتی ارائه می‌دهد. ساخت این مدل‌های بنیادی نیازمند مجموعه داده‌های وسیع، ارتشی از مهندسان بسیار متخصص و مهمتر از همه، دسترسی به ذخایر عظیم قدرت محاسباتی است که عمدتاً توسط خوشه‌های GPU گران‌قیمت و پرمصرف انرژی تأمین می‌شود. Microsoft با اجازه دادن به پیشگامانی مانند OpenAI - شرکتی که Microsoft میلیاردها دلار در آن سرمایه‌گذاری کرده و زیرساخت ابری قابل توجهی برای آن فراهم می‌کند - برای مقابله با مراحل اولیه و پرخطرتر توسعه، عملاً بخش قابل توجهی از بار تحقیق و توسعه و قمار مالی را برون‌سپاری می‌کند.

با این حال، این حائل زمانی صرفاً برای صرفه‌جویی در هزینه نیست. سلیمان تأکید کرد که ماه‌های اضافی به Microsoft زمان ارزشمندی برای پالایش و بهینه‌سازی این فناوری‌های قدرتمند برای کاربردهای خاص و ملموس مشتری می‌دهد. مدل‌های پیشگام اغلب به عنوان ابزارهای قدرتمند اما تا حدودی عمومی ظاهر می‌شوند. استراتژی Microsoft به آن اجازه می‌دهد تا مشاهده کند چه چیزی کار می‌کند، قابلیت‌های نوظهور را درک کند و سپس پیاده‌سازی‌ها را مستقیماً متناسب با نیازهای پایگاه گسترده مشتریان سازمانی و مصرف‌کننده خود تنظیم کند. این تمرکز از توانایی فنی محض به کاربرد عملی تغییر می‌کند - ادغام یکپارچه هوش مصنوعی در محصولاتی مانند Windows، Office (Microsoft 365)، خدمات ابری Azure و مجموعه رو به رشد دستیاران Copilot آن. هدف فقط داشتن جدیدترین مدل نیست، بلکه داشتن مفیدترین تکرار برای کارهای دنیای واقعی است. این بهینه‌سازی مشتری‌محور به خودی خود به یک تمایز رقابتی تبدیل می‌شود که بالقوه در درازمدت ارزشمندتر از اولین نفر بودن در عبور از خط پایان فناوری است.

همزیستی OpenAI: یک وابستگی استراتژیک

موضع فعلی هوش مصنوعی Microsoft به طور جدایی‌ناپذیری با رابطه عمیق و چندوجهی آن با OpenAI مرتبط است. این صرفاً یک سرمایه‌گذاری منفعل نیست؛ بلکه سنگ بنای استراتژی محصول هوش مصنوعی ردموند است. Microsoft مقادیر عظیمی از منابع محاسباتی ابری Azure را در اختیار OpenAI قرار می‌دهد که سوخت ضروری برای آموزش و اجرای مدل‌هایی مانند سری GPT است. در مقابل، Microsoft دسترسی ممتاز و حقوق صدور مجوز برای ادغام این مدل‌های پیشرفته در اکوسیستم خود را به دست می‌آورد. این ترتیب همزیستی به Microsoft اجازه می‌دهد تا ویژگی‌های هوش مصنوعی پیشرفته را در سراسر چشم‌انداز محصول خود ارائه دهد بدون اینکه هزینه و ریسک کامل توسعه مدل‌های قابل مقایسه را به طور کامل از ابتدا در داخل متحمل شود.

از دیدگاه Microsoft، چرا باید تلاش و هزینه طاقت‌فرسایی را که تیم Sam Altman در OpenAI در حال انجام آن است، تکرار کرد، به خصوص زمانی که این مشارکت دسترسی مستقیم به ثمرات آن کار را فراهم می‌کند؟ این یک رویکرد عمل‌گرایانه است که از قابلیت‌های تحقیقاتی متمرکز OpenAI استفاده می‌کند و در عین حال به Microsoft اجازه می‌دهد تا بر ادغام گسترده‌تر، ساخت پلتفرم و استقرار در بازار تمرکز کند. موفقیت ابتکارات Copilot Microsoft، که کمک هوش مصنوعی را در همه چیز از کدنویسی گرفته تا صفحات گسترده تزریق می‌کند، تا حد زیادی بر این پایه استوار است.

با این حال، این اتکا، هرچند استراتژیک، طبیعتاً سؤالاتی را در مورد استقلال بلندمدت ایجاد می‌کند. در حالی که این مشارکت در حال حاضر بسیار سودمند است، وابستگی قابل توجهی به یک نهاد خارجی را نشان می‌دهد، هرچند نهادی که از طریق سرمایه‌گذاری و تأمین زیرساخت، ارتباط نزدیکی دارد. پویایی این رابطه پیچیده و دائماً در حال تحول است و چشم‌انداز رقابتی کل صنعت هوش مصنوعی را شکل می‌دهد.

پوشش ریسک: ظهور مدل‌های Phi

در حالی که مشارکت OpenAI پایه و اساس پیشنهادات هوش مصنوعی پیشرفته آن را تشکیل می‌دهد، Microsoft تمام تراشه‌های خود را روی یک شماره قرار نمی‌دهد. این شرکت به طور همزمان در حال پیگیری یک مسیر موازی است و خانواده مدل‌های زبان کوچک‌تر و تخصصی‌تر خود را تحت نام رمز Phi توسعه می‌دهد. این ابتکار جنبه‌ای متفاوت و در عین حال مکمل از استراتژی کلی هوش مصنوعی آن را نشان می‌دهد.

برخلاف مدل‌های عظیم و همه‌منظوره مانند GPT-4، مدل‌های سری Phi عمداً طوری طراحی شده‌اند که فشرده و کارآمد باشند. آنها معمولاً در محدوده تعداد پارامترهای تک رقمی تا دو رقمی پایین میلیارد قرار دارند و از نظر اندازه چندین مرتبه کوچک‌تر از همتایان پیشگام خود هستند. این قد و قامت کوچک‌تر مزایای مشخصی را به همراه دارد:

  • کارایی: آنها به قدرت محاسباتی بسیار کمتری برای اجرا نیاز دارند، که باعث می‌شود هزینه عملیاتی آنها در مقیاس به طور چشمگیری کمتر باشد.
  • محاسبات لبه (Edge Computing): نیازهای متوسط منابع آنها، آنها را برای استقرار در دستگاه‌های محلی، مانند لپ‌تاپ‌ها یا حتی گوشی‌های هوشمند، مناسب می‌سازد، به جای اینکه صرفاً به خوشه‌های قدرتمند GPU مبتنی بر ابر متکی باشند. این امر امکاناتی را برای قابلیت‌های هوش مصنوعی آفلاین، حریم خصوصی پیشرفته و برنامه‌های با تأخیر کمتر باز می‌کند.
  • صدور مجوز آسان (Permissive Licensing): Microsoft به طور قابل توجهی بسیاری از مدل‌های Phi را تحت مجوزهای آسان (مانند مجوز MIT) منتشر کرده است و آنها را از طریق پلتفرم‌هایی مانند Hugging Face به طور رایگان در دسترس جامعه گسترده تحقیق و توسعه قرار داده است. این امر نوآوری را تقویت می‌کند و به توسعه‌دهندگان خارجی اجازه می‌دهد تا بر اساس کار Microsoft بنا کنند.

در حالی که این مدل‌های Phi عموماً از همان گستردگی ویژگی‌ها یا معیارهای عملکرد خام پیشنهادات سطح بالای OpenAI برخوردار نیستند (تا همین اواخر فاقد ویژگی‌های پیشرفته‌ای مانند چندوجهی بودن یا معماری‌های پیچیده Mixture of Experts موجود در مدل‌های بزرگ‌تر بودند)، ثابت کرده‌اند که به طرز چشمگیری برای اندازه خود شایسته هستند. آنها اغلب به طور قابل توجهی فراتر از کلاس وزنی خود عمل می‌کنند و با توجه به تعداد پارامترهای محدود خود، عملکرد چشمگیری را در وظایف خاص ارائه می‌دهند. به عنوان مثال، مدلی مانند Phi-4، علیرغم اینکه نسبتاً کوچک است و به طور بالقوه 14 میلیارد پارامتر دارد، می‌تواند به طور مؤثر بر روی یک GPU پیشرفته واحد کار کند، شاهکاری که برای مدل‌هایی چندین برابر بزرگ‌تر که اغلب به سرورهای کامل مملو از GPU نیاز دارند، غیرممکن است.

توسعه خانواده Phi اهداف استراتژیک متعددی را دنبال می‌کند. این امر تخصص داخلی در ساخت مدل را برای Microsoft فراهم می‌کند، وابستگی به شرکای خارجی را برای انواع خاصی از برنامه‌ها کاهش می‌دهد، به تقاضای رو به رشد برای هوش مصنوعی کارآمد لبه پاسخ می‌دهد و حسن نیت را در جامعه منبع باز پرورش می‌دهد. این یک پوشش ریسک، یک مسیر جایگزین و به طور بالقوه، پله‌ای به سوی استقلال بیشتر در هوش مصنوعی است.

دیدگاه بلندمدت: به سوی خودکفایی

علیرغم اثربخشی فعلی استراتژی ‘دنباله‌رو سریع’ و ادغام عمیق با OpenAI، مصطفی سلیمان در مورد جاه‌طلبی نهایی Microsoft شفاف است: خودکفایی بلندمدت در هوش مصنوعی. او این دیدگاه را به صراحت بیان کرد و گفت: ‘این کاملاً حیاتی است که در بلندمدت بتوانیم هوش مصنوعی را به طور خودکفا در Microsoft انجام دهیم’. این نشان می‌دهد که اتکای فعلی به شرکا، هرچند اکنون سودمند است، به عنوان یک مرحله گذار و نه یک وضعیت دائمی تلقی می‌شود.

دستیابی به این هدف مستلزم سرمایه‌گذاری داخلی پایدار و قابل توجه در تحقیق، جذب استعداد و توسعه زیرساخت‌ها، با تکیه بر پایه‌هایی است که توسط پروژه‌هایی مانند خانواده مدل Phi گذاشته شده است. این به معنای توسعه قابلیت‌ها در کل پشته هوش مصنوعی، از ایجاد مدل بنیادی گرفته تا استقرار برنامه، است که به طور بالقوه با همان شرکایی که در حال حاضر به آنها متکی است، رقابت می‌کند.

با این حال، این انتقال قریب‌الوقوع نیست. خود سلیمان انتظارات را تعدیل کرد و به طول عمر مشارکت کلیدی موجود اشاره کرد: ‘حداقل تا سال 2030، ما عمیقاً با OpenAI شریک هستیم، که [یک] رابطه فوق‌العاده موفق برای ما داشته‌اند’. این جدول زمانی نشان‌دهنده یک تکامل تدریجی و چند ساله به جای یک تغییر ناگهانی است. پنج تا شش سال آینده احتمالاً شاهد ادامه بهره‌برداری Microsoft از پیشرفت‌های OpenAI و در عین حال تقویت همزمان توان داخلی خود خواهد بود.

عوامل زمینه‌ای نیز نقش دارند. نگرانی‌ها در مورد انحصار رابطه ابری Microsoft-OpenAI زمانی مطرح شد که OpenAI همکاری‌هایی را با melibatkan Oracle و Softbank اعلام کرد، که نشان می‌دهد Microsoft دیگر تنها ارائه‌دهنده ابر برای آزمایشگاه تحقیقاتی هوش مصنوعی نخواهد بود. در حالی که مشارکت اصلی قوی باقی می‌ماند، این تحولات ماهیت پویای اتحادها را در چشم‌انداز به سرعت در حال تغییر هوش مصنوعی برجسته می‌کند و احتمالاً ضرورت استراتژیک Microsoft برای پرورش قابلیت‌های مستقل را تقویت می‌کند. مسیر رسیدن به خودکفایی یک هدف استراتژیک بلندمدت است که مزایای فعلی را با استقلال آینده متعادل می‌کند.

یک روند گسترده‌تر: بسته دنباله‌رو

رویکرد حساب‌شده Microsoft در پیروی استراتژیک یک پدیده منزوی نیست. هزینه‌های هنگفت و عدم قطعیت‌های ذاتی در پیشبرد مرز مطلق هوش مصنوعی باعث شده است که سایر بازیگران اصلی فناوری استراتژی‌های مشابه، هرچند متنوعی را اتخاذ کنند. این نشان می‌دهد که ‘دنباله‌رو سریع’ بودن در حال تبدیل شدن به یک کتاب بازی شناخته شده و قابل اجرا در عرصه هوش مصنوعی مولد است.

Amazon Web Services (AWS) یک نمونه موازی قانع‌کننده ارائه می‌دهد. مانند رابطه Microsoft با OpenAI، AWS به شدت (میلیاردها دلار) در Anthropic، رقیب برجسته OpenAI که به خاطر خانواده مدل‌های Claude خود شناخته می‌شود، سرمایه‌گذاری کرده است. AWS منابع محاسباتی ابری قابل توجهی، از جمله زیرساخت‌های اختصاصی مانند خوشه Project Rainier خود را فراهم می‌کند و Anthropic را به عنوان یک شریک کلیدی در پلتفرم خود قرار می‌دهد. به طور همزمان، AWS در حال توسعه خانواده مدل‌های زبان خود است که طبق گزارش‌ها با نام رمز Nova شناخته می‌شود. با این حال، برخلاف رویکرد نسبتاً باز Microsoft با Phi، به نظر می‌رسد AWS Nova را اختصاصی نگه می‌دارد و آن را عمدتاً در اکوسیستم و خدمات خود ادغام می‌کند. این امر استراتژی دنباله‌رو را منعکس می‌کند: استفاده از یک شریک پیشرو در حین ایجاد ظرفیت داخلی، البته با رویکردی بسته‌تر در مقایسه با مشارکت‌های منبع باز Microsoft.

این روند فراتر از Silicon Valley گسترش می‌یابد. غول‌های فناوری چینی نیز مهارت خود را در این استراتژی نشان داده‌اند. Alibaba، از طریق تیم Qwen خود، توجه قابل توجهی را به خود جلب کرده است. خانواده مدل‌های Qwen، بسیار شبیه به Phi مایکروسافت، به دلیل دستیابی به عملکردی که اغلب از انتظارات برای مدل‌هایی در اندازه خود فراتر می‌رود، مورد توجه قرار گرفته‌اند. آنها لزوماً زمینه کاملاً جدیدی را از نظر فناوری ایجاد نکرده‌اند، اما در تکرار سریع و بهینه‌سازی مفاهیمی که توسط دیگران پیشگام شده‌اند، برتری داشته‌اند. به عنوان مثال، تیم Qwen مدل‌هایی را که قابلیت‌های استدلال پیشرفته را در بر می‌گرفتند، نسبتاً سریع پس از اینکه OpenAI این مفهوم را رایج کرد، منتشر کرد و بر کارایی و عملکرد در آن پارادایم تثبیت شده تمرکز کرد. Alibaba، مشابه Microsoft، همچنین رویکرد نسبتاً بازی را اتخاذ کرده و بسیاری از مدل‌های Qwen را برای عموم منتشر کرده است.

به طور مشابه، DeepSeek، یکی دیگر از نهادهای هوش مصنوعی چینی، قدرت تکرار متمرکز را نشان داد. هنگامی که مفهوم مدل‌های زبان متمرکز بر استدلال توسط پیشگامان تأیید شد، DeepSeek بر بهینه‌سازی این معماری‌ها تمرکز کرد و به طور قابل توجهی الزامات محاسباتی را هم برای آموزش و هم برای اجرای چنین مدل‌هایی کاهش داد. این به آنها اجازه داد تا مدل‌های بسیار توانمندی را ارائه دهند که نسبتاً منابع کمتری مصرف می‌کردند و بر اساس کارایی و دسترسی، جایگاهی را برای خود ایجاد کردند.

این مثال‌ها نشان می‌دهند که استراتژی ‘دنباله‌رو سریع’ در سطح جهانی به کار گرفته می‌شود. شرکت‌ها پیشرفت‌ها را مشاهده می‌کنند، از موفقیت‌ها و اشتباهات پیشگامان درس می‌گیرند و سپس منابع خود را بر بهینه‌سازی، پالایش و ادغام این پیشرفت‌ها به روش‌هایی متمرکز می‌کنند که به بهترین وجه با موقعیت‌های بازار خاص، پایگاه‌های مشتری و مدل‌های تجاری آنها مطابقت دارد. این اذعان دارد که در زمینه‌ای که به چنین منابع عظیمی نیاز دارد، تقلید و انطباق استراتژیک می‌تواند به همان اندازه قدرتمند و بسیار مقرون به صرفه‌تر از اختراع مداوم باشد.

فراتر از مدل‌ها: ساخت اکوسیستم هوش مصنوعی

یک مزیت حیاتی و اغلب دست کم گرفته شده استراتژی Microsoft، آزادسازی منابع و تمرکز است. Microsoft با عدم صرف تمام دلارهای موجود و مهندسان در رقابت برای مدل بنیادی پیشگامانه بعدی، می‌تواند انرژی قابل توجهی را به آنچه ممکن است حیاتی‌ترین چالش برای پذیرش گسترده هوش مصنوعی باشد، اختصاص دهد: ساخت اکوسیستم پیرامونی و امکان کاربرد عملی.

قدرتمندترین مدل هوش مصنوعی در جهان اگر نتواند به طور مؤثر در گردش کار، فرآیندهای تجاری و محصولات نرم‌افزاری موجود ادغام شود، ارزش محدودی دارد. Microsoft با درک این موضوع، با پشتکار بر روی ابزارها، چارچوب‌ها و زیرساخت‌های مورد نیاز برای پر کردن شکاف بین قابلیت خام هوش مصنوعی و ارزش تجاری ملموس کار کرده است. این تمرکز بر ‘آخرین مایل’ پیاده‌سازی هوش مصنوعی مسلماً جایی است که نقاط قوت Microsoft در نرم‌افزارهای سازمانی و پلتفرم‌های ابری یک مزیت رقابتی قابل توجه را فراهم می‌کند.

چندین ابتکار کلیدی این تمرکز را برجسته می‌کنند:

  • Autogen: این چارچوب برای ساده‌سازی ایجاد و هماهنگ‌سازی برنامه‌هایی طراحی شده است که شامل چندین عامل هوش مصنوعی هستند که با هم کار می‌کنند. وظایف پیچیده اغلب مستلزم تقسیم آنها به وظایف فرعی است که توسط عوامل هوش مصنوعی تخصصی انجام می‌شود؛ Autogen ساختاری را برای مدیریت مؤثر این تعاملات فراهم می‌کند.
  • KBLaM (Knowledge Base Language Model): تحقیقات اعلام شده بر کاهش هزینه محاسباتی و پیچیدگی مرتبط با افزایش دانش یک مدل زبان با استفاده از منابع داده خارجی ساختاریافته (مانند پایگاه‌های داده) تمرکز دارد. این برای برنامه‌های سازمانی حیاتی است که در آن هوش مصنوعی باید به طور دقیق و کارآمد بر روی داده‌های خاص شرکت استدلال کند.
  • VidTok: این توکنایزر ویدیوی منبع باز که اخیراً معرفی شده است، با هدف استانداردسازی روش تبدیل محتوای ویدیویی به قالبی است که مدل‌های یادگیری ماشین بتوانند به راحتی پردازش و درک کنند. از آنجایی که هوش مصنوعی به طور فزاینده‌ای با وظایف چندوجهی (متن، تصاویر، ویدیو) سروکار دارد، ابزارهایی مانند VidTok به لوله‌کشی ضروری برای ساخت برنامه‌های پیچیده آگاه از ویدیو تبدیل می‌شوند.

اینها تنها نمونه‌هایی از یک تلاش گسترده‌تر هستند. Microsoft به طور پیوسته مقالات تحقیقاتی، کتابخانه‌های نرم‌افزاری و ویژگی‌های پلتفرمی را با هدف آسان‌تر، کارآمدتر و قابل اطمینان‌تر کردن ادغام هوش مصنوعی برای توسعه‌دهندگان و کسب‌وکارها منتشر می‌کند. Microsoft با تمرکز بر این فناوری‌های توانمندساز در کنار توسعه مدل Phi و مشارکت OpenAI، نه تنها مدل‌های هوش مصنوعی، بلکه یک پلتفرم جامع طراحی شده برای دسترسی‌پذیر، قابل مدیریت و واقعاً مفید کردن هوش مصنوعی در سراسر پایگاه مشتریان گسترده خود را می‌سازد. این تأکید استراتژیک بر کاربرد و ادغام، که با صرفه‌جویی در هزینه‌های ‘دنباله‌رو سریع’ بودن در توسعه مدل پیشگام تسهیل شده است، در نهایت می‌تواند عامل تعیین‌کننده در رقابت بلندمدت هوش مصنوعی باشد.