در رقابت پرمخاطره و فوقالعاده گرانقیمت برای تسلط بر هوش مصنوعی، خرد متعارف اغلب حکم میکند که پیشتاز بودن تنها راه پیروزی است. با این حال، Microsoft، غولی که عمیقاً در انقلاب هوش مصنوعی مولد ریشه دوانده است، مسیری کاملاً متفاوت را ترسیم میکند. تحت هدایت مصطفی سلیمان، مدیرعامل هوش مصنوعی Microsoft، این غول ردموندی نقش حرکتکننده دوم زیرک را پذیرفته است، به دیگران اجازه میدهد مسیر را هموار کنند - و هزینههای سرسامآور را جذب کنند - در حالی که به طور استراتژیک خود را برای بهرهبرداری از پیشرفتهای آنها موقعیتیابی میکند. این به معنای عقب ماندن نیست؛ بلکه یک استراتژی حسابشده برای کارایی، بهینهسازی و در نهایت، ادغام در بازار است.
اقتصاد پیروی از رهبر
مصطفی سلیمان، نامی مترادف با نوآوری در هوش مصنوعی از زمان همکاری در تأسیس DeepMind (که بعداً توسط Google خریداری شد)، از بیان فلسفه Microsoft ابایی نداشته است. او در گفتمان عمومی اخیر، منطق را آشکار کرد: عقب ماندن عمدی از لبه مطلق توسعه مدل هوش مصنوعی با حاشیه سه تا شش ماه، اساساً مقرون به صرفهتر است. شدت سرمایهگذاری محض در آموزش مدلهای واقعاً ‘پیشگام’ - الگوریتمهایی که مرزهای توانایی هوش مصنوعی را جابجا میکنند - بسیار زیاد است و به میلیاردها دلار میرسد بدون هیچ تضمینی برای موفقیت فوری در بازار یا کاربردی بودن.
سلیمان صراحتاً اظهار داشت: ‘استراتژی ما این است که با توجه به سرمایهبر بودن این مدلها، یک رتبه دوم بسیار نزدیک را بازی کنیم’. این رویکرد یک مزیت مالی حیاتی ارائه میدهد. ساخت این مدلهای بنیادی نیازمند مجموعه دادههای وسیع، ارتشی از مهندسان بسیار متخصص و مهمتر از همه، دسترسی به ذخایر عظیم قدرت محاسباتی است که عمدتاً توسط خوشههای GPU گرانقیمت و پرمصرف انرژی تأمین میشود. Microsoft با اجازه دادن به پیشگامانی مانند OpenAI - شرکتی که Microsoft میلیاردها دلار در آن سرمایهگذاری کرده و زیرساخت ابری قابل توجهی برای آن فراهم میکند - برای مقابله با مراحل اولیه و پرخطرتر توسعه، عملاً بخش قابل توجهی از بار تحقیق و توسعه و قمار مالی را برونسپاری میکند.
با این حال، این حائل زمانی صرفاً برای صرفهجویی در هزینه نیست. سلیمان تأکید کرد که ماههای اضافی به Microsoft زمان ارزشمندی برای پالایش و بهینهسازی این فناوریهای قدرتمند برای کاربردهای خاص و ملموس مشتری میدهد. مدلهای پیشگام اغلب به عنوان ابزارهای قدرتمند اما تا حدودی عمومی ظاهر میشوند. استراتژی Microsoft به آن اجازه میدهد تا مشاهده کند چه چیزی کار میکند، قابلیتهای نوظهور را درک کند و سپس پیادهسازیها را مستقیماً متناسب با نیازهای پایگاه گسترده مشتریان سازمانی و مصرفکننده خود تنظیم کند. این تمرکز از توانایی فنی محض به کاربرد عملی تغییر میکند - ادغام یکپارچه هوش مصنوعی در محصولاتی مانند Windows، Office (Microsoft 365)، خدمات ابری Azure و مجموعه رو به رشد دستیاران Copilot آن. هدف فقط داشتن جدیدترین مدل نیست، بلکه داشتن مفیدترین تکرار برای کارهای دنیای واقعی است. این بهینهسازی مشتریمحور به خودی خود به یک تمایز رقابتی تبدیل میشود که بالقوه در درازمدت ارزشمندتر از اولین نفر بودن در عبور از خط پایان فناوری است.
همزیستی OpenAI: یک وابستگی استراتژیک
موضع فعلی هوش مصنوعی Microsoft به طور جداییناپذیری با رابطه عمیق و چندوجهی آن با OpenAI مرتبط است. این صرفاً یک سرمایهگذاری منفعل نیست؛ بلکه سنگ بنای استراتژی محصول هوش مصنوعی ردموند است. Microsoft مقادیر عظیمی از منابع محاسباتی ابری Azure را در اختیار OpenAI قرار میدهد که سوخت ضروری برای آموزش و اجرای مدلهایی مانند سری GPT است. در مقابل، Microsoft دسترسی ممتاز و حقوق صدور مجوز برای ادغام این مدلهای پیشرفته در اکوسیستم خود را به دست میآورد. این ترتیب همزیستی به Microsoft اجازه میدهد تا ویژگیهای هوش مصنوعی پیشرفته را در سراسر چشمانداز محصول خود ارائه دهد بدون اینکه هزینه و ریسک کامل توسعه مدلهای قابل مقایسه را به طور کامل از ابتدا در داخل متحمل شود.
از دیدگاه Microsoft، چرا باید تلاش و هزینه طاقتفرسایی را که تیم Sam Altman در OpenAI در حال انجام آن است، تکرار کرد، به خصوص زمانی که این مشارکت دسترسی مستقیم به ثمرات آن کار را فراهم میکند؟ این یک رویکرد عملگرایانه است که از قابلیتهای تحقیقاتی متمرکز OpenAI استفاده میکند و در عین حال به Microsoft اجازه میدهد تا بر ادغام گستردهتر، ساخت پلتفرم و استقرار در بازار تمرکز کند. موفقیت ابتکارات Copilot Microsoft، که کمک هوش مصنوعی را در همه چیز از کدنویسی گرفته تا صفحات گسترده تزریق میکند، تا حد زیادی بر این پایه استوار است.
با این حال، این اتکا، هرچند استراتژیک، طبیعتاً سؤالاتی را در مورد استقلال بلندمدت ایجاد میکند. در حالی که این مشارکت در حال حاضر بسیار سودمند است، وابستگی قابل توجهی به یک نهاد خارجی را نشان میدهد، هرچند نهادی که از طریق سرمایهگذاری و تأمین زیرساخت، ارتباط نزدیکی دارد. پویایی این رابطه پیچیده و دائماً در حال تحول است و چشمانداز رقابتی کل صنعت هوش مصنوعی را شکل میدهد.
پوشش ریسک: ظهور مدلهای Phi
در حالی که مشارکت OpenAI پایه و اساس پیشنهادات هوش مصنوعی پیشرفته آن را تشکیل میدهد، Microsoft تمام تراشههای خود را روی یک شماره قرار نمیدهد. این شرکت به طور همزمان در حال پیگیری یک مسیر موازی است و خانواده مدلهای زبان کوچکتر و تخصصیتر خود را تحت نام رمز Phi توسعه میدهد. این ابتکار جنبهای متفاوت و در عین حال مکمل از استراتژی کلی هوش مصنوعی آن را نشان میدهد.
برخلاف مدلهای عظیم و همهمنظوره مانند GPT-4، مدلهای سری Phi عمداً طوری طراحی شدهاند که فشرده و کارآمد باشند. آنها معمولاً در محدوده تعداد پارامترهای تک رقمی تا دو رقمی پایین میلیارد قرار دارند و از نظر اندازه چندین مرتبه کوچکتر از همتایان پیشگام خود هستند. این قد و قامت کوچکتر مزایای مشخصی را به همراه دارد:
- کارایی: آنها به قدرت محاسباتی بسیار کمتری برای اجرا نیاز دارند، که باعث میشود هزینه عملیاتی آنها در مقیاس به طور چشمگیری کمتر باشد.
- محاسبات لبه (Edge Computing): نیازهای متوسط منابع آنها، آنها را برای استقرار در دستگاههای محلی، مانند لپتاپها یا حتی گوشیهای هوشمند، مناسب میسازد، به جای اینکه صرفاً به خوشههای قدرتمند GPU مبتنی بر ابر متکی باشند. این امر امکاناتی را برای قابلیتهای هوش مصنوعی آفلاین، حریم خصوصی پیشرفته و برنامههای با تأخیر کمتر باز میکند.
- صدور مجوز آسان (Permissive Licensing): Microsoft به طور قابل توجهی بسیاری از مدلهای Phi را تحت مجوزهای آسان (مانند مجوز MIT) منتشر کرده است و آنها را از طریق پلتفرمهایی مانند Hugging Face به طور رایگان در دسترس جامعه گسترده تحقیق و توسعه قرار داده است. این امر نوآوری را تقویت میکند و به توسعهدهندگان خارجی اجازه میدهد تا بر اساس کار Microsoft بنا کنند.
در حالی که این مدلهای Phi عموماً از همان گستردگی ویژگیها یا معیارهای عملکرد خام پیشنهادات سطح بالای OpenAI برخوردار نیستند (تا همین اواخر فاقد ویژگیهای پیشرفتهای مانند چندوجهی بودن یا معماریهای پیچیده Mixture of Experts موجود در مدلهای بزرگتر بودند)، ثابت کردهاند که به طرز چشمگیری برای اندازه خود شایسته هستند. آنها اغلب به طور قابل توجهی فراتر از کلاس وزنی خود عمل میکنند و با توجه به تعداد پارامترهای محدود خود، عملکرد چشمگیری را در وظایف خاص ارائه میدهند. به عنوان مثال، مدلی مانند Phi-4، علیرغم اینکه نسبتاً کوچک است و به طور بالقوه 14 میلیارد پارامتر دارد، میتواند به طور مؤثر بر روی یک GPU پیشرفته واحد کار کند، شاهکاری که برای مدلهایی چندین برابر بزرگتر که اغلب به سرورهای کامل مملو از GPU نیاز دارند، غیرممکن است.
توسعه خانواده Phi اهداف استراتژیک متعددی را دنبال میکند. این امر تخصص داخلی در ساخت مدل را برای Microsoft فراهم میکند، وابستگی به شرکای خارجی را برای انواع خاصی از برنامهها کاهش میدهد، به تقاضای رو به رشد برای هوش مصنوعی کارآمد لبه پاسخ میدهد و حسن نیت را در جامعه منبع باز پرورش میدهد. این یک پوشش ریسک، یک مسیر جایگزین و به طور بالقوه، پلهای به سوی استقلال بیشتر در هوش مصنوعی است.
دیدگاه بلندمدت: به سوی خودکفایی
علیرغم اثربخشی فعلی استراتژی ‘دنبالهرو سریع’ و ادغام عمیق با OpenAI، مصطفی سلیمان در مورد جاهطلبی نهایی Microsoft شفاف است: خودکفایی بلندمدت در هوش مصنوعی. او این دیدگاه را به صراحت بیان کرد و گفت: ‘این کاملاً حیاتی است که در بلندمدت بتوانیم هوش مصنوعی را به طور خودکفا در Microsoft انجام دهیم’. این نشان میدهد که اتکای فعلی به شرکا، هرچند اکنون سودمند است، به عنوان یک مرحله گذار و نه یک وضعیت دائمی تلقی میشود.
دستیابی به این هدف مستلزم سرمایهگذاری داخلی پایدار و قابل توجه در تحقیق، جذب استعداد و توسعه زیرساختها، با تکیه بر پایههایی است که توسط پروژههایی مانند خانواده مدل Phi گذاشته شده است. این به معنای توسعه قابلیتها در کل پشته هوش مصنوعی، از ایجاد مدل بنیادی گرفته تا استقرار برنامه، است که به طور بالقوه با همان شرکایی که در حال حاضر به آنها متکی است، رقابت میکند.
با این حال، این انتقال قریبالوقوع نیست. خود سلیمان انتظارات را تعدیل کرد و به طول عمر مشارکت کلیدی موجود اشاره کرد: ‘حداقل تا سال 2030، ما عمیقاً با OpenAI شریک هستیم، که [یک] رابطه فوقالعاده موفق برای ما داشتهاند’. این جدول زمانی نشاندهنده یک تکامل تدریجی و چند ساله به جای یک تغییر ناگهانی است. پنج تا شش سال آینده احتمالاً شاهد ادامه بهرهبرداری Microsoft از پیشرفتهای OpenAI و در عین حال تقویت همزمان توان داخلی خود خواهد بود.
عوامل زمینهای نیز نقش دارند. نگرانیها در مورد انحصار رابطه ابری Microsoft-OpenAI زمانی مطرح شد که OpenAI همکاریهایی را با melibatkan Oracle و Softbank اعلام کرد، که نشان میدهد Microsoft دیگر تنها ارائهدهنده ابر برای آزمایشگاه تحقیقاتی هوش مصنوعی نخواهد بود. در حالی که مشارکت اصلی قوی باقی میماند، این تحولات ماهیت پویای اتحادها را در چشمانداز به سرعت در حال تغییر هوش مصنوعی برجسته میکند و احتمالاً ضرورت استراتژیک Microsoft برای پرورش قابلیتهای مستقل را تقویت میکند. مسیر رسیدن به خودکفایی یک هدف استراتژیک بلندمدت است که مزایای فعلی را با استقلال آینده متعادل میکند.
یک روند گستردهتر: بسته دنبالهرو
رویکرد حسابشده Microsoft در پیروی استراتژیک یک پدیده منزوی نیست. هزینههای هنگفت و عدم قطعیتهای ذاتی در پیشبرد مرز مطلق هوش مصنوعی باعث شده است که سایر بازیگران اصلی فناوری استراتژیهای مشابه، هرچند متنوعی را اتخاذ کنند. این نشان میدهد که ‘دنبالهرو سریع’ بودن در حال تبدیل شدن به یک کتاب بازی شناخته شده و قابل اجرا در عرصه هوش مصنوعی مولد است.
Amazon Web Services (AWS) یک نمونه موازی قانعکننده ارائه میدهد. مانند رابطه Microsoft با OpenAI، AWS به شدت (میلیاردها دلار) در Anthropic، رقیب برجسته OpenAI که به خاطر خانواده مدلهای Claude خود شناخته میشود، سرمایهگذاری کرده است. AWS منابع محاسباتی ابری قابل توجهی، از جمله زیرساختهای اختصاصی مانند خوشه Project Rainier خود را فراهم میکند و Anthropic را به عنوان یک شریک کلیدی در پلتفرم خود قرار میدهد. به طور همزمان، AWS در حال توسعه خانواده مدلهای زبان خود است که طبق گزارشها با نام رمز Nova شناخته میشود. با این حال، برخلاف رویکرد نسبتاً باز Microsoft با Phi، به نظر میرسد AWS Nova را اختصاصی نگه میدارد و آن را عمدتاً در اکوسیستم و خدمات خود ادغام میکند. این امر استراتژی دنبالهرو را منعکس میکند: استفاده از یک شریک پیشرو در حین ایجاد ظرفیت داخلی، البته با رویکردی بستهتر در مقایسه با مشارکتهای منبع باز Microsoft.
این روند فراتر از Silicon Valley گسترش مییابد. غولهای فناوری چینی نیز مهارت خود را در این استراتژی نشان دادهاند. Alibaba، از طریق تیم Qwen خود، توجه قابل توجهی را به خود جلب کرده است. خانواده مدلهای Qwen، بسیار شبیه به Phi مایکروسافت، به دلیل دستیابی به عملکردی که اغلب از انتظارات برای مدلهایی در اندازه خود فراتر میرود، مورد توجه قرار گرفتهاند. آنها لزوماً زمینه کاملاً جدیدی را از نظر فناوری ایجاد نکردهاند، اما در تکرار سریع و بهینهسازی مفاهیمی که توسط دیگران پیشگام شدهاند، برتری داشتهاند. به عنوان مثال، تیم Qwen مدلهایی را که قابلیتهای استدلال پیشرفته را در بر میگرفتند، نسبتاً سریع پس از اینکه OpenAI این مفهوم را رایج کرد، منتشر کرد و بر کارایی و عملکرد در آن پارادایم تثبیت شده تمرکز کرد. Alibaba، مشابه Microsoft، همچنین رویکرد نسبتاً بازی را اتخاذ کرده و بسیاری از مدلهای Qwen را برای عموم منتشر کرده است.
به طور مشابه، DeepSeek، یکی دیگر از نهادهای هوش مصنوعی چینی، قدرت تکرار متمرکز را نشان داد. هنگامی که مفهوم مدلهای زبان متمرکز بر استدلال توسط پیشگامان تأیید شد، DeepSeek بر بهینهسازی این معماریها تمرکز کرد و به طور قابل توجهی الزامات محاسباتی را هم برای آموزش و هم برای اجرای چنین مدلهایی کاهش داد. این به آنها اجازه داد تا مدلهای بسیار توانمندی را ارائه دهند که نسبتاً منابع کمتری مصرف میکردند و بر اساس کارایی و دسترسی، جایگاهی را برای خود ایجاد کردند.
این مثالها نشان میدهند که استراتژی ‘دنبالهرو سریع’ در سطح جهانی به کار گرفته میشود. شرکتها پیشرفتها را مشاهده میکنند، از موفقیتها و اشتباهات پیشگامان درس میگیرند و سپس منابع خود را بر بهینهسازی، پالایش و ادغام این پیشرفتها به روشهایی متمرکز میکنند که به بهترین وجه با موقعیتهای بازار خاص، پایگاههای مشتری و مدلهای تجاری آنها مطابقت دارد. این اذعان دارد که در زمینهای که به چنین منابع عظیمی نیاز دارد، تقلید و انطباق استراتژیک میتواند به همان اندازه قدرتمند و بسیار مقرون به صرفهتر از اختراع مداوم باشد.
فراتر از مدلها: ساخت اکوسیستم هوش مصنوعی
یک مزیت حیاتی و اغلب دست کم گرفته شده استراتژی Microsoft، آزادسازی منابع و تمرکز است. Microsoft با عدم صرف تمام دلارهای موجود و مهندسان در رقابت برای مدل بنیادی پیشگامانه بعدی، میتواند انرژی قابل توجهی را به آنچه ممکن است حیاتیترین چالش برای پذیرش گسترده هوش مصنوعی باشد، اختصاص دهد: ساخت اکوسیستم پیرامونی و امکان کاربرد عملی.
قدرتمندترین مدل هوش مصنوعی در جهان اگر نتواند به طور مؤثر در گردش کار، فرآیندهای تجاری و محصولات نرمافزاری موجود ادغام شود، ارزش محدودی دارد. Microsoft با درک این موضوع، با پشتکار بر روی ابزارها، چارچوبها و زیرساختهای مورد نیاز برای پر کردن شکاف بین قابلیت خام هوش مصنوعی و ارزش تجاری ملموس کار کرده است. این تمرکز بر ‘آخرین مایل’ پیادهسازی هوش مصنوعی مسلماً جایی است که نقاط قوت Microsoft در نرمافزارهای سازمانی و پلتفرمهای ابری یک مزیت رقابتی قابل توجه را فراهم میکند.
چندین ابتکار کلیدی این تمرکز را برجسته میکنند:
- Autogen: این چارچوب برای سادهسازی ایجاد و هماهنگسازی برنامههایی طراحی شده است که شامل چندین عامل هوش مصنوعی هستند که با هم کار میکنند. وظایف پیچیده اغلب مستلزم تقسیم آنها به وظایف فرعی است که توسط عوامل هوش مصنوعی تخصصی انجام میشود؛ Autogen ساختاری را برای مدیریت مؤثر این تعاملات فراهم میکند.
- KBLaM (Knowledge Base Language Model): تحقیقات اعلام شده بر کاهش هزینه محاسباتی و پیچیدگی مرتبط با افزایش دانش یک مدل زبان با استفاده از منابع داده خارجی ساختاریافته (مانند پایگاههای داده) تمرکز دارد. این برای برنامههای سازمانی حیاتی است که در آن هوش مصنوعی باید به طور دقیق و کارآمد بر روی دادههای خاص شرکت استدلال کند.
- VidTok: این توکنایزر ویدیوی منبع باز که اخیراً معرفی شده است، با هدف استانداردسازی روش تبدیل محتوای ویدیویی به قالبی است که مدلهای یادگیری ماشین بتوانند به راحتی پردازش و درک کنند. از آنجایی که هوش مصنوعی به طور فزایندهای با وظایف چندوجهی (متن، تصاویر، ویدیو) سروکار دارد، ابزارهایی مانند VidTok به لولهکشی ضروری برای ساخت برنامههای پیچیده آگاه از ویدیو تبدیل میشوند.
اینها تنها نمونههایی از یک تلاش گستردهتر هستند. Microsoft به طور پیوسته مقالات تحقیقاتی، کتابخانههای نرمافزاری و ویژگیهای پلتفرمی را با هدف آسانتر، کارآمدتر و قابل اطمینانتر کردن ادغام هوش مصنوعی برای توسعهدهندگان و کسبوکارها منتشر میکند. Microsoft با تمرکز بر این فناوریهای توانمندساز در کنار توسعه مدل Phi و مشارکت OpenAI، نه تنها مدلهای هوش مصنوعی، بلکه یک پلتفرم جامع طراحی شده برای دسترسیپذیر، قابل مدیریت و واقعاً مفید کردن هوش مصنوعی در سراسر پایگاه مشتریان گسترده خود را میسازد. این تأکید استراتژیک بر کاربرد و ادغام، که با صرفهجویی در هزینههای ‘دنبالهرو سریع’ بودن در توسعه مدل پیشگام تسهیل شده است، در نهایت میتواند عامل تعیینکننده در رقابت بلندمدت هوش مصنوعی باشد.