مدلهای بنیادی هوش مصنوعی در حال کالایی شدن: ساتیا نادلا
ساتیا نادلا، مدیرعامل مایکروسافت، معتقد است که مدلهای بنیادی هوش مصنوعی در حال تبدیل شدن به یک کالا هستند و مزیت رقابتی در آینده بر نوآوری در محصول و یکپارچهسازی سیستم متمرکز خواهد بود.
ساتیا نادلا، مدیرعامل مایکروسافت، معتقد است که مدلهای بنیادی هوش مصنوعی در حال تبدیل شدن به یک کالا هستند و مزیت رقابتی در آینده بر نوآوری در محصول و یکپارچهسازی سیستم متمرکز خواهد بود.
مایکروسافت و IBM با ارائه مدلهای زبانی کوچک (SLM) مانند Granite و Phi-4، انقلابی در هوش مصنوعی کارآمد و پایدار ایجاد کردهاند. این مدلها با مصرف انرژی کمتر، دسترسیپذیری بیشتر و قابلیت اجرا بر روی دستگاههای کممصرف، آیندهای روشن برای هوش مصنوعی رقم میزنند.
سری Phi-4 مایکروسافت یک پیشرفت چشمگیر در هوش مصنوعی، به ویژه در پردازش چندوجهی و استقرار محلی کارآمد است. این سری، شامل مدلهای Phi-4 Mini Instruct و Phi-4 Multimodal، دوران جدیدی را آغاز میکند که در آن قابلیتهای هوش مصنوعی قدرتمند دیگر محدود به زیرساختهای ابری در مقیاس بزرگ نیست.
LLMWare و Qualcomm Technologies برای ارائه Model HQ در پردازنده های Snapdragon X Series همکاری می کنند، و قابلیت های هوش مصنوعی روی دستگاه را برای شرکت ها فراهم می کنند. این شامل مدل های هوش مصنوعی، امنیت و ابزارهای بهره وری است.
مایکروسافت یک مدل هوش مصنوعی جدید برای پردازش گفتار، تصویر و متن به طور مستقیم بر روی دستگاهها ارائه کرده است، که نیازهای محاسباتی را به طور قابل توجهی کاهش میدهد. این یک تغییر در هوش مصنوعی مولد است، که بر روی مدلهای زبان کوچک (SLM) تمرکز دارد.
مایکروسافت Phi-4 را معرفی کرد، خانوادهای از مدلهای هوش مصنوعی کمحجم و با کارایی بالا که تعادل بین اندازه و توانایی را بازتعریف میکند. این مدلها برای پردازش متن، تصویر و گفتار به طور همزمان، با مصرف توان محاسباتی بسیار کمتر طراحی شدهاند.
مایکروسافت از فی-۴ رونمایی کرد، مدلهای زبانی کوچک چندوجهی و مینی برای تسریع نوآوری در هوش مصنوعی و توانمندسازی توسعهدهندگان با قابلیتهای پیشرفته.
مایکروسافت Phi-4، یک مدل زبانی کوچک با 14 میلیارد پارامتر را معرفی کرده است که برای ارتقای سطح استدلال ریاضی طراحی شده است. این مدل که در ابتدا در Azure AI Foundry در دسترس بود، اخیراً با مجوز MIT در Hugging Face باز شده است. Phi-4 در استدلال ریاضی از مدل های مشابه و بزرگتر بهتر عمل می کند. این امر به دلیل استفاده از تکنیک های نوآورانه در آموزش از جمله پیش آموزش و آموزش میانی با داده های مصنوعی، مدیریت داده های ارگانیک و یک طرح آموزش پس از جدید است. این نوآوری ها باعث شده است که Phi-4 در توانایی های پرسش و پاسخ با تمرکز بر STEM از مدل مربی خود GPT-4o پیشی بگیرد. Phi-4 از داده های مصنوعی و داده های واقعی انتخاب شده برای آموزش استفاده می کند. مرحله پس از آموزش شامل تنظیم دقیق مدل با داده های با کیفیت بالا و بهینه سازی ترجیحات مستقیم است. Phi-4 در چندین معیار از Llama-3.1-405B پیشی گرفته است و در GPQA و MATH نیز از GPT-4o پیشی گرفته است. Phi-4 یک مدل زبان کوچک است که برای استدلال پیچیده ریاضی طراحی شده است و کاربردهای گسترده ای در آموزش، تحقیقات، مهندسی، امور مالی و سایر زمینه ها دارد.