آی‌بی‌ام: مدل‌های هوش مصنوعی کوچک‌تر، کارآمدتر

پالایش سری Granite: قابلیت متمرکز، ردپای کاهش‌یافته

مدل‌های Granite 3.2 آی‌بی‌ام، نمایانگر ادامه‌ی استراتژی این شرکت برای توسعه‌ی مدل‌های کوچک‌تر هستند. این مدل‌ها طوری طراحی شده‌اند که قابلیت‌های خاصی را بدون تحمیل تقاضاهای بیش از حد بر منابع محاسباتی ارائه دهند. این رویکرد با نیازهای عملی بسیاری از کسب‌وکارهایی که به راه‌حل‌های هوش مصنوعی هم قدرتمند و هم مقرون‌به‌صرفه نیاز دارند، همسو است.

این مدل‌ها تحت مجوز Apache 2.0 در Hugging Face به‌صورت متن‌باز در دسترس هستند. نسخه‌های منتخب از طریق پلتفرم watsonx.ai خود آی‌بی‌ام و همچنین Ollama، Replicate و LM Studio نیز قابل‌دسترسی هستند. این دسترسی گسترده با برنامه‌هایی برای ادغام این مدل‌ها در Red Hat Enterprise Linux AI 1.5 در ماه‌های آینده تقویت می‌شود و تعهد آی‌بی‌ام به هوش مصنوعی متن‌باز را تثبیت می‌کند.

انقلاب در پردازش اسناد: مدل Granite Vision

یکی از ویژگی‌های برجسته‌ی این نسخه، یک مدل زبان بصری جدید است که به‌طور خاص برای وظایف درک اسناد مهندسی شده است. این مدل نشان‌دهنده‌ی پیشرفت چشمگیری در نحوه‌ی تعامل کسب‌وکارها با اسناد و استخراج اطلاعات از آن‌ها است. طبق تست‌های بنچمارک داخلی آی‌بی‌ام، این مدل جدید در تست‌هایی که به‌طور خاص برای بازتاب حجم کاری در سطح سازمانی طراحی شده‌اند، هم‌سطح یا حتی بهتر از مدل‌های رقیب بسیار بزرگ‌تر عمل می‌کند.

توسعه‌ی این قابلیت شامل استفاده از ابزار متن‌باز Docling آی‌بی‌ام بود. این ابزار برای پردازش 85 میلیون سند PDF، تولید 26 میلیون جفت پرسش و پاسخ مصنوعی استفاده شد. این آماده‌سازی گسترده تضمین می‌کند که این مدل به‌خوبی برای مدیریت گردش‌های کاری فشرده‌ی اسناد که مشخصه‌ی بسیاری از محیط‌های سازمانی، از جمله خدمات مالی، مراقبت‌های بهداشتی و حقوقی است، مجهز شده است.

آمار کلیدی، مقیاس و کارایی را برجسته می‌کند:

  • 85 میلیون: تعداد اسناد PDF پردازش‌شده با استفاده از ابزار Docling آی‌بی‌ام برای آموزش مدل بصری جدید. این مجموعه داده‌ی عظیم، آمادگی مدل را برای چالش‌های پردازش اسناد در دنیای واقعی نشان می‌دهد.
  • 30٪: کاهش اندازه‌ی به‌دست‌آمده در مدل‌های ایمنی Granite Guardian ضمن حفظ سطوح عملکرد. این نشان‌دهنده‌ی تعهد آی‌بی‌ام به بهینه‌سازی کارایی بدون به خطر انداختن ایمنی است.
  • 2 سال: حداکثر دامنه‌ی پیش‌بینی مدل‌های TinyTimeMixers آی‌بی‌ام، با وجود داشتن کمتر از 10 میلیون پارامتر. این نشان‌دهنده‌ی توانایی قابل‌توجه این مدل‌های تخصصی برای پیش‌بینی بلندمدت است.

استدلال پیشرفته: زنجیره‌ی تفکر و مقیاس‌بندی استنتاج

آی‌بی‌ام همچنین استدلال “زنجیره‌ی تفکر” را در نسخه‌های 2B و 8B پارامتری Granite 3.2 گنجانده است. این ویژگی به مدل‌ها اجازه می‌دهد تا به روشی ساختاریافته و روشمند به مسائل نزدیک شوند و آن‌ها را به مراحلی تقسیم کنند که منعکس‌کننده‌ی فرآیندهای استدلال انسانی است. این امر توانایی مدل‌ها را برای مقابله با وظایف پیچیده‌ای که نیاز به استنتاج منطقی دارند، افزایش می‌دهد.

به‌طور حیاتی، کاربران این انعطاف‌پذیری را دارند که بسته به پیچیدگی کار، این قابلیت را فعال یا غیرفعال کنند. این سازگاری یک تمایز کلیدی است که به سازمان‌ها اجازه می‌دهد تا استفاده از منابع را بر اساس نیازهای خاص خود بهینه کنند. برای کارهای ساده‌تر، استدلال زنجیره‌ی تفکر را می‌توان برای صرفه‌جویی در توان محاسباتی غیرفعال کرد، در حالی که برای مسائل پیچیده‌تر، می‌توان آن را فعال کرد تا از پتانسیل استدلال کامل مدل استفاده شود.

این پیشرفت‌ها منجر به بهبودهای چشمگیری در عملکرد مدل 8B در بنچمارک‌های پیروی از دستورالعمل شده است و از نسخه‌های قبلی پیشی گرفته است. از طریق روش‌های نوآورانه‌ی “مقیاس‌بندی استنتاج”، آی‌بی‌ام نشان داده است که حتی این مدل نسبتاً کوچک می‌تواند به‌طور مؤثری با سیستم‌های بسیار بزرگ‌تر در بنچمارک‌های استدلال ریاضی رقابت کند. این امر پتانسیل مدل‌های کوچک‌تر و بهینه‌شده را برای ارائه‌ی عملکرد چشمگیر در حوزه‌های خاص برجسته می‌کند.

ایمنی و ظرافت: به‌روزرسانی‌های Granite Guardian

مدل‌های ایمنی Granite Guardian که برای نظارت و کاهش خطرات احتمالی مرتبط با محتوای تولیدشده توسط هوش مصنوعی طراحی شده‌اند نیز به‌روزرسانی‌های قابل‌توجهی را پشت سر گذاشته‌اند. اندازه‌ی این مدل‌ها 30 درصد کاهش یافته است، در حالی که سطوح عملکرد خود را حفظ کرده‌اند. این بهینه‌سازی به کارایی بیشتر و کاهش مصرف منابع کمک می‌کند.

علاوه بر این، این مدل‌ها اکنون دارای ویژگی‌ای به نام “اعتماد کلامی” هستند. اینویژگی با تصدیق درجات عدم قطعیت در نظارت بر ایمنی، ارزیابی ریسک دقیق‌تری را ارائه می‌دهد. به‌جای ارائه‌ی یک طبقه‌بندی دودویی ایمن/ناامن، مدل‌ها می‌توانند سطوح مختلفی از اطمینان را در ارزیابی‌های خود بیان کنند و ارزیابی آگاهانه‌تر و شفاف‌تری را در اختیار کاربران قرار دهند.

TinyTimeMixers: پیش‌بینی بلندمدت برای برنامه‌ریزی استراتژیک

علاوه بر به‌روزرسانی‌های Granite، آی‌بی‌ام نسل بعدی مدل‌های TinyTimeMixers خود را نیز منتشر کرده است. این مدل‌ها به‌طور قابل‌توجهی کوچک هستند و کمتر از 10 میلیون پارامتر دارند – کسری از اندازه‌ی بسیاری از مدل‌های دیگر در این صنعت. با وجود اندازه‌ی جمع‌وجور، این مدل‌های تخصصی قادر به پیش‌بینی داده‌های سری زمانی تا دو سال آینده هستند.

این قابلیت به‌ویژه برای طیف وسیعی از کاربردهای تجاری ارزشمند است، از جمله:

  • تجزیه‌وتحلیل روند مالی: پیش‌بینی حرکات بازار و شناسایی فرصت‌های سرمایه‌گذاری.
  • برنامه‌ریزی زنجیره‌ی تأمین: بهینه‌سازی سطوح موجودی و پیش‌بینی نوسانات تقاضا.
  • مدیریت موجودی خرده‌فروشی: اطمینان از سطوح کافی موجودی برای پاسخگویی به تقاضای مشتری و در عین حال به حداقل رساندن ضایعات.

این برنامه‌ها همگی بر توانایی تصمیم‌گیری آگاهانه بر اساس پیش‌بینی‌های بلندمدت متکی هستند و مدل‌های TinyTimeMixers را به ابزاری قدرتمند برای برنامه‌ریزی استراتژیک کسب‌وکار تبدیل می‌کنند.

رسیدگی به محدودیت‌های کسب‌وکار در دنیای واقعی

توانایی تغییر قابلیت‌های استدلال در مدل‌های Granite مستقیماً به یک چالش عملی در پیاده‌سازی هوش مصنوعی می‌پردازد. رویکردهای استدلال گام‌به‌گام، در حالی که قدرتمند هستند، به توان محاسباتی قابل‌توجهی نیاز دارند که همیشه ضروری نیست. آی‌بی‌ام با اختیاری کردن این ویژگی، سازمان‌ها را قادر می‌سازد تا هزینه‌های محاسباتی را برای کارهای ساده‌تر کاهش دهند و در عین حال گزینه‌ی استدلال پیشرفته را برای مسائل پیچیده‌تر حفظ کنند.

این رویکرد نشان‌دهنده‌ی درک عمیقی از محدودیت‌های کسب‌وکار در دنیای واقعی است، جایی که کارایی و مقرون‌به‌صرفه بودن اغلب به‌اندازه‌ی عملکرد خام اهمیت دارند. تمرکز آی‌بی‌ام بر ارائه‌ی راه‌حل‌های عملی که می‌توانند با نیازهای خاص کسب‌وکار تنظیم شوند، یک تمایز کلیدی در بازار شلوغ هوش مصنوعی است.

کسب کشش: شواهدی از تأثیر عملی

به نظر می‌رسد استراتژی آی‌بی‌ام برای توسعه‌ی مدل‌های کوچک‌تر و تخصصی‌شده با بازار همخوانی دارد. مدل قبلی Granite 3.1 8B اخیراً به عملکرد قوی در Salesforce LLM Benchmark for Customer Relationship Management (CRM) دست یافت. این بنچمارک به‌طور خاص برای ارزیابی عملکرد LLMها در وظایف مرتبط با CRM، مانند تجزیه‌وتحلیل تعامل با مشتری و تولید محتوای شخصی‌شده طراحی شده است.

عملکرد قوی مدل Granite 3.1 8B در این بنچمارک نشان می‌دهد که مدل‌های کوچک‌تر و تخصصی‌شده می‌توانند به‌طور مؤثری نیازهای خاص کسب‌وکار را برآورده کنند. این شواهد بیشتری ارائه می‌دهد که رویکرد آی‌بی‌ام نه‌تنها از نظر تئوری صحیح است، بلکه از نظر عملی نیز قابل‌اجرا است.

تمرکز بر کارایی، یکپارچه‌سازی و تأثیر دنیای واقعی

Sriram Raghavan، معاون تحقیقات هوش مصنوعی آی‌بی‌ام، به‌طور خلاصه فلسفه‌ی این شرکت را بیان می‌کند: “عصر بعدی هوش مصنوعی در مورد کارایی، یکپارچه‌سازی و تأثیر دنیای واقعی است – جایی که شرکت‌ها می‌توانند بدون صرف هزینه‌ی بیش از حد برای محاسبات، به نتایج قدرتمندی دست یابند. آخرین پیشرفت‌های Granite آی‌بی‌ام بر راه‌حل‌های باز تمرکز دارند و گامی دیگر در جهت دسترس‌پذیرتر، مقرون‌به‌صرفه‌تر و ارزشمندتر کردن هوش مصنوعی برای شرکت‌های مدرن نشان می‌دهند.”

این بیانیه تعهد آی‌بی‌ام به توسعه‌ی راه‌حل‌های هوش مصنوعی را نشان می‌دهد که نه‌تنها از نظر فناوری پیشرفته هستند، بلکه کاربردی، در دسترس و همسو با نیازهای واقعی کسب‌وکارها هستند. تمرکز بر راه‌حل‌های باز، تعهد آی‌بی‌ام به تقویت همکاری و نوآوری در جامعه‌ی هوش مصنوعی را بیشتر نشان می‌دهد. تأکید از صرفاً ساختن بزرگ‌ترین مدل‌ها به ایجاد ابزارهای هوش مصنوعی تغییر می‌کند که ارزش ملموسی ارائه می‌دهند و کسب‌وکارها را برای دستیابی به اهداف استراتژیک خود توانمند می‌سازند.