Tag: AIGC

چالش مدل‌های هوش مصنوعی در درک تاریخ جهان: یک مطالعه نشان می‌دهد

مطالعه‌ای جدید نشان می‌دهد که مدل‌های پیشرفته هوش مصنوعی مانند GPT-4 در درک تاریخ جهان با مشکل مواجه هستند و تنها به 46 درصد از سوالات تاریخی پاسخ صحیح می‌دهند. این امر نگرانی‌هایی را در مورد قابلیت اطمینان این سیستم‌ها در زمینه‌هایی که نیاز به درک قوی از گذشته دارند، ایجاد می‌کند. این مطالعه همچنین نشان می‌دهد که مدل‌های هوش مصنوعی در درک تاریخ مناطق خاصی مانند آفریقای جنوب صحرا با چالش‌های بیشتری روبرو هستند و این نشان‌دهنده وجود سوگیری در داده‌های آموزشی است. این یافته‌ها بر اهمیت تفکر انتقادی و سواد رسانه‌ای در عصر هوش مصنوعی تأکید می‌کند.

چالش مدل‌های هوش مصنوعی در درک تاریخ جهان: یک مطالعه نشان می‌دهد

مقیاس‌بندی استنتاج مدل‌های انتشار پارادایم جدید

تحقیقات اخیر نشان داده است که مقیاس‌بندی در طول استنتاج برای مدل‌های زبانی بزرگ (LLM) مؤثر است. این مطالعه بررسی می‌کند که آیا این اصل را می‌توان برای مدل‌های انتشار نیز به کار برد. نتایج نشان می‌دهد که افزایش محاسبات در طول استنتاج کیفیت نمونه‌های تولید شده را بهبود می‌بخشد. چارچوب پیشنهادی دو محور طراحی دارد: تأییدکننده‌ها و الگوریتم‌ها. این چارچوب در سناریوهای مختلف از جمله تولید تصویر مشروط به کلاس و متن آزمایش شد.

مقیاس‌بندی استنتاج مدل‌های انتشار پارادایم جدید

کاهش حافظه پنهان KV با مکانیسم توجه جدید گام

این مقاله به بررسی مکانیسم توجه جدید چند ماتریسی فاکتوریزاسیون (MFA) و نوع آن MFA-KR می پردازد که با کاهش قابل توجه مصرف حافظه پنهان KV، هزینه استنتاج مدل های زبانی بزرگ را کاهش می دهد. MFA با حفظ عملکردی مشابه MHA سنتی، به میزان 93.7% در مصرف حافظه صرفه جویی می کند. این مکانیسم همچنین از نظر سادگی، سهولت بازتولید، حساسیت کم به ابرپارامترها و سازگاری با روش های مختلف تعبیه موقعیت برتری دارد. MFA با نوآوری هایی در افزایش تعداد و ابعاد سر توجه، استفاده از تجزیه رتبه پایین و طراحی یک سر کلید-مقدار، به این مهم دست یافته است. نتایج تجربی نشان می دهد که MFA در مقایسه با MQA و MLA، به حافظه پنهان KV کوچکتر و رتبه موثر کل بالاتری دست می یابد و در مقایسه با MHA سنتی، با وجود SLSD کوچکتر، TER بالاتری دارد. این مکانیسم جدید، با یک طراحی ساده، به طور موثر به مشکل گلوگاه حافظه در استنتاج LLM ها پرداخته و بدون ایجاد پیچیدگی های مهندسی اضافی، در اکوسیستم ترانسفورمر ادغام می شود.

کاهش حافظه پنهان KV با مکانیسم توجه جدید گام

ESM3 جهش در تحقیقات پروتئین مدل بیولوژیکی پیشگام

ESM3 مدل بیولوژیکی با 98 میلیارد پارامتر پیشرفت قابل توجهی در درک و دستکاری پروتئین ها ارائه می دهد این مدل ساختار سه بعدی و عملکرد پروتئین ها را به الفبای گسسته تبدیل می کند ESM3 می تواند به طور همزمان توالی ساختار و عملکرد پروتئین را پردازش کند و پروتئین های جدیدی تولید کند ESM3 شبیه سازی تکامل 5 تریلیون سال تکامل طبیعی را انجام می دهد API رایگان ESM3 برای تسریع در پیش بینی پروتئین در دسترس است یان لکان از این دستاورد قدردانی کرده است ESM3 قدرت محاسباتی زیادی دارد و از رویکرد چندوجهی و مدل سازی زبان پوشانده شده استفاده می کند ESM3 می تواند پروتئین های جدید را با دقت بی سابقه ای تولید کند و پتانسیل زیادی در مهندسی پروتئین دارد ESM3 یک پروتئین فلورسنت سبز جدید esmGFP تولید کرده است که روشنایی آن قابل مقایسه با GFP طبیعی است

ESM3 جهش در تحقیقات پروتئین مدل بیولوژیکی پیشگام