Tag: Fine-Tuning

GPT-4.1 OpenAI: پسرفت در همسویی؟

GPT-4.1 از OpenAI با ادعای برتری در پیروی از دستورالعمل‌ها معرفی شد. اما، ارزیابی‌های اولیه نشان می‌دهد که ممکن است نسبت به نسخه‌های قبلی خود کمتر قابل اعتماد باشد. این موضوع بحث‌هایی را در مورد جهت توسعه هوش مصنوعی برانگیخته است.

GPT-4.1 OpenAI: پسرفت در همسویی؟

GPT-4.1 OpenAI: نگران‌کننده‌تر از قبل؟

GPT-4.1 OpenAI نگرانی‌هایی را در مورد سازگاری و رفتارهای ناخواسته در مقایسه با مدل‌های قبلی برانگیخته است. آزمایش‌های مستقل این مسائل را برجسته کرده‌اند.

GPT-4.1 OpenAI: نگران‌کننده‌تر از قبل؟

مدل‌های هوش مصنوعی کوچک در شرکت‌ها

تحلیل جدید گارتنر نشان می‌دهد شرکت‌ها به سمت مدل‌های هوش مصنوعی کوچک‌تر و متمرکزتر حرکت می‌کنند، زیرا بهینه‌سازی منابع محاسباتی و کاهش هزینه‌های عملیاتی مهم است.

مدل‌های هوش مصنوعی کوچک در شرکت‌ها

رمزگشایی اسرار زیستی: مدل‌های زبانی برای تجزیه و تحلیل تک سلولی

بدن انسان، شگفتی طبیعت، از تریلیون‌ها سلول تشکیل شده است. C2S-Scale داده های پیچیده را به زبانی قابل فهم برای انسان و ماشین تبدیل می کند و درک عمیق‌تری از سیستم‌های بیولوژیکی از سلول‌ها تا بافت‌ها ارائه می‌دهد.

رمزگشایی اسرار زیستی: مدل‌های زبانی برای تجزیه و تحلیل تک سلولی

اجرای محلی مدل‌های زبانی بزرگ در مک

با اجرای محلی مدل‌های زبانی بزرگ در مک، از حریم خصوصی، عملکرد بالا و کنترل بیشتر بر تعاملات هوش مصنوعی خود لذت ببرید.

اجرای محلی مدل‌های زبانی بزرگ در مک

تخصص‌گرایی، تنظیم دقیق و ادغام در مدل‌های زبانی بزرگ

چالش تطبیق مدل‌های زبانی بزرگ (LLMs) مانند Llama و Mistral برای حوزه‌های فنی تخصصی مانند علم مواد. بررسی روش‌های تنظیم دقیق (fine-tuning) و ادغام مدل (merging) مانند SLERP برای ایجاد تخصص و قابلیت‌های نوظهور، ضمن حفظ دانش عمومی مدل‌ها.

تخصص‌گرایی، تنظیم دقیق و ادغام در مدل‌های زبانی بزرگ

حملات AI برتر با ابزارهای خود Gemini

محققان روشی جدید برای حمله به مدل‌های Gemini کشف کرده‌اند. با سوءاستفاده از ویژگی fine-tuning، آن‌ها حملات prompt injection خودکار و بسیار مؤثری ایجاد می‌کنند که نیاز به آزمایش دستی را از بین می‌برد و آسیب‌پذیری‌های غیرمنتظره‌ای را در ابزارهای خود AI آشکار می‌سازد.

حملات AI برتر با ابزارهای خود Gemini

Mistral AI: رقیب متن‌باز جدید برای بزرگان هوش مصنوعی

Mistral AI مدل متن‌باز Mistral Small 3.1 را منتشر کرد که Gemma 3 و GPT-4o Mini را به چالش می‌کشد. این مدل با مجوز Apache 2.0، پنجره زمینه 128k و سرعت استنتاج بالا، عملکرد و دسترسی‌پذیری را ترکیب می‌کند. قابلیت تنظیم دقیق (fine-tuning) آن را برای کاربردهای تخصصی ایده‌آل می‌سازد و رقابت بین مدل‌های متن‌باز و اختصاصی را تشدید می‌کند.

Mistral AI: رقیب متن‌باز جدید برای بزرگان هوش مصنوعی

بهینه‌سازی گما ۳: ملاحظات و کاربردها

تکامل سریع مدل‌های زبانی بزرگ (LLMs) امکانات هیجان‌انگیزی را برای تطبیق این ابزارهای قدرتمند با وظایف و مجموعه داده‌های خاص ایجاد کرده است. بهینه‌سازی، فرآیندی برای آموزش بیشتر یک مدل از پیش آموزش‌دیده بر روی یک مجموعه داده کوچکتر و خاص دامنه، به عنوان یک جایگزین قانع‌کننده برای رویکردهای تولید تقویت‌شده با بازیابی (RAG) ظاهر شده است.

بهینه‌سازی گما ۳: ملاحظات و کاربردها

گوگل جما ۳ ۱بی: هوش مصنوعی موبایل

Gemma 3 1B گوگل، یک مدل زبان کوچک (SLM) با حجم فقط 529 مگابایت، برای برنامه‌های موبایل و وب با قابلیت‌های هوش مصنوعی پیشرفته و عملکرد آفلاین.

گوگل جما ۳ ۱بی: هوش مصنوعی موبایل