Tag: Fine-Tuning

پیمایش انقلاب هوش مصنوعی: چرا برنامه‌نویسی مهم است

دمیس هاسابیس از Google DeepMind توضیح می‌دهد که چرا برنامه‌نویسی با وجود اتوماسیون هوش مصنوعی هنوز مهم است و چگونه می‌تواند بهره‌وری را افزایش دهد.

پیمایش انقلاب هوش مصنوعی: چرا برنامه‌نویسی مهم است

رونمایی NVIDIA از Llama Nemotron Nano VL

NVIDIA مدل Llama Nemotron Nano VL را برای درک سطح سند با دقت و کارایی بالا معرفی کرد. این سیستم مبتنی بر Llama 3.1 و یک رمزگذار دیداری ساده است.

رونمایی NVIDIA از Llama Nemotron Nano VL

HTX: آینده‌ای قوی‌تر با همکاری

آژانس علم و فناوری Home Team (HTX) با همکاری‌های جدید، به دنبال تقویت امنیت سنگاپور از طریق هوش مصنوعی و فناوری‌های نوین است.

HTX: آینده‌ای قوی‌تر با همکاری

چالش ارتقاء R1: DeepSeek و مدل‌های زبانی بزرگ

DeepSeek با R1 ارتقا یافته، رقیبی برای مدل‌های پیشرو مانند O3 OpenAI و Gemini 2.5 Pro گوگل است. این ارتقا دقت استدلال را افزایش و توهمات را کاهش می‌دهد، در حالی که بر توسعه باز و کاربردهای اقتصادی تمرکز دارد.

چالش ارتقاء R1: DeepSeek و مدل‌های زبانی بزرگ

MedGemma گوگل: تحول تحلیل پزشکی با هوش مصنوعی

گوگل مدل‌های منبع باز MedGemma را معرفی کرد که تحلیل‌های متنی و تصویری پزشکی را در عرصه بهداشت و درمان متحول می‌کنند.

MedGemma گوگل: تحول تحلیل پزشکی با هوش مصنوعی

QwenLong-L1: استدلال متن طولانی

QwenLong-L1 چارچوبی نوآورانه برای توانمندسازی مدل‌های زبانی بزرگ (LLM) با قابلیت‌های استدلال پیشرفته متن طولانی، جهت استخراج بینش‌های ارزشمند از حجم وسیعی از داده‌ها، از جمله پرونده‌های پیچیده شرکتی است.

QwenLong-L1: استدلال متن طولانی

NVIDIA از Nemotron Nano 4B رونمایی کرد

NVIDIA مدل زبان منبع باز کوچک اما قدرتمندی به نام Nemotron Nano 4B را برای استدلال علمی و فنی پیشرفته و استقرار موثر در لبه معرفی کرده است.

NVIDIA از Nemotron Nano 4B رونمایی کرد

همکاری HTX سنگاپور در هوش مصنوعی

همکاری HTX سنگاپور با Mistral AI و Microsoft برای توسعه مدل‌های هوش مصنوعی، امنیت عمومی را تقویت می‌کند.

همکاری HTX سنگاپور در هوش مصنوعی

رونمایی از مدل زبان بزرگ 24B پارامتری Sarvam AI

Sarvam AI یک مدل زبان بزرگ 24 میلیاردی پارامتری را عرضه کرد که برای زبان‌های هندی و استدلال پیچیده بهینه شده است. این مدل Sarvam-M نام دارد و بر اساس Mistral Small ساخته شده است.

رونمایی از مدل زبان بزرگ 24B پارامتری Sarvam AI

رونمایی Sarvam AI از LLM پیشرفته

Sarvam AI با LLM جدید خود، Sarvam-M، به دنبال رقابت با مدل‌های برتر متا و گوگل است و در زبان‌های هندی، ریاضیات و برنامه‌نویسی عملکردی عالی نشان می‌دهد.

رونمایی Sarvam AI از LLM پیشرفته