مدلهای هوش مصنوعی منتشر شده در سال ۲۰۲۵
OpenAI’s GPT 4.5 ‘Orion’
OpenAI، اوریون را به عنوان جاهطلبانهترین مدل خود تا به امروز معرفی میکند و بر ‘دانش جهانی’ گسترده و ‘هوش هیجانی’ پیشرفتهی آن تأکید دارد. با وجود این ادعاها، عملکرد اوریون در برخی از معیارها نسبت به مدلهای جدیدتر متمرکز بر استدلال، عقبتر است. دسترسی به اوریون منحصر به مشترکین طرح پرمیوم OpenAI است که قیمت آن ۲۰۰ دلار در ماه است.
Claude Sonnet 3.7
Anthropic، سونِت ۳.۷ را به عنوان پیشگام ‘مدل استدلال ترکیبی’ در صنعت معرفی میکند. این معماری منحصر به فرد به آن اجازه میدهد تا پاسخهای سریعی ارائه دهد و در عین حال ظرفیت پردازش عمیق و سنجیده را در صورت نیاز حفظ کند. به طور منحصر به فرد، به کاربران امکان کنترل زمان پردازش مدل را میدهد، ویژگیای که Anthropic بر آن تأکید دارد. سونِت ۳.۷ برای همهی کاربران Claude در دسترس است، و کاربران پرمصرفتر به اشتراک Pro با قیمت ۲۰ دلار در ماه نیاز دارند.
xAI’s Grok 3
گراک ۳ جدیدترین مدل پرچمدار xAI است، استارتاپی که توسط ایلان ماسک تأسیس شده است. xAI ادعا میکند که گراک ۳ از سایر مدلهای پیشرو در زمینههایی مانند ریاضیات، علوم و کدنویسی پیشی میگیرد. دسترسی به این مدل به اشتراک X Premium گره خورده است که هزینهی آن ۵۰ دلار در ماه است. پس از مطالعهای که نشاندهندهی سوگیری چپگرا در گراک ۲ بود، ماسک متعهد شد که گراک را به سمت ‘بیطرفی سیاسی’ بیشتر هدایت کند، اگرچه میزان این تغییر هنوز مشخص نیست.
OpenAI o3-mini
o3-mini OpenAI یک مدل استدلال تخصصی است که برای رشتههای STEM، از جمله کدنویسی، ریاضیات و علوم بهینهسازی شده است. در حالی که قدرتمندترین محصول OpenAI نیست، اندازهی جمع و جور آن به گفتهی این شرکت، به کاهش قابل توجه هزینههای عملیاتی منجر میشود. این مدل به صورت رایگان در دسترس است و برای کاربران پرمصرف اشتراک لازم است.
OpenAI Deep Research
مدل Deep Research OpenAI برای کاوش عمیق موضوعات خاص طراحی شده است و ارجاعات روشنی را برای پشتیبانی از یافتههای خود ارائه میدهد. این سرویس منحصراً از طریق اشتراک Pro ChatGPT در دسترس است که قیمت آن ۲۰۰ دلار در ماه است. OpenAI آن را برای طیف گستردهای از وظایف تحقیقاتی، از تحقیقات علمی گرفته تا مقایسهی محصولات مصرفی، توصیه میکند. با این حال، کاربران باید از مشکل مداوم توهمات هوش مصنوعی آگاه باشند.
Mistral Le Chat
Mistral نسخههای اپلیکیشن Le Chat، یک دستیار شخصی هوش مصنوعی چندوجهی را معرفی کرده است. Mistral ادعا میکند که Le Chat از نظر پاسخگویی از همهی رباتهای گفتگوی دیگر پیشی میگیرد. یک نسخهی پولی، روزنامهنگاری بهروز شده از AFP را ادغام میکند. ارزیابیهای Le Monde نشان داد که عملکرد Le Chat چشمگیر است، اگرچه نرخ خطای بالاتری نسبت به ChatGPT نشان داد.
OpenAI Operator
OpenAI، اپراتور را به عنوان یک کارآموز شخصی تصور میکند که قادر به اجرای مستقل وظایف است، مانند کمک به خرید مواد غذایی. این به اشتراک ۲۰۰ دلاری در ماه ChatGPT Pro نیاز دارد. در حالی که عاملهای هوش مصنوعی پتانسیل قابل توجهی دارند، اما در مرحلهی آزمایشی باقی میمانند. یک بازبینکنندهی واشنگتن پست گزارش داد که اپراتور به طور خودکار تصمیم گرفت دوازده تخم مرغ را به قیمت ۳۱ دلار سفارش دهد و کارت اعتباری بازبینکننده را شارژ کند.
Google Gemini 2.0 Pro Experimental
مدل پرچمدار بسیار مورد انتظار گوگل، Gemini 2.0 Pro Experimental، ادعا میکند که در کدنویسی و درک دانش عمومی برتری دارد. این مدل دارای یک پنجرهی متنی فوقالعاده بزرگ ۲ میلیون توکنی است که به کاربرانی که نیاز به پردازش سریع مقادیر زیادی متن دارند، پاسخ میدهد. دسترسی به این سرویس حداقل به اشتراک Google One AI Premium با قیمت ۱۹.۹۹ دلار در ماه نیاز دارد.
مدلهای هوش مصنوعی منتشر شده در سال ۲۰۲۴
DeepSeek R1
این مدل هوش مصنوعی چینی توجه قابل توجهی را در سیلیکون ولی به خود جلب کرد. R1 DeepSeek عملکرد قویای در کدنویسی و ریاضیات نشان میدهد و ماهیت متنباز آن به هر کسی اجازه میدهد تا آن را به صورت محلی و رایگان اجرا کند. با این حال، R1 سانسور دولتی چین را در خود جای داده است و با بررسیهای فزایندهای برای انتقال بالقوهی دادههای کاربر به چین مواجه است که منجر به ممنوعیتهایی در برخی مناطق شده است.
Gemini Deep Research
Deep Research نتایج جستجوی گوگل را به اسناد مختصر و با استناد خوب ساده میکند. این سرویس برای دانشجویان و افرادی که به دنبال خلاصههای تحقیقاتی سریع هستند مفید است. با این حال، کیفیت آن کمتر از یک مقالهی علمی دقیق بررسی شده است. Deep Research به اشتراک ۱۹.۹۹ دلاری Google One AI Premium نیاز دارد.
Meta Llama 3.3 70B
این جدیدترین و پیشرفتهترین نسخهی مدلهای هوش مصنوعی متنباز Llama متا است. متا بر مقرون به صرفه بودن و کارایی این نسخه، به ویژه در زمینههایی مانند ریاضیات، دانش عمومی و پیروی از دستورالعملها تأکید میکند. این مدل به صورت رایگان و متنباز در دسترس است.
OpenAI Sora
Sora یک مدل پیشگام است که قادر به تولید ویدیوهای واقعگرایانه از اعلانهای متنی است. در حالی که میتواند کل صحنهها را ایجاد کند، نه فقط کلیپهای کوتاه، OpenAI اذعان میکند که گاهی اوقات ‘فیزیک غیرواقعی’ تولید میکند. دسترسی در حال حاضر به نسخههای پولی ChatGPT، با شروع از طرح Plus با قیمت ۲۰ دلار در ماه محدود شده است.
Alibaba Qwen QwQ-32B-Preview
این مدل به عنوان یکی از معدود مدلهایی که o1 OpenAI را در معیارهای خاص صنعت به چالش میکشد، برجسته است و قدرت خاصی را در ریاضیات و کدنویسی نشان میدهد. از قضا، برای یک ‘مدل استدلال’، علیبابا خاطرنشان میکند که ‘جای پیشرفت در استدلال عقل سلیم’ دارد. آزمایش TechCrunch تأیید میکند که این مدل همچنین سانسور دولتی چین را در خود جای داده است. این مدل رایگان و متنباز است.
Anthropic’s Computer Use
Computer Use Anthropic برای کنترل رایانهی کاربر برای انجام وظایفی مانند کدنویسی یا رزرو پرواز طراحی شده است و خود را به عنوان پیشدرآمدی برای Operator OpenAI معرفی میکند. با این حال، Computer Use در مرحلهی آزمایش بتا باقی میماند. قیمتگذاری مبتنی بر API است: ۰.۸۰ دلار به ازای هر میلیون توکن ورودی و ۴ دلار به ازای هر میلیون توکن خروجی.
x.AI’s Grok 2
شرکت هوش مصنوعی ایلان ماسک، x.AI، نسخهی ارتقا یافتهای از ربات گفتگوی پرچمدار خود، Grok 2 را منتشر کرده است که ادعا میکند عملکرد ‘سه برابر سریعتر’ دارد. کاربران رایگان به ۱۰ سوال در هر دو ساعت در Grok محدود میشوند، در حالی که مشترکین طرحهای Premium و Premium+ X دارای سهمیهی استفادهی بالاتری هستند. x.AI همچنین Aurora، یک تولیدکنندهی تصویر را راهاندازی کرد که تصاویر بسیار واقعی، از جمله تصاویری که ممکن است گرافیکی یا خشونتآمیز باشند، تولید میکند.
OpenAI o1
خانوادهی o1 OpenAI برای ارائهی پاسخهای بهبودیافته با استفاده از یک مکانیسم استدلال پنهان برای ‘فکر کردن’ به پاسخهای خود مهندسی شده است. به گفتهی OpenAI، این مدل در کدنویسی، ریاضیات و ایمنی برتری دارد، اما همچنین ظرفیت فریب دادن انسانها را نشان میدهد. استفاده از o1 به اشتراک ChatGPT Plus با قیمت ۲۰ دلار در ماه نیاز دارد.
Anthropic’s Claude Sonnet 3.5
Anthropic، کلود سونِت ۳.۵ را به عنوان یک مدل برتر در کلاس خود معرفی میکند. این مدل به دلیل مهارت کدنویسی خود شناخته شده است و مورد علاقهی بسیاری از افراد داخلی فناوری است. این مدل را میتوان به صورت رایگان در Claude استفاده کرد، اگرچه کاربران مکرر احتمالاً به اشتراک ۲۰ دلاری ماهانهی Pro نیاز خواهند داشت. در حالی که میتواند تصاویر را درک کند، فاقد قابلیتهای تولید تصویر است.
OpenAI GPT 4o-mini
OpenAI، جیپیتی ۴o-mini را به عنوان مقرون به صرفهترین و سریعترین مدل خود تا به امروز معرفی میکند که به دلیل اندازهی جمع و جور آن است. این مدل برای انجام طیف گستردهای از وظایف، مانند پشتیبانی از رباتهای گفتگوی خدمات مشتری طراحی شده است. این مدل در سطح رایگان ChatGPT در دسترس است. برای کارهای با حجم بالا و ساده مناسبتر است تا کارهای پیچیده.
Cohere Command R+
مدل Command R+ Cohere در برنامههای پیچیدهی Retrieval-Augmented Generation (RAG) برای استفادهی سازمانی تخصص دارد. این بدان معناست که در یافتن و استناد به قطعات خاصی از اطلاعات برتری دارد. با این حال، مهم است که توجه داشته باشید که RAG مشکل توهمات هوش مصنوعی را به طور کامل از بین نمیبرد. قدرت این مدل در توانایی آن برای ترکیب اطلاعات از منابع متعدد نهفته است و پاسخی جامعتر و مرتبطتر با زمینه نسبت به روشهای جستجوی سنتی ارائه میدهد. تمرکز سازمانی آن به این معنی است که احتمالاً در جریانهای کاری تجاری ادغام میشود، نه اینکه یک محصول مصرفکنندهی مستقل باشد. ساختار قیمتگذاری احتمالاً با الگوهای استفادهی سازمانی تنظیم میشود.
توضیحات بیشتر در مورد مفاهیم و مدلهای کلیدی:
Retrieval-Augmented Generation (RAG): RAG نشاندهندهی پیشرفت قابل توجهی در توانایی هوش مصنوعی برای تولید متن دقیق و مرتبط با زمینه است. برخلاف مدلهایی که صرفاً به دانش از پیش آموزشدیدهی خود متکی هستند، مدلهای RAG میتوانند به صورت پویا اطلاعات را از منابع خارجی، مانند پایگاههای داده یا اسناد، در طول فرآیند تولید بازیابی کنند. این به آنها اجازه میدهد تا اطلاعات بهروز را در خود جای دهند و پاسخهای خاصتر و قابل تأییدتری ارائه دهند. با این حال، کیفیت اطلاعات بازیابی شده و توانایی مدل برای ادغام صحیح آن، عوامل مهمی در کاهش توهمات هستند.
پنجرهی متنی (Context Window): پنجرهی متنی به مقدار متنی اشاره دارد که یک مدل هوش مصنوعی میتواند در یک زمان پردازش کند. یک پنجرهی متنی بزرگتر به مدل اجازه میدهد تا اطلاعات بیشتری را هنگام تولید پاسخ در نظر بگیرد، که منجر به انسجام و ارتباط بهبود یافته، به ویژه در وظایفی که شامل اسناد طولانی یا مکالمات پیچیده است، میشود. پنجرهی متنی ۲ میلیون توکنی Gemini 2.0 Pro Experimental فوقالعاده بزرگ است و آن را قادر میسازد تا وظایفی مانند خلاصهسازی کل کتابها یا تجزیه و تحلیل پایگاههای کد گسترده را انجام دهد.
متنباز در مقابل متنبسته (Open Source vs. Closed Source): تمایز بین مدلهای هوش مصنوعی متنباز و متنبسته بسیار مهم است. مدلهای متنباز، مانند Llama 3.3 70B متا و DeepSeek R1، به هر کسی اجازه میدهند تا به کد مدل دسترسی داشته باشد، آن را تغییر دهد و توزیع کند. این امر همکاری و نوآوری را تقویت میکند، اما نگرانیهایی را در مورد سوء استفادهی احتمالی و ادغام سوگیریها یا سانسورهای ناخواسته، همانطور که در R1 دیده میشود، ایجاد میکند. مدلهای متنبسته، مانند مدلهای OpenAI و Anthropic، معمولاً اختصاصی هستند و برای دسترسی به اشتراک پولی نیاز دارند. این به شرکتها اجازه میدهد تا کنترل توسعه و استفاده از مدل را حفظ کنند، اما میتواند شفافیت و دسترسی را محدود کند.
هوش مصنوعی چندوجهی (Multimodal AI): مدلهای هوش مصنوعی چندوجهی، مانند Le Chat Mistral، میتوانند محتوا را در چندین وجه، مانند متن، تصاویر و صدا پردازش و تولید کنند. این قابلیت امکانات جدیدی را برای کاربردهای هوش مصنوعی باز میکند و امکان تعاملات طبیعیتر و شهودیتر را فراهم میکند. به عنوان مثال، یک دستیار چندوجهی میتواند درخواست گفتاری کاربر را درک کند، یک تصویر مرتبط را تجزیه و تحلیل کند و یک پاسخ متنی تولید کند که اطلاعات هر دو را در خود جای دهد.
عاملهای هوش مصنوعی (AI Agents): عاملهای هوش مصنوعی، مانند Operator OpenAI، گامی به سوی سیستمهای هوش مصنوعی مستقلتر هستند. این عاملها برای انجام وظایف به طور مستقل، تصمیمگیری و انجام اقدامات بر اساس دستورالعملهای کاربر یا اهداف از پیش تعریف شده طراحی شدهاند. با این حال، همانطور که بررسی واشنگتن پست نشان میدهد، این عاملها هنوز در مراحل اولیهی توسعهی خود هستند و میتوانند رفتار غیرقابل پیشبینی از خود نشان دهند. اطمینان از ایمنی و قابلیت اطمینان عاملهای هوش مصنوعی یک چالش بزرگ برای این حوزه است.
مدلهای استدلال (Reasoning Models): مدلهای استدلال، دستهای که شامل o3-mini و o1 OpenAI میشود، به طور خاص برای انجام استدلال منطقی و حل مسئله طراحی شدهاند. این مدلها اغلب برای وظایفی که نیاز به استنتاج پیچیده دارند، مانند کدنویسی، ریاضیات و تجزیه و تحلیل علمی بهینهسازی میشوند. ‘ویژگی استدلال پنهان’ ذکر شده در زمینهی o1، رویکردی جدید برای بهبود قابلیتهای استدلال مدل را پیشنهاد میکند، احتمالاً با ترکیب تکنیکهایی مانند زنجیرهی تفکر یا استدلال نمادین.
توهمات (Hallucinations): توهمات هوش مصنوعی به مواردی اشاره دارد که یک مدل متنی تولید میکند که از نظر واقعی نادرست، بیمعنی یا ناسازگار با زمینهی ارائه شده است. این یک چالش مهم برای توسعهی هوش مصنوعی باقی میماند، به ویژه در کاربردهایی که نیاز به دقت و قابلیت اطمینان بالا دارند. در حالی که تکنیکهایی مانند RAG میتوانند به کاهش توهمات کمک کنند، اما مشکل را به طور کامل از بین نمیبرند. کاربران همیشه باید خروجی مدلهای هوش مصنوعی را به طور انتقادی ارزیابی کنند، به خصوص هنگام برخورد با اطلاعات حساس یا حیاتی.