تحلیل هوش مصنوعی: GPT-4.5، فضا و آینده

GPT-4.5: یک بهبود، نه یک انقلاب

OpenAI اخیراً GPT-4.5 را برای کاربران ChatGPT Pro در دسترس قرار داده است و حساب‌های Plus، Team، سازمانی و آموزشی نیز به زودی به آن دسترسی خواهند داشت. طبق گفته OpenAI، این مدل که در داخل با نام ‘Orion’ شناخته می‌شود، “درک بهتری از مقصود انسان دارد، نشانه‌های ظریف و انتظارات ضمنی را با ظرافت و هوش هیجانی بیشتری تفسیر می‌کند.” این مدل از تکنیک‌های نظارتی جدید در کنار تنظیم دقیق سنتی و یادگیری تقویتی از بازخورد انسانی بهره می‌برد که منعکس کننده فرآیند توسعه GPT-4o است. GPT-4.5 قابلیت‌های جستجوی بی‌درنگ، پشتیبانی از آپلود فایل و تصویر و ادغام با یک بوم (canvas) برای نوشتن و کدنویسی را ارائه می‌دهد. با این حال، در حال حاضر فاقد ویژگی‌های چندوجهی مانند حالت صوتی، ویدیو یا اشتراک‌گذاری صفحه نمایش است که در ChatGPT یافت می‌شود.

OpenAI تاکید می‌کند که یادگیری بدون نظارت، دقت و شهود یک مدل را افزایش می‌دهد. این رویکرد نیروی محرکه پیشرفت در مدل‌هایی مانند GPT-3.5، GPT-4 و اکنون GPT-4.5 بوده است. به طور جداگانه، استدلال مقیاس‌پذیر، مدل‌ها را برای پردازش سیستماتیک اطلاعات آموزش می‌دهد و قبل از پاسخ‌دهی، زنجیره‌ای از تفکر ایجاد می‌کند. این رویکرد روشمند توانایی آنها را برای مقابله با چالش‌های پیچیده STEM و منطق بهبود می‌بخشد، همانطور که توسط مدل‌هایی مانند OpenAI o1 و OpenAI o3-mini نشان داده شده است. GPT-4.5 به عنوان نمونه‌ای بارز از مقیاس‌بندی یادگیری بدون نظارت ارائه می‌شود که از افزایش توان محاسباتی، مجموعه داده‌های بزرگتر و نوآوری معماری بهره می‌برد. این مدل که بر روی ابررایانه‌های هوش مصنوعی Microsoft Azure آموزش دیده است، ظاهراً دارای دانش گسترده‌تر و درک عمیق‌تری از جهان است که توهمات را کاهش می‌دهد و قابلیت اطمینان را افزایش می‌دهد.

با وجود این پیشرفت‌ها، GPT-4.5 شور و شوق قابل توجهی ایجاد نکرده است. این مدل بیشتر به عنوان یک بهبود تدریجی تلقی می‌شود تا یک جهش انقلابی. در حالی که OpenAI از هوش هیجانی، ظرافت و خلاقیت پیشرفته صحبت می‌کند، بسیاری از کاربران تفاوت چشمگیری را در مقایسه با GPT-4o مشاهده نکرده‌اند. عدم وجود پیشرفت‌های چندوجهی، که یکی از ویژگی‌های کلیدی GPT-4o است، به این برداشت دامن می‌زند.

علاوه بر این، GPT-4.5 تمایل به تولید خروجی‌های بی‌معنی نشان داده است. ابزار محک‌زنی داخلی OpenAI برای سنجش واقعیت، SimpleQA، نشان می‌دهد که GPT-4.5 در 37.1٪ مواقع دچار توهم می‌شود (ساخته‌ها را به عنوان واقعیت با اطمینان ارائه می‌دهد). این یک نگرانی مهم است، حتی در مقایسه با GPT-4o، یکی دیگر از مدل‌های پیشرفته “استدلالی”، که در همان معیار 61.8٪ مواقع دچار توهم می‌شود. مدل کوچکتر و ارزان‌تر o3-mini نرخ توهم بالاتری را نشان می‌دهد که 80.3٪ است.

چشم‌انداز فعلی هوش مصنوعی، با حضور رقبایی مانند Anthropic با Claude 3.7 و پیشرفت‌های Google با Gemini، انتظارات را برای ارتقاهای قابل توجه افزایش داده است. کاربران به دنبال پیشرفت‌های چشمگیر هستند، نه فقط اصلاحات، و GPT-4.5، در شکل فعلی خود، به نظر می‌رسد که از این هدف فاصله دارد.

ظهور مدل‌های استدلالی و اعتماد سرمایه‌گذاران

ایلان ماسک اخیراً در X (توئیتر سابق) اظهار داشت که هوش عمومی مصنوعی (AGI) در افق است. این اظهارات در میان رقابت شدید غول‌های فناوری مانند OpenAI، Google، Meta، Microsoft، DeepSeek، Anthropic و xAI متعلق به خود ماسک برای توسعه مدل‌های استدلالی - سیستم‌های هوش مصنوعی طراحی شده برای تقلید از تفکر انسان‌گونه - صورت می‌گیرد.

سرمایه‌گذاران به وضوح اشتیاق خود را به این هدف نشان می‌دهند. اندکی پس از راه‌اندازی Claude 3.7 Sonnet با استدلال ترکیبی، Anthropic یک دور سرمایه‌گذاری قابل توجه 3.5 میلیارد دلاری سری E را تضمین کرد. این امر ارزش آن را سه برابر کرد و به 61.5 میلیارد دلار رساند و موقعیت آن را به عنوان یک رقیب اصلی برای OpenAI تثبیت کرد. این سرمایه‌گذاری که توسط Lightspeed Venture Partners و با مشارکت Salesforce Ventures، Cisco، Fidelity، Jane Street و دیگران انجام شد، برای گسترش توان محاسباتی برای توسعه هوش مصنوعی، افزایش تحقیقات ایمنی و تسریع رشد جهانی استفاده خواهد شد.

فراتر رفتن از مرزهای استدلال: معیار BBEH

مدل‌های زبان بزرگ (LLMs) به طور فزاینده‌ای در برنامه‌های کاربردی روزمره ادغام می‌شوند و نیازمند قابلیت‌های استدلالی قوی در حوزه‌های مختلف هستند. با این حال، معیارهای موجود اغلب ریاضیات و کدنویسی را در اولویت قرار می‌دهند و از سایر انواع استدلال حیاتی غفلت می‌کنند. در حالی که مجموعه داده BIG-Bench به طور گسترده برای ارزیابی LLM ها در وظایف استدلالی پیچیده استفاده شده است، مدل‌ها پیشرفت چشمگیری داشته‌اند به طوری که اکنون در BIG-Bench و نوع چالش‌برانگیزتر آن، BIG-Bench Hard (BBH)، امتیازهای تقریباً کاملی کسب می‌کنند. این اشباع، این معیارها را برای سنجش پیشرفت‌های بیشتر کم‌اثر می‌کند.

برای رفع این محدودیت، محققان BIG-Bench Extra Hard (BBEH) را معرفی کرده‌اند. این معیار جدید هر وظیفه در BBH را با یک نسخه بسیار دشوارتر جایگزین می‌کند، در حالی که همچنان مهارت‌های استدلالی مشابه را ارزیابی می‌کند. آزمایش‌های BBEH نشان می‌دهد که حتی بهترین مدل‌های همه‌منظوره فقط به امتیاز 9.8٪ می‌رسند، در حالی که مدل برتر که به طور خاص برای استدلال طراحی شده است به 44.8٪ می‌رسد. این نتایج چالش‌های مداومی را که LLM ها با استدلال پیچیده با آن روبرو هستند برجسته می‌کند و نشان‌دهنده فضای قابل توجهی برای بهبود است. مقاله تحقیقاتی کامل جزئیات بیشتری در مورد این معیار جدید ارائه می‌دهد.

ماهواره‌های مجهز به هوش مصنوعی: عصر جدیدی در اکتشاف و عملیات فضایی

TakeMe2Space، یک استارت‌آپ فضایی مستقر در حیدرآباد، اخیراً 5.5 کرور روپیه در یک دور سرمایه‌گذاری پیش‌بذر به رهبری Seafund، با مشارکت Blume Ventures، Artha Venture Fund، AC Ventures و سایر سرمایه‌گذاران فرشته، جذب کرد. این بودجه، اگرچه متوسط است، اما گامی مهم در جهت ایجاد اولین آزمایشگاه هوش مصنوعی هند در فضا است. TakeMe2Space قصد دارد از این بودجه برای توسعه MOI-1 (My Orbital Infrastructure–Technology Demonstrator)، پلتفرمی که به کاربران امکان می‌دهد مدل‌های هوش مصنوعی مشاهده زمین یا سایر آزمایش‌های فضایی را مستقیماً از طریق یک کنسول وب به نام Orbitlab به یک ماهواره مداری آپلود کنند، استفاده کند. کاربران فقط برای زمان استفاده از ماهواره، با نرخ 2 دلار در دقیقه، هزینه پرداخت خواهند کرد.

گزارش شده است که پلتفرم MOI-TD این شرکت توانایی آپلود مدل‌های بزرگ هوش مصنوعی از یک ایستگاه زمینی، اجرای کد خارجی روی ماهواره و دانلود ایمن نتایج کدگذاری شده و رمزگذاری شده را نشان داده است. این نشان دهنده حرکتی به سمت عملیات ماهواره‌ای مستقل‌تر و کارآمدتر است.

TakeMe2Space در این تلاش تنها نیست. سازمان‌هایی مانند ESA (با OPS-SAT) و Globalstar نیز در حال پیشگامی در کاربردهای دنیای واقعی فناوری ماهواره‌ای مجهز به هوش مصنوعی هستند، از ارتباطات امن IoT گرفته تا اجرای مدل هوش مصنوعی در مدار. با ادامه پیشرفت فناوری، ماهواره‌های مبتنی بر هوش مصنوعی آماده‌اند تا به طور فزاینده‌ای مستقل شوند و منجر به عملیات فضایی کارآمدتر و باز کردن امکانات جدید برای تحقیق، امنیت و اتصال جهانی شوند.

به طور سنتی، ماهواره‌ها به شدت به ایستگاه‌های زمینی برای پردازش داده‌ها، تصمیم‌گیری و اجرای فرمان متکی بوده‌اند. داده‌ها باید به زمین منتقل می‌شدند، در زمین تجزیه و تحلیل می‌شدند و سپس بینش‌های پردازش شده دوباره به ماهواره منتقل می‌شدند - فرآیندی که هم زمان‌بر و هم نیازمند پهنای باند زیاد بود. با این حال، پیشرفت‌ها در هوش مصنوعی و محاسبات لبه‌ای (پردازش داده‌ها در خود دستگاه به جای ابر) اکنون ماهواره‌ها را قادر می‌سازد تا داده‌ها را در مدار پردازش کنند، تصمیمات مستقل بگیرند و فقط مهم‌ترین بینش‌ها را به صورت ایمن منتقل کنند. این امر منجر به عملیات سریع‌تر، هوشمندانه‌تر و کارآمدتر می‌شود.

عملکرد ماهواره‌های مدرن مجهز به هوش مصنوعی معمولاً شامل سه مرحله کلیدی است:

  1. آپلینک الگوریتم‌های هوش مصنوعی: الگوریتم‌های هوش مصنوعی از ایستگاه‌های زمینی به ماهواره‌ها منتقل می‌شوند و قابلیت‌های پیشرفته پردازش داده را برای آنها فراهم می‌کنند.
  2. تجزیه و تحلیل داده‌ها در مدار: مدل‌های هوش مصنوعی تصاویر، داده‌های حسگر و سایر ورودی‌ها را مستقیماً در مدار تجزیه و تحلیل می‌کنند و نیاز به مداخله مداوم زمین را به حداقل می‌رسانند.
  3. دانلود ایمن بینش‌ها: به جای انتقال داده‌های خام، ماهواره‌ها بینش‌های رمزگذاری شده را ارسال می‌کنند که باعث صرفه‌جویی در پهنای باند و افزایش امنیت می‌شود.

این رویکرد مبتنی بر هوش مصنوعی چندین مزیت را ارائه می‌دهد. این امر به طور قابل توجهی تأخیر را کاهش می‌دهد زیرا ماهواره‌ها را قادر می‌سازد تا داده‌ها را در فضا پردازش کنند و امکان پاسخ سریع‌تر به شرایط بی‌درنگ را بدون انتظار برای دستورالعمل از ایستگاه‌های زمینی فراهم می‌کند. استفاده از پهنای باند بهینه می‌شود، زیرا فقط مرتبط‌ترین بینش‌ها به جای حجم زیادی از داده‌های خام منتقل می‌شوند. امنیت نیز از طریق ارتباطات رمزگذاری شده بهبود می‌یابد و خطر تهدیدات سایبری و نقض داده‌ها را کاهش می‌دهد. این مزایا به ویژه در کاربردهایی مانند واکنش به بلایا، عملیات نظامی و اکتشافات فضایی ارزشمند هستند.

کاربردهای دنیای واقعی ماهواره‌های مجهز به هوش مصنوعی متنوع و تاثیرگذار هستند:

  • مدیریت بلایا: ماهواره‌های مجهز به هوش مصنوعی می‌توانند آتش‌سوزی‌های جنگلی، سیل‌ها و طوفان‌ها را در زمان واقعی شناسایی کنند و امکان اقدام سریع توسط تیم‌های واکنش اضطراری را فراهم کنند.
  • کشاورزی دقیق: مدل‌های هوش مصنوعی سلامت محصول و شرایط خاک را تجزیه و تحلیل می‌کنند تا شیوه‌های کشاورزی دقیق را بهبود بخشند.
  • نظارت بر محیط زیست: سازمان‌های محیط زیست از داده‌های ماهواره‌ای برای ردیابی سطح آلودگی هوا و آب استفاده می‌کنند.
  • ناوبری خودکار و عملیات فضایی: هوش مصنوعی با پیش‌بینی و واکنش به تهدیدات احتمالی، اجتناب از برخورد را بهبود می‌بخشد و ایمنی ماهواره‌ها را تضمین می‌کند. همچنین هماهنگی صورت‌های فلکی ماهواره‌ای را تسهیل می‌کند و پوشش و کارایی را افزایش می‌دهد. علاوه بر این، هوش مصنوعی نقش مهمی در ردیابی و پیش‌بینی حرکات زباله‌های مداری ایفا می‌کند و خطر آسیب به زیرساخت‌های فضایی را کاهش می‌دهد.
  • دفاع و امنیت: سیستم‌های نظارتی مجهز به هوش مصنوعی فعالیت‌های غیرمجاز و تحرکات نظامی را با دقت بیشتری شناسایی می‌کنند.
  • مخابرات و IoT: ماهواره‌های مبتنی بر هوش مصنوعی به مسیریابی هوشمندتر ترافیک کمک می‌کنند، اتصال اینترنت ماهواره‌ای را بهبود می‌بخشند و ارتباطات جهانی یکپارچه را تضمین می‌کنند.
  • اکتشافات فضایی: هوش مصنوعی کارایی تلسکوپ‌های فضایی را در شناسایی سیارک‌ها و سیارات فراخورشیدی افزایش می‌دهد و به طور قابل توجهی تلاش‌های اکتشاف فضایی را پیش می‌برد.

با وجود مزایای متعدد، چالش‌هایی در توسعه و استقرار ماهواره‌های مجهز به هوش مصنوعی باقی مانده است:

  • توان محاسباتی محدود: ماهواره‌ها باید با تراشه‌های کم‌مصرف و مقاوم در برابر تشعشع کار کنند که قابلیت‌های هوش مصنوعی را محدود می‌کند.
  • محیط خشن فضا: قرار گرفتن در معرض تشعشع خطر خرابی سخت‌افزار را به همراه دارد.
  • تهدیدات امنیتی: آپلود و اجرای کد خارجی در فضا نیاز به مدیریت دقیق برای جلوگیری از حملات سایبری دارد.
  • هزینه و زمان توسعه: ساخت، آزمایش و اعتبارسنجی سخت‌افزار ماهواره‌ای سازگار با هوش مصنوعی فرآیندی پرهزینه و زمان‌بر است.
  • الزامات سازگاری: مدل‌های هوش مصنوعی مستقر در مدار باید بسیار سازگار باشند، با حداقل به‌روزرسانی‌ها کارکنند و به طور مستقل با سناریوهای جدید سازگار شوند.

AI Unlocked: حذف عبارات تکراری در ChatGPT

هوش مصنوعی می‌تواند ابزاری ارزشمند در تولید محتوا باشد و به نوشتن، ایده‌پردازی، بهبود وضوح، اصلاح ساختار و افزایش خوانایی کلی کمک کند. با این حال، یک مشکل رایج در متن تولید شده توسط هوش مصنوعی، تمایل آن به زبان فرمولی به دلیل انتخاب‌های تکراری کلمات است. به جای ارائه پیام‌های تازه و تاثیرگذار، هوش مصنوعی اغلب به الگوهای آشنا متکی است که اثربخشی و اصالت را کاهش می‌دهد.

کلمات و عبارات بیش از حد استفاده شده، مانند “delve,” “tapestry,” “vibrant,” “landscape,” “realm,” “embark,” “excels,” “It’s important to note…,” و “A testament to…,” می‌توانند به طور قابل توجهی از کیفیت محتوای تولید شده توسط هوش مصنوعی بکاهند. برای بازاریابان محصول، این تکرار می‌تواند پیام‌رسانی را کم‌اثرتر کند، تعامل مخاطب را کاهش دهد، تمایز برند را تضعیف کند و از برجسته شدن بینش‌ها و پیام‌رسانی استراتژیک در یک بازار شلوغ جلوگیری کند.

با استفاده از ویژگی حافظه ChatGPT، می‌توان این مشکل را کاهش داد و کلمات و عبارات بیش از حد استفاده شده را حذف کرد. در اینجا نحوه استفاده موثر از این ویژگی آمده است:

دسترسی: ChatGPT از طریق وب سایت یا برنامه تلفن همراه آن قابل دسترسی است.

مزایا:

  • اصالت پیشرفته: تضمین می‌کند که محتوای تولید شده توسط هوش مصنوعی کمتر رباتیک و بیشتر انسانی به نظر برسد.
  • پیام‌رسانی برند بهبود یافته: از عبارت‌پردازی عمومی که تمایز برند را تضعیف می‌کند، جلوگیری می‌کند.
  • افزایش تعامل: با کاهش افزونگی، ارتباط موثرتر را تشویق می‌کند.

مثال: تولید محتوای بازاریابی محصول

یک بازاریاب محصول را در نظر بگیرید که وظیفه تهیه پیش‌نویس محتوا برای عرضه یک محصول جدید را دارد. یک درخواست اولیه به ChatGPT ممکن است منجر به پاسخی پر از عبارات تکراری و عمومی مانند “delving into an intricate landscape of innovation…” شود که باعث می‌شود پیام‌رسانی غیرالهام‌بخش به نظر برسد.

برای ایجاد محتوای جذاب‌تر و منحصر به فرد، بازاریاب می‌تواند این مراحل را دنبال کند:

  1. تنظیم پرامپت: بازاریاب به صراحت به ChatGPT دستور می‌دهد: “Please avoid the following words: delve, tapestry, vibrant, landscape, realm, embark, excels. Commit this to memory.” این به ChatGPT دستور می‌دهد تا به طور فعال این اصطلاحات را در پاسخ‌های خود فیلتر کند.
  2. استفاده از حافظه پایدار: عبارت “Commit this to memory” تضمین می‌کند که ChatGPT این دستورالعمل‌های خاص را در چندین تعامل حفظ می‌کند. این امر امکان اجتناب مداوم از کلمات و عبارات مشخص شده را فراهم می‌کند. ChatGPT قبل از تولید متن، حافظه خود را بررسی می‌کند و از دستورالعمل‌ها برای اجتناب از اصطلاحات تعیین شده پیروی می‌کند.
  3. بررسی دستی: پس از تولید پاسخ، بازاریاب محتوا را برای هرگونه افزونگی باقی‌مانده بررسی می‌کند و زبان را برای وضوح و تاثیرگذاری تنظیم می‌کند.

اثربخشی:

  • سفارشی‌سازی پرامپت: دستورالعمل‌های خاص به شکل‌دهی خروجی هوش مصنوعی کمک می‌کند.
  • حفظ حافظه: ChatGPT می‌تواند قوانین اجتناب از کلمات را در طول مکالمات ذخیره و دنبال کند.
  • اصلاح دستی: ویرایش نهایی انسانی، وضوح و اصالت را تضمین می‌کند.

توجه: ابزارها و تجزیه و تحلیل ارائه شده در این بخش بر اساس آزمایش داخلی است و ارزش روشنی را نشان می‌دهد. توصیه‌ها مستقل هستند و تحت تأثیر سازندگان ابزار قرار نمی‌گیرند.

اخبار و تحولات اضافی هوش مصنوعی

  • افزایش گوشی‌های هوشمند مجهز به هوش مصنوعی: دویچه تلکام در کنگره جهانی موبایل 2025 در بارسلونا برنامه‌های خود را برای راه‌اندازی یک گوشی هوشمند مجهز به هوش مصنوعی با دستیار Perplexity اعلام کرد. این دستیار برای ساده‌سازی کارهای روزمره مانند سفارش تاکسی، رزرو میز، ترجمه زبان‌ها به صورت بی‌درنگ و پاسخ به سوالات کاربر طراحی شده است. این شرکت این را به عنوان یک دستیار مجازی در نظر می‌گیرد که با نوشتن ایمیل، برقراری تماس، خلاصه‌سازی متون و مدیریت تقویم‌ها، از میلیون‌ها مشتری پشتیبانی می‌کند. تلفن هوش مصنوعی Google Cloud AI، ElevenLabs و Picsart را برای افزایش عملکرد خود ادغام می‌کند و قرار است اواخر امسال عرضه شود. Glance، واحد InMobi، و Google Cloud نیز همکاری خود را برای استفاده از مدل‌های هوش مصنوعی Google برای توسعه برنامه‌های کاربردی هوش مصنوعی رو به مصرف‌کننده برای بهبود تجربه کاربر در صفحه‌های قفل گوشی‌های هوشمند و صفحه‌های تلویزیون محیطی اعلام کردند. Glance در حال حاضر بیش از 450 میلیون گوشی هوشمند مبتنی بر Android را در سراسر جهان تامین می‌کند.

  • بخش‌های دولتی شاهد کاهش حوادث سایبری بحرانی هستند: طبق آخرین گزارش تحلیلگر Kaspersky Managed Detection and Response (MDR)، صنایع دولتی و توسعه‌ای در سال 2024 شاهد کاهش قابل توجهی در حوادث با شدت بالا بودند که شامل دخالت مستقیم انسان می‌شد. با این حال، بخش‌های غذا، فناوری اطلاعات، مخابرات و صنعت شاهد افزایش چنین حوادثی بودند.

  • OpenAI قصد دارد Sora را در ChatGPT ادغام کند: OpenAI در حال کار بر روی ادغام ابزار تولید ویدیوی هوش مصنوعی خود، Sora، به طور مستقیم در ChatGPT است. در حال حاضر، Sora فقط از طریق یک برنامه وب اختصاصی در دسترس است و به کاربران امکان می‌دهد کلیپ‌های سینمایی تا 20 ثانیه تولید کنند. OpenAI همچنین در حال توسعه یک تولید کننده تصویر هوش مصنوعی است که توسط Sora پشتیبانی می‌شود.