بحران آزمون تورینگ: آیا هوش مصنوعی معیار را شکست داده؟
مدلهای پیشرفته هوش مصنوعی مانند GPT-4.5 در آزمون تورینگ بهتر از انسانها عمل میکنند و این سوال را ایجاد میکنند که آیا این آزمون هنوز معیار معتبری برای هوش عمومی مصنوعی (AGI) است یا بیشتر محدودیتهای آزمون و سوگیریهای انسانی را آشکار میسازد. این مطالعه بر نیاز به روشهای ارزیابی جدید تاکید میکند.