Преосмисляне на AI бенчмарковете
Традиционните AI бенчмаркове са подложени на все по-голям контрол. Общността търси по-смислени методи за измерване на реалните възможности на AI.
Традиционните AI бенчмаркове са подложени на все по-голям контрол. Общността търси по-смислени методи за измерване на реалните възможности на AI.
Сравнение на AI инструменти за задълбочени изследвания: ChatGPT, Gemini, Perplexity, Grok. Кой AI се справя най-добре със сложни задачи?
Apple проучва AI търсене в Safari на фона на опасения за Google. Обсъжда се OpenAI, Anthropic. Промени в онлайн търсенето са възможни.
Обичаният асистент на Microsoft Office получава модерен AI редизайн, надграждайки функционалността си, за да предлага истинска AI помощ.
Shin Yong-tak обяви успешна тестова система за AGI, включваща емоционално базиран цикъл на самосъзнание, стремяща се да вдъхне на AI човешко емоционално разбиране и етична автономия.
Статията разглежда възхода на ERNIE Bot на Baidu и как Китай се справя със санкциите, за да постигне напредък в областта на изкуствения интелект, демонстрирайки устойчивост и иновации.
Hugging Face представи Open Computer Agent, експеримент за AI, работещ в браузър. Той демонстрира потенциал, но има ограничения и е по-скоро proof-of-concept.
Изпълнителният директор на Instacart, Фиджи Симо, се присъединява към OpenAI като CEO на Applications. Тя ще се фокусира върху развитието на приложенията и разширяването на въздействието на AI.
Li Auto представи MindVLA, голям модел VLA с 2.2 милиарда параметри, който се стреми да превърне автомобилите в интелигентни партньори, способни на естествена комуникация и самостоятелни решения.
Microsoft и Google си партнират за протокола Agent2Agent, насърчавайки оперативна съвместимост и комуникация между AI агенти.