OpenAI представляет HealthBench для оценки AI в медицине
OpenAI запустила HealthBench, эталонную систему для оценки AI в здравоохранении. HealthBench, разработанная с участием врачей из 60 стран, использует 5000 диалогов и оценочные рубрики.
OpenAI запустила HealthBench, эталонную систему для оценки AI в здравоохранении. HealthBench, разработанная с участием врачей из 60 стран, использует 5000 диалогов и оценочные рубрики.
Сенаторы США призывают запретить DeepSeek и другие AI технологии в федеральных контрактах из-за рисков национальной безопасности, особенно со стороны Китая.
Статья рассказывает об унифицированных платформах чат-ботов, объединяющих разные AI-модели для упрощения поиска и сравнения ответов.
Отчет Check Point показывает, как киберпреступники используют возможности ИИ для увеличения масштабов, эффективности и воздействия своих атак, что требует срочных мер защиты.
Модель Claude от Anthropic пишет 80% своего кода, что ускоряет развитие ИИ и меняет роль инженеров-программистов.
Исследование Carnegie Mellon об ИИ-компании, выявляющее потенциал и ограничения ИИ-агентов в рабочих задачах и будущем труда.
AI21 Labs получила $300 млн от Google и Nvidia на развитие AI решений для бизнеса. Инвестиции пойдут на расширение LLM и инструментов обработки естественного языка.
DeepSeek представила DeepSeek-Prover-V2, LLM для формальных доказательств теорем в Lean 4, использующую DeepSeek-V3 и ProverBench для оценки.
Илон Маск привлекает общественность к улучшению Grok AI, используя краудсорсинг "galaxy brain" задач для обучения.
Раскройте свой творческий потенциал! Создавайте уникальные фоны для Google Meet с помощью Gemini AI. Персонализируйте свои виртуальные встречи с помощью AI.