ИИ: Google, xAI и Mistral

Достижения Google в области ИИ для здравоохранения

Компания Google недавно представила ряд обновлений Health AI на своем ежегодном мероприятии ‘The Check Up’, продемонстрировав стремление компании использовать ИИ для различных приложений в области здравоохранения. Эти обновления охватывают широкий спектр: от улучшения запросов, связанных со здоровьем, в Google Search до внедрения новых ‘открытых’ моделей ИИ, предназначенных для повышения эффективности разработки лекарств с помощью ИИ.

Google внедряет ИИ и сложные системы качества и ранжирования, чтобы расширить объем ответов ‘панели знаний’ для широкого круга тем, связанных со здоровьем. Это расширение включает добавление поддержки запросов о здравоохранении на нескольких языках, таких как испанский, португальский и японский, первоначально на мобильных платформах. Хотя Поиск уже предоставлял ответы на панели знаний для распространенных проблем со здоровьем, таких как грипп или простуда, это обновление значительно расширяет спектр тем, которые охватывают эти панели.

Кроме того, Google представляет новую функцию в Поиске под названием ‘What People Suggest’ (‘Что предлагают люди’). Эта функция предназначена для предоставления пользователям информации, полученной от людей, которые поделились аналогичным медицинским опытом. Это дополнение предлагает уникальный способ получения информации для пользователей. Оно позволяет пользователям быстро находить подлинные точки зрения других людей с таким же заболеванием, а также ссылки для дальнейшего изучения. Функция ‘What People Suggest’ в настоящее время доступна на мобильных устройствах в США.

Оптимизация медицинских записей с помощью новых API

Google также запустила во всем мире новые интерфейсы прикладного программирования (API) для медицинских записей для своей платформы Health Connect, совместимые с устройствами Android. Эти API позволяют приложениям как читать, так и записывать данные медицинских записей, включая аллергии, лекарства, прививки и результаты лабораторных исследований, и все это в стандартизированном формате FHIR. Эти усовершенствования обеспечивают поддержку Health Connect более 50 типов данных, охватывающих активность, сон, питание, жизненно важные показатели, а теперь и медицинские записи. Эта интеграция обеспечивает беспрепятственную связь между ежедневными данными о здоровье пользователей и информацией от их поставщиков медицинских услуг.

ИИ-соисследователь: виртуальный партнер по исследованиям

Новаторской инновацией от Google является ‘ИИ-соисследователь’, новая система, основанная на Gemini 2.0. Эта система задумана как ‘виртуальный научный сотрудник’ для исследователей и ученых. ИИ-соисследователь предназначен для помощи исследователям в навигации по обширной научной литературе, тем самым способствуя генерации новых гипотез. Помогая в анализе обширных наборов данных и сложных исследовательских работ, ИИ-соисследователь стремится дать экспертам возможность открывать новые идеи и ускорять свои исследовательские начинания. Google активно сотрудничает с такими учреждениями, как Imperial College London, Houston Methodist и Stanford University, чтобы изучить практическое применение этого инструмента, и намеревается запустить программу доверенных тестировщиков.

TxGemma: ускорение открытия лекарств

Google также представила TxGemma, набор открытых моделей на основе Gemma, предназначенных для повышения эффективности разработки лекарств с помощью ИИ. TxGemma обладает способностью понимать как стандартный текст, так и структуры различных терапевтических объектов, включая малые молекулы, химические вещества и белки. Выпуск TxGemma запланирован на ближайшее будущее.

Инструмент Capricorn AI: развитие детской онкологии

В сотрудничестве с Центром детской онкологии имени принцессы Максимы в Нидерландах Google разрабатывает инструмент ИИ под названием Capricorn. Этот инструмент подчеркивает приверженность Google применению ИИ в специализированных областях медицины, особенно в детской онкологии.

Более широкое влияние ИИ на здравоохранение

Ранее Google подчеркивала положительное влияние ИИ на глобальные показатели здоровья. Компания разработала модели ИИ, помогающие в выявлении таких заболеваний, как рак молочной железы, рак легких и диабетическая ретинопатия. В мае 2024 года Google анонсировала Med-Gemini, семейство моделей Gemini, точно настроенных для мультимодальных медицинских приложений. Кроме того, в июне 2024 года Google представила Personal Health Large Language Model для мобильных и носимых устройств. Эта точно настроенная версия Gemini предназначена для интерпретации данных датчиков и предоставления персонализированных идей и рекомендаций относительно сна и физической активности человека.

##Приобретение xAI компании Hotshot: шаг в генеративное видео с помощью ИИ

Предприятие Илона Маска в области ИИ, xAI, приобрело Hotshot, стартап, специализирующийся на инструментах генерации видео на основе ИИ. Это приобретение позволяет xAI конкурировать с Sora от OpenAI, ведущей платформой в области генеративного видео с помощью ИИ. Hotshot объявила на своем веб-сайте, что начала поэтапный отказ от создания новых видео 14 марта, а существующие клиенты могли загрузить созданные ими видео до 30 марта.

Grok 3: амбициозный ИИ-чатбот xAI

19 февраля xAI представила Grok 3, последнюю версию своего чатбота, которую Илон Маск провозгласил ‘самым умным ИИ на Земле’. Впоследствии компания объявила о бета-выпуске двух моделей рассуждений, Grok 3 (Think) и Grok 3 Mini (Think). xAI заявила, что Grok 3, обученный на их суперкластере Colossus с десятикратной вычислительной мощностью по сравнению с предыдущими самыми современными моделями, демонстрирует существенные улучшения в рассуждениях, математике, кодировании, знании мира и задачах следования инструкциям.

Mistral Small 3.1 от Mistral AI: компактный и мощный

Французский стартап в области ИИ Mistral AI представил 17 марта новую модель с открытым исходным кодом под названием Mistral Small 3.1. Компания утверждает, что эта модель превосходит сопоставимые модели, такие как Gemma 3 от Google и GPT-4o Mini от OpenAI, тем самым усиливая конкуренцию на рынке, где в значительной степени доминируют американские технологические гиганты.

Mistral Small 3.1 обрабатывает как текст, так и изображения с 24 миллиардами параметров – значительно меньший размер по сравнению с ведущими проприетарными моделями – при этом соответствуя или превосходя их производительность. Mistral AI подчеркнула, что Mistral Small 3.1 является первой моделью с открытым исходным кодом, которая не только соответствует, но и превосходит производительность ведущих небольших проприетарных моделей по различным параметрам.

Основываясь на Mistral Small 3, эта новая модель может похвастаться улучшенной производительностью текста, мультимодальным пониманием и расширенным контекстным окном до 128 000 токенов. Mistral AI утверждает, что модель обрабатывает информацию со скоростью 150 токенов в секунду, что делает ее подходящей для приложений, требующих быстрого времени отклика.

Универсальность и доступность Mistral Small 3.1

Mistral Small 3.1 предназначен для работы на оборудовании, доступном как один RTX 4090 или Mac с 32 ГБ ОЗУ, что делает его очень подходящим для приложений на устройствах. Модель можно точно настроить для специализированных областей, что позволяет создавать высокоточных экспертов в предметной области, особенно полезных в таких областях, как юридические консультации, медицинская диагностика и техническая поддержка.

Новая модель предназначена для широкого спектра корпоративных и потребительских приложений, требующих мультимодального понимания. Потенциальные варианты использования включают проверку документов, диагностику, обработку изображений на устройстве, визуальный контроль качества, обнаружение объектов в системах безопасности, поддержку клиентов на основе изображений и помощь общего назначения.

Mistral OCR: расширенное понимание документов

Ранее в марте Mistral AI анонсировала Mistral OCR, который компания рекламирует как ‘Лучший в мире API для понимания документов’. Mistral OCR — это API оптического распознавания символов (OCR), способный извлекать текст, таблицы, уравнения и изображения из сложных документов. Mistral AI считает, что эта технология произведет революцию в том, как организации обрабатывают и используют обширные хранилища информации.

По данным компании, Mistral OCR обрабатывает до 2000 страниц в минуту, поддерживает многоязычные и мультимодальные возможности и предоставляет структурированные выходные данные, такие как JSON, для бесшовной интеграции в рабочие процессы ИИ. Внутренние тесты показывают, что Mistral OCR лидирует на рынке по точности извлечения текста, особенно для отсканированных документов, математического контента и многоязычного текста. В отличие от традиционных решений OCR, он также извлекает встроенные изображения, что делает его идеальным для научных исследований, нормативных документов и оцифровки исторических документов.

Mistral AI сообщает, что OCR уже помогает предприятиям и исследовательским институтам оцифровывать литературу, оптимизировать обслуживание клиентов и сохранять исторические архивы. Кроме того, OCR помогает компаниям конвертировать техническую литературу, инженерные чертежи, конспекты лекций, презентации, нормативные документы и многое другое в индексированные, готовые к ответам форматы. Возможности Mistral OCR доступны для бесплатной пробной версии на le Chat, и компания ожидает дальнейших улучшений модели в ближайшие недели. Эти постоянные разработки отражают динамичный характер ИИ и его потенциал для изменения различных отраслей.