هوش مصنوعی: گوگل، xAI و میسترال

پیشرفت‌های گوگل در هوش مصنوعی سلامت

گوگل اخیراً مجموعه‌ای از به‌روزرسانی‌های Health AI را در رویداد سالانه ‘The Check Up’ خود رونمایی کرد که نشان‌دهنده تعهد این شرکت به استفاده از هوش مصنوعی برای کاربردهای مختلف مراقبت‌های بهداشتی است. این به‌روزرسانی‌ها شامل بهبود جستجوهای مرتبط با سلامت در Google Search تا معرفی مدل‌های هوش مصنوعی ‘باز’ جدید طراحی شده برای افزایش کارایی کشف دارو با هوش مصنوعی می‌شود.

گوگل در حال به‌کارگیری هوش مصنوعی و سیستم‌های پیچیده کیفیت و رتبه‌بندی برای گسترش دامنه پاسخ‌های ‘پنل دانش’ برای طیف گسترده‌ای از موضوعات مرتبط با سلامت است. این گسترش شامل افزودن پشتیبانی برای جستجوهای مراقبت‌های بهداشتی به چندین زبان، مانند اسپانیایی، پرتغالی و ژاپنی، در ابتدا در پلتفرم‌های تلفن همراه است. در حالی که Search قبلاً پاسخ‌های پنل دانش را برای نگرانی‌های رایج سلامتی مانند آنفولانزا یا سرماخوردگی ارائه می‌کرد، این به‌روزرسانی به طور قابل توجهی آرایه موضوعاتی را که این پنل‌ها در بر می‌گیرند، بزرگ‌تر می‌کند.

علاوه بر این، گوگل یک ویژگی جدید را در Search به نام ‘What People Suggest’ معرفی می‌کند. این ویژگی برای ارائه اطلاعات به کاربران برگرفته از افرادی که تجربیات پزشکی مشابهی را به اشتراک گذاشته‌اند، طراحی شده است. این افزونه یک راه منحصر به فرد برای کاربران برای به دست آوردن بینش ارائه می‌دهد. این به کاربران اجازه می‌دهد تا به سرعت دیدگاه‌های معتبر دیگران را با همان شرایط، همراه با پیوندهایی برای کاوش بیشتر، کشف کنند. ‘What People Suggest’ در حال حاضر در دستگاه‌های تلفن همراه در ایالات متحده در دسترس است.

ساده‌سازی سوابق پزشکی با APIهای جدید

گوگل همچنین APIهای جدید برنامه‌نویسی کاربردی سوابق پزشکی (API) را برای پلتفرم Health Connect خود، سازگار با دستگاه‌های Android، در سطح جهانی راه‌اندازی کرده است. این APIها به برنامه‌ها امکان می‌دهند تا داده‌های سوابق پزشکی، شامل آلرژی‌ها، داروها، ایمن‌سازی‌ها و نتایج آزمایشگاهی را بخوانند و بنویسند، همگی در قالب استاندارد FHIR. این پیشرفت‌ها پشتیبانی Health Connect را به بیش از 50 نوع داده، شامل فعالیت، خواب، تغذیه، علائم حیاتی و اکنون سوابق پزشکی، می‌رساند. این ادغام، ارتباط یکپارچه‌ای را بین داده‌های سلامت روزانه کاربران و اطلاعات ارائه‌دهندگان مراقبت‌های بهداشتی آنها تسهیل می‌کند.

همکار علمی هوش مصنوعی: یک شریک تحقیقاتی مجازی

یک نوآوری پیشگامانه از گوگل، ‘همکار علمی هوش مصنوعی’ است، یک سیستم جدید که توسط Gemini 2.0 پشتیبانی می‌شود. این سیستم به عنوان یک ‘همکار علمی مجازی’ برای محققان و دانشمندان در نظر گرفته شده است. همکار علمی هوش مصنوعی برای کمک به محققان در جهت‌یابی در ادبیات علمی گسترده طراحی شده است و در نتیجه تولید فرضیه‌های جدید را تسهیل می‌کند. همکار علمی هوش مصنوعی با کمک به تجزیه و تحلیل مجموعه داده‌های وسیع و مقالات تحقیقاتی پیچیده، قصد دارد به متخصصان در کشف ایده‌های جدید و تسریع تلاش‌های تحقیقاتی خود قدرت بخشد. گوگل فعالانه با موسساتی مانند Imperial College London، Houston Methodist و Stanford University برای کشف کاربردهای عملی این ابزار همکاری می‌کند و قصد دارد یک برنامه آزمایشی معتبر را آغاز کند.

TxGemma: تسریع کشف دارو

گوگل همچنین TxGemma را معرفی کرد، مجموعه‌ای از مدل‌های باز مبتنی بر Gemma که برای افزایش کارایی کشف دارو با هوش مصنوعی در نظر گرفته شده است. TxGemma توانایی درک متن استاندارد و ساختارهای موجودیت‌های درمانی مختلف، از جمله مولکول‌های کوچک، مواد شیمیایی و پروتئین‌ها را دارد. انتشار TxGemma برای آینده نزدیک برنامه ریزی شده است.

ابزار هوش مصنوعی Capricorn: پیشرفت در سرطان‌شناسی کودکان

گوگل با همکاری مرکز Princess Maxima برای سرطان‌شناسی کودکان در هلند، در حال توسعه یک ابزار هوش مصنوعی به نام Capricorn بوده است. این ابزار بر تعهد گوگل به استفاده از هوش مصنوعی در زمینه‌های تخصصی پزشکی، به ویژه در سرطان‌شناسی کودکان، تأکید می‌کند.

تأثیر گسترده‌تر هوش مصنوعی بر مراقبت‌های بهداشتی

گوگل پیش از این تأثیر مثبت هوش مصنوعی بر نتایج سلامت جهانی را برجسته کرده است. این شرکت مدل‌های هوش مصنوعی را برای کمک به تشخیص بیماری‌هایی مانند سرطان سینه، سرطان ریه و رتینوپاتی دیابتی توسعه داده است. در ماه مه 2024، گوگل Med-Gemini را معرفی کرد، خانواده‌ای از مدل‌های Gemini که برای کاربردهای چندوجهی پزشکی تنظیم دقیق شده‌اند. علاوه بر این، در ژوئن 2024، گوگل مدل زبان بزرگ سلامت شخصی را برای دستگاه‌های تلفن همراه و پوشیدنی معرفی کرد. این نسخه تنظیم دقیق شده Gemini برای تفسیر داده‌های حسگر و ارائه بینش‌ها و توصیه‌های شخصی‌سازی شده در مورد الگوهای خواب و تناسب اندام فرد طراحی شده است.

خرید Hotshot توسط xAI: حرکتی به سوی ویدیوی هوش مصنوعی مولد

شرکت هوش مصنوعی ایلان ماسک، xAI، Hotshot را خریداری کرده است، استارتاپی که در ابزارهای تولید ویدیو با هوش مصنوعی تخصص دارد. این خرید، xAI را در موقعیتی قرار می‌دهد که با Soraی OpenAI، پلتفرم پیشرو در فضای ویدیوی هوش مصنوعی مولد، رقابت کند. Hotshot در وب‌سایت خود اعلام کرد که از 14 مارس شروع به حذف تدریجی ایجاد ویدیوی جدید کرده است و مشتریان فعلی تا 30 مارس فرصت دارند ویدیوهای ایجاد شده خود را دانلود کنند.

Grok 3: ربات چت هوش مصنوعی جاه‌طلبانه xAI

در 19 فوریه، xAI از Grok 3 رونمایی کرد، آخرین نسخه از ربات چت خود، که ایلان ماسک آن را ‘هوشمندترین هوش مصنوعی روی زمین’ اعلام کرد. متعاقباً، این شرکت انتشار بتا دو مدل استدلال، Grok 3 (Think) و Grok 3 Mini (Think) را اعلام کرد. xAI اظهار داشت که Grok 3، که بر روی ابررایانه Colossus آنها با ده برابر قدرت محاسباتی مدل‌های پیشرفته قبلی آموزش دیده است، پیشرفت‌های قابل توجهی در استدلال، ریاضیات، کدنویسی، دانش جهانی و وظایف پیروی از دستورالعمل نشان می‌دهد.

Mistral Small 3.1 از Mistral AI: جمع و جور و قدرتمند

استارتاپ هوش مصنوعی فرانسوی Mistral AI یک مدل متن‌باز جدید را در 17 مارس معرفی کرد، به نام Mistral Small 3.1. این شرکت ادعا می‌کند که این مدل از مدل‌های مشابهی مانند Gemma 3 گوگل و GPT-4o Miniی OpenAI پیشی می‌گیرد، بنابراین رقابت را در بازاری که عمدتاً تحت سلطه غول‌های فناوری ایالات متحده است، تشدید می‌کند.

Mistral Small 3.1 هم متن و هم تصاویر را با 24 میلیارد پارامتر پردازش می‌کند – اندازه به طور قابل توجهی کوچکتر در مقایسه با مدل‌های اختصاصی پیشرو – در حالی که با عملکرد آنها مطابقت دارد یا از آن فراتر می‌رود. Mistral AI تاکید کرد که Mistral Small 3.1 اولین مدل متن‌بازی است که نه تنها با عملکرد مدل‌های اختصاصی کوچک پیشرو در ابعاد مختلف مطابقت دارد، بلکه از آن فراتر می‌رود.

این مدل جدید که بر اساس Mistral Small 3 ساخته شده است، دارای عملکرد متنی بهبود یافته، درک چندوجهی و یک پنجره زمینه گسترده تا 128000 توکن است. Mistral AI ادعا می‌کند که این مدل اطلاعات را با سرعت 150 توکن در ثانیه پردازش می‌کند و آن را برای برنامه‌هایی که به زمان پاسخ سریع نیاز دارند مناسب می‌کند.

تطبیق‌پذیری و دسترسی Mistral Small 3.1

Mistral Small 3.1 برای اجرا بر روی سخت‌افزاری به اندازه یک RTX 4090 یا یک Mac با 32 گیگابایت رم طراحی شده است و آن را برای برنامه‌های کاربردی روی دستگاه بسیار مناسب می‌کند. این مدل را می‌توان برای حوزه‌های تخصصی تنظیم دقیق کرد و امکان ایجاد متخصصان موضوعی بسیار دقیق را فراهم می‌کند، به ویژه در زمینه‌هایی مانند مشاوره حقوقی، تشخیص پزشکی و پشتیبانی فنی مفید است.

مدل جدید برای طیف گسترده‌ای از برنامه‌های سازمانی و مصرف‌کننده که نیاز به درک چندوجهی دارند، طراحی شده است. موارد استفاده بالقوه شامل تأیید اسناد، تشخیص، پردازش تصویر روی دستگاه، بازرسی بصری برای کنترل کیفیت، تشخیص اشیا در سیستم‌های امنیتی، پشتیبانی مشتری مبتنی بر تصویر و کمک‌های عمومی است.

Mistral OCR: درک پیشرفته اسناد

در اوایل ماه مارس، Mistral AI از Mistral OCR رونمایی کرد، که این شرکت آن را ‘بهترین API درک اسناد جهان’ می‌نامد. Mistral OCR یک API تشخیص کاراکتر نوری (OCR) است که قادر به استخراج متن، جداول، معادلات و تصاویر از اسناد پیچیده است. Mistral AI معتقد است که این فناوری نحوه پردازش و استفاده سازمان‌ها از مخازن اطلاعات وسیع را متحول خواهد کرد.

به گفته این شرکت، Mistral OCR تا 2000 صفحه در دقیقه را پردازش می‌کند، از قابلیت‌های چند زبانه و چندوجهی پشتیبانی می‌کند و خروجی‌های ساختاریافته‌ای مانند JSON را برای ادغام یکپارچه در جریان‌های کاری هوش مصنوعی ارائه می‌دهد. آزمایش‌های داخلی نشان می‌دهد که Mistral OCR در دقت استخراج متن، به ویژه برای اسناد اسکن شده، محتوای ریاضی و متن چند زبانه، پیشتاز بازار است. برخلاف راه‌حل‌های OCR سنتی، تصاویر جاسازی شده را نیز استخراج می‌کند و آن را برای تحقیقات علمی، پرونده‌های نظارتی و دیجیتالی‌سازی اسناد تاریخی ایده‌آل می‌کند.

Mistral AI گزارش می‌دهد که OCR در حال حاضر به شرکت‌ها و موسسات تحقیقاتی در دیجیتالی کردن ادبیات، ساده‌سازی خدمات مشتری و حفظ آرشیوهای تاریخی کمک می‌کند. علاوه بر این، OCR به شرکت‌ها کمک می‌کند تا ادبیات فنی، نقشه‌های مهندسی، یادداشت‌های سخنرانی، ارائه‌ها، پرونده‌های نظارتی و موارد دیگر را به فرمت‌های فهرست‌بندی شده و آماده پاسخ تبدیل کنند. قابلیت‌های Mistral OCR برای آزمایش رایگان در le Chat در دسترس است و این شرکت پیش‌بینی می‌کند که در هفته‌های آینده پیشرفت‌های بیشتری در این مدل ایجاد شود. این پیشرفت‌های مداوم، ماهیت پویای هوش مصنوعی و پتانسیل آن برای تغییر شکل صنایع مختلف را منعکس می‌کند.