الذكاء الاصطناعي: ابتكارات Google الصحية واستحواذ xAI

خطوات Google في مجال الذكاء الاصطناعي للرعاية الصحية

كشفت Google مؤخرًا عن مجموعة من تحديثات Health AI في حدث ‘The Check Up’ السنوي، مما يدل على التزام الشركة بالاستفادة من الذكاء الاصطناعي لتطبيقات الرعاية الصحية المتنوعة. تمتد هذه التحديثات من تحسين الاستعلامات المتعلقة بالصحة في Google Search إلى تقديم نماذج ذكاء اصطناعي ‘مفتوحة’ جديدة مصممة لتعزيز كفاءة اكتشاف الأدوية المدعوم بالذكاء الاصطناعي.

تحسين الوصول إلى المعلومات الصحية عبر بحث Google

تقوم Google بنشر أنظمة الذكاء الاصطناعي وأنظمة الجودة والترتيب المتطورة لتوسيع نطاق إجابات ‘لوحة المعرفة’ لمجموعة واسعة من الموضوعات المتعلقة بالصحة. يتضمن هذا التوسع إضافة دعم للاستعلامات المتعلقة بالرعاية الصحية بلغات متعددة، مثل الإسبانية والبرتغالية واليابانية، في البداية على منصات الأجهزة المحمولة. في حين أن البحث قدم بالفعل إجابات لوحة المعرفة للمخاوف الصحية السائدة مثل الأنفلونزا أو نزلات البرد، فإن هذا التحديث يوسع بشكل كبير مجموعة الموضوعات التي تشملها هذه اللوحات.

علاوة على ذلك، تقدم Google ميزة جديدة في البحث تسمى ‘What People Suggest’. تم تصميم هذه الميزة لتقديم معلومات للمستخدمين مستمدة من الأفراد الذين شاركوا تجارب طبية مماثلة. يوفر هذا الإضافة وسيلة فريدة للمستخدمين للحصول على رؤى. فهو يسمح للمستخدمين باكتشاف وجهات نظر حقيقية بسرعة من الآخرين الذين يعانون من نفس الحالة، مع روابط لمزيد من الاستكشاف. ‘What People Suggest’ متاح حاليًا على الأجهزة المحمولة داخل الولايات المتحدة.

تبسيط السجلات الطبية باستخدام واجهات برمجة تطبيقات جديدة

أطلقت Google أيضًا واجهات برمجة تطبيقات (APIs) جديدة للسجلات الطبية على مستوى العالم لمنصة Health Connect الخاصة بها، والمتوافقة مع أجهزة Android. تمكن واجهات برمجة التطبيقات هذه التطبيقات من قراءة وكتابة بيانات السجلات الطبية، بما في ذلك الحساسية والأدوية والتحصينات ونتائج المختبر، وكل ذلك بتنسيق FHIR القياسي. تجلب هذه التحسينات دعم Health Connect لأكثر من 50 نوعًا من البيانات، والتي تشمل النشاط والنوم والتغذية والعلامات الحيوية، والآن السجلات الطبية. يسهل هذا التكامل اتصالاً سلسًا بين بيانات الصحة اليومية للمستخدمين والمعلومات الواردة من مقدمي الرعاية الصحية.

العالم المشارك في الذكاء الاصطناعي: شريك بحث افتراضي

من الابتكارات الرائدة من Google هو ‘AI co-scientist’، وهو نظام جديد مدعوم بـ Gemini 2.0. يُنظر إلى هذا النظام على أنه ‘متعاون علمي افتراضي’ للباحثين والعلماء. تم تصميم AI co-scientist لمساعدة الباحثين في التنقل في الأدبيات العلمية الواسعة، وبالتالي تسهيل توليد فرضيات جديدة. من خلال المساعدة في تحليل مجموعات البيانات الضخمة والأوراق البحثية المعقدة، يهدف AI co-scientist إلى تمكين الخبراء من اكتشاف أفكار جديدة وتسريع مساعيهم البحثية. تتعاون Google بنشاط مع مؤسسات مثل Imperial College London و Houston Methodist و Stanford University لاستكشاف التطبيقات العملية لهذه الأداة وتعتزم بدء برنامج اختبار موثوق به.

TxGemma: تسريع اكتشاف الأدوية

قدمت Google أيضًا TxGemma، وهي مجموعة من النماذج المفتوحة المستندة إلى Gemma والتي تهدف إلى تعزيز كفاءة اكتشاف الأدوية المدفوعة بالذكاء الاصطناعي. يمتلك TxGemma القدرة على فهم كل من النص القياسي وهياكل الكيانات العلاجية المختلفة، بما في ذلك الجزيئات الصغيرة والمواد الكيميائية والبروتينات. من المقرر إصدار TxGemma في المستقبل القريب.

أداة Capricorn AI: تطوير طب الأورام للأطفال

بالتعاون مع مركز Princess Maxima لطب الأورام للأطفال في هولندا، تعمل Google على تطوير أداة ذكاء اصطناعي تسمى Capricorn. تؤكد هذه الأداة على تفاني Google في تطبيق الذكاء الاصطناعي على المجالات الطبية المتخصصة، وخاصة في طب الأورام للأطفال.

التأثير الأوسع للذكاء الاصطناعي على الرعاية الصحية

سلطت Google سابقًا الضوء على التأثير الإيجابي للذكاء الاصطناعي على نتائج الصحة العالمية. طورت الشركة نماذج ذكاء اصطناعي للمساعدة في الكشف عن أمراض مثل سرطان الثدي وسرطان الرئة واعتلال الشبكية السكري. في مايو 2024، أعلنت Google عن Med-Gemini، وهي عائلة من نماذج Gemini مضبوطة بدقة لتطبيقات طبية متعددة الوسائط. علاوة على ذلك، في يونيو 2024، قدمت Google نموذج اللغة الكبيرة للصحة الشخصية للأجهزة المحمولة والأجهزة القابلة للارتداء. تم تصميم هذا الإصدار المضبوط بدقة من Gemini لتفسير بيانات المستشعر وتقديم رؤى وتوصيات مخصصة فيما يتعلق بأنماط نوم الفرد ولياقته البدنية.

استحواذ xAI على Hotshot: خطوة نحو إنشاء فيديو بالذكاء الاصطناعي التوليدي

استحوذت شركة xAI، مشروع الذكاء الاصطناعي التابع لـ Elon Musk، على Hotshot، وهي شركة ناشئة متخصصة في أدوات إنشاء الفيديو المدعومة بالذكاء الاصطناعي. يضع هذا الاستحواذ xAI في منافسة مع Sora من OpenAI، وهي منصة رائدة في مجال إنشاء الفيديو بالذكاء الاصطناعي التوليدي. أعلنت Hotshot على موقعها على الإنترنت أنها بدأت في التخلص التدريجي من إنشاء مقاطع فيديو جديدة في 14 مارس، مع منح العملاء الحاليين حتى 30 مارس لتنزيل مقاطع الفيديو التي أنشأوها.

Grok 3: روبوت الدردشة الطموح للذكاء الاصطناعي من xAI

في 19 فبراير، كشفت xAI عن Grok 3، وهو أحدث إصدار من روبوت الدردشة الخاص بها، والذي أعلن Elon Musk أنه ‘أذكى ذكاء اصطناعي على وجه الأرض’. في وقت لاحق، أعلنت الشركة عن الإصدار التجريبي لنموذجين للاستدلال، Grok 3 (Think) و Grok 3 Mini (Think). ذكرت xAI أن Grok 3، الذي تم تدريبه على مجموعة Colossus العملاقة الخاصة بهم بقوة حسابية تبلغ عشرة أضعاف قوة النماذج الحديثة السابقة، يُظهر تحسينات كبيرة في مهام الاستدلال والرياضيات والترميز والمعرفة العالمية واتباع التعليمات.

Mistral AI’s Mistral Small 3.1: صغير الحجم وقوي

قدمت شركة Mistral AI الفرنسية الناشئة في مجال الذكاء الاصطناعي نموذجًا جديدًا مفتوح المصدر في 17 مارس، أطلق عليه اسم Mistral Small 3.1. تؤكد الشركة أن هذا النموذج يتفوق على نماذج مماثلة مثل Gemma 3 من Google و GPT-4o Mini من OpenAI، مما يزيد من حدة المنافسة في سوق تهيمن عليه شركات التكنولوجيا الأمريكية إلى حد كبير.

يعالج Mistral Small 3.1 كلاً من النصوص والصور باستخدام 24 مليار معلمة - وهو حجم أصغر بكثير مقارنة بالنماذج الاحتكارية الرائدة - مع مطابقة أدائها أو تجاوزه. أكدت Mistral AI أن Mistral Small 3.1 هو أول نموذج مفتوح المصدر لا يلبي فقط أداء النماذج الاحتكارية الصغيرة الرائدة بل يتجاوزها عبر أبعاد مختلفة.

بناءً على Mistral Small 3، يتميز هذا النموذج الجديد بأداء محسّن للنص، وفهم متعدد الوسائط، ونافذة سياق موسعة تصل إلى 128000 رمز. تدعي Mistral AI أن النموذج يعالج المعلومات بسرعات تصل إلى 150 رمزًا في الثانية، مما يجعله مناسبًا للتطبيقات التي تتطلب أوقات استجابة سريعة.

تعدد استخدامات Mistral Small 3.1 وإمكانية الوصول إليه

تم تصميم Mistral Small 3.1 للتشغيل على أجهزة يمكن الوصول إليها مثل RTX 4090 واحد أو جهاز Mac بذاكرة وصول عشوائي (RAM) بسعة 32 جيجابايت، مما يجعله مناسبًا للغاية للتطبيقات على الجهاز. يمكن ضبط النموذج بدقة للمجالات المتخصصة، مما يتيح إنشاء خبراء متخصصين في الموضوع بدقة عالية، وهو مفيد بشكل خاص في مجالات مثل المشورة القانونية والتشخيص الطبي والدعم الفني.

تم تصميم النموذج الجديد لمجموعة واسعة من تطبيقات المؤسسات والمستهلكين التي تتطلب فهمًا متعدد الوسائط. تتضمن حالات الاستخدام المحتملة التحقق من المستندات، والتشخيص، ومعالجة الصور على الجهاز، وعمليات الفحص البصري لمراقبة الجودة، واكتشاف الأشياء في أنظمة الأمان، ودعم العملاء القائم على الصور، والمساعدة للأغراض العامة.

Mistral OCR: فهم متقدم للمستندات

في وقت سابق من شهر مارس، أعلنت Mistral AI عن Mistral OCR، الذي تصفه الشركة بأنه ‘أفضل واجهة برمجة تطبيقات لفهم المستندات في العالم’. Mistral OCR هو واجهة برمجة تطبيقات للتعرف الضوئي على الأحرف (OCR) قادرة على استخراج النصوص والجداول والمعادلات والصور من المستندات المعقدة. تعتقد Mistral AI أن هذه التقنية ستحدث ثورة في كيفية معالجة المؤسسات واستخدامها لمستودعات المعلومات الهائلة.

وفقًا للشركة، يعالج Mistral OCR ما يصل إلى 2000 صفحة في الدقيقة، ويدعم القدرات متعددة اللغات والوسائط المتعددة، ويقدم مخرجات منظمة مثل JSON للتكامل السلس في سير عمل الذكاء الاصطناعي. تشير الاختبارات الداخلية إلى أن Mistral OCR يتصدر السوق في دقة استخراج النص، خاصة بالنسبة للمستندات الممسوحة ضوئيًا والمحتوى الرياضي والنص متعدد اللغات. على عكس حلول OCR التقليدية، فإنه يستخرج أيضًا الصور المضمنة، مما يجعله مثاليًا للبحث العلمي والإيداعات التنظيمية ورقمنة المستندات التاريخية.

تفيد Mistral AI بأن OCR يساعد بالفعل المؤسسات والمؤسسات البحثية في رقمنة الأدبيات وتبسيط خدمة العملاء والحفاظ على الأرشيفات التاريخية. بالإضافة إلى ذلك، يساعد OCR الشركات على تحويل الأدبيات التقنية والرسومات الهندسية وملاحظات المحاضرات والعروض التقديمية والإيداعات التنظيمية والمزيد إلى تنسيقات مفهرسة وجاهزة للإجابة. تتوفر إمكانات Mistral OCR للتجربة المجانية على le Chat، وتتوقع الشركة إجراء مزيد من التحسينات على النموذج في الأسابيع المقبلة. تعكس هذه التطورات المستمرة الطبيعة الديناميكية للذكاء الاصطناعي وإمكاناته لإعادة تشكيل الصناعات المتنوعة.