KI: Googles Gesundheits-KI, xAI, Mistral

Googles Fortschritte in der Gesundheits-KI

Google hat kürzlich auf seiner jährlichen Veranstaltung ‘The Check Up’ eine Reihe von Updates für Health AI vorgestellt, die das Engagement des Unternehmens für die Nutzung von KI für verschiedene Anwendungen im Gesundheitswesen unterstreichen. Diese Updates reichen von der Verbesserung gesundheitsbezogener Suchanfragen in der Google-Suche bis hin zur Einführung neuer ‘offener’ KI-Modelle, die die Effizienz der KI-gestützten Arzneimittelforschung steigern sollen.

Verbesserung des Zugangs zu Gesundheitsinformationen über die Google-Suche

Google setzt KI und ausgefeilte Qualitäts- und Rankingsysteme ein, um den Umfang der Antworten in den ‘Knowledge Panels’ für eine breite Palette von Gesundheitsthemen zu erweitern. Diese Erweiterung umfasst die Unterstützung von Gesundheitsanfragen in mehreren Sprachen, wie Spanisch, Portugiesisch und Japanisch, zunächst auf mobilen Plattformen. Während die Suche bereits Antworten in den Knowledge Panels für häufige Gesundheitsprobleme wie Grippe oder Erkältung lieferte, erweitert dieses Update die Bandbreite der Themen, die diese Panels abdecken, erheblich.

Darüber hinaus führt Google eine neue Funktion in der Suche namens ‘What People Suggest’ ein. Diese Funktion soll Nutzern Informationen von Personen präsentieren, die ähnliche medizinische Erfahrungen gemacht haben. Diese Ergänzung bietet Nutzern eine einzigartige Möglichkeit, Einblicke zu gewinnen. Sie ermöglicht es Nutzern, schnell authentische Perspektiven von anderen mit der gleichen Erkrankung zu entdecken, komplett mit Links zur weiteren Recherche. ‘What People Suggest’ ist derzeit auf mobilen Geräten in den Vereinigten Staaten verfügbar.

Optimierung von Krankenakten mit neuen APIs

Google hat außerdem weltweit neue APIs (Application Programming Interfaces) für medizinische Unterlagen für seine Health Connect-Plattform eingeführt, die mit Android-Geräten kompatibel sind. Diese APIs ermöglichen es Anwendungen, Daten aus Krankenakten zu lesen und zu schreiben, einschließlich Allergien, Medikamenten, Impfungen und Laborergebnissen, und zwar im standardisierten FHIR-Format. Diese Erweiterungen bringen die Unterstützung von Health Connect auf über 50 Datentypen, die Aktivität, Schlaf, Ernährung, Vitalparameter und jetzt auch Krankenakten umfassen. Diese Integration ermöglicht eine nahtlose Verbindung zwischen den täglichen Gesundheitsdaten der Nutzer und den Informationen ihrer Gesundheitsdienstleister.

Der KI-Co-Wissenschaftler: Ein virtueller Forschungspartner

Eine bahnbrechende Innovation von Google ist der ‘KI-Co-Wissenschaftler’, ein neuartiges System, das auf Gemini 2.0 basiert. Dieses System ist als ‘virtueller wissenschaftlicher Mitarbeiter’ für Forscher und Wissenschaftler konzipiert. Der KI-Co-Wissenschaftler soll Forschern helfen, sich in der umfangreichen wissenschaftlichen Literatur zurechtzufinden und so die Generierung neuer Hypothesen zu erleichtern. Durch die Unterstützung bei der Analyse großer Datenmengen und komplexer Forschungsarbeiten soll der KI-Co-Wissenschaftler Experten in die Lage versetzen, neue Ideen zu entdecken und ihre Forschungsbemühungen zu beschleunigen. Google arbeitet aktiv mit Institutionen wie dem Imperial College London, Houston Methodist und der Stanford University zusammen, um die praktischen Anwendungen dieses Tools zu erforschen, und beabsichtigt, ein Trusted-Tester-Programm zu starten.

TxGemma: Beschleunigung der Arzneimittelentwicklung

Google stellte außerdem TxGemma vor, eine Sammlung von Gemma-basierten offenen Modellen, die die Effizienz der KI-gesteuerten Arzneimittelentwicklung verbessern sollen. TxGemma ist in der Lage, sowohl Standardtext als auch die Strukturen verschiedener therapeutischer Einheiten, einschließlich kleiner Moleküle, Chemikalien und Proteine, zu verstehen. Die Veröffentlichung von TxGemma ist für die nahe Zukunft geplant.

Capricorn AI Tool: Fortschritte in der pädiatrischen Onkologie

In Zusammenarbeit mit dem Princess Maxima Center for Pediatric Oncology in den Niederlanden hat Google ein KI-Tool namens Capricorn entwickelt. Dieses Tool unterstreicht Googles Engagement für die Anwendung von KI in spezialisierten medizinischen Bereichen, insbesondere in der pädiatrischen Onkologie.

Der breitere Einfluss von KI auf das Gesundheitswesen

Google hat bereits früher den positiven Einfluss von KI auf die globale Gesundheit hervorgehoben. Das Unternehmen hat KI-Modelle entwickelt, die bei der Erkennung von Krankheiten wie Brustkrebs, Lungenkrebs und diabetischer Retinopathie helfen. Im Mai 2024 kündigte Google Med-Gemini an, eine Familie von Gemini-Modellen, die für multimodale medizinische Anwendungen optimiert wurden. Im Juni 2024 stellte Google das Personal Health Large Language Model für mobile und tragbare Geräte vor. Diese optimierte Version von Gemini wurde entwickelt, um Sensordaten zu interpretieren und personalisierte Einblicke und Empfehlungen zu Schlaf- und Fitnessmustern einer Person zu geben.

xAI’s Akquisition von Hotshot: Ein Schritt in Richtung generativer Video-KI

Elon Musks KI-Unternehmen, xAI, hat Hotshot übernommen, ein Startup, das sich auf KI-gestützte Videogenerierungstools spezialisiert hat. Diese Akquisition positioniert xAI im Wettbewerb mit OpenAI’s Sora, einer führenden Plattform im Bereich der generativen Video-KI. Hotshot gab auf seiner Website bekannt, dass es am 14. März mit der Ausphasung der Erstellung neuer Videos begonnen hat und bestehende Kunden bis zum 30. März Zeit haben, ihre erstellten Videos herunterzuladen.

Grok 3: xAI’s ambitionierter KI-Chatbot

Am 19. Februar stellte xAI Grok 3 vor, die neueste Version seines Chatbots, den Elon Musk als ‘die intelligenteste KI der Welt’ bezeichnete. Anschließend kündigte das Unternehmen die Beta-Version von zwei Reasoning-Modellen an, Grok 3 (Think) und Grok 3 Mini (Think). xAI gab an, dass Grok 3, das auf ihrem Colossus-Supercluster mit der zehnfachen Rechenleistung früherer State-of-the-Art-Modelle trainiert wurde, erhebliche Verbesserungen in den Bereichen Reasoning, Mathematik, Programmierung, Weltwissen und Aufgaben zur Befolgung von Anweisungen aufweist.

Mistral AI’s Mistral Small 3.1: Kompakt und leistungsstark

Das französische KI-Startup Mistral AI stellte am 17. März ein neues Open-Source-Modell namens Mistral Small 3.1 vor. Das Unternehmen behauptet, dass dieses Modell vergleichbare Modelle wie Googles Gemma 3 und OpenAI’s GPT-4o Mini übertrifft und damit den Wettbewerb in einem Markt verschärft, der weitgehend von US-amerikanischen Technologiegiganten dominiert wird.

Mistral Small 3.1 verarbeitet sowohl Text als auch Bilder mit 24 Milliarden Parametern – eine deutlich geringere Größe im Vergleich zu führenden proprietären Modellen – und erreicht oder übertrifft dabei deren Leistung. Mistral AI betonte, dass Mistral Small 3.1 das erste Open-Source-Modell ist, das die Leistung führender kleiner proprietärer Modelle in verschiedenen Dimensionen nicht nur erreicht, sondern übertrifft.

Aufbauend auf Mistral Small 3 bietet dieses neue Modell eine verbesserte Textleistung, multimodales Verständnis und ein erweitertes Kontextfenster von bis zu 128.000 Token. Mistral AI behauptet, dass das Modell Informationen mit einer Geschwindigkeit von 150 Token pro Sekunde verarbeitet, was es für Anwendungen geeignet macht, die schnelle Reaktionszeiten erfordern.

Vielseitigkeit und Zugänglichkeit von Mistral Small 3.1

Mistral Small 3.1 ist so konzipiert, dass es auf Hardware läuft, die so zugänglich ist wie eine einzelne RTX 4090 oder ein Mac mit 32 GB RAM, was es sehr geeignet für Anwendungen auf Geräten macht. Das Modell kann für spezielle Bereiche feinabgestimmt werden, was die Erstellung hochpräziser Fachexperten ermöglicht, was besonders in Bereichen wie Rechtsberatung, medizinische Diagnostik und technischer Support nützlich ist.

Das neue Modell ist auf ein breites Spektrum von Unternehmens- und Verbraucheranwendungen zugeschnitten, die multimodales Verständnis erfordern. Mögliche Anwendungsfälle sind Dokumentenprüfung, Diagnostik, Bildverarbeitung auf Geräten, visuelle Inspektionen zur Qualitätskontrolle, Objekterkennung in Sicherheitssystemen, bildbasierter Kundensupport und allgemeine Unterstützung.

Mistral OCR: Fortschrittliches Dokumentenverständnis

Anfang März kündigte Mistral AI Mistral OCR an, das das Unternehmen als die ‘weltweit beste API für Dokumentenverständnis’ anpreist. Mistral OCR ist eine Optical Character Recognition (OCR) API, die in der Lage ist, Text, Tabellen, Gleichungen und Bilder aus komplexen Dokumenten zu extrahieren. Mistral AI ist davon überzeugt, dass diese Technologie die Art und Weise, wie Unternehmen riesige Informationsbestände verarbeiten und nutzen, revolutionieren wird.

Nach Angaben des Unternehmens verarbeitet Mistral OCR bis zu 2000 Seiten pro Minute, unterstützt mehrsprachige und multimodale Funktionen und liefert strukturierte Ausgaben wie JSON für eine nahtlose Integration in KI-Workflows. Interne Tests zeigen, dass Mistral OCR bei der Genauigkeit der Textextraktion führend ist, insbesondere bei gescannten Dokumenten, mathematischen Inhalten und mehrsprachigem Text. Im Gegensatz zu herkömmlichen OCR-Lösungen extrahiert es auch eingebettete Bilder, was es ideal für wissenschaftliche Forschung, behördliche Einreichungen und die Digitalisierung historischer Dokumente macht.

Mistral AI berichtet, dass OCR bereits Unternehmen und Forschungseinrichtungen bei der Digitalisierung von Literatur, der Optimierung des Kundendienstes und der Erhaltung historischer Archive unterstützt. Darüber hinaus hilft OCR Unternehmen, technische Literatur, technische Zeichnungen, Vorlesungsnotizen, Präsentationen, behördliche Einreichungen und mehr in indizierte, antwortbereite Formate zu konvertieren. Die Funktionen von Mistral OCR stehen für einen kostenlosen Test auf le Chat zur Verfügung, und das Unternehmen erwartet in den kommenden Wochen weitere Verbesserungen des Modells. Diese laufenden Entwicklungen spiegeln die dynamische Natur der KI und ihr Potenzial wider, verschiedene Branchen neu zu gestalten.