IA: Sanità Google, xAI e Mistral

I Progressi di Google nell’IA Sanitaria

Google ha recentemente presentato una serie di aggiornamenti relativi all’IA per la salute durante l’evento annuale ‘The Check Up’, dimostrando l’impegno dell’azienda nell’utilizzo dell’Intelligenza Artificiale per diverse applicazioni sanitarie. Questi aggiornamenti spaziano dal miglioramento delle query relative alla salute in Google Search all’introduzione di nuovi modelli IA ‘open’ progettati per aumentare l’efficienza della scoperta di farmaci basata sull’IA.

Google sta implementando l’IA e sofisticati sistemi di qualità e ranking per ampliare l’ambito delle risposte del ‘knowledge panel’ per una vasta gamma di argomenti relativi alla salute. Questa espansione include l’aggiunta del supporto per le query sanitarie in più lingue, come spagnolo, portoghese e giapponese, inizialmente su piattaforme mobili. Mentre Search forniva già risposte del knowledge panel per problemi di salute comuni come l’influenza o il raffreddore comune, questo aggiornamento amplia significativamente la gamma di argomenti che questi pannelli comprendono.

Oltre a ciò, Google introduce una nuova funzionalità in Search chiamata ‘What People Suggest’. Questa funzionalità è progettata per presentare agli utenti informazioni derivate da individui che hanno condiviso esperienze mediche simili. Questa aggiunta offre un canale unico per gli utenti per ottenere approfondimenti. Consente agli utenti di scoprire rapidamente prospettive autentiche di altri con la stessa condizione, complete di link per ulteriori approfondimenti. ‘What People Suggest’ è attualmente accessibile sui dispositivi mobili negli Stati Uniti.

Semplificazione delle Cartelle Cliniche con Nuove API

Google ha anche lanciato a livello globale nuove interfacce di programmazione delle applicazioni (API) per le cartelle cliniche per la sua piattaforma Health Connect, compatibile con i dispositivi Android. Queste API consentono alle applicazioni di leggere e scrivere dati di cartelle cliniche, tra cui allergie, farmaci, vaccinazioni e risultati di laboratorio, il tutto nel formato standardizzato FHIR. Questi miglioramenti portano il supporto di Health Connect a oltre 50 tipi di dati, che comprendono attività, sonno, nutrizione, segni vitali e ora cartelle cliniche. Questa integrazione facilita una connessione senza soluzione di continuità tra i dati sanitari quotidiani degli utenti e le informazioni dei loro fornitori di assistenza sanitaria.

Il Co-Scienziato IA: Un Partner di Ricerca Virtuale

Un’innovazione rivoluzionaria di Google è il ‘co-scienziato IA’, un nuovo sistema basato su Gemini 2.0. Questo sistema è concepito come un ‘collaboratore scientifico virtuale’ per ricercatori e scienziati. Il co-scienziato IA è progettato per assistere i ricercatori nella navigazione di una vasta letteratura scientifica, facilitando così la generazione di nuove ipotesi. Aiutando nell’analisi di vasti set di dati e complessi documenti di ricerca, il co-scienziato IA mira a consentire agli esperti di scoprire nuove idee e accelerare i loro sforzi di ricerca. Google sta collaborando attivamente con istituzioni come l’Imperial College London, l’Houston Methodist e la Stanford University per esplorare le applicazioni pratiche di questo strumento e intende avviare un programma di tester fidati.

TxGemma: Accelerare la Scoperta di Farmaci

Google ha anche introdotto TxGemma, una raccolta di modelli aperti basati su Gemma destinati a migliorare l’efficienza della scoperta di farmaci basata sull’IA. TxGemma possiede la capacità di comprendere sia il testo standard che le strutture di varie entità terapeutiche, tra cui piccole molecole, sostanze chimiche e proteine. Il rilascio di TxGemma è previsto per il prossimo futuro.

Strumento IA Capricorn: Avanzamento dell’Oncologia Pediatrica

In collaborazione con il Princess Maxima Center for Pediatric Oncology nei Paesi Bassi, Google ha sviluppato uno strumento IA chiamato Capricorn. Questo strumento sottolinea la dedizione di Google all’applicazione dell’IA a campi medici specializzati, in particolare nell’oncologia pediatrica.

L’Impatto Più Ampio dell’IA sulla Sanità

Google ha precedentemente evidenziato l’influenza positiva dell’IA sugli esiti sanitari globali. L’azienda ha sviluppato modelli IA per aiutare nella rilevazione di malattie come il cancro al seno, il cancro ai polmoni e la retinopatia diabetica. Nel maggio 2024, Google ha annunciato Med-Gemini, una famiglia di modelli Gemini ottimizzati per applicazioni mediche multimodali. Inoltre, nel giugno 2024, Google ha introdotto il Personal Health Large Language Model per dispositivi mobili e indossabili. Questa versione ottimizzata di Gemini è progettata per interpretare i dati dei sensori e fornire approfondimenti e raccomandazioni personalizzate sui modelli di sonno e fitness di un individuo.

L’Acquisizione di Hotshot da parte di xAI: Un Passo nel Video Generativo con l’IA

L’impresa di IA di Elon Musk, xAI, ha acquisito Hotshot, una startup specializzata in strumenti di generazione video basati sull’IA. Questa acquisizione posiziona xAI per competere con Sora di OpenAI, una piattaforma leader nello spazio video generativo con l’IA. Hotshot ha annunciato sul suo sito web che ha iniziato a eliminare gradualmente la creazione di nuovi video il 14 marzo, con i clienti esistenti che hanno tempo fino al 30 marzo per scaricare i loro video creati.

Grok 3: L’Ambizioso Chatbot IA di xAI

Il 19 febbraio, xAI ha presentato Grok 3, l’ultima iterazione del suo chatbot, che Elon Musk ha proclamato come ‘l’IA più intelligente sulla Terra’. Successivamente, l’azienda ha annunciato il rilascio beta di due modelli di ragionamento, Grok 3 (Think) e Grok 3 Mini (Think). xAI ha dichiarato che Grok 3, addestrato sul loro supercluster Colossus con una potenza di calcolo dieci volte superiore rispetto ai precedenti modelli all’avanguardia, mostra miglioramenti sostanziali nelle attività di ragionamento, matematica, codifica, conoscenza del mondo e comprensione delle istruzioni.

Mistral Small 3.1 di Mistral AI: Compatto e Potente

La startup francese di IA Mistral AI ha introdotto un nuovo modello open-source il 17 marzo, chiamato Mistral Small 3.1. L’azienda afferma che questo modello supera modelli comparabili come Gemma 3 di Google e GPT-4o Mini di OpenAI, intensificando così la concorrenza in un mercato in gran parte dominato dai giganti tecnologici statunitensi.

Mistral Small 3.1 elabora sia testo che immagini con 24 miliardi di parametri, una dimensione significativamente inferiore rispetto ai principali modelli proprietari, eguagliando o superando le loro prestazioni. Mistral AI ha sottolineato che Mistral Small 3.1 è il primo modello open-source a non solo soddisfare ma superare le prestazioni dei principali piccoli modelli proprietari in varie dimensioni.

Basandosi su Mistral Small 3, questo nuovo modello vanta prestazioni di testo migliorate, comprensione multimodale e una finestra di contesto espansa fino a 128.000 token. Mistral AI afferma che il modello elabora le informazioni a una velocità di 150 token al secondo, rendendolo adatto per applicazioni che richiedono tempi di risposta rapidi.

Versatilità e Accessibilità di Mistral Small 3.1

Mistral Small 3.1 è progettato per funzionare su hardware accessibile come una singola RTX 4090 o un Mac con 32 GB di RAM, rendendolo altamente adatto per applicazioni on-device. Il modello può essere ottimizzato per domini specializzati, consentendo la creazione di esperti in materia altamente accurati, particolarmente utili in settori come la consulenza legale, la diagnostica medica e il supporto tecnico.

Il nuovo modello è adattato per un ampio spettro di applicazioni aziendali e consumer che richiedono comprensione multimodale. I potenziali casi d’uso includono la verifica dei documenti, la diagnostica, l’elaborazione delle immagini on-device, le ispezioni visive per il controllo qualità, il rilevamento di oggetti nei sistemi di sicurezza, l’assistenza clienti basata su immagini e l’assistenza generica.

Mistral OCR: Comprensione Avanzata dei Documenti

All’inizio di marzo, Mistral AI ha annunciato Mistral OCR, che l’azienda pubblicizza come ‘la migliore API di comprensione dei documenti al mondo’. Mistral OCR è un’API di Optical Character Recognition (OCR) in grado di estrarre testo, tabelle, equazioni e immagini da documenti complessi. Mistral AI ritiene che questa tecnologia rivoluzionerà il modo in cui le organizzazioni elaborano e utilizzano vasti archivi di informazioni.

Secondo l’azienda, Mistral OCR elabora fino a 2000 pagine al minuto, supporta capacità multilingue e multimodali e fornisce output strutturati come JSON per una perfetta integrazione nei flussi di lavoro IA. I test interni indicano che Mistral OCR è leader di mercato nell’accuratezza dell’estrazione del testo, in particolare per documenti scansionati, contenuti matematici e testo multilingue. A differenza delle soluzioni OCR tradizionali, estrae anche immagini incorporate, rendendolo ideale per la ricerca scientifica, i documenti normativi e la digitalizzazione di documenti storici.

Mistral AI riferisce che l’OCR sta già aiutando le imprese e le istituzioni di ricerca a digitalizzare la letteratura, semplificare il servizio clienti e preservare gli archivi storici. Inoltre, l’OCR sta aiutando le aziende a convertire letteratura tecnica, disegni tecnici, appunti di lezioni, presentazioni, documenti normativi e altro in formati indicizzati e pronti per la risposta. Le funzionalità di Mistral OCR sono disponibili per la prova gratuita su le Chat e l’azienda prevede ulteriori miglioramenti al modello nelle prossime settimane. Questi sviluppi in corso riflettono la natura dinamica dell’IA e il suo potenziale per rimodellare diversi settori.