Kemajuan Google dalam AI Kesehatan
Google baru-baru ini meluncurkan serangkaian pembaruan Health AI di acara tahunan ‘The Check Up’, yang menunjukkan komitmen perusahaan untuk memanfaatkan AI untuk berbagai aplikasi perawatan kesehatan. Pembaruan ini mencakup peningkatan kueri terkait kesehatan di Google Search hingga memperkenalkan model AI ‘terbuka’ baru yang dirancang untuk meningkatkan efisiensi penemuan obat yang didukung AI.
Meningkatkan Akses Informasi Kesehatan melalui Google Search
Google menggunakan AI dan sistem kualitas serta peringkat yang canggih untuk memperluas cakupan jawaban ‘panel pengetahuan’ untuk berbagai topik terkait kesehatan. Ekspansi ini mencakup penambahan dukungan untuk kueri perawatan kesehatan dalam berbagai bahasa, seperti Spanyol, Portugis, dan Jepang, yang awalnya pada platform seluler. Sementara Search sudah memberikan jawaban panel pengetahuan untuk masalah kesehatan umum seperti influenza atau flu biasa, pembaruan ini secara signifikan memperbesar jangkauan topik yang dicakup oleh panel ini.
Selain itu, Google memperkenalkan fitur baru di Search yang disebut ‘What People Suggest’. Fitur ini dirancang untuk menyajikan informasi kepada pengguna yang berasal dari individu yang telah berbagi pengalaman medis serupa. Penambahan ini menawarkan jalan unik bagi pengguna untuk mendapatkan wawasan. Ini memungkinkan pengguna untuk dengan cepat menemukan perspektif otentik dari orang lain dengan kondisi yang sama, lengkap dengan tautan untuk eksplorasi lebih lanjut. ‘What People Suggest’ saat ini dapat diakses di perangkat seluler di Amerika Serikat.
Menyederhanakan Rekam Medis dengan API Baru
Google juga telah meluncurkan application programming interfaces (API) rekam medis baru secara global untuk platform Health Connect-nya, yang kompatibel dengan perangkat Android. API ini memberdayakan aplikasi untuk membaca dan menulis data rekam medis, yang mencakup alergi, obat-obatan, imunisasi, dan hasil lab, semuanya dalam format FHIR standar. Peningkatan ini membawa dukungan Health Connect ke lebih dari 50 jenis data, yang mencakup aktivitas, tidur, nutrisi, tanda-tanda vital, dan sekarang rekam medis. Integrasi ini memfasilitasi koneksi yang mulus antara data kesehatan harian pengguna dan informasi dari penyedia layanan kesehatan mereka.
AI Co-Scientist: Mitra Penelitian Virtual
Inovasi inovatif dari Google adalah ‘AI co-scientist’, sistem baru yang didukung oleh Gemini 2.0. Sistem ini dibayangkan sebagai ‘kolaborator ilmiah virtual’ untuk para peneliti dan ilmuwan. AI co-scientist dirancang untuk membantu peneliti dalam menavigasi literatur ilmiah yang luas, sehingga memfasilitasi generasi hipotesis baru. Dengan membantu dalam analisis kumpulan data yang luas dan makalah penelitian yang kompleks, AI co-scientist bertujuan untuk memberdayakan para ahli untuk mengungkap ide-ide baru dan mempercepat upaya penelitian mereka. Google secara aktif berkolaborasi dengan institusi seperti Imperial College London, Houston Methodist, dan Stanford University untuk mengeksplorasi aplikasi praktis dari alat ini dan bermaksud untuk memulai program penguji tepercaya.
TxGemma: Mempercepat Penemuan Obat
Google juga memperkenalkan TxGemma, kompilasi model terbuka berbasis Gemma yang dimaksudkan untuk meningkatkan efisiensi penemuan obat yang digerakkan oleh AI. TxGemma memiliki kemampuan untuk memahami teks standar dan struktur berbagai entitas terapeutik, termasuk molekul kecil, bahan kimia, dan protein. Rilis TxGemma dijadwalkan untuk waktu dekat.
Alat AI Capricorn: Memajukan Onkologi Anak
Bekerja sama dengan Princess Maxima Center for Pediatric Oncology di Belanda, Google telah mengembangkan alat AI bernama Capricorn. Alat ini menggarisbawahi dedikasi Google untuk menerapkan AI ke bidang medis khusus, khususnya dalam onkologi anak.
Dampak AI yang Lebih Luas pada Perawatan Kesehatan
Google sebelumnya telah menyoroti pengaruh positif AI pada hasil kesehatan global. Perusahaan telah mengembangkan model AI untuk membantu dalam deteksi penyakit seperti kanker payudara, kanker paru-paru, dan retinopati diabetik. Pada Mei 2024, Google mengumumkan Med-Gemini, keluarga model Gemini yang disetel dengan baik untuk aplikasi medis multimodal. Lebih lanjut, pada Juni 2024, Google memperkenalkan Personal Health Large Language Model untuk perangkat seluler dan wearable. Versi Gemini yang disetel dengan baik ini dirancang untuk menafsirkan data sensor dan memberikan wawasan dan rekomendasi yang dipersonalisasi mengenai pola tidur dan kebugaran seseorang.
Akuisisi Hotshot oleh xAI: Langkah ke Video AI Generatif
Usaha AI Elon Musk, xAI, telah mengakuisisi Hotshot, sebuah startup yang berspesialisasi dalam alat pembuatan video yang didukung AI. Akuisisi ini memposisikan xAI untuk bersaing dengan OpenAI’s Sora, platform terkemuka di ruang video AI generatif. Hotshot mengumumkan di situs webnya bahwa mereka mulai menghentikan pembuatan video baru pada 14 Maret, dengan pelanggan yang ada memiliki waktu hingga 30 Maret untuk mengunduh video yang mereka buat.
Grok 3: Chatbot AI Ambisius xAI
Pada 19 Februari, xAI meluncurkan Grok 3, iterasi terbaru dari chatbot-nya, yang diproklamasikan oleh Elon Musk sebagai ‘AI terpintar di Bumi’. Selanjutnya, perusahaan mengumumkan rilis beta dari dua model penalaran, Grok 3 (Think) dan Grok 3 Mini (Think). xAI menyatakan bahwa Grok 3, yang dilatih pada supercluster Colossus mereka dengan sepuluh kali kekuatan komputasi dari model state-of-the-art sebelumnya, menunjukkan peningkatan substansial dalam penalaran, matematika, pengkodean, pengetahuan dunia, dan tugas-tugas mengikuti instruksi.
Mistral Small 3.1 dari Mistral AI: Ringkas dan Bertenaga
Startup AI Prancis, Mistral AI, memperkenalkan model open-source baru pada 17 Maret, bernama Mistral Small 3.1. Perusahaan menegaskan bahwa model ini melampaui model sebanding seperti Gemma 3 dari Google dan GPT-4o Mini dari OpenAI, sehingga mengintensifkan persaingan di pasar yang sebagian besar didominasi oleh raksasa teknologi AS.
Mistral Small 3.1 memproses teks dan gambar dengan 24 miliar parameter – ukuran yang jauh lebih kecil dibandingkan dengan model proprietary terkemuka – sambil menyamai atau melampaui kinerja mereka. Mistral AI menekankan bahwa Mistral Small 3.1 adalah model open-source pertama yang tidak hanya memenuhi tetapi melampaui kinerja model proprietary kecil terkemuka di berbagai dimensi.
Membangun di atas Mistral Small 3, model baru ini menawarkan peningkatan kinerja teks, pemahaman multimodal, dan jendela konteks yang diperluas hingga 128.000 token. Mistral AI mengklaim model tersebut memproses informasi dengan kecepatan 150 token per detik, membuatnya cocok untuk aplikasi yang menuntut waktu respons yang cepat.
Keserbagunaan dan Aksesibilitas Mistral Small 3.1
Mistral Small 3.1 dirancang untuk berjalan pada perangkat keras yang dapat diakses seperti RTX 4090 tunggal atau Mac dengan RAM 32GB, membuatnya sangat cocok untuk aplikasi on-device. Model ini dapat disetel dengan baik untuk domain khusus, memungkinkan pembuatan ahli materi pelajaran yang sangat akurat, terutama berguna dalam bidang-bidang seperti nasihat hukum, diagnostik medis, dan dukungan teknis.
Model baru ini dirancang untuk spektrum luas aplikasi perusahaan dan konsumen yang membutuhkan pemahaman multimodal. Kasus penggunaan potensial termasuk verifikasi dokumen, diagnostik, pemrosesan gambar on-device, inspeksi visual untuk kontrol kualitas, deteksi objek dalam sistem keamanan, dukungan pelanggan berbasis gambar, dan bantuan tujuan umum.
Mistral OCR: Pemahaman Dokumen Tingkat Lanjut
Sebelumnya pada bulan Maret, Mistral AI mengumumkan Mistral OCR, yang disebut perusahaan sebagai ‘API pemahaman dokumen terbaik di dunia’. Mistral OCR adalah API Optical Character Recognition (OCR) yang mampu mengekstrak teks, tabel, persamaan, dan gambar dari dokumen yang kompleks. Mistral AI percaya teknologi ini akan merevolusi cara organisasi memproses dan memanfaatkan repositori informasi yang luas.
Menurut perusahaan, Mistral OCR memproses hingga 2000 halaman per menit, mendukung kemampuan multibahasa dan multimodal, dan memberikan output terstruktur seperti JSON untuk integrasi yang mulus ke dalam alur kerja AI. Tes internal menunjukkan bahwa Mistral OCR memimpin pasar dalam akurasi ekstraksi teks, terutama untuk dokumen yang dipindai, konten matematika, dan teks multibahasa. Tidak seperti solusi OCR tradisional, ia juga mengekstrak gambar yang disematkan, membuatnya ideal untuk penelitian ilmiah, pengajuan peraturan, dan digitalisasi dokumen historis.
Mistral AI melaporkan bahwa OCR sudah membantu perusahaan dan lembaga penelitian dalam mendigitalkan literatur, merampingkan layanan pelanggan, dan melestarikan arsip sejarah. Selain itu, OCR membantu perusahaan mengonversi literatur teknis, gambar teknik, catatan kuliah, presentasi, pengajuan peraturan, dan lainnya ke dalam format yang terindeks dan siap untuk dijawab. Kemampuan Mistral OCR tersedia untuk uji coba gratis di le Chat, dan perusahaan mengantisipasi peningkatan lebih lanjut pada model dalam beberapa minggu mendatang. Perkembangan yang sedang berlangsung ini mencerminkan sifat dinamis AI dan potensinya untuk membentuk kembali berbagai industri.