Dunia Kepintaran Buatan (Artificial Intelligence - AI) sentiasa berubah, dengan penemuan dan langkah strategik yang membentuk masa depan pelbagai industri. Mari kita selidiki beberapa perkembangan terkini dan paling berkesan, dengan memfokuskan pada kemajuan Google dalam AI penjagaan kesihatan, pemerolehan syarikat permulaan video AI generatif oleh xAI, dan pelancaran model AI yang berkuasa namun padat oleh Mistral AI.
Kemajuan Google dalam AI Penjagaan Kesihatan
Google baru-baru ini melancarkan satu set kemas kini AI Kesihatan di acara tahunan ‘The Check Up’, mempamerkan komitmen syarikat untuk memanfaatkan AI untuk pelbagai aplikasi penjagaan kesihatan. Kemas kini ini merangkumi peningkatan pertanyaan berkaitan kesihatan dalam Google Search hingga memperkenalkan model AI ‘terbuka’ baharu yang direka untuk meningkatkan kecekapan penemuan ubat yang dikuasakan AI.
Meningkatkan Akses Maklumat Kesihatan melalui Google Search
Google menggunakan AI dan sistem kualiti dan kedudukan yang canggih untuk meluaskan skop jawapan ‘panel pengetahuan’ untuk pelbagai topik berkaitan kesihatan. Peluasan ini termasuk menambah sokongan untuk pertanyaan penjagaan kesihatan dalam pelbagai bahasa, seperti Sepanyol, Portugis, dan Jepun, pada mulanya pada platform mudah alih. Walaupun Search sudah menyediakan jawapan panel pengetahuan untuk masalah kesihatan yang lazim seperti influenza atau selesema biasa, kemas kini ini meluaskan lagi topik yang diliputi oleh panel ini.
Selain itu, Google memperkenalkan ciri baharu dalam Search yang dipanggil ‘What People Suggest’. Ciri ini direka untuk membentangkan pengguna dengan maklumat yang diperoleh daripada individu yang telah berkongsi pengalaman perubatan yang serupa. Penambahan ini menawarkan jalan unik untuk pengguna mendapatkan pandangan. Ia membolehkan pengguna menemui perspektif tulen daripada orang lain dengan keadaan yang sama dengan cepat, lengkap dengan pautan untuk penerokaan lanjut. ‘What People Suggest’ kini boleh diakses pada peranti mudah alih di Amerika Syarikat.
Memperkemas Rekod Perubatan dengan API Baharu
Google juga telah melancarkan antara muka pengaturcaraan aplikasi (API) rekod perubatan baharu secara global untuk platform Health Connectnya, yang serasi dengan peranti Android. API ini memperkasakan aplikasi untuk membaca dan menulis data rekod perubatan, merangkumi alahan, ubat-ubatan, imunisasi, dan keputusan makmal, semuanya dalam format FHIR yang dipiawaikan. Peningkatan ini membawa sokongan Health Connect kepada lebih 50 jenis data, merangkumi aktiviti, tidur, pemakanan, tanda-tanda vital, dan kini rekod perubatan. Penyepaduan ini memudahkan sambungan yang lancar antara data kesihatan harian pengguna dan maklumat daripada penyedia penjagaan kesihatan mereka.
‘AI Co-Scientist’: Rakan Penyelidik Maya
Inovasi terobosan daripada Google ialah ‘AI co-scientist’, sistem novel yang disokong oleh Gemini 2.0. Sistem ini dibayangkan sebagai ‘kolaborator saintifik maya’ untuk penyelidik dan saintis. ‘AI co-scientist’ direka untuk membantu penyelidik menavigasi kesusasteraan saintifik yang luas, dengan itu memudahkan penjanaan hipotesis baharu. Dengan membantu dalam analisis set data yang besar dan kertas penyelidikan yang kompleks, ‘AI co-scientist’ bertujuan untuk memperkasakan pakar untuk menemui idea baharu dan mempercepatkan usaha penyelidikan mereka. Google sedang bekerjasama secara aktif dengan institusi seperti Imperial College London, Houston Methodist, dan Stanford University untuk meneroka aplikasi praktikal alat ini dan berhasrat untuk memulakan program penguji yang dipercayai.
TxGemma: Mempercepatkan Penemuan Ubat
Google juga memperkenalkan TxGemma, kompilasi model terbuka berasaskan Gemma yang bertujuan untuk meningkatkan kecekapan penemuan ubat yang dipacu AI. TxGemma mempunyai keupayaan untuk memahami kedua-dua teks standard dan struktur pelbagai entiti terapeutik, termasuk molekul kecil, bahan kimia, dan protein. Pelancaran TxGemma dijadualkan dalam masa terdekat.
Alat AI Capricorn: Memajukan Onkologi Pediatrik
Dengan kerjasama Princess Maxima Center for Pediatric Oncology di Belanda, Google telah membangunkan alat AI bernama Capricorn. Alat ini menekankan dedikasi Google untuk menggunakan AI dalam bidang perubatan khusus, terutamanya dalam onkologi pediatrik.
Impak AI yang Lebih Luas terhadap Penjagaan Kesihatan
Google sebelum ini telah menyerlahkan pengaruh positif AI terhadap hasil kesihatan global. Syarikat itu telah membangunkan model AI untuk membantu dalam pengesanan penyakit seperti kanser payudara, kanser paru-paru, dan retinopati diabetik. Pada Mei 2024, Google mengumumkan Med-Gemini, keluarga model Gemini yang ditala halus untuk aplikasi perubatan multimodal. Selanjutnya, pada Jun 2024, Google memperkenalkan Personal Health Large Language Model untuk peranti mudah alih dan boleh pakai. Versi Gemini yang ditala halus ini direka untuk mentafsir data sensor dan memberikan pandangan dan cadangan yang diperibadikan mengenai corak tidur dan kecergasan individu.
Pemerolehan Hotshot oleh xAI: Langkah ke dalam Video AI Generatif
Usaha AI Elon Musk, xAI, telah memperoleh Hotshot, sebuah syarikat permulaan yang mengkhusus dalam alat penjanaan video yang dikuasakan AI. Pemerolehan ini meletakkan xAI untuk bersaing dengan Sora OpenAI, platform terkemuka dalam ruang video AI generatif. Hotshot mengumumkan di laman webnya bahawa ia mula menghentikan penciptaan video baharu pada 14 Mac, dengan pelanggan sedia ada mempunyai masa sehingga 30 Mac untuk memuat turun video yang telah mereka cipta.
Grok 3: Chatbot AI xAI yang Bercita-cita Tinggi
Pada 19 Februari, xAI melancarkan Grok 3, lelaran terbaharu chatbotnya, yang diisytiharkan oleh Elon Musk sebagai “AI paling pintar di Bumi.” Selepas itu, syarikat itu mengumumkan keluaran beta dua model penaakulan, Grok 3 (Think) dan Grok 3 Mini (Think). xAI menyatakan bahawa Grok 3, yang dilatih pada superkluster Colossus mereka dengan sepuluh kali ganda kuasa pengiraan model terkini sebelumnya, mempamerkan peningkatan yang ketara dalam penaakulan, matematik, pengekodan, pengetahuan dunia, dan tugas mengikut arahan.
Mistral Small 3.1 Mistral AI: Padat dan Berkuasa
Syarikat permulaan AI Perancis, Mistral AI, memperkenalkan model sumber terbuka baharu pada 17 Mac, bernama Mistral Small 3.1. Syarikat itu menegaskan bahawa model ini mengatasi model setanding seperti Gemma 3 Google dan GPT-4o Mini OpenAI, dengan itu meningkatkan persaingan dalam pasaran yang sebahagian besarnya dikuasai oleh gergasi teknologi AS.
Mistral Small 3.1 memproses kedua-dua teks dan imej dengan 24 bilion parameter – saiz yang jauh lebih kecil berbanding model proprietari terkemuka – sambil memadankan atau melebihi prestasinya. Mistral AI menekankan bahawa Mistral Small 3.1 ialah model sumber terbuka pertama yang bukan sahaja memenuhi tetapi melebihi prestasi model proprietari kecil terkemuka merentasi pelbagai dimensi.
Membina Mistral Small 3, model baharu ini mempunyai prestasi teks yang dipertingkatkan, pemahaman multimodal, dan tetingkap konteks yang diperluaskan sehingga 128,000 token. Mistral AI mendakwa model itu memproses maklumat pada kelajuan 150 token sesaat, menjadikannya sesuai untuk aplikasi yang memerlukan masa tindak balas yang pantas.
Kepelbagaian dan Kebolehcapaian Mistral Small 3.1
Mistral Small 3.1 direka untuk dijalankan pada perkakasan yang boleh diakses seperti RTX 4090 tunggal atau Mac dengan RAM 32GB, menjadikannya sangat sesuai untuk aplikasi pada peranti. Model ini boleh ditala halus untuk domain khusus, membolehkan penciptaan pakar perkara subjek yang sangat tepat, terutamanya berguna dalam bidang seperti nasihat undang-undang, diagnostik perubatan, dan sokongan teknikal.
Model baharu ini disesuaikan untuk spektrum luas aplikasi perusahaan dan pengguna yang memerlukan pemahaman multimodal. Kes penggunaan yang berpotensi termasuk pengesahan dokumen, diagnostik, pemprosesan imej pada peranti, pemeriksaan visual untuk kawalan kualiti, pengesanan objek dalam sistem keselamatan, sokongan pelanggan berasaskan imej, dan bantuan tujuan am.
Mistral OCR: Pemahaman Dokumen Lanjutan
Awal bulan Mac, Mistral AI mengumumkan Mistral OCR, yang diuar-uarkan oleh syarikat itu sebagai “API pemahaman dokumen terbaik di dunia.” Mistral OCR ialah API Pengecaman Aksara Optik (OCR) yang mampu mengekstrak teks, jadual, persamaan dan imej daripada dokumen yang kompleks. Mistral AI percaya teknologi ini akan merevolusikan cara organisasi memproses dan menggunakan repositori maklumat yang luas.
Menurut syarikat itu, Mistral OCR memproses sehingga 2000 halaman seminit, menyokong keupayaan berbilang bahasa dan multimodal, dan menyampaikan output berstruktur seperti JSON untuk penyepaduan yang lancar ke dalam aliran kerja AI. Ujian dalaman menunjukkan bahawa Mistral OCR mendahului pasaran dalam ketepatan pengekstrakan teks, terutamanya untuk dokumen yang diimbas, kandungan matematik dan teks berbilang bahasa. Tidak seperti penyelesaian OCR tradisional, ia juga mengekstrak imej terbenam, menjadikannya ideal untuk penyelidikan saintifik, pemfailan kawal selia dan pendigitalan dokumen sejarah.
Mistral AI melaporkan bahawa OCR sudah membantu perusahaan dan institusi penyelidikan dalam mendigitalkan kesusasteraan, memperkemas perkhidmatan pelanggan dan memelihara arkib sejarah. Selain itu, OCR membantu syarikat menukar kesusasteraan teknikal, lukisan kejuruteraan, nota kuliah, pembentangan, pemfailan kawal selia dan banyak lagi ke dalam format terindeks yang sedia untuk dijawab. Keupayaan Mistral OCR tersedia untuk percubaan percuma di le Chat, dan syarikat menjangkakan penambahbaikan selanjutnya pada model itu dalam beberapa minggu akan datang. Perkembangan berterusan ini mencerminkan sifat dinamik AI dan potensinya untuk membentuk semula pelbagai industri.