AI: Đột phá Y tế, xAI, Mistral

Những Bước Tiến của Google trong AI Chăm sóc Sức khỏe

Google gần đây đã công bố một loạt các bản cập nhật Health AI tại sự kiện thường niên ‘The Check Up’, thể hiện cam kết của công ty trong việc tận dụng AI cho các ứng dụng chăm sóc sức khỏe đa dạng. Các bản cập nhật này trải dài từ việc cải thiện các truy vấn liên quan đến sức khỏe trong Google Search đến việc giới thiệu các mô hình AI ‘mở’ mới được thiết kế để tăng hiệu quả của việc khám phá thuốc do AI hỗ trợ.

Google đang triển khai AI và các hệ thống xếp hạng và chất lượng tinh vi để mở rộng phạm vi trả lời của ‘bảng tri thức’ cho một loạt các chủ đề liên quan đến sức khỏe. Việc mở rộng này bao gồm việc thêm hỗ trợ cho các truy vấn chăm sóc sức khỏe bằng nhiều ngôn ngữ, chẳng hạn như tiếng Tây Ban Nha, tiếng Bồ Đào Nha và tiếng Nhật, ban đầu trên nền tảng di động. Mặc dù Search đã cung cấp câu trả lời cho bảng tri thức cho các vấn đề sức khỏe phổ biến như cúm hoặc cảm lạnh thông thường, bản cập nhật này mở rộng đáng kể mảng chủ đề mà các bảng này bao gồm.

Ngoài ra, Google giới thiệu một tính năng mới trong Search có tên ‘What People Suggest’. Tính năng này được thiết kế để cung cấp cho người dùng thông tin có nguồn gốc từ những cá nhân đã chia sẻ kinh nghiệm y tế tương tự. Sự bổ sung này cung cấp một con đường độc đáo để người dùng có được những hiểu biết sâu sắc. Nó cho phép người dùng nhanh chóng khám phá những quan điểm chân thực từ những người khác có cùng tình trạng, hoàn chỉnh với các liên kết để khám phá thêm. ‘What People Suggest’ hiện có thể truy cập trên thiết bị di động ở Hoa Kỳ.

Hợp lý hóa Hồ sơ Y tế với API mới

Google cũng đã ra mắt toàn cầu các giao diện lập trình ứng dụng (API) hồ sơ y tế mới cho nền tảng Health Connect, tương thích với các thiết bị Android. Các API này trao quyền cho các ứng dụng đọc và ghi dữ liệu hồ sơ y tế, bao gồm dị ứng, thuốc, tiêm chủng và kết quả xét nghiệm, tất cả đều ở định dạng FHIR tiêu chuẩn. Những cải tiến này mang lại sự hỗ trợ của Health Connect cho hơn 50 loại dữ liệu, bao gồm hoạt động, giấc ngủ, dinh dưỡng, dấu hiệu sinh tồn và giờ đây là hồ sơ y tế. Sự tích hợp này tạo điều kiện kết nối liền mạch giữa dữ liệu sức khỏe hàng ngày của người dùng và thông tin từ các nhà cung cấp dịch vụ chăm sóc sức khỏe của họ.

Nhà Khoa học Đồng hành AI: Đối tác Nghiên cứu Ảo

Một sự đổi mới đột phá từ Google là ‘AI co-scientist’, một hệ thống mới dựa trên Gemini 2.0. Hệ thống này được hình dung như một ‘cộng tác viên khoa học ảo’ cho các nhà nghiên cứu và nhà khoa học. Nhà khoa học đồng hành AI được thiết kế để hỗ trợ các nhà nghiên cứu điều hướng các tài liệu khoa học mở rộng, từ đó tạo điều kiện tạo ra các giả thuyết mới. Bằng cách hỗ trợ phân tích các bộ dữ liệu khổng lồ và các bài báo nghiên cứu phức tạp, nhà khoa học đồng hành AI nhằm mục đích trao quyền cho các chuyên gia khám phá những ý tưởng mới và thúc đẩy nỗ lực nghiên cứu của họ. Google đang tích cực hợp tác với các tổ chức như Imperial College London, Houston Methodist và Đại học Stanford để khám phá các ứng dụng thực tế của công cụ này và dự định bắt đầu một chương trình thử nghiệm đáng tin cậy.

TxGemma: Tăng tốc Khám phá Thuốc

Google cũng giới thiệu TxGemma, một tập hợp các mô hình mở dựa trên Gemma nhằm nâng cao hiệu quả của việc khám phá thuốc do AI hỗ trợ. TxGemma có khả năng hiểu cả văn bản tiêu chuẩn và cấu trúc của các thực thể trị liệu khác nhau, bao gồm các phân tử nhỏ, hóa chất và protein. Việc phát hành TxGemma được lên kế hoạch cho tương lai gần.

Công cụ Capricorn AI: Thúc đẩy Ung thư Nhi khoa

Hợp tác với Trung tâm Ung thư Nhi khoa Princess Maxima ở Hà Lan, Google đã và đang phát triển một công cụ AI có tên Capricorn. Công cụ này nhấn mạnh sự cống hiến của Google trong việc áp dụng AI vào các lĩnh vực y tế chuyên biệt, đặc biệt là ung thư nhi khoa.

Tác động Rộng hơn của AI đối với Chăm sóc Sức khỏe

Trước đây, Google đã nhấn mạnh ảnh hưởng tích cực của AI đối với kết quả sức khỏe toàn cầu. Công ty đã phát triển các mô hình AI để hỗ trợ phát hiện các bệnh như ung thư vú, ung thư phổi và bệnh võng mạc tiểu đường. Vào tháng 5 năm 2024, Google đã công bố Med-Gemini, một nhóm các mô hình Gemini được tinh chỉnh cho các ứng dụng y tế đa phương thức. Hơn nữa, vào tháng 6 năm 2024, Google đã giới thiệu Mô hình Ngôn ngữ Lớn về Sức khỏe Cá nhân cho các thiết bị di động và thiết bị đeo được. Phiên bản Gemini được tinh chỉnh này được thiết kế để diễn giải dữ liệu cảm biến và cung cấp thông tin chi tiết và đề xuất được cá nhân hóa về giấc ngủ và thói quen tập thể dục của một cá nhân.

Việc xAI mua lại Hotshot: Một bước tiến vào Video AI Tạo sinh

Công ty AI của Elon Musk, xAI, đã mua lại Hotshot, một công ty khởi nghiệp chuyên về các công cụ tạo video do AI hỗ trợ. Việc mua lại này giúp xAI cạnh tranh với Sora của OpenAI, một nền tảng hàng đầu trong không gian video AI tạo sinh. Hotshot đã thông báo trên trang web của mình rằng họ đã bắt đầu loại bỏ dần việc tạo video mới vào ngày 14 tháng 3, với các khách hàng hiện tại có thời hạn đến ngày 30 tháng 3 để tải xuống các video đã tạo của họ.

Grok 3: Chatbot AI đầy tham vọng của xAI

Vào ngày 19 tháng 2, xAI đã tiết lộ Grok 3, phiên bản mới nhất của chatbot của mình, mà Elon Musk tuyên bố là ‘AI thông minh nhất trên Trái đất’. Sau đó, công ty đã công bố bản phát hành beta của hai mô hình lý luận, Grok 3 (Think) và Grok 3 Mini (Think). xAI tuyên bố rằng Grok 3, được đào tạo trên siêu máy tính Colossus của họ với sức mạnh tính toán gấp mười lần so với các mô hình tiên tiến trước đây, thể hiện những cải tiến đáng kể trong các nhiệm vụ lý luận, toán học, mã hóa, kiến thức thế giới và tuân theo hướng dẫn.

Mistral Small 3.1 của Mistral AI: Nhỏ gọn và Mạnh mẽ

Công ty khởi nghiệp AI của Pháp Mistral AI đã giới thiệu một mô hình nguồn mở mới vào ngày 17 tháng 3, có tên Mistral Small 3.1. Công ty khẳng định rằng mô hình này vượt trội hơn các mô hình tương đương như Gemma 3 của Google và GPT-4o Mini của OpenAI, do đó làm tăng sự cạnh tranh trong một thị trường phần lớn bị chi phối bởi các gã khổng lồ công nghệ Hoa Kỳ.

Mistral Small 3.1 xử lý cả văn bản và hình ảnh với 24 tỷ tham số – kích thước nhỏ hơn đáng kể so với các mô hình độc quyền hàng đầu – trong khi vẫn sánh ngang hoặc vượt trội hơn hiệu suất của chúng. Mistral AI nhấn mạnh rằng Mistral Small 3.1 là mô hình nguồn mở đầu tiên không chỉ đáp ứng mà còn vượt trội hơn hiệu suất của các mô hình độc quyền nhỏ hàng đầu trên nhiều khía cạnh.

Dựa trên Mistral Small 3, mô hình mới này tự hào có hiệu suất văn bản nâng cao, hiểu biết đa phương thức và cửa sổ ngữ cảnh mở rộng lên đến 128.000 token. Mistral AI tuyên bố mô hình xử lý thông tin với tốc độ 150 token mỗi giây, làm cho nó phù hợp với các ứng dụng đòi hỏi thời gian phản hồi nhanh.

Tính linh hoạt và Khả năng truy cập của Mistral Small 3.1

Mistral Small 3.1 được thiết kế để chạy trên phần cứng dễ tiếp cận như một RTX 4090 duy nhất hoặc một máy Mac có RAM 32GB, làm cho nó rất phù hợp cho các ứng dụng trên thiết bị. Mô hình có thể được tinh chỉnh cho các lĩnh vực chuyên biệt, cho phép tạo ra các chuyên gia về chủ đề có độ chính xác cao, đặc biệt hữu ích trong các lĩnh vực như tư vấn pháp lý, chẩn đoán y tế và hỗ trợ kỹ thuật.

Mô hình mới được thiết kế riêng cho một loạt các ứng dụng doanh nghiệp và người tiêu dùng đòi hỏi sự hiểu biết đa phương thức. Các trường hợp sử dụng tiềm năng bao gồm xác minh tài liệu, chẩn đoán, xử lý hình ảnh trên thiết bị, kiểm tra trực quan để kiểm soát chất lượng, phát hiện đối tượng trong hệ thống an ninh, hỗ trợ khách hàng dựa trên hình ảnh và hỗ trợ đa năng.

Mistral OCR: Hiểu tài liệu nâng cao

Đầu tháng 3, Mistral AI đã công bố Mistral OCR, mà công ty quảng cáo là ‘API hiểu tài liệu tốt nhất thế giới’. Mistral OCR là một API Nhận dạng Ký tự Quang học (OCR) có khả năng trích xuất văn bản, bảng, phương trình và hình ảnh từ các tài liệu phức tạp. Mistral AI tin rằng công nghệ này sẽ cách mạng hóa cách các tổ chức xử lý và sử dụng các kho thông tin khổng lồ.

Theo công ty, Mistral OCR xử lý tới 2000 trang mỗi phút, hỗ trợ khả năng đa ngôn ngữ và đa phương thức, đồng thời cung cấp các đầu ra có cấu trúc như JSON để tích hợp liền mạch vào quy trình làm việc AI. Các thử nghiệm nội bộ chỉ ra rằng Mistral OCR dẫn đầu thị trường về độ chính xác trích xuất văn bản, đặc biệt đối với các tài liệu được quét, nội dung toán học và văn bản đa ngôn ngữ. Không giống như các giải pháp OCR truyền thống, nó cũng trích xuất hình ảnh nhúng, làm cho nó lý tưởng cho nghiên cứu khoa học, hồ sơ pháp lý và số hóa tài liệu lịch sử.

Mistral AI báo cáo rằng OCR đã hỗ trợ các doanh nghiệp và tổ chức nghiên cứu số hóa tài liệu, hợp lý hóa dịch vụ khách hàng và bảo tồn các kho lưu trữ lịch sử. Ngoài ra, OCR đang giúp các công ty chuyển đổi tài liệu kỹ thuật, bản vẽ kỹ thuật, ghi chú bài giảng, bài thuyết trình, hồ sơ pháp lý, v.v. thành các định dạng được lập chỉ mục, sẵn sàng trả lời. Khả năng của Mistral OCR có sẵn để dùng thử miễn phí trên le Chat và công ty dự đoán những cải tiến hơn nữa cho mô hình trong những tuần tới. Những phát triển đang diễn ra này phản ánh bản chất năng động của AI và tiềm năng của nó trong việc định hình lại các ngành công nghiệp khác nhau.