AI: 구글 헬스케어 혁신, xAI, 미스트랄

Google의 헬스케어 AI 발전

Google은 최근 연례 ‘The Check Up’ 행사에서 다양한 헬스케어 애플리케이션에 AI를 활용하려는 회사의 노력을 보여주는 Health AI 업데이트 제품군을 공개했습니다. 이러한 업데이트는 Google 검색에서 건강 관련 쿼리를 개선하는 것부터 AI 기반 신약 개발의 효율성을 높이기 위해 설계된 새로운 ‘개방형’ AI 모델 도입에 이르기까지 다양합니다.

Google 검색을 통한 건강 정보 접근성 향상

Google은 광범위한 건강 관련 주제에 대한 ‘지식 패널’ 답변 범위를 넓히기 위해 AI와 정교한 품질 및 순위 시스템을 배포하고 있습니다. 이번 확장에는 처음에는 모바일 플랫폼에서 스페인어, 포르투갈어, 일본어와 같은 여러 언어로 된 의료 관련 쿼리에 대한 지원이 추가되었습니다. 검색은 이미 인플루엔자나 감기와 같은 일반적인 건강 문제에 대한 지식 패널 답변을 제공했지만, 이번 업데이트를 통해 이러한 패널이 포함하는 주제의 범위가 크게 확대되었습니다.

이 외에도 Google은 검색에 ‘What People Suggest’라는 새로운 기능을 도입했습니다. 이 기능은 유사한 의료 경험을 공유한 개인으로부터 얻은 정보를 사용자에게 제공하도록 설계되었습니다. 이 추가 기능은 사용자에게 통찰력을 얻을 수 있는 특별한 방법을 제공합니다. 사용자는 동일한 질환을 가진 다른 사람들의 진솔한 관점을 빠르게 발견하고 추가 탐색을 위한 링크를 확인할 수 있습니다. ‘What People Suggest’는 현재 미국의 모바일 기기에서 사용할 수 있습니다.

새로운 API를 통한 의료 기록 간소화

Google은 또한 Android 기기와 호환되는 Health Connect 플랫폼용 새로운 의료 기록 API(애플리케이션 프로그래밍 인터페이스)를 전 세계적으로 출시했습니다. 이러한 API를 통해 애플리케이션은 알레르기, 약물, 예방 접종, 검사 결과 등 모든 의료 기록 데이터를 표준화된 FHIR 형식으로 읽고 쓸 수 있습니다. 이러한 개선 사항을 통해 Health Connect는 활동, 수면, 영양, 활력 징후, 이제는 의료 기록까지 50가지가 넘는 데이터 유형을 지원합니다. 이러한 통합을 통해 사용자의 일상적인 건강 데이터와 의료 제공자의 정보를 원활하게 연결할 수 있습니다.

AI 공동 과학자: 가상 연구 파트너

Google의 획기적인 혁신은 Gemini 2.0을 기반으로 하는 새로운 시스템인 ‘AI 공동 과학자’입니다. 이 시스템은 연구자와 과학자를 위한 ‘가상 과학 협력자’로 구상되었습니다. AI 공동 과학자는 연구자가 방대한 과학 문헌을 탐색하여 새로운 가설 생성을 촉진하도록 설계되었습니다. 방대한 데이터 세트와 복잡한 연구 논문 분석을 지원함으로써 AI 공동 과학자는 전문가가 새로운 아이디어를 발견하고 연구 노력을 가속화할 수 있도록 지원하는 것을 목표로 합니다. Google은 Imperial College London, Houston Methodist, Stanford University와 같은 기관과 적극적으로 협력하여 이 도구의 실제 적용을 모색하고 신뢰할 수 있는 테스터 프로그램을 시작할 계획입니다.

TxGemma: 신약 개발 가속화

Google은 또한 AI 기반 신약 개발의 효율성을 높이기 위해 고안된 Gemma 기반 개방형 모델 모음인 TxGemma를 도입했습니다. TxGemma는 표준 텍스트와 소분자, 화학 물질, 단백질을 포함한 다양한 치료 물질의 구조를 모두 이해할 수 있는 기능을 갖추고 있습니다. TxGemma의 출시는 가까운 시일 내에 예정되어 있습니다.

Capricorn AI 도구: 소아 종양학 발전

Google은 네덜란드의 Princess Maxima Center for Pediatric Oncology와 협력하여 Capricorn이라는 AI 도구를 개발해 왔습니다. 이 도구는 특히 소아 종양학과 같은 전문 의료 분야에 AI를 적용하려는 Google의 노력을 강조합니다.

AI가 헬스케어에 미치는 광범위한 영향

Google은 이전에 AI가 전 세계 건강 결과에 미치는 긍정적인 영향을 강조했습니다. 이 회사는 유방암, 폐암, 당뇨병성 망막병증과 같은 질병을 감지하는 데 도움이 되는 AI 모델을 개발했습니다. 2024년 5월, Google은 다중 모드 의료 애플리케이션에 맞게 미세 조정된 Gemini 모델 제품군인 Med-Gemini를 발표했습니다. 또한 2024년 6월, Google은 모바일 및 웨어러블 기기용 Personal Health Large Language Model을 도입했습니다. Gemini의 이 미세 조정된 버전은 센서 데이터를 해석하고 개인의 수면 및 피트니스 패턴에 대한 개인화된 통찰력과 권장 사항을 제공하도록 설계되었습니다.

xAI의 Hotshot 인수: 생성 AI 비디오로의 이동

Elon Musk의 AI 벤처인 xAI는 AI 기반 비디오 생성 도구를 전문으로 하는 스타트업인 Hotshot을 인수했습니다. 이번 인수를 통해 xAI는 생성 AI 비디오 분야의 선두 플랫폼인 OpenAI의 Sora와 경쟁할 수 있게 되었습니다. Hotshot은 웹사이트를 통해 3월 14일부터 새로운 비디오 생성을 단계적으로 중단하기 시작했으며 기존 고객은 3월 30일까지 생성된 비디오를 다운로드할 수 있다고 발표했습니다.

Grok 3: xAI의 야심 찬 AI 챗봇

2월 19일, xAI는 Elon Musk가 ‘지구상에서 가장 똑똑한 AI’라고 선언한 챗봇의 최신 버전인 Grok 3를 공개했습니다. 그 후, 회사는 두 가지 추론 모델인 Grok 3 (Think)와 Grok 3 Mini (Think)의 베타 릴리스를 발표했습니다. xAI는 이전 최첨단 모델보다 10배 더 강력한 컴퓨팅 성능을 갖춘 Colossus 슈퍼 클러스터에서 훈련된 Grok 3가 추론, 수학, 코딩, 세계 지식 및 지시 따르기 작업에서 상당한 개선을 보였다고 밝혔습니다.

Mistral AI의 Mistral Small 3.1: 컴팩트하고 강력함

프랑스 AI 스타트업 Mistral AI는 3월 17일 Mistral Small 3.1이라는 새로운 오픈 소스 모델을 도입했습니다. 이 회사는 이 모델이 Google의 Gemma 3 및 OpenAI의 GPT-4o Mini와 같은 유사한 모델을 능가하여 주로 미국 기술 대기업이 지배하는 시장에서 경쟁을 심화시킨다고 주장합니다.

Mistral Small 3.1은 텍스트와 이미지를 모두 240억 개의 매개변수로 처리합니다. 이는 선도적인 독점 모델에 비해 훨씬 작은 크기이지만 성능은 비슷하거나 능가합니다. Mistral AI는 Mistral Small 3.1이 다양한 차원에서 선도적인 소형 독점 모델의 성능을 충족할 뿐만 아니라 능가하는 최초의 오픈 소스 모델이라고 강조했습니다.

Mistral Small 3를 기반으로 구축된 이 새로운 모델은 향상된 텍스트 성능, 다중 모드 이해 및 최대 128,000개의 토큰으로 확장된 컨텍스트 창을 자랑합니다. Mistral AI는 이 모델이 초당 150개의 토큰 속도로 정보를 처리하므로 빠른 응답 시간이 필요한 애플리케이션에 적합하다고 주장합니다.

Mistral Small 3.1의 다재다능함과 접근성

Mistral Small 3.1은 단일 RTX 4090 또는 32GB RAM이 장착된 Mac과 같이 접근 가능한 하드웨어에서 실행되도록 설계되어 온디바이스 애플리케이션에 매우 적합합니다. 이 모델은 특정 도메인에 맞게 미세 조정할 수 있으므로 특히 법률 자문, 의료 진단, 기술 지원과 같은 분야에서 유용한 매우 정확한 주제 전문가를 만들 수 있습니다.

새로운 모델은 다중 모드 이해가 필요한 광범위한 엔터프라이즈 및 소비자 애플리케이션에 맞게 조정되었습니다. 잠재적인 사용 사례로는 문서 확인, 진단, 온디바이스 이미지 처리, 품질 관리를 위한 육안 검사, 보안 시스템의 객체 감지, 이미지 기반 고객 지원 및 범용 지원이 있습니다.

Mistral OCR: 고급 문서 이해

3월 초, Mistral AI는 회사가 ‘세계 최고의 문서 이해 API’라고 자랑하는 Mistral OCR을 발표했습니다. Mistral OCR은 복잡한 문서에서 텍스트, 표, 수식 및 이미지를 추출할 수 있는 OCR(광학 문자 인식) API입니다. Mistral AI는 이 기술이 조직이 방대한 정보 저장소를 처리하고 활용하는 방식을 혁신할 것이라고 믿습니다.

회사에 따르면 Mistral OCR은 분당 최대 2000페이지를 처리하고, 다국어 및 다중 모드 기능을 지원하며, AI 워크플로에 원활하게 통합할 수 있도록 JSON과 같은 구조화된 출력을 제공합니다. 내부 테스트에 따르면 Mistral OCR은 특히 스캔한 문서, 수학 콘텐츠 및 다국어 텍스트의 텍스트 추출 정확도에서 시장을 선도합니다. 또한 기존 OCR 솔루션과 달리 내장된 이미지를 추출하므로 과학 연구, 규제 서류 제출, 역사 문서 디지털화에 이상적입니다.

Mistral AI는 OCR이 이미 기업과 연구 기관이 문헌을 디지털화하고, 고객 서비스를 간소화하고, 역사적 기록을 보존하는 데 도움을 주고 있다고 보고합니다. 또한 OCR은 기업이 기술 문헌, 엔지니어링 도면, 강의 노트, 프레젠테이션, 규제 서류 등을 인덱싱되고 답변 가능한 형식으로 변환하는 데 도움을 주고 있습니다. Mistral OCR 기능은 le Chat에서 무료 평가판으로 제공되며, 회사는 앞으로 몇 주 안에 모델이 더욱 개선될 것으로 예상합니다. 이러한 지속적인 개발은 AI의 역동적인 특성과 다양한 산업을 재편할 수 있는 잠재력을 반영합니다.