AI: Google, xAI, และ Mistral

ความก้าวหน้าของ Google ในด้าน AI เพื่อสุขภาพ

Google ได้เปิดตัวชุดอัปเดต Health AI ที่งาน ‘The Check Up’ ประจำปี แสดงให้เห็นถึงความมุ่งมั่นของบริษัทในการใช้ประโยชน์จาก AI สำหรับการใช้งานด้านการดูแลสุขภาพที่หลากหลาย การอัปเดตเหล่านี้ครอบคลุมตั้งแต่การปรับปรุงคำค้นหาที่เกี่ยวข้องกับสุขภาพใน Google Search ไปจนถึงการแนะนำโมเดล AI แบบ ‘เปิด’ ใหม่ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพของการค้นคว้ายาที่ขับเคลื่อนด้วย AI

Google กำลังปรับใช้ AI และระบบคุณภาพและการจัดอันดับที่ซับซ้อนเพื่อขยายขอบเขตของคำตอบ ‘แผงความรู้’ สำหรับหัวข้อที่เกี่ยวข้องกับสุขภาพที่หลากหลาย การขยายนี้รวมถึงการเพิ่มการสนับสนุนสำหรับคำค้นหาด้านการดูแลสุขภาพในหลายภาษา เช่น สเปน โปรตุเกส และญี่ปุ่น ในขั้นต้นบนแพลตฟอร์มมือถือ แม้ว่า Search จะให้คำตอบในแผงความรู้สำหรับข้อกังวลด้านสุขภาพที่แพร่หลาย เช่น ไข้หวัดใหญ่หรือไข้หวัดธรรมดาอยู่แล้ว แต่การอัปเดตนี้จะขยายขอบเขตของหัวข้อที่แผงเหล่านี้ครอบคลุมอย่างมาก

นอกจากนี้ Google ยังแนะนำคุณลักษณะใหม่ใน Search ที่เรียกว่า ‘What People Suggest’ คุณลักษณะนี้ออกแบบมาเพื่อนำเสนอข้อมูลที่ได้มาจากบุคคลที่เคยมีประสบการณ์ทางการแพทย์ที่คล้ายคลึงกันแก่ผู้ใช้ การเพิ่มนี้เป็นช่องทางที่ไม่เหมือนใครสำหรับผู้ใช้ในการรับข้อมูลเชิงลึก ช่วยให้ผู้ใช้ค้นพบมุมมองที่แท้จริงจากผู้อื่นที่มีอาการเดียวกันได้อย่างรวดเร็ว พร้อมลิงก์สำหรับการสำรวจเพิ่มเติม ‘What People Suggest’ สามารถเข้าถึงได้บนอุปกรณ์มือถือภายในสหรัฐอเมริกา

การปรับปรุงเวชระเบียนด้วย API ใหม่

Google ยังได้เปิดตัว application programming interfaces (APIs) เวชระเบียนใหม่ทั่วโลกสำหรับแพลตฟอร์ม Health Connect ซึ่งเข้ากันได้กับอุปกรณ์ Android APIs เหล่านี้ช่วยให้แอปพลิเคชันสามารถอ่านและเขียนข้อมูลเวชระเบียน ซึ่งรวมถึงอาการแพ้ ยา การฉีดวัคซีน และผลการตรวจทางห้องปฏิบัติการ ทั้งหมดนี้อยู่ในรูปแบบ FHIR ที่ได้มาตรฐาน การปรับปรุงเหล่านี้ทำให้ Health Connect รองรับข้อมูลมากกว่า 50 ประเภท ซึ่งครอบคลุมกิจกรรม การนอนหลับ โภชนาการ สัญญาณชีพ และเวชระเบียน การผสานรวมนี้อำนวยความสะดวกในการเชื่อมต่อที่ราบรื่นระหว่างข้อมูลสุขภาพประจำวันของผู้ใช้และข้อมูลจากผู้ให้บริการด้านการดูแลสุขภาพของพวกเขา

The AI Co-Scientist: หุ้นส่วนการวิจัยเสมือนจริง

นวัตกรรมที่ก้าวล้ำจาก Google คือ ‘AI co-scientist’ ซึ่งเป็นระบบใหม่ที่ขับเคลื่อนโดย Gemini 2.0 ระบบนี้ได้รับการออกแบบให้เป็น ‘ผู้ cộng tác ทางวิทยาศาสตร์เสมือน’ สำหรับนักวิจัยและนักวิทยาศาสตร์ AI co-scientist ได้รับการออกแบบมาเพื่อช่วยนักวิจัยในการสำรวจเอกสารทางวิทยาศาสตร์ที่กว้างขวาง ซึ่งจะช่วยอำนวยความสะดวกในการสร้างสมมติฐานใหม่ๆ โดยการช่วยในการวิเคราะห์ชุดข้อมูลขนาดใหญ่และเอกสารการวิจัยที่ซับซ้อน AI co-scientist มีเป้าหมายที่จะช่วยให้ผู้เชี่ยวชาญค้นพบแนวคิดใหม่ๆ และเร่งความพยายามในการวิจัยของพวกเขา Google กำลังทำงานร่วมกับสถาบันต่างๆ เช่น Imperial College London, Houston Methodist และ Stanford University เพื่อสำรวจการใช้งานจริงของเครื่องมือนี้ และตั้งใจที่จะเริ่มโปรแกรมผู้ทดสอบที่เชื่อถือได้

TxGemma: เร่งการค้นคว้ายา

Google ยังได้เปิดตัว TxGemma ซึ่งเป็นการรวบรวมโมเดลแบบเปิดที่ใช้ Gemma ซึ่งมีวัตถุประสงค์เพื่อเพิ่มประสิทธิภาพของการค้นคว้ายาที่ขับเคลื่อนด้วย AI TxGemma มีความสามารถในการทำความเข้าใจทั้งข้อความมาตรฐานและโครงสร้างของเอนทิตีการรักษาต่างๆ รวมถึงโมเลกุลขนาดเล็ก สารเคมี และโปรตีน การเปิดตัว TxGemma มีกำหนดในอนาคตอันใกล้

Capricorn AI Tool: ความก้าวหน้าด้านเนื้องอกวิทยาในเด็ก

ด้วยความร่วมมือกับ Princess Maxima Center for Pediatric Oncology ในเนเธอร์แลนด์ Google ได้พัฒนาเครื่องมือ AI ชื่อ Capricorn เครื่องมือนี้เน้นย้ำถึงความมุ่งมั่นของ Google ในการประยุกต์ใช้ AI กับสาขาการแพทย์เฉพาะทาง โดยเฉพาะอย่างยิ่งในด้านเนื้องอกวิทยาในเด็ก

ผลกระทบที่กว้างขึ้นของ AI ต่อการดูแลสุขภาพ

Google ได้เน้นย้ำถึงอิทธิพลเชิงบวกของ AI ต่อผลลัพธ์ด้านสุขภาพทั่วโลกก่อนหน้านี้ บริษัทได้พัฒนาโมเดล AI เพื่อช่วยในการตรวจหาโรคต่างๆ เช่น มะเร็งเต้านม มะเร็งปอด และเบาหวานขึ้นตา ในเดือนพฤษภาคม 2024 Google ได้ประกาศ Med-Gemini ซึ่งเป็นกลุ่มโมเดล Gemini ที่ได้รับการปรับแต่งอย่างละเอียดสำหรับการใช้งานทางการแพทย์แบบ multimodal นอกจากนี้ ในเดือนมิถุนายน 2024 Google ได้เปิดตัว Personal Health Large Language Model สำหรับอุปกรณ์มือถือและอุปกรณ์สวมใส่ Gemini เวอร์ชันที่ปรับแต่งอย่างละเอียดนี้ได้รับการออกแบบมาเพื่อตีความข้อมูลเซ็นเซอร์และให้ข้อมูลเชิงลึกและคำแนะนำส่วนบุคคลเกี่ยวกับรูปแบบการนอนหลับและการออกกำลังกายของแต่ละบุคคล

การเข้าซื้อกิจการ Hotshot ของ xAI: การเคลื่อนไหวในวิดีโอ Generative AI

xAI บริษัท AI ของ Elon Musk ได้เข้าซื้อกิจการ Hotshot ซึ่งเป็นสตาร์ทอัพที่เชี่ยวชาญด้านเครื่องมือสร้างวิดีโอที่ขับเคลื่อนด้วย AI การเข้าซื้อกิจการครั้งนี้ทำให้ xAI สามารถแข่งขันกับ Sora ของ OpenAI ซึ่งเป็นแพลตฟอร์มชั้นนำในพื้นที่วิดีโอ generative AI Hotshot ประกาศบนเว็บไซต์ว่าจะเริ่มยุติการสร้างวิดีโอใหม่ในวันที่ 14 มีนาคม โดยลูกค้าปัจจุบันมีเวลาจนถึงวันที่ 30 มีนาคมในการดาวน์โหลดวิดีโอที่สร้างขึ้น

Grok 3: แชทบอท AI ที่ทะเยอทะยานของ xAI

เมื่อวันที่ 19 กุมภาพันธ์ xAI ได้เปิดตัว Grok 3 ซึ่งเป็นแชทบอทเวอร์ชันล่าสุด ซึ่ง Elon Musk ประกาศว่าเป็น ‘AI ที่ฉลาดที่สุดในโลก’ ต่อมา บริษัทได้ประกาศเปิดตัวเบต้าของโมเดลการให้เหตุผลสองแบบ ได้แก่ Grok 3 (Think) และ Grok 3 Mini (Think) xAI ระบุว่า Grok 3 ซึ่งได้รับการฝึกฝนบนซูเปอร์คลัสเตอร์ Colossus ของพวกเขาด้วยพลังการประมวลผลที่มากกว่าโมเดลที่ล้ำสมัยก่อนหน้านี้ถึงสิบเท่า แสดงให้เห็นถึงการปรับปรุงที่สำคัญในการให้เหตุผล คณิตศาสตร์ การเขียนโค้ด ความรู้รอบโลก และงานที่ต้องปฏิบัติตามคำสั่ง

Mistral Small 3.1 ของ Mistral AI: กะทัดรัดและทรงพลัง

Mistral AI สตาร์ทอัพ AI ของฝรั่งเศสได้เปิดตัวโมเดลโอเพนซอร์สใหม่เมื่อวันที่ 17 มีนาคม ชื่อ Mistral Small 3.1 บริษัท ยืนยันว่าโมเดลนี้มีประสิทธิภาพเหนือกว่าโมเดลที่เทียบเคียงได้ เช่น Gemma 3 ของ Google และ GPT-4o Mini ของ OpenAI ซึ่งเป็นการเพิ่มการแข่งขันในตลาดที่ส่วนใหญ่ถูกครอบงำโดยยักษ์ใหญ่ด้านเทคโนโลยีของสหรัฐฯ

Mistral Small 3.1 ประมวลผลทั้งข้อความและรูปภาพด้วยพารามิเตอร์ 24 พันล้านพารามิเตอร์ ซึ่งมีขนาดเล็กกว่าโมเดลที่เป็นกรรมสิทธิ์ชั้นนำอย่างมาก ในขณะที่เทียบเท่าหรือเกินประสิทธิภาพของโมเดลเหล่านั้น Mistral AI เน้นย้ำว่า Mistral Small 3.1 เป็นโมเดลโอเพนซอร์สตัวแรกที่ไม่เพียงแต่ตรงตาม แต่ยังเกินประสิทธิภาพของโมเดลขนาดเล็กที่เป็นกรรมสิทธิ์ชั้นนำในมิติต่างๆ

ต่อยอดจาก Mistral Small 3 โมเดลใหม่นี้มีประสิทธิภาพข้อความที่ได้รับการปรับปรุง ความเข้าใจแบบ multimodal และหน้าต่างบริบทที่ขยายได้สูงสุด 128,000 โทเค็น Mistral AI อ้างว่าโมเดลประมวลผลข้อมูลด้วยความเร็ว 150 โทเค็นต่อวินาที ทำให้เหมาะสำหรับแอปพลิเคชันที่ต้องการเวลาตอบสนองที่รวดเร็ว

ความคล่องตัวและการเข้าถึงของ Mistral Small 3.1

Mistral Small 3.1 ได้รับการออกแบบมาให้ทำงานบนฮาร์ดแวร์ที่เข้าถึงได้ง่าย เช่น RTX 4090 เดียวหรือ Mac ที่มี RAM 32GB ทำให้เหมาะอย่างยิ่งสำหรับแอปพลิเคชันบนอุปกรณ์ โมเดลสามารถปรับแต่งอย่างละเอียดสำหรับโดเมนเฉพาะ ทำให้สามารถสร้างผู้เชี่ยวชาญเฉพาะเรื่องที่มีความแม่นยำสูง ซึ่งมีประโยชน์อย่างยิ่งในสาขาต่างๆ เช่น คำแนะนำทางกฎหมาย การวินิจฉัยทางการแพทย์ และการสนับสนุนด้านเทคนิค

โมเดลใหม่นี้ได้รับการปรับแต่งสำหรับแอปพลิเคชันระดับองค์กรและผู้บริโภคที่หลากหลายซึ่งต้องการความเข้าใจแบบ multimodal กรณีการใช้งานที่เป็นไปได้ ได้แก่ การตรวจสอบเอกสาร การวินิจฉัย การประมวลผลภาพบนอุปกรณ์ การตรวจสอบด้วยภาพเพื่อควบคุมคุณภาพ การตรวจจับวัตถุในระบบรักษาความปลอดภัย การสนับสนุนลูกค้าตามภาพ และความช่วยเหลือทั่วไป

Mistral OCR: การทำความเข้าใจเอกสารขั้นสูง

เมื่อต้นเดือนมีนาคม Mistral AI ได้ประกาศ Mistral OCR ซึ่งบริษัท ยกย่องว่าเป็น ‘API การทำความเข้าใจเอกสารที่ดีที่สุดในโลก’ Mistral OCR เป็น API Optical Character Recognition (OCR) ที่สามารถแยกข้อความ ตาราง สมการ และรูปภาพจากเอกสารที่ซับซ้อน Mistral AI เชื่อว่าเทคโนโลยีนี้จะปฏิวัติวิธีการที่องค์กรประมวลผลและใช้ประโยชน์จากแหล่งข้อมูลจำนวนมหาศาล

ตามที่บริษัท ระบุ Mistral OCR ประมวลผลได้ถึง 2,000 หน้าต่อนาที รองรับความสามารถหลายภาษาและหลายรูปแบบ และให้ผลลัพธ์ที่มีโครงสร้าง เช่น JSON เพื่อการผสานรวมเข้ากับเวิร์กโฟลว์ AI ได้อย่างราบรื่น การทดสอบภายในระบุว่า Mistral OCR เป็นผู้นำตลาดในด้านความแม่นยำในการแยกข้อความ โดยเฉพาะอย่างยิ่งสำหรับเอกสารที่สแกน เนื้อหาทางคณิตศาสตร์ และข้อความหลายภาษา ซึ่งแตกต่างจากโซลูชัน OCR แบบดั้งเดิม ตรงที่ยังแยกรูปภาพที่ฝังอยู่ ทำให้เหมาะสำหรับการวิจัยทางวิทยาศาสตร์ การยื่นเอกสารตามกฎข้อบังคับ และการแปลงเอกสารทางประวัติศาสตร์ให้เป็นดิจิทัล

Mistral AI รายงานว่า OCR กำลังช่วยเหลือองค์กรและสถาบันวิจัยในการแปลงวรรณกรรมให้เป็นดิจิทัล ปรับปรุงการบริการลูกค้า และรักษาสิ่งพิมพ์ในอดีต นอกจากนี้ OCR ยังช่วยให้บริษัทต่างๆ แปลงวรรณกรรมทางเทคนิค แบบวิศวกรรม บันทึกการบรรยาย งานนำเสนอ การยื่นเอกสารตามกฎข้อบังคับ และอื่นๆ ให้เป็นรูปแบบที่จัดทำดัชนีและพร้อมตอบคำถาม ความสามารถของ Mistral OCR มีให้ทดลองใช้ฟรีบน le Chat และบริษัท คาดว่าจะมีการปรับปรุงโมเดลเพิ่มเติมในอีกไม่กี่สัปดาห์ข้างหน้า การพัฒนาอย่างต่อเนื่องเหล่านี้สะท้อนให้เห็นถึงธรรมชาติที่ไม่หยุดนิ่งของ AI และศักยภาพในการปรับเปลี่ยนอุตสาหกรรมที่หลากหลาย