แนวทางนวัตกรรมของ Ant ในการฝึกอบรมแบบจำลอง AI
Ant Group ยักษ์ใหญ่ด้านฟินเทคที่ได้รับการสนับสนุนจาก Jack Ma ประสบความสำเร็จครั้งสำคัญในด้านปัญญาประดิษฐ์ (AI) โดยใช้ประโยชน์จากเซมิคอนดักเตอร์ที่ผลิตในจีน แนวทางที่เป็นนวัตกรรมใหม่นี้ช่วยให้บริษัทสามารถพัฒนาเทคนิคสำหรับการฝึกอบรมแบบจำลอง AI ซึ่งส่งผลให้ต้นทุนลดลงอย่างน่าทึ่งถึง 20% แหล่งข่าวที่คุ้นเคยกับเรื่องนี้เปิดเผยว่า Ant ใช้ชิปในประเทศ รวมถึงชิปจากบริษัทในเครือ Alibaba Group Holding Ltd. และ Huawei Technologies Co. เพื่อฝึกอบรมแบบจำลองโดยใช้วิธีการเรียนรู้ของเครื่อง Mixture of Experts (MoE)
ผลลัพธ์ที่ Ant ได้รับนั้นเทียบได้กับผลลัพธ์ที่ได้จากการใช้ชิปของ Nvidia Corp. เช่น H800 ซึ่งเป็นโปรเซสเซอร์ประสิทธิภาพสูงที่ถูกจำกัดการส่งออกไปยังประเทศจีนโดยสหรัฐอเมริกา ในขณะที่ Ant ยังคงใช้ Nvidia สำหรับการพัฒนา AI แต่ก็มีการพึ่งพาทางเลือกอื่นมากขึ้นเรื่อยๆ รวมถึง Advanced Micro Devices Inc. (AMD) และชิปจีน สำหรับแบบจำลองล่าสุด
เข้าสู่การแข่งขัน AI: จีน vs. สหรัฐอเมริกา
การบุกเข้าสู่การพัฒนาแบบจำลอง AI ของ Ant ทำให้บริษัทอยู่ท่ามกลางการแข่งขันที่ดุเดือดระหว่างบริษัทจีนและสหรัฐอเมริกา การแข่งขันนี้ทวีความรุนแรงขึ้นนับตั้งแต่ DeepSeek แสดงให้เห็นถึงศักยภาพในการฝึกอบรมแบบจำลองที่มีความสามารถสูงด้วยต้นทุนเพียงเล็กน้อยเมื่อเทียบกับยักษ์ใหญ่ในอุตสาหกรรมอย่าง OpenAI และ Alphabet Inc.’s Google ซึ่งลงทุนไปหลายพันล้าน ความสำเร็จของ Ant ตอกย้ำความมุ่งมั่นของบริษัทจีนในการใช้ทางเลือกที่มาจากท้องถิ่นแทนเซมิคอนดักเตอร์ Nvidia ที่ทันสมัยที่สุด
คำมั่นสัญญาของการอนุมาน AI ที่คุ้มค่า
เอกสารการวิจัยที่เผยแพร่โดย Ant ในเดือนนี้เน้นย้ำถึงศักยภาพของแบบจำลอง โดยอ้างว่ามีประสิทธิภาพที่เหนือกว่าในเกณฑ์มาตรฐานบางอย่างเมื่อเทียบกับ Meta Platforms Inc. แม้ว่าข้อเรียกร้องเหล่านี้ยังไม่ได้รับการตรวจสอบโดยอิสระจาก Bloomberg News อย่างไรก็ตาม หากแพลตฟอร์มของ Ant ทำงานตามที่โฆษณาไว้ ก็อาจแสดงถึงความก้าวหน้าครั้งสำคัญในการพัฒนาปัญญาประดิษฐ์ของจีน นี่เป็นเพราะความสามารถในการลดต้นทุนการอนุมาน (inferencing) อย่างมาก ซึ่งเป็นกระบวนการสนับสนุนบริการ AI
Mixture of Experts: ผู้เปลี่ยนเกมใน AI
ในขณะที่บริษัทต่างๆ ทุ่มทรัพยากรจำนวนมากให้กับ AI แบบจำลอง MoE ได้รับความโดดเด่นในฐานะแนวทางที่ได้รับความนิยมและมีประสิทธิภาพ เทคนิคนี้ถูกใช้โดยบริษัทต่างๆ เช่น Google และ DeepSeek สตาร์ทอัพในหางโจว ซึ่งเกี่ยวข้องกับการแบ่งงานออกเป็นชุดข้อมูลขนาดเล็ก ซึ่งคล้ายกับการมีทีมผู้เชี่ยวชาญ โดยแต่ละคนจะมุ่งเน้นไปที่ส่วนเฉพาะของงาน ซึ่งจะช่วยเพิ่มประสิทธิภาพของกระบวนการโดยรวม
การเอาชนะคอขวด GPU
ตามธรรมเนียมแล้ว การฝึกอบรมแบบจำลอง MoE นั้นต้องพึ่งพาชิปประสิทธิภาพสูงอย่างมาก เช่น หน่วยประมวลผลกราฟิก (GPU) ที่ผลิตโดย Nvidia ต้นทุนที่สูงลิ่วของชิปเหล่านี้เป็นอุปสรรคสำคัญสำหรับบริษัทขนาดเล็กจำนวนมาก ซึ่งจำกัดการนำแบบจำลอง MoE มาใช้อย่างแพร่หลาย อย่างไรก็ตาม Ant ได้ทำงานอย่างขยันขันแข็งในวิธีการฝึกอบรมแบบจำลองภาษาขนาดใหญ่ (LLMs) อย่างมีประสิทธิภาพมากขึ้น ซึ่งช่วยขจัดข้อจำกัดนี้ได้อย่างมีประสิทธิภาพ ชื่อเอกสารการวิจัยของพวกเขา ซึ่งกำหนดเป้าหมายที่จะปรับขนาดแบบจำลอง “โดยไม่ต้องใช้ GPU ระดับพรีเมียม” สะท้อนให้เห็นถึงวัตถุประสงค์นี้อย่างชัดเจน
ท้าทายการครอบงำของ Nvidia
แนวทางของ Ant ท้าทายกลยุทธ์ที่แพร่หลายโดยตรงซึ่งสนับสนุนโดย Jensen Huang ซีอีโอของ Nvidia Huang ได้โต้แย้งอย่างต่อเนื่องว่าความต้องการด้านการประมวลผลจะยังคงเติบโตต่อไป แม้ว่าจะมีการเกิดขึ้นของแบบจำลองที่มีประสิทธิภาพมากขึ้น เช่น R1 ของ DeepSeek เขาก็ตาม เขาเชื่อว่าบริษัทต่างๆ จะต้องใช้ชิปที่ดีกว่าเพื่อสร้างรายได้ที่สูงขึ้น แทนที่จะใช้ชิปที่ถูกกว่าเพื่อลดต้นทุน ดังนั้น Nvidia จึงยังคงมุ่งเน้นไปที่การสร้าง GPU ขนาดใหญ่ที่มีแกนประมวลผล ทรานซิสเตอร์ และความจุหน่วยความจำที่เพิ่มขึ้น
การวัดปริมาณการประหยัดต้นทุน
Ant ได้ให้ตัวเลขที่เป็นรูปธรรมเพื่อแสดงให้เห็นถึงความคุ้มค่าของแนวทางที่ปรับให้เหมาะสม บริษัทระบุว่าการฝึกอบรม 1 ล้านล้านโทเค็นโดยใช้ฮาร์ดแวร์ประสิทธิภาพสูงจะมีค่าใช้จ่ายประมาณ 6.35 ล้านหยวน (880,000 ดอลลาร์) อย่างไรก็ตาม ด้วยการใช้ฮาร์ดแวร์ที่มีสเปคต่ำกว่าและเทคนิคที่ปรับให้เหมาะสม Ant สามารถลดต้นทุนนี้เหลือ 5.1 ล้านหยวน โทเค็นแสดงถึงหน่วยของข้อมูลที่แบบจำลองประมวลผลเพื่อเรียนรู้เกี่ยวกับโลกและให้คำตอบที่เกี่ยวข้องกับคำถามของผู้ใช้
ใช้ประโยชน์จากความก้าวหน้าของ AI สำหรับโซลูชันอุตสาหกรรม
Ant วางแผนที่จะใช้ประโยชน์จากความก้าวหน้าล่าสุดในแบบจำลองภาษาขนาดใหญ่ โดยเฉพาะ Ling-Plus และ Ling-Lite เพื่อพัฒนาโซลูชัน AI อุตสาหกรรมสำหรับภาคส่วนต่างๆ เช่น การดูแลสุขภาพและการเงิน แบบจำลองเหล่านี้ได้รับการออกแบบมาเพื่อตอบสนองความต้องการเฉพาะของอุตสาหกรรมและมอบโซลูชันที่ปรับให้เหมาะสม
การขยายแอปพลิเคชัน AI ในการดูแลสุขภาพ
ความมุ่งมั่นของ Ant ต่อการดูแลสุขภาพนั้นเห็นได้ชัดจากการรวมแพลตฟอร์มออนไลน์ของจีน Haodf.com เข้ากับบริการปัญญาประดิษฐ์ ด้วยการสร้าง AI Doctor Assistant, Ant มีเป้าหมายที่จะสนับสนุนเครือข่ายแพทย์ 290,000 คนของ Haodf โดยการช่วยเหลือในงานต่างๆ เช่น การจัดการเวชระเบียน การประยุกต์ใช้ AI นี้มีศักยภาพในการปรับปรุงประสิทธิภาพและความแม่นยำในการให้บริการด้านการดูแลสุขภาพได้อย่างมาก
ความช่วยเหลือที่ขับเคลื่อนด้วย AI สำหรับชีวิตประจำวัน
นอกเหนือจากการดูแลสุขภาพแล้ว Ant ยังได้พัฒนาแอป ‘ผู้ช่วยชีวิต’ AI ที่เรียกว่า Zhixiaobao และบริการ AI ที่ปรึกษาทางการเงินชื่อ Maxiaocai แอปพลิเคชันเหล่านี้แสดงให้เห็นถึงความทะเยอทะยานของ Ant ในการรวม AI เข้ากับแง่มุมต่างๆ ของชีวิตประจำวัน โดยให้ความช่วยเหลือส่วนบุคคลและชาญฉลาดแก่ผู้ใช้
การเปรียบเทียบประสิทธิภาพ: แบบจำลอง Ling กับคู่แข่ง
ในเอกสารการวิจัย Ant อ้างว่าแบบจำลอง Ling-Lite มีประสิทธิภาพเหนือกว่าแบบจำลอง Llama ของ Meta ในเกณฑ์มาตรฐานที่สำคัญสำหรับการทำความเข้าใจภาษาอังกฤษ นอกจากนี้ ทั้งแบบจำลอง Ling-Lite และ Ling-Plus ยังแสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่าเมื่อเทียบกับแบบจำลองของ DeepSeek ในเกณฑ์มาตรฐานภาษาจีน สิ่งนี้เน้นย้ำถึงตำแหน่งทางการแข่งขันของ Ant ในภูมิทัศน์ AI
ดังที่ Robin Yu ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ Shengshang Tech Co. ผู้ให้บริการโซลูชัน AI ในปักกิ่งกล่าวไว้อย่างเหมาะสมว่า “หากคุณพบจุดโจมตีหนึ่งจุดเพื่อเอาชนะปรมาจารย์กังฟูที่ดีที่สุดในโลก คุณก็ยังสามารถพูดได้ว่าคุณเอาชนะพวกเขาได้ ซึ่งเป็นเหตุผลว่าทำไมการประยุกต์ใช้ในโลกแห่งความเป็นจริงจึงมีความสำคัญ”
โอเพนซอร์สเพื่อการทำงานร่วมกันและนวัตกรรม
Ant ได้ทำให้แบบจำลอง Ling เป็นโอเพนซอร์ส ส่งเสริมการทำงานร่วมกันและนวัตกรรมภายในชุมชน AI Ling-Lite ประกอบด้วยพารามิเตอร์ 16.8 พันล้านพารามิเตอร์ ซึ่งเป็นการตั้งค่าที่ปรับได้ซึ่งควบคุมประสิทธิภาพของแบบจำลอง ในทางกลับกัน Ling-Plus มีพารามิเตอร์ 290 พันล้านพารามิเตอร์ที่ใหญ่กว่าอย่างมาก ทำให้เป็นหนึ่งในแบบจำลองภาษาที่ใหญ่กว่า เพื่อให้บริบท ผู้เชี่ยวชาญประเมินว่า GPT-4.5 ของ ChatGPT มีพารามิเตอร์ประมาณ 1.8 ล้านล้านพารามิเตอร์ ในขณะที่ DeepSeek-R1 มี 671 พันล้านพารามิเตอร์
การแก้ไขปัญหาในการฝึกอบรมแบบจำลอง
การเดินทางของ Ant ในการพัฒนาแบบจำลองเหล่านี้ไม่ได้ปราศจากความท้าทาย บริษัทประสบปัญหาในบางด้านของการฝึกอบรม โดยเฉพาะอย่างยิ่งเกี่ยวกับความเสถียร แม้แต่การเปลี่ยนแปลงเล็กน้อยในฮาร์ดแวร์หรือโครงสร้างของแบบจำลองก็อาจนำไปสู่ปัญหาได้ รวมถึงความผันผวนในอัตราความผิดพลาดของแบบจำลอง สิ่งนี้เน้นย้ำถึงความซับซ้อนและความละเอียดอ่อนที่เกี่ยวข้องกับการฝึกอบรมแบบจำลอง AI ขั้นสูง
การปรับใช้ในโลกแห่งความเป็นจริงในการดูแลสุขภาพ
ความมุ่งมั่นของ Ant ต่อการใช้งานจริงได้รับการพิสูจน์เพิ่มเติมโดยการปรับใช้เครื่องจักรแบบจำลองขนาดใหญ่ที่เน้นการดูแลสุขภาพ เครื่องจักรเหล่านี้กำลังถูกใช้งานโดยโรงพยาบาลและผู้ให้บริการด้านการดูแลสุขภาพเจ็ดแห่งในเมืองใหญ่ๆ เช่น ปักกิ่งและเซี่ยงไฮ้ แบบจำลองขนาดใหญ่ใช้ประโยชน์จาก DeepSeek R1, Qwen ของ Alibaba และ LLM ของ Ant เองเพื่อให้บริการให้คำปรึกษาทางการแพทย์
ตัวแทน AI สำหรับบริการด้านการดูแลสุขภาพที่ได้รับการปรับปรุง
นอกเหนือจากเครื่องจักรแบบจำลองขนาดใหญ่แล้ว Ant ยังได้เปิดตัวตัวแทน AI ทางการแพทย์สองตัว ได้แก่ Angel และ Yibaoer Angel ได้ให้บริการแก่สถานพยาบาลมากกว่า 1,000 แห่งแล้ว ในขณะที่ Yibaoer ให้การสนับสนุนบริการประกันสุขภาพ นอกจากนี้ ในเดือนกันยายนของปีก่อน Ant ได้เปิดตัวบริการ AI Healthcare Manager ภายในแอปการชำระเงิน Alipay ซึ่งขยายขอบเขตการเข้าถึงในภาคการดูแลสุขภาพ ความคิดริเริ่มเหล่านี้แสดงให้เห็นถึงความทุ่มเทของ Ant ในการใช้ประโยชน์จาก AI เพื่อเปลี่ยนแปลงและปรับปรุงการให้บริการด้านการดูแลสุขภาพ