โมเดล Qwen ของ Alibaba จุดประกายความทะเยอทะยาน AI ของจีน

การขยายตัวของระบบนิเวศ AI ของจีน

เมื่อวันที่ 5 มีนาคม Alibaba ยักษ์ใหญ่ด้านเทคโนโลยีของจีนได้เปิดตัว QwQ-32B โมเดลการให้เหตุผลด้วยปัญญาประดิษฐ์ (AI) รุ่นล่าสุด ซึ่งส่งผลให้หุ้นของบริษัทที่จดทะเบียนในฮ่องกงพุ่งสูงขึ้นถึง 8% อย่างน่าประทับใจ แม้ว่าโมเดลใหม่นี้อาจยังไม่สามารถเทียบเคียงความสามารถของระบบ AI ชั้นนำในสหรัฐอเมริกาได้ แต่มีรายงานว่า QwQ-32B มีประสิทธิภาพเทียบเท่ากับ R1 โมเดลของ DeepSeek ซึ่งเป็นคู่แข่งในประเทศ สิ่งที่ทำให้ QwQ-32B แตกต่างคือความต้องการพลังงานคอมพิวเตอร์ที่ต่ำกว่าอย่างมาก ทั้งในการพัฒนาและการดำเนินงานอย่างต่อเนื่อง ผู้สร้าง QwQ-32B อ้างว่ามันรวบรวม ‘จิตวิญญาณปรัชญาโบราณ’ เข้าถึงปัญหาด้วยความรู้สึก ‘ประหลาดใจและสงสัยอย่างแท้จริง’

Scott Singer นักวิชาการรับเชิญในโครงการ Technology and International Affairs Program ที่ Carnegie Endowment for International Peace กล่าวว่า “การเปิดตัวครั้งนี้ตอกย้ำความสามารถในการแข่งขันในวงกว้างของระบบนิเวศ AI ระดับแนวหน้าของจีน” ระบบนิเวศนี้เป็นภูมิทัศน์ที่มีชีวิตชีวาซึ่งประกอบด้วยผู้เล่นเช่น DeepSeek พร้อมด้วยโมเดล R1 และ Tencent พร้อมด้วยโมเดล Hunyuan ที่น่าสังเกตคือ Jack Clark ผู้ร่วมก่อตั้ง Anthropic ได้ยอมรับว่า Hunyuan เป็น ‘ระดับโลก’ ในบางแง่มุม อย่างไรก็ตาม สิ่งสำคัญคือต้องทราบว่าการประเมินโมเดลล่าสุดของ Alibaba ยังอยู่ในช่วงเริ่มต้น ความยากลำบากโดยธรรมชาติในการวัดความสามารถของโมเดล ประกอบกับข้อเท็จจริงที่ว่า QwQ-32B ได้รับการประเมินภายในโดย Alibaba เท่านั้น หมายความว่า “สภาพแวดล้อมของข้อมูลยังไม่สมบูรณ์มากนักในขณะนี้” ดังที่ Singer ชี้ให้เห็น

การเปิดตัวโมเดล R1 ของ DeepSeek ในเดือนมกราคมได้ส่งแรงกระเพื่อมไปทั่วตลาดหุ้นทั่วโลก ทำให้ระบบนิเวศเทคโนโลยีของจีนกลายเป็นจุดสนใจในระดับนานาชาติ ความสนใจนี้ยิ่งเพิ่มมากขึ้นจากการรับรู้ที่เพิ่มขึ้นในสหรัฐอเมริกาเกี่ยวกับการแข่งขันกับจีนเพื่อให้ได้มาซึ่งปัญญาประดิษฐ์ทั่วไป (AGI) AGI แสดงถึงระดับความซับซ้อนของ AI ตามสมมุติฐานที่ระบบมีความสามารถในการทำงานด้านความรู้ความเข้าใจที่หลากหลาย ตั้งแต่การออกแบบกราฟิกไปจนถึงการวิจัยการเรียนรู้ของเครื่อง ในระดับที่เทียบเท่าหรือเกินความสามารถของมนุษย์

นัยเชิงกลยุทธ์ของ AGI

การพัฒนา AGI ได้รับการคาดการณ์อย่างกว้างขวางว่าจะมอบความได้เปรียบทางทหารและเชิงกลยุทธ์ที่สำคัญแก่หน่วยงานใดก็ตาม ไม่ว่าจะเป็นบริษัทหรือรัฐบาล ที่ประสบความสำเร็จก่อน แอปพลิเคชันที่เป็นไปได้ของระบบดังกล่าวมีมากมายและเปลี่ยนแปลงได้ ตั้งแต่ความสามารถในการทำสงครามไซเบอร์ขั้นสูงไปจนถึงการสร้างอาวุธทำลายล้างสูงรูปแบบใหม่

ทีมงานที่รับผิดชอบโมเดลล่าสุดของ Alibaba ประกาศว่า “เรามั่นใจว่าการรวมโมเดลพื้นฐานที่แข็งแกร่งขึ้นเข้ากับการเรียนรู้แบบเสริมกำลังที่ขับเคลื่อนโดยทรัพยากรการคำนวณที่ปรับขนาดได้ จะขับเคลื่อนเราให้เข้าใกล้การบรรลุ AGI มากขึ้น” การแสวงหา AGI นี้เป็นหัวข้อทั่วไปที่ดำเนินการผ่านห้องปฏิบัติการ AI ชั้นนำส่วนใหญ่ วัตถุประสงค์ที่ระบุไว้ของ DeepSeek คือ “ไขปริศนาของ AGI ด้วยความอยากรู้อยากเห็น” ในทำนองเดียวกัน พันธกิจของ OpenAI คือ “เพื่อให้แน่ใจว่าปัญญาประดิษฐ์ทั่วไป—ระบบ AI ที่โดยทั่วไปแล้วฉลาดกว่ามนุษย์—เป็นประโยชน์ต่อมนุษยชาติทั้งหมด” CEO ของ AI ที่โดดเด่นได้แสดงความคาดหวังว่าระบบที่เหมือน AGI อาจเกิดขึ้นภายในวาระปัจจุบันของประธานาธิบดีทรัมป์

การปรากฏตัวอีกครั้งของ Jack Ma และภูมิทัศน์เทคโนโลยีของจีน

ความก้าวหน้าทาง AI ล่าสุดของ Alibaba เกิดขึ้นหลังจากการปรากฏตัวต่อสาธารณะที่โดดเด่นของ Jack Ma ผู้ร่วมก่อตั้งบริษัท เขาได้รับการนั่งแถวหน้าอย่างเด่นชัดในระหว่างการประชุมระหว่างประธานาธิบดีสี จิ้นผิง และบุคคลสำคัญทางธุรกิจชั้นนำของจีน นี่เป็นการเปลี่ยนแปลงที่สำคัญสำหรับ Ma ซึ่งส่วนใหญ่ได้ถอนตัวจากสายตาสาธารณะตั้งแต่ปี 2020 การวิพากษ์วิจารณ์ก่อนหน้านี้ของเขาเกี่ยวกับหน่วยงานกำกับดูแลของรัฐและธนาคารของรัฐที่ขัดขวางนวัตกรรมและดำเนินการด้วย ‘ความคิดแบบโรงรับจำนำ’ ดูเหมือนจะนำไปสู่ช่วงเวลาที่การมองเห็นลดลง

ในช่วงที่ Ma ไม่อยู่ในความสนใจ รัฐบาลจีนได้ดำเนินการตามมาตรการหลายอย่างที่มุ่งเป้าไปที่อุตสาหกรรมเทคโนโลยี มีการกำหนดกฎระเบียบที่เข้มงวดมากขึ้นเกี่ยวกับวิธีที่บริษัทต่างๆ สามารถใช้ข้อมูลและมีส่วนร่วมในการแข่งขันในตลาด ในขณะเดียวกัน รัฐบาลก็ใช้การควบคุมแพลตฟอร์มดิจิทัลที่สำคัญมากขึ้น

การเปลี่ยนลำดับความสำคัญ: จากการปราบปรามเทคโนโลยีไปสู่การฟื้นฟูเศรษฐกิจ

ภายในปี 2022 การเปลี่ยนแปลงที่ชัดเจนในจุดสนใจของรัฐบาลก็ปรากฏขึ้น ภัยคุกคามที่รับรู้ได้จากอุตสาหกรรมเทคโนโลยีดูเหมือนจะลดลงเมื่อเทียบกับความท้าทายที่ใกล้เข้ามาของภาวะเศรษฐกิจชะงักงัน Singer อธิบายว่า “เรื่องราวความซบเซาทางเศรษฐกิจนั้น และความพยายามที่จะพลิกกลับ ได้กำหนดรูปแบบนโยบายมากมายในช่วง 18 เดือนที่ผ่านมา” ขณะนี้จีนกำลังดำเนินการอย่างแข็งขันในการนำเทคโนโลยีล้ำสมัยมาใช้ รายงานระบุว่าอย่างน้อย 13 รัฐบาลเมือง และ 10 บริษัทพลังงานของรัฐ ได้รวมโมเดล DeepSeek เข้ากับระบบปฏิบัติการของตนแล้ว

แนวโน้มของประสิทธิภาพ AI ที่เพิ่มขึ้น

โมเดลของ Alibaba เป็นตัวอย่างของแนวโน้มที่ต่อเนื่องในสาขา AI: การเพิ่มประสิทธิภาพของระบบอย่างสม่ำเสมอควบคู่ไปกับการลดต้นทุนการดำเนินงาน Epoch AI ซึ่งเป็นองค์กรวิจัยที่ไม่แสวงหาผลกำไร ประเมินว่าพลังการคำนวณที่จำเป็นสำหรับการฝึกอบรมระบบ AI ได้เพิ่มขึ้นในอัตราที่เกิน 4 เท่าต่อปี อย่างไรก็ตาม ความก้าวหน้าพร้อมกันในการออกแบบอัลกอริทึมได้นำไปสู่การเพิ่มประสิทธิภาพของพลังการคำนวณนั้นขึ้นสามเท่าในแต่ละปี ในทางปฏิบัติ หมายความว่าระบบ AI ที่อาจต้องใช้ชิปคอมพิวเตอร์ขั้นสูง 10,000 ชิปสำหรับการฝึกอบรมเมื่อปีที่แล้ว สามารถฝึกอบรมได้โดยใช้เพียงหนึ่งในสามของจำนวนนั้นในปีนี้

บทบาทสำคัญของชิปคอมพิวเตอร์ระดับไฮเอนด์

แม้จะมีการเพิ่มประสิทธิภาพที่น่าประทับใจเหล่านี้ แต่ Singer เตือนว่าชิปคอมพิวเตอร์ระดับไฮเอนด์ยังคงมีความจำเป็นสำหรับการพัฒนา AI ขั้นสูง ความเป็นจริงนี้ตอกย้ำความท้าทายอย่างต่อเนื่องที่เกิดจากการควบคุมการส่งออกของสหรัฐฯ สำหรับชิปเหล่านี้สำหรับบริษัท AI ของจีน เช่น Alibaba และ DeepSeek CEO ของ DeepSeek ได้ระบุโดยเฉพาะว่าการเข้าถึงชิป แทนที่จะเป็นทรัพยากรทางการเงินหรือความสามารถพิเศษ เป็นคอขวดหลักของพวกเขา

กระบวนทัศน์ใหม่: ‘โมเดลการให้เหตุผล’

QwQ แสดงถึงการเพิ่มล่าสุดในรุ่นที่กำลังเติบโตของระบบ AI ที่จัดอยู่ในประเภท ‘โมเดลการให้เหตุผล’ ผู้เชี่ยวชาญบางคนมองว่านี่เป็นการเปลี่ยนแปลงกระบวนทัศน์ในสาขา AI ก่อนหน้านี้ ระบบ AI ได้รับการปรับปรุงผ่านการรวมกันของการเพิ่มพลังการคำนวณที่ใช้สำหรับการฝึกอบรม และการเพิ่มปริมาณและคุณภาพของข้อมูลการฝึกอบรม

กระบวนทัศน์ใหม่นี้เน้นวิธีการที่แตกต่างออกไป มันเกี่ยวข้องกับการนำโมเดลที่ผ่านการฝึกอบรมเบื้องต้นแล้ว ในกรณีนี้คือ Qwen 2.5-32B และจากนั้นเพิ่มทรัพยากรการคำนวณที่จัดสรรให้กับระบบอย่างมีนัยสำคัญเมื่อตอบสนองต่อข้อความค้นหาเฉพาะ ดังที่ทีม Qwen กล่าวไว้อย่างชัดเจนว่า “เมื่อได้รับเวลาในการไตร่ตรอง ตั้งคำถาม และไตร่ตรอง ความเข้าใจของแบบจำลองเกี่ยวกับคณิตศาสตร์และการเขียนโปรแกรมจะเบ่งบานเหมือนดอกไม้ที่เปิดรับแสงแดด” ข้อสังเกตนี้สอดคล้องกับแนวโน้มที่เห็นในแบบจำลองตะวันตก ซึ่งเทคนิคที่ช่วยให้มีเวลา ‘คิด’ ที่ยาวนานขึ้นส่งผลให้ประสิทธิภาพดีขึ้นอย่างมากในงานวิเคราะห์ที่ซับซ้อน

การเปิดตัว Open-Weight และพลวัตของตลาด

QwQ ของ Alibaba ได้รับการเผยแพร่ภายใต้โมเดล ‘open weight’ ซึ่งหมายความว่าน้ำหนัก ซึ่งโดยพื้นฐานแล้วประกอบขึ้นเป็นโมเดลและสามารถเข้าถึงได้ในรูปแบบไฟล์คอมพิวเตอร์ สามารถดาวน์โหลดและเรียกใช้ในเครื่องได้ แม้แต่บนแล็ปท็อประดับไฮเอนด์ ที่น่าสนใจคือ ตัวอย่างของโมเดลที่เปิดตัวในเดือนพฤศจิกายนของปีก่อนหน้านี้ได้รับความสนใจน้อยกว่ามาก Singer ตั้งข้อสังเกตว่า “ตลาดหุ้นโดยทั่วไปมีปฏิกิริยาตอบสนองต่อการเปิดตัวโมเดล ไม่ใช่กับวิถีของเทคโนโลยี” ซึ่งคาดว่าจะยังคงก้าวหน้าอย่างรวดเร็วในทั้งสองฝั่งของมหาสมุทรแปซิฟิก เขายังเน้นย้ำว่า “ระบบนิเวศของจีนมีผู้เล่นจำนวนมากอยู่ในนั้น ซึ่งทั้งหมดกำลังนำเสนอโมเดลที่ทรงพลังและน่าสนใจมาก และยังไม่ชัดเจนว่าใครจะปรากฏตัวขึ้น เมื่อทุกอย่างพูดและทำเสร็จแล้ว ในฐานะผู้ที่มีโมเดลที่ดีที่สุด”

การตรวจสอบรายละเอียดสถาปัตยกรรมของ QwQ-32B

โมเดล QwQ-32B แม้ว่าจะสร้างขึ้นบนพื้นฐานของ Qwen 2.5-32B แต่ก็มีการปรับเปลี่ยนสถาปัตยกรรมที่สำคัญหลายประการและการปรับปรุงการฝึกอบรมที่ก่อให้เกิดความสามารถในการให้เหตุผลที่ดีขึ้น การปรับปรุงเหล่านี้สามารถแบ่งออกเป็นหมวดหมู่กว้างๆ ได้ดังนี้:

  • การขยาย Context Window: Context window ซึ่งกำหนดปริมาณข้อความที่โมเดลสามารถพิจารณาได้ในคราวเดียว มีแนวโน้มว่าจะขยายออกไปอย่างมาก สิ่งนี้ทำให้ QwQ-32B สามารถประมวลผลและทำความเข้าใจข้อความที่ยาวขึ้นและซับซ้อนมากขึ้นได้ดีขึ้น นำไปสู่ความเข้าใจที่ดีขึ้นและการตอบสนองที่ละเอียดยิ่งขึ้น

  • กลไก Attention ที่ได้รับการปรับปรุง: กลไก attention ซึ่งเป็นองค์ประกอบหลักของโมเดลที่ใช้ Transformer เช่น QwQ-32B มีแนวโน้มว่าจะได้รับการปรับปรุง ซึ่งอาจเกี่ยวข้องกับเทคนิคต่างๆ เช่น multi-headed attention หรือ sparse attention ทำให้โมเดลสามารถมุ่งเน้นไปที่ข้อมูลที่เกี่ยวข้องภายในข้อความอินพุตได้อย่างมีประสิทธิภาพมากขึ้นและกรองสัญญาณรบกวนออกไป

  • Reinforcement Learning from Human Feedback (RLHF): แม้ว่าจะไม่ได้ระบุไว้อย่างชัดเจน แต่ก็มีความเป็นไปได้สูงที่ QwQ-32B จะได้รับการปรับแต่งอย่างละเอียดโดยใช้ RLHF เทคนิคนี้เกี่ยวข้องกับการฝึกอบรมโมเดลเพื่อสร้างเอาต์พุตที่ผู้ประเมินที่เป็นมนุษย์ต้องการ นำไปสู่การปรับปรุงในด้านต่างๆ เช่น ความสอดคล้อง ความช่วยเหลือ และความไม่เป็นอันตราย

  • Instruction Tuning: QwQ-32B อาจได้รับการปรับแต่งคำสั่งอย่างกว้างขวาง ซึ่งเป็นกระบวนการที่โมเดลได้รับการฝึกอบรมเกี่ยวกับชุดคำสั่งที่หลากหลายและเอาต์พุตที่สอดคล้องกัน สิ่งนี้ช่วยให้โมเดลสามารถสรุปผลไปยังงานใหม่ได้ดีขึ้นและปฏิบัติตามคำแนะนำได้แม่นยำยิ่งขึ้น

  • Chain-of-Thought Prompting: โมเดลได้รับการออกแบบมาโดยเฉพาะเพื่อใช้ประโยชน์จากการแจ้งเตือนแบบ chain-of-thought ซึ่งเป็นเทคนิคที่โมเดลได้รับการสนับสนุนให้สร้างชุดขั้นตอนการให้เหตุผลระดับกลางก่อนที่จะได้คำตอบสุดท้าย สิ่งนี้ส่งเสริมการให้เหตุผลที่รอบคอบและมีเหตุผลมากขึ้น

ผลกระทบต่ออุตสาหกรรมเฉพาะ

ความก้าวหน้าที่รวบรวมโดย QwQ-32B และโมเดล AI อื่นๆ ของจีนมีนัยสำคัญต่ออุตสาหกรรมต่างๆ ทั้งในประเทศจีนและทั่วโลก ภาคส่วนสำคัญบางส่วนที่น่าจะได้รับผลกระทบ ได้แก่:

  • อีคอมเมิร์ซ: ธุรกิจหลักของ Alibaba อีคอมเมิร์ซ จะได้รับประโยชน์อย่างมากจากความสามารถ AI ที่ได้รับการปรับปรุง ซึ่งรวมถึงด้านต่างๆ เช่น คำแนะนำส่วนบุคคล แชทบอทบริการลูกค้า การตรวจจับการฉ้อโกง และการเพิ่มประสิทธิภาพห่วงโซ่อุปทาน

  • การเงิน: โมเดล AI สามารถใช้สำหรับงานต่างๆ เช่น การประเมินความเสี่ยง การตรวจจับการฉ้อโกง การซื้อขายอัลกอริทึม และการจัดการลูกค้าสัมพันธ์ ความสามารถในการให้เหตุผลที่เพิ่มขึ้นของโมเดลเช่น QwQ-32B อาจนำไปสู่การคาดการณ์ทางการเงินที่แม่นยำยิ่งขึ้นและการตัดสินใจที่ดีขึ้น

  • การดูแลสุขภาพ: AI สามารถช่วยในการค้นพบยา การวินิจฉัยโรค การแพทย์เฉพาะบุคคล และการตรวจสอบผู้ป่วย โมเดลการให้เหตุผลที่ทรงพลังยิ่งขึ้นสามารถวิเคราะห์ข้อมูลทางการแพทย์ที่ซับซ้อนและให้ข้อมูลเชิงลึกที่ไม่สามารถเข้าถึงได้ก่อนหน้านี้

  • การผลิต: ระบบอัตโนมัติที่ขับเคลื่อนด้วย AI การควบคุมคุณภาพ และการบำรุงรักษาเชิงคาดการณ์สามารถเพิ่มประสิทธิภาพและลดต้นทุนในกระบวนการผลิต

  • การขนส่ง: ยานยนต์ไร้คนขับ ระบบจัดการจราจร และการเพิ่มประสิทธิภาพด้านโลจิสติกส์ต้องพึ่งพา AI อย่างมาก ความก้าวหน้าในการให้เหตุผล AI สามารถนำไปสู่เครือข่ายการขนส่งที่ปลอดภัยและมีประสิทธิภาพมากขึ้น

  • การศึกษา: โมเดล AI ได้รับการปรับใช้มากขึ้นเรื่อยๆ เพื่อให้การสนับสนุนที่ดีขึ้นสำหรับนักเรียน และแม้แต่การสอนพิเศษส่วนบุคคล

อนาคตของการแข่งขันและความร่วมมือด้าน AI

ความก้าวหน้าอย่างรวดเร็วของโมเดล AI ของจีน เช่น QwQ-32B ทำให้เกิดคำถามสำคัญเกี่ยวกับอนาคตของการแข่งขันและความร่วมมือด้าน AI ในระดับโลก ในขณะที่พลวัตการแข่งขันมีอยู่อย่างไม่ต้องสงสัย โดยเฉพาะอย่างยิ่งระหว่างสหรัฐอเมริกาและจีน แต่ก็มีประโยชน์ที่เป็นไปได้ในการทำงานร่วมกันและการแบ่งปันความรู้

  • โอเพนซอร์ส vs. โคลสซอร์ส: การตัดสินใจของ Alibaba ที่จะเปิดตัว QwQ-32B เป็นโมเดล open-weight นั้นมีความสำคัญ มันตรงกันข้ามกับแนวทางที่บริษัท AI ตะวันตกบางแห่งใช้ ซึ่งรักษารูปแบบของตนไว้เป็นระบบที่เป็นกรรมสิทธิ์และปิดแหล่งที่มา โมเดลโอเพนซอร์สสามารถส่งเสริมความร่วมมือที่มากขึ้นและเร่งสร้างนวัตกรรมโดยอนุญาตให้นักวิจัยและนักพัฒนาทั่วโลกสร้างผลงานที่มีอยู่

  • การแบ่งปันข้อมูลและการกำหนดมาตรฐาน: การพัฒนาระบบ AI ที่แข็งแกร่งและเชื่อถือได้ต้องใช้ข้อมูลจำนวนมหาศาล ความร่วมมือระหว่างประเทศในการแบ่งปันข้อมูลและการสร้างมาตรฐานร่วมกันจะเป็นประโยชน์ต่อชุมชน AI ทั้งหมด

  • ข้อควรพิจารณาด้านจริยธรรม: เมื่อระบบ AI มีประสิทธิภาพมากขึ้น ข้อควรพิจารณาด้านจริยธรรมก็มีความสำคัญมากขึ้น การเจรจาและความร่วมมือระดับโลกเป็นสิ่งจำเป็นเพื่อให้แน่ใจว่า AI ได้รับการพัฒนาและปรับใช้อย่างมีความรับผิดชอบ พร้อมด้วยมาตรการป้องกันที่เหมาะสมเพื่อลดความเสี่ยงที่อาจเกิดขึ้น

  • การแลกเปลี่ยนผู้มีความสามารถ: สาขา AI ได้รับประโยชน์จากกลุ่มผู้มีความสามารถที่หลากหลายและกระจายอยู่ทั่วโลก การอำนวยความสะดวกในการแลกเปลี่ยนนักวิจัยและวิศวกรระหว่างประเทศสามารถส่งเสริมการถ่ายทอดความรู้และเร่งความก้าวหน้า

การเกิดขึ้นของ QwQ-32B และโมเดล AI ขั้นสูงอื่นๆ ของจีนแสดงถึงก้าวสำคัญในการวิวัฒนาการอย่างต่อเนื่องของปัญญาประดิษฐ์ มันเน้นย้ำถึงความสามารถที่เพิ่มขึ้นของระบบนิเวศเทคโนโลยีของจีนและตอกย้ำถึงผลกระทบระดับโลกของความก้าวหน้าของ AI ปีต่อๆ ไปน่าจะเป็นพยานถึงความก้าวหน้าอย่างรวดเร็วอย่างต่อเนื่อง การแข่งขันที่เข้มข้น และการเรียกร้องให้มีความร่วมมือระหว่างประเทศเพิ่มขึ้นเพื่อให้แน่ใจว่า AI เป็นประโยชน์ต่อมนุษยชาติโดยรวม