Qwen3 อาลีบาบาจุดประกาย AI ต้นทุนต่ำ ประสิทธิภาพสูง

ภูมิทัศน์ของ AI มีการพัฒนาอย่างต่อเนื่อง โดยมีโมเดลและความก้าวหน้าใหม่ๆ เกิดขึ้นอย่างรวดเร็ว ท่ามกลางการพัฒนาล่าสุด การเปิดตัวโอเพนซอร์สของ Alibaba สำหรับโมเดล Tongyi Qianwen รุ่นต่อไป Qwen3 ได้รับความสนใจอย่างมาก ด้วยขนาดพารามิเตอร์ที่เล็กลง ต้นทุนที่ลดลง และประสิทธิภาพที่เพิ่มขึ้นเมื่อเทียบกับโมเดลชั้นนำอื่นๆ Qwen3 ได้วางตำแหน่งตัวเองเป็นคู่แข่งที่แข็งแกร่งในเวที AI ระดับโลก

Qwen3 โดดเด่นในฐานะโมเดลการให้เหตุผลแบบไฮบริดบุกเบิกในประเทศจีน โดยนำเสนอการผสมผสานที่น่าสนใจของประสิทธิภาพที่เพิ่มขึ้นและต้นทุนที่ลดลง ด้วยพารามิเตอร์ทั้งหมด 235 พันล้านพารามิเตอร์ ทำให้ต้องการทรัพยากรน้อยกว่าอย่างมากในการปรับใช้เมื่อเทียบกับโมเดลอื่นๆ ที่มีความสามารถคล้ายคลึงกัน ความคุ้มค่านี้ทำให้ Qwen3 เป็นตัวเลือกที่น่าสนใจสำหรับองค์กรที่ต้องการใช้ประโยชน์จากพลังของโมเดลภาษาขนาดใหญ่โดยไม่ทำให้งบประมาณบานปลาย

เสริมศักยภาพเอเจนต์และแอปพลิเคชัน AI

หนึ่งในไฮไลท์สำคัญของ Qwen3 คือศักยภาพในการเร่งการพัฒนาและการปรับใช้เอเจนต์ AI และแอปพลิเคชันโมเดลภาษาขนาดใหญ่ ในการประเมินความสามารถของเอเจนต์โมเดล Qwen3 ได้คะแนนที่น่าประทับใจ เหนือกว่าโมเดลระดับบนสุดอื่นๆ สิ่งนี้บ่งชี้ว่า Qwen3 สามารถลดอุปสรรคในการเข้าสู่การพัฒนาและปรับใช้เอเจนต์ AI ซึ่งอาจนำไปสู่การเพิ่มขึ้นของแอปพลิเคชันที่เป็นนวัตกรรมใหม่

ความต้องการที่เพิ่มขึ้นสำหรับความสามารถในการเรียกเครื่องมือในเอเจนต์ AI

เอเจนต์ AI ถูกนำมาใช้มากขึ้นเพื่อทำงานที่ซับซ้อนโดยอัตโนมัติและโต้ตอบกับโลกแห่งความเป็นจริง ความสามารถที่จำเป็นของเอเจนต์ AI ขึ้นอยู่กับความซับซ้อนและความเป็นอิสระของงานที่ได้รับการออกแบบมาให้ดำเนินการ

ระบบเอเจนต์ AI ที่แข็งแกร่งโดยทั่วไปต้องการความสามารถต่อไปนี้จากโมเดลพื้นฐาน:

  • ความเข้าใจและการสร้างภาษาขั้นพื้นฐาน: ความสามารถในการตีความคำสั่ง เข้าใจบริบท และสร้างการตอบสนองด้วยภาษาธรรมชาติได้อย่างแม่นยำ

  • การใช้และการเรียกเครื่องมือ: ความสามารถในการทำความเข้าใจและใช้เครื่องมือภายนอก รวมถึง API เพื่อทำงานเฉพาะให้สำเร็จ

  • การให้เหตุผลและการวางแผน: ความสามารถในการแบ่งเป้าหมายที่ซับซ้อนออกเป็นงานย่อยๆ ที่เล็กลง และดำเนินการตามลำดับเชิงตรรกะ

Qwen3 ตอบสนองความต้องการที่สำคัญสำหรับความสามารถในการเรียกเครื่องมือที่ดีขึ้นในเอเจนต์ AI สามารถผสานรวมเครื่องมือภายนอกได้อย่างแม่นยำ ทั้งในโหมดการคิดและไม่คิด ทำให้เป็นโมเดลโอเพนซอร์สชั้นนำสำหรับงานที่ซับซ้อนที่ใช้เอเจนต์เป็นหลัก

ในการประเมินความสามารถของเอเจนต์โมเดล Qwen3 ได้คะแนนสูง เหนือกว่าโมเดลระดับบนสุดอื่นๆ สิ่งนี้บ่งชี้ถึงการลดลงอย่างมีนัยสำคัญของอุปสรรคในการเข้าสู่การพัฒนาและปรับใช้เอเจนต์ AI

Qwen3 รองรับโปรโตคอล MCP โดยกำเนิดและมีความสามารถในการเรียกเครื่องมือที่แข็งแกร่ง เมื่อรวมกับเฟรมเวิร์ก Qwen-Agent ซึ่งห่อหุ้มเทมเพลตและตัวแยกวิเคราะห์การเรียกเครื่องมือ ทำให้กระบวนการพัฒนาง่ายขึ้นและเปิดใช้งานการทำงานของเอเจนต์ที่มีประสิทธิภาพบนอุปกรณ์มือถือและคอมพิวเตอร์ นักพัฒนาสามารถกำหนดเครื่องมือที่มีอยู่ตามไฟล์กำหนดค่า MCP และรวมเข้าด้วยกันโดยใช้เฟรมเวิร์ก Qwen-Agent หรือเครื่องมือที่กำหนดเองอื่นๆ สิ่งนี้ช่วยให้สามารถพัฒนาเอเจนต์อัจฉริยะได้อย่างรวดเร็วด้วยฐานความรู้และความสามารถในการใช้เครื่องมือ

นอกจากนี้ Qwen3 ยังแสดงให้เห็นถึงประสิทธิภาพที่แข็งแกร่งในด้านความเข้าใจและการสร้างภาษาขั้นพื้นฐาน ตลอดจนความสามารถในการให้เหตุผล

นั่นหมายความว่า ด้วยความสามารถของโมเดลที่เทียบเท่ากัน ต้นทุนในการเรียกโมเดลสำหรับเอเจนต์และอุตสาหกรรมแอปพลิเคชัน AI จะต่ำกว่า และการเรียกนั้นสะดวกกว่า ซึ่งจะส่งเสริมการเกิดขึ้นของเอเจนต์และแอปพลิเคชัน AI ใหม่ๆ มากขึ้นอย่างหลีกเลี่ยงไม่ได้

ความมุ่งมั่นในโอเพนซอร์ส

Alibaba ได้ยืนยันความมุ่งมั่นต่อชุมชนโอเพนซอร์สอีกครั้งโดยนำเสนอโมเดล Qwen3 ที่หลากหลาย ซึ่งรวมถึงโมเดล Mixture-of-Experts (MoE) สองรุ่นที่มีพารามิเตอร์ 3 หมื่นล้านและ 235 พันล้านพารามิเตอร์ ตลอดจนโมเดล Dense หกรุ่นที่มีขนาดแตกต่างกัน

โมเดล MoE ที่มีพารามิเตอร์ 3 หมื่นล้านพารามิเตอร์นั้น ให้ประสิทธิภาพที่เพิ่มขึ้นอย่างมาก โดยให้ประสิทธิภาพเทียบเท่ากับโมเดล Qwen2.5-32B รุ่นก่อนหน้า โมเดล Dense ยังแสดงให้เห็นถึงประสิทธิภาพที่ดีขึ้น โดยแม้แต่โมเดลที่เล็กกว่าก็ยังให้ผลลัพธ์ที่น่าประทับใจ

เนื่องจากโมเดล Qwen3 ทั้งหมดเป็นโมเดลการให้เหตุผลแบบไฮบริด API จึงสามารถตั้งค่าได้ตามต้องการเพื่อตั้งค่า ‘งบประมาณการคิด’ (เช่น จำนวนโทเค็นสูงสุดที่คาดหวังสำหรับการคิดเชิงลึก) เพื่อดำเนินการคิดในระดับที่แตกต่างกันและตอบสนองความต้องการที่หลากหลายของแอปพลิเคชัน AI และสถานการณ์ต่างๆ สำหรับประสิทธิภาพและต้นทุนได้อย่างยืดหยุ่น องค์กรขนาดเล็กและขนาดกลางและนักพัฒนา AI สามารถเลือกโมเดลได้อย่างยืดหยุ่นตามความต้องการ ซึ่งจะลดเกณฑ์และค่าใช้จ่ายในการใช้โมเดลขนาดใหญ่อย่างหลีกเลี่ยงไม่ได้ ทีมงานเหล่านี้ที่มีเงินทุนและบุคลากรที่จำกัดมากสามารถทุ่มทรัพยากรและพลังงานมากขึ้นให้กับตลาดและการขุดค้นความต้องการและความเจ็บปวดของผู้ใช้ เพื่อให้พวกเขาสามารถพัฒนาแอปพลิเคชันที่เป็นนวัตกรรมใหม่ๆ ได้มากขึ้น

รากฐานทางเทคโนโลยีของ Alibaba

หลังจาก 16 ปีของการพัฒนา Alibaba ได้สร้างระบบสถาปัตยกรรมเทคโนโลยีแบบเต็มสแต็กขึ้นใหม่อย่างครอบคลุม ตั้งแต่ฮาร์ดแวร์พื้นฐานไปจนถึงการประมวลผล การจัดเก็บ เครือข่าย การประมวลผลข้อมูล การฝึกอบรมโมเดล และแพลตฟอร์มการให้เหตุผล ทำให้เป็นแพลตฟอร์มการประมวลผลแบบคลาวด์ชั้นนำในภูมิภาคเอเชียแปซิฟิก Alibaba ยังเป็นหนึ่งในบริษัทเทคโนโลยีแห่งแรกของโลกที่ลงทุนในการวิจัยโมเดลขนาดใหญ่

ก่อนหน้านี้ Zhou Jingren กล่าวในการสัมภาษณ์กับสื่อว่าการพัฒนาโมเดลขนาดใหญ่นั้นแยกไม่ออกจากความช่วยเหลือของระบบคลาวด์ ไม่ว่าจะเป็นการฝึกอบรมหรือการให้เหตุผล ทุกความก้าวหน้าในโมเดลขนาดใหญ่ บนพื้นผิวคือวิวัฒนาการของความสามารถของโมเดล แต่เบื้องหลังคือความร่วมมือและการอัปเกรดที่ครอบคลุมของแพลตฟอร์มการประมวลผลแบบคลาวด์และข้อมูลและวิศวกรรมทั้งหมด Multimodality ยังเป็นวิธีสำคัญในการ AGI อีกด้วย

การยอมรับในระดับนานาชาติ

การเปิดตัว Qwen3 ได้รับความสนใจในระดับโลก หลังจากการเปิดตัว Qwen 3 ของ Alibaba Elon Musk กล่าวบนแพลตฟอร์มโซเชียลมีเดีย X ว่า Grok 3.5 เวอร์ชันเบต้าในช่วงต้นจะเปิดตัวให้กับสมาชิก SuperGrok ในสัปดาห์หน้า โดยอ้างว่าเป็น AI ตัวแรกที่สามารถตอบคำถามเกี่ยวกับเครื่องยนต์จรวดหรือเทคโนโลยีเคมีไฟฟ้าได้อย่างแม่นยำ

ขับเคลื่อนนวัตกรรมและการเข้าถึง

Sun Maosong รองประธานบริหารของสถาบันปัญญาประดิษฐ์แห่งมหาวิทยาลัย Tsinghua และนักวิชาการต่างชาติของ European Academy of Humanities and Natural Sciences กล่าวว่าในช่วงไม่กี่ปีที่ผ่านมา จีนได้สร้างผลงานที่แข็งแกร่งในการพัฒนาปัญญาประดิษฐ์ โดยเฉพาะอย่างยิ่งในสาขาโมเดลขนาดใหญ่ การเกิดขึ้นของ DeepSeek และชุดผลิตภัณฑ์โอเพนซอร์สจาก Tongyi Qianwen ได้ส่งเสริมเส้นทางโอเพนซอร์สของโมเดลขนาดใหญ่ในประเทศอย่างมาก ซึ่งไม่ต้องสงสัยเลยว่ามีความสำคัญอย่างยิ่งในการบรรเทาการผูกขาดทางเทคโนโลยี ส่งเสริมความเท่าเทียมทางเทคโนโลยี และเพิ่มความครอบคลุมของปัญญาประดิษฐ์

ปัจจุบัน จำนวนโมเดลที่ได้มาจาก Qwen ในชุมชนโอเพนซอร์สทั้งในและต่างประเทศมีจำนวนเกิน 100,000 โมเดล ซึ่งแซงหน้าโมเดลที่ได้มาจากซีรีส์ Llama และ Tongyi Qianwen Qwen เป็นกลุ่มโมเดลภาษาเชิงกำเนิดที่ใหญ่ที่สุดในโลก จากรายการโมเดลขนาดใหญ่โอเพนซอร์สระดับโลก Huggingface ล่าสุดเมื่อวันที่ 10 กุมภาพันธ์ 2025 โมเดลขนาดใหญ่โอเพนซอร์สสิบอันดับแรกเป็นโมเดลที่ได้มาจากโมเดลโอเพนซอร์ส Tongyi Qianwen Qwen ทั้งหมด

Sun Maosong เชื่อว่านี่หมายความว่าวัฒนธรรมโมเดลขนาดใหญ่ของจีนได้รับการยอมรับในระดับสากล ซึ่งเป็นการเปลี่ยนแปลงทางวัฒนธรรม สิ่งนี้มีค่ามากและแสดงถึงการยอมรับการพัฒนาและเทคโนโลยีของโมเดลขนาดใหญ่ของจีน