DeepSeek สตาร์ทอัพ AI ของจีน ได้สร้างความก้าวหน้าที่โดดเด่นในภูมิทัศน์การแข่งขันของปัญญาประดิษฐ์ด้วยการปรับปรุงซ้ำของแบบจำลองพื้นฐาน แทนที่จะเปิดตัว DeepSeek R2 ที่คาดเดากัน บริษัท ได้แนะนำ DeepSeek-R1-0528 เมื่อวันที่ 28 พฤษภาคม โดยแสดงให้เห็นถึงความก้าวหน้าในด้านการให้เหตุผล ตรรกะ คณิตศาสตร์ และการเขียนโปรแกรม แบบจำลองโอเพนซอร์สที่ได้รับการปรับปรุงนี้ ซึ่งทำงานภายใต้ใบอนุญาต MIT ปัจจุบันแสดงเมตริกประสิทธิภาพที่เทียบเคียงได้กับแบบจำลองชั้นนำ เช่น GPT-3 ของ OpenAI และ Gemini 2.5 Pro ของ Google
การจัดการงานให้เหตุผลที่ซับซ้อนที่ได้รับการปรับปรุง
การปรับปรุงใน DeepSeek-R1-0528 สามารถนำมาประกอบกับการจัดสรรทรัพยากรการคำนวณที่รอบคอบมากขึ้น ควบคู่ไปกับการเพิ่มประสิทธิภาพอัลกอริทึมที่ใช้ในขั้นตอนหลังการฝึกอบรม การปรับเปลี่ยนที่ละเอียดเหล่านี้ช่วยเพิ่มความลึกซึ้งในการคิดของแบบจำลองในระหว่างกระบวนการให้เหตุผล เพื่อแสดงให้เห็นถึงสิ่งนี้ เวอร์ชันก่อนหน้าใช้โทเค็นประมาณ 12,000 โทเค็นต่อคำถามในการทดสอบ American Invitational Mathematics Examination (AIME) ในขณะที่แบบจำลองที่อัปเดตแล้วใช้โทเค็นเกือบ 23,000 โทเค็น การใช้โทเค็นที่เพิ่มขึ้นนี้สัมพันธ์กับการเพิ่มขึ้นอย่างมากในด้านความแม่นยำ โดยเพิ่มขึ้นจาก 70% เป็น 87.5% ในการทดสอบ AIME ฉบับปี 2025
ในด้านคณิตศาสตร์ คะแนนที่เป็นเอกสารของแบบจำลองได้ถึงระดับที่น่าประทับใจ โดยทำได้ 91.4% ใน AIME 2024 และ 79.4% ใน Harvard-MIT Mathematics Tournament (HMMT) 2025 ตัวเลขเหล่านี้เข้าใกล้หรือเกินเกณฑ์มาตรฐานประสิทธิภาพที่กำหนดโดยแบบจำลองแบบปิดซอร์สบางรุ่น รวมถึง GPT-3 และ Gemini 2.5 Pro
ในส่วนของความสามารถในการเขียนโปรแกรม ดัชนี LiveCodeBench ได้ประสบกับการเพิ่มขึ้นอย่างมากเกือบ 10 จุด โดยย้ายจาก 63.5 เป็น 73.3% นอกจากนี้ การประเมิน SWE-Verified ได้แสดงให้เห็นถึงการปรับปรุงในอัตราความสำเร็จ โดยเพิ่มขึ้นจาก 49.2% เป็น 57.6%
ในขอบเขตของการให้เหตุผลทั่วไป ประสิทธิภาพของแบบจำลองในการทดสอบ GPQA-Diamond ได้รับการปรับปรุงอย่างมีนัยสำคัญ โดยคะแนนเพิ่มขึ้นจาก 71.5% เป็น 81.0% ที่น่าสังเกตคือประสิทธิภาพในการวัดผล “Last Examination of Humanity” เพิ่มขึ้นมากกว่าสองเท่า โดยเพิ่มขึ้นจาก 8.5% เป็น 17.7%
การปรับปรุงเหล่านี้โดยรวมเน้นย้ำถึงความสามารถที่ได้รับการปรับปรุงของ DeepSeek-R1-0528 ในการจัดการกับงานให้เหตุผลที่ซับซ้อน ทำให้เป็นคู่แข่งที่น่าเกรงขามในภูมิทัศน์ AI อัลกอริทึมที่ได้รับการปรับปรุงและการใช้ทรัพยากรที่เพิ่มประสิทธิภาพได้แปลเป็นผลกำไรที่จับต้องได้ในด้านความแม่นยำและความสามารถในการแก้ปัญหาในหลากหลายโดเมน
อัตราข้อผิดพลาดที่ลดลงและการผสานรวมแอปพลิเคชันที่ดีขึ้น
หนึ่งในความก้าวหน้าที่โดดเด่นที่นำเสนอโดยการอัปเดตนี้คือการลดลงอย่างเห็นได้ชัดในอัตราการหลอน ซึ่งเป็นข้อกังวลที่สำคัญสำหรับความน่าเชื่อถือของแบบจำลองภาษาขนาดใหญ่ (LLM) ด้วยการลดอุบัติการณ์ของการตอบสนองที่ไม่ถูกต้องตามข้อเท็จจริง DeepSeek-R1-0528 ช่วยเพิ่มความแข็งแกร่ง โดยเฉพาะอย่างยิ่งในบริบทที่ความแม่นยำมีความสำคัญยิ่ง ความแม่นยำที่สูงขึ้นนี้ส่งเสริมความมั่นใจมากขึ้นในผลลัพธ์ของแบบจำลอง ทำให้เป็นเครื่องมือที่เชื่อถือได้มากขึ้นสำหรับแอปพลิเคชันต่างๆ
นอกจากนี้ การอัปเดตยังรวมถึงคุณสมบัติที่ปรับแต่งมาเพื่อใช้ในสภาพแวดล้อมที่มีโครงสร้าง รวมถึงการสร้างเอาต์พุต JSON โดยตรงและการสนับสนุนที่ขยายสำหรับการเรียกใช้ฟังก์ชัน ความก้าวหน้าทางเทคนิคเหล่านี้ช่วยปรับปรุงการผสานรวมของแบบจำลองเข้ากับเวิร์กโฟลว์อัตโนมัติ เอเจนต์ซอฟต์แวร์ หรือระบบแบ็กเอนด์ โดยไม่จำเป็นต้องมีการประมวลผลขั้นกลางที่กว้างขวาง ด้วยการให้การสนับสนุนดั้งเดิมสำหรับรูปแบบข้อมูลที่มีโครงสร้างและการเรียกใช้ฟังก์ชัน DeepSeek-R1-0528 ช่วยลดความซับซ้อนในการพัฒนาและปรับใช้แอปพลิเคชันที่ขับเคลื่อนด้วย AI ทำให้ง่ายขึ้นสำหรับนักพัฒนาในการใช้ประโยชน์จากความสามารถของมัน
การมุ่งเน้นไปที่การลดข้อผิดพลาดและการปรับปรุงการผสานรวมแอปพลิเคชันแสดงให้เห็นถึงความมุ่งมั่นของ DeepSeek ในการปรับปรุงการปฏิบัติจริงและความสามารถในการใช้งานของแบบจำลอง ด้วยการแก้ไขความท้าทายที่สำคัญที่เกี่ยวข้องกับความแม่นยำและความง่ายในการผสานรวม บริษัทกำลังวางตำแหน่งแบบจำลองของตนให้เป็นสินทรัพย์ที่มีค่าสำหรับอุตสาหกรรมและแอปพลิเคชันที่หลากหลาย
การเพิ่มความสนใจในการกลั่น
ควบคู่ไปกับการปรับปรุงที่ทำกับ DeepSeek-R1-0528 ทีม DeepSeek ได้เริ่มกระบวนการกลั่นสายความคิดลงในแบบจำลองที่เบากว่าซึ่งออกแบบมาสำหรับนักพัฒนาและนักวิจัยที่มีทรัพยากรฮาร์ดแวร์จำกัด DeepSeek-R1-0528 ซึ่งประกอบด้วยพารามิเตอร์ 685 พันล้านตัว ถูกนำมาใช้เพื่อฝึกอบรม Qwen3 8B Base ส่งผลให้เกิดการสร้าง DeepSeek-R1-0528-Qwen3-8B
ที่น่าสังเกตคือแบบจำลองที่กลั่นนี้จัดการเพื่อแข่งขันกับแบบจำลองโอเพนซอร์สขนาดใหญ่กว่ามากในเกณฑ์มาตรฐานบางอย่าง ด้วยคะแนน 86.0% ใน AIME 2024 ไม่เพียงแต่เกินประสิทธิภาพของ Qwen3 8B มากกว่า 10.0% แต่ยังตรงกับประสิทธิภาพของ Qwen3-235B-thinking ความสำเร็จนี้เน้นย้ำถึงศักยภาพของเทคนิคการกลั่นในการสร้างแบบจำลองที่กะทัดรัดและมีประสิทธิภาพมากขึ้นโดยไม่ลดทอนประสิทธิภาพ
แนวทางนี้ท้าทายแนวคิดที่ยึดถือมายาวนานว่าแบบจำลองขนาดใหญ่นั้นเหนือกว่าโดยเนื้อแท้ โดยแนะนำว่าเวอร์ชันที่ประหยัดกว่าแต่ได้รับการฝึกอบรมที่ดีกว่าอาจมีความเหมาะสมกว่าสำหรับงานให้เหตุผลบางอย่าง ด้วยการมุ่งเน้นไปที่การกลั่น DeepSeek กำลังสำรวจเส้นทางอื่น ๆ สู่ความก้าวหน้าของ AI ซึ่งอาจปูทางไปสู่แบบจำลองที่เข้าถึงได้และมีประสิทธิภาพด้านทรัพยากรมากขึ้น
แบบจำลอง DeepSeek-R1-0528 แสดงถึงความก้าวหน้าที่สำคัญในสาขาปัญญาประดิษฐ์ ซึ่งแสดงให้เห็นถึงพลังของการเพิ่มประสิทธิภาพอัลกอริทึมและการจัดสรรทรัพยากรเชิงกลยุทธ์ ความสามารถที่ได้รับการปรับปรุงในด้านการให้เหตุผล คณิตศาสตร์ การเขียนโปรแกรม และความรู้ทั่วไป ควบคู่ไปกับอัตราข้อผิดพลาดที่ลดลงและคุณสมบัติการผสานรวมที่ได้รับการปรับปรุง ทำให้เป็นคู่แข่งที่น่าเกรงขามสำหรับแบบจำลองที่จัดตั้งขึ้นจากบริษัทอเมริกันยักษ์ใหญ่ นอกจากนี้ การสำรวจเทคนิคการกลั่นของ DeepSeek ยังบ่งบอกถึงเส้นทางที่มีแนวโน้มไปสู่โซลูชัน AI ที่มีประสิทธิภาพและเข้าถึงได้มากขึ้น ในขณะที่ภูมิทัศน์ AI ยังคงมีการพัฒนาอย่างต่อเนื่อง ความมุ่งมั่นของ DeepSeek ในนวัตกรรมและการปฏิบัติจริงน่าจะมีบทบาทสำคัญในการกำหนดอนาคตของอุตสาหกรรม
การปรับปรุงและปรับปรุงแบบจำลอง AI อย่างต่อเนื่อง เช่น DeepSeek-R1-0528 เป็นสิ่งจำเป็นสำหรับการปลดล็อกศักยภาพเต็มรูปแบบของปัญญาประดิษฐ์ ด้วยการผลักดันขอบเขตของสิ่งที่เป็นไปได้และการแก้ไขความท้าทายที่สำคัญที่เกี่ยวข้องกับความแม่นยำ ประสิทธิภาพ และการเข้าถึง DeepSeek กำลังมีส่วนร่วมในการพัฒนา AI และการผสานรวมเข้ากับด้านต่างๆ ของชีวิตของเรา ในขณะที่ AI กลายเป็นที่แพร่หลายมากขึ้น ความสำคัญของความก้าวหน้าเหล่านี้จะยังคงเติบโตต่อไป โดยกำหนดอนาคตของเทคโนโลยีและสังคมโดยรวม
ความหมายของ DeepSeek-R1-0528 สำหรับชุมชน AI และอื่นๆ
การเปิดตัว DeepSeek-R1-0528 และเกณฑ์มาตรฐานประสิทธิภาพที่น่าประทับใจ มีความหมายอย่างมากสำหรับชุมชน AI และที่อื่นๆ ประการแรก แสดงให้เห็นว่านวัตกรรมใน AI ไม่ได้จำกัดอยู่เพียงบริษัทชั้นนำในสหรัฐอเมริกาและประเทศตะวันตกอื่นๆ สตาร์ทอัพจีนอย่าง DeepSeek สามารถพัฒนาแบบจำลอง AI ที่ทันสมัยที่สามารถแข่งขันกับดีที่สุดในโลกได้ การแข่งขันที่เพิ่มขึ้นนี้สามารถขับเคลื่อนนวัตกรรมเพิ่มเติมและเร่งการพัฒนาเทคโนโลยี AI ทั่วโลก
ประการที่สอง ลักษณะโอเพนซอร์สของ DeepSeek-R1-0528 ช่วยให้นักวิจัยและนักพัฒนาทั่วโลกสามารถเข้าถึงและใช้ประโยชน์จากความสามารถของมันได้ ประชาธิปไตยของเทคโนโลยี AI นี้สามารถส่งเสริมความร่วมมือ เร่งการวิจัย และนำไปสู่การพัฒนาแอปพลิเคชันและกรณีการใช้งานใหม่ๆ แบบจำลองโอเพนซอร์สยังช่วยให้มีความโปร่งใสและการตรวจสอบที่มากขึ้น ซึ่งสามารถช่วยระบุและแก้ไขอคติหรือข้อจำกัดที่อาจเกิดขึ้นในแบบจำลอง
ประการที่สาม ประสิทธิภาพที่ได้รับการปรับปรุงของ DeepSeek-R1-0528 ในโดเมนต่างๆ เช่น คณิตศาสตร์ การเขียนโปรแกรม และการให้เหตุผลทั่วไป มีศักยภาพที่จะส่งผลกระทบต่ออุตสาหกรรมและแอปพลิเคชันที่หลากหลาย ในสาขาการศึกษา แบบจำลองสามารถใช้เพื่อสร้างประสบการณ์การเรียนรู้ส่วนบุคคล ให้ข้อเสนอแนะอัตโนมัติ และช่วยเหลือนักเรียนในการแก้ปัญหา ในโลกธุรกิจ สามารถใช้เพื่อทำให้งานเป็นอัตโนมัติ ปรับปรุงการตัดสินใจ และเพิ่มประสิทธิภาพการบริการลูกค้า และในชุมชนวิทยาศาสตร์ สามารถใช้เพื่อเร่งการวิจัย วิเคราะห์ข้อมูล และสร้างข้อมูลเชิงลึกใหม่ๆ
สุดท้าย การมุ่งเน้นของ DeepSeek ไปที่เทคนิคการกลั่นบ่งบอกถึงเส้นทางที่มีแนวโน้มไปสู่โซลูชัน AI ที่มีประสิทธิภาพและเข้าถึงได้มากขึ้น ด้วยการสร้างแบบจำลองที่มีขนาดเล็กลงและมีประสิทธิภาพมากขึ้นซึ่งยังคงรักษาความสามารถของแบบจำลองขนาดใหญ่ DeepSeek กำลังทำให้เทคโนโลยี AI เข้าถึงได้มากขึ้นสำหรับนักพัฒนาและนักวิจัยที่มีทรัพยากรฮาร์ดแวร์จำกัด ซึ่งสามารถช่วยทำให้ AI เป็นประชาธิปไตยและรับประกันว่าผลประโยชน์ของมันจะถูกแบ่งปันอย่างกว้างขวางมากขึ้น
โดยสรุป DeepSeek-R1-0528 แสดงถึงเหตุการณ์สำคัญในการพัฒนาปัญญาประดิษฐ์ ประสิทธิภาพที่น่าประทับใจ ลักษณะโอเพนซอร์ส และการมุ่งเน้นไปที่การกลั่นมีศักยภาพในการขับเคลื่อนนวัตกรรมเพิ่มเติม เร่งการวิจัย และทำให้การเข้าถึงเทคโนโลยี AI เป็นประชาธิปไตย ในขณะที่ภูมิทัศน์ AI ยังคงมีการพัฒนาอย่างต่อเนื่อง การมีส่วนร่วมของ DeepSeek น่าจะมีบทบาทสำคัญในการกำหนดอนาคตของอุตสาหกรรมและผลกระทบต่อสังคม