OpenAI เปิดตัวโมเดล o3 และ o4-mini

OpenAI ได้เปิดตัวความก้าวหน้าล่าสุดในโมเดล inference ได้แก่ o3 และ o4-mini เมื่อวันที่ 16 เมษายน การพัฒนานี้เกิดขึ้นหลังจากมีการปรับเปลี่ยนแผนงานผลิตภัณฑ์ของบริษัทหลายครั้ง เนื่องจาก GPT-5 ที่รอคอยกันอย่างใจจดใจจ่อยังคงอยู่ในระหว่างการพัฒนา

บริบทและความเป็นมา

ในขั้นต้น OpenAI ได้พิจารณาที่จะงดเว้นการเปิดตัวโมเดล o3 เป็นรายบุคคล โดยมีแผนที่จะรวมความสามารถของมันเข้ากับ GPT-5 ที่กำลังจะมาถึงโดยตรง อย่างไรก็ตาม ในช่วงต้นเดือนเมษายน Sam Altman ซีอีโอของ OpenAI ได้ประกาศการเปลี่ยนแปลงกลยุทธ์ โดยอ้างถึงความท้าทายที่ไม่คาดฝันในการรวมส่วนประกอบทั้งหมดเข้าด้วยกัน ด้วยเหตุนี้จึงมีการตัดสินใจที่จะเปิดตัว o3 และ o4-mini เป็นโมเดลแบบสแตนด์อโลน ในขณะที่ GPT-5 อยู่ระหว่างการพัฒนาเพิ่มเติม

ความสามารถและคุณสมบัติของ o3 และ o4-mini

โมเดลใหม่เหล่านี้ o3 และ o4-mini สามารถเข้าถึงได้แล้วสำหรับผู้ใช้ ChatGPT Plus, Pro, Team และ API โดยทำหน้าที่แทนที่โมเดล o1 และ o3-mini รุ่นก่อนหน้า ในอนาคตอันใกล้นี้ สมาชิก ChatGPT enterprise และ education ก็จะสามารถใช้โมเดลขั้นสูงเหล่านี้ได้เช่นกัน มีการสังเกตเห็นการปรับปรุงที่โดดเด่นในด้านการแก้ไขโค้ดและความสามารถในการใช้เหตุผลเชิงภาพ

OpenAI เน้นย้ำว่าโมเดลเหล่านี้เป็นข้อเสนอที่ชาญฉลาดที่สุดของพวกเขาจนถึงปัจจุบัน โดยโมเดล inference สามารถใช้เครื่องมือทุกอย่างที่มีใน ChatGPT ได้อย่างอิสระ รวมถึงการค้นหาเว็บ การวิเคราะห์ไฟล์ด้วย Python การใช้เหตุผลเชิงอินพุตภาพ และการสร้างภาพ

เกณฑ์มาตรฐานด้านประสิทธิภาพ

ในการประเมินที่ดำเนินการโดยผู้เชี่ยวชาญภายนอก โมเดล o3 แสดงให้เห็นถึงการลดลง 20% ในข้อผิดพลาดร้ายแรง เมื่อเทียบกับรุ่นก่อนหน้า o1 เมื่อเผชิญกับงานที่ซับซ้อนในโลกแห่งความเป็นจริง ในทางกลับกัน o4-mini ได้รับการปรับให้เหมาะสมเพื่อการตอบสนองที่รวดเร็วและคุ้มค่า ในเกณฑ์มาตรฐานทางคณิตศาสตร์ AIME 2025 o3 และ o4-mini ได้คะแนน 88.9 และ 92.7 ตามลำดับ ซึ่งสูงกว่าคะแนนของ o1 ที่ 79.2 ในทำนองเดียวกัน ในเกณฑ์มาตรฐานการเขียนโค้ด Codeforces o3 และ o4-mini ได้คะแนน 2706 และ 2719 ซึ่งสูงกว่าคะแนนของ o1 ที่ 1891 นอกจากนี้ o3 และ o4-mini ยังมีประสิทธิภาพเหนือกว่า o1 ในเกณฑ์มาตรฐานต่างๆ รวมถึง GPQA Diamond (คำถามวิทยาศาสตร์ระดับปริญญาเอก), Humanity’s Last Exam (คำถามระดับผู้เชี่ยวชาญสหวิทยาการ) และ MathVista (การใช้เหตุผลทางคณิตศาสตร์เชิงภาพ)

การแก้ไขโค้ดและการใช้เหตุผลเชิงภาพที่ได้รับการปรับปรุง

โมเดล o3-high (โหมดความจุสูง) และ o4-mini-high แสดงอัตราความถูกต้องในการแก้ไขโค้ดโดยรวม 81.3% และ 68.9% ตามลำดับ ซึ่งสูงกว่าอัตราของ o1-high ที่ 64.4% นอกจากนี้ o3 และ o4-mini ยังรวมข้อมูลภาพเข้ากับกระบวนการใช้เหตุผล ทำให้ผู้ใช้สามารถอัปโหลดแผนภูมิในหนังสือเรียนหรือภาพสเก็ตช์ที่วาดด้วยมือ และรับการตีความโดยตรงจากโมเดล โมเดลเหล่านี้สามารถใช้เครื่องมือหลายอย่างได้อย่างกระตือรือร้นเพื่อตอบสนองต่อคำถามของผู้ใช้ ตัวอย่างเช่น เมื่อถูกถามเกี่ยวกับการใช้พลังงานในช่วงฤดูร้อนในสถานที่เฉพาะ โมเดลสามารถค้นหาข้อมูลสาธารณะบนเว็บ สร้างโค้ด Python สำหรับการทำนาย และสร้างภาพ

การใช้งานจริง

OpenAI ได้ให้ตัวอย่างที่แสดงให้เห็นถึงความสามารถของโมเดล:

  • การสร้างแผนการเดินทาง: โดยการให้ o3 ด้วยรูปภาพของตารางเวลาและเวลาปัจจุบัน ผู้ใช้สามารถขอแผนการเดินทางโดยละเอียดที่คำนึงถึงสถานที่ท่องเที่ยวและการแสดงทั้งหมดที่ระบุไว้ในตารางเวลา

  • การวิเคราะห์กฎกีฬา: เมื่อได้รับแจ้งให้วิเคราะห์ผลกระทบของกฎกีฬาใหม่ต่อประสิทธิภาพของพิทเชอร์และระยะเวลาของเกม o3 สามารถค้นหาข้อมูลที่เกี่ยวข้องและดำเนินการวิเคราะห์ทางสถิติได้โดยอัตโนมัติ

  • คำถามตามรูปภาพ: ผู้ใช้สามารถอัปโหลดรูปถ่ายและสอบถามเกี่ยวกับรายละเอียดเฉพาะ เช่น ชื่อของเรือที่ใหญ่ที่สุดในภาพหรือสถานที่เทียบท่า

ประสิทธิภาพด้านต้นทุน

ในเกณฑ์มาตรฐาน AIME 2025 o3 แสดงให้เห็นถึงประสิทธิภาพด้านต้นทุนที่สูงกว่าเมื่อเทียบกับ o1 OpenAI ยืนยันว่าทั้ง o3 และ o4-mini มีราคาไม่แพงกว่ารุ่นก่อนหน้า

การอัปเดตเพิ่มเติม

นอกเหนือจากการเปิดตัว GPT-5 ที่ล่าช้า OpenAI ได้เปิดตัว o3 และ o4-mini เป็นโซลูชันชั่วคราวในช่วงการเปลี่ยนผ่านโมเดลอย่างต่อเนื่อง นอกจากนี้ บริษัทยังได้เปิดตัว Codex CLI ซึ่งเป็นเครื่องมือตัวแทนการเขียนโปรแกรมโอเพนซอร์ส นอกจากนี้ โมเดลชุด GPT-4.1 ได้ถูกรวมเข้ากับ API ซึ่งมีประสิทธิภาพเหนือกว่า GPT-4o การเปิดตัว GPT-4.1 สอดคล้องกับแผนการของ OpenAI ที่จะยกเลิกเวอร์ชันตัวอย่าง GPT-4.5 ซึ่งเปิดตัวในเดือนกุมภาพันธ์ปีนี้

ความท้าทายและทิศทางในอนาคต

การปรับเปลี่ยนแผนงานผลิตภัณฑ์ล่าสุดของ OpenAI ส่งผลให้ระบบนิเวศผลิตภัณฑ์มีความซับซ้อนมากขึ้น ซึ่งก่อให้เกิดความท้าทายในการรวม o-series ที่เน้นการ inference เข้ากับ GPT series พื้นฐาน (เช่น GPT-4, GPT-5) เพื่อรักษาความได้เปรียบในการแข่งขัน OpenAI จะต้องแสดงให้เห็นถึงความสามารถของตนผ่านโมเดลพื้นฐาน เช่น GPT-5

เจาะลึกโมเดลใหม่: o3 และ o4-mini

o3: ม้างานอัจฉริยะ

โมเดล o3 ได้รับการออกแบบให้เป็นโมเดลอเนกประสงค์ที่มีความสามารถสูง ซึ่งมีจุดมุ่งหมายเพื่อจัดการงานที่หลากหลาย จุดแข็งที่สำคัญอยู่ที่ความแม่นยำที่เพิ่มขึ้นและอัตราข้อผิดพลาดที่ลดลงในสถานการณ์ที่ซับซ้อนในโลกแห่งความเป็นจริง โมเดลนี้เหมาะอย่างยิ่งสำหรับการใช้งานที่ต้องการการใช้เหตุผลอย่างลึกซึ้ง การแก้ปัญหาที่ซับซ้อน และความเข้าใจที่ละเอียดอ่อนเกี่ยวกับบริบท

ความสามารถหลัก:

  • การใช้เหตุผลขั้นสูง: o3 มีความโดดเด่นในงานที่ต้องใช้การอนุมานเชิงตรรกะหลายขั้นตอน ทำให้เหมาะสำหรับการใช้งาน เช่น การวิเคราะห์ทางการเงิน การตรวจสอบเอกสารทางกฎหมาย และการวิจัยทางวิทยาศาสตร์

  • อัตราข้อผิดพลาดที่ลดลง: เมื่อเทียบกับรุ่นก่อนหน้า o1 o3 ช่วยลดการเกิดข้อผิดพลาดร้ายแรงได้อย่างมาก ทำให้มั่นใจได้ถึงผลลัพธ์ที่น่าเชื่อถือและไว้วางใจได้มากขึ้น

  • การใช้งานที่หลากหลาย: o3 ได้รับการออกแบบมาเพื่อจัดการงานที่หลากหลาย ตั้งแต่การตอบคำถามง่ายๆ ไปจนถึงการแก้ปัญหาที่ซับซ้อน ทำให้เป็นเครื่องมืออเนกประสงค์สำหรับการใช้งานต่างๆ

  • การรวมเครื่องมือ: ความสามารถในการรวมเข้ากับเครื่องมือ ChatGPT ได้อย่างราบรื่น เช่น การค้นหาเว็บ การวิเคราะห์ Python และการตีความภาพ ช่วยขยายความสามารถของโมเดลได้อย่างมาก และช่วยให้สามารถจัดการงานที่หลากหลายมากขึ้น

o4-mini: ผู้ปฏิบัติงานที่มีประสิทธิภาพและคล่องตัว

โมเดล o4-mini ได้รับการปรับให้เหมาะสมเพื่อความเร็วและประสิทธิภาพ ทำให้เป็นตัวเลือกที่เหมาะสมสำหรับการใช้งานที่การตอบสนองและความคุ้มค่าเป็นสิ่งสำคัญยิ่ง โมเดลนี้ได้รับการออกแบบมาเพื่อส่งมอบผลลัพธ์คุณภาพสูงอย่างรวดเร็วและมีประสิทธิภาพ โดยไม่ลดทอนความแม่นยำหรือความน่าเชื่อถือ

ความสามารถหลัก:

  • การตอบสนองที่รวดเร็ว: o4-mini ได้รับการออกแบบมาสำหรับการใช้งานที่ต้องการการตอบสนองแบบเรียลไทม์หรือใกล้เรียลไทม์ เช่น แชทบอทบริการลูกค้า เกมแบบโต้ตอบ และการสร้างเนื้อหาแบบไดนามิก

  • ความคุ้มค่า: โมเดลได้รับการปรับให้เหมาะสมเพื่อประสิทธิภาพ ทำให้เป็นโซลูชันที่คุ้มค่าสำหรับการใช้งานที่มีปริมาณคำขอสูงหรือมีงบประมาณจำกัด

  • ประสิทธิภาพที่สมดุล: แม้จะเน้นที่ความเร็วและประสิทธิภาพ o4-mini ยังคงส่งมอบผลลัพธ์คุณภาพสูง ทำให้มั่นใจได้ว่าผู้ใช้ไม่ต้องเสียสละความแม่นยำเพื่อการตอบสนอง

  • การใช้งานที่หลากหลาย: แม้จะเน้นที่ความเร็วและประสิทธิภาพ o4-mini สามารถจัดการงานที่หลากหลาย ทำให้เป็นเครื่องมืออเนกประสงค์สำหรับการใช้งานต่างๆ

การเจาะลึกเกณฑ์มาตรฐานด้านประสิทธิภาพ

เกณฑ์มาตรฐานด้านประสิทธิภาพที่เผยแพร่โดย OpenAI ให้ข้อมูลเชิงลึกที่มีค่าเกี่ยวกับความสามารถของโมเดลใหม่ ลองมาดูเกณฑ์มาตรฐานที่สำคัญบางส่วนอย่างใกล้ชิด และสิ่งที่พวกเขาเปิดเผย:

  • AIME 2025 (คณิตศาสตร์): AIME (American Invitational Mathematics Examination) เป็นการแข่งขันคณิตศาสตร์ที่ท้าทาย ซึ่งทดสอบทักษะการแก้ปัญหาและการใช้เหตุผลทางคณิตศาสตร์ โมเดล o3 และ o4-mini มีประสิทธิภาพเหนือกว่า o1 อย่างมากในเกณฑ์มาตรฐานนี้ ซึ่งแสดงให้เห็นถึงความสามารถทางคณิตศาสตร์ที่ได้รับการปรับปรุง

  • Codeforces (การเขียนโค้ด): Codeforces เป็นแพลตฟอร์มการเขียนโปรแกรมเชิงแข่งขันที่ได้รับความนิยม ซึ่งจัดการแข่งขันและการท้าทายการเขียนโค้ด โมเดล o3 และ o4-mini ได้คะแนนสูงกว่าในเกณฑ์มาตรฐาน Codeforces ซึ่งบ่งชี้ถึงทักษะการเขียนโค้ดที่ได้รับการปรับปรุงและความสามารถในการแก้ปัญหาการเขียนโปรแกรมที่ซับซ้อน

  • GPQA Diamond (วิทยาศาสตร์ระดับปริญญาเอก): เกณฑ์มาตรฐาน GPQA (General Purpose Question Answering) ประเมินความสามารถของโมเดลในการตอบคำถามในสาขาวิทยาศาสตร์ที่หลากหลาย โมเดล o3 และ o4-mini แสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่าในเกณฑ์มาตรฐานนี้ ซึ่งเน้นย้ำถึงความรู้ทางวิทยาศาสตร์ขั้นสูงและความสามารถในการใช้เหตุผล

  • Humanity’s Last Exam (ระดับผู้เชี่ยวชาญสหวิทยาการ): เกณฑ์มาตรฐานนี้ทดสอบความสามารถของโมเดลในการตอบคำถามที่ต้องใช้ความรู้จากหลายสาขา เช่น ประวัติศาสตร์ ปรัชญา และวรรณคดี โมเดล o3 และ o4-mini มีประสิทธิภาพเหนือกว่า o1 ในเกณฑ์มาตรฐานนี้ ซึ่งแสดงให้เห็นถึงความเข้าใจและความเชี่ยวชาญสหวิทยาการ

  • MathVista (การใช้เหตุผลทางคณิตศาสตร์เชิงภาพ): MathVista เป็นเกณฑ์มาตรฐานที่ประเมินความสามารถของโมเดลในการแก้ปัญหาทางคณิตศาสตร์ที่นำเสนอในรูปแบบภาพ เช่น แผนภูมิ กราฟ และไดอะแกรม โมเดล o3 และ o4-mini มีความโดดเด่นในเกณฑ์มาตรฐานนี้ ซึ่งแสดงให้เห็นถึงความสามารถในการดึงข้อมูลจากแหล่งข้อมูลภาพ และประยุกต์ใช้การใช้เหตุผลทางคณิตศาสตร์เพื่อแก้ปัญหา

นัยยะสำหรับผู้ใช้และนักพัฒนา

การเปิดตัว o3 และ o4-mini มีนัยยะสำคัญสำหรับทั้งผู้ใช้และนักพัฒนา โมเดลใหม่เหล่านี้มีประโยชน์มากมาย รวมถึง:

  • ประสิทธิภาพที่ได้รับการปรับปรุง: ผู้ใช้สามารถคาดหวังการปรับปรุงที่สำคัญในด้านประสิทธิภาพในงานที่หลากหลาย รวมถึงการใช้เหตุผล การแก้ปัญหา และการสร้างโค้ด

  • ประสิทธิภาพที่เพิ่มขึ้น: โมเดล o4-mini นำเสนอโซลูชันที่คุ้มค่าสำหรับการใช้งานที่ต้องการเวลาตอบสนองที่รวดเร็วและปริมาณงานสูง

  • ความสามารถที่ขยายตัว: ความสามารถในการรวมเข้ากับเครื่องมือ ChatGPT เช่น การค้นหาเว็บและการวิเคราะห์ Python เปิดโอกาสใหม่ๆ สำหรับการใช้งานและกรณีการใช้งาน

  • ความยืดหยุ่นที่มากขึ้น: ความพร้อมใช้งานของสองโมเดลที่แตกต่างกัน o3 และ o4-mini ช่วยให้ผู้ใช้สามารถเลือกโมเดลที่เหมาะสมกับความต้องการและข้อกำหนดเฉพาะของตนได้มากที่สุด

บริบทที่กว้างขึ้น: แผนงานผลิตภัณฑ์ของ OpenAI

การเปิดตัว o3 และ o4-mini เป็นเพียงส่วนหนึ่งของปริศนาที่ใหญ่กว่า OpenAI กำลังพัฒนาแผนงานผลิตภัณฑ์อย่างต่อเนื่อง โดยมีเป้าหมายสูงสุดในการสร้างโมเดล AI ที่ทรงพลังและอเนกประสงค์มากขึ้น แนวโน้มและการพัฒนาที่สำคัญบางอย่างที่ควรจับตามอง ได้แก่:

  • การพัฒนา GPT-5 อย่างต่อเนื่อง: แม้ว่าการเปิดตัว GPT-5 จะล่าช้าไป แต่ OpenAI ยังคงมุ่งมั่นที่จะพัฒนาโมเดลรุ่นต่อไปนี้ GPT-5 คาดว่าจะให้การปรับปรุงที่สำคัญในด้านประสิทธิภาพและความสามารถเมื่อเทียบกับรุ่นก่อนหน้า

  • การรวมโมเดล Inference และ Foundation: OpenAI กำลังทำงานเพื่อรวมโมเดล o-series ที่เน้นการ inference เข้ากับโมเดล GPT series พื้นฐานอย่างราบรื่น การรวมนี้จะช่วยให้ผู้ใช้สามารถใช้ประโยชน์จากจุดแข็งของโมเดลทั้งสองประเภทเพื่อสร้างแอปพลิเคชัน AI ที่ทรงพลังและอเนกประสงค์มากขึ้น

  • การทำให้ AI เป็นประชาธิปไตย: OpenAI มุ่งมั่นที่จะทำให้เทคโนโลยี AI เข้าถึงได้ง่ายขึ้นสำหรับทุกคน การเปิดตัวเครื่องมือโอเพนซอร์ส เช่น Codex CLI เป็นก้าวไปในทิศทางนี้

ผลกระทบต่อภูมิทัศน์ AI

นวัตกรรมอย่างต่อเนื่องของ OpenAI มีผลกระทบอย่างลึกซึ้งต่อภูมิทัศน์ AI ที่กว้างขึ้น ขับเคลื่อนความก้าวหน้าและสร้างแรงบันดาลใจในการพัฒนาใหม่ๆ ทั่วทั้งอุตสาหกรรม การเปิดตัว o3 และ o4-mini ตอกย้ำสถานะของ OpenAI ในฐานะผู้นำในสาขานี้ และปูทางไปสู่ความก้าวหน้าที่น่าตื่นเต้นยิ่งขึ้นในอีกไม่กี่ปีข้างหน้า ด้วยการผลักดันขอบเขตของสิ่งที่เป็นไปได้ด้วย AI OpenAI กำลังช่วยกำหนดอนาคตของเทคโนโลยีและเปลี่ยนแปลงวิธีการใช้ชีวิตและการทำงานของเรา

บทสรุป

การเปิดตัวโมเดล o3 และ o4-mini แสดงถึงก้าวสำคัญในการวิวัฒนาการของเทคโนโลยี AI โมเดลเหล่านี้ให้ประสิทธิภาพที่ได้รับการปรับปรุง ประสิทธิภาพที่เพิ่มขึ้น และความสามารถที่ขยายตัว ทำให้ผู้ใช้และนักพัฒนาสามารถสร้างแอปพลิเคชัน AI ที่ทรงพลังและอเนกประสงค์มากขึ้น ในขณะที่ OpenAI ยังคงคิดค้นและปรับแต่งแผนงานผลิตภัณฑ์ของตนอย่างต่อเนื่อง เราสามารถคาดหวังที่จะเห็นการพัฒนาที่น่าตื่นเต้นยิ่งขึ้นในอีกไม่กี่ปีข้างหน้า