OpenAI เปิดตัว GPT-4.5 ไม่ใช่รุ่น Frontier

ก้าวเล็กๆ ไม่ใช่ก้าวกระโดด

OpenAI กำลังเปิดตัวโมเดล AI หลักรุ่นล่าสุด ซึ่งรู้จักกันภายในว่า Orion แม้ว่าจะได้รับการตั้งชื่ออย่างเป็นทางการว่า GPT-4.5 แต่รุ่นนี้ไม่ได้ถูกจัดว่าเป็นโมเดล “frontier” โดยบริษัท GPT-4.5 พร้อมให้ผู้ใช้ ChatGPT Pro ใช้งานในรูปแบบตัวอย่างการวิจัย OpenAI ยกย่องว่าเป็น “โมเดลที่มีความรู้มากที่สุด” แต่การสื่อสารเบื้องต้นเตือนว่ามันอาจไม่ตรงกับประสิทธิภาพของโมเดลเช่น o1 หรือ o3-mini สิ่งนี้ชี้ให้เห็นถึงการมุ่งเน้นไปที่การปรับแต่งและประสิทธิภาพมากกว่าความก้าวหน้าที่ก้าวล้ำ

ความสามารถที่เพิ่มขึ้น การโต้ตอบที่ละเอียดยิ่งขึ้น

ผู้ใช้สามารถคาดหวังอะไรจาก GPT-4.5 ได้บ้าง? OpenAI เน้นการปรับปรุงในหลายด้านที่สำคัญ:

  • ความสามารถในการเขียน: โมเดลนี้ได้รับการออกแบบมาให้เป็นผู้ช่วยในการเขียนที่มีความสามารถมากขึ้น
  • ความรู้เกี่ยวกับโลกที่กว้างขึ้น: GPT-4.5 มีความเข้าใจในแนวคิดและข้อมูลในโลกแห่งความเป็นจริงที่กว้างขึ้น
  • ‘บุคลิกภาพที่ละเอียดยิ่งขึ้น’: OpenAI อ้างว่าการโต้ตอบกับโมเดลนี้จะให้ความรู้สึกเป็นธรรมชาติและใช้งานง่ายยิ่งขึ้น

บริษัทเน้นย้ำถึงความสามารถของ GPT-4.5 ในการจดจำรูปแบบและเชื่อมโยง ทำให้เหมาะอย่างยิ่งสำหรับงานต่างๆ เช่น การเขียน การเขียนโปรแกรม และการแก้ไขปัญหาในทางปฏิบัติ

ไม่ใช่ Frontier Model: ทำความเข้าใจความแตกต่าง

แม้จะมีการปรับปรุงเหล่านี้ OpenAI ก็ชัดเจนว่า GPT-4.5 ไม่ได้แสดงถึงการก้าวกระโดดไปสู่ความสามารถใหม่ทั้งหมด เอกสารที่รั่วไหลออกมา ซึ่งต่อมาได้รับการแก้ไข ได้ให้บริบทเพิ่มเติม:

“GPT-4.5 ไม่ใช่ frontier model แต่เป็น LLM ที่ใหญ่ที่สุดของ OpenAI ปรับปรุงประสิทธิภาพการคำนวณของ GPT-4 ได้มากกว่า 10 เท่า” เอกสารระบุ “มันไม่ได้แนะนำความสามารถ frontier ใหม่ 7 อย่างเมื่อเทียบกับรุ่นการให้เหตุผลก่อนหน้านี้ และประสิทธิภาพของมันต่ำกว่า o1, o3-mini และการวิจัยเชิงลึกในการประเมินความพร้อมส่วนใหญ่”

ความแตกต่างนี้มีความสำคัญ บ่งชี้ว่าในขณะที่ GPT-4.5 เป็นการอัปเกรดที่สำคัญในแง่ของขนาดและประสิทธิภาพ แต่ก็ไม่ได้ผลักดันขอบเขตของความสามารถ AI ในลักษณะเดียวกับที่โมเดล “frontier” จะทำ

การฝึกอบรมและการพัฒนา

รายงานระบุว่า OpenAI ใช้โมเดลการให้เหตุผล o1 (ชื่อรหัส Strawberry) และข้อมูลสังเคราะห์เพื่อฝึกอบรม GPT-4.5 บริษัทยืนยันการรวมกันของเทคนิคการกำกับดูแลแบบใหม่และวิธีการที่กำหนดไว้:

  • Supervised Fine-Tuning (SFT)
  • Reinforcement Learning from Human Feedback (RLHF)

สิ่งเหล่านี้คล้ายกับแนวทางที่ใช้ในการพัฒนา GPT-4o

การจัดการภาพหลอนและการปรับปรุงการทำงานร่วมกัน

การปรับปรุงที่โดดเด่นอย่างหนึ่งคือการลดภาพหลอน ตามที่ OpenAI ระบุ GPT-4.5 มีอาการประสาทหลอนน้อยกว่า GPT-4o และน้อยกว่าโมเดล o1 เล็กน้อย

Raphael Gontijo Lopes นักวิจัยของ OpenAI เน้นย้ำถึงการมุ่งเน้นไปที่การทำงานร่วมกัน: “เราปรับ GPT-4.5 ให้เป็นผู้ทำงานร่วมกันที่ดีขึ้น ทำให้การสนทนารู้สึกอบอุ่นขึ้น ใช้งานง่ายขึ้น และมีความแตกต่างทางอารมณ์มากขึ้น” เขาตั้งข้อสังเกตว่าผู้ทดสอบที่เป็นมนุษย์ให้คะแนน GPT-4.5 สูงกว่า GPT-4o ในหมวดหมู่ต่างๆ

มุมมองของ CEO: การยอมรับข้อจำกัด

Sam Altman ซีอีโอของ OpenAI ในโพสต์บน X ยอมรับธรรมชาติของ GPT-4.5: “โมเดลยักษ์ ราคาแพง” ที่ “จะไม่ทำลายเกณฑ์มาตรฐาน” การประเมินอย่างตรงไปตรงมานี้ตอกย้ำแนวคิดที่ว่ารุ่นนี้เป็นเรื่องของความก้าวหน้าทีละน้อยมากกว่าการพัฒนาที่ปฏิวัติวงการ

แผนการเปิดตัว

การเปิดตัว GPT-4.5 เป็นไปตามแนวทางแบบแบ่งระดับ:

  1. ผู้ใช้ Pro: เข้าถึงได้ทันทีในรูปแบบตัวอย่างการวิจัย
  2. ผู้ใช้ Plus และ Team: คาดว่าจะพร้อมใช้งานในสัปดาห์หน้า
  3. ผู้ใช้ Enterprise และ Edu: การเข้าถึงจะตามมาหลังจากผู้ใช้ Plus และ Team

โมเดลนี้ยังมีให้ใช้งานผ่านแพลตฟอร์ม Azure AI Foundry ของ Microsoft ควบคู่ไปกับข้อเสนอจาก Stability, Cohere และ Microsoft เอง

ความแม่นยำและภาพหลอนที่ลดลง

OpenAI เน้นย้ำถึงความแม่นยำที่ได้รับการปรับปรุงของ GPT-4.5 โดยอ้างว่าสร้างการตอบสนองที่แม่นยำยิ่งขึ้นและมีอาการประสาทหลอนน้อยกว่าเมื่อเทียบกับรุ่นอื่นๆ นี่เป็นขั้นตอนสำคัญไปข้างหน้า เนื่องจากภาพหลอน (การสร้างข้อมูลที่เป็นเท็จหรือไม่สมเหตุสมผล) เป็นความท้าทายที่ต่อเนื่องในแบบจำลองภาษาขนาดใหญ่

มองไปข้างหน้า: GPT-5 และเส้นทางสู่ AGI

รายงานก่อนหน้านี้แนะนำไทม์ไลน์สำหรับรุ่นของ OpenAI: GPT-4.5 ภายในสิ้นเดือนกุมภาพันธ์ และ GPT-5 เร็วที่สุดในปลายเดือนพฤษภาคม Altman ได้อธิบาย GPT-5 ว่าเป็น “ระบบที่รวมเทคโนโลยีจำนวนมากของเรา” คาดว่าจะรวมโมเดลการให้เหตุผล o3 ใหม่ของ OpenAI ซึ่งถูกหยอกล้อในระหว่างการประกาศ “12 วันแห่งคริสต์มาส” ของบริษัทในเดือนธันวาคม

ในขณะที่ o3-mini เปิดตัวก่อนหน้านี้ โมเดล o3 แบบเต็มกำลังถูกสงวนไว้สำหรับระบบ GPT-5 สิ่งนี้สอดคล้องกับวิสัยทัศน์ที่กว้างขึ้นของ OpenAI ในการรวมแบบจำลองภาษาขนาดใหญ่เพื่อสร้างระบบที่มีความสามารถมากขึ้น ซึ่งอาจเข้าใกล้ขอบเขตของปัญญาประดิษฐ์ทั่วไป (AGI)

เจาะลึกสถาปัตยกรรมของ GPT-4.5

แม้ว่า OpenAI จะไม่ได้เปิดเผยรายละเอียดทางเทคนิคอย่างละเอียด แต่ก็สามารถอนุมานได้หลายอย่างเกี่ยวกับสถาปัตยกรรมของ GPT-4.5 ตามข้อมูลที่มีอยู่:

  • จำนวนพารามิเตอร์ที่มากขึ้น: อธิบายว่าเป็น “LLM ที่ใหญ่ที่สุด” ของ OpenAI จึงมีเหตุผลที่จะสันนิษฐานว่า GPT-4.5 มีจำนวนพารามิเตอร์ที่สูงกว่ารุ่นก่อนอย่างมาก ความจุที่เพิ่มขึ้นนี้มีส่วนช่วยในการปรับปรุงฐานความรู้และความสามารถในการให้เหตุผล

  • ประสิทธิภาพการคำนวณที่ปรับให้เหมาะสม: เอกสารที่รั่วไหลออกมากล่าวถึงการปรับปรุงประสิทธิภาพการคำนวณ “มากกว่า 10 เท่า” เมื่อเทียบกับ GPT-4 สิ่งนี้ชี้ให้เห็นถึงการปรับแต่งสถาปัตยกรรมที่ช่วยให้โมเดลประมวลผลข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น ซึ่งอาจนำไปสู่เวลาตอบสนองที่เร็วขึ้นและการใช้พลังงานที่ลดลง

  • กลไกความสนใจที่ได้รับการปรับปรุง: จากการเน้นที่การจดจำรูปแบบและการเชื่อมโยง จึงมีแนวโน้มว่า GPT-4.5 จะรวมเอาความก้าวหน้าในกลไกความสนใจ กลไกเหล่านี้ช่วยให้โมเดลสามารถมุ่งเน้นไปที่ส่วนที่เกี่ยวข้องมากที่สุดของข้อความที่ป้อนเข้า ซึ่งนำไปสู่การตอบสนองที่สอดคล้องกันและเหมาะสมกับบริบทมากขึ้น

  • ข้อมูลการฝึกอบรมที่ละเอียดยิ่งขึ้น: การใช้ “เทคนิคการกำกับดูแลแบบใหม่” บอกเป็นนัยถึงการปรับปรุงคุณภาพและความหลากหลายของข้อมูลการฝึกอบรม ซึ่งอาจเกี่ยวข้องกับการรวมชุดข้อมูลเฉพาะทางมากขึ้น การใช้ประโยชน์จากการสร้างข้อมูลสังเคราะห์ หรือการใช้วิธีการที่ซับซ้อนมากขึ้นสำหรับการกรองและทำความสะอาดข้อมูลที่มีอยู่

บทบาทของข้อมูลสังเคราะห์

การรายงานการใช้ข้อมูลสังเคราะห์ในการฝึกอบรม GPT-4.5 เป็นสิ่งที่น่าสังเกตเป็นพิเศษ ข้อมูลสังเคราะห์ที่สร้างขึ้นโดยแบบจำลอง AI เองมีข้อดีหลายประการ:

  • การเอาชนะความขาดแคลนข้อมูล: สามารถใช้เพื่อเสริมชุดข้อมูลที่มีอยู่ โดยเฉพาะอย่างยิ่งในโดเมนที่ข้อมูลในโลกแห่งความเป็นจริงมีจำกัดหรือยากที่จะได้รับ

  • การจัดการอคติ: ข้อมูลสังเคราะห์สามารถสร้างขึ้นอย่างระมัดระวังเพื่อลดอคติที่มีอยู่ในชุดข้อมูลในโลกแห่งความเป็นจริง ซึ่งนำไปสู่แบบจำลอง AI ที่ยุติธรรมและเท่าเทียมกันมากขึ้น

  • การสำรวจสถานการณ์สมมติ: ช่วยให้นักวิจัยสามารถฝึกอบรมแบบจำลองในสถานการณ์ที่อาจหายากหรือไม่สามารถสังเกตได้ในโลกแห่งความเป็นจริง ซึ่งช่วยเพิ่มความสามารถในการจัดการกับสถานการณ์ที่ไม่คาดคิด

อย่างไรก็ตาม การใช้ข้อมูลสังเคราะห์ยังทำให้เกิดความกังวล:

  • ศักยภาพในการขยายอคติ: หากไม่ได้รับการควบคุมอย่างระมัดระวัง ข้อมูลสังเคราะห์สามารถขยายอคติที่มีอยู่โดยไม่ได้ตั้งใจหรือแนะนำอคติใหม่

  • ความเสี่ยงของการใส่มากเกินไป: แบบจำลองที่ได้รับการฝึกฝนโดยใช้ข้อมูลสังเคราะห์เป็นหลักอาจทำงานได้ดีกับข้อมูลสังเคราะห์ที่คล้ายกัน แต่พยายามที่จะสรุปไปยังอินพุตในโลกแห่งความเป็นจริง

แนวทางของ OpenAI ในการใช้ข้อมูลสังเคราะห์น่าจะเกี่ยวข้องกับการตรวจสอบและการทดสอบอย่างรอบคอบเพื่อลดความเสี่ยงเหล่านี้

“บุคลิกภาพที่ละเอียดยิ่งขึ้น”: การพิจารณาอย่างใกล้ชิด

คำกล่าวอ้างของ OpenAI ที่ว่า GPT-4.5 มี “บุคลิกภาพที่ละเอียดยิ่งขึ้น” เป็นสิ่งที่น่าสนใจ สิ่งนี้ชี้ให้เห็นถึงความพยายามที่จะทำให้การโต้ตอบของแบบจำลองมีส่วนร่วม เป็นธรรมชาติ และชาญฉลาดทางอารมณ์มากขึ้น ซึ่งอาจเกี่ยวข้องกับเทคนิคหลายอย่าง:

  • การปรับแต่งอย่างละเอียดเกี่ยวกับข้อมูลการสนทนา: การฝึกอบรมแบบจำลองเกี่ยวกับชุดข้อมูลขนาดใหญ่ของการสนทนาของมนุษย์เพื่อให้เข้าใจความแตกต่างของภาษา น้ำเสียง และสัญญาณทางสังคมได้ดียิ่งขึ้น

  • การรวมแบบจำลองความฉลาดทางอารมณ์: การรวมแบบจำลองเฉพาะทางที่ออกแบบมาเพื่อรับรู้และตอบสนองต่ออารมณ์ของมนุษย์ ทำให้ GPT-4.5 สามารถปรับรูปแบบการสื่อสารได้ตามความเหมาะสม

  • การเรียนรู้แบบเสริมกำลังด้วยความคิดเห็นของมนุษย์: การใช้ความคิดเห็นของมนุษย์เพื่อให้รางวัลแก่การตอบสนองที่ถูกมองว่าเป็นธรรมชาติ มีส่วนร่วม และเห็นอกเห็นใจมากขึ้น

เป้าหมายคือการสร้างประสบการณ์การสนทนาที่เหมือนมนุษย์มากขึ้น ก้าวไปไกลกว่าการโต้ตอบที่ใช้งานได้อย่างหมดจดเพื่อส่งเสริมความรู้สึกของการเชื่อมต่อและความสัมพันธ์

ผลกระทบต่อกลุ่มผู้ใช้ที่แตกต่างกัน

การเปิดตัว GPT-4.5 แบบแบ่งระดับบ่งบอกถึงผลกระทบที่แตกต่างกันสำหรับกลุ่มผู้ใช้ต่างๆ:

  • ผู้ใช้ Pro: ในฐานะผู้ใช้งานกลุ่มแรก ผู้ใช้ Pro จะมีโอกาสทดลองกับความสามารถของแบบจำลองและให้ข้อเสนอแนะแก่ OpenAI ข้อเสนอแนะนี้จะมีความสำคัญในการกำหนดรูปแบบการพัฒนาต่อไปของแบบจำลอง

  • ผู้ใช้ Plus และ Team: ผู้ใช้เหล่านี้มีแนวโน้มที่จะได้รับประโยชน์จากประสิทธิภาพที่ได้รับการปรับปรุงและรูปแบบการโต้ตอบที่ละเอียดยิ่งขึ้นของ GPT-4.5 ในงานประจำวันของพวกเขา เช่น การเขียน การเขียนโค้ด และการวิจัย

  • ผู้ใช้ Enterprise และ Edu: สำหรับผู้ใช้เหล่านี้ ความแม่นยำที่เพิ่มขึ้นและภาพหลอนที่ลดลงอาจมีค่าอย่างยิ่ง ทำให้มั่นใจได้ถึงผลลัพธ์ที่น่าเชื่อถือและไว้วางใจได้มากขึ้นในการตั้งค่าระดับมืออาชีพและการศึกษา

  • ผู้ใช้ Microsoft Azure AI Foundry: ความพร้อมใช้งานของ GPT-4.5 บนแพลตฟอร์มนี้ขยายการเข้าถึงแบบจำลองสำหรับนักพัฒนาและนักวิจัย ส่งเสริมนวัตกรรมและการสร้างแอปพลิเคชันที่ขับเคลื่อนด้วย AI ใหม่

บริบทที่กว้างขึ้น: กลยุทธ์ของ OpenAI

การเปิดตัว GPT-4.5 แม้ว่าจะไม่ใช่ frontier model แต่ก็สอดคล้องกับกลยุทธ์ที่กว้างขึ้นของ OpenAI ในการพัฒนาแบบวนซ้ำและความก้าวหน้าทีละน้อยไปสู่ AGI ด้วยการเปิดตัวการปรับปรุงที่เพิ่มขึ้น OpenAI สามารถ:

  • รวบรวมความคิดเห็นของผู้ใช้: ปรับแต่งแบบจำลองอย่างต่อเนื่องตามการใช้งานจริงและข้อเสนอแนะ

  • จัดการความคาดหวัง: หลีกเลี่ยงการโฆษณาเกินจริงและตั้งความคาดหวังที่เป็นจริงสำหรับแต่ละรุ่น

  • รักษาความได้เปรียบในการแข่งขัน: ก้าวนำหน้าในสาขา AI ที่มีการพัฒนาอย่างรวดเร็ว

  • เตรียมพร้อมสำหรับความก้าวหน้าในอนาคต: วางรากฐานสำหรับความก้าวหน้าที่สำคัญยิ่งขึ้น เช่น GPT-5

แนวทางนี้ตรงกันข้ามกับการเปิดตัว “บิ๊กแบง” ของบริษัท AI อื่นๆ บางแห่ง ซึ่งชี้ให้เห็นถึงแนวทางที่ระมัดระวังและวัดผลได้มากขึ้นในการพัฒนาและปรับใช้ระบบ AI ที่ทรงพลังมากขึ้น การมุ่งเน้นไม่ได้อยู่ที่การผลักดันขอบเขตของสิ่งที่เป็นไปได้เท่านั้น แต่ยังรวมถึงการรับรองความปลอดภัย ความน่าเชื่อถือ และความพึงพอใจของผู้ใช้

การพัฒนาและการปรับใช้แบบจำลองเช่น GPT-4.5 ทำให้เกิดคำถามมากมาย:

  • เราจะวัดได้อย่างไรว่าแบบจำลองมี “บุคลิกภาพที่ละเอียดยิ่งขึ้น”?
  • อะไรคือผลกระทบของแบบจำลองที่มีอาการประสาทหลอนน้อยลง?
  • อะไรคือความสำคัญของการเปิดตัวแบบจำลองที่ไม่ใช่ frontier model?

คำถามเหล่านี้เป็นคำถามที่ดี และไม่มีคำตอบที่ชัดเจน