ก้าวเล็กๆ ไม่ใช่ก้าวกระโดด
OpenAI กำลังเปิดตัวโมเดล AI หลักรุ่นล่าสุด ซึ่งรู้จักกันภายในว่า Orion แม้ว่าจะได้รับการตั้งชื่ออย่างเป็นทางการว่า GPT-4.5 แต่รุ่นนี้ไม่ได้ถูกจัดว่าเป็นโมเดล “frontier” โดยบริษัท GPT-4.5 พร้อมให้ผู้ใช้ ChatGPT Pro ใช้งานในรูปแบบตัวอย่างการวิจัย OpenAI ยกย่องว่าเป็น “โมเดลที่มีความรู้มากที่สุด” แต่การสื่อสารเบื้องต้นเตือนว่ามันอาจไม่ตรงกับประสิทธิภาพของโมเดลเช่น o1 หรือ o3-mini สิ่งนี้ชี้ให้เห็นถึงการมุ่งเน้นไปที่การปรับแต่งและประสิทธิภาพมากกว่าความก้าวหน้าที่ก้าวล้ำ
ความสามารถที่เพิ่มขึ้น การโต้ตอบที่ละเอียดยิ่งขึ้น
ผู้ใช้สามารถคาดหวังอะไรจาก GPT-4.5 ได้บ้าง? OpenAI เน้นการปรับปรุงในหลายด้านที่สำคัญ:
- ความสามารถในการเขียน: โมเดลนี้ได้รับการออกแบบมาให้เป็นผู้ช่วยในการเขียนที่มีความสามารถมากขึ้น
- ความรู้เกี่ยวกับโลกที่กว้างขึ้น: GPT-4.5 มีความเข้าใจในแนวคิดและข้อมูลในโลกแห่งความเป็นจริงที่กว้างขึ้น
- ‘บุคลิกภาพที่ละเอียดยิ่งขึ้น’: OpenAI อ้างว่าการโต้ตอบกับโมเดลนี้จะให้ความรู้สึกเป็นธรรมชาติและใช้งานง่ายยิ่งขึ้น
บริษัทเน้นย้ำถึงความสามารถของ GPT-4.5 ในการจดจำรูปแบบและเชื่อมโยง ทำให้เหมาะอย่างยิ่งสำหรับงานต่างๆ เช่น การเขียน การเขียนโปรแกรม และการแก้ไขปัญหาในทางปฏิบัติ
ไม่ใช่ Frontier Model: ทำความเข้าใจความแตกต่าง
แม้จะมีการปรับปรุงเหล่านี้ OpenAI ก็ชัดเจนว่า GPT-4.5 ไม่ได้แสดงถึงการก้าวกระโดดไปสู่ความสามารถใหม่ทั้งหมด เอกสารที่รั่วไหลออกมา ซึ่งต่อมาได้รับการแก้ไข ได้ให้บริบทเพิ่มเติม:
“GPT-4.5 ไม่ใช่ frontier model แต่เป็น LLM ที่ใหญ่ที่สุดของ OpenAI ปรับปรุงประสิทธิภาพการคำนวณของ GPT-4 ได้มากกว่า 10 เท่า” เอกสารระบุ “มันไม่ได้แนะนำความสามารถ frontier ใหม่ 7 อย่างเมื่อเทียบกับรุ่นการให้เหตุผลก่อนหน้านี้ และประสิทธิภาพของมันต่ำกว่า o1, o3-mini และการวิจัยเชิงลึกในการประเมินความพร้อมส่วนใหญ่”
ความแตกต่างนี้มีความสำคัญ บ่งชี้ว่าในขณะที่ GPT-4.5 เป็นการอัปเกรดที่สำคัญในแง่ของขนาดและประสิทธิภาพ แต่ก็ไม่ได้ผลักดันขอบเขตของความสามารถ AI ในลักษณะเดียวกับที่โมเดล “frontier” จะทำ
การฝึกอบรมและการพัฒนา
รายงานระบุว่า OpenAI ใช้โมเดลการให้เหตุผล o1 (ชื่อรหัส Strawberry) และข้อมูลสังเคราะห์เพื่อฝึกอบรม GPT-4.5 บริษัทยืนยันการรวมกันของเทคนิคการกำกับดูแลแบบใหม่และวิธีการที่กำหนดไว้:
- Supervised Fine-Tuning (SFT)
- Reinforcement Learning from Human Feedback (RLHF)
สิ่งเหล่านี้คล้ายกับแนวทางที่ใช้ในการพัฒนา GPT-4o
การจัดการภาพหลอนและการปรับปรุงการทำงานร่วมกัน
การปรับปรุงที่โดดเด่นอย่างหนึ่งคือการลดภาพหลอน ตามที่ OpenAI ระบุ GPT-4.5 มีอาการประสาทหลอนน้อยกว่า GPT-4o และน้อยกว่าโมเดล o1 เล็กน้อย
Raphael Gontijo Lopes นักวิจัยของ OpenAI เน้นย้ำถึงการมุ่งเน้นไปที่การทำงานร่วมกัน: “เราปรับ GPT-4.5 ให้เป็นผู้ทำงานร่วมกันที่ดีขึ้น ทำให้การสนทนารู้สึกอบอุ่นขึ้น ใช้งานง่ายขึ้น และมีความแตกต่างทางอารมณ์มากขึ้น” เขาตั้งข้อสังเกตว่าผู้ทดสอบที่เป็นมนุษย์ให้คะแนน GPT-4.5 สูงกว่า GPT-4o ในหมวดหมู่ต่างๆ
มุมมองของ CEO: การยอมรับข้อจำกัด
Sam Altman ซีอีโอของ OpenAI ในโพสต์บน X ยอมรับธรรมชาติของ GPT-4.5: “โมเดลยักษ์ ราคาแพง” ที่ “จะไม่ทำลายเกณฑ์มาตรฐาน” การประเมินอย่างตรงไปตรงมานี้ตอกย้ำแนวคิดที่ว่ารุ่นนี้เป็นเรื่องของความก้าวหน้าทีละน้อยมากกว่าการพัฒนาที่ปฏิวัติวงการ
แผนการเปิดตัว
การเปิดตัว GPT-4.5 เป็นไปตามแนวทางแบบแบ่งระดับ:
- ผู้ใช้ Pro: เข้าถึงได้ทันทีในรูปแบบตัวอย่างการวิจัย
- ผู้ใช้ Plus และ Team: คาดว่าจะพร้อมใช้งานในสัปดาห์หน้า
- ผู้ใช้ Enterprise และ Edu: การเข้าถึงจะตามมาหลังจากผู้ใช้ Plus และ Team
โมเดลนี้ยังมีให้ใช้งานผ่านแพลตฟอร์ม Azure AI Foundry ของ Microsoft ควบคู่ไปกับข้อเสนอจาก Stability, Cohere และ Microsoft เอง
ความแม่นยำและภาพหลอนที่ลดลง
OpenAI เน้นย้ำถึงความแม่นยำที่ได้รับการปรับปรุงของ GPT-4.5 โดยอ้างว่าสร้างการตอบสนองที่แม่นยำยิ่งขึ้นและมีอาการประสาทหลอนน้อยกว่าเมื่อเทียบกับรุ่นอื่นๆ นี่เป็นขั้นตอนสำคัญไปข้างหน้า เนื่องจากภาพหลอน (การสร้างข้อมูลที่เป็นเท็จหรือไม่สมเหตุสมผล) เป็นความท้าทายที่ต่อเนื่องในแบบจำลองภาษาขนาดใหญ่
มองไปข้างหน้า: GPT-5 และเส้นทางสู่ AGI
รายงานก่อนหน้านี้แนะนำไทม์ไลน์สำหรับรุ่นของ OpenAI: GPT-4.5 ภายในสิ้นเดือนกุมภาพันธ์ และ GPT-5 เร็วที่สุดในปลายเดือนพฤษภาคม Altman ได้อธิบาย GPT-5 ว่าเป็น “ระบบที่รวมเทคโนโลยีจำนวนมากของเรา” คาดว่าจะรวมโมเดลการให้เหตุผล o3 ใหม่ของ OpenAI ซึ่งถูกหยอกล้อในระหว่างการประกาศ “12 วันแห่งคริสต์มาส” ของบริษัทในเดือนธันวาคม
ในขณะที่ o3-mini เปิดตัวก่อนหน้านี้ โมเดล o3 แบบเต็มกำลังถูกสงวนไว้สำหรับระบบ GPT-5 สิ่งนี้สอดคล้องกับวิสัยทัศน์ที่กว้างขึ้นของ OpenAI ในการรวมแบบจำลองภาษาขนาดใหญ่เพื่อสร้างระบบที่มีความสามารถมากขึ้น ซึ่งอาจเข้าใกล้ขอบเขตของปัญญาประดิษฐ์ทั่วไป (AGI)
เจาะลึกสถาปัตยกรรมของ GPT-4.5
แม้ว่า OpenAI จะไม่ได้เปิดเผยรายละเอียดทางเทคนิคอย่างละเอียด แต่ก็สามารถอนุมานได้หลายอย่างเกี่ยวกับสถาปัตยกรรมของ GPT-4.5 ตามข้อมูลที่มีอยู่:
จำนวนพารามิเตอร์ที่มากขึ้น: อธิบายว่าเป็น “LLM ที่ใหญ่ที่สุด” ของ OpenAI จึงมีเหตุผลที่จะสันนิษฐานว่า GPT-4.5 มีจำนวนพารามิเตอร์ที่สูงกว่ารุ่นก่อนอย่างมาก ความจุที่เพิ่มขึ้นนี้มีส่วนช่วยในการปรับปรุงฐานความรู้และความสามารถในการให้เหตุผล
ประสิทธิภาพการคำนวณที่ปรับให้เหมาะสม: เอกสารที่รั่วไหลออกมากล่าวถึงการปรับปรุงประสิทธิภาพการคำนวณ “มากกว่า 10 เท่า” เมื่อเทียบกับ GPT-4 สิ่งนี้ชี้ให้เห็นถึงการปรับแต่งสถาปัตยกรรมที่ช่วยให้โมเดลประมวลผลข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น ซึ่งอาจนำไปสู่เวลาตอบสนองที่เร็วขึ้นและการใช้พลังงานที่ลดลง
กลไกความสนใจที่ได้รับการปรับปรุง: จากการเน้นที่การจดจำรูปแบบและการเชื่อมโยง จึงมีแนวโน้มว่า GPT-4.5 จะรวมเอาความก้าวหน้าในกลไกความสนใจ กลไกเหล่านี้ช่วยให้โมเดลสามารถมุ่งเน้นไปที่ส่วนที่เกี่ยวข้องมากที่สุดของข้อความที่ป้อนเข้า ซึ่งนำไปสู่การตอบสนองที่สอดคล้องกันและเหมาะสมกับบริบทมากขึ้น
ข้อมูลการฝึกอบรมที่ละเอียดยิ่งขึ้น: การใช้ “เทคนิคการกำกับดูแลแบบใหม่” บอกเป็นนัยถึงการปรับปรุงคุณภาพและความหลากหลายของข้อมูลการฝึกอบรม ซึ่งอาจเกี่ยวข้องกับการรวมชุดข้อมูลเฉพาะทางมากขึ้น การใช้ประโยชน์จากการสร้างข้อมูลสังเคราะห์ หรือการใช้วิธีการที่ซับซ้อนมากขึ้นสำหรับการกรองและทำความสะอาดข้อมูลที่มีอยู่
บทบาทของข้อมูลสังเคราะห์
การรายงานการใช้ข้อมูลสังเคราะห์ในการฝึกอบรม GPT-4.5 เป็นสิ่งที่น่าสังเกตเป็นพิเศษ ข้อมูลสังเคราะห์ที่สร้างขึ้นโดยแบบจำลอง AI เองมีข้อดีหลายประการ:
การเอาชนะความขาดแคลนข้อมูล: สามารถใช้เพื่อเสริมชุดข้อมูลที่มีอยู่ โดยเฉพาะอย่างยิ่งในโดเมนที่ข้อมูลในโลกแห่งความเป็นจริงมีจำกัดหรือยากที่จะได้รับ
การจัดการอคติ: ข้อมูลสังเคราะห์สามารถสร้างขึ้นอย่างระมัดระวังเพื่อลดอคติที่มีอยู่ในชุดข้อมูลในโลกแห่งความเป็นจริง ซึ่งนำไปสู่แบบจำลอง AI ที่ยุติธรรมและเท่าเทียมกันมากขึ้น
การสำรวจสถานการณ์สมมติ: ช่วยให้นักวิจัยสามารถฝึกอบรมแบบจำลองในสถานการณ์ที่อาจหายากหรือไม่สามารถสังเกตได้ในโลกแห่งความเป็นจริง ซึ่งช่วยเพิ่มความสามารถในการจัดการกับสถานการณ์ที่ไม่คาดคิด
อย่างไรก็ตาม การใช้ข้อมูลสังเคราะห์ยังทำให้เกิดความกังวล:
ศักยภาพในการขยายอคติ: หากไม่ได้รับการควบคุมอย่างระมัดระวัง ข้อมูลสังเคราะห์สามารถขยายอคติที่มีอยู่โดยไม่ได้ตั้งใจหรือแนะนำอคติใหม่
ความเสี่ยงของการใส่มากเกินไป: แบบจำลองที่ได้รับการฝึกฝนโดยใช้ข้อมูลสังเคราะห์เป็นหลักอาจทำงานได้ดีกับข้อมูลสังเคราะห์ที่คล้ายกัน แต่พยายามที่จะสรุปไปยังอินพุตในโลกแห่งความเป็นจริง
แนวทางของ OpenAI ในการใช้ข้อมูลสังเคราะห์น่าจะเกี่ยวข้องกับการตรวจสอบและการทดสอบอย่างรอบคอบเพื่อลดความเสี่ยงเหล่านี้
“บุคลิกภาพที่ละเอียดยิ่งขึ้น”: การพิจารณาอย่างใกล้ชิด
คำกล่าวอ้างของ OpenAI ที่ว่า GPT-4.5 มี “บุคลิกภาพที่ละเอียดยิ่งขึ้น” เป็นสิ่งที่น่าสนใจ สิ่งนี้ชี้ให้เห็นถึงความพยายามที่จะทำให้การโต้ตอบของแบบจำลองมีส่วนร่วม เป็นธรรมชาติ และชาญฉลาดทางอารมณ์มากขึ้น ซึ่งอาจเกี่ยวข้องกับเทคนิคหลายอย่าง:
การปรับแต่งอย่างละเอียดเกี่ยวกับข้อมูลการสนทนา: การฝึกอบรมแบบจำลองเกี่ยวกับชุดข้อมูลขนาดใหญ่ของการสนทนาของมนุษย์เพื่อให้เข้าใจความแตกต่างของภาษา น้ำเสียง และสัญญาณทางสังคมได้ดียิ่งขึ้น
การรวมแบบจำลองความฉลาดทางอารมณ์: การรวมแบบจำลองเฉพาะทางที่ออกแบบมาเพื่อรับรู้และตอบสนองต่ออารมณ์ของมนุษย์ ทำให้ GPT-4.5 สามารถปรับรูปแบบการสื่อสารได้ตามความเหมาะสม
การเรียนรู้แบบเสริมกำลังด้วยความคิดเห็นของมนุษย์: การใช้ความคิดเห็นของมนุษย์เพื่อให้รางวัลแก่การตอบสนองที่ถูกมองว่าเป็นธรรมชาติ มีส่วนร่วม และเห็นอกเห็นใจมากขึ้น
เป้าหมายคือการสร้างประสบการณ์การสนทนาที่เหมือนมนุษย์มากขึ้น ก้าวไปไกลกว่าการโต้ตอบที่ใช้งานได้อย่างหมดจดเพื่อส่งเสริมความรู้สึกของการเชื่อมต่อและความสัมพันธ์
ผลกระทบต่อกลุ่มผู้ใช้ที่แตกต่างกัน
การเปิดตัว GPT-4.5 แบบแบ่งระดับบ่งบอกถึงผลกระทบที่แตกต่างกันสำหรับกลุ่มผู้ใช้ต่างๆ:
ผู้ใช้ Pro: ในฐานะผู้ใช้งานกลุ่มแรก ผู้ใช้ Pro จะมีโอกาสทดลองกับความสามารถของแบบจำลองและให้ข้อเสนอแนะแก่ OpenAI ข้อเสนอแนะนี้จะมีความสำคัญในการกำหนดรูปแบบการพัฒนาต่อไปของแบบจำลอง
ผู้ใช้ Plus และ Team: ผู้ใช้เหล่านี้มีแนวโน้มที่จะได้รับประโยชน์จากประสิทธิภาพที่ได้รับการปรับปรุงและรูปแบบการโต้ตอบที่ละเอียดยิ่งขึ้นของ GPT-4.5 ในงานประจำวันของพวกเขา เช่น การเขียน การเขียนโค้ด และการวิจัย
ผู้ใช้ Enterprise และ Edu: สำหรับผู้ใช้เหล่านี้ ความแม่นยำที่เพิ่มขึ้นและภาพหลอนที่ลดลงอาจมีค่าอย่างยิ่ง ทำให้มั่นใจได้ถึงผลลัพธ์ที่น่าเชื่อถือและไว้วางใจได้มากขึ้นในการตั้งค่าระดับมืออาชีพและการศึกษา
ผู้ใช้ Microsoft Azure AI Foundry: ความพร้อมใช้งานของ GPT-4.5 บนแพลตฟอร์มนี้ขยายการเข้าถึงแบบจำลองสำหรับนักพัฒนาและนักวิจัย ส่งเสริมนวัตกรรมและการสร้างแอปพลิเคชันที่ขับเคลื่อนด้วย AI ใหม่
บริบทที่กว้างขึ้น: กลยุทธ์ของ OpenAI
การเปิดตัว GPT-4.5 แม้ว่าจะไม่ใช่ frontier model แต่ก็สอดคล้องกับกลยุทธ์ที่กว้างขึ้นของ OpenAI ในการพัฒนาแบบวนซ้ำและความก้าวหน้าทีละน้อยไปสู่ AGI ด้วยการเปิดตัวการปรับปรุงที่เพิ่มขึ้น OpenAI สามารถ:
รวบรวมความคิดเห็นของผู้ใช้: ปรับแต่งแบบจำลองอย่างต่อเนื่องตามการใช้งานจริงและข้อเสนอแนะ
จัดการความคาดหวัง: หลีกเลี่ยงการโฆษณาเกินจริงและตั้งความคาดหวังที่เป็นจริงสำหรับแต่ละรุ่น
รักษาความได้เปรียบในการแข่งขัน: ก้าวนำหน้าในสาขา AI ที่มีการพัฒนาอย่างรวดเร็ว
เตรียมพร้อมสำหรับความก้าวหน้าในอนาคต: วางรากฐานสำหรับความก้าวหน้าที่สำคัญยิ่งขึ้น เช่น GPT-5
แนวทางนี้ตรงกันข้ามกับการเปิดตัว “บิ๊กแบง” ของบริษัท AI อื่นๆ บางแห่ง ซึ่งชี้ให้เห็นถึงแนวทางที่ระมัดระวังและวัดผลได้มากขึ้นในการพัฒนาและปรับใช้ระบบ AI ที่ทรงพลังมากขึ้น การมุ่งเน้นไม่ได้อยู่ที่การผลักดันขอบเขตของสิ่งที่เป็นไปได้เท่านั้น แต่ยังรวมถึงการรับรองความปลอดภัย ความน่าเชื่อถือ และความพึงพอใจของผู้ใช้
การพัฒนาและการปรับใช้แบบจำลองเช่น GPT-4.5 ทำให้เกิดคำถามมากมาย:
- เราจะวัดได้อย่างไรว่าแบบจำลองมี “บุคลิกภาพที่ละเอียดยิ่งขึ้น”?
- อะไรคือผลกระทบของแบบจำลองที่มีอาการประสาทหลอนน้อยลง?
- อะไรคือความสำคัญของการเปิดตัวแบบจำลองที่ไม่ใช่ frontier model?
คำถามเหล่านี้เป็นคำถามที่ดี และไม่มีคำตอบที่ชัดเจน