การปรับปรุงทีละน้อย กับต้นทุนที่สูงลิ่ว
OpenAI เปิดตัว GPT-4.5 โดยเริ่มต้นในรูปแบบพรีวิวสำหรับการวิจัย (research preview) โมเดลภาษาอันทรงพลังรุ่นใหม่นี้เปิดให้ใช้งานในวงจำกัด พร้อมกับป้ายราคาที่สูงลิ่ว: ผู้ใช้ Pro ต้องเผชิญกับค่าธรรมเนียมรายเดือน $200 ในขณะที่ผู้ใช้ Plus สามารถเข้าถึงได้ในราคา $20 ต่อเดือน แม้ว่า Sam Altman ซีอีโอของ OpenAI จะยกย่อง GPT-4.5 ว่าเป็นแบบจำลองที่เป็นธรรมชาติและสนทนาได้มากขึ้น แต่การเปิดตัวครั้งนี้กลับได้รับการตอบรับที่หลากหลาย โดยเฉพาะอย่างยิ่งเกี่ยวกับความสามารถในการให้เหตุผลหลัก
GPT-4.5 มีการปรับปรุงในหลายด้านที่สำคัญ OpenAI อ้างว่ามีการปรับปรุงในด้านความแม่นยำ ลดแนวโน้มที่จะ “หลอน” (สร้างข้อมูลเท็จ) และเพิ่มความสามารถในการชักจูง อย่างไรก็ตาม การปรับปรุงเหล่านี้มาพร้อมกับต้นทุนที่สูง โครงสร้างราคาสำหรับการใช้ GPT-4.5 ถูกกำหนดไว้ที่ $75 ต่อล้านโทเค็นอินพุต และ $150 ต่อล้านโทเค็นเอาต์พุตที่น่าตกใจ การกำหนดราคานี้ได้จุดประกายการถกเถียงอย่างดุเดือดในชุมชน AI โดยผู้เชี่ยวชาญมีความเห็นที่แตกต่างกันอย่างมากว่าการปรับปรุงทีละน้อยนั้นสมเหตุสมผลกับค่าใช้จ่ายทางการเงินที่สำคัญเช่นนี้หรือไม่
คำถามหลักอยู่ที่ข้อเสนอคุณค่าที่แท้จริงของ GPT-4.5 ในขณะที่การสนทนาที่ราบรื่นขึ้นและความแม่นยำที่ดีขึ้นเล็กน้อยเป็นสิ่งที่น่ายินดี แต่คำถามพื้นฐานยังคงอยู่: มันแสดงถึงความก้าวหน้าครั้งสำคัญในความสามารถของ AI หรือไม่ หรือเป็นเพียงการปรับแต่งเทคโนโลยีที่มีอยู่ซึ่งมีราคาแพง?
การทดสอบในโลกแห่งความเป็นจริง: ความไม่สอดคล้องกับคำกล่าวอ้างของ OpenAI?
การประเมินอิสระของ GPT-4.5 ได้กระตุ้นให้เกิดการถกเถียงกันมากขึ้น Andrej Karpathy บุคคลสำคัญในสาขา AI ได้ทำการทดลองเปรียบเทียบ GPT-4 กับ GPT-4.5 งานเขียนเชิงสร้างสรรค์ห้างานถูกนำเสนอต่อผู้ใช้ ซึ่งจากนั้นถูกขอให้ตัดสินคุณภาพของผลลัพธ์ ที่น่าแปลกใจคือ ผลลัพธ์สนับสนุนโมเดล GPT-4 รุ่นเก่าในสี่ในห้างาน ผลลัพธ์นี้ท้าทายโดยตรงต่อแนวคิดที่ว่า GPT-4.5 แสดงถึงการทำซ้ำที่เหนือกว่าในระดับสากล
การประเมินทางเทคนิคของ Dr. Raj Dandeker ให้ผลลัพธ์ที่น่ากังวลในทำนองเดียวกัน การทดสอบของเขามุ่งเน้นไปที่ด้านที่ OpenAI อ้างว่ามีการปรับปรุงอย่างชัดเจน เช่น การให้เหตุผลทางคณิตศาสตร์และการอนุมานเชิงตรรกะ อย่างไรก็ตาม มีรายงานว่า GPT-4.5 ประสบปัญหาในด้านเหล่านี้ โดยแสดงให้เห็นถึงข้อได้เปรียบเพียงเล็กน้อยหรือไม่มีเลยเมื่อเทียบกับรุ่นก่อน ผลการวิจัยเหล่านี้ขัดแย้งโดยตรงกับคำยืนยันของ OpenAI และทำให้เกิดคำถามร้ายแรงเกี่ยวกับความโปร่งใสและความถูกต้องของคำกล่าวอ้างทางการตลาดของบริษัท
ปฏิกิริยาของสื่อและอุตสาหกรรม: ความคิดเห็นที่หลากหลาย
การตอบสนองของสื่อต่อ GPT-4.5 สะท้อนให้เห็นถึงความคิดเห็นที่แตกแยกในชุมชน AI นิตยสาร Wired ซึ่งเป็นกระบอกเสียงที่โดดเด่นในด้านเทคโนโลยี ได้นำเสนอมุมมองเชิงวิพากษ์ โดยตั้งคำถามถึงการแสวงหา Artificial General Intelligence (AGI) อย่างไม่หยุดยั้งของ OpenAI และระบุว่า GPT-4.5 เป็นการอัปเกรดที่มีราคาแพงโดยมีกำไรเพียงเล็กน้อย Futurism อีกหนึ่งสิ่งพิมพ์ที่มีอิทธิพล ตั้งข้อสังเกตว่าความตื่นเต้นในช่วงแรกเกี่ยวกับการเปิดตัวลดลง ซึ่งบ่งชี้ถึงความสงสัยที่เพิ่มขึ้นเกี่ยวกับศักยภาพที่แท้จริงของเทคโนโลยี
อย่างไรก็ตาม ไม่ใช่ทุกปฏิกิริยาที่เป็นลบ Jacob Rintamaki ซึ่งเกี่ยวข้องกับ Stanford University ได้เสนอการประเมินในเชิงบวกมากขึ้น โดยเฉพาะอย่างยิ่งการยกย่องอารมณ์ขันที่ได้รับการปรับปรุงของ GPT-4.5 เขาแย้งว่าสิ่งนี้แสดงถึงความก้าวหน้าครั้งสำคัญในความสามารถของ AI ในการทำความเข้าใจและมีส่วนร่วมในการปฏิสัมพันธ์ทางสังคม สิ่งนี้เน้นย้ำถึงช่องทางที่เป็นไปได้สำหรับ GPT-4.5: ความเป็นเลิศในด้านที่การสื่อสารที่ละเอียดอ่อนและอารมณ์ขันมีความสำคัญสูงสุด
คู่แข่งเข้ามามีส่วนร่วม
แม้แต่โมเดล AI ที่แข่งขันกันก็ยัง “แสดงความคิดเห็น” เกี่ยวกับการเปิดตัว GPT-4.5 ในแง่หนึ่ง Grok ของ xAI ซึ่งเป็นโมเดลภาษาคู่แข่ง ยอมรับว่า GPT-4.5 มีการปรับปรุงในด้านความสามารถในการสนทนา แต่ก็ชี้ให้เห็นถึงลักษณะที่ต้องใช้ทรัพยากรมาก สิ่งนี้เน้นย้ำถึงข้อกังวลที่สำคัญ: พลังการประมวลผลที่แท้จริงที่จำเป็นในการเรียกใช้ GPT-4.5 ซึ่งแปลโดยตรงเป็นต้นทุนการดำเนินงานที่สูงขึ้นและรอยเท้าทางสิ่งแวดล้อมที่ใหญ่ขึ้น
ChatGPT เอง เมื่อได้รับแจ้ง เน้นย้ำถึงการรักษาบริบท ความคิดสร้างสรรค์ และความแม่นยำที่ได้รับการปรับปรุงของ GPT-4.5 อย่างไรก็ตาม ยังยอมรับว่าแบบจำลองยังคงแสดงข้อบกพร่อง โดยเฉพาะอย่างยิ่งในการสนทนาที่ยาวนาน ซึ่งบางครั้งอาจสูญเสียการติดตามบทสนทนาที่กำลังดำเนินอยู่หรือสร้างการตอบสนองที่ไม่สอดคล้องกัน การประเมินตนเองนี้ แม้ว่าจะดูเหมือนเป็นกลาง แต่ก็ตอกย้ำการรับรู้ว่า GPT-4.5 แม้จะมีความก้าวหน้า แต่ก็ยังคงเป็นเทคโนโลยีที่ไม่สมบูรณ์
เจาะลึกรายละเอียดเฉพาะ
เพื่อให้เข้าใจถึงการตอบรับที่หลากหลาย สิ่งสำคัญคือต้องตรวจสอบข้อเรียกร้องและข้อเรียกร้องแย้งที่เฉพาะเจาะจงเกี่ยวกับ GPT-4.5 โดยละเอียด
1. การอ้างสิทธิ์ในความแม่นยำที่เพิ่มขึ้น:
OpenAI ยืนยันว่า GPT-4.5 มีความแม่นยำมากกว่ารุ่นก่อน แม้ว่าสิ่งนี้อาจเป็นจริงในงานที่กำหนดไว้อย่างแคบๆ บางอย่าง แต่การทดสอบอิสระโดย Karpathy และ Dandeker ทำให้เกิดข้อสงสัยเกี่ยวกับความสามารถในการสรุปทั่วไปของข้อเรียกร้องนี้ ดูเหมือนว่าการปรับปรุงในด้านความแม่นยำจะไม่สม่ำเสมอในทุกโดเมน และอาจมีความสำคัญน้อยกว่าที่โฆษณาไว้ในตอนแรก
2. สัญญาว่าจะลดอาการประสาทหลอน:
“อาการประสาทหลอน” ซึ่งเป็นแนวโน้มของแบบจำลองภาษาในการสร้างข้อมูลเท็จหรือไม่สมเหตุสมผล เป็นความท้าทายที่ต่อเนื่องในสาขานี้ OpenAI อ้างว่า GPT-4.5 มีความก้าวหน้าในการบรรเทาปัญหานี้ อย่างไรก็ตาม รายงานของผู้ใช้และหลักฐานเล็กๆ น้อยๆ ชี้ให้เห็นว่าอาการประสาทหลอน แม้ว่าอาจจะเกิดขึ้นน้อยลง แต่ก็ยังคงเป็นปัญหาอยู่ แบบจำลองยังคงสามารถสร้างความไม่ถูกต้องที่ระบุไว้อย่างมั่นใจ โดยเฉพาะอย่างยิ่งเมื่อต้องรับมือกับหัวข้อที่ซับซ้อนหรือละเอียดอ่อน
3. ศิลปะแห่งการชักชวน:
OpenAI เน้นย้ำถึงความสามารถในการชักจูงที่เพิ่มขึ้นของ GPT-4.5 สิ่งนี้ทำให้เกิดความกังวลด้านจริยธรรม เนื่องจาก AI ที่ชักจูงได้มากกว่าอาจถูกใช้เพื่อวัตถุประสงค์ในการบิดเบือน เช่น การเผยแพร่ข้อมูลที่ผิด หรือการโน้มน้าวความคิดเห็นในทางที่ไม่พึงประสงค์ ขอบเขตที่ความสามารถในการชักจูงของ GPT-4.5 แสดงถึงการปรับปรุงอย่างแท้จริงหรือความเสี่ยงที่อาจเกิดขึ้นยังคงเป็นหัวข้อของการถกเถียงอย่างต่อเนื่อง
4. ข้อได้เปรียบในการสนทนา:
GPT-4.5 เป็นคู่สนทนาที่คล่องแคล่วและมีส่วนร่วมมากกว่า GPT-4 อย่างไม่ต้องสงสัย นี่อาจเป็นการปรับปรุงที่สำคัญที่สุดและเห็นได้ชัดเจนที่สุด แบบจำลองสร้างข้อความที่ไหลลื่นเป็นธรรมชาติมากขึ้น เลียนแบบรูปแบบการพูดที่เหมือนมนุษย์ได้อย่างมีประสิทธิภาพมากขึ้น และแสดงให้เห็นถึงความเข้าใจที่มากขึ้นเกี่ยวกับความแตกต่างของการสนทนา ทำให้เหมาะสำหรับแอปพลิเคชันต่างๆ เช่น แชทบอท ผู้ช่วยเสมือน และเครื่องมือการเขียนเชิงสร้างสรรค์
5. การขาดดุลในการให้เหตุผล:
แม้จะมีการปรับปรุงในการสนทนา แต่การขาดความก้าวหน้าอย่างมากในความสามารถในการให้เหตุผลก็เป็นจุดยึดที่สำคัญสำหรับนักวิจารณ์หลายคน GPT-4.5 ยังคงประสบปัญหาเกี่ยวกับงานที่ต้องใช้การอนุมานเชิงตรรกะ การให้เหตุผลทางคณิตศาสตร์ และความเข้าใจสามัญสำนึก ข้อจำกัดนี้ขัดขวางความสามารถในการนำไปใช้ในโดเมนที่ต้องการความคิดที่แม่นยำและเชิงวิเคราะห์ เช่น การวิจัยทางวิทยาศาสตร์ การสร้างแบบจำลองทางการเงิน และการวิเคราะห์ทางกฎหมาย
6. ปัจจัยด้านต้นทุน:
ต้นทุนที่สูงเกินไปในการใช้ GPT-4.5 เป็นอุปสรรคสำคัญในการเข้าถึงสำหรับผู้ใช้ที่มีศักยภาพจำนวนมาก โครงสร้างราคา ซึ่งขึ้นอยู่กับโทเค็นอินพุตและเอาต์พุต ทำให้มีราคาแพงเกินไปสำหรับแอปพลิเคชันขนาดใหญ่หรือการใช้งานอย่างต่อเนื่อง สิ่งนี้ทำให้เกิดความกังวลเกี่ยวกับความสามารถในการเข้าถึงและความเท่าเทียม เนื่องจากมีเพียงองค์กรและบุคคลที่มีทุนทรัพย์เพียงพอเท่านั้นที่สามารถใช้ประโยชน์จากเทคโนโลยีได้
7. ป้ายกำกับ “Research Preview”:
การตัดสินใจของ OpenAI ที่จะเปิดตัว GPT-4.5 เป็น “research preview” นั้นน่าสังเกต สิ่งนี้ชี้ให้เห็นว่าแบบจำลองยังอยู่ระหว่างการพัฒนาและอาจมีการปรับปรุงเพิ่มเติม นอกจากนี้ยังบอกเป็นนัยว่า OpenAI ตระหนักถึงข้อจำกัดและกำลังขอความคิดเห็นจากผู้ใช้เพื่อเป็นแนวทางในการปรับปรุงในอนาคต อย่างไรก็ตาม ป้ายกำกับ “research preview” ไม่ได้แก้ตัวอย่างเต็มที่สำหรับต้นทุนที่สูงหรือความคลาดเคลื่อนระหว่างคำกล่าวอ้างของ OpenAI และประสิทธิภาพที่แท้จริงของแบบจำลอง
บริบทที่กว้างขึ้น: การแข่งขันด้านอาวุธ AI
การเปิดตัว GPT-4.5 ต้องเข้าใจในบริบทที่กว้างขึ้นของ “การแข่งขันด้านอาวุธ AI” ที่กำลังดำเนินอยู่ บริษัทต่างๆ เช่น OpenAI, Google และ Anthropic กำลังมีส่วนร่วมในการแข่งขันที่ดุเดือดเพื่อพัฒนาแบบจำลอง AI ที่ทันสมัยและมีความสามารถมากที่สุด แรงกดดันในการแข่งขันนี้สามารถนำไปสู่การเปิดตัวที่เร่งรีบ การเรียกร้องที่เกินจริง และการมุ่งเน้นไปที่การปรับปรุงทีละน้อยมากกว่าความก้าวหน้าขั้นพื้นฐาน
การแสวงหา AGI ซึ่งเป็น AI สมมุติที่มีสติปัญญาระดับมนุษย์และความสามารถในการแก้ปัญหาทั่วไป ยังคงเป็นแรงผลักดันที่อยู่เบื้องหลังการวิจัยและพัฒนาส่วนใหญ่ในสาขานี้ อย่างไรก็ตาม GPT-4.5 แม้จะมีความก้าวหน้า แต่ก็ยังห่างไกลจากเป้าหมายที่ทะเยอทะยานนี้ มันทำหน้าที่เป็นเครื่องเตือนใจว่าเส้นทางสู่ AGI นั้นน่าจะยาวนานและยากลำบาก และความก้าวหน้าที่แท้จริงนั้นหายากและยากที่จะบรรลุ
อนาคตของ GPT-4.5
ชะตากรรมสูงสุดของ GPT-4.5 ยังคงไม่แน่นอน ในฐานะ “research preview” มีแนวโน้มที่จะพัฒนาไปตามกาลเวลา OpenAI อาจจัดการกับคำวิจารณ์และปรับปรุงความสามารถในการให้เหตุผลของแบบจำลอง ลดต้นทุน หรือปรับปรุงประสิทธิภาพในโดเมนเฉพาะ
อย่างไรก็ตาม การตอบรับที่หลากหลายต่อ GPT-4.5 เน้นย้ำถึงความสำคัญของการประเมินเชิงวิพากษ์และการทดสอบอิสระในสาขา AI นอกจากนี้ยังเน้นย้ำถึงความจำเป็นในความโปร่งใสที่มากขึ้นจากบริษัทต่างๆ เช่น OpenAI โดยเฉพาะอย่างยิ่งเกี่ยวกับความสามารถและข้อจำกัดของแบบจำลองของพวกเขา
สำหรับตอนนี้ GPT-4.5 เป็นเครื่องพิสูจน์ถึงความก้าวหน้าอย่างต่อเนื่องใน AI แต่ยังเป็นนิทานเตือนใจเกี่ยวกับอันตรายของ hype ความท้าทายในการบรรลุความก้าวหน้าที่แท้จริง และความสำคัญของการสร้างสมดุลระหว่างนวัตกรรมกับข้อพิจารณาด้านจริยธรรมและความเป็นจริงในทางปฏิบัติ ป้ายราคาที่สูง ควบคู่ไปกับผลตอบแทนจากการลงทุนที่น่าสงสัย ทำให้เป็นสินค้าฟุ่มเฟือยที่น้อยคนนักจะซื้อได้ และน้อยคนนักที่จะให้เหตุผลได้ มันทำหน้าที่เป็นเครื่องเตือนใจที่มีศักยภาพว่าความก้าวหน้าใน AI ไม่ได้เป็นเส้นตรงเสมอไป และแบบจำลองที่ใหญ่กว่าและมีราคาแพงกว่านั้นไม่ได้ดีกว่าเสมอไป