OpenAI เปิดตัว GPT-4.5: อีกขั้นของโมเดลภาษา

การโต้ตอบที่ดีขึ้นและลดภาพหลอน

ในบล็อกโพสต์ที่มาพร้อมกับการประกาศ, OpenAI ได้เน้นถึงประสบการณ์การใช้งานที่ดีขึ้นของ GPT-4.5. ‘การทดสอบเบื้องต้นแสดงให้เห็นว่าการโต้ตอบกับ GPT‑4.5 รู้สึกเป็นธรรมชาติมากขึ้น’ บริษัทกล่าว. ความเป็นธรรมชาติที่เพิ่มขึ้นนี้เกิดจากการปรับปรุงที่สำคัญหลายประการ:

  • ฐานความรู้ที่กว้างขึ้น: GPT-4.5 มีฐานความรู้ที่กว้างขวางมากขึ้น ทำให้สามารถจัดการกับหัวข้อและคำถามที่หลากหลายได้มากขึ้นด้วยความแม่นยำและเชิงลึกที่มากขึ้น
  • การทำความเข้าใจความตั้งใจที่ดีขึ้น: โมเดลแสดงให้เห็นถึงความสามารถที่เหนือกว่าในการทำความเข้าใจและปฏิบัติตามความตั้งใจของผู้ใช้ นำไปสู่การตอบสนองที่เกี่ยวข้องและเป็นประโยชน์มากขึ้น
  • ‘EQ’ ที่มากขึ้น: OpenAI แนะนำว่า GPT-4.5 มีระดับ ‘ความฉลาดทางอารมณ์’ ที่สูงขึ้น ทำให้สามารถเข้าใจและตอบสนองต่อความแตกต่างเล็กน้อยของการสื่อสารของมนุษย์ได้ดีขึ้น

การปรับปรุงเหล่านี้มีส่วนช่วยให้ผู้ใช้ได้รับประสบการณ์ที่ใช้งานง่ายและมีประสิทธิผลมากขึ้น นอกจากนี้ การทดสอบภายในยังเปิดเผยว่า GPT-4.5 มีอัตราการเกิดภาพหลอน (hallucination) ต่ำกว่าโมเดลก่อนหน้าของ OpenAI อย่าง GPT-4o และ o1 อย่างมีนัยสำคัญ ภาพหลอน ซึ่งเป็นกรณีที่โมเดล AI สร้างข้อมูลที่ไม่ถูกต้องตามข้อเท็จจริงหรือไร้สาระ เป็นความท้าทายอย่างต่อเนื่องในการพัฒนา large language models อัตราการเกิดภาพหลอนที่ลดลงของ GPT-4.5 แสดงถึงขั้นตอนสำคัญในการบรรเทาปัญหานี้

ก้าวไปข้างหน้า แต่ไม่ใช่จุดสูงสุด

แม้ว่า GPT-4.5 จะแสดงถึงความก้าวหน้าที่สำคัญ แต่ Sam Altman ผู้ร่วมก่อตั้งและ CEO ของ OpenAI ได้ชี้แจงว่าจะไม่ได้เป็นเทคโนโลยีที่ล้ำสมัยที่สุดในแง่ของประสิทธิภาพ benchmark ในโพสต์บน X (เดิมชื่อ Twitter) Altman อธิบายว่าโมเดลนี้มี ‘ความมหัศจรรย์ที่ผมไม่เคยรู้สึกมาก่อน’ บอกเป็นนัยถึงความสามารถและศักยภาพที่เป็นเอกลักษณ์ อย่างไรก็ตาม เขายอมรับว่ามันไม่จำเป็นต้องมีประสิทธิภาพเหนือกว่าโมเดลอื่น ๆ ในการทดสอบมาตรฐาน

ความแตกต่างนี้เน้นให้เห็นถึงแนวทางการพัฒนาโมเดลของ OpenAI ซึ่งให้ความสำคัญไม่เพียงแต่ประสิทธิภาพดิบเท่านั้น แต่ยังรวมถึงประสบการณ์การใช้งานโดยรวมและความสามารถของโมเดลในการจัดการกับงานในโลกแห่งความเป็นจริงได้อย่างมีประสิทธิภาพ การมุ่งเน้นของ GPT-4.5 ในการโต้ตอบที่เป็นธรรมชาติ, การลดภาพหลอน, และการทำความเข้าใจความตั้งใจที่ดีขึ้น บ่งบอกถึงการเปลี่ยนแปลงไปสู่โมเดลที่ไม่เพียงแต่ทรงพลัง แต่ยังเชื่อถือได้และใช้งานง่ายอีกด้วย

การเปิดตัวแบบเป็นขั้นตอนและความท้าทายด้านโครงสร้างพื้นฐาน

OpenAI วางแผนที่จะเปิดตัว GPT-4.5 แบบเป็นขั้นตอน โดยเริ่มจากผู้สมัครสมาชิก ChatGPT Plus และ Team ในสัปดาห์หน้า ตามที่ Alex Paino หัวหน้าฝ่ายวิจัยของ OpenAI และสมาชิกทีมงานด้านเทคนิคของบริษัทกล่าวระหว่างการถ่ายทอดสด ผู้สมัครสมาชิก ChatGPT Edu และ Enterprise จะสามารถเข้าถึงได้ในสัปดาห์ถัดไป แนวทางที่เหลื่อมล้ำนี้ช่วยให้ OpenAI สามารถจัดการกับความต้องการโมเดลใหม่และรับประกันการเปลี่ยนแปลงที่ราบรื่นสำหรับฐานผู้ใช้

Altman อธิบายในโพสต์ X ของเขาว่า GPT-4.5 เป็น ‘โมเดลขนาดยักษ์ที่มีราคาแพง’ เขาอธิบายว่าการเปิดตัวครั้งแรกจะให้ความสำคัญกับผู้สมัครสมาชิก Plus และ Pro เนื่องจากข้อจำกัดด้านทรัพยากร ‘เราต้องการเปิดตัวให้กับ plus และ pro พร้อมกันจริงๆ แต่เราเติบโตขึ้นมากและไม่มี GPU’ เขาเขียน ‘เราจะเพิ่ม GPU หลายหมื่นตัวในสัปดาห์หน้าและเปิดตัวไปยังระดับ plus ในตอนนั้น’ ข้อความนี้เน้นย้ำถึงความต้องการด้านการประมวลผลที่สำคัญของ large language models และความท้าทายอย่างต่อเนื่องในการจัดหาทรัพยากรฮาร์ดแวร์ที่เพียงพอเพื่อรองรับการปรับใช้ GPU (Graphics Processing Units) เป็นโปรเซสเซอร์เฉพาะทางที่เหมาะอย่างยิ่งสำหรับการประมวลผลแบบขนานที่จำเป็นสำหรับโมเดล AI

การผสานรวมกับ Azure AI Foundry ของ Microsoft

ความพร้อมใช้งานของ GPT-4.5 ขยายไปไกลกว่าแพลตฟอร์มของ OpenAI เอง Satya Nadella ซีอีโอของ Microsoft ประกาศบน X ว่าโมเดลนี้มีให้ใช้งานในรูปแบบพรีวิวผ่าน Azure AI Foundry ของ Microsoft การผสานรวมนี้สะท้อนให้เห็นถึงความร่วมมืออย่างลึกซึ้งระหว่างทั้งสองบริษัท Microsoft ได้ลงทุนอย่างมากใน OpenAI ซึ่งเกิน 13 พันล้านดอลลาร์ และได้รวมโมเดลของ OpenAI เข้ากับผลิตภัณฑ์ต่างๆ ของ Microsoft นอกจากนี้ Microsoft ยังมอบทรัพยากรการประมวลผลที่สำคัญแก่ OpenAI ซึ่งสนับสนุนการพัฒนาและการปรับใช้เทคโนโลยี AI ขั้นสูง

Azure AI Foundry มอบแพลตฟอร์มสำหรับนักพัฒนาในการทดลองและสร้างแอปพลิเคชันโดยใช้โมเดล AI ที่ล้ำสมัย รวมถึง GPT-4.5 ความร่วมมือนี้ขยายขอบเขตการเข้าถึงเทคโนโลยีของ OpenAI และช่วยให้นักพัฒนาในวงกว้างสามารถใช้ประโยชน์จากความสามารถของมันได้

บริบท: พลวัตของตลาดและ Roadmap ในอนาคต

การเปิดตัว GPT-4.5 เกิดขึ้นในช่วงเวลาของกิจกรรมที่เข้มข้นและการแข่งขันในแวดวง AI เพียงหนึ่งเดือนก่อนหน้านี้ ตลาดตอบสนองอย่างรุนแรงต่อการเปิดตัวแนวทางที่มีประสิทธิภาพโดยห้องปฏิบัติการ DeepSeek ของจีน เหตุการณ์นี้นำไปสู่การลดลงอย่างมีนัยสำคัญเกือบ 6 แสนล้านดอลลาร์ในวันเดียวในมูลค่าหลักทรัพย์ตามราคาตลาดของ Nvidia ผู้ผลิต GPU ชั้นนำที่ใช้กันอย่างแพร่หลายในการพัฒนาโมเดล AI เหตุการณ์นี้เน้นให้เห็นถึงความอ่อนไหวของตลาดต่อความก้าวหน้าและแรงกดดันในการแข่งขันในสาขาปัญญาประดิษฐ์ที่พัฒนาไปอย่างรวดเร็ว

เพื่อตอบสนองต่อการรับรู้ที่เพิ่มขึ้นของตลาด Altman ยอมรับถึงความจำเป็นในการเปิดเผยข้อมูลที่มากขึ้นเกี่ยวกับ roadmap ของ OpenAI สองสัปดาห์หลังจากการตกต่ำของตลาด Nvidia เขากล่าวในโพสต์ X ว่าบริษัทตั้งเป้าที่จะปรับปรุงการสื่อสารสาธารณะเกี่ยวกับแผนการในอนาคต ความมุ่งมั่นต่อความโปร่งใสนี้สะท้อนให้เห็นถึงการตระหนักถึงความสำคัญของการแจ้งให้ผู้มีส่วนได้ส่วนเสียทราบเกี่ยวกับทิศทางและความคืบหน้าของการพัฒนา AI

Altman ให้ข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับแผนการในอนาคตของ OpenAI โดยระบุว่า GPT-4.5 จะตามมาด้วย GPT-5 ซึ่งจะรวมเทคโนโลยีของ OpenAI ที่หลากหลายมากขึ้น นอกจากนี้เขายังกล่าวถึงงานของบริษัทเกี่ยวกับ ‘reasoning models’ ซึ่งทำการคำนวณอย่างกว้างขวางในขณะที่ผู้ใช้สอบถาม ในทางตรงกันข้าม GPT-4.5 ได้รับการอธิบายว่าเป็น ‘last non-chain-of-thought model’ ของบริษัท ซึ่งบ่งบอกถึงการเปลี่ยนแปลงไปสู่ความสามารถในการให้เหตุผลที่ซับซ้อนยิ่งขึ้นในอนาคต Chain-of-thought prompting เป็นเทคนิคที่กระตุ้นให้ large language models แบ่งปัญหาที่ซับซ้อนออกเป็นชุดของขั้นตอนกลาง ปรับปรุงการให้เหตุผลและความสามารถในการแก้ปัญหา

เจาะลึกความสามารถของ GPT-4.5

แม้ว่ารายละเอียดทางเทคนิคเฉพาะเกี่ยวกับสถาปัตยกรรมและข้อมูลการฝึกอบรมของ GPT-4.5 ยังคงไม่เปิดเผย แต่คำแถลงของ OpenAI และผลการทดสอบเบื้องต้นให้เบาะแสบางอย่างเกี่ยวกับคุณสมบัติหลักและการปรับปรุง:

  • การทำความเข้าใจภาษาที่ได้รับการปรับปรุง: GPT-4.5 มีแนวโน้มที่จะสร้างขึ้นจากความก้าวหน้าของรุ่นก่อนในด้านการทำความเข้าใจภาษาธรรมชาติ ซึ่งรวมถึงการปรับปรุงในด้านต่างๆ เช่น:
    • ไวยากรณ์และวากยสัมพันธ์: การแยกวิเคราะห์และการสร้างประโยคที่ถูกต้องตามหลักไวยากรณ์ที่แม่นยำยิ่งขึ้น
    • ความหมาย: ความเข้าใจที่ดีขึ้นเกี่ยวกับความหมายและความสัมพันธ์ระหว่างคำและแนวคิด
    • วัจนปฏิบัติ: ความสามารถที่ดีขึ้นในการตีความบริบทและความตั้งใจเบื้องหลังการใช้ภาษา
  • การแสดงความรู้ที่ขยายออกไป: ‘ฐานความรู้ที่กว้างขึ้น’ ที่ OpenAI กล่าวถึง บ่งชี้ว่า GPT-4.5 ได้รับการฝึกฝนบนชุดข้อมูลที่ใหญ่และหลากหลายกว่าโมเดลก่อนหน้านี้ ซึ่งอาจครอบคลุมหัวข้อที่หลากหลายขึ้น, ข้อมูลที่เป็นข้อเท็จจริง, และรูปแบบการเขียน
  • การให้เหตุผลและการแก้ปัญหาที่ได้รับการปรับปรุง: แม้ว่าจะไม่ได้ระบุว่าเป็น ‘reasoning model’ อย่างชัดเจน แต่ความสามารถที่ดีขึ้นของ GPT-4.5 ในการปฏิบัติตามความตั้งใจของผู้ใช้และแก้ไขปัญหาในทางปฏิบัติ บ่งบอกถึงการปรับปรุงในความสามารถในการให้เหตุผล ซึ่งอาจเกี่ยวข้องกับการปรับปรุงใน:
    • การอนุมานเชิงตรรกะ: การสรุปผลที่ถูกต้องจากสมมติฐานที่กำหนด
    • การให้เหตุผลเชิงสามัญสำนึก: การใช้ความรู้และความเข้าใจในชีวิตประจำวันเพื่อแก้ไขปัญหา
    • การให้เหตุผลเชิงสาเหตุ: การระบุความสัมพันธ์เชิงสาเหตุและผลกระทบ
  • การบรรเทาภาพหลอน: อัตราการเกิดภาพหลอนที่ลดลงเป็นความก้าวหน้าที่สำคัญ ซึ่งน่าจะเกิดจากปัจจัยหลายอย่างรวมกัน เช่น:
    • ข้อมูลการฝึกอบรมที่ได้รับการปรับปรุง: การกรองข้อมูลที่ไม่ถูกต้องหรือทำให้เข้าใจผิดออกจากชุดข้อมูลการฝึกอบรม
    • Reinforcement Learning from Human Feedback (RLHF): การปรับแต่งโมเดลตามความคิดเห็นของมนุษย์เพื่อจัดลำดับความสำคัญของความถูกต้องตามข้อเท็จจริงและลดการสร้างเนื้อหาที่ไม่สมเหตุสมผล
    • การปรับเปลี่ยนสถาปัตยกรรม: อาจรวมกลไกเพื่อยึดโยงการตอบสนองของโมเดลในฐานความรู้ได้ดีขึ้น และป้องกันไม่ให้หลงทางไปสู่การอ้างสิทธิ์ที่ไม่ได้รับการสนับสนุน

ความสำคัญของ ‘ความฉลาดทางอารมณ์’

การกล่าวถึง ‘EQ’ ที่มากขึ้นของ GPT-4.5 ของ OpenAI นั้นน่าสนใจเป็นพิเศษ แม้ว่าโมเดล AI จะไม่มีอารมณ์ในความหมายของมนุษย์ แต่คำว่า ‘ความฉลาดทางอารมณ์’ ในบริบทนี้มีแนวโน้มที่จะหมายถึงความสามารถของโมเดลในการ:

  • รับรู้และตอบสนองต่ออารมณ์: ตรวจจับอารมณ์ของอินพุตของผู้ใช้ (เช่น เชิงบวก, เชิงลบ, เป็นกลาง, หงุดหงิด, กระตือรือร้น) และปรับการตอบสนองตามนั้น
  • สร้างข้อความที่มีความแตกต่างทางอารมณ์ที่เหมาะสม: สร้างข้อความที่ไม่เพียงแต่ถูกต้องตามข้อเท็จจริงเท่านั้น แต่ยังเหมาะสมทางอารมณ์สำหรับบริบทที่กำหนดด้วย ซึ่งอาจเกี่ยวข้องกับการใช้ภาษาที่เห็นอกเห็นใจ, ให้กำลังใจ, หรือสร้างความมั่นใจ ขึ้นอยู่กับสถานการณ์
  • ทำความเข้าใจและตอบสนองต่อสัญญาณทางอารมณ์โดยนัย: อนุมานสภาวะทางอารมณ์จากสัญญาณที่ละเอียดอ่อนในการใช้ภาษา เช่น การเลือกคำ, โครงสร้างประโยค, และเครื่องหมายวรรคตอน

การเพิ่ม ‘ความฉลาดทางอารมณ์’ ของโมเดล AI เป็นขั้นตอนสำคัญในการสร้างปฏิสัมพันธ์ที่เป็นธรรมชาติและน่าดึงดูดยิ่งขึ้น สามารถปรับปรุงประสบการณ์การใช้งานในแอปพลิเคชันต่างๆ เช่น การบริการลูกค้า, การศึกษา, และการเขียนเชิงสร้างสรรค์

ผลกระทบในวงกว้างของ GPT-4.5

การเปิดตัว GPT-4.5 มีผลกระทบในวงกว้างหลายประการสำหรับสาขาปัญญาประดิษฐ์และการประยุกต์ใช้:

  • ความก้าวหน้าอย่างต่อเนื่องใน AI อเนกประสงค์: GPT-4.5 แสดงให้เห็นถึงความก้าวหน้าอย่างต่อเนื่องในการพัฒนาโมเดล AI ที่สามารถทำงานได้หลากหลายและจัดการกับข้อมูลประเภทต่างๆ ได้ แนวโน้มนี้กำลังผลักดันขอบเขตของสิ่งที่เป็นไปได้ด้วย AI และเปิดโอกาสใหม่ๆ สำหรับการประยุกต์ใช้ในอุตสาหกรรมต่างๆ
  • การมุ่งเน้นที่เพิ่มขึ้นในด้านความน่าเชื่อถือและความน่าไว้วางใจ: การเน้นที่การลดภาพหลอนและการปรับปรุงความถูกต้องตามข้อเท็จจริงสะท้อนให้เห็นถึงการตระหนักถึงความสำคัญของการสร้างระบบ AI ที่น่าเชื่อถือที่เพิ่มขึ้น เมื่อโมเดล AI ถูกรวมเข้ากับแอปพลิเคชันที่สำคัญมากขึ้น การรับรองความน่าเชื่อถือและการลดความเสี่ยงในการสร้างข้อมูลที่ทำให้เข้าใจผิดจึงเป็นสิ่งสำคัญยิ่ง
  • การโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ที่ได้รับการปรับปรุง: การปรับปรุงในการทำความเข้าใจภาษาธรรมชาติ, การรับรู้ความตั้งใจ, และ ‘ความฉลาดทางอารมณ์’ มีส่วนช่วยให้เกิดการโต้ตอบที่ราบรื่นและใช้งานง่ายยิ่งขึ้นระหว่างมนุษย์และระบบ AI สิ่งนี้มีความสำคัญอย่างยิ่งต่อการทำให้เทคโนโลยี AI สามารถเข้าถึงได้และใช้งานง่ายสำหรับผู้ชมในวงกว้าง
  • ศักยภาพสำหรับแอปพลิเคชันใหม่: ความสามารถของ GPT-4.5 สามารถเปิดใช้งานแอปพลิเคชันใหม่ในด้านต่างๆ เช่น:
    • การสร้างเนื้อหา: การสร้างเนื้อหาที่เป็นลายลักษณ์อักษรคุณภาพสูงสำหรับวัตถุประสงค์ต่างๆ เช่น การตลาด, วารสารศาสตร์, และการศึกษา
    • การสร้างโค้ด: การช่วยเหลือผู้พัฒนาซอฟต์แวร์โดยการสร้าง snippets โค้ด, แก้จุดบกพร่องของโค้ด, และทำให้งานเขียนโปรแกรมเป็นไปโดยอัตโนมัติ
    • การวิเคราะห์ข้อมูล: การสรุปและการดึงข้อมูลเชิงลึกจากชุดข้อมูลขนาดใหญ่
    • การเรียนรู้ส่วนบุคคล: การปรับเนื้อหาการศึกษาและการสอนให้เข้ากับความต้องการของนักเรียนแต่ละคน
    • การบริการลูกค้า: การให้การสนับสนุนลูกค้าที่ชาญฉลาดและเห็นอกเห็นใจมากขึ้น

GPT-4.5 แสดงถึงความก้าวหน้าที่โดดเด่นในวิวัฒนาการของ large language models การมุ่งเน้นไปที่การโต้ตอบที่เป็นธรรมชาติ, การลดภาพหลอน, และประสบการณ์การใช้งานที่ดีขึ้น ทำให้เป็นเครื่องมือที่มีค่าสำหรับการใช้งานที่หลากหลาย แม้ว่าจะไม่ใช่ benchmark performer ที่ดีที่สุด แต่ก็แสดงถึงความก้าวหน้าในการพัฒนา AI และเน้นย้ำถึงการมุ่งเน้นไปที่การสร้างระบบ AI ที่ไม่เพียงแต่ทรงพลัง แต่ยังเชื่อถือได้, น่าไว้วางใจ, และใช้งานง่าย การเปิดตัวแบบเป็นขั้นตอนและการผสานรวมกับ Azure AI Foundry ของ Microsoft จะขยายขอบเขตการเข้าถึงและช่วยให้ผู้ใช้ในวงกว้างสามารถสำรวจความสามารถของมันได้