เอเจนต์ตัวที่สองของ OpenAI
เมื่อสามสัปดาห์ก่อน OpenAI ได้เปิดตัว Deep Research ซึ่งเป็นเอเจนต์ตัวที่สองของบริษัท เอเจนต์นี้สามารถค้นหาเว็บไซต์หลายแห่งและทำการวิจัยออนไลน์ที่ครอบคลุมได้ภายใน 5-30 นาที โดยสังเคราะห์ข้อมูลและให้รายงานโดยละเอียดพร้อมการอ้างอิง
บทความนี้รวบรวมและจัดระเบียบการสัมภาษณ์โดย Sequoia Capital กับ Isa Fulford และ Josh Tobin หัวหน้าทีม Deep Research ของ OpenAI สมาชิกทั้งสองแบ่งปันรายละเอียดทางเทคนิคและการคิดเชิงผลิตภัณฑ์เบื้องหลัง Deep Research พร้อมกับกรณีการใช้งานที่พวกเขากำลังสังเกตเห็นในปัจจุบัน
Deep Research มีต้นกำเนิดมาจากการสำรวจภายในของ OpenAI เกี่ยวกับความสามารถของโมเดลในการจัดการงานระยะยาว เป้าหมายระยะยาวของทีมคือ เพื่อให้ผู้ใช้ได้รับเอเจนต์ขั้นสุดยอดในอนาคต: โซลูชัน all-in-one ที่เป็นธรรมชาติสำหรับการค้นหาเว็บ การใช้คอมพิวเตอร์ หรืองานอื่น ๆ ที่พวกเขาต้องการให้เอเจนต์ทำ
Deep Research ยังได้รับการปรับให้เหมาะสมเป็นพิเศษในระดับผลิตภัณฑ์ ตัวอย่างเช่น ตามที่กล่าวไว้ในการวิเคราะห์ DeepSeek ของเรา Deep Research ช่วยเพิ่มความไว้วางใจของผู้ใช้ผ่านการอ้างอิงที่ชัดเจนและ Chain-of-Thought (CoT) ทีมงานยังได้ออกแบบขั้นตอนการชี้แจงเพื่อให้แน่ใจว่ามีความเข้าใจที่ตรงกันเกี่ยวกับงาน Deep Research มีประสิทธิภาพเหนือกว่าการค้นหา AI และ ChatGPT ในการดึงข้อมูลและการจัดระเบียบ อย่างไรก็ตาม ในขั้นตอนนี้ Deep Research ยังไม่มีประสิทธิภาพในการดึงข้อมูลเชิงลึกใหม่ ๆ จากข้อมูลที่มีอยู่ และยังไม่สามารถค้นพบทางวิทยาศาสตร์ใหม่ ๆ ได้
ประเด็นสำคัญ:
- OpenAI ได้เปิดตัวเอเจนต์ตัวที่สอง Deep Research ซึ่งสามารถทำการสืบค้นออนไลน์ได้อย่างละเอียด
- ความสามารถของเอเจนต์เกิดจากการฝึกอบรมแบบ end-to-end ของโมเดล
- Deep Research เก่งในการสังเคราะห์ข้อมูลและค้นหาข้อเท็จจริงที่คลุมเครือ
- กรณีการใช้งานครอบคลุมงานระดับมืออาชีพ ชีวิตส่วนตัว การเขียนโปรแกรม และการศึกษา
- ทีมงานคาดการณ์ถึงความก้าวหน้าครั้งสำคัญสำหรับเอเจนต์ในปี 2025
ความสามารถของเอเจนต์เกิดจากการฝึกอบรมโมเดลแบบ End-to-End
Deep Research เป็นเอเจนต์ที่สามารถค้นหาเว็บไซต์ออนไลน์หลายแห่งและสร้างรายงานที่ครอบคลุม ทำงานหลายอย่างที่มนุษย์ต้องใช้เวลาหลายชั่วโมง ทำงานภายใน ChatGPT โดยตอบคำถามในเวลาประมาณ 5-30 นาที ทำให้สามารถทำการวิจัยเชิงลึกและให้คำตอบที่ละเอียดและเฉพาะเจาะจงกว่า ChatGPT มาตรฐาน OpenAI ก่อนหน้านี้ได้เปิดตัว Operator และ Deep Research เป็นเอเจนต์ตัวที่สอง โดยจะมีอีกมากมายตามมา
ต้นกำเนิด
ประมาณหนึ่งปีที่แล้ว OpenAI เริ่มนำกระบวนทัศน์การให้เหตุผลมาใช้ภายใน โดยมีเป้าหมายเพื่อฝึกอบรมโมเดลให้คิดก่อนตอบ วิธีนี้พิสูจน์แล้วว่าประสบความสำเร็จอย่างสูง
ในขั้นต้น OpenAI มุ่งเน้นไปที่คณิตศาสตร์และวิทยาศาสตร์ อย่างไรก็ตาม พวกเขาค้นพบว่าสถาปัตยกรรมโมเดลการให้เหตุผลแบบใหม่นี้ยังปลดล็อกความสามารถในการจัดการงานระยะยาว ซึ่งเกี่ยวข้องกับความสามารถของเอเจนต์
ในขณะเดียวกัน OpenAI ตระหนักว่า งานจำนวนมากต้องการการวิจัยออนไลน์อย่างกว้างขวางหรือบริบทภายนอก ความสามารถในการให้เหตุผลที่แข็งแกร่ง การแยกแยะแหล่งที่มาของข้อมูล และระดับความคิดสร้างสรรค์ ในที่สุด OpenAI ได้พัฒนาวิธีการฝึกอบรมโมเดลที่สามารถจัดการงานเหล่านี้ได้ พวกเขาตัดสินใจที่จะฝึกอบรมโมเดลให้ทำงานเกี่ยวกับการเรียกดูข้อมูล โดยใช้วิธีการเดียวกับที่ใช้ในการฝึกอบรมโมเดลการให้เหตุผล แต่ใช้กับงานในโลกแห่งความเป็นจริงมากขึ้น
โครงการ Deep Research เริ่มต้นด้วยการสาธิตดั้งเดิมโดย Isa Fulford และ Yash Patil Josh Tobin กลับมาร่วมงานกับ OpenAI อีกครั้งเมื่อประมาณหกเดือนที่แล้วหลังจากทำงานที่สตาร์ทอัพ รู้สึกสนใจงานพื้นฐานอย่างมาก และเข้าร่วมโครงการ Deep Research
บุคคลสำคัญ:
- Isa Fulford: นักวิจัย AI ในทีม Post-training ของ OpenAI ซึ่งเป็นผู้มีส่วนร่วมหลักใน ChatGPT Retrieval Plugin
- Yash Patil: สมาชิกของทีมโมเดลหลักในทีม Post-training ของ OpenAI โดยลาออกจาก Stanford
- Josh Tobin: ก่อนหน้านี้เคยเป็น Research Scientist ที่ OpenAI ต่อมาได้ก่อตั้ง Gantry (ผลิตภัณฑ์เพื่อปรับปรุง ML ผ่านการวิเคราะห์ การแจ้งเตือน และข้อเสนอแนะจากมนุษย์) เขากลับมาร่วมงานกับ OpenAI และปัจจุบันเป็นหัวหน้าทีมวิจัยผลิตภัณฑ์ Agents
ขั้นตอนการชี้แจง (Clarification Flow)
Deep Research มีการออกแบบที่เป็นเอกลักษณ์: ขั้นตอนการชี้แจง ก่อนที่จะเริ่มการวิจัย โมเดล Deep Research จะถามคำถามผู้ใช้ โดยทั่วไปแล้ว ChatGPT จะถามคำถามติดตามผลเมื่อสิ้นสุดคำตอบเท่านั้น หรือสอบถามว่าคำตอบนั้นน่าพอใจหรือไม่ ซึ่งแตกต่างจาก Deep Research ที่มีส่วนร่วมในพฤติกรรมนี้ตั้งแต่เริ่มต้น
นี่เป็นการออกแบบโดยเจตนาของทีม ผู้ใช้จะได้รับคำตอบที่ดีที่สุดจากโมเดล Deep Research เมื่อข้อความแจ้งของพวกเขามีความชัดเจนและละเอียดมากเท่านั้น อย่างไรก็ตาม ผู้ใช้มักจะไม่ให้ข้อมูลทั้งหมดในข้อความแจ้งเริ่มต้นของพวกเขา ดังนั้น OpenAI ต้องการให้แน่ใจว่าหลังจากรอ 5 หรือ 30 นาที ผู้ใช้จะได้รับคำตอบที่ละเอียดและน่าพอใจเพียงพอ ขั้นตอนนี้เพิ่มเข้ามาเพื่อให้แน่ใจว่าผู้ใช้ให้รายละเอียดที่จำเป็นทั้งหมดสำหรับโมเดล
ผู้ใช้หลายคนใน X ได้กล่าวถึงการโต้ตอบกับ o1 หรือ o1 Pro ก่อนเพื่อปรับแต่งข้อความแจ้งของพวกเขา เมื่อพอใจแล้ว พวกเขาส่งข้อความแจ้งไปยัง Deep Research
รูปแบบขั้นสุดยอดของเอเจนต์ (The Ultimate Form of Agents)
ในช่วงสองสามเดือนที่ผ่านมา OpenAI ได้เปิดตัว Deep Research สามเวอร์ชันที่แตกต่างกัน ซึ่งทั้งหมดมีชื่อว่า Deep Research Josh Tobin เชื่อว่าในขณะที่แต่ละผลิตภัณฑ์มีจุดแข็งและจุดอ่อนของตัวเอง ความแตกต่างด้านคุณภาพระหว่างผลิตภัณฑ์เหล่านั้นก็ชัดเจน ในท้ายที่สุด นี่เป็นเพราะวิธีการสร้างโมเดล ความพยายามที่ลงทุนในการสร้างชุดข้อมูล และการใช้โมเดล O-series เป็นเอ็นจิ้น สิ่งนี้ทำให้โมเดล Deep Research ได้รับการปรับให้เหมาะสม สร้างเครื่องมือที่มีความชาญฉลาดและมีคุณภาพสูง
ปัจจุบัน Deep Research, O3 และ Operator ค่อนข้างเป็นอิสระต่อกัน อย่างไรก็ตาม OpenAI มีเป้าหมาย เพื่อให้ผู้ใช้มีเอเจนต์ขั้นสุดยอดเพียงตัวเดียวในที่สุด ซึ่งสามารถทำการค้นหาเว็บ ใช้คอมพิวเตอร์ หรือทำงานอื่น ๆ ที่ต้องการได้ โดยรวมฟังก์ชันทั้งหมดเหล่านี้เข้าด้วยกันอย่างเป็นธรรมชาติมากขึ้น
การฝึกอบรมแบบ End-to-End เป็นเหตุผลพื้นฐานสำหรับพลังของโมเดล
โมเดลพื้นฐานของ Deep Research เป็นเวอร์ชันที่ปรับแต่งอย่างละเอียดของ O3 O3 เป็นโมเดลการให้เหตุผลที่ทันสมัยที่สุดของ OpenAI และความสามารถในการวิเคราะห์ส่วนใหญ่ของ Deep Research มาจาก O3 OpenAI ได้ฝึกอบรมโมเดล Deep Research โดยเฉพาะเกี่ยวกับงานการเรียกดูข้อมูลที่ซับซ้อนและงานการให้เหตุผลอื่น ๆ ดังนั้น Deep Research จึงสามารถใช้เครื่องมือการเรียกดูข้อมูลและเครื่องมือ Python ได้เช่นกัน ด้วยการฝึกอบรมแบบ end-to-end ในงานเหล่านี้ Deep Research ได้เรียนรู้กลยุทธ์ในการจัดการกับงานเหล่านั้น ทำให้โมเดลเก่งในการวิเคราะห์การค้นหาออนไลน์ในที่สุด
โดยสัญชาตญาณ ผู้ใช้ทำการร้องขอ และโมเดลจะคิดอย่างรอบคอบเกี่ยวกับเรื่องนี้ก่อน จากนั้นจึงค้นหาข้อมูลที่เกี่ยวข้อง แยกข้อมูล และอ่าน หลังจากทำความเข้าใจว่าข้อมูลนี้เกี่ยวข้องกับคำขออย่างไร โมเดลจะตัดสินใจว่าจะค้นหาอะไรต่อไปเพื่อให้เข้าใกล้คำตอบสุดท้ายที่ผู้ใช้ต้องการมากขึ้น Deep Research สามารถรวมข้อมูลทั้งหมดนี้ไว้ในรายงานที่เป็นระเบียบเรียบร้อย พร้อมการอ้างอิงที่ชี้ไปยังแหล่งที่มาดั้งเดิม
นวัตกรรมที่ทำให้ Deep Research มีความสามารถของเอเจนต์อยู่ที่การฝึกอบรมแบบ end-to-end ของโมเดลของ OpenAI ซึ่งหมายความว่าการดำเนินการหลายอย่างในระหว่างกระบวนการวิจัยนั้นไม่สามารถคาดเดาได้ล่วงหน้า เป็นไปไม่ได้ที่จะบรรลุความยืดหยุ่นที่โมเดลได้รับจากการฝึกอบรมโดยการเขียนแบบจำลองภาษา โปรแกรม หรือสคริปต์ ด้วยการฝึกอบรม โมเดล Deep Research ได้เรียนรู้วิธีตอบสนองต่อข้อมูลเว็บแบบเรียลไทม์และปรับกลยุทธ์ทันทีตามสิ่งที่เห็น ดังนั้น โมเดล Deep Research จึงทำการค้นหาที่สร้างสรรค์มาก ผู้ใช้สามารถเห็นว่าโมเดลมีความชาญฉลาดเพียงใดในการตัดสินใจว่าจะค้นหาอะไรต่อไป หรือวิธีหลีกเลี่ยงปัญหาบางอย่างโดยการอ่านบทสรุปของ CoT
ความแตกต่างระหว่าง Deep Research และ AI Search
เกี่ยวกับคำถามของ John Collison ที่ว่าความสามารถของ Deep Research มาจากการเข้าถึงเนื้อหาเว็บแบบเรียลไทม์มากน้อยเพียงใด และมาจาก CoT มากน้อยเพียงใด นักวิจัย OpenAI ทั้งสองเชื่อว่าความสามารถที่โดดเด่นของ Deep Research เป็นผลมาจากการรวมกันของทั้งสองอย่าง
ผลิตภัณฑ์การค้นหา AI อื่น ๆ ไม่ได้รับการฝึกอบรมแบบ end-to-end ดังนั้นจึงไม่มีความยืดหยุ่นในการตอบสนองต่อข้อมูลเท่ากับ Deep Research และไม่มีความคิดสร้างสรรค์ในการแก้ปัญหาเฉพาะเท่า
ก่อนที่จะเข้าร่วม OpenAI Josh Tobin ทำงานที่สตาร์ทอัพและพยายามสร้างเอเจนต์ในแบบที่คนส่วนใหญ่อธิบายถึงการสร้างเอเจนต์ โดยพื้นฐานแล้วเป็นการสร้างกราฟการดำเนินการโดยมี LLM แทรกแซงที่โหนดบางโหนด แม้ว่า LLM สามารถตัดสินใจว่าจะทำอะไรต่อไป แต่ตรรกะของลำดับขั้นตอนทั้งหมดถูกกำหนดโดยมนุษย์
Josh Tobin พบว่านี่เป็นวิธีการที่มีประสิทธิภาพสำหรับการสร้างต้นแบบอย่างรวดเร็ว แต่มันก็พบปัญหาอย่างรวดเร็วในโลกแห่งความเป็นจริง เป็นการยากที่จะคาดการณ์สถานการณ์ทั้งหมดที่โมเดลอาจเผชิญ และพิจารณาเส้นทางที่แตกต่างกันทั้งหมดที่โมเดลอาจต้องการใช้ นอกจากนี้ เนื่องจากโมเดลเหล่านี้ไม่ได้ถูกฝึกอบรมมาโดยเฉพาะเพื่อทำการตัดสินใจ พวกเขาจึงมักจะไม่ใช่ผู้มีอำนาจตัดสินใจที่ดีที่สุดที่โหนด พวกเขาได้รับการฝึกอบรมให้ทำสิ่งที่คล้ายกับการตัดสินใจ
สิ่งนี้ย้ำว่าพลังที่แท้จริงของโมเดล Deep Research มาจากการฝึกอบรมแบบ end-to-end โดยตรง โดยมีเป้าหมายเพื่อแก้ไขงานที่ผู้ใช้ต้องการแก้ไขจริง ๆ ดังนั้นจึงไม่จำเป็นต้องตั้งค่ากราฟการดำเนินการหรือทำการตัดสินใจโหนดในสถาปัตยกรรมเบื้องหลัง ทุกอย่างขับเคลื่อนโดยตัวโมเดลเอง
นอกจากนี้ หากผู้ใช้มีเวิร์กโฟลว์ที่เฉพาะเจาะจงและคาดเดาได้มาก การทำในแบบที่ Josh Tobin อธิบายไว้ข้างต้นก็มีค่า แต่ถ้าต้องการการประมวลผลที่ยืดหยุ่นมาก วิธีการที่คล้ายกับ Deep Research อาจเป็นทางเลือกที่ดีที่สุด
Josh Tobin แนะนำว่ากฎที่เข้มงวดบางอย่างไม่ควรถูกเข้ารหัสอย่างหนักในโมเดล หากมีความต้องการเช่น “ไม่ต้องการให้โมเดลเข้าถึงฐานข้อมูลบางอย่าง” ควรใช้ตรรกะที่เขียนด้วยตนเองจะดีกว่า ผู้คนมักคิดว่าพวกเขาสามารถฉลาดกว่าโมเดลได้โดยการเขียนโค้ด แต่ในความเป็นจริง เมื่อสาขานี้พัฒนาขึ้น โมเดลมักจะคิดค้นวิธีแก้ปัญหาที่ดีกว่ามนุษย์
หนึ่งในบทเรียนที่สำคัญที่สุดของการเรียนรู้ของเครื่องคือผลลัพธ์ที่คุณได้รับขึ้นอยู่กับสิ่งที่คุณปรับให้เหมาะสม ดังนั้น หากผู้ใช้สามารถตั้งค่าระบบเพื่อปรับให้เหมาะสมโดยตรงสำหรับผลลัพธ์ที่ต้องการ มันจะดีกว่าการพยายามปะติดปะต่อโมเดลที่ไม่เหมาะสมกับงานทั้งหมด ดังนั้น การปรับแต่ง RL บนพื้นฐานของโมเดลโดยรวมอาจกลายเป็นส่วนสำคัญในการสร้างเอเจนต์ที่ทรงพลังที่สุด
ข้อมูลคุณภาพสูงเป็นหนึ่งในปัจจัยสำคัญสำหรับความสำเร็จของโมเดล
หนึ่งในปัจจัยสำคัญสำหรับความสำเร็จของโมเดล Deep Research คือการมีชุดข้อมูลคุณภาพสูง คุณภาพของข้อมูลที่ป้อนเข้าสู่โมเดลน่าจะเป็นปัจจัยสำคัญที่กำหนดคุณภาพของโมเดล ในโครงการ Deep Research Edward Sun จะปรับชุดข้อมูลทั้งหมดให้เหมาะสม
ข้อดีของ Deep Research
จุดแข็งของ Deep Research อยู่ที่ความสามารถในการให้คำตอบที่ดีที่สุดเมื่อผู้ใช้มีคำอธิบายโดยละเอียดเกี่ยวกับความต้องการของพวกเขา อย่างไรก็ตาม แม้ว่าคำถามของผู้ใช้จะคลุมเครือ Deep Research ก็สามารถชี้แจงข้อมูลที่ต้องการได้ มันมีประสิทธิภาพมากที่สุดเมื่อผู้ใช้กำลังมองหาชุดข้อมูลเฉพาะ
Deep Research ไม่เพียงแต่สามารถรวบรวมข้อมูลทั้งหมดเกี่ยวกับแหล่งที่มาได้อย่างกว้างขวาง แต่ยังเก่งในการค้นหาข้อเท็จจริงที่คลุมเครือมาก เช่น เนื้อหาหางยาวที่จะไม่ปรากฏในหน้าแรก ๆ ในการค้นหาแบบดั้งเดิม รายละเอียดของตอนเฉพาะของรายการทีวีที่ไม่ค่อยมีคนรู้จัก และอื่น ๆ ในคำถามเกี่ยวกับนายพลชาวออสเตรีย ChatGPT เคยให้คำตอบที่ผิด ในขณะที่ Deep Research ค้นหาคำตอบที่ถูกต้องได้สำเร็จ
Deep Research เก่งมากในการสังเคราะห์ข้อมูล โดยเฉพาะอย่างยิ่งในการค้นหาข้อมูลเฉพาะที่หายาก อย่างไรก็ตาม Deep Research ยังไม่มีประสิทธิภาพในการดึงข้อมูลเชิงลึกใหม่ ๆ จากข้อมูลที่มีอยู่ และยังไม่สามารถค้นพบทางวิทยาศาสตร์ใหม่ ๆ ได้
กรณีการใช้งานของ Deep Research
ผู้ใช้เป้าหมาย
Deep Research ได้รับการออกแบบมาสำหรับทุกคนที่มีส่วนร่วมในงานที่ต้องใช้ความรู้ในชีวิตประจำวันหรือการทำงาน โดยเฉพาะอย่างยิ่งผู้ที่ต้องการรวบรวมข้อมูลจำนวนมาก วิเคราะห์ข้อมูล และทำการตัดสินใจ ผู้ใช้หลายคนใช้ Deep Research กับงานของพวกเขา เช่น ในการวิจัย เพื่อทำความเข้าใจสถานการณ์ในด้านต่าง ๆ เช่น ตลาด บริษัท และอสังหาริมทรัพย์
กรณีการใช้งาน
OpenAI หวังว่า Deep Research จะสามารถให้บริการได้ทั้งในสถานการณ์ทางธุรกิจและชีวิตส่วนตัว เนื่องจากเป็นความสามารถที่หลากหลายมากที่สามารถนำไปใช้ได้ทั้งในที่ทำงานและชีวิตส่วนตัว ความน่าสนใจของ Deep Research อยู่ที่ความสามารถในการประหยัดเวลาได้มาก งานบางอย่างที่อาจต้องใช้เวลาหลายชั่วโมงหรือหลายวัน ตอนนี้สามารถตอบได้ 90% ด้วย Deep Research OpenAI เชื่อว่าจะมีงานที่คล้ายกันมากขึ้นในสถานการณ์ทางธุรกิจ แต่ Deep Research จะกลายเป็นส่วนหนึ่งของชีวิตส่วนตัวของผู้คนด้วย
Deep Research ไม่ได้เกี่ยวกับการแทนที่พนักงาน สำหรับงานที่ต้องใช้ความรู้ โดยเฉพาะอย่างยิ่งงานที่ต้องใช้เวลามากในการค้นหาข้อมูลและสรุปผล Deep Research จะช่วยให้ผู้คนมีพลังพิเศษ ทำให้งานที่อาจต้องใช้เวลา 4 หรือ 8 ชั่วโมงเสร็จสิ้นภายใน 5 นาที ทำให้ผู้ใช้สามารถทำอะไรได้มากขึ้น
การสัมภาษณ์ได้กล่าวถึงกรณีการใช้งาน ได้แก่: การแพทย์ การลงทุน และสถานการณ์การทำงานระดับมืออาชีพอื่น ๆ การช็อปปิ้ง การเดินทาง และสถานการณ์ครอบครัวอื่น ๆ การเขียนโปรแกรมและการศึกษาส่วนบุคคล
การแพทย์ การลงทุน และสถานการณ์การทำงานระดับมืออาชีพอื่น ๆ
ในทางการแพทย์ Deep Research สามารถช่วยค้นหาวรรณกรรมทั้งหมดหรือกรณีล่าสุดของโรคบางชนิด ซึ่งจะช่วยประหยัดเวลา
ในการลงทุน ด้วยความช่วยเหลือของ Deep Research นักลงทุนสามารถเลือกที่จะวิจัยสตาร์ทอัพที่มีศักยภาพทุกรายที่พวกเขาอาจลงทุน ไม่ใช่แค่บริษัทที่พวกเขามีเวลาพบปะด้วย
ในการดำเนินงานของบริษัท ผู้ใช้ที่กำลังพิจารณาที่จะเริ่มต้นบริษัทสินค้าอุปโภคบริโภคได้ใช้ Deep Research อย่างกว้างขวางเพื่อตรวจสอบว่าชื่อแบรนด์เฉพาะได้รับการจดทะเบียนแล้วหรือไม่ โดเมนถูกครอบครองหรือไม่ ขนาดตลาด และข้อมูลอื่น ๆ อีกมากมาย
การช็อปปิ้ง การเดินทาง และสถานการณ์ครอบครัวอื่น ๆ
ผู้ใช้ที่กำลังพิจารณาที่จะซื้อรถยนต์ใหม่ต้องการทราบว่ารุ่นต่อไปจะเปิดตัวเมื่อใด มีบทความคาดการณ์มากมายทางออนไลน์ ดังนั้นผู้ใช้จึงขอให้ Deep Research รวบรวมข่าวลือที่เกี่ยวข้องทั้งหมด Deep Research ได้จัดทำรายงานที่ยอดเยี่ยม โดยแจ้งให้ผู้ใช้ทราบว่าอาจมีการเปิดตัวรถยนต์ใหม่ในอีกไม่กี่เดือนข้างหน้า
เมื่อ Deep Research เปิดตัวในญี่ปุ่น ผู้ใช้พบว่ามีประโยชน์มากในการค้นหาร้านอาหารที่ตรงตามข้อกำหนดเฉพาะ และยังสามารถช่วยให้ผู้ใช้ค้นพบสิ่งที่พวกเขาอาจไม่พบด้วยตัวเอง
เมื่อผู้ใช้ต้องการซื้อสินค้าที่มีราคาแพง วางแผนการเดินทางพิเศษ หรือใช้เวลามากในการคิดเกี่ยวกับปัญหา พวกเขาอาจใช้เวลาหลายชั่วโมงทางออนไลน์เพื่อค้นหาข้อมูลที่เกี่ยวข้อง เรียกดูบทวิจารณ์ทั้งหมด ฯลฯ Deep Research สามารถจัดระเบียบข้อมูลนี้ได้อย่างรวดเร็ว สร้างรายงานสรุป และให้คำแนะนำโดยละเอียดและเป็นส่วนตัว
คุณแม่ที่ทำงานยุ่งมักไม่มีเวลาวางแผนงานวันเกิดให้ลูก ๆ แต่ตอนนี้พวกเขาสามารถทำได้อย่างรวดเร็วด้วยความช่วยเหลือของ Deep Research
Deep Research ยังยอดเยี่ยมในการทำตามคำแนะนำ หากผู้ใช้ไม่เพียงแต่ต้องการทราบเกี่ยวกับผลิตภัณฑ์ แต่ยังต้องการเปรียบเทียบกับผลิตภัณฑ์อื่น ๆ ทั้งหมด หรือแม้แต่ต้องการดูบทวิจารณ์จากเว็บไซต์เช่น Reddit พวกเขาสามารถร้องขอ Deep Research ได้หลายอย่าง และมันจะทำงานเหล่านี้ทั้งหมดในคราวเดียว ผู้ใช้ยังสามารถขอให้ Deep Research ใส่ข้อมูลในตารางได้อีกด้วย
การเขียนโปรแกรม
หลายคนใช้ Deep Research สำหรับการเขียนโปรแกรม สถานการณ์นี้ไม่ได้ถูกพิจารณาโดย OpenAI ในตอนแรก แต่หลายคนกำลังใช้มันเพื่อเขียนโค้ด ค้นหาโค้ด แม้กระทั่งค้นหาเอกสารล่าสุดสำหรับแพ็คเกจ หรือเขียนสคริปต์ โดยมีผลลัพธ์ที่น่าประทับใจ
การศึกษา
การศึกษาส่วนบุคคลเป็นสถานการณ์การใช้งานที่น่าสนใจมาก หากผู้ใช้มีหัวข้อที่ต้องการเรียนรู้ เช่น ทบทวนชีววิทยาหรือทำความเข้าใจเหตุการณ์ปัจจุบัน พวกเขาเพียงแค่ต้องระบุส่วนที่พวกเขาไม่เข้าใจหรือข้อมูลที่พวกเขาต้องการเจาะลึก และ Deep Research สามารถรวบรวมรายงานโดยละเอียดได้ บางทีในอนาคต อาจเป็นไปได้ที่จะให้การศึกษาส่วนบุคคลตามสิ่งที่ Deep Research เรียนรู้เกี่ยวกับผู้ใช้
เอเจนต์จะเกิดขึ้นในปี 2025
ทิศทางการพัฒนาในอนาคตสำหรับ Deep Research
ในแง่ของรูปแบบผลิตภัณฑ์ OpenAI หวังว่า Deep Research จะสามารถฝังรูปภาพในอนาคต ค้นหารูปภาพของผลิตภัณฑ์ สร้างแผนภูมิ และฝังแผนภูมิเหล่านี้ในคำตอบ
ในแง่ของแหล่งข้อมูล OpenAI หวังที่จะขยายแหล่งข้อมูลที่โมเดลสามารถเข้าถึงได้ พวกเขาหวังว่าโมเดลจะสามารถค้นหาข้อมูลส่วนตัวได้ในอนาคต OpenAI จะปรับปรุงความสามารถของโมเดลต่อไป ทำให้เก่งขึ้นในการเรียกดูและวิเคราะห์
ในแง่ของความถูกต้องของข้อมูล เพื่อให้ผู้ใช้สามารถไว้วางใจผลลัพธ์ของ Deep Research ผู้ใช้สามารถดูแหล่งที่มาของข้อมูลที่โมเดลอ้างถึงได้ ในระหว่างกระบวนการฝึกอบรมโมเดล OpenAI ยังพยายามที่จะรับรองความถูกต้องของการอ้างอิง แต่โมเดลอาจยังคงทำผิดพลาด สร้างภาพหลอน หรือแม้กระทั่งเชื่อถือแหล่งที่มาที่อาจไม่น่าเชื่อถือที่สุด ดังนั้น นี่คือพื้นที่ที่ OpenAI หวังว่าจะปรับปรุงต่อไป
เพื่อรวมเข้ากับแผนงาน OpenAI Agent ในวงกว้างมากขึ้น OpenAI หวังว่า Deep Research จะสามารถขยายไปยังสถานการณ์การใช้งานที่แตกต่างกันมากมาย โดยรวมโมเดลการให้เหตุผลที่ทันสมัยที่สุดเข้ากับเครื่องมือที่มนุษย์สามารถใช้เพื่อทำงานหรือภารกิจในชีวิตประจำวันให้เสร็จสิ้น จากนั้นจึงปรับโมเดลให้เหมาะสมโดยตรงเพื่อให้ได้ผลลัพธ์ที่ผู้ใช้ต้องการให้เอเจนต์บรรลุ
ในขั้นตอนนี้ ไม่มีอะไรหยุด Deep Research จากการขยายไปยังสถานการณ์งานที่ซับซ้อนมากขึ้น AGI เป็นปัญหาในการดำเนินงาน และจะมีการพัฒนาที่น่าตื่นเต้นมากมายให้รอคอยในอนาคต
Sam Altman เชื่อว่างานที่ Deep Research สามารถทำได้จะคิดเป็นเปอร์เซ็นต์เล็กน้อยของงานทั้งหมดที่เป็นไปได้ทางเศรษฐกิจในโลก Josh Tobin เชื่อว่า Deep Research ไม่สามารถทำงานทั้งหมดให้กับผู้ใช้ได้ แต่มันสามารถประหยัดเวลาให้ผู้ใช้ได้หลายชั่วโมงหรือหลายวัน OpenAI หวังว่าเป้าหมายที่ค่อนข้างใกล้คือ Deep Research และเอเจนต์ที่สร้างขึ้นถัดไป รวมถึงเอเจนต์อื่น ๆ ที่สร้างขึ้นบนรากฐานนี้ จะช่วยประหยัดเวลาให้ผู้ใช้ 1%, 5%, 10% หรือ 25% ขึ้นอยู่กับประเภทของงานที่พวกเขาทำ
Agent & RL
Isa Fulford และ Josh Tobin เห็นพ้องกันว่าเอเจนต์จะเกิดขึ้นในปีนี้
RL มีช่วงสูงสุด จากนั้นดูเหมือนจะมีช่วงตกต่ำเล็กน้อย และตอนนี้ก็ได้รับความสนใจอีกครั้ง Yann LeCun เคยมีการเปรียบเทียบ: ถ้าคนกำลังทำเค้ก ส่วนใหญ่จะเป็นเค้ก จะมีน้ำตาลไอซิ่งเล็กน้อย และสุดท้ายก็มีเชอร์รี่สองสามลูกอยู่ด้านบน การเรียนรู้แบบไม่มีผู้สอนก็เหมือนเค้ก การเรียนรู้แบบมีผู้สอนคือน้ำตาลไอซิ่ง และ RL คือเชอร์รี่
Josh Tobin เชื่อว่าเมื่อทำ RL ในปี 2015-2016 โดยใช้การเปรียบเทียบเค้ก มันอาจจะพยายามเพิ่มเชอร์รี่โดยไม่มีเค้ก แต่ตอนนี้ มีแบบจำลองภาษาที่ได้รับการฝึกอบรมล่วงหน้าเกี่ยวกับข้อมูลจำนวนมาก โมเดลเหล่านี้มีประสิทธิภาพมาก และเรารู้วิธีทำการปรับแต่งแบบมีผู้สอนอย่างละเอียดบนแบบจำลองภาษาเหล่านี้เพื่อให้เก่งในการดำเนินการตามคำแนะนำและทำสิ่งที่ผู้คนต้องการ ตอนนี้ทุกอย่างทำงานได้ดีมาก และเหมาะมากที่จะปรับโมเดลเหล่านี้ตามฟังก์ชันรางวัลที่ผู้ใช้กำหนดสำหรับกรณีการใช้งานใด ๆ