OpenAI เผยเครื่องมือใหม่เพื่อขับเคลื่อน AI Agents

แนะนำ Responses API: รากฐานใหม่สำหรับ AI Agents

‘Responses API’ ที่เพิ่งเปิดตัวใหม่ช่วยลดความซับซ้อนของกระบวนการพัฒนาสำหรับ AI agents ทำให้พวกเขาสามารถทำงานได้อย่างอิสระในนามของผู้ใช้ API นี้ได้รับการออกแบบมาเพื่อเป็นรากฐานสำหรับการสร้าง agents ที่ขับเคลื่อนโดย large language models ที่ซับซ้อนของ OpenAI มีกำหนดจะเข้ามาแทนที่ Assistants API ที่มีอยู่ ซึ่งจะค่อยๆ ยุติการใช้งานในอีกหนึ่งปีข้างหน้า

การเคลื่อนไหวเชิงกลยุทธ์นี้โดย OpenAI ตอกย้ำความมุ่งมั่นของบริษัทต่อ agentic AI Responses API ช่วยให้นักพัฒนาสามารถสร้าง agents ที่มีความสามารถที่เพิ่มขึ้น โดยเน้นเฉพาะที่การดึงข้อมูลและการทำงานอัตโนมัติ

ความสามารถในการค้นหาที่ได้รับการปรับปรุง: เชื่อมช่องว่างความรู้

หนึ่งในคุณสมบัติหลักของ Responses API คือความสามารถในการจัดเตรียม AI agents ด้วยฟังก์ชันการค้นหาที่มีประสิทธิภาพ Agents เหล่านี้สามารถใช้ประโยชน์จากเครื่องมือค้นหาไฟล์เฉพาะเพื่อเจาะลึกเข้าไปในที่เก็บข้อมูลภายในของบริษัท นอกจากนี้ พวกเขาสามารถขยายการค้นหาไปยังอินเทอร์เน็ตในวงกว้างได้อีกด้วย

ความสามารถนี้สะท้อนให้เห็นถึง Operator agent ที่เพิ่งเปิดตัวของ OpenAI Operator พึ่งพาโมเดล Computer-Using-Agent (CUA) ซึ่งออกแบบมาเพื่อปรับปรุงงานต่างๆ เช่น การป้อนข้อมูล อย่างไรก็ตาม สิ่งสำคัญคือต้องรับทราบว่า OpenAI ได้ตั้งข้อสังเกตก่อนหน้านี้ว่าโมเดล CUA อาจไม่น่าเชื่อถือในบางครั้งเมื่อทำงานอัตโนมัติภายในระบบปฏิบัติการ โมเดลดังกล่าวแสดงให้เห็นว่ามีข้อผิดพลาด ดังนั้น OpenAI จึงแนะนำให้นักพัฒนาทราบว่า Responses API อยู่ในระยะ ‘เริ่มต้น’ โดยคาดว่าจะมีความน่าเชื่อถือดีขึ้นเมื่อเวลาผ่านไป

นักพัฒนาที่ใช้ Responses API มีตัวเลือก model สองแบบให้เลือก: GPT-4o search และ GPT-4o mini search ทั้งสอง models มีความสามารถในการเรียกดูเว็บโดยอัตโนมัติเพื่อค้นหาคำตอบสำหรับคำถามของผู้ใช้ ที่สำคัญ พวกเขายังให้การอ้างอิงสำหรับแหล่งที่มาที่แจ้งการตอบสนองของพวกเขา ส่งเสริมความโปร่งใสและการตรวจสอบได้

ความสามารถในการค้นหาเว็บและการดึงข้อมูลนี้มีความสำคัญยิ่ง OpenAI เน้นย้ำว่าการเข้าถึงทั้งเว็บแบบเปิดและชุดข้อมูลที่เป็นกรรมสิทธิ์ของบริษัทช่วยเพิ่มความแม่นยำของ models ได้อย่างมาก และด้วยเหตุนี้ ประสิทธิภาพของ agents ที่สร้างขึ้นบน models เหล่านั้น

การเปรียบเทียบความแม่นยำ: ก้าวกระโดดไปข้างหน้า แต่ยังไม่สมบูรณ์แบบ

OpenAI ได้แสดงให้เห็นถึงความเหนือกว่าของ models ที่เปิดใช้งานการค้นหาโดยใช้ SimpleQA benchmark ของตัวเอง benchmark นี้ได้รับการออกแบบมาโดยเฉพาะเพื่อวัดอัตราการสับสน (confabulation rate) ของระบบ AI ซึ่งโดยพื้นฐานแล้วคือความถี่ที่พวกเขาสร้างข้อมูลเท็จหรือข้อมูลที่คิดค้นขึ้น

ผลลัพธ์ที่ได้น่าสนใจ GPT-4o search ทำคะแนนได้ 90% ที่น่าประทับใจ ในขณะที่ GPT-4o mini search ตามมาติดๆ ด้วยคะแนน 88% ในทางตรงกันข้าม GPT-4.5 model ใหม่ แม้ว่าจะมีจำนวนพารามิเตอร์ที่มากกว่าและมีกำลังโดยรวมมากกว่า แต่ทำคะแนนได้เพียง 63% ใน benchmark เดียวกัน คะแนนที่ต่ำกว่านี้เป็นผลมาจากการขาดความสามารถในการค้นหาเพื่อดึงข้อมูลเพิ่มเติม

อย่างไรก็ตาม เป็นสิ่งสำคัญสำหรับนักพัฒนาที่จะต้องรักษามุมมองที่เป็นจริง แม้ว่า models เหล่านี้จะแสดงถึงความก้าวหน้าครั้งสำคัญ แต่ฟังก์ชันการค้นหาไม่ได้กำจัดการสับสน (confabulations) หรือภาพหลอน (hallucinations) ของ AI ได้ทั้งหมด คะแนน benchmark บ่งชี้ว่า GPT-4o search ยังคงสร้างข้อผิดพลาดตามข้อเท็จจริงในประมาณ 10% ของการตอบสนอง อัตราความผิดพลาดนี้อาจสูงเกินไปสำหรับการใช้งานจำนวนมากที่ต้องการ agentic AI ที่มีความแม่นยำสูง

เพิ่มขีดความสามารถให้นักพัฒนา: เครื่องมือและทรัพยากรโอเพนซอร์ส

แม้ว่าเทคโนโลยีจะยังอยู่ในช่วงเริ่มต้น แต่ OpenAI ก็สนับสนุนให้นักพัฒนาเริ่มทดลองใช้เครื่องมือใหม่เหล่านี้อย่างจริงจัง นอกเหนือจาก Responses API แล้ว บริษัทยังได้เปิดตัว Agents SDK (Software Development Kit) แบบโอเพนซอร์ส SDK นี้มีชุดเครื่องมือสำหรับการผสานรวม AI models และ agents เข้ากับระบบภายในได้อย่างราบรื่น นอกจากนี้ยังมีทรัพยากรสำหรับการใช้มาตรการป้องกันและตรวจสอบการดำเนินการของ AI agents

การเปิดตัวนี้สร้างขึ้นจากการเปิดตัว ‘Swarm’ ก่อนหน้านี้ของ OpenAI ซึ่งเป็น framework ที่ออกแบบมาเพื่อช่วยนักพัฒนาจัดการและประสานงาน AI agents หลายตัว ทำให้พวกเขาสามารถทำงานร่วมกันในงานที่ซับซ้อนได้

วิสัยทัศน์เชิงกลยุทธ์ของ OpenAI: การขยายการเข้าถึงและการนำไปใช้

เครื่องมือและโครงการริเริ่มใหม่เหล่านี้สอดคล้องกับเป้าหมายที่กว้างขึ้นของ OpenAI ในการเพิ่มส่วนแบ่งการตลาดของ large language models ดังที่ Damian Rollison ผู้อำนวยการฝ่าย Market Insights ของ SOCi Inc. ซึ่งเป็นบริษัทสตาร์ทอัพด้าน agentic AI ชี้ให้เห็นว่า OpenAI ได้ใช้กลยุทธ์ที่คล้ายกันก่อนหน้านี้โดยการรวม ChatGPT เข้ากับ Siri ของ Apple Inc. ภายในชุด Apple Intelligence ใหม่ การรวมนี้ทำให้ ChatGPT ได้รับการเปิดเผยต่อผู้ชมใหม่จำนวนมาก

“Responses API ใหม่เปิดโอกาสให้มีการเปิดรับและปรับตัวของประชาชนทั่วไปให้เข้ากับแนวคิดของ AI agents ได้กว้างขึ้น ซึ่งอาจฝังอยู่ในเครื่องมือต่างๆ ที่พวกเขาใช้อยู่แล้ว” Rollison กล่าว

คำเตือน: การนำทางใน Hype Cycle

แม้ว่าศักยภาพของ AI agents จะปฏิเสธไม่ได้ และนักพัฒนาจำนวนมากจะต้องกระตือรือร้นที่จะสำรวจความเป็นไปได้ที่นำเสนอโดยเครื่องมือใหม่ของ OpenAI แต่สิ่งสำคัญคือต้องจำไว้ว่าเทคโนโลยีเหล่านี้ยังอยู่ในช่วงเริ่มต้น การอ้างว่ามีประสิทธิภาพไร้ที่ติควรได้รับการพิจารณาด้วยความสงสัยในระดับหนึ่ง

ตัวอย่างล่าสุดเน้นย้ำประเด็นนี้ สตาร์ทอัพจากจีนสร้างกระแสฮือฮาด้วยการเปิดตัว AI agent ชื่อ Manus ผู้ใช้ในช่วงแรกประทับใจในตอนแรก แต่เมื่อ agent พร้อมใช้งานมากขึ้น ข้อจำกัดและข้อบกพร่องก็ปรากฏชัดขึ้นอย่างรวดเร็ว สิ่งนี้ทำหน้าที่เป็นเครื่องเตือนใจว่าประสิทธิภาพในโลกแห่งความเป็นจริงมักจะล้าหลังกระแสเริ่มต้น และการทดสอบและการประเมินอย่างละเอียดเป็นสิ่งสำคัญ

อนาคตของ AI Agents: ภูมิทัศน์การทำงานร่วมกัน

การพัฒนา AI agents ไม่ได้จำกัดอยู่แค่ความพยายามของ OpenAI เท่านั้น ระบบนิเวศที่กำลังเติบโตของบริษัทและนักวิจัยมีส่วนร่วมอย่างแข็งขันในสาขาที่พัฒนาอย่างรวดเร็วนี้ ทั้งการแข่งขันและการทำงานร่วมกันกำลังขับเคลื่อนนวัตกรรม นำไปสู่แนวทางและโซลูชันที่หลากหลาย

บริษัทบางแห่งกำลังมุ่งเน้นไปที่ agents เฉพาะทางที่ปรับให้เหมาะกับอุตสาหกรรมหรืองานเฉพาะ ในขณะที่บริษัทอื่นๆ กำลังติดตาม agents ที่มีวัตถุประสงค์ทั่วไปมากขึ้นซึ่งสามารถจัดการกับคำขอได้หลากหลายมากขึ้น ชุมชนการวิจัยยังสำรวจสถาปัตยกรรมใหม่และเทคนิคการฝึกอบรมเพื่อปรับปรุงความน่าเชื่อถือ ความปลอดภัย และข้อควรพิจารณาด้านจริยธรรมเกี่ยวกับ AI agents

ความท้าทายและข้อควรพิจารณาที่สำคัญ

เมื่อ AI agents มีความซับซ้อนมากขึ้นและรวมเข้ากับแง่มุมต่างๆ ของชีวิตเรา ความท้าทายและข้อควรพิจารณาที่สำคัญหลายประการก็ปรากฏขึ้น:

  • ความน่าเชื่อถือและความถูกต้อง: การตรวจสอบให้แน่ใจว่า agents ให้ข้อมูลที่ถูกต้องและเชื่อถือได้อย่างสม่ำเสมอเป็นสิ่งสำคัญยิ่ง โดยเฉพาะอย่างยิ่งในการใช้งานที่สำคัญ
  • ความปลอดภัยและการรักษาความปลอดภัย: การป้องกันการใช้งานที่เป็นอันตรายและผลกระทบที่ไม่ได้ตั้งใจเป็นสิ่งสำคัญ เนื่องจาก agents อาจเข้าถึงข้อมูลที่ละเอียดอ่อนหรือควบคุมระบบที่สำคัญได้
  • ความโปร่งใสและความสามารถในการอธิบาย: การทำความเข้าใจว่า agents ตัดสินใจและดำเนินการอย่างไรเป็นสิ่งสำคัญสำหรับการสร้างความไว้วางใจและความรับผิดชอบ
  • ผลกระทบทางจริยธรรม: การจัดการกับอคติที่อาจเกิดขึ้น ข้อกังวลด้านความเป็นธรรม และผลกระทบต่อสังคมเป็นสิ่งสำคัญเพื่อให้แน่ใจว่ามีการพัฒนาและการปรับใช้อย่างมีความรับผิดชอบ
  • ประสบการณ์ผู้ใช้: การออกแบบอินเทอร์เฟซที่ใช้งานง่ายและเป็นมิตรกับผู้ใช้สำหรับการโต้ตอบกับ agents เป็นกุญแจสำคัญในการนำไปใช้อย่างแพร่หลาย
  • ความเป็นส่วนตัวของข้อมูล: การปกป้องข้อมูลผู้ใช้และการปฏิบัติตามกฎระเบียบด้านความเป็นส่วนตัวเป็นข้อกังวลที่สำคัญ

เส้นทางข้างหน้า: การทำซ้ำและการพัฒนาอย่างมีความรับผิดชอบ

การพัฒนา AI agents เป็นการเดินทางต่อเนื่อง โดดเด่นด้วยการทำซ้ำ การปรับแต่ง และการเรียนรู้อย่างต่อเนื่อง เครื่องมือใหม่ของ OpenAI แสดงถึงก้าวสำคัญไปข้างหน้า แต่ไม่ใช่จุดหมายปลายทางสุดท้าย เมื่อเทคโนโลยีเติบโตเต็มที่ การวิจัยอย่างต่อเนื่อง แนวทางการพัฒนาอย่างมีความรับผิดชอบ และการทำงานร่วมกันแบบเปิดจะเป็นสิ่งสำคัญในการตระหนักถึงศักยภาพสูงสุดของ AI agents ในขณะที่ลดความเสี่ยงที่อาจเกิดขึ้น การมุ่งเน้นจะต้องยังคงอยู่ในการสร้าง agents ที่ไม่เพียงแต่ทรงพลัง แต่ยังน่าเชื่อถือ ปลอดภัย และเป็นประโยชน์ต่อสังคม การพัฒนาของสาขานี้ต้องใช้วิธีการที่รอบคอบและมีการวัดผล สร้างสมดุลระหว่างนวัตกรรมกับความมุ่งมั่นในหลักการทางจริยธรรมและความเป็นอยู่ที่ดีของผู้ใช้ ในอีกไม่กี่ปีข้างหน้าจะมีการพัฒนาต่อไปอย่างไม่ต้องสงสัย และชุมชนการพัฒนาอย่างมีความรับผิดชอบจะต้องระมัดระวังในการชี้นำวิถีของเทคโนโลยีที่เปลี่ยนแปลงนี้