Anthropic เผยความเข้าใจ AI ด้วย Claude 3.7 Sonnet

ในโลกของการพัฒนาปัญญาประดิษฐ์ (AI) ที่ไม่หยุดนิ่งและมักจะคลุมเครือ ก้าวสำคัญสู่ความชัดเจนได้เกิดขึ้นแล้ว Anthropic บริษัทวิจัยที่ได้รับการสนับสนุนอย่างแข็งแกร่งจาก Amazon ได้เปิดเผยการทำงานภายในของแบบจำลองภาษาขนาดใหญ่ (LLMs) เล็กน้อยด้วยเวอร์ชันล่าสุด Claude 3.7 Sonnet โมเดลนี้ไม่ใช่แค่การอัปเดตเพิ่มเติม แต่ยังแสดงถึงการเปลี่ยนแปลงกระบวนทัศน์ที่อาจเกิดขึ้น โดยนำเสนอสิ่งที่บริษัทเรียกว่าระบบ AI การให้เหตุผลแบบไฮบริด (hybrid reasoning) ชั้นนำของโลก ผลกระทบนั้นกว้างขวาง ไม่เพียงแต่ให้คำมั่นสัญญาถึงประสิทธิภาพที่เพิ่มขึ้น โดยเฉพาะอย่างยิ่งในโดเมนที่ซับซ้อน เช่น วิศวกรรมซอฟต์แวร์ แต่ยังรวมถึงความโปร่งใสที่จำเป็นอย่างยิ่งในเส้นทางการตัดสินใจของจิตใจดิจิทัลที่ทรงพลังเหล่านี้

นวัตกรรมหลักอยู่ที่ความสามารถของ Claude 3.7 Sonnet ในการผสานโหมดการทำงานที่แตกต่างกันสองโหมดได้อย่างราบรื่น: การสร้างคำตอบอย่างรวดเร็วที่คาดหวังได้จาก AI เชิงสนทนา และความสามารถในการให้เหตุผลที่ลึกซึ้งและรอบคอบยิ่งขึ้น ความเป็นคู่ (duality) นี้มอบแนวทางแบบไดนามิกให้กับผู้ใช้ ทำให้พวกเขาสามารถเลือกระหว่างคำตอบที่เกือบจะทันทีสำหรับคำถามที่ไม่ซับซ้อน และการใช้กลไกการวิเคราะห์ที่ลึกซึ้งยิ่งขึ้นสำหรับงานที่ต้องการกระบวนการคิดที่ซับซ้อน ความยืดหยุ่นนี้มีจุดมุ่งหมายเพื่อปรับสมดุลระหว่างความเร็วและความลึกของการรับรู้ (cognitive depth) ให้เหมาะสมที่สุด โดยปรับแต่งโปรไฟล์ประสิทธิภาพของ AI ให้เข้ากับความต้องการเฉพาะของงานนั้นๆ

การมองเข้าไปในเครื่องจักร: การมาถึงของ Visible Scratch Pad

บางทีคุณสมบัติที่โดดเด่นที่สุดที่มาพร้อมกับ Claude 3.7 Sonnet คือ Visible Scratch Pad เป็นเวลาหลายปีที่การคำนวณภายในของ LLMs ยังคงเป็นสิ่งที่เข้าใจยากเป็นส่วนใหญ่ ทำงานภายใน ‘กล่องดำ’ (black box) ที่ทำให้นักพัฒนา นักวิจัย และผู้ใช้ที่ต้องการทำความเข้าใจว่า AI ได้ข้อสรุปนั้นมา อย่างไร รู้สึกหงุดหงิด นวัตกรรมของ Anthropic เผชิญหน้ากับความทึบนี้โดยตรง

คุณสมบัตินี้ทำงาน เปรียบเสมือนการอนุญาตให้นักเรียนแสดงวิธีทำโจทย์คณิตศาสตร์ที่ซับซ้อน เมื่อต้องเผชิญกับคำถามที่ท้าทายซึ่งจำเป็นต้องมีการวิเคราะห์หลายขั้นตอน ตอนนี้ Claude 3.7 Sonnet สามารถแสดงความคิดระหว่างกลางและลำดับตรรกะออกมาภายนอกได้ ผู้ใช้จะได้รับความสามารถในการสังเกตการแสดงลำดับการให้เหตุผลของโมเดล เห็นการแยกย่อยปัญหาและขั้นตอนที่ดำเนินการไปสู่การแก้ปัญหา

  • ความไว้วางใจและการดีบักที่เพิ่มขึ้น: การมองเห็นนี้มีค่าอย่างยิ่งสำหรับการสร้างความไว้วางใจ เมื่อผู้ใช้สามารถติดตามตรรกะของ AI ได้ พวกเขาจะสามารถประเมินความถูกต้องของผลลัพธ์ได้ดีขึ้น สำหรับนักพัฒนา มันเป็นเครื่องมือดีบักที่ทรงพลัง ทำให้ง่ายต่อการระบุว่าการให้เหตุผลอาจผิดพลาดไปที่ใด หรืออคติอาจแทรกซึมเข้ามาที่ใด
  • คุณค่าทางการศึกษาและการตีความ: การทำความเข้าใจ ‘เหตุผล’ เบื้องหลังคำตอบของ AI อาจมีความสำคัญพอๆ กับคำตอบนั้นเอง โดยเฉพาะอย่างยิ่งในบริบททางการศึกษาหรือการวิจัย scratch pad ให้ข้อมูลเชิงลึกเกี่ยวกับกลยุทธ์การแก้ปัญหาของโมเดล
  • การนำทางความซับซ้อน: สำหรับงานที่เกี่ยวข้องกับการวิเคราะห์ข้อมูลที่ซับซ้อน การอนุมานเชิงตรรกะ หรือการแก้ปัญหาอย่างสร้างสรรค์ การสังเกตกระบวนการคิดของ AI สามารถช่วยให้ผู้ใช้ปรับแต่งพรอมต์ (prompts) หรือชี้นำโมเดลได้อย่างมีประสิทธิภาพมากขึ้น

อย่างไรก็ตาม สิ่งสำคัญคือต้องทราบว่าความโปร่งใสนี้ไม่ได้สมบูรณ์แบบ Anthropic ยอมรับว่าขั้นตอนบางอย่างภายใน scratch pad อาจถูกแก้ไขหรือทำให้ง่ายขึ้น โดยหลักแล้วเพื่อเหตุผลด้านความปลอดภัยหรือเพื่อปกป้ององค์ประกอบที่เป็นกรรมสิทธิ์ของสถาปัตยกรรมของโมเดล อย่างไรก็ตาม การเคลื่อนไหวไปสู่การมองเห็นแม้เพียงบางส่วนถือเป็นการเปลี่ยนแปลงที่สำคัญจากธรรมชาติที่ปิดสนิทตามปกติของการทำงานของ LLM

การปรับแต่งเครื่องยนต์: การควบคุมของนักพัฒนาและข้อพิจารณาทางเศรษฐกิจ

นอกเหนือจากความโปร่งใสที่ผู้ใช้มองเห็นได้แล้ว ยังมีชั้นของการควบคุมใหม่ที่มอบให้กับนักพัฒนา Anthropic ได้นำเสนอ กลไกมาตราส่วนเลื่อน (sliding scale mechanism) ซึ่งจัดการผ่านอินเทอร์เฟซที่ใช้โทเค็น (token-based interface) ที่ช่วยให้นักพัฒนาสามารถปรับเปลี่ยน ‘งบประมาณการให้เหตุผล’ (reasoning budget) ที่จัดสรรให้กับโมเดลสำหรับงานใดงานหนึ่งได้

คุณสมบัตินี้ตระหนักถึงความเป็นจริงในทางปฏิบัติของการปรับใช้ AI ในวงกว้าง การให้เหตุผลที่ลึกซึ้งและหลายขั้นตอนนั้นมีค่าใช้จ่ายในการคำนวณสูง ไม่ใช่ทุกงานที่ต้องการพลังการวิเคราะห์เต็มรูปแบบของโมเดล การให้วิธีการปรับทรัพยากรที่จัดสรรช่วยให้นักพัฒนาสามารถสร้างสมดุลที่รอบคอบระหว่างคุณภาพหรือความลึกของผลลัพธ์ที่ต้องการกับต้นทุนการคำนวณที่เกี่ยวข้อง (และส่งผลให้เกิดค่าใช้จ่ายทางการเงิน)

  • การเพิ่มประสิทธิภาพการจัดสรรทรัพยากร: องค์กรต่างๆ สามารถตัดสินใจเกี่ยวกับการปรับใช้ AI ได้ละเอียดยิ่งขึ้น งานง่ายๆ สามารถประมวลผลได้ด้วยงบประมาณการให้เหตุผลน้อยที่สุด เพื่อประหยัดทรัพยากร ในขณะที่การวิเคราะห์เชิงกลยุทธ์ที่ซับซ้อนสามารถใช้ประโยชน์จากความลึกเต็มรูปแบบของความสามารถของโมเดลได้
  • ความสามารถในการปรับขนาดและการจัดการต้นทุน: การควบคุมนี้มีความสำคัญอย่างยิ่งสำหรับองค์กรที่ต้องการรวม AI ที่ซับซ้อนเข้ากับเวิร์กโฟลว์ที่หลากหลายโดยไม่เกิดค่าใช้จ่ายในการดำเนินงานที่สูงเกินไป ช่วยให้สามารถจัดทำงบประมาณและวางแผนทรัพยากรสำหรับโครงการริเริ่ม AI ได้อย่างคาดการณ์ได้มากขึ้น
  • ประสิทธิภาพของแอปพลิเคชันที่ปรับแต่งได้: แอปพลิเคชันที่แตกต่างกันมีความต้องการที่แตกต่างกัน แชทบอทบริการลูกค้าอาจให้ความสำคัญกับความเร็วและประสิทธิภาพด้านต้นทุน ในขณะที่เครื่องมือวิจัยทางวิทยาศาสตร์อาจให้ความสำคัญกับความแม่นยำและความลึกเหนือสิ่งอื่นใด มาตราส่วนเลื่อนช่วยให้สามารถปรับแต่งนี้ได้

ความยืดหยุ่นทางเศรษฐกิจและการดำเนินงานนี้อาจพิสูจน์ได้ว่าเป็นตัวสร้างความแตกต่างที่สำคัญในภูมิทัศน์ AI ที่มีการแข่งขันสูง โดยเฉพาะอย่างยิ่งดึงดูดธุรกิจที่กำลังมองหาโซลูชัน AI ที่ใช้งานได้จริงและปรับขนาดได้

ความโดดเด่นในโรงหล่อดิจิทัล: ความเป็นเลิศในการสร้างโค้ด

ความสามารถของ Claude 3.7 Sonnet ขยายไปไกลกว่าการให้เหตุผลเชิงทฤษฎีและความโปร่งใส พวกมันแปลไปสู่ประสิทธิภาพที่จับต้องได้ โดยเฉพาะอย่างยิ่งในสาขาที่ต้องการสูงอย่างการเขียนโค้ดและการพัฒนาซอฟต์แวร์ Anthropic ได้เปิดเผยผลการเปรียบเทียบสมรรถนะ (benchmark results) ที่บ่งชี้ถึงความได้เปรียบที่ชัดเจนเหนือคู่แข่ง โดยเฉพาะโมเดล o3-mini ของ OpenAI ในงานที่เป็นหัวใจสำคัญของการเขียนโปรแกรมสมัยใหม่

ในการทดสอบการเขียนโค้ด SWE-Bench ซึ่งเป็นการประเมินที่เข้มงวดซึ่งออกแบบมาเพื่อประเมินความสามารถในการแก้ไขปัญหา GitHub ในโลกแห่งความเป็นจริง Claude 3.7 Sonnet ทำคะแนนความแม่นยำได้อย่างน่าประทับใจถึง 62.3% ตัวเลขนี้สูงกว่าความแม่นยำ 49.3% ที่รายงานของโมเดลที่เทียบเคียงได้ของ OpenAI อย่างมีนัยสำคัญ สิ่งนี้ชี้ให้เห็นถึงความเชี่ยวชาญที่เพิ่มขึ้นในการทำความเข้าใจบริบทของโค้ด การระบุข้อบกพร่อง และการสร้างแพตช์โค้ดที่ถูกต้อง ซึ่งเป็นทักษะที่มีมูลค่าสูงในวิศวกรรมซอฟต์แวร์

นอกจากนี้ ในขอบเขตของ เวิร์กโฟลว์แบบเอเจนต์ (agentic workflows) ซึ่งเกี่ยวข้องกับระบบ AI ที่ดำเนินการลำดับของการกระทำโดยอัตโนมัติ Claude 3.7 Sonnet ยังแสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่าอีกด้วย ใน TAU-Bench ทำคะแนนได้ 81.2% เทียบกับ 73.5% ของ OpenAI การเปรียบเทียบสมรรถนะนี้ทดสอบความสามารถของโมเดลในการโต้ตอบกับเครื่องมือ APIs และสภาพแวดล้อมดิจิทัลเพื่อทำงานที่ซับซ้อนให้สำเร็จ ซึ่งบ่งบอกถึงเอเจนต์ AI ที่มีความสามารถและเชื่อถือได้มากขึ้นสำหรับการทำงานอัตโนมัติ

  • ผลกระทบต่อการพัฒนาซอฟต์แวร์: ความแม่นยำที่สูงขึ้นในการเปรียบเทียบสมรรถนะการเขียนโค้ดแปลโดยตรงไปสู่การเพิ่มผลิตภาพที่เป็นไปได้สำหรับนักพัฒนา ผู้ช่วย AI เช่น Claude สามารถกลายเป็นพันธมิตรที่น่าเชื่อถือมากขึ้นในการเขียน การดีบัก และการบำรุงรักษาฐานโค้ด (codebases)
  • การพัฒนาความสามารถแบบเอเจนต์: ประสิทธิภาพที่แข็งแกร่งบน TAU-Bench ตอกย้ำการมุ่งเน้นของ Anthropic ในการสร้างระบบ AI ที่เป็นอิสระมากขึ้น ความสามารถนี้มีความสำคัญอย่างยิ่งต่อการบรรลุวิสัยทัศน์ของเอเจนต์ AI ที่สามารถจัดการงานที่ซับซ้อนและหลายขั้นตอนโดยมีการแทรกแซงของมนุษย์น้อยที่สุด
  • การเปรียบเทียบสมรรถนะเชิงแข่งขัน: ผลลัพธ์เหล่านี้ทำให้ Anthropic อยู่ในตำแหน่งที่แข็งแกร่งในการ ‘แข่งขันด้านอาวุธ AI’ (AI arms race) ที่กำลังดำเนินอยู่ โดยเฉพาะอย่างยิ่งในด้านการสร้างโค้ดและเครื่องมือสำหรับนักพัฒนาซึ่งมีความสำคัญในเชิงพาณิชย์

การจินตนาการสถาปัตยกรรมใหม่: ก้าวข้ามกระบวนทัศน์กล่องดำ

เป็นเวลาหลายทศวรรษที่สถาปัตยกรรมที่แพร่หลายของโมเดล AI ที่ซับซ้อนจำนวนมากมีส่วนทำให้เกิดธรรมชาติแบบ ‘กล่องดำ’ บ่อยครั้งที่เส้นทางการประมวลผลที่ง่ายกว่าและเร็วกว่าถูกจัดการแยกต่างหากจากงานการให้เหตุผลที่ซับซ้อนและใช้ทรัพยากรมาก การแยกส่วนนี้อาจนำไปสู่ความไร้ประสิทธิภาพและทำให้การทำความเข้าใจแบบองค์รวมทำได้ยาก ความก้าวหน้าของ Anthropic ด้วย Claude 3.7 Sonnet ส่วนหนึ่งเกิดจากการออกแบบสถาปัตยกรรมนี้ใหม่โดยพื้นฐาน

Dario Amodei, CEO ของ Anthropic ได้อธิบายถึงการเปลี่ยนแปลงนี้อย่างชัดเจน: ‘เราก้าวข้ามการปฏิบัติต่อการให้เหตุผลว่าเป็นความสามารถที่แยกจากกัน ตอนนี้มันเป็นส่วนหนึ่งที่ราบรื่นของการทำงานหลักของโมเดล’ คำกล่าวนี้ชี้ไปที่ สถาปัตยกรรมการให้เหตุผลแบบบูรณาการ (integrated reasoning architecture) แทนที่จะส่งปัญหาที่ซับซ้อนไปยังโมดูลเฉพาะทาง ความสามารถในการให้เหตุผลเชิงลึกได้ถูกถักทอเข้าไปในโครงสร้างของโมเดลหลัก

การรวมเป็นหนึ่งนี้นำเสนอข้อได้เปรียบที่เป็นไปได้หลายประการ:

  1. การเปลี่ยนผ่านที่ราบรื่นขึ้น: โมเดลสามารถเปลี่ยนระหว่างการตอบสนองอย่างรวดเร็วและการคิดเชิงลึกได้อย่างลื่นไหลมากขึ้น โดยไม่มีค่าใช้จ่ายในการเรียกใช้ระบบแยกต่างหาก
  2. บริบทแบบองค์รวม: การรักษาการให้เหตุผลแบบบูรณาการอาจช่วยให้โมเดลรักษาบริบทและความสอดคล้องกันได้ดีขึ้นในโหมดการทำงานต่างๆ
  3. ประสิทธิภาพที่เพิ่มขึ้น: แม้ว่าการให้เหตุผลเชิงลึกจะยังคงต้องใช้ทรัพยากรมาก การบูรณาการอาจปลดล็อกประสิทธิภาพทางสถาปัตยกรรมเมื่อเทียบกับการจัดการระบบที่แตกต่างกัน

ปรัชญาสถาปัตยกรรมนี้สอดคล้องกับความก้าวหน้าของ Anthropic ใน AI แบบเอเจนต์ (agentic AI) โดยต่อยอดจากคุณสมบัติ Computer Use ของพวกเขา ซึ่งเปิดตัวเมื่อต้นปี 2024 ซึ่งช่วยให้โมเดล Claude สามารถโต้ตอบกับแอปพลิเคชันซอฟต์แวร์ได้เหมือนกับผู้ใช้ที่เป็นมนุษย์ (คลิกปุ่ม ป้อนข้อความ) โมเดลใหม่นี้ช่วยเพิ่มความสามารถเหล่านี้ การให้เหตุผลที่ดีขึ้นและสถาปัตยกรรมแบบบูรณาการน่าจะมีส่วนช่วยให้ประสบความสำเร็จในการเปรียบเทียบสมรรถนะที่เห็นในเวิร์กโฟลว์แบบเอเจนต์

Jared Kaplan, หัวหน้านักวิทยาศาสตร์ของ Anthropic เน้นย้ำถึงเส้นทางของการพัฒนาเหล่านี้ โดยเน้นว่าเอเจนต์ AI ในอนาคตที่สร้างขึ้นบนรากฐานนี้จะมีความเชี่ยวชาญมากขึ้นในการใช้เครื่องมือที่หลากหลายและนำทางสภาพแวดล้อมดิจิทัลที่ไม่หยุดนิ่งและคาดเดาไม่ได้ เป้าหมายคือการสร้างเอเจนต์ที่ไม่เพียงแต่สามารถทำตามคำแนะนำได้ แต่ยังสามารถวางกลยุทธ์และปรับตัวเพื่อให้บรรลุวัตถุประสงค์ที่ซับซ้อนได้

กระดานหมากรุกเชิงกลยุทธ์: การแข่งขันและทิศทางในอนาคต

การเปิดตัว Claude 3.7 Sonnet ไม่ได้เกิดขึ้นในสุญญากาศ มันมาถึงท่ามกลางการแข่งขันที่ดุเดือด โดยหลักแล้วกับ OpenAI ซึ่งคาดการณ์กันอย่างกว้างขวางว่าจะเปิดตัวโมเดลรุ่นต่อไป GPT-5 ผู้สังเกตการณ์ในอุตสาหกรรมคาดการณ์ว่า GPT-5 อาจรวมรูปแบบของการให้เหตุผลแบบไฮบริดเข้าไว้ด้วย ทำให้การเปิดตัวปัจจุบันของ Anthropic เป็นการเคลื่อนไหวเชิงกลยุทธ์ที่ถูกจังหวะเพื่อสร้างความได้เปรียบตั้งแต่เนิ่นๆ

ด้วยการนำเสนอโมเดลไฮบริดที่มีความโปร่งใสที่เพิ่มขึ้นและการควบคุมสำหรับนักพัฒนาออกสู่ตลาดในขณะนี้ Anthropic บรรลุเป้าหมายหลายประการ:

  • การครองส่วนแบ่งทางความคิด (Capturing Mindshare): เป็นการวางตำแหน่งบริษัทในฐานะผู้ริเริ่ม โดยเฉพาะอย่างยิ่งในด้านที่สำคัญของการให้เหตุผล ความโปร่งใส และความสามารถแบบเอเจนต์
  • การรวบรวมข้อมูลในโลกแห่งความเป็นจริง: การปรับใช้ในช่วงต้นช่วยให้ Anthropic สามารถรวบรวมข้อมูลอันมีค่าเกี่ยวกับวิธีที่ผู้ใช้และนักพัฒนาโต้ตอบกับคุณสมบัติใหม่เหล่านี้ ซึ่งจะเป็นข้อมูลสำหรับการปรับปรุงในอนาคต
  • การตั้งค่ามาตรฐานเปรียบเทียบ (Setting Benchmarks): ผลการเปรียบเทียบสมรรถนะการเขียนโค้ดที่น่าประทับใจได้ตั้งมาตรฐานที่สูงสำหรับคู่แข่งที่จะต้องเทียบเท่าหรือเหนือกว่า

การเน้นที่คุณสมบัติเช่น visible scratch pad และแถบเลื่อนงบประมาณการให้เหตุผลยังสอดคล้องกับแนวโน้มและความต้องการที่เกิดขึ้นใหม่:

  • AI ที่อธิบายได้ (Explainable AI - XAI): เนื่องจากระบบ AI ถูกรวมเข้ากับโครงสร้างพื้นฐานที่สำคัญและกระบวนการตัดสินใจมากขึ้น (ในการเงิน การดูแลสุขภาพ กฎหมาย ฯลฯ) หน่วยงานกำกับดูแลทั่วโลก (เช่น EU กับ AI Act) จึงเรียกร้องความโปร่งใสและความสามารถในการตีความเพิ่มมากขึ้น scratch pad ตอบสนองความต้องการ AI ที่อธิบายได้นี้โดยตรง
  • ความอยู่รอดทางเศรษฐกิจ: การมุ่งเน้นไปที่ประสิทธิภาพด้านต้นทุนผ่านแถบเลื่อนงบประมาณการให้เหตุผลทำให้ AI ที่ซับซ้อนเข้าถึงได้ง่ายขึ้นและใช้งานได้จริงสำหรับธุรกิจในวงกว้างขึ้น ก้าวข้ามการปรับใช้เชิงทดลองไปสู่การบูรณาการการดำเนินงานที่ปรับขนาดได้

เมื่อมองไปข้างหน้า Anthropic ได้วางแผนงานที่ชัดเจนสำหรับการต่อยอดจากรากฐานที่วางไว้โดย Claude 3.7 Sonnet:

  • ความสามารถด้านโค้ดสำหรับองค์กร: มีการวางแผนขยาย Claude Code เพิ่มเติม โดยมีเป้าหมายเพื่อมอบเครื่องมือที่ทรงพลังและปรับแต่งได้มากขึ้นโดยเฉพาะสำหรับทีมพัฒนาซอฟต์แวร์ระดับองค์กร
  • การควบคุมการให้เหตุผลอัตโนมัติ: บริษัทตั้งใจที่จะพัฒนากลไกที่สามารถกำหนดระยะเวลาหรือความลึกของการให้เหตุผลที่เหมาะสมที่สุดที่จำเป็นสำหรับงานที่กำหนดได้โดยอัตโนมัติ ซึ่งอาจขจัดความจำเป็นในการปรับด้วยตนเองผ่านแถบเลื่อนในหลายกรณี
  • การบูรณาการหลายรูปแบบ (Multimodal Integration): การทำซ้ำในอนาคตจะมุ่งเน้นไปที่การรวมประเภทอินพุตที่หลากหลายเข้าด้วยกันอย่างราบรื่น เช่น รูปภาพ ข้อมูลจาก APIs และข้อมูลเซ็นเซอร์อื่นๆ ที่อาจเกิดขึ้น ทำให้ Claude สามารถจัดการกับเวิร์กโฟลว์ในโลกแห่งความเป็นจริงที่ซับซ้อนและหลากหลายมากขึ้น ซึ่งต้องการความเข้าใจและการสังเคราะห์ข้อมูลจากหลายแหล่ง

Jared Kaplan ได้ให้ภาพรวมของวิสัยทัศน์ระยะยาว โดยชี้ให้เห็นถึงก้าวการพัฒนาที่รวดเร็ว: ‘นี่เป็นเพียงจุดเริ่มต้น’ เขากล่าว ‘ภายในปี 2026 เอเจนต์ AI จะจัดการงานต่างๆ ได้อย่างราบรื่นเหมือนมนุษย์ ตั้งแต่การวิจัยในนาทีสุดท้ายไปจนถึงการจัดการฐานโค้ดทั้งหมด’ การคาดการณ์ที่ทะเยอทะยานนี้ตอกย้ำความเชื่อที่ว่าการปรับปรุงสถาปัตยกรรมและความสามารถที่เห็นใน Claude 3.7 Sonnet เป็นก้าวสำคัญสู่ระบบ AI ที่เป็นอิสระอย่างแท้จริงและมีความสามารถสูง ซึ่งสามารถปรับเปลี่ยนรูปแบบงานความรู้ (knowledge work) และปฏิสัมพันธ์ทางดิจิทัลได้อย่างสิ้นเชิงภายในไม่กี่ปีข้างหน้า การแข่งขันได้เริ่มขึ้นแล้ว และ Anthropic เพิ่งทำการเคลื่อนไหวที่สำคัญอย่างยิ่ง