ความก้าวหน้าอย่างไม่หยุดยั้งของปัญญาประดิษฐ์ยังคงดำเนินต่อไป โดยขยายขอบเขตจากการตอบคำถามง่ายๆ และการสร้างเนื้อหา ไปสู่ขอบเขตของการมีส่วนร่วมอย่างแข็งขันในชีวิตดิจิทัลของเรา ดูเหมือนว่าในแต่ละสัปดาห์จะมีผู้ท้าชิงรายใหม่เกิดขึ้น ซึ่งเป็นอัลกอริทึมขั้นสูงที่สัญญาว่าจะทำให้งานต่างๆ มีความคล่องตัว เพิ่มประสิทธิภาพการทำงาน หรือเพียงแค่ทำให้การนำทางความซับซ้อนของโลกออนไลน์ง่ายขึ้นเล็กน้อย ก้าวเข้าสู่เวทีที่กำลังพัฒนานี้อย่างมั่นคงคือ Amazon บริษัทที่มีความทะเยอทะยานขยายขอบเขตไปไกลกว่าการค้าปลีกออนไลน์มาโดยตลอด ข้อเสนอล่าสุดของพวกเขา ซึ่งมีชื่อว่า Nova Act แสดงถึงก้าวสำคัญสู่อนาคตที่เอเจนต์ AI ไม่เพียงแต่ช่วยเหลือมนุษย์เท่านั้น แต่ยังทำงานต่างๆ ในนามของพวกเขาโดยตรงภายในสภาพแวดล้อมที่คุ้นเคยของเว็บเบราว์เซอร์
นี่ไม่ใช่เพียงแค่แชทบอทอีกตัวที่สามารถสนทนาได้ Amazon วางตำแหน่ง Nova Act ให้เป็นโมเดล AI ยุคถัดไปที่ซับซ้อน ซึ่งออกแบบมาพร้อมกับระดับความเป็นอิสระในการปฏิบัติงานที่ไม่ค่อยพบเห็นในแอปพลิเคชันที่ผู้บริโภคใช้งานโดยตรง คำมั่นสัญญาหลักคืออะไร? เอเจนต์ที่สามารถดำเนินการ กึ่งอัตโนมัติ เข้าใจเจตนาของผู้ใช้ และดำเนินการตามกระบวนการหลายขั้นตอนทางออนไลน์โดยอาจมีการกำกับดูแลจากมนุษย์น้อยที่สุด การเปลี่ยนแปลงจากผู้ช่วยแบบพาสซีฟไปสู่ผู้เข้าร่วมแบบแอคทีฟนี้ถือเป็นช่วงเวลาสำคัญในการพัฒนาและการนำเทคโนโลยี AI ไปใช้
การกำหนดนิยามผู้ช่วยนักบินดิจิทัล: ความสามารถของ Nova Act
สิ่งที่ทำให้ Nova Act แตกต่างอย่างแท้จริงคือความสามารถที่กล่าวอ้างในการควบคุมเว็บเบราว์เซอร์และดำเนินการต่างๆ ที่โดยปกติแล้วต้องใช้การป้อนข้อมูลโดยตรงจากมนุษย์ ลองนึกภาพผู้ช่วยที่ไม่เพียงแค่ค้นหาข้อมูล แต่ยังดำเนินการตามข้อมูลนั้นด้วย Amazon ได้ชี้ให้เห็นว่า Nova Act มีความสามารถพื้นฐานในการนำทางเว็บไซต์ ตีความเนื้อหา และดำเนินการคำสั่งที่มีจุดมุ่งหมายเพื่อเป็นประโยชน์ต่อผู้ใช้ ซึ่งรวมถึงงานที่ผสมผสานโลกดิจิทัลและอาจรวมถึงโลกทางกายภาพเข้าด้วยกัน ทำให้เส้นแบ่งระหว่างการดึงข้อมูลและการดำเนินการในโลกแห่งความเป็นจริงพร่ามัว
บางทีคำกล่าวอ้างที่ดึงดูดความสนใจมากที่สุดคือศักยภาพของเอเจนต์ในการ ซื้อสินค้าโดยไม่มีการแทรกแซงโดยตรงจากมนุษย์ ในทุกขั้นตอน แม้ว่ารายละเอียดและมาตรการป้องกันเกี่ยวกับคุณลักษณะนี้จะยังคงเป็นความลับในช่วงเริ่มต้น แต่ความหมายนั้นลึกซึ้ง AI ที่ประเมินตัวเลือก ทำการเลือก และทำธุรกรรมให้เสร็จสมบูรณ์ แสดงถึงการก้าวกระโดดไปสู่ความเป็นอิสระทางดิจิทัลอย่างแท้จริง นอกเหนือจากการค้าแล้ว Amazon ยังสาธิตสถานการณ์ที่ Nova Act สามารถค้นหาอินเทอร์เน็ตได้อย่างอิสระ โดยได้รับมอบหมายให้ค้นหาอพาร์ตเมนต์ว่างใน Redwood City, California ที่ตรงตามเกณฑ์เฉพาะ เช่น อยู่ในระยะทางที่สามารถปั่นจักรยานไปยังสถานีรถไฟได้ สิ่งนี้แสดงให้เห็นถึงความสามารถในการเข้าใจคำขอที่ซับซ้อนและหลายชั้น และโต้ตอบกับอินเทอร์เฟซเว็บเพื่อตอบสนองคำขอเหล่านั้น
ดูเหมือนว่า Amazon กำลังจัดโครงสร้างความสามารถของ Nova Act ในระดับต่างๆ ซึ่งบ่งบอกถึงแพลตฟอร์มที่หลากหลายซึ่งปรับให้เข้ากับความต้องการต่างๆ ได้:
- การสร้างข้อความ (Text Generation): นำเสนอในสามระดับที่แตกต่างกัน – Micro, Lite, และ Pro แนวทางแบบแบ่งระดับนี้น่าจะสะท้อนถึงระดับความซับซ้อน ความเร็ว หรืออาจเป็นการเข้าถึงคุณลักษณะการประมวลผลภาษาขั้นสูงที่แตกต่างกัน เพื่อตอบสนองความต้องการของผู้ใช้ที่แตกต่างกันตั้งแต่ข้อความสั้นๆ ง่ายๆ ไปจนถึงการสร้างเนื้อหาที่ซับซ้อนมากขึ้น
- การสร้างรูปภาพ (Image Generation): โมเดล Canvas ถูกกำหนดไว้สำหรับการผลิตเนื้อหาภาพ โดยใช้ประโยชน์จากสาขาที่กำลังเติบโตของ AI เชิงสร้างสรรค์สำหรับรูปภาพ
- การสร้างวิดีโอ (Video Generation): ในทำนองเดียวกัน โมเดล Reel มุ่งเน้นไปที่การสร้างเนื้อหาวิดีโอ ซึ่งเป็นการขยายขีดความสามารถด้านมัลติมีเดียของเอเจนต์ให้กว้างขวางยิ่งขึ้น
สิ่งสำคัญคือต้องเข้าใจว่า Nova Act กำลังอยู่ในช่วงการพัฒนาเบื้องต้น Amazon ระบุอย่างชัดเจนว่าเอเจนต์ยังอยู่ในช่วงเริ่มต้น แต่เน้นย้ำถึงความสามารถในการปรับปรุงเมื่อเวลาผ่านไปผ่านการเรียนรู้และการปรับแต่งอย่างต่อเนื่อง กระบวนการเรียนรู้นี้จะมีความสำคัญอย่างยิ่ง โดยเฉพาะอย่างยิ่งสำหรับงานที่ต้องการความเข้าใจที่ละเอียดอ่อนและการโต้ตอบกับภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของเว็บไซต์และบริการออนไลน์
การเข้าถึงช่วงแรก: ระยะ Research Preview
ในตอนนี้ Nova Act ยังไม่ได้เปิดตัวสู่สาธารณะ แต่ Amazon เลือกใช้แนวทางที่ระมัดระวังมากขึ้น โดยทำให้เครื่องมือ AI นี้พร้อมใช้งานในสิ่งที่พวกเขาเรียกว่า “research preview” ระยะนี้อนุญาตให้ผู้ใช้ที่ได้รับเลือก ซึ่งรวมถึงผู้ขาย ผู้ลงโฆษณา และผู้ซื้อภายในระบบนิเวศของ Amazon อย่างชัดเจน สามารถโต้ตอบกับเอเจนต์และให้ข้อเสนอแนะอันมีค่าได้ กลยุทธ์การเปิดตัวแบบควบคุมนี้ช่วยให้ Amazon สามารถรวบรวมข้อมูลการใช้งานจริง ระบุปัญหาที่อาจเกิดขึ้น ปรับแต่งอัลกอริทึม และทำความเข้าใจได้ดีขึ้นว่าผู้ใช้อาจใช้ประโยชน์จากเครื่องมืออันทรงพลังเช่นนี้ได้อย่างไรก่อนที่จะมีการนำไปใช้งานในวงกว้าง
ปัจจุบัน การเข้าถึงดูเหมือนจะจำกัดตามภูมิศาสตร์ ลูกค้า Amazon ที่สนใจซึ่งอยู่ใน United States สามารถไปที่ nova.amazon.com
และลงชื่อเข้าใช้เพื่อสำรวจแพลตฟอร์มได้ อย่างไรก็ตาม ผู้ใช้นอกสหรัฐอเมริกาดูเหมือนจะถูกยกเว้นจากระยะพรีวิวเบื้องต้นนี้ในขณะนี้ การเปิดตัวแบบแบ่งระยะนี้เป็นเรื่องปกติสำหรับเทคโนโลยีที่อาจส่งผลกระทบอย่างมีนัยสำคัญ ซึ่งช่วยให้สามารถปรับปรุงซ้ำๆ และตรวจสอบการปฏิบัติตามข้อกำหนดระดับภูมิภาคได้ ข้อเสนอแนะที่รวบรวมจากผู้ขายและผู้ลงโฆษณาจะให้ข้อมูลเชิงลึกเป็นพิเศษ ซึ่งเผยให้เห็นว่าธุรกิจต่างๆ อาจรวม Nova Act เข้ากับเวิร์กโฟลว์ของตนสำหรับการวิจัยตลาด การจัดการแคมเปญโฆษณา หรือการวิเคราะห์ปฏิสัมพันธ์กับลูกค้าได้อย่างไร ในทางกลับกัน ผู้ซื้อจะให้ข้อมูลที่สำคัญเกี่ยวกับความสามารถในการใช้งาน ความน่าเชื่อถือ และความน่าเชื่อถือของเอเจนต์ที่ทำงานต่างๆ เช่น การค้นหาผลิตภัณฑ์หรือการเปรียบเทียบ
การเสริมศักยภาพนักนวัตกรรม: Nova Act Software Development Kit (SDK)
ด้วยตระหนักว่าศักยภาพที่แท้จริงของแพลตฟอร์มมักจะอยู่ในความคิดสร้างสรรค์ของชุมชนนักพัฒนาในวงกว้าง Amazon จึงได้เปิดตัว Nova Act SDK ไปพร้อมกัน ชุดพัฒนาซอฟต์แวร์ (Software Development Kit) นี้เป็นส่วนประกอบสำคัญที่ออกแบบมาโดยเฉพาะเพื่อเสริมศักยภาพให้นักพัฒนาสามารถสร้างเอเจนต์ AI ที่ปรับแต่งเองได้ โดยใช้ประโยชน์จากความสามารถหลักของ Nova Act โดยเฉพาะอย่างยิ่งคุณลักษณะการโต้ตอบกับเบราว์เซอร์
Rohit Prasad รองประธานอาวุโสฝ่าย Amazon Artificial General Intelligence ได้อธิบายวิสัยทัศน์เบื้องหลังการเคลื่อนไหวนี้ว่า: “Nova.amazon.com นำพลังของความฉลาดระดับแนวหน้าของ Amazon มาไว้ในมือของนักพัฒนาและผู้ที่ชื่นชอบเทคโนโลยีทุกคน ทำให้การสำรวจความสามารถของ Amazon Nova ง่ายกว่าที่เคย” คำกล่าวนี้เน้นย้ำถึงกลยุทธ์ของ Amazon: ไม่เพียงแต่สร้างเอเจนต์ที่ทรงพลังเพียงตัวเดียว แต่ยังส่งเสริมระบบนิเวศทั้งหมดของเครื่องมือ AI เฉพาะทางที่สร้างขึ้นบนเทคโนโลยีพื้นฐานของพวกเขา
SDK เปิดประตูสู่แอปพลิเคชันที่เป็นไปได้มากมาย ซึ่งก้าวไปไกลกว่าตัวอย่างเบื้องต้นที่ Amazon ให้ไว้ นักพัฒนาสามารถสร้างบอทที่ปรับแต่งสำหรับงานเฉพาะทางได้อย่างมีทฤษฎี:
- การสั่งซื้ออัตโนมัติ: การออกแบบเอเจนต์ที่สามารถนำทางแพลตฟอร์มการจัดส่งอาหารที่ซับซ้อน หรือสั่งซื้อวัสดุสิ้นเปลืองที่ใช้บ่อยซ้ำโดยอัตโนมัติ
- การเดินทางและที่พัก: การสร้างบอทที่สามารถค้นหาเว็บไซต์ท่องเที่ยวหลายแห่ง เปรียบเทียบสิ่งอำนวยความสะดวกและราคาของโรงแรม และดำเนินการจองตามความต้องการของผู้ใช้ที่กำหนดไว้ล่วงหน้า
- การป้อนข้อมูลและการกรอกแบบฟอร์ม: การทำให้กระบวนการกรอกแบบฟอร์มออนไลน์ ใบสมัคร หรือแบบสำรวจที่มักน่าเบื่อเป็นไปโดยอัตโนมัติด้วยความแม่นยำและความเร็ว
- การจัดการปฏิทิน: การสร้างเอเจนต์ที่สามารถสแกนอีเมลหรือข้อความอย่างชาญฉลาดเพื่อหารายละเอียดกิจกรรม และเพิ่มการนัดหมาย การแจ้งเตือน หรือกำหนดเวลาลงในปฏิทินดิจิทัลของผู้ใช้โดยอัตโนมัติ
- การวิเคราะห์คู่แข่ง: การพัฒนาเครื่องมือสำหรับธุรกิจที่สามารถตรวจสอบเว็บไซต์ของคู่แข่งเพื่อดูการเปลี่ยนแปลงราคา การอัปเดตผลิตภัณฑ์ หรือกิจกรรมส่งเสริมการขาย
- การรวบรวมข้อมูลส่วนบุคคล: การสร้างเอเจนต์ที่ค้นหาเว็บเพื่อหาข่าวสาร บทความ หรือเอกสารวิจัยที่เกี่ยวข้องกับความสนใจเฉพาะหรือสาขาวิชาชีพของผู้ใช้ โดยรวบรวมข้อมูลอย่างมีประสิทธิภาพ
ด้วยการจัดหา SDK นั้น Amazon กำลังเชิญชวนนักพัฒนาให้นำเสนอนวัตกรรมบน Nova Act ซึ่งอาจนำไปสู่การแพร่กระจายของเอเจนต์ AI บนเบราว์เซอร์ที่ออกแบบมาสำหรับแอปพลิเคชันเฉพาะกลุ่มนับไม่ถ้วนในอุตสาหกรรมต่างๆ แนวทางนี้ไม่เพียงแต่เร่งการสำรวจศักยภาพของ Nova Act เท่านั้น แต่ยังช่วยเสริมความแข็งแกร่งให้กับตำแหน่งของ Amazon ในภูมิทัศน์ AI ที่มีการแข่งขันสูงด้วยการสร้างชุมชนรอบเทคโนโลยีของตน
จุดกำเนิด: Amazon AGI SF Lab
ศูนย์กลางการพัฒนาที่อยู่เบื้องหลังโมเดล Nova Act คือ Amazon AGI SF Lab ซึ่งตั้งอยู่ในทำเลที่ยอดเยี่ยมใน San Francisco, California ห้องปฏิบัติการนี้แสดงถึงความพยายามที่มุ่งเน้นโดย Amazon ในการรวบรวมผู้มีความสามารถระดับสูงในด้านปัญญาประดิษฐ์ ภารกิจที่ชัดเจนคือการนำผู้เชี่ยวชาญและวิศวกร AI ชั้นนำมารวมกันโดยมีเป้าหมายเดียวคือการสร้างโมเดล AI พื้นฐานที่ล้ำสมัย
ความเป็นผู้นำของ AGI SF Lab บ่งบอกถึงความมุ่งมั่นของ Amazon ได้เป็นอย่างดี นำโดยบุคคลสำคัญที่เคยดำรงตำแหน่งสำคัญที่ OpenAI ได้แก่ David Luan และ Pieter Abbeel ความเชี่ยวชาญของพวกเขา ซึ่งได้รับการฝึกฝนจากหนึ่งในองค์กรวิจัย AI ชั้นนำของโลก ส่งสัญญาณถึงความตั้งใจของ Amazon ที่จะแข่งขันในระดับสูงสุดในการพัฒนาความสามารถด้านปัญญาประดิษฐ์ทั่วไปขั้นสูง การจัดตั้งห้องปฏิบัติการเฉพาะทางนี้ ซึ่งมีบุคลากรที่มีประสบการณ์ในอุตสาหกรรม เน้นย้ำว่า Nova Act ไม่ใช่โครงการที่แยกออกมา แต่เป็นส่วนหนึ่งของการผลักดันที่กว้างขวาง ได้รับทุนสนับสนุนอย่างดี และมีความสำคัญเชิงกลยุทธ์โดย Amazon สู่อนาคตของ AI
การลงทุนอย่างหนักนี้สะท้อนให้เห็นถึงการดำเนินการของยักษ์ใหญ่ด้านเทคโนโลยีรายใหญ่อื่นๆ แทบทุกราย การแข่งขันเพื่อพัฒนาและปรับใช้ AI ที่เหนือกว่ากำลังดำเนินไปอย่างเต็มที่ ซึ่งถูกมองว่าเป็นพื้นฐานสำหรับการเติบโต ประสิทธิภาพ และความได้เปรียบทางการแข่งขันในอนาคตในภาคส่วนต่างๆ Nova Act ซึ่งเปิดตัวครั้งแรกในเชิงแนวคิดเมื่อปลายปีที่แล้วในฐานะส่วนหนึ่งของพอร์ตโฟลิโอโมเดล AI ที่กำลังเติบโตของ Amazon กำลังปรากฏเป็นแพลตฟอร์มที่จับต้องได้ ซึ่งแสดงให้เห็นถึงความก้าวหน้าที่เกิดขึ้นภายในหน่วยงานเฉพาะทางเช่น AGI SF Lab
การนำทางในสนามแข่งที่แออัด: การผงาดขึ้นของเอเจนต์อัตโนมัติ
Nova Act ของ Amazon ไม่ได้เข้าสู่ตลาดในสุญญากาศ มันเข้าร่วมกับสาขาที่ขยายตัวอย่างรวดเร็วของเอเจนต์ AI ที่ออกแบบมาสำหรับการทำงานอัตโนมัติหรือกึ่งอัตโนมัติ โดยเฉพาะอย่างยิ่งที่เกี่ยวข้องกับการโต้ตอบบนเว็บ การประกาศดังกล่าวเกิดขึ้นหลังจากความคิดริเริ่มจากคู่แข่งไม่นาน โดยเฉพาะอย่างยิ่ง ผู้นำด้าน AI อย่าง OpenAI เองก็ได้เปิดตัว Operator ในเดือนมกราคม ซึ่งอธิบายว่าเป็นแชทบอทอัตโนมัติที่มีความสามารถในการท่องเว็บโดยไม่ต้องมีการดูแลจากมนุษย์อย่างต่อเนื่อง
แนวโน้มไปสู่เอเจนต์ที่สามารถนำทางและโต้ตอบกับโลกดิจิทัลได้อย่างอิสระนี้ บ่งบอกถึงวิวัฒนาการที่สำคัญในการประยุกต์ใช้ AI แชทบอทรุ่นแรกๆ เป็นอินเทอร์เฟซการสนทนาเป็นหลัก ซึ่งจำกัดอยู่เพียงการประมวลผลข้อมูลที่ให้มา หรือการดึงข้อมูลผ่าน API ที่จำกัด เอเจนต์อย่าง Nova Act และ Operator แสดงถึงการเคลื่อนไหวไปสู่ AI ที่สามารถ ดำเนินการ ภายในสภาพแวดล้อมเดียวกันกับที่มนุษย์ใช้ในชีวิตประจำวัน นั่นคือ เว็บเบราว์เซอร์ที่เข้าถึงข้อมูลและฟังก์ชันการทำงานที่กว้างใหญ่และไม่มีโครงสร้างของอินเทอร์เน็ต
ความสามารถนี้เปิดโอกาสอันยิ่งใหญ่สำหรับระบบอัตโนมัติและประสิทธิภาพ แต่ก็ทำให้เกิดคำถามที่สำคัญเช่นกัน เอเจนต์เหล่านี้จะจัดการกับเว็บไซต์ที่ซับซ้อนและเปลี่ยนแปลงตลอดเวลาได้อย่างไร จะเกิดอะไรขึ้นเมื่อพวกเขาพบข้อผิดพลาดที่ไม่คาดคิดหรือข้อความแจ้งเตือนด้านความปลอดภัย ผู้ใช้จะแน่ใจได้อย่างไรว่าเอเจนต์กำลังดำเนินการเพื่อประโยชน์สูงสุดของตน โดยเฉพาะอย่างยิ่งเมื่อเกี่ยวข้องกับธุรกรรมทางการเงิน การพัฒนากลไกการควบคุมที่แข็งแกร่ง บันทึกการปฏิบัติงานที่โปร่งใส และโปรโตคอลความปลอดภัยที่เชื่อถือได้ จะมีความสำคัญอย่างยิ่งเมื่อเทคโนโลยีเหล่านี้เติบโตเต็มที่ การแข่งขันระหว่าง Amazon, OpenAI, Google, Microsoft และอื่นๆ ในพื้นที่นี้มีแนวโน้มที่จะเร่งสร้างนวัตกรรม ผลักดันขอบเขตของสิ่งที่เอเจนต์อัตโนมัติสามารถทำได้ ในขณะเดียวกันก็บังคับให้อุตสาหกรรมต้องเผชิญกับความท้าทายที่เกี่ยวข้อง การพัฒนา Nova Act SDK โดยเฉพาะอย่างยิ่ง อาจถูกมองว่าเป็นกลยุทธ์ของ Amazon ในการสร้างความแตกต่างด้วยการเปิดใช้งานการสร้างเอเจนต์ที่ปรับแต่งเอง แทนที่จะเสนอเพียงเอเจนต์เดียวที่เป็นเสาหลัก