Amazon บุกเบิก AI: Nova Platform และระบบอัตโนมัติบนเบราว์เซอร์

ภูมิทัศน์ของปัญญาประดิษฐ์ (AI) ที่พัฒนาอย่างรวดเร็วทำให้ยักษ์ใหญ่ด้านเทคโนโลยีต่างแข่งขันกันอย่างต่อเนื่อง เพื่อทำให้ทุกคนเข้าถึงได้ง่ายขึ้นพร้อมกับผลักดันขีดความสามารถให้สูงขึ้น Amazon ซึ่งเป็นกำลังสำคัญในด้านคลาวด์คอมพิวติ้งและอีคอมเมิร์ซ ได้ขยายบทบาทด้าน Generative AI อย่างมีนัยสำคัญ ล่าสุดบริษัทได้เปิดตัว nova.amazon.com ซึ่งเป็นพอร์ทัลเฉพาะที่ออกแบบมาเพื่อปรับปรุงการโต้ตอบของนักพัฒนากับ Foundation Models อันทรงพลังของบริษัท โครงการริเริ่มนี้เกิดขึ้นพร้อมกับการเปิดตัวเครื่องมือที่น่าสนใจเป็นพิเศษ: Amazon Nova Act ซึ่งเป็นโมเดล AI ที่ได้รับการฝึกฝนอย่างพิถีพิถันเพื่อนำทางและทำงานต่างๆ โดยตรงภายในเว็บเบราว์เซอร์ ซึ่งเป็นสัญญาณบ่งบอกถึงระยะใหม่ของการโต้ตอบบนเว็บแบบอัตโนมัติ

เปิดประตู: เกตเวย์นักพัฒนา Nova

การเปิดตัว nova.amazon.com อย่างมีกลยุทธ์ของ Amazon เป็นมากกว่าแค่ที่อยู่เว็บใหม่ แต่ยังสะท้อนถึงความพยายามร่วมกันในการลดอุปสรรคสำหรับนักพัฒนาที่กระตือรือร้นที่จะสำรวจและใช้ประโยชน์จาก AI ที่ซับซ้อน ก่อนหน้าแพลตฟอร์มนี้ การเข้าถึง Foundation Models ชั้นนำของ Amazon ซึ่งจัดแสดงครั้งแรกในงาน re:Invent 2024 มักจะต้องเกี่ยวข้องกับการนำทางผ่านระบบนิเวศที่กว้างขวางและซับซ้อนมากขึ้นของบริการ AWS โดยเฉพาะ Amazon Bedrock แม้ว่า Bedrock จะยังคงเป็นขุมพลังสำหรับการปรับขนาดและปรับใช้แอปพลิเคชัน AI ระดับองค์กร แต่ nova.amazon.com ทำหน้าที่เป็นสนามทดสอบที่เข้าถึงได้ เป็นห้องปฏิบัติการดิจิทัลที่การทดลองสามารถเฟื่องฟูได้โดยมีแรงเสียดทานน้อยลง

พอร์ทัลใหม่นี้เชิญชวนนักพัฒนา นักวิจัย และผู้ที่ชื่นชอบ AI ที่ดำเนินงานภายในสหรัฐอเมริกาให้เข้ามามีส่วนร่วมโดยตรงกับ ตระกูลโมเดล Nova ชุดนี้แสดงถึงความสามารถที่หลากหลายของ Amazon ในด้าน Generative AI:

  • Nova Text Models (Micro, Lite, Pro): นำเสนอความสามารถในการสร้างข้อความที่หลากหลาย โมเดลเหล่านี้น่าจะตอบสนองความต้องการที่แตกต่างกัน ตั้งแต่งานที่รวดเร็วและน้ำหนักเบา (Micro, Lite) ที่เหมาะสำหรับแชทบอทหรือการสรุปเนื้อหา ไปจนถึงการให้เหตุผลที่ซับซ้อน การสร้างเนื้อหาขนาดยาว และความเข้าใจที่ละเอียดอ่อนซึ่งจำเป็นสำหรับแอปพลิเคชันที่ซับซ้อน (Pro) แนวทางแบบแบ่งระดับช่วยให้นักพัฒนาสามารถเลือกความสมดุลที่เหมาะสมระหว่างประสิทธิภาพ ต้นทุน และความซับซ้อนสำหรับกรณีการใช้งานเฉพาะของตน การทดลองผ่าน nova.amazon.com ช่วยให้สามารถสร้างต้นแบบและประเมินผลได้อย่างรวดเร็วก่อนที่จะตัดสินใจปรับใช้ในขนาดที่ใหญ่ขึ้น
  • Nova Canvas: โมเดลนี้มุ่งเน้นไปที่ การสร้างภาพ โดยตอบสนองความสนใจอย่างมากเกี่ยวกับการสร้างสรรค์ภาพที่ขับเคลื่อนด้วย AI นักพัฒนาสามารถสำรวจศักยภาพในการสร้างสื่อการตลาด คอนเซ็ปต์อาร์ต การแสดงภาพผลิตภัณฑ์ หรือสินทรัพย์ดิจิทัลที่ไม่เหมือนใคร ทดสอบพรอมต์และปรับแต่งผลลัพธ์โดยตรงผ่านแพลตฟอร์ม
  • Nova Reel: ตอบสนองต่อสาขา การสร้างวิดีโอ ที่กำลังเติบโต Nova Reel ช่วยให้ผู้ใช้สามารถทดลองสร้างลำดับวิดีโอสั้นๆ จากพรอมต์ข้อความหรืออินพุตอื่นๆ ที่อาจเกิดขึ้นได้ สิ่งนี้เปิดช่องทางสำหรับการสร้างเนื้อหาแบบไดนามิก การส่งข้อความส่วนบุคคล และรูปแบบการเล่าเรื่องที่เป็นนวัตกรรมใหม่

คุณค่าหลักของ nova.amazon.com อยู่ที่ความรวดเร็วในการเข้าถึง มันมีสภาพแวดล้อมแบบ Sandbox ที่นักพัฒนาสามารถทดสอบสมมติฐาน ทำความเข้าใจพฤติกรรมของโมเดล และประเมินความเป็นไปได้ในการรวมความสามารถ AI ขั้นสูงเหล่านี้เข้ากับโครงการของตน ก่อน ที่จะเข้าไปเกี่ยวข้องกับโครงสร้างพื้นฐานที่กว้างขวางขึ้นและต้นทุนที่อาจเกิดขึ้นซึ่งเกี่ยวข้องกับการปรับใช้บนคลาวด์เต็มรูปแบบบนบริการต่างๆ เช่น Bedrock นับเป็นความเคลื่อนไหวเชิงกลยุทธ์เพื่อส่งเสริมชุมชนแห่งนวัตกรรมรอบๆ AI ของ Amazon ดึงดูดความสนใจของนักพัฒนาตั้งแต่ช่วงเริ่มต้นของกระบวนการสร้างแนวคิด

ขอแนะนำ Nova Act: AI ควบคุมเบราว์เซอร์

บางทีองค์ประกอบที่โดดเด่นที่สุดของการประกาศนี้คือ Amazon Nova Act นำเสนอในรูปแบบ Early Research Preview ที่เข้าถึงได้ผ่าน Software Development Kit (SDK) โดยเฉพาะ Nova Act ก้าวเข้าสู่ขอบเขตของระบบอัตโนมัติบนเบราว์เซอร์ที่ขับเคลื่อนด้วย AI นี่ไม่ใช่แค่การกรอกแบบฟอร์มหรือคลิกปุ่มตามสคริปต์ที่ตายตัว Nova Act ได้รับการออกแบบด้วยระดับความฉลาดที่สูงขึ้น โดยมีเป้าหมายเพื่อทำความเข้าใจและดำเนินงานที่ซับซ้อนและหลายขั้นตอนภายในสภาพแวดล้อมแบบไดนามิกของเว็บเบราว์เซอร์

ลองนึกถึงความแตกต่างระหว่าง Robotic Process Automation (RPA) แบบดั้งเดิม ซึ่งมักจะอาศัยตัวเลือกและเวิร์กโฟลว์ที่กำหนดไว้ล่วงหน้าซึ่งเปราะบางต่อการเปลี่ยนแปลงของเว็บไซต์ กับ Agent ที่สามารถตีความ เจตนา เบื้องหลังงานได้ Nova Act มุ่งมั่นที่จะเป็นอย่างหลัง Amazon แนะนำว่ามันสามารถแยกแยะวัตถุประสงค์ที่ซับซ้อน เช่น การค้นคว้าและจองการเดินทางหลายช่วง การจัดการการสมัครสมาชิกออนไลน์บนแพลตฟอร์มต่างๆ หรือการรวบรวมข้อมูลจากแหล่งเว็บต่างๆ ให้เป็นลำดับของการดำเนินการที่เล็กลงและดำเนินการได้ มันเรียนรู้ที่จะโต้ตอบกับองค์ประกอบของเว็บ (ปุ่ม แบบฟอร์ม เมนู) ตามบริบท ซึ่งอาจปรับให้เข้ากับการเปลี่ยนแปลงเลย์เอาต์เล็กน้อยที่จะทำลายสคริปต์อัตโนมัติที่ง่ายกว่า

Shubham Katiyar ผู้อำนวยการที่มุ่งเน้นด้าน Generative Artificial Intelligence ที่ Amazon ได้วางกรอบความสำคัญของการพัฒนานี้ไว้อย่างชัดเจน:

‘นี่แสดงถึง การเปลี่ยนแปลงขั้นพื้นฐาน ในวิธีการทำงานของ AI Agent ในสภาพแวดล้อมดิจิทัล ทำให้สามารถดำเนินการงานบนเว็บที่ซับซ้อนได้อย่างน่าเชื่อถือ ตั้งแต่การส่งแบบฟอร์มไปจนถึงการจัดการปฏิทินด้วย ความแม่นยำที่ไม่เคยมีมาก่อน

การเน้นย้ำถึง ‘การเปลี่ยนแปลงขั้นพื้นฐาน’ และ ‘ความแม่นยำที่ไม่เคยมีมาก่อน’ เน้นย้ำถึงความทะเยอทะยานของ Amazon สำหรับ Nova Act มันไม่ได้ถูกวางตำแหน่งให้เป็นการปรับปรุงเพียงเล็กน้อย แต่เป็นการก้าวกระโดดในการสร้าง Agent อัตโนมัติที่สามารถนำทางความซับซ้อนของเว็บสมัยใหม่ได้อย่างน่าเชื่อถือ

เสริมศักยภาพนักพัฒนา: Nova Act SDK

เครื่องมือที่ช่วยให้นักพัฒนาสามารถควบคุมความสามารถในการทำงานอัตโนมัติของเบราว์เซอร์นี้คือ Amazon Nova Act SDK ซึ่งนำเสนอในเบื้องต้นในรูปแบบ Early Research Preview โดย SDK มีเครื่องมือในการสร้างและปรับแต่ง AI Agent ที่นำทางเว็บเหล่านี้ คุณสมบัติหลักคือการรองรับการควบคุมและการปรับปรุงอย่างละเอียดผ่าน โค้ด Python สิ่งนี้ช่วยให้นักพัฒนาสามารถก้าวข้ามคำสั่งที่ใช้พรอมต์ง่ายๆ และผสานตรรกะที่ซับซ้อนเข้ากับการทำงานของ Agent ได้

SDK อำนวยความสะดวกในการพัฒนาที่สำคัญหลายประการ:

  • การแยกย่อยงาน: นักพัฒนาสามารถแนะนำ AI ในการแบ่งเป้าหมายใหญ่ออกเป็นงานย่อยที่จัดการได้ ซึ่งช่วยปรับปรุงความน่าเชื่อถือและทำให้กระบวนการโปร่งใสมากขึ้น
  • การแทรกโค้ดที่กำหนดเอง: ความสามารถในการแทรกโค้ด Python ช่วยให้:
    • การทดสอบ: การใช้การตรวจสอบในขั้นตอนต่างๆ เพื่อให้แน่ใจว่า Agent ทำงานตามที่คาดไว้
    • Breakpoints: การหยุดการทำงานชั่วคราว ณ จุดเฉพาะเพื่อการดีบักและการตรวจสอบ ซึ่งมีความสำคัญต่อการทำความเข้าใจพฤติกรรมของ Agent
    • Assertions: การกำหนดเงื่อนไขที่ต้องเป็นจริงเพื่อให้กระบวนการดำเนินต่อไป เพิ่มชั้นของการตรวจสอบความถูกต้อง
    • Thread Pooling สำหรับ Parallelization: ทำให้ Agent สามารถจัดการการดำเนินการหรืออินสแตนซ์ของเบราว์เซอร์หลายรายการพร้อมกันได้ ซึ่งช่วยเร่งเวิร์กโฟลว์ที่ซับซ้อนได้อย่างมาก

ระดับของการบูรณาการนี้ชี้ให้เห็นว่า Amazon มองว่า Nova Act ไม่ใช่แค่เครื่องมือสำหรับผู้ใช้ปลายทางเท่านั้น แต่ยังเป็นองค์ประกอบที่ทรงพลังสำหรับนักพัฒนาที่สร้างโซลูชันอัตโนมัติที่ซับซ้อน SDK มี Hooks ที่จำเป็นในการสร้าง AI Agent ที่แข็งแกร่ง ทดสอบได้ และอาจปรับขนาดได้ ซึ่งปรับให้เหมาะกับกระบวนการทางธุรกิจหรือความต้องการของผู้ใช้โดยเฉพาะ

การนำทาง: การเปิดเผยข้อมูลและข้อควรพิจารณา

ด้วยพลังอันยิ่งใหญ่มาพร้อมกับความจำเป็นในการจัดการอย่างระมัดระวัง Amazon มีความโปร่งใสอย่างน่ายกย่องเกี่ยวกับสถานะปัจจุบันและข้อจำกัดของ Nova Act โดยเน้นย้ำถึง ลักษณะการทดลอง ในฐานะ ‘Early Research Preview’ ผู้ใช้และนักพัฒนาได้รับการเตือนอย่างชัดเจนว่าพวกเขามีหน้าที่รับผิดชอบในการดูแลการกระทำของ Agent

การเปิดเผยข้อมูลที่สำคัญหลายประการควรค่าแก่การให้ความสนใจ:

  • โอกาสเกิดข้อผิดพลาด: AI ไม่ใช่สิ่งที่ไม่มีข้อผิดพลาด Nova Act อาจทำผิดพลาด ในการตีความคำสั่งหรือโต้ตอบกับองค์ประกอบของเว็บ การตรวจสอบและการยืนยันอย่างต่อเนื่องมีความสำคัญอย่างยิ่ง โดยเฉพาะอย่างยิ่งในช่วงการวิจัยนี้
  • การรวบรวมข้อมูล: เพื่อปรับปรุงโมเดล Amazon รวบรวมข้อมูลการโต้ตอบ ซึ่งรวมถึง พรอมต์ ที่ผู้ใช้ให้มา และที่สำคัญคือ ภาพหน้าจอ ที่ถ่ายระหว่างการทำงานของ Agent สิ่งนี้เน้นย้ำถึงกลไกการเรียนรู้ของระบบ แต่ก็ทำให้เกิดข้อกังวลด้านความเป็นส่วนตัวที่สำคัญเช่นกัน
  • ข้อควรระวังด้านความปลอดภัย: นักพัฒนาได้รับการแนะนำอย่างยิ่งว่า อย่าแชร์ API keys ของตน นอกจากนี้ ไม่แนะนำให้ป้อนข้อมูลส่วนบุคคลหรือข้อมูลทางการเงินที่ละเอียดอ่อนในขณะที่ Nova Act ทำงานอยู่ เนื่องจากข้อมูลนี้ อาจถูกจับภาพในภาพหน้าจอ นี่เป็นคำเตือนที่สำคัญ เนื่องจาก Agent มีปฏิสัมพันธ์โดยตรงกับแบบฟอร์มและหน้าเว็บที่อาจมีความละเอียดอ่อน
  • ข้อควรระวังด้านความปลอดภัย: นักพัฒนาได้รับการแนะนำอย่างยิ่งว่า อย่าแชร์ API keys ของตน นอกจากนี้ ไม่แนะนำให้ป้อนข้อมูลส่วนบุคคลหรือข้อมูลทางการเงินที่ละเอียดอ่อนในขณะที่ Nova Act ทำงานอยู่ เนื่องจากข้อมูลนี้ อาจถูกจับภาพในภาพหน้าจอ นี่เป็นคำเตือนที่สำคัญ เนื่องจาก Agent มีปฏิสัมพันธ์โดยตรงกับแบบฟอร์มและหน้าเว็บที่อาจมีความละเอียดอ่อน

ข้อควรระวังเหล่านี้มีความสำคัญอย่างยิ่ง แม้ว่าศักยภาพของ Nova Act จะน่าตื่นเต้น แต่การใช้งานในปัจจุบันจำเป็นต้องใช้อย่างระมัดระวังและรอบรู้ ลักษณะการรวบรวมข้อมูล โดยเฉพาะอย่างยิ่งการจับภาพหน้าจอ จำเป็นต้องพิจารณาอย่างรอบคอบเกี่ยวกับงานที่มอบหมายให้กับ Agent และสภาพแวดล้อมที่ทำงานอยู่ อย่างไรก็ตาม การวางกรอบอย่างมีความรับผิดชอบนี้ยังสร้างความไว้วางใจด้วยการตั้งความคาดหวังที่เป็นจริงในช่วงระยะการพัฒนาของเครื่องมือ

เสียงตอบรับในอุตสาหกรรม: ความกระตือรือร้นพบกับความระมัดระวัง

การประกาศดังกล่าวได้สร้างความสนใจอย่างมากในชุมชนเทคโนโลยีและนักพัฒนาตามที่คาดการณ์ไว้ โอกาสในการเข้าถึงโมเดล AI ระดับแนวหน้าได้ง่ายขึ้นและเครื่องมือใหม่ๆ เช่น Nova Act เป็นสิ่งที่ดึงดูดใจอย่างมาก

Wesley Kurosawa ซึ่งระบุว่าเป็นนักวิเคราะห์ข้อมูลทางธุรกิจ ได้แสดงความรู้สึกในแง่ดีที่แพร่หลายในหมู่นักพัฒนาจำนวนมาก:

‘ข่าวที่น่าทึ่งอย่างยิ่งจาก Amazon! ด้วย nova.amazon.com ตอนนี้เราสามารถเข้าถึงโมเดล AI ที่ล้ำสมัยได้โดยตรงและทดลองกับความสามารถด้านปัญญาระดับแนวหน้าที่ก่อนหน้านี้เข้าไม่ถึง นี่เป็นเครื่องมือที่ยอดเยี่ยมสำหรับนักพัฒนาเช่นเราในการทดสอบแนวคิดอย่างรวดเร็วแล้วปรับขนาดผ่าน Amazon Bedrock ความสามารถในการสร้าง Web Agent ด้วย Nova Act SDK เปิดโอกาสใหม่ๆ สำหรับระบบอัตโนมัติและความช่วยเหลือ Amazon ได้ทำให้การเข้าถึง AI ขั้นสูงเป็นประชาธิปไตยอย่างแท้จริง—รอไม่ไหวที่จะเริ่มสร้างด้วยมัน!’

ปฏิกิริยาของ Kurosawa เน้นย้ำถึงประโยชน์ที่รับรู้ได้ที่สำคัญ: การทำให้เป็นประชาธิปไตย ของ AI ขั้นสูง ประโยชน์ของ nova.amazon.com ในฐานะ แพลตฟอร์มสร้างต้นแบบอย่างรวดเร็ว และศักยภาพที่ปลดปล่อยโดย Nova Act SDK สำหรับการสร้างโซลูชันอัตโนมัติและความช่วยเหลือแบบใหม่ เส้นทางที่ราบรื่นจากการทดลองบน nova.amazon.com ไปสู่การปรับใช้ขนาดใหญ่บน Amazon Bedrock ถูกมองว่าเป็นข้อได้เปรียบที่สำคัญ

อย่างไรก็ตาม ความสามารถเฉพาะตัวของ Nova Act ยังจุดประกายการถกเถียงและก่อให้เกิดคำถามที่เกี่ยวข้อง ความสามารถในการนำทางและโต้ตอบกับเว็บไซต์ในลักษณะที่อาจเร็วกว่าและซับซ้อนกว่าพฤติกรรมของมนุษย์ทั่วไปได้นำไปสู่ความกังวล โดยเฉพาะอย่างยิ่งเกี่ยวกับวิธีที่เว็บไซต์อาจรับรู้กิจกรรมของมัน ผู้ใช้รายหนึ่งบน Reddit ได้แสดงความกังวลนี้:

‘น่าสนใจมาก ทั้งหมดนี้ทำให้ฉันคิดว่าบางเว็บไซต์อาจมองว่ามันเป็นเทคนิค Web Scraping เนื่องจากมันอาจเร็วเกินไปที่จะถือว่าเป็นกิจกรรมปกติของมนุษย์ ฉันแน่ใจว่านี่จะเป็นช่วงเวลาที่น่าสนใจมาก ที่ซึ่งเส้นแบ่งระหว่าง Web Scraping และการใช้งานปกติจะทับซ้อนกัน’

ความคิดเห็นนี้กล่าวถึงความท้าทายที่เกิดขึ้นใหม่ที่สำคัญ Web Scraping การดึงข้อมูลอัตโนมัติจากเว็บไซต์ มักจะดำเนินการในพื้นที่สีเทา บางครั้งละเมิดข้อกำหนดในการให้บริการและอาจทำให้เซิร์ฟเวอร์ทำงานหนักเกินไป AI Agent ขั้นสูงเช่น Nova Act แม้จะมีจุดประสงค์เพื่อการดำเนินงานมากกว่าการเก็บเกี่ยวข้อมูลจำนวนมาก อาจแสดงรูปแบบการท่องเว็บที่ยากต่อการแยกแยะจากบอท Scraping ที่ก้าวร้าว

การเบลอเส้นแบ่ง ที่อาจเกิดขึ้นระหว่างความช่วยเหลืออัตโนมัติที่ถูกต้องตามกฎหมายและเทคนิค Scraping ที่ต้องห้ามนำเสนอความท้าทายหลายประการ:

  1. การตรวจจับ: ผู้ดูแลเว็บไซต์จะแยกความแตกต่างระหว่าง Agent ของ Nova Act ที่ทำงานตามคำขอของผู้ใช้อย่างถูกต้องตามกฎหมาย (เช่น การจองเที่ยวบิน) กับบอทที่ Scraping ราคาเที่ยวบินจำนวนมากได้อย่างไร กลไกการตรวจจับอาจต้องมีความซับซ้อนมากขึ้นอย่างมีนัยสำคัญ ก้าวข้ามการจำกัดอัตรา IP หรือ CAPTCHA แบบง่ายๆ
  2. การปรับใช้นโยบาย: ข้อกำหนดในการให้บริการของเว็บไซต์อาจต้องมีการแก้ไขเพื่อระบุถึงการใช้ AI Agent ขั้นสูงอย่างชัดเจน จะได้รับอนุญาต จำกัด หรือต้องการการเข้าถึง API เฉพาะหรือไม่?
  3. การใช้งานอย่างมีจริยธรรม: นักพัฒนาที่ใช้ Nova Act จะต้องคำนึงถึงภาระที่พวกเขาวางบนเว็บไซต์และเคารพคำสั่ง robots.txt และข้อกำหนดในการให้บริการ แม้ว่า Agent จะสามารถข้ามข้อจำกัดบางอย่างทางเทคนิคได้ก็ตาม การใช้งานอย่างมีความรับผิดชอบจะเป็นสิ่งสำคัญยิ่งในการป้องกันการต่อต้านเทคโนโลยี
  4. ศักยภาพการแข่งขันทางอาวุธ: การพัฒนา Agent ที่ซับซ้อนอาจกระตุ้นให้เกิดการพัฒนาการป้องกันต่อต้าน Agent ที่ซับซ้อนไม่แพ้กัน ซึ่งนำไปสู่เกมแมวจับหนูทางเทคโนโลยีอย่างต่อเนื่อง

‘ช่วงเวลาที่น่าสนใจ’ ที่ผู้ใช้ Reddit คาดการณ์ไว้นั้นดูเหมือนจะแน่นอน เนื่องจากระบบนิเวศของเว็บต้องต่อสู้กับผลกระทบของ AI Agent ที่สามารถโต้ตอบได้เหมือนมนุษย์ (หรือเหนือมนุษย์)

มองไปข้างหน้า: ทิศทาง AI ของ Amazon

ความมุ่งมั่นของ Amazon ต่อ AI ขยายไปไกลกว่าการประกาศในปัจจุบันเหล่านี้ บริษัทได้ส่งสัญญาณถึงความพยายามอย่างต่อเนื่องในการ ปรับปรุงโมเดลที่มีอยู่ โดยมุ่งเน้นที่การเพิ่ม ความแม่นยำ ความสามารถในการให้เหตุผล และประโยชน์โดยรวม วงจรการปรับปรุงแบบวนซ้ำนี้เป็นแนวปฏิบัติมาตรฐานในสาขา AI ที่มีการแข่งขันสูง เพื่อให้แน่ใจว่าโมเดลยังคงล้ำสมัยอยู่เสมอ

นอกจากนี้ Amazon กำลังก้าวเข้าสู่ขอบเขตการโต้ตอบ AI ที่ละเอียดอ่อนยิ่งขึ้น:

  • เสียงที่กำหนดเอง: การสำรวจตัวเลือกสำหรับนักพัฒนาในการสร้าง เสียงที่กำหนดเอง สำหรับแอปพลิเคชัน AI เป็นเรื่องที่น่าสนใจ สิ่งนี้อาจนำไปสู่ประสบการณ์ผู้ใช้ที่เป็นส่วนตัวและสอดคล้องกับแบรนด์มากขึ้น อย่างไรก็ตาม มันยังมาพร้อมกับ ข้อควรพิจารณาด้านจริยธรรมและความปลอดภัย ที่สำคัญ ศักยภาพในการนำไปใช้ในทางที่ผิดในการสร้าง Deepfakes หรือการแอบอ้างบุคคลอื่นจำเป็นต้องมีมาตรการป้องกันที่แข็งแกร่งและความมุ่งมั่นอย่างแรงกล้าในการพัฒนาอย่างมีความรับผิดชอบ ซึ่ง Amazon ยอมรับอย่างชัดเจน
  • Multimodal AI: การลงทุนกำลังไหลเข้าสู่ Multimodal AI ซึ่งรวมความสามารถต่างๆ เข้าด้วยกันทั้งข้อความ เสียง รูปภาพ และวิดีโอ ลองนึกภาพผู้ช่วย AI ที่ไม่เพียงแต่เข้าใจคำสั่งเสียงเท่านั้น แต่ยังสามารถตีความภาพที่แสดงผ่านกล้อง สร้างภาพที่เกี่ยวข้อง และตอบสนองด้วยเสียงสังเคราะห์หรือวิดีโอ การบรรจบกันของรูปแบบต่างๆ นี้ให้คำมั่นสัญญาถึงประสบการณ์ AI ที่ซับซ้อน โต้ตอบได้ และรับรู้บริบทได้มากขึ้น ซึ่งอาจเปลี่ยนแปลงทุกอย่างตั้งแต่ผู้ช่วยเสมือนอย่าง Alexa ไปจนถึงแพลตฟอร์มการช็อปปิ้งออนไลน์และการสร้างเนื้อหา

ทิศทางในอนาคตเหล่านี้บ่งชี้ว่า nova.amazon.com และ Nova Act ไม่ใช่การเปิดตัวผลิตภัณฑ์ที่แยกจากกัน แต่เป็นขั้นตอนในกลยุทธ์ระยะยาวที่กว้างขึ้นเพื่อฝัง AI ขั้นสูงและหลากหลายมากขึ้นในระบบนิเวศอันกว้างใหญ่ของ Amazon และเสริมศักยภาพให้นักพัฒนาสร้างแอปพลิเคชันที่ขับเคลื่อนด้วย AI รุ่นต่อไป

เริ่มต้นใช้งาน: การเข้าถึงและความพร้อมใช้งาน

สำหรับตอนนี้ ประตูสู่เครื่องมือใหม่เหล่านี้ nova.amazon.com เปิดให้ ผู้ใช้ในสหรัฐอเมริกา ที่มีบัญชี Amazon ผ่านพอร์ทัลนี้ พวกเขาสามารถเริ่มทดลองกับโมเดลการสร้างข้อความและรูปภาพต่างๆ ของ Nova (Nova Micro, Lite, Pro, Canvas) และสมัครเพื่อเข้าถึง Research Preview ของ Nova Act SDK การเปิดตัวเบื้องต้นแบบควบคุมนี้ช่วยให้ Amazon สามารถรวบรวมข้อเสนอแนะ ตรวจสอบรูปแบบการใช้งาน และปรับปรุงข้อเสนอก่อนที่จะเปิดให้ใช้งานในวงกว้างขึ้น เป็นการวางตำแหน่งชุมชนนักพัฒนาในสหรัฐฯ ให้เป็นสนามทดสอบเบื้องต้นสำหรับความสามารถที่ล้ำสมัยเหล่านี้ ซึ่งเป็นการปูทางสำหรับการขยายตัวทั่วโลกในอนาคต การเดินทางสู่ระบบอัตโนมัติบนเบราว์เซอร์ที่ขับเคลื่อนด้วย AI และ Foundation Models ที่เข้าถึงได้ง่ายได้เริ่มต้นขึ้นแล้ว โดย Amazon ได้ปักธงอย่างมั่นคงในดินแดนใหม่ที่น่าตื่นเต้นนี้