Nvidia ได้เปิดตัวแพลตฟอร์ม NeMo อย่างเป็นทางการ ซึ่งเป็นชุดไมโครเซอร์วิสที่ออกแบบมาเพื่อปรับปรุงการพัฒนาระบบ AI agent ขั้นสูง แพลตฟอร์มนี้ ซึ่งประกาศเมื่อวันพุธที่ 23 เมษายน รองรับ large language models (LLMs) หลากหลาย และใช้กลไก “Data Flywheel” แนวทางที่เป็นนวัตกรรมนี้ช่วยให้ AI agent เรียนรู้อย่างต่อเนื่องจากประสบการณ์จริง ปรับปรุงประสิทธิภาพและความสามารถในการปรับตัว
องค์ประกอบหลักของแพลตฟอร์ม NeMo
แพลตฟอร์ม NeMo เป็นระบบนิเวศของไมโครเซอร์วิสที่เชื่อมต่อถึงกัน ซึ่งแต่ละไมโครเซอร์วิสได้รับการออกแบบมาเพื่อจัดการกับลักษณะเฉพาะของการพัฒนา AI agent องค์ประกอบเหล่านี้ทำงานร่วมกันเพื่อให้ผู้พัฒนามีชุดเครื่องมือที่แข็งแกร่งสำหรับการสร้างโซลูชัน AI ที่ซับซ้อน
NeMo Customizer: เร่งการปรับแต่ง LLM ให้ละเอียดยิ่งขึ้น
NeMo Customizer เป็นองค์ประกอบหลักที่ออกแบบมาเพื่อเร่งการปรับแต่ง large language models ให้ละเอียดยิ่งขึ้น ไมโครเซอร์วิสนี้ช่วยลดความซับซ้อนของกระบวนการปรับแต่ง LLM ให้เข้ากับงานหรือชุดข้อมูลเฉพาะ ทำให้ผู้พัฒนาสามารถบรรลุประสิทธิภาพสูงสุดโดยใช้ความพยายามน้อยที่สุด ด้วยการปรับปรุงกระบวนการปรับแต่งให้ละเอียดยิ่งขึ้น NeMo Customizer ช่วยลดเวลาและทรัพยากรที่จำเป็นในการปรับ LLM ให้เข้ากับแอปพลิเคชันต่างๆ
NeMo Evaluator: ลดความซับซ้อนของการประเมินแบบจำลอง AI และเวิร์กโฟลว์
NeMo Evaluator นำเสนอแนวทางที่คล่องตัวในการประเมินแบบจำลอง AI และเวิร์กโฟลว์ตามเกณฑ์มาตรฐานที่กำหนดเองและเฉพาะอุตสาหกรรม ไมโครเซอร์วิสนี้ช่วยให้ผู้พัฒนาสามารถประเมินประสิทธิภาพของ AI agent ได้อย่างรวดเร็ว ระบุจุดที่ต้องปรับปรุง และตรวจสอบให้แน่ใจว่าโซลูชันของตนเป็นไปตามมาตรฐานที่กำหนด ด้วย API เพียงห้าครั้ง ผู้พัฒนาจะได้รับข้อมูลเชิงลึกที่มีค่าเกี่ยวกับประสิทธิภาพของแบบจำลอง AI
NeMo Guardrails: เพิ่มความสอดคล้องและการป้องกัน
NeMo Guardrails ได้รับการออกแบบมาเพื่อเพิ่มความสอดคล้องและการป้องกันของระบบ AI โดยไม่ส่งผลกระทบต่อประสิทธิภาพอย่างมีนัยสำคัญ ไมโครเซอร์วิสนี้ช่วยให้มั่นใจได้ว่า AI agent ปฏิบัติตามหลักเกณฑ์ทางจริยธรรมและข้อกำหนดด้านกฎระเบียบ ลดความเสี่ยงของผลกระทบที่ไม่คาดฝัน ด้วยการเพิ่มเวลาแฝงเพียงครึ่งวินาที NeMo Guardrails สามารถปรับปรุงการป้องกันการปฏิบัติตามกฎระเบียบได้ถึง 1.4 เท่า
NeMo Retriever: อำนวยความสะดวกในการดึงข้อมูลความรู้
NeMo Retriever ช่วย AI agent ในการเข้าถึงและดึงข้อมูลที่ถูกต้องจากฐานข้อมูล ไมโครเซอร์วิสนี้ช่วยให้ AI agent สามารถค้นหาความรู้ที่ถูกต้องได้อย่างรวดเร็ว ปรับปรุงความสามารถในการตอบคำถาม แก้ปัญหา และตัดสินใจอย่างชาญฉลาด ด้วยการปรับปรุงกระบวนการดึงข้อมูลความรู้ NeMo Retriever ช่วยเพิ่มประสิทธิภาพโดยรวมของ AI agent
NeMo Curator: ฝึกอบรมแบบจำลอง Generative AI ที่มีความแม่นยำสูง
NeMo Curator ได้รับการออกแบบมาเพื่อฝึกอบรมแบบจำลอง generative AI ที่มีความแม่นยำสูง ไมโครเซอร์วิสนี้มอบเครื่องมือและทรัพยากรที่จำเป็นแก่ผู้พัฒนาในการสร้าง AI agent ที่สามารถสร้างข้อความ รูปภาพ และเนื้อหาประเภทอื่นๆ ที่สมจริงและสอดคล้องกัน ด้วยการเพิ่มประสิทธิภาพกระบวนการฝึกอบรม NeMo Curator ช่วยให้การพัฒนาโซลูชัน generative AI ที่ทันสมัย
กลไก Data Flywheel
Data Flywheel เป็นแนวคิดหลักในแพลตฟอร์ม NeMo ซึ่งออกแบบมาเพื่อให้การเรียนรู้อย่างต่อเนื่องและการปรับปรุงแบบจำลอง AI กลไกนี้สร้างวงจรป้อนกลับเชิงบวกที่ AI agent เรียนรู้จากปฏิสัมพันธ์กับสภาพแวดล้อม กลายเป็นอัจฉริยะและมีประสิทธิภาพมากขึ้นเมื่อเวลาผ่านไป
วงจรป้อนกลับเชิงบวก
Data Flywheel ทำงานผ่านวงจรต่อเนื่องของการโต้ตอบ การรวบรวมข้อมูล การประเมิน และการปรับแต่ง เมื่อ AI agent โต้ตอบกับผู้ใช้และสภาพแวดล้อม พวกเขาสร้างข้อมูลจำนวนมาก รวมถึงบันทึกการสนทนาและรูปแบบการใช้งาน ข้อมูลนี้จะถูกประมวลผลโดย NeMo Curator เพื่อระบุข้อมูลเชิงลึกและรูปแบบที่เกี่ยวข้อง NeMo Evaluator ประเมินประสิทธิภาพของ AI agent ระบุจุดที่โดดเด่นและจุดที่ต้องปรับปรุง สุดท้าย NeMo Customizer จะปรับแต่งแบบจำลองอย่างละเอียดตามการประเมินนี้ ปรับปรุงความถูกต้องและประสิทธิภาพ
การแทรกแซงจากมนุษย์น้อยที่สุดและความเป็นอิสระสูงสุด
Data Flywheel ได้รับการออกแบบมาให้ทำงานโดยมีการแทรกแซงจากมนุษย์น้อยที่สุดและความเป็นอิสระสูงสุด สิ่งนี้ช่วยให้ AI agent เรียนรู้และปรับปรุงอย่างต่อเนื่องโดยไม่ต้องมีการกำกับดูแลอย่างต่อเนื่อง ด้วยการทำให้กระบวนการเรียนรู้เป็นไปโดยอัตโนมัติ Data Flywheel ช่วยลดภาระของผู้พัฒนาและช่วยให้ AI agent ปรับตัวเข้ากับการเปลี่ยนแปลงเงื่อนไขและความต้องการของผู้ใช้
การรวมและการปรับใช้
แพลตฟอร์ม NeMo ได้รับการออกแบบมาให้รวมและปรับใช้ได้อย่างง่ายดายในโครงสร้างพื้นฐานการประมวลผลต่างๆ รวมถึงสภาพแวดล้อมภายในองค์กรและระบบคลาวด์ ความยืดหยุ่นนี้ช่วยให้องค์กรสามารถใช้ประโยชน์จากแพลตฟอร์มในวิธีที่เหมาะสมกับความต้องการและทรัพยากรของตนมากที่สุด
แพลตฟอร์มซอฟต์แวร์ Nvidia AI Enterprise
แพลตฟอร์ม NeMo ถูกปรับใช้บนแพลตฟอร์มซอฟต์แวร์ Nvidia AI Enterprise ซึ่งมีชุดเครื่องมือและทรัพยากรที่ครอบคลุมสำหรับการพัฒนาและปรับใช้แอปพลิเคชัน AI แพลตฟอร์มนี้ช่วยลดความซับซ้อนของกระบวนการจัดการและปรับขนาดโซลูชัน AI ช่วยให้องค์กรสามารถมุ่งเน้นไปที่นวัตกรรมและมูลค่าทางธุรกิจ
การดำเนินการบนโครงสร้างพื้นฐานการประมวลผลแบบเร่ง
NeMo สามารถดำเนินการได้บนโครงสร้างพื้นฐานการประมวลผลแบบเร่งใดๆ ช่วยให้องค์กรสามารถใช้ประโยชน์จากพลังของ GPU และฮาร์ดแวร์เฉพาะทางอื่นๆ เพื่อเพิ่มประสิทธิภาพของ AI agent ให้เหมาะสม สิ่งนี้ทำให้มั่นใจได้ว่า AI agent สามารถจัดการกับงานที่ซับซ้อนและชุดข้อมูลขนาดใหญ่ได้อย่างง่ายดาย
แอปพลิเคชันในโลกแห่งความเป็นจริง
แพลตฟอร์ม NeMo ได้รับการออกแบบมาเพื่อรองรับแอปพลิเคชันที่หลากหลายในอุตสาหกรรมต่างๆ องค์กรขนาดใหญ่อาจสร้าง AI agent หลายร้อยตัวที่มีฟังก์ชันการทำงานที่แตกต่างกัน เช่น การตรวจจับการฉ้อโกงโดยอัตโนมัติ ผู้ช่วยช็อปปิ้ง การบำรุงรักษาเครื่องจักรเชิงคาดการณ์ และการตรวจสอบเอกสาร
การนำไปใช้งานของ AT&T
AT&T ได้ร่วมมือกับ Arize และ Quantiphi เพื่อใช้ประโยชน์จาก NeMo ในการพัฒนา AI agent ขั้นสูงที่สามารถประมวลผลเอกสารความรู้ระดับองค์กรเกือบ 10,000 ฉบับที่อัปเดตทุกสัปดาห์ ด้วยการรวม NeMo Customizer และ Evaluator เข้าด้วยกัน AT&T ได้ปรับแต่ง Mistral 7B อย่างละเอียดเพื่อให้บรรลุการบริการลูกค้าที่เป็นส่วนตัว การป้องกันการฉ้อโกง และการเพิ่มประสิทธิภาพประสิทธิภาพเครือข่าย การนำไปใช้งานนี้ส่งผลให้ความแม่นยำในการตอบสนอง AI โดยรวมเพิ่มขึ้น 40%
การรองรับและการรวมโมเดลโอเพนซอร์ส
ไมโครเซอร์วิส NeMo รองรับโมเดลโอเพนซอร์สยอดนิยมต่างๆ รวมถึง Llama, Microsoft Phi, Google Gemma, Mistral และ Llama Nemotron Ultra สิ่งนี้ช่วยให้ผู้พัฒนาสามารถใช้ประโยชน์จากโมเดล AI ที่ดีที่สุดและปรับแต่งให้ตรงกับความต้องการเฉพาะของตน
การรวมของ Meta
Meta ได้รวม NeMo โดยการเพิ่มตัวเชื่อมต่อไปยัง Llamastack การรวมนี้ช่วยให้ผู้พัฒนาสามารถรวมความสามารถของ NeMo เข้ากับเวิร์กโฟลว์ AI ที่มีอยู่ได้อย่างราบรื่น
การรวมผู้ให้บริการซอฟต์แวร์ AI
ผู้ให้บริการซอฟต์แวร์ AI เช่น Cloudera, Datadog, Dataiku, DataRobot, DataStax, SuperAnnotate และ Weights & Biases ได้รวม NeMo เข้ากับแพลตฟอร์มของตน การรวมอย่างแพร่หลายนี้ทำให้ NeMo เข้าถึงได้สำหรับนักพัฒนาและองค์กรที่หลากหลาย