Nvidia Corp. ได้เปิดตัว NeMo microservices อย่างเป็นทางการ ซึ่งเป็นชุดเครื่องมือที่ครอบคลุมซึ่งได้รับการออกแบบอย่างพิถีพิถันเพื่อช่วยให้นักพัฒนาสามารถเร่งการปรับใช้เอเจนต์ปัญญาประดิษฐ์ที่ซับซ้อนได้ microservices เหล่านี้ได้รับการออกแบบมาเพื่อควบคุมพลังของการอนุมาน AI และระบบข้อมูลในวงกว้าง ซึ่งเป็นการก้าวกระโดดครั้งสำคัญในขอบเขตของระบบอัตโนมัติและประสิทธิภาพการทำงานที่ขับเคลื่อนด้วย AI
การเกิดขึ้นของ AI Agents: เพื่อนร่วมงานดิจิทัลในแรงงานยุคใหม่
AI agents กำลังเกิดขึ้นอย่างรวดเร็วในฐานะทรัพย์สินที่ขาดไม่ได้ในแรงงานยุคใหม่ ซึ่งพร้อมที่จะปฏิวัติวิธีการทำงานของพนักงานที่มีความรู้และบริการ เพื่อนร่วมงานดิจิทัลเหล่านี้ได้รับการออกแบบมาเพื่อผสานรวมเข้ากับเวิร์กโฟลว์ที่มีอยู่ได้อย่างราบรื่น สามารถดำเนินการต่างๆ ได้อย่างกว้างขวาง รวมถึง:
- การประมวลผลคำสั่งซื้อ: การจัดการและประมวลผลคำสั่งซื้อของลูกค้าอย่างมีประสิทธิภาพ ปรับปรุงการดำเนินงาน และลดการแทรกแซงด้วยตนเอง
- การค้นพบข้อมูล: การระบุและดึงข้อมูลที่เกี่ยวข้องจากชุดข้อมูลขนาดใหญ่อย่างรวดเร็ว ทำให้สามารถตัดสินใจและรับข้อมูลเชิงลึกโดยอาศัยข้อมูล
- การดำเนินการตามงานเชิงรุก: การคาดการณ์และการแก้ไขปัญหาหรือโอกาสที่อาจเกิดขึ้นอย่างเชิงรุก เพิ่มประสิทธิภาพการดำเนินงานโดยรวมและความคล่องตัว
ต่างจาก AI chatbots แบบดั้งเดิม AI agents มีความสามารถพิเศษในการดำเนินการอัตโนมัติโดยมีการกำกับดูแลของมนุษย์น้อยที่สุด ระดับความเป็นอิสระนี้ต้องใช้ความสามารถในการประมวลผลข้อมูลที่แข็งแกร่งเพื่อให้มั่นใจถึงการตัดสินใจที่ถูกต้องและมีประสิทธิภาพ Agents อาศัยกระแสข้อมูลอย่างต่อเนื่องเพื่อแจ้งให้ทราบถึงการให้เหตุผล ซึ่งอาจเป็นเรื่องท้าทายอย่างยิ่งเมื่อต้องจัดการกับความรู้ที่เป็นกรรมสิทธิ์หรือข้อมูลเรียลไทม์ที่เปลี่ยนแปลงอย่างรวดเร็ว
การจัดการกับความท้าทายด้านข้อมูล: การรับประกันความถูกต้องและความน่าเชื่อถือของ Agent
หนึ่งในความท้าทายที่สำคัญในการพัฒนาและปรับใช้ AI agents คือการทำให้มั่นใจว่ามีการไหลเวียนของข้อมูลคุณภาพสูงอย่างสม่ำเสมอ หากไม่สามารถเข้าถึงข้อมูลที่เกี่ยวข้องและเป็นปัจจุบันจากแหล่งต่างๆ ความเข้าใจของ agent อาจลดลง นำไปสู่การตอบสนองที่ไม่น่าเชื่อถือและลดผลิตภาพ โดยเฉพาะอย่างยิ่งเมื่อ agents จำเป็นต้องเข้าถึงความรู้ที่เป็นกรรมสิทธิ์ที่เก็บไว้หลังไฟร์วอลล์ของบริษัท หรือใช้ข้อมูลเรียลไทม์ที่เปลี่ยนแปลงอย่างรวดเร็ว
Joey Conway ผู้อำนวยการอาวุโสของซอฟต์แวร์ generative AI สำหรับองค์กรที่ Nvidia เน้นย้ำถึงความสำคัญของคุณภาพของข้อมูล โดยระบุว่า “หากไม่มีกระแสข้อมูลนำเข้าคุณภาพสูงอย่างต่อเนื่อง ไม่ว่าจะเป็นจากฐานข้อมูล การโต้ตอบกับผู้ใช้ หรือสัญญาณในโลกแห่งความเป็นจริง ความเข้าใจของ agent อาจอ่อนแอลง ทำให้การตอบสนองมีความน่าเชื่อถือน้อยลง ซึ่งทำให้ agents มีผลิตภาพน้อยลง”
NeMo Microservices: ชุดเครื่องมือที่ครอบคลุมสำหรับการพัฒนา AI Agent
เพื่อจัดการกับความท้าทายเหล่านี้และเร่งการพัฒนาและการปรับใช้ AI agents Nvidia จึงเปิดตัว NeMo microservices ชุดเครื่องมือนี้ประกอบด้วยองค์ประกอบสำคัญ 5 ประการ:
Customizer: อำนวยความสะดวกในการปรับแต่ง large language models (LLMs) ให้ละเอียดยิ่งขึ้น โดยให้ปริมาณงานการฝึกอบรมที่สูงขึ้นถึง 1.8 เท่า ซึ่งช่วยให้นักพัฒนาสามารถปรับแบบจำลองให้เข้ากับชุดข้อมูลเฉพาะได้อย่างรวดเร็ว ปรับประสิทธิภาพและความแม่นยำให้เหมาะสม Customizer นำเสนอ application programming interface (API) ที่ช่วยให้นักพัฒนาสามารถดูแลจัดการแบบจำลองได้อย่างมีประสิทธิภาพก่อนการปรับใช้
Evaluator: ลดความซับซ้อนในการประเมินแบบจำลองและเวิร์กโฟลว์ AI โดยอิงตามเกณฑ์มาตรฐานที่กำหนดเองและอุตสาหกรรม ด้วยการเรียก API เพียงห้าครั้ง นักพัฒนาสามารถประเมินประสิทธิภาพของโซลูชัน AI ของตนได้อย่างครอบคลุม ทำให้มั่นใจได้ว่าตรงตามมาตรฐานที่กำหนด
Guardrails: ทำหน้าที่เป็นตาข่ายนิรภัย ป้องกันไม่ให้แบบจำลองหรือ agents AI ประพฤติตนในลักษณะที่ไม่ปลอดภัยหรือไม่เหมาะสม สิ่งนี้ทำให้มั่นใจถึงการปฏิบัติตามข้อกำหนดและพฤติกรรมทางจริยธรรม โดยเพิ่มเวลาแฝงเพียงครึ่งวินาทีในขณะที่ให้ประสิทธิภาพ 1.4 เท่า
Retriever: ช่วยให้นักพัฒนาสร้าง agents ที่สามารถดึงข้อมูลจากระบบต่างๆ และประมวลผลได้อย่างแม่นยำ สิ่งนี้ทำให้สามารถสร้างไปป์ไลน์ข้อมูล AI ที่ซับซ้อน เช่น retrieval-augmented generation (RAG) ซึ่งช่วยเพิ่มความสามารถของ agent ในการเข้าถึงและใช้ข้อมูลที่เกี่ยวข้อง
Curator: ช่วยให้นักพัฒนาสามารถกรองและปรับแต่งข้อมูลที่ใช้ในการฝึกอบรมแบบจำลอง AI ปรับปรุงความแม่นยำของแบบจำลอง และลดอคติ การทำให้มั่นใจว่ามีการใช้เฉพาะข้อมูลคุณภาพสูง Curator ช่วยสร้าง AI agents ที่น่าเชื่อถือและมีประสิทธิภาพมากขึ้น
จากข้อมูลของ Conway “NeMo microservices ใช้งานง่ายและสามารถทำงานบนโครงสร้างพื้นฐานการประมวลผลแบบเร่งความเร็วใดๆ ทั้งในสถานที่และในระบบคลาวด์ ในขณะที่ให้ความปลอดภัย ความเสถียร และการสนับสนุนระดับองค์กร”
การทำให้การพัฒนา AI Agent เป็นประชาธิปไตย: การเข้าถึงสำหรับทุกคน
Nvidia ได้ออกแบบเครื่องมือ NeMo โดยคำนึงถึงการเข้าถึง เพื่อให้มั่นใจว่านักพัฒนาที่มีความรู้ทั่วไปเกี่ยวกับ AI สามารถใช้ประโยชน์จากเครื่องมือเหล่านี้ได้ผ่านการเรียก API อย่างง่าย การทำให้การพัฒนา AI agent เป็นประชาธิปไตยนี้ช่วยให้องค์กรต่างๆ สามารถสร้างระบบ multi-agent ที่ซับซ้อน ซึ่ง agents เฉพาะทางหลายร้อยรายทำงานร่วมกันเพื่อให้บรรลุเป้าหมายที่เป็นหนึ่งเดียวในขณะที่ทำงานร่วมกับเพื่อนร่วมงานที่เป็นมนุษย์
การสนับสนุนแบบจำลองในวงกว้าง: การยอมรับระบบนิเวศ Open AI
NeMo microservices มีการสนับสนุนอย่างกว้างขวางสำหรับแบบจำลอง open AI ที่ได้รับความนิยมมากมาย รวมถึง:
- ตระกูลแบบจำลอง Llama ของ Meta Platforms Inc.
- ตระกูลแบบจำลองภาษาขนาดเล็ก Phi ของ Microsoft
- แบบจำลอง Gemma ของ Google LLC
- แบบจำลอง Mistral
นอกจากนี้ Llama Nemotron Ultra ของ Nvidia ซึ่งได้รับการยอมรับว่าเป็นแบบจำลองเปิดชั้นนำสำหรับการให้เหตุผลทางวิทยาศาสตร์ การเขียนโค้ด และเกณฑ์มาตรฐานทางคณิตศาสตร์ที่ซับซ้อน ก็สามารถเข้าถึงได้ผ่าน microservices
การยอมรับในอุตสาหกรรม: ระบบนิเวศของคู่ค้าที่กำลังเติบโต
ผู้ให้บริการ AI ชั้นนำจำนวนมากได้รวม NeMo microservices เข้ากับแพลตฟอร์มของตนแล้ว รวมถึง:
- Cloudera Inc.
- Datadog Inc.
- Dataiku
- DataRobot Inc.
- DataStax Inc.
- SuperAnnotate AI Inc.
- Weights & Biases Inc.
การยอมรับอย่างแพร่หลายนี้เน้นย้ำถึงคุณค่าและความสามารถรอบด้านของ NeMo microservices ในระบบนิเวศ AI นักพัฒนาสามารถเริ่มใช้ microservices เหล่านี้ได้ทันทีผ่านเฟรมเวิร์ก AI ที่ได้รับความนิยม เช่น CrewAI, Haystack by Deepset, LangChain, LlamaIndex และ Llamastack
แอปพลิเคชันในโลกแห่งความเป็นจริง: การขับเคลื่อนมูลค่าทางธุรกิจ
คู่ค้าและบริษัทเทคโนโลยีของ Nvidia กำลังใช้ประโยชน์จาก NeMo microservices ใหม่เพื่อสร้างแพลตฟอร์ม AI agent ที่เป็นนวัตกรรมใหม่และเริ่มใช้งานเพื่อนร่วมงานดิจิทัล ซึ่งขับเคลื่อนมูลค่าทางธุรกิจที่จับต้องได้
AT&T Inc.: ใช้ NeMo Customizer และ Evaluator เพื่อปรับแต่งแบบจำลอง Mistral 7B สำหรับบริการส่วนบุคคล การป้องกันการฉ้อโกง และการปรับประสิทธิภาพเครือข่ายให้เหมาะสม ส่งผลให้ความแม่นยำของ AI agent เพิ่มขึ้น
BlackRock Inc.: กำลังรวม microservices เข้ากับแพลตฟอร์มเทคโนโลยี Aladdin เพื่อรวมการจัดการการลงทุนผ่านภาษาข้อมูลทั่วไป ปรับปรุงประสิทธิภาพและความสามารถในการตัดสินใจ
เจาะลึกส่วนประกอบ NeMo Microservices
เพื่อให้เข้าใจถึงศักยภาพในการเปลี่ยนแปลงของ NeMo microservices อย่างเต็มที่ สิ่งสำคัญคือต้องเจาะลึกลงไปในแต่ละส่วนประกอบ:
Customizer: การปรับแต่ง LLMs สำหรับงานเฉพาะ
microservice Customizer เป็นตัวเปลี่ยนเกมสำหรับองค์กรที่ต้องการปรับ large language models (LLMs) ให้เข้ากับความต้องการเฉพาะของตน จัดการกับความท้าทายของ LLMs ทั่วไปที่ไม่ได้เหมาะอย่างยิ่งสำหรับแอปพลิเคชันเฉพาะกลุ่มหรือชุดข้อมูลที่เป็นกรรมสิทธิ์เสมอไป
คุณสมบัติหลัก:
- ความสามารถในการปรับแต่งอย่างละเอียด: ช่วยให้นักพัฒนาสามารถปรับแต่ง LLMs อย่างละเอียดโดยใช้ข้อมูลของตนเอง ปรับแต่งความรู้และพฤติกรรมของแบบจำลองให้เข้ากับงานเฉพาะ
- ปริมาณงานการฝึกอบรมที่เพิ่มขึ้น: ให้ปริมาณงานการฝึกอบรมที่สูงขึ้นถึง 1.8 เท่า เมื่อเทียบกับวิธีการปรับแต่งแบบดั้งเดิม เร่งกระบวนการปรับแต่งแบบจำลอง
- อินเทอร์เฟซที่ขับเคลื่อนด้วย API: นำเสนอ API ที่ใช้งานง่าย ซึ่งช่วยให้นักพัฒนาสามารถดูแลจัดการแบบจำลองได้อย่างรวดเร็ว ทำให้มั่นใจได้ว่าได้รับการปรับให้เหมาะสมสำหรับการปรับใช้
ประโยชน์:
- ปรับปรุงความแม่นยำ: การปรับแต่ง LLMs อย่างละเอียดด้วยข้อมูลที่เกี่ยวข้องช่วยปรับปรุงความแม่นยำและประสิทธิภาพในแอปพลิเคชันเฉพาะอย่างมีนัยสำคัญ
- ลดเวลาในการพัฒนา: ปริมาณงานการฝึกอบรมที่เร่งขึ้นและ API ที่คล่องตัวช่วยลดเวลาที่ต้องใช้ในการปรับแต่งแบบจำลอง
- ปรับปรุงประสิทธิภาพ: แบบจำลองที่ได้รับการปรับให้เหมาะสมนำไปสู่ AI agents ที่มีประสิทธิภาพมากขึ้น สามารถให้ผลลัพธ์ที่ดีขึ้นโดยใช้ทรัพยากรน้อยลง
Evaluator: การประเมินประสิทธิภาพของแบบจำลองด้วยความมั่นใจ
microservice Evaluator ได้รับการออกแบบมาเพื่อลดความซับซ้อนของกระบวนการประเมินประสิทธิภาพของแบบจำลอง AI ที่มักซับซ้อน มีกรอบการทำงานที่เป็นมาตรฐานสำหรับการประเมินแบบจำลองเทียบกับเกณฑ์มาตรฐานที่กำหนดเองและอุตสาหกรรม ทำให้มั่นใจได้ว่าตรงตามมาตรฐานที่กำหนด
คุณสมบัติหลัก:
- การประเมินที่ง่ายขึ้น: ช่วยให้นักพัฒนาสามารถประเมินแบบจำลองและเวิร์กโฟลว์ AI ได้ด้วยการเรียก API เพียงห้าครั้ง ทำให้กระบวนการประเมินคล่องตัวขึ้น
- เกณฑ์มาตรฐานที่กำหนดเองและอุตสาหกรรม: สนับสนุนทั้งเกณฑ์มาตรฐานที่กำหนดเองซึ่งปรับให้เหมาะกับแอปพลิเคชันเฉพาะและเกณฑ์มาตรฐานของอุตสาหกรรมสำหรับการเปรียบเทียบในวงกว้าง
- การรายงานที่ครอบคลุม: สร้างรายงานโดยละเอียดเกี่ยวกับประสิทธิภาพของแบบจำลอง ให้ข้อมูลเชิงลึกในด้านที่ต้องปรับปรุง
ประโยชน์:
- การตัดสินใจโดยอาศัยข้อมูล: ให้ข้อมูลวัตถุประสงค์เพื่อแจ้งการตัดสินใจเกี่ยวกับการเลือก การฝึกอบรม และการปรับใช้แบบจำลอง
- ปรับปรุงคุณภาพของแบบจำลอง: ระบุส่วนที่ต้องปรับปรุง นำไปสู่แบบจำลอง AI ที่มีคุณภาพสูงและน่าเชื่อถือมากขึ้น
- ลดความเสี่ยง: ทำให้มั่นใจได้ว่าแบบจำลองตรงตามข้อกำหนดด้านประสิทธิภาพก่อนการปรับใช้ ลดความเสี่ยงของปัญหาที่ไม่คาดฝัน
Guardrails: การรับประกันพฤติกรรม AI ที่ปลอดภัยและมีจริยธรรม
microservice Guardrails เป็นส่วนประกอบที่สำคัญสำหรับการทำให้มั่นใจว่าแบบจำลอง AI ประพฤติตนในลักษณะที่ปลอดภัย มีจริยธรรม และเป็นไปตามข้อกำหนด ทำหน้าที่เป็นระบบตรวจสอบแบบเรียลไทม์ ป้องกันไม่ให้แบบจำลองสร้างเนื้อหาที่ไม่เหมาะสมหรือเป็นอันตราย
คุณสมบัติหลัก:
- การตรวจสอบแบบเรียลไทม์: ตรวจสอบเอาต์พุตของแบบจำลองอย่างต่อเนื่อง ระบุและบล็อกเนื้อหาที่อาจเป็นอันตราย
- กฎที่ปรับแต่งได้: ช่วยให้นักพัฒนาสามารถกำหนดกฎและนโยบายที่กำหนดเองเพื่อให้สอดคล้องกับข้อกำหนดด้านจริยธรรมและการปฏิบัติตามข้อกำหนดเฉพาะของตน
- ประสิทธิภาพและเวลาแฝงต่ำ: ให้การปฏิบัติตามข้อกำหนดเพิ่มเติมด้วยประสิทธิภาพ 1.4 เท่าและเวลาแฝงเพิ่มขึ้นเพียงครึ่งวินาที ลดผลกระทบต่อประสิทธิภาพให้เหลือน้อยที่สุด
ประโยชน์:
- ลดความเสี่ยงของอันตราย: ป้องกันไม่ให้แบบจำลองสร้างเนื้อหาที่อาจเป็นอันตราย ล่วงละเมิด หรือเลือกปฏิบัติ
- มั่นใจในการปฏิบัติตามข้อกำหนด: ช่วยให้องค์กรปฏิบัติตามกฎระเบียบและแนวทางปฏิบัติทางจริยธรรมที่เกี่ยวข้อง
- ปรับปรุงชื่อเสียง: แสดงให้เห็นถึงความมุ่งมั่นในการพัฒนา AI ที่มีความรับผิดชอบ เพิ่มความไว้วางใจและชื่อเสียง
Retriever: ปลดปล่อยพลังของการเข้าถึงข้อมูล
microservice Retriever ช่วยให้ AI agents สามารถเข้าถึงและประมวลผลข้อมูลจากแหล่งต่างๆ ได้อย่างกว้างขวาง ทำให้พวกเขาสามารถตัดสินใจได้อย่างมีข้อมูลมากขึ้นและให้การตอบสนองที่แม่นยำยิ่งขึ้น
คุณสมบัติหลัก:
- การดึงข้อมูล: ช่วยให้ agents สามารถดึงข้อมูลจากระบบต่างๆ รวมถึงฐานข้อมูล APIs และเอกสารที่ไม่มีโครงสร้าง
- การประมวลผลข้อมูล: ช่วยให้ agents สามารถประมวลผลและแปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมสำหรับการวิเคราะห์และการตัดสินใจ
- Retrieval-Augmented Generation (RAG): สนับสนุนการสร้างไปป์ไลน์ข้อมูล AI ที่ซับซ้อน เช่น RAG ช่วยเพิ่มความสามารถของ agent ในการเข้าถึงและใช้ข้อมูลที่เกี่ยวข้อง
ประโยชน์:
- ปรับปรุงความแม่นยำ: การเข้าถึงแหล่งข้อมูลที่หลากหลายมากขึ้นนำไปสู่การตัดสินใจที่แม่นยำและมีข้อมูลมากขึ้น
- ปรับปรุงบริบท: ให้ agents มีความเข้าใจอย่างลึกซึ้งยิ่งขึ้นเกี่ยวกับบริบทที่ล้อมรอบข้อความค้นหาของผู้ใช้ ทำให้สามารถตอบสนองได้อย่างเกี่ยวข้องมากขึ้น
- เพิ่มประสิทธิภาพ: ทำให้กระบวนการดึงข้อมูลและการประมวลผลเป็นไปโดยอัตโนมัติ ปลดปล่อยทรัพยากรบุคคลสำหรับงานเชิงกลยุทธ์มากขึ้น
Curator: การปรับแต่งข้อมูลสำหรับการฝึกอบรมแบบจำลองที่เหมาะสม
microservice Curator มีบทบาทสำคัญในการทำให้มั่นใจว่าแบบจำลอง AI ได้รับการฝึกอบรมบนข้อมูลคุณภาพสูงและไม่ลำเอียง ช่วยให้นักพัฒนาสามารถกรองและปรับแต่งข้อมูล ลบข้อมูลที่ไม่เกี่ยวข้องหรือเป็นอันตราย และลดความเสี่ยงของอคติในแบบจำลองที่เป็นผลลัพธ์
คุณสมบัติหลัก:
- การกรองข้อมูล: ช่วยให้นักพัฒนาสามารถกรองข้อมูลตามเกณฑ์ต่างๆ เช่น เนื้อหา แหล่งที่มา และความเกี่ยวข้อง
- การตรวจจับอคติ: ระบุและลดอคติที่อาจเกิดขึ้นในข้อมูล ทำให้มั่นใจได้ถึงความเป็นธรรมและความเท่าเทียมกันในผลลัพธ์ของแบบจำลอง
- การเพิ่มคุณค่าข้อมูล: ช่วยให้นักพัฒนาสามารถเพิ่มคุณค่าข้อมูลด้วยข้อมูลเพิ่มเติม ปรับปรุงความแม่นยำและความสมบูรณ์ของชุดข้อมูลการฝึกอบรม
ประโยชน์:
- ปรับปรุงความแม่นยำของแบบจำลอง: การฝึกอบรมบนข้อมูลคุณภาพสูงนำไปสู่แบบจำลอง AI ที่แม่นยำและน่าเชื่อถือมากขึ้น
- ลดอคติ: การลดอคติในข้อมูลทำให้มั่นใจได้ถึงความเป็นธรรมและความเท่าเทียมกันในผลลัพธ์ของแบบจำลอง
- ปรับปรุงความไว้วางใจ: การสร้างแบบจำลองบนข้อมูลที่ไม่ลำเอียงช่วยเพิ่มความไว้วางใจในระบบ AI และการตัดสินใจ
สรุป: ยุคใหม่ของระบบอัตโนมัติที่ขับเคลื่อนด้วย AI
Nemo microservices ของ Nvidia แสดงถึงความก้าวหน้าครั้งสำคัญในด้านการพัฒนา AI agent ด้วยการจัดหาชุดเครื่องมือที่ครอบคลุมซึ่งจัดการกับความท้าทายที่สำคัญของการเข้าถึงข้อมูล การปรับแต่งแบบจำลอง และพฤติกรรมทางจริยธรรม Nvidia กำลังช่วยให้นักพัฒนาสามารถสร้างโซลูชัน AI ที่เป็นนวัตกรรมใหม่ที่ขับเคลื่อนมูลค่าทางธุรกิจที่จับต้องได้ ในขณะที่องค์กรต่างๆ ยอมรับ AI agents มากขึ้น NeMo microservices จะมีบทบาทสำคัญในการกำหนดอนาคตของการทำงานและระบบอัตโนมัติอย่างไม่ต้องสงสัย