Amazon Nova मॉडल को अनुकूलित करके उपकरण उपयोग बढ़ाना

आज की तेजी से विकसित हो रही तकनीकी परिदृश्य में, बड़े भाषा मॉडल (एलएलएम) प्राकृतिक भाषा प्रसंस्करण के लिए शक्तिशाली उपकरणों के रूप में उभरे हैं। हालाँकि, स्थिर प्रशिक्षण डेटा पर उनकी निर्भरता वास्तविक दुनिया के परिदृश्यों के अनुकूल होने की उनकी क्षमता को सीमित करती है। जैसे-जैसे उद्योग तेजी से सूचित निर्णय लेने में सक्षम एआई समाधानों की मांग कर रहे हैं, बाहरी उपकरणों और एपीआई का एकीकरण सर्वोपरि हो गया है। इन उपकरणों का उपयोग करने की सटीकता स्वायत्त एजेंटों की निर्णय लेने की क्षमताओं और परिचालन दक्षता को बढ़ाने के लिए महत्वपूर्ण है, अंततः परिष्कृत एजेंटिक वर्कफ़्लो के विकास का मार्ग प्रशस्त करती है।

यह लेख Amazon Bedrock के माध्यम से Amazon Nova मॉडल का उपयोग करके टूल कॉलिंग के तकनीकी पहलुओं पर प्रकाश डालता है। इसके अलावा, यह उपकरण उपयोग में अधिक सटीकता प्राप्त करने के लिए इन मॉडलों को अनुकूलित करने के विभिन्न तरीकों का पता लगाता है।

उपकरण उपयोग के साथ एलएलएम क्षमताओं का विस्तार

एलएलएम ने प्राकृतिक भाषा कार्यों की एक विस्तृत श्रृंखला में उल्लेखनीय दक्षता का प्रदर्शन किया है। हालाँकि, उनकी वास्तविक क्षमता एपीआई और कम्प्यूटेशनल ढांचे जैसे बाहरी उपकरणों के साथ निर्बाध एकीकरण के माध्यम से अनलॉक की जाती है। ये उपकरण एलएलएम को वास्तविक समय के डेटा तक पहुंचने, डोमेन-विशिष्ट गणना करने और सटीक जानकारी प्राप्त करने की क्षमता के साथ सशक्त बनाते हैं, जिससे उनकी विश्वसनीयता और बहुमुखी प्रतिभा बढ़ती है।

एक मौसम एपीआई के एकीकरण पर विचार करें, जो एलएलएम को सटीक और अद्यतित मौसम पूर्वानुमान प्रदान करने में सक्षम बनाता है। इसी तरह, एक विकिपीडिया एपीआई एलएलएम को सूचना के विशाल भंडार तक पहुंचने की क्षमता से लैस कर सकता है, जिससे वे अधिक सटीकता के साथ जटिल प्रश्नों का जवाब दे सकते हैं। वैज्ञानिक संदर्भों में, कैलकुलेटर और प्रतीकात्मक इंजन जैसे उपकरण एलएलएम को संख्यात्मक अशुद्धियों को दूर करने में मदद कर सकते हैं, जिससे वे जटिल गणनाओं के लिए अधिक विश्वसनीय हो जाते हैं।

इन उपकरणों के साथ निर्बाध रूप से एकीकृत होकर, एलएलएम गतिशील और विशिष्ट कार्यों को वास्तविक दुनिया की उपयोगिता के साथ संभालने में सक्षम मजबूत, डोमेन-जागरूक प्रणालियों के रूप में विकसित होते हैं।

अमेज़ॅन नोवा मॉडल और अमेज़ॅन बेड्रोक

अमेज़ॅन नोवा मॉडल, जिसे दिसंबर 2024 में AWS re:Invent में पेश किया गया था, असाधारण मूल्य-प्रदर्शन मूल्य देने के लिए डिज़ाइन किया गया है। ये मॉडल लागत-प्रभावशीलता बनाए रखते हुए प्रमुख पाठ-समझ बेंचमार्क पर अत्याधुनिक प्रदर्शन प्रदान करते हैं। श्रृंखला में तीन प्रकार शामिल हैं:

  • माइक्रो: एक टेक्स्ट-ओनली मॉडल जो एज उपयोग के लिए अनुकूलित है, जो अल्ट्रा-कुशल प्रदर्शन प्रदान करता है।
  • लाइट: एक मल्टीमॉडल मॉडल जो बहुमुखी प्रतिभा और प्रदर्शन के बीच संतुलन बनाता है।
  • प्रो: एक उच्च-प्रदर्शन मल्टीमॉडल मॉडल जिसे जटिल कार्यों से निपटने के लिए डिज़ाइन किया गया है।

अमेज़ॅन नोवा मॉडल का उपयोग पीढ़ी और एजेंटिक वर्कफ़्लो के विकास सहित कार्यों की एक विस्तृत श्रृंखला के लिए किया जा सकता है। इन मॉडलों में टूल कॉलिंग नामक प्रक्रिया के माध्यम से बाहरी टूल या सेवाओं के साथ बातचीत करने की क्षमता होती है। इस कार्यक्षमता को अमेज़ॅन बेड्रोक कंसोल और कन्वर्ज और इनवोक जैसे एपीआई के माध्यम से एक्सेस किया जा सकता है।

प्री-ट्रेन्ड मॉडल का उपयोग करने के अलावा, डेवलपर्स के पास मल्टीमॉडल डेटा (प्रो और लाइट) या टेक्स्ट डेटा (प्रो, लाइट और माइक्रो) के साथ इन मॉडलों को फाइन-ट्यून करने का विकल्प होता है। यह लचीलापन डेवलपर्स को सटीकता, विलंबता और लागत-प्रभावशीलता के वांछित स्तरों को प्राप्त करने में सक्षम बनाता है। इसके अलावा, डेवलपर्स बड़े मॉडलों को छोटे मॉडलों में स्व-सेवा कस्टम फाइन-ट्यूनिंग और डिस्टिलेशन करने के लिए अमेज़ॅन बेड्रोक कंसोल और एपीआई का लाभ उठा सकते हैं।

समाधान अवलोकन

समाधान में विशेष रूप से उपकरण उपयोग के लिए डिज़ाइन किए गए एक कस्टम डेटासेट को तैयार करना शामिल है। फिर इस डेटासेट का उपयोग अमेज़ॅन बेड्रोक के माध्यम से अमेज़ॅन नोवा मॉडल के प्रदर्शन का मूल्यांकन करने के लिए किया जाता है, जिसमें कन्वर्स और इनवोक एपीआई का उपयोग किया जाता है। इसके बाद, AmazonNova माइक्रो और Amazon Nova लाइट मॉडल को Amazon Bedrock के माध्यम से तैयार किए गए डेटासेट का उपयोग करके फाइन-ट्यून किया जाता है। फाइन-ट्यूनिंग प्रक्रिया पूरी होने पर, इन अनुकूलित मॉडलों का मूल्यांकन प्रोविज़न थ्रूपुट के माध्यम से किया जाता है।

उपकरण

एलएलएम में उपकरण उपयोग में दो आवश्यक ऑपरेशन शामिल हैं: उपकरण चयन और तर्क निष्कर्षण या पीढ़ी। उदाहरण के लिए, किसी विशिष्ट स्थान के लिए मौसम की जानकारी प्राप्त करने के लिए डिज़ाइन किए गए टूल पर विचार करें। जब ‘अभी लंदन में मौसम कैसा है?’ जैसे प्रश्न प्रस्तुत किए जाते हैं, तो एलएलएम यह निर्धारित करने के लिए अपने उपलब्ध उपकरणों का आकलन करता है कि कोई उपयुक्त उपकरण मौजूद है या नहीं। यदि कोई उपयुक्त उपकरण पहचाना जाता है, तो मॉडल इसका चयन करता है और आवश्यक तर्क - इस मामले में, ‘लंदन’ - टूल कॉल बनाने के लिए निकालता है।

प्रत्येक उपकरण को एक औपचारिक विनिर्देश के साथ सावधानीपूर्वक परिभाषित किया गया है जो इसके इच्छित कार्य, अनिवार्य और वैकल्पिक तर्कों और संबंधित डेटा प्रकारों की रूपरेखा तैयार करता है। इन सटीक परिभाषाओं को टूल कॉन्फ़िग कहा जाता है, यह सुनिश्चित करती है कि टूल कॉल सही ढंग से निष्पादित किए जाएं और तर्क पार्सिंग टूल की परिचालन आवश्यकताओं के साथ संरेखित हो। इस आवश्यकता का पालन करते हुए, इस उदाहरण में उपयोग किए गए डेटासेट में आठ अलग-अलग उपकरण परिभाषित हैं, प्रत्येक के अपने तर्क और कॉन्फ़िगरेशन हैं, जो सभी JSON प्रारूप में संरचित हैं। परिभाषित आठ उपकरण इस प्रकार हैं:

  • weather_api_call: मौसम की जानकारी प्राप्त करने के लिए डिज़ाइन किया गया एक कस्टम टूल।
  • stat_pull: आँकड़े पहचानने के लिए एक कस्टम टूल।
  • text_to_sql: टेक्स्ट को SQL क्वेरी में बदलने के लिए एक कस्टम टूल।
  • terminal: एक टर्मिनल वातावरण में स्क्रिप्ट को निष्पादित करने के लिए एक उपकरण।
  • wikipedia: विकिपीडिया पृष्ठों के माध्यम से खोज करने के लिए एक विकिपीडिया एपीआई उपकरण।
  • duckduckgo_results_json: एक इंटरनेट खोज उपकरण जो खोज करने के लिए DuckDuckGo का उपयोग करता है।
  • youtube_search: वीडियो लिस्टिंग की खोज के लिए एक YouTube API खोज उपकरण।
  • pubmed_search: PubMed एब्स्ट्रैक्ट की खोज के लिए एक PubMed खोज उपकरण।

डेटासेट

इस समाधान में उपयोग किया गया डेटासेट एक सिंथेटिक टूल कॉलिंग डेटासेट है, जो अमेज़ॅन बेड्रोक से एक फाउंडेशन मॉडल (FM) की सहायता से बनाया गया है और बाद में मैन्युअल रूप से मान्य और समायोजित किया गया है। इस डेटासेट को पहले चर्चा किए गए आठ उपकरणों के सेट के लिए विकसित किया गया था, जिसका उद्देश्य प्रश्नों और उपकरण आवाहनों का एक विविध संग्रह उत्पन्न करना है जो दूसरे मॉडल को इन उदाहरणों से सीखने और अनदेखे उपकरण आवाहनों के लिए सामान्य बनाने में सक्षम बनाता है।

डेटासेट के भीतर प्रत्येक प्रविष्टि को एक JSON ऑब्जेक्ट के रूप में संरचित किया गया है, जिसमें कुंजी-मूल्य जोड़े हैं जो प्रश्न (मॉडल के लिए एक प्राकृतिक भाषा उपयोगकर्ता क्वेरी), उपयोगकर्ता क्वेरी का उत्तर देने के लिए आवश्यक ग्राउंड ट्रुथ टूल, इसके तर्क (टूल को निष्पादित करने के लिए आवश्यक मापदंडों वाले एक शब्दकोश), और अतिरिक्त बाधाएं जैसे order_matters: boolean, जो इंगित करता है कि तर्कों का क्रम महत्वपूर्ण है या नहीं, और arg_pattern: optional, तर्क सत्यापन या स्वरूपण के लिए एक नियमित अभिव्यक्ति (regex)। इन ग्राउंड ट्रुथ लेबल का उपयोग प्री-ट्रेन्ड अमेज़ॅन नोवा मॉडल के प्रशिक्षण की निगरानी के लिए किया जाता है, जिससे उन्हें उपकरण उपयोग के लिए अनुकूलित किया जाता है। इस प्रक्रिया को पर्यवेक्षित फाइन-ट्यूनिंग के रूप में जाना जाता है, जिसे निम्नलिखित अनुभागों में और अधिक खोजा गया है।

प्रशिक्षण सेट में 560 प्रश्न शामिल हैं, जबकि परीक्षण सेट में 120 प्रश्न हैं। परीक्षण सेट को प्रति उपकरण श्रेणी 15 प्रश्न शामिल करने के लिए संरचित किया गया है, जिसमें कुल 120 प्रश्न हैं।

अमेज़ॅन नोवा के लिए डेटासेट तैयार करना

अमेज़ॅन नोवा मॉडल के साथ इस डेटासेट का प्रभावी ढंग से उपयोग करने के लिए, डेटा को एक विशिष्ट चैट टेम्पलेट के अनुसार स्वरूपित करना आवश्यक है। मूल उपकरण कॉलिंग में एक अनुवाद परत शामिल होती है जो मॉडल को भेजने से पहले इनपुट को उपयुक्त प्रारूप में स्वरूपित करती है। इस समाधान में, एक DIY उपकरण उपयोग दृष्टिकोण अपनाया गया है, जिसमें एक कस्टम प्रॉम्प्ट टेम्पलेट का उपयोग किया गया है। विशेष रूप से, सिस्टम प्रॉम्प्ट, टूल कॉन्फ़िग के साथ एम्बेडेड उपयोगकर्ता संदेश और ग्राउंड ट्रुथ लेबल को सहायक संदेश के रूप में जोड़ा जाना चाहिए।

Amazon S3 पर डेटासेट अपलोड करना

यह चरण फाइन-ट्यूनिंग प्रक्रिया के दौरान प्रशिक्षण डेटा तक पहुंचने के लिए Amazon Bedrock को सक्षम करने के लिए आवश्यक है। डेटासेट को Amazon Simple Storage Service (Amazon S3) कंसोल या प्रोग्रामेटिक रूप से अपलोड किया जा सकता है।

अमेज़ॅन बेड्रोक एपीआई के माध्यम से बेस मॉडल के साथ टूल कॉलिंग

उपकरण उपयोग डेटासेट के निर्माण और आवश्यकतानुसार स्वरूपित होने के बाद, इसका उपयोग अमेज़ॅन नोवा मॉडल का परीक्षण करने के लिए किया जा सकता है। अमेज़ॅन बेड्रोक में उपकरण उपयोग के लिए कन्वर्स और इनवोक दोनों एपीआई का उपयोग किया जा सकता है। कन्वर्स एपीआई गतिशील, संदर्भ-जागरूक वार्तालापों को सक्षम बनाता है, जिससे मॉडल बहु-मोड़ संवादों में संलग्न हो सकते हैं, जबकि इनवोक एपीआई उपयोगकर्ताओं को अमेज़ॅन बेड्रोक के भीतर अंतर्निहित मॉडल को कॉल करने और उनके साथ बातचीत करने की अनुमति देता है।

कन्वर्स एपीआई का उपयोग करने के लिए, संदेश, सिस्टम प्रॉम्प्ट (यदि कोई हो) और टूल कॉन्फ़िग सीधे एपीआई को भेजे जाते हैं।

एलएलएम प्रतिक्रिया से उपकरण और तर्कों को पार्स करने के लिए, प्रश्न पर विचार करें: ‘अरे, अभी पेरिस में तापमान क्या है?’। प्रश्न का उत्तर देने के लिए आवश्यक उपकरण और तर्कों की पहचान करने के लिए आउटपुट को पार्स किया जाएगा।

उन्नत उपकरण उपयोग के लिए अमेज़ॅन नोवा मॉडल को फाइन-ट्यून करना

फाइन-ट्यूनिंग अमेज़ॅन नोवा जैसे प्री-ट्रेन्ड भाषा मॉडल को विशिष्ट कार्यों के अनुकूल बनाने में एक महत्वपूर्ण कदम है। वांछित एप्लिकेशन के अनुरूप डेटासेट पर मॉडल को प्रशिक्षित करके, मॉडल अधिक सटीकता और दक्षता के साथ कार्य करने के लिए सीख सकता है। उपकरण उपयोग के संदर्भ में, फाइन-ट्यूनिंग मॉडल की उपयुक्त उपकरण का चयन करने और सही तर्क निकालने की क्षमता में काफी सुधार कर सकती है।

फाइन-ट्यूनिंग प्रक्रिया में प्रशिक्षण डेटासेट में मॉडल की भविष्यवाणियों और ग्राउंड ट्रुथ लेबल के बीच अंतर को कम करने के लिए मॉडल के आंतरिक मापदंडों को समायोजित करना शामिल है। यह आमतौर पर एक पुनरावृत्त प्रक्रिया के माध्यम से प्राप्त किया जाता है, जहां मॉडल को बार-बार प्रशिक्षण डेटा के संपर्क में लाया जाता है और देखे गए त्रुटियों के आधार पर इसके मापदंडों को समायोजित किया जाता है।

फाइन-ट्यूनिंग डेटासेट तैयार करना

वास्तविक दुनिया के परिदृश्यों में मॉडल से जिन प्रश्नों और उपकरण आवाहनों को संभालने की उम्मीद की जाती है, उन्हें दर्शाने के लिए फाइन-ट्यूनिंग डेटासेट को सावधानीपूर्वक क्यूरेट किया जाना चाहिए। डेटासेट में विभिन्न उपकरण श्रेणियों और तर्क पैटर्न को कवर करते हुए उदाहरणों की एक विविध श्रेणी शामिल होनी चाहिए।

डेटासेट में प्रत्येक उदाहरण में एक प्रश्न, कॉल किए जाने वाले संबंधित उपकरण और उपकरण को निष्पादित करने के लिए आवश्यक तर्क शामिल होने चाहिए। तर्कों को एक संरचित तरीके से स्वरूपित किया जाना चाहिए, आमतौर पर JSON ऑब्जेक्ट के रूप में।

फाइन-ट्यूनिंग प्रक्रिया

फाइन-ट्यूनिंग प्रक्रिया को अमेज़ॅन बेड्रोक कंसोल या एपीआई का उपयोग करके किया जा सकता है। प्रक्रिया में फाइन-ट्यून किए जाने वाले मॉडल, फाइन-ट्यूनिंग डेटासेट और वांछित प्रशिक्षण मापदंडों को निर्दिष्ट करना शामिल है।

प्रशिक्षण पैरामीटर फाइन-ट्यूनिंग प्रक्रिया के विभिन्न पहलुओं को नियंत्रित करते हैं, जैसे कि सीखने की दर, बैच आकार और युगों की संख्या। सीखने की दर प्रत्येक पुनरावृत्ति के दौरान किए गए पैरामीटर समायोजन के परिमाण को निर्धारित करती है। बैच आकार प्रत्येक पुनरावृत्ति में संसाधित उदाहरणों की संख्या निर्धारित करता है। युगों की संख्या यह निर्धारित करती है कि मॉडल को पूरे प्रशिक्षण डेटासेट के संपर्क में कितनी बार लाया जाता है।

फाइन-ट्यून किए गए मॉडल का मूल्यांकन करना

फाइन-ट्यूनिंग प्रक्रिया पूरी होने के बाद, फाइन-ट्यून किए गए मॉडल के प्रदर्शन का मूल्यांकन करना आवश्यक है। यह एक अलग परीक्षण डेटासेट पर मॉडल का परीक्षण करके किया जा सकता है जिसका उपयोग फाइन-ट्यूनिंग प्रक्रिया के दौरान नहीं किया गया था।

परीक्षण डेटासेट वास्तविक दुनिया के परिदृश्यों में मॉडल से जिन प्रश्नों और उपकरण आवाहनों को संभालने की उम्मीद की जाती है, उनका प्रतिनिधि होना चाहिए। सटीकता, परिशुद्धता, रिकॉल और F1-स्कोर जैसे मेट्रिक्स को मापकर मॉडल के प्रदर्शन का मूल्यांकन किया जा सकता है।

उपकरण उपयोग के लिए अमेज़ॅन नोवा मॉडल को अनुकूलित करने के लाभ

उपकरण उपयोग के लिए अमेज़ॅन नोवा मॉडल को अनुकूलित करने के कई लाभ हैं:

  • बेहतर सटीकता: कार्य-विशिष्ट डेटासेट पर मॉडल को फाइन-ट्यून करने से उपकरण चयन और तर्क निष्कर्षण की सटीकता में काफी सुधार हो सकता है।
  • बढ़ी हुई दक्षता: फाइन-ट्यून किए गए मॉडल अक्सर प्री-ट्रेन्ड मॉडल की तुलना में उपकरण उपयोग कार्यों को अधिक कुशलता से कर सकते हैं।
  • बढ़ी हुई अनुकूलन क्षमता: फाइन-ट्यूनिंग मॉडल को विशिष्ट डोमेन और उपयोग के मामलों के अनुकूल होने की अनुमति देती है।
  • कम लागत: कुछ मामलों में, फाइन-ट्यूनिंग से उपकरण उपयोग कार्यों को करने के लिए आवश्यक कम्प्यूटेशनल संसाधनों को कम किया जा सकता है।

निष्कर्ष

उपकरण उपयोग के लिए अमेज़ॅन नोवा मॉडल को अनुकूलित करना एलएलएम के प्रदर्शन और अनुकूलन क्षमता को बढ़ाने के लिए एक मूल्यवान तकनीक है। कार्य-विशिष्ट डेटासेट पर मॉडल को फाइन-ट्यून करके, डेवलपर्स उपकरण उपयोग अनुप्रयोगों की सटीकता, दक्षता और अनुकूलन क्षमता में काफी सुधार कर सकते हैं। जैसे-जैसे उद्योग तेजी से सूचित निर्णय लेने में सक्षम एआई समाधानों की मांग कर रहे हैं, उपकरण उपयोग के लिए एलएलएम का अनुकूलन तेजी से महत्वपूर्ण होता जाएगा।