जेनरेटिव आर्टिफिशियल इंटेलिजेंस विभिन्न अनुप्रयोगों के माध्यम से व्यवसाय संचालन में क्रांति ला रहा है, जिसमें अमेज़ॅन के रूफस और अमेज़ॅन सेलर असिस्टेंट जैसे संवादी सहायक शामिल हैं। इसके अतिरिक्त, कुछ सबसे प्रभावशाली जेनरेटिव एआई एप्लिकेशन पृष्ठभूमि में स्वायत्त रूप से चलते हैं, एक आवश्यक सुविधा जो व्यवसायों को बड़े पैमाने पर अपने संचालन, डेटा हैंडलिंग और सामग्री निर्माण को बदलने में सक्षम बनाती है। ये गैर-संवादी कार्यान्वयन अक्सर बड़े भाषा मॉडल (एलएलएम) द्वारा संचालित एजेंट वर्कफ़्लो के रूप में आते हैं, जो सीधे उपयोगकर्ता के हस्तक्षेप के बिना विशिष्ट व्यावसायिक उद्देश्यों को पूरा करते हैं।
वास्तविक समय के उपयोगकर्ता प्रतिक्रिया और पर्यवेक्षण से लाभान्वित होने वाले संवादी अनुप्रयोगों की तुलना में, गैर-संवादी अनुप्रयोगों में उच्च विलंबता सहनशीलता, बैच प्रसंस्करण और कैशिंग जैसे अद्वितीय फायदे हैं, लेकिन उनकी स्वायत्त प्रकृति को मजबूत सुरक्षा उपायों और विस्तृत गुणवत्ता आश्वासन की आवश्यकता होती है।
यह लेख अमेज़ॅन के चार अलग-अलग जेनरेटिव एआई अनुप्रयोगों के मामलों की पड़ताल करता है:
- अमेज़ॅन उत्पाद लिस्टिंग निर्माण और कैटलॉग डेटा गुणवत्ता सुधार - यह प्रदर्शित करता है कि एलएलएम कैसे बिक्री भागीदारों और अमेज़ॅन को बड़े पैमाने पर उच्च गुणवत्ता वाली उत्पाद लिस्टिंग बनाने में मदद कर सकते हैं
- अमेज़ॅन फार्मेसी में नुस्खे प्रसंस्करण - एक अत्यधिक विनियमित वातावरण में कार्यान्वयन और एजेंट वर्कफ़्लो के लिए कार्य अपघटन को प्रदर्शित करता है
- समीक्षा हाइलाइट्स - बड़े पैमाने पर बैच प्रसंस्करण, पारंपरिक मशीन लर्निंग (एमएल) एकीकरण, छोटे एलएलएम के उपयोग और लागत प्रभावी समाधानों को स्पष्ट करता है
- अमेज़ॅन विज्ञापन रचनात्मक छवि और वीडियो पीढ़ी - रचनात्मक कार्यों में बहुआयामी जेनरेटिव एआई और जिम्मेदार एआई प्रथाओं पर प्रकाश डालता है
प्रत्येक केस स्टडी गैर-संवादी जेनरेटिव एआई अनुप्रयोगों को लागू करने के विभिन्न पहलुओं को उजागर करती है, तकनीकी वास्तुकला से लेकर परिचालन विचारों तक। इन उदाहरणों के माध्यम से, आप सीखेंगे कि अमेज़ॅन बेडरोक और अमेज़ॅन सेजमेकर सहित ए AWS सेवाओं का पूरा सूट सफलता के लिए कैसे महत्वपूर्ण है। अंत में, हम विभिन्न उपयोग के मामलों में आम तौर पर साझा किए गए प्रमुख पाठों की एक सूची प्रदान करते हैं।
अमेज़ॅन पर उच्च गुणवत्ता वाली उत्पाद लिस्टिंग बनाना
व्यापक विवरण के साथ उच्च गुणवत्ता वाली उत्पाद लिस्टिंग बनाने से ग्राहकों को खरीदारी के बारे में सूचित निर्णय लेने में मदद मिलती है। परंपरागत रूप से, बिक्री भागीदार प्रत्येक उत्पाद के लिए कई विशेषताओं को मैन्युअल रूप से दर्ज करते हैं। 2024 में लॉन्च किया गया एक नया जेनरेटिव एआई समाधान, ब्रांड वेबसाइटों और अन्य स्रोतों से सक्रिय रूप से उत्पाद जानकारी प्राप्त करके ग्राहक अनुभव को बेहतर बनाकर इस प्रक्रिया को बदल देता है।
जेनरेटिव एआई विभिन्न प्रारूपों (जैसे URL, उत्पाद छवियां, या स्प्रेडशीट) में जानकारी इनपुट करने का समर्थन करके और इसे स्वचालित रूप से वांछित संरचना और प्रारूप में परिवर्तित करके बिक्री भागीदारों के अनुभव को सरल बनाता है। 900,000 से अधिक बिक्री भागीदारों ने इसका उपयोग किया है, और लगभग 80% उत्पन्न उत्पाद लिस्टिंग ड्राफ्ट को न्यूनतम संपादन के साथ स्वीकार किया जाता है। एआई-जनरेटेड सामग्री व्यापक उत्पाद विवरण प्रदान करती है, जो स्पष्टता और सटीकता को बढ़ाने में मदद करती है, जो बदले में ग्राहक खोजों में उत्पादों की खोज में योगदान करती है।
नई उत्पाद लिस्टिंग के लिए, वर्कफ़्लो बिक्री भागीदार द्वारा प्रारंभिक जानकारी प्रदान करने के साथ शुरू होता है। फिर, सिस्टम शीर्षक, विवरण और विस्तृत विशेषताओं सहित व्यापक उत्पाद लिस्टिंग उत्पन्न करने के लिए जानकारी के कई स्रोतों का उपयोग करता है। उत्पन्न उत्पाद लिस्टिंग को अनुमोदन या संपादन के लिए बिक्री भागीदार के साथ साझा किया जाता है।
मौजूदा उत्पाद लिस्टिंग के लिए, सिस्टम उन उत्पादों की पहचान करता है जिन्हें अतिरिक्त डेटा के साथ समृद्ध किया जा सकता है।
बड़ी मात्रा में आउटपुट के लिए डेटा एकीकरण और प्रसंस्करण
अमेज़ॅन टीम ने एलएलएम के अनुकूल एपीआई के लिए मजबूत आंतरिक और बाहरी स्रोत कनेक्टर्स बनाने के लिए अमेज़ॅन बेडरोक और अन्य ए AWS सेवाओं का उपयोग किया, जिससे अमेज़ॅन डॉट कॉम बैकएंड सिस्टम के साथ सहज एकीकरण हुआ।
एक प्रमुख चुनौती 50 से अधिक विशेषताओं (पाठ और संख्या दोनों सहित) में डेटा की विविधता को एक सुसंगत उत्पाद लिस्टिंग में संश्लेषित करना था। एलएलएम को वाणिज्य अवधारणाओं की सटीक व्याख्या करने के लिए विशिष्ट नियंत्रण तंत्र और निर्देशों की आवश्यकता होती है, क्योंकि वे इतने जटिल, विविध डेटा के साथ बेहतर प्रदर्शन नहीं कर सकते हैं। उदाहरण के लिए, एलएलएम एक चकाकू ब्लॉक में “क्षमता” को स्लॉट की संख्या के बजाय आकार के रूप में गलत समझ सकता है, या “फिट वियर” को ब्रांड नाम के बजाय शैली वर्णक के रूप में गलत समझ सकता है। इन मामलों को संबोधित करने के लिए प्रांप्ट इंजीनियरिंग और फाइन-ट्यूनिंग का व्यापक रूप से उपयोग किया गया था।
एलएलएम के साथ पीढ़ी और सत्यापन
उत्पन्न उत्पाद लिस्टिंग पूरी और सही होनी चाहिए। ऐसा करने में मदद करने के लिए, समाधान गुणों की पीढ़ी और सत्यापन दोनों के लिए एलएलएम का उपयोग करके एक बहु-चरणीय वर्कफ़्लो लागू करता है। यह दोहरी एलएलएम पद्धति मतिभ्रम को रोकने में मदद करती है, जो सुरक्षा चिंताओं का ध्यान रखते हुए या तकनीकी विनिर्देशों को संसाधित करते समय महत्वपूर्ण है। टीम ने यह सुनिश्चित करने के लिए उन्नत स्व-प्रतिबिंब तकनीकों को विकसित किया कि पीढ़ी और सत्यापन प्रक्रियाएं प्रभावी ढंग से एक-दूसरे के पूरक हैं।
मानवीय प्रतिक्रिया के साथ बहु-परत गुणवत्ता आश्वासन
मानवीय प्रतिक्रिया समाधान की गुणवत्ता आश्वासन के लिए केंद्रीय है। प्रक्रिया में अमेज़ॅन डॉट कॉम के विशेषज्ञों द्वारा प्रारंभिक मूल्यांकन शामिल है, और स्वीकृति या संपादन के लिए बिक्री भागीदारों से इनपुट शामिल हैं। यह उच्च गुणवत्ता वाला आउटपुट प्रदान करता है और कृत्रिम बुद्धिमत्ता मॉडल को लगातार बढ़ाने की क्षमता प्रदान करता है।
गुणवत्ता आश्वासन प्रक्रिया में एमएल, एल्गोरिदम, या एलएलएम-आधारित मूल्यांकन के संयोजन के साथ स्वचालित परीक्षण विधियां शामिल हैं। विफल उत्पाद लिस्टिंग को फिर से उत्पन्न किया जाता है, सफल उत्पाद लिस्टिंग को आगे की परीक्षा के अधीन किया जाता है। हमारे द्वारा उपयोग किए जाने वाले [कारण अनुमान मॉडल] का उपयोग करके, हम उन अंतर्निहित विशेषताओं की पहचान करते हैं जो उत्पाद लिस्टिंग प्रदर्शन को प्रभावित करती हैं और समृद्ध अवसरों को प्रभावित करती हैं। अंततः, गुणवत्ता जांच से गुजरने वाली उत्पाद लिस्टिंग और बिक्री भागीदार द्वारा स्वीकृत उत्पाद लिस्टिंग प्रकाशित की जाती हैं, जिससे यह सुनिश्चित होता है कि ग्राहकों को सटीक और व्यापक उत्पाद जानकारी प्राप्त हो।
सटीकता और लागत के लिए एप्लिकेशन-स्तरीय सिस्टम अनुकूलन
सटीकता और पूर्णता के उच्च मानकों को देखते हुए, टीम ने एक व्यापक प्रयोगात्मक दृष्टिकोण अपनाया और एक स्वचालित अनुकूलन प्रणाली से लैस थी। सिस्टम एलएलएम, प्रॉम्प्ट, प्लेबुक, वर्कफ़्लो और कृत्रिम बुद्धिमत्ता उपकरणों के विभिन्न संयोजनों की खोज करता है ताकि लागत सहित उच्च व्यावसायिक मेट्रिक्स में सुधार किया जा सके। चल रहे मूल्यांकन और स्वचालित परीक्षण के माध्यम से, उत्पाद उत्पाद लिस्टिंग जनरेटर प्रदर्शन, लागत और दक्षता को प्रभावी ढंग से संतुलित कर सकता है, जबकि लगातार कृत्रिम बुद्धिमत्ता विकास के अनुकूल भी है। इस दृष्टिकोण का मतलब है कि ग्राहक उच्च गुणवत्ता वाली उत्पाद जानकारी से लाभान्वित हो सकते हैं, और बिक्री भागीदार कुशल उत्पाद लिस्टिंग निर्माण के लिए अत्याधुनिक उपकरणों तक पहुंच सकते हैं।
अमेज़ॅन फार्मेसी में जेनरेटिव कृत्रिम बुद्धिमत्ता-आधारित पर्ची प्रसंस्करण
पहले चर्चा किए गए विक्रेता प्रॉडक्ट लिस्टिंग उदाहरण में, मानव-इन-द-लूप वर्कफ़्लो का आधार निर्धारित किया गया था, अमेज़ॅन फार्मेसी दर्शाती है कि इन सिद्धांतों को कैसे [स्वास्थ्य बीमा पोर्टेबिलिटी एंड अकाउंटिबिलिटी अधिनियम] (एचआईपीएए) द्वारा विनियमित उद्योग पर लागू किया जा सकता है। [अमेज़ॅन फार्मेसी अमेज़ॅन सेजमेकर का उपयोग करके एलएलएम-आधारित चैटबॉट कैसे बनाती है] नामक लेख में, हमने रोगी देखभाल विशेषज्ञों के लिए एक संवादात्मक सहायक साझा किया, अब हम स्वचालित पर्ची प्रसंस्करण पर ध्यान केंद्रित करते हैं।
अमेज़ॅन फार्मेसी में, हमने फार्मासिस्ट तकनीशियनों को दवा के निर्देशों को और अधिक सटीक और कुशलता से संसाधित करने में मदद करने के लिए अमेज़ॅन बेडरोक और सेजमेकर पर आधारित एक कृत्रिम बुद्धिमत्ता प्रणाली विकसित की है। समाधान सटीकता बढ़ाने के लिए मानव विशेषज्ञता को एलएलएम के साथ निर्माता और सत्यापनकर्ता भूमिकाओं में एकीकृत करता है जो रोगियों के दवा निर्देशों को निर्देशित करते हैं।
स्वास्थ्य सेवा सटीकता के लिए प्रत्यायोजित वर्कफ़्लो डिज़ाइन
पर्ची प्रसंस्करण प्रणाली मानव विशेषज्ञता (डेटा एंट्री क्लर्क और फार्मासिस्ट) को कृत्रिम बुद्धिमत्ता समर्थन के साथ दिशा सुझाव और प्रतिक्रिया प्रदान करने के लिए जोड़ती है। वर्कफ़्लो फार्मेसी नॉलेज रिपॉजिटरी प्रीप्रोसेसर से शुरू होता है, जो पर्ची के मूल पाठ को [अमेज़ॅन डायनामोडीबी] में मानकीकृत करता है, और फिर प्रमुख घटकों (खुराक, आवृत्ति) की पहचान करने के लिए सेजमेकर पर फाइन-ट्यून किए गए छोटे भाषा मॉडल (एसएलएम) का उपयोग करता है।
सिस्टम डेटा इंटीग्रेटर्स और फार्मासिस्ट जैसे विशेषज्ञों को मूल रूप से 통합 करता है, इन बिंदुओं पर उत्पादन एआई एक पूरी वर्कफ़्लो की प्रशंसा करता है और इसके साथ है, इसके परिणामस्वरूप गति और सटीक पर एक तेज गति तेज होती है, जिसके परिणामस्वरूप हमारे रोगियों की बेहतर सेवा होती है। फिर दिशा اسمبلی प्रणाली एक सलाह मॉड्यूल में इनपुट बनाने के लिए एक डेटा ऑपरेटर के लिए निर्देश तैयार करती है, साथ ही एक मॉड्यूल या किसी अन्य सुरक्षा उपाय के रूप में डेटा ऑपरेटर के लिए प्रतिक्रिया के रूप में गलती पैदा करती है। तकनीशियन अंत में अत्यधिक सटीक, सुरक्षित रूप से दिए गए निर्देशों को खत्म करना शुरू कर देते हैं, फार्मासिस्टों ने प्रतिक्रिया भेज दी या दिशाओं को कम करने वाली सेवा में تنفيذ करने के लिए।
समाधान की एक हाइलाइट कार्य अपघटन का उपयोग है, जिसने इंजीनियरों और वैज्ञानिकों को पूरी प्रक्रिया को कई चरणों में तोड़ने में सक्षम बनाया, जिसमें उप-चरणों वाले अलग-अलग मॉड्यूल शामिल थे। टीम ने फाइन-ट्यून किए गए एसएलएम का व्यापक रूप से उपयोग किया। इसके अतिरिक्त, प्रक्रिया अंततः विश्वास का अनुमान लगाने के लिए [नामित संस्था मान्यता (एनईआर)] या [रिग्रेशन मॉडल] जैसे पारंपरिक एमएल प्रोग्राम को शामिल करती है। एसएलएम और पारंपरिक एमएल का इस नियंत्रित, स्पष्ट रूप से परिभाषित प्रक्रिया में उपयोग काफी हद तक प्रशोधन गति को बढ़ा सकता है, जबकि विशिष्ट चरणों में उचित सुरक्षा उपायों को शामिल करने के कारण सख्त सुरक्षामानकों को बनाए रखता है।
सिस्टम में कई अच्छी तरह से परिभाषित उप-चरण होते हैं, प्रत्येक उप-प्रक्रिया एक विशेष घटक के रूप में काम करती है, जो समग्र लक्ष्य को पाने के लिए अर्ध-स्वायत्त लेकिन सहयोगी तरीके से वर्कफ़्लो में काम करती है। सत्यापन इस अपघटन विधि पर हर चरण के मूल्य पर विशेष रूप से है, यह स्पष्ट रूप से एक एंड-टू-एंड समाधान से बहुत प्रभावी है; एसएलएम से विशेष रूप से ट्यून की जाने वाली बारीकियों के साथ। टीम ने वर्कफ़्लो समन्वयन के लिए [ए AWS फागेट ेट] का उपयोग किया, क्योंकि यह इनहेरिटिव बैक-साइड सिस्टम में मौजूदा के साथ एकीकृत है।
टीम के उत्पाद विकास में, वे अमेज़ॅन बेडरोक गए, जो उच्च प्रदर्शन वाले एलएलएम प्रदान करता है, जिसमें जेनरेटिव कृत्रिम बुद्धिमत्ता अनुप्रयोगों के लिए तैयार किए गए उपयोग में आसान सुविधाएँ हैं। सेजमेकर आगे एलएलएम चयन, गहन अनुकूलन और पारंपरिक एमएल विधियों का समर्थन करता है। इस तकनीक के बारे में अधिक जानने के लिए, [कार्य अपघटन प्राप्त करें और कृत्रिम बुद्धिमत्ता को केवल छोटे एलएलएम के साथ क्यों खरीदा जाएगा] पढ़ें और [अमेज़ॅन फार्मेसी व्यवसाय केस स्टडी] पढ़ें।
सुरक्षा उपायों और एचआईटीएल के साथ एक विश्वसनीय एप्लिकेशन का निर्माण
एचआईपीएए मानकों का पालन करने और रोगी गोपनीयता प्रदान करने के लिए, हमने ए AWS सेवाओं का के साथ काम करने के द्वारा कठोर डेटा प्रशासन प्रथाओं को लागू किया गया, जबकि एक हाइब्रिड विधि को नियोजित किया, इसने अमेज़ॅन बेडरोक एपीआई का उपयोग करके एप्रूवड फाइन-ट्यूनड एलएलएम के साथ [अमेज़ॅन ओपन सर्च सर्विस] का उपयोग करके [पुनर्प्राप्ति संवर्धित जनरेशन] (आरएजी) को मिला दिया। यह संयोजन कुशल ज्ञान पुनर्प्राप्ति को सक्षम करता है जबकि विशिष्ट उप-कार्यों के लिए उच्च सटीकता बनाए रखता है।
एलएलएम भ्रमों का प्रबंधन, जो स्वास्थ्य सेवा में ज़रूरी है, के लिए बड़े डेटासेट पर ठीक ट्यूनिंग से अधिक की आवश्यकता है। हमारे समाधान ने डोमेन-विशिष्ट सुरक्षा उपायों को बनाए रखा जो [अमेज़ॅन बेडरोक गارڈ्रेल्स] पर बनाए गए थे और सिस्टम की विश्वसनीयता बढ़ाने के लिए मानव-इन-द-लूप (एचआईटीएल) पर्यवेक्षण द्वारा पूरक थे।
अमेज़ॅन फार्मेसी टीम फार्मासिस्ट से वास्तविक समय की प्रतिक्रिया और विस्तारित पर्ची प्रारूप क्षमताओं के साथ इस प्रणाली को बढ़ाना जारी रखती है। नवाचार, डोमेन विशेषज्ञता, उन्नत कृत्रिम बुद्धिमत्ता सेवाओं और मानवीय पर्यवेक्षण का यह संतुलित दृष्टिकोण न केवल परिचालन दक्षता में सुधार करता है, बल्कि यह भी सुनिश्चित करता है कि कृत्रिम बुद्धिमत्ता प्रणाली स्वास्थ्य सेवा पेशेवरों को ठीक से सशक्त बनाती है, जिससे इष्टतम रोगी देखभाल प्रदान की जा सके।
जेनरेटिव कृत्रिम बुद्धिमत्ता-आधारित ग्राहक समीक्षा हाइलाइट्स
हमारे पिछले उदाहरण ने दिखाया कि अमेज़ॅन फार्मेसी पर्ची प्रसंस्करण के लिए वास्तविक समय के वर्कफ़्लो में एलएलएम को कैसे एकीकृत करता है, जबकि यह उपयोग का मामला दिखाता है कि इसी तरह की तकनीकों (एसएलएम, पारंपरिक एमएल और विचारशील वर्कफ़्लो डिज़ाइन) को बड़े पैमाने पर [ऑफ़लाइन बैच अनुमान] पर कैसे लागू किया जा सकता है।
अमेज़ॅन ने 200 मिलियन से अधिक वार्षिक उत्पाद समीक्षाओं और रेटिंग को संसाधित करने के लिए [कृत्रिम बुद्धिमत्ता-जनरेटेड ग्राहक समीक्षा हाइलाइट्स] लॉन्च किए। यह सुविधा साझा ग्राहक राय को संक्षिप्त पैराग्राफ में व्यवस्थित करती है, जो उत्पाद और इसकी सुविधाओं के बारे में सकारात्मक, तटस्थ और नकारात्मक प्रतिक्रिया पर प्रकाश डालती है। खरीदार प्रासंगिक ग्राहक समीक्षाओं तक पहुंच प्रदान करके और मूल समीक्षाओं को बरकरार रखकर पारदर्शिता बनाए रखते हुए जल्दी से सहमति प्राप्त कर सकते हैं।
सिस्टम एक इंटरफ़ेस के माध्यम से खरीदारी निर्णयों को बढ़ाता है जहां ग्राहक विशिष्ट सुविधाओं (जैसे छवि गुणवत्ता, रिमोट-कंट्रोल सुविधा, या फायर टीवी की आसान स्थापना) का चयन करके समीक्षा हाइलाइट का पता लगा सकते हैं। इन सुविधाओं को सकारात्मक भावनाओं का प्रतिनिधित्व करने वाले हरे रंग के चेक मार्क, नकारात्मक भावनाओं का प्रतिनिधित्व करने वाले नारंगी ऋण चिह्न और तटस्थता का प्रतिनिधित्व करने वाले भूरे रंग के साथ दर्शाया गया है - जिसका अर्थ है कि खरीदार सत्यापित खरीद समीक्षाओं के आधार पर उत्पाद के फायदे और नुकसान को जल्दी से पहचान सकते हैं।
लागत प्रभावी तरीके से ऑफ़लाइन उपयोग के मामलों के लिए LLM का उपयोग करना
टीम ने पारंपरिक एमएल विधियों को विशेषज्ञ एसएलएम के साथ मिलाकर एक लागत प्रभावी हाइब्रिड आर्किटेक्चर विकसित किया। यह दृष्टिकोण भावना विश्लेषण और कीवर्ड निष्कर्षण को पारंपरिक एमएल को सौंपता है, जबकि जटिल पाठ पीढ़ी कार्यों के लिए अनुकूलित एसएलएम का उपयोग करता है, जिससे सटीकता और प्रसंस्करण दक्षता में सुधार होता है।
यह सुविधा अतुल्यकालिक प्रसंस्करण के लिए [सेजमेकर बैच रूपांतरण] को नियोजित करती है, जो रीयल-टाइम एंडपॉइंट्स की तुलना में लागत में महत्वपूर्ण रूप से कमी प्रदान करती है। लगभग शून्य विलंबता अनुभव प्रदान करने के लिए, समाधान निकाले गए जानकारियों और मौजूदा समीक्षाओं को [कैश] करता है, जिससे प्रतीक्षा समय कम होता है और अतिरिक्त गणना की आवश्यकता के बिना कई ग्राहकों को एक साथ एक्सेस करने की अनुमति मिलती है। सिस्टम नई समीक्षाओं को वृद्धिशील रूप से संसाधित करता है, जिससे डेटासेट को पूरी तरह से पुन: संसाधित किए बिना जानकारियों को अपडेट किया जाता है। इष्टतम प्रदर्शन और लागत दक्षता के लिए, सुविधा बैच रूपांतरण नौकरियों के लिए [अमेज़ॅन इलास्टिक कंप्यूटर क्लाउड] (अमेज़ॅन ईसी2) [इंफ2 इंस्टेंस] का उपयोग करती है, [वैकल्पिक समाधानों की तुलना में 40% तक बेहतर मूल्य-प्रदर्शन प्रदान करती है]।
इस व्यापक दृष्टिकोण का पालन करके, टीम ने प्रभावी ढंग से लागतों का प्रबंधन किया, जबकि बड़ी मात्रा में समीक्षाओं और उत्पादों को संसाधित किया, जिससे समाधान कुशल और स्केलेबल दोनों बन गए।
अमेज़ॅन विज्ञापन एआई-संचालित रचनात्मक छवि और वीडियो पीढ़ी
पिछले उदाहरणों में, हमने मुख्य रूप से पाठ-केंद्रित जेनरेटिव कृत्रिम बुद्धिमत्ता अनुप्रयोगों का पता लगाया, अब हम [अमेज़ॅन विज्ञापन प्रायोजित विज्ञापन रचनात्मक सामग्री पीढ़ी] के साथ बहुआयामी जेनरेटिव कृत्रिम बुद्धिमत्ता की ओर बढ़ते हैं। इस समाधान में [छवि] और [वीडियो] पीढ़ी क्षमताएं हैं, और हम इस अनुभाग में इन सुविधाओं के बारे में विवरण साझा करेंगे। कुल मिलाकर, समाधान का मुख्य भाग [अमेज़ॅन नोवा] रचनात्मक सामग्री पीढ़ी मॉडल का उपयोग करता है।
ग्राहक की जरूरतों से शुरू होकर, अमेज़ॅन द्वारा मार्च 2023 में किए गए एक सर्वेक्षण से पता चला है कि लगभग 75% विज्ञापनदाता विज्ञापन अभियानों को सफल बनाने के लिए संघर्ष करते समय रचनात्मक सामग्री पीढ़ी को अपनी प्राथमिक चुनौती के रूप में सूचीबद्ध करते हैं। कई विज्ञापनदाताओं, विशेष रूप से जिनके पास आंतरिक क्षमता या एजेंसी समर्थन नहीं था, उच्च गुणवत्ता वाले दृश्य बनाने की विशेषज्ञता और लागत के कारण महत्वपूर्ण बाधाओं का सामना करना पड़ा। अमेज़ॅन विज्ञापन समाधान दृश्य सामग्री निर्माण का लोकतंत्रीकरण करता है, जिससे विभिन्न आकारों के विज्ञापनदाताओं के लिए इसे एक्सेस करना और कुशलतापूर्वक उपयोग करना सुलभ हो जाता है। प्रभाव महत्वपूर्ण है: [प्रायोजित ब्रांड] विज्ञापन अभियानों में एआई-जनरेटेड छवियों का उपयोग करने वाले विज्ञापनदाताओं में [क्लिक-थ्रू रेट (सीटीआर)] लगभग 8% है, और गैर-उपयोगकर्ताओं की तुलना में 88% अधिक अभियान सबमिट किए गए हैं।
पिछले साल, ए AWS मशीन लर्निंग ब्लॉग ने एक [विस्तृत छवि पीढ़ी समाधान] पर एक लेख प्रकाशित किया। तब से, अमेज़ॅन ने रचनात्मक छवि पीढ़ी के लिए आधार के रूप में [अमेज़ॅन नोवा कैनवास] को अपनाया है। पाठ या छवि संकेतों का उपयोग करते हुए, पाठ-आधारित संपादन सुविधाओं और रंग योजनाओं और लेआउट समायोजन नियंत्रणों के संयोजन के साथ, पेशेवर-ग्रेड चित्र बनाएं।
सितंबर 2024 में, अमेज़ॅन विज्ञापन टीम ने उत्पाद छवियों से [लघु वीडियो विज्ञापन] बनाने की क्षमता जोड़ी। यह सुविधा [अमेज़ॅन बेडरोक पर उपलब्ध फाउंडेशन मॉडल] का उपयोग करती है ताकि ग्राहकों को प्राकृतिक भाषा के माध्यम से दृश्य शैली, गति, कैमरा आंदोलन, रोटेशन और ज़ूम को नियंत्रित करके नियंत्रण प्रदान किया जा सके। यह वीडियो स्टोरीबोर्ड का वर्णन करने और फिर कहानी सामग्री उत्पन्न करने के लिए एक एजेंट वर्कफ़्लो का उपयोग करता है।
जैसा कि मूल लेख में चर्चा की गई है, [जिम्मेदार कृत्रिम बुद्धिमत्ता] इस समाधान का मूल है, और अमेज़ॅन नोवा रचनात्मक मॉडल सुरक्षित और जिम्मेदार कृत्रिम बुद्धिमत्ता उपयोग का समर्थन करने के लिए अंतर्निहित नियंत्रणों के साथ आता है, जिसमें वॉटरमार्किंग और सामग्री ऑडिट शामिल हैं।
समाधान छवि और वीडियो पीढ़ी प्रक्रियाओं के सर्वर रहित समन्वय के लिए [ ए AWS स्टेप फंक्शंस] और [ ए AWS लैम्ब्डा] फ़ंक्शन का उपयोग करता है। उत्पन्न सामग्री को [अमेज़ॅन सिंपल स्टोरेज सर्विस] (अमेज़ॅन एस3) में संग्रहीत किया जाता है, मेटाडेटा को डायनामोडीबी में संग्रहीत किया जाता है, जबकि [ अमेज़ॅन एपीआई गेटवे] पीढ़ी कार्यक्षमताओं तक ग्राहक पहुंच प्रदान करता है। अब समाधान अमेजॅन बेडक्रॉक गार्ड्रेल्स को शामिल करता है, विभिन्न चरणों में अतिरिक्त सुरक्षा जांच के लिए [ अमेजॅन रेकग्निशन] और [ अमेज़ॅन कॉम्प्रिहेंड] एकीकरण को बनाए रखने के अलावा
बड़ी मात्रा में उच्च गुणवत्ता वाले विज्ञापन रचनात्मक बनाने से जटिल चुनौतियाँ आती हैं। जेनरेटिव कृत्रिम बुद्धिमत्ता मॉडल को ब्रांड पहचान के साथ-साथ सभी तकनीकी स्तरों के विज्ञापनदाताओं के लिए आसान पहुंच बनाए रखते हुए विभिन्न उत्पाद श्रेणियों और विज्ञापन वातावरणों में आकर्षक और उपयुक्त चित्र बनाने की आवश्यकता होती है। गुणवत्ता आश्वासन और सुधार छवि और वीडियो पीढ़ी क्षमताओं की नींव हैं। यह प्रणाली [ अमेज़ॅन सेजमेकर ग्राउंड ट्रुथ] के माध्यम से लागू की गई एक व्यापक एचआईटीएल प्रक्रिया के माध्यम से लगातार बढ़ रही है। यह कार्यान्वयन एक शक्तिशाली उपकरण प्रदान करता है जो विज्ञापनदाताओं की निर्माण प्रक्रिया को बदल सकता है, जिससे विभिन्न उत्पाद श्रेणियों और वातावरणों में उच्च गुणवत्ता वाली दृश्य सामग्री निर्माण अधिक सुलभ हो जाती है।
यह सिर्फ शुरुआत है कि अमेज़ॅन विज्ञापन उन विज्ञापनदाताओं की मदद करने के लिए जेनरेटिव कृत्रिम बुद्धिमत्ता का उपयोग कैसे करता है जिन्हें अपने विज्ञापन लक्ष्यों के लिए उपयुक्त सामग्री बनाने की आवश्यकता होती है। यह समाधान दर्शाता है कि कैसे निर्माण बाधाओं को कम करने से विज्ञापन अभियानों में सीधे सुधार हो सकता है, जबकि जिम्मेदार कृत्रिम बुद्धिमत्ता उपयोग के उच्च मानकों को बनाए रखा जा सकता है।
महत्वपूर्ण तकनीकी अनुभव और चर्चा
गैर-संवादी अनुप्रयोगों को एक दृढ़ता से सत्यापन तंत्र और मजबूत सुरक्षा उपायों की आवश्यकता होती है, इसकी स्वायत्तता को देखते हुए, लेकिन उच्च विलंबता सहनशीलता से लाभान्वित होता है, जिससे बैच प्रक्रिया शुरू करने की क्षमता के साथ कैशिंग होता है। इन जानकारियों को संवादी कृत्रिम बुद्धिमत्ता के साथ कार्य कार्यान्वयन पर भी लागू किया जाता है:
- कार्य अपघटन और एजेंट वर्कफ़्लो – जटिल समस्याओं को छोटे घटकों में तोड़ने को विभिन्न कार्यान्वयनों में मूल्यवान साबित किया गया है। डोमेन विशेषज्ञों द्वारा यह गहरा विचारोत्तेजक अपघटन विशिष्ट उप-कार्यों के लिए विशेष मॉडल बनाने में सक्षम बनाता है, जैसा कि अमेज़ॅन फार्मेसी पर्ची प्रसंस्करण में दर्शाया गया है, जिसमें फाइन-ट्यून किए गए एसएलएम खुराक पहचान जैसे असतत कार्यों को संभाल सकते हैं। यह रणनीति स्पष्ट सत्यापन चरणों के साथ विशेष एजेंटों के निर्माण की अनुमति देती है, जिससे विश्वसनीयता में सुधार होता है और रखरखाव सरल हो जाता है। अमेज़ॅन विक्रेता उत्पाद लिस्टिंग उपयोग का मामला अलग पीढ़ी और सत्यापन प्रक्रियाओं के साथ अपने बहु-चरणीय वर्कफ़्लो के माध्यम से इसका उदाहरण देता है। इसके अतिरिक्त, समीक्षा हाइलाइट उपयोग का मामला लागत प्रभावी और नियंत्रित एलएलएम उपयोग प्रदर्शित करता है, अर्थात् पारंपरिक एमएल का उपयोग करके प्रीप्रोसेसिंग और एलएलएम कार्यों के साथ संबद्ध होने वाले हिस्सों को निष्पादित करना।
- हाइब्रिड आर्किटेक्चर और मॉडल चयन – शुद्ध एलएलएम दृष्टिकोण की तुलना में, पारंपरिक एमएल के साथ एलएलएम को संयोजित करने से बेहतर नियंत्रण और लागत प्रभावशीलता मिलती है। पारंपरिक एमएल अच्छी तरह से परिभाषित कार्यों को संभालने में उत्कृष्ट है, जैसा कि भावना विश्लेषण और जानकारी निकालने के लिए समीक्षा हाइलाइट प्रणाली में दिखाया गया है। अमेज़ॅन टीम ने अमेज़ॅन फार्मेसी के कार्यान्वयन जैसे प्रभावी डोमेन-विशिष्ट अनुप्रयोगों के लिए रैगू को फाइन-ट्यूनिंग के साथ संयोजित करके, आवश्यकताओं के आधार पर बड़े और छोटे भाषा मॉडल को रणनीतिक रूप से तैनात किया है।
- लागत अनुकूलन रणनीति – अमेज़ॅन टीम ने बैच प्रोसेसिंग के माध्यम से दक्षता हासिल की, उच्च-वोल्यूमिनिक ऑपरेशनों के लिए कैशिंग तंत्र, विशेषज्ञ उदाहरण प्रकार जैसे [ ए AWS इनफेरेंटिया] और [ ए AWS ट्रेनिंयम], कर्सर ऑप्टिमाइज़ेशन सेलेक्शन। समीक्षा हाइलाइट इंक्रीमेंटल प्रोसेसिंग को दर्शाती है गणना कैसे कम करें आवश्यकताओं को कम करना, जबकि अमेज़ॅन विज्ञापन एक अमेज़ॅन नोवा [फाउंडेशन मॉडल] (एफएम) का उपयोग करके कुशल रचनात्मिक निर्माण करता है सामग्री का उत्पादन।
- गुणवत्ता आश्वासन और नियंत्रण तंत्र – गुणवत्ता नियंत्रण अमेज़ॅन बेडक्रॉक गार्ड्रेल के माध्यम से विशिष्ट डोमेन-विशिष्ट सुरक्षा उपायों और स्वचालित परीक्षण के साथ मानव मूल्यांकन के संयोजन वाले बहु-परत सत्यापन पर निर्भर करता है। पीढ़ी और सत्यापन के लिए दोहरी एलएलएम विधि अमेज़ॅन विक्रेता उत्पाद लिस्टिंग में मतिभ्रम को रोकने में मदद करती है, जबकि स्व-प्रतिबिंब तकनीक सटीकता में सुधार करती है। अमेज़ॅन नोवा रचनात्मक एफएम अंतर्निहित जिम्मेदार एआई नियंत्रण प्रदान करता है और चल रहे ए/बी परीक्षण और प्रदर्शन माप द्वारा पूरक है।
- एचआईटीएल कार्यान्वयन – एचआईटीएल दृष्टिकोण कई परतों को फैलाता है, फार्मासिस्टों के विशेषज्ञ मूल्यांकन से लेकर बिक्री भागीदारों से अंतिम उपयोगकर्ता प्रतिक्रिया तक। अमेज़ॅन टीम ने संरचित सुधार वर्कफ़्लो स्थापित किए हैं, जिससे विशिष्ट डोमेन आवश्यकताओं और जोखिम प्रोफाइल के आधार पर स्वचालन और मानव पर्यवेक्षण को संतुलित किया जा सके।
- जिम्मेदार कृत्रिम बुद्धिमत्ता और अनुपालन – जिम्मेदार कृत्रिम बुद्धिमत्ता प्रथाओं में विनियमित वातावरण के लिए सामग्री अंतर्ग्रहण सुरक्षा उपाय और एचआईपीएए जैसे नियमों का अनुपालन शामिल हैं। अमेज़ॅन टीम ने उपयोगकर्ता-सामना वाले अनुप्रयोगों के लिए सामग्री ऑडिट को एकीकृत किया है, समीक्षा हाइलाइट की पारदर्शिता को स्रोत जानकारी तक पहुंच प्रदान करके रखरखाव किया है और गुणवत्ता और अनुपालन में सुधार के लिए निगरानी के साथ डेटा प्रशासन को लागू किया है।
ये पैटर्न स्केलेबल, विश्वसनीय और लागत प्रभावी जेनरेटिव कृत्रिम बुद्धिमत्ता समाधान के लिए अनुमति देते हैं, जबकि गुणवत्ता और उत्तरदायित्व मानकों को बनाए रखते हैं। ये कार्यान्वयन दिखाते हैं कि एक प्रभावी समाधान को न केवल उन्नत मॉडल की आवश्यकता होती है, बल्कि वास्तुकला, संचालन और शासन पर ध्यान से ध्यान देना भी होता है, जो ए AWS सेवाओं और स्थापित प्रथाओं द्वारा समर्थित होता है।
आगे बढ़ने के लिए कदम
इस लेख में साझा किए गए अमेज़ॅन उदाहरण बताते हैं कि जेनरेटिव कृत्रिम बुद्धिमत्ता पारंपरिक संवादी सहायकों से परे मूल्य कैसे बना सकती है। हम आपको इन उदाहरणों का पालन करने या अपने स्वयं के समाधान बनाने के लिए आमंत्रित करते हैं ताकि यह पता चल सके कि जेनरेटिव कृत्रिम बुद्धिमत्ता आपके व्यवसाय या यहां तक कि आपके उद्योग को कैसे फिर से आकार दे सकती है। आप विचार प्रक्रिया शुरू करने के लिए [ ए AWS जनरेटिव कृत्रिम बुद्धिमत्ता उपयोग के मामले] पृष्ठ पर जा सकते हैं।
ये उदाहरण बताते हैं कि प्रभावी जेनरेटिव कृत्रिम बुद्धिमत्ता कार्यान्वयन अक्सर विभिन्न प्रकार के मॉडल और वर्कफ़्लो के संयोजन से लाभान्वित होते हैं। यह जानने के लिए कि कौन से एफएम ए AWS सेवाओं द्वारा समर्थित हैं, [ अमेज़ॅन बेडरोक में समर्थित फाउंडेशन मॉडल] और [ अमेज़ॅन सेजमेकर जंप स्टार्ट फाउंडेशन मॉडल] देखें। हम आपको [ अमेज़ॅन बेडरोक प्रवाह] का पता लगाने की भी सलाह देते हैं, जो वर्कफ़्लो के निर्माण के मार्ग को सरल बना सकता है। इसके अतिरिक्त, हम आपको याद दिलाते हैं कि ट्रेनिंयम और इनफेरेंटिया त्वरक इन अनुप्रयोगों में महत्वपूर्ण लागत बचत प्रदान करते हैं।
जैसा कि हमने उदाहरणों में समझाया है, एजेंट वर्कफ़्लो विशेष रूप से मूल्यवान साबित हुए हैं। वर्कफ़्लो को त्वरित रूप से निर्मित करने के लिए हम आपको [ अमेज़ॅन बेडरोक एजेंट] को ब्राउज़ करने की सलाह देते हैं।
जेनरेटिव कृत्रिम बुद्धिमत्ता को सफलतापूर्वक लागू करना सिर्फ मॉडल चयन से अधिक है - यह प्रयोग से लेकर एप्लिकेशन मॉनिटरिंग तक एक व्यापक सॉफ्टवेयर विकास प्रक्रिया का प्रतिनिधित्व करता है। इन आवश्यक सेवाओं में अपनी नींव का निर्माण शुरू करने के लिए, हम आपको [ अमेज़ॅन क्विक स्टार्ट] ब्राउज़ करने के लिए आमंत्रित करते हैं।
अमेज़ॅन कृत्रिम बुद्धिमत्ता का उपयोग कैसे करता है, इसके बारे में अधिक जानकारी के लिए, अमेज़ॅन न्यूज़ में [कृत्रिम बुद्धिमत्ता] देखें।