जनरेटिव्ह आर्टिफिशियल इंटेलिजन्स (Generative AI) विविध ॲप्लिकेशन्सच्या माध्यमातून व्यवसाय कार्यान्वित करण्याच्या पद्धतीत पूर्णपणे बदल घडवत आहे. यात ॲमेझॉनच्या मालकीचे Rufus आणि Amazon Seller Assistant यांसारख्या संभाषणात्मक (conversational) सहाय्यकांचा समावेश आहे. याव्यतिरिक्त, काही अत्यंत प्रभावी जनरेटिव्ह एआय ॲप्लिकेशन्स पडद्यामागे स्वायत्तपणे (autonomously) कार्य करतात. हे एक अत्यावश्यक वैशिष्ट्य आहे, जे कंपन्यांना त्यांचे कामकाज, डेटा प्रक्रिया आणि सामग्री निर्मिती मोठ्या प्रमाणात रूपांतरित करण्यास सक्षम करते. हे गैर-संभाषणात्मक कार्यान्वयन (non-conversational implementations) सामान्यतः मोठ्याभाषिक मॉडेलद्वारे (Large Language Models - LLM) समर्थित असलेल्या ‘एजंट वर्कफ्लो’ (agent workflow) च्या स्वरूपात दिसून येतात. यात विशिष्ट व्यवसायिक उद्दिष्ट्ये साध्य करण्यासाठी थेट वापरकर्त्याच्या संवादाची आवश्यकता नसते आणि ते विविध उद्योगांमध्ये कार्य करू शकतात.
रिअल-टाइम वापरकर्ता अभिप्राय (real-time user feedback) आणि पर्यवेक्षणामुळे संभाषणात्मक ॲप्लिकेशन्सना वेगळे फायदे मिळतात, तर गैर-संभाषणात्मक ॲप्लिकेशन्समध्ये उच्च ‘लेटेंसी टॉलरन्स’ (latency tolerance), ‘बॅच प्रोसेसिंग’ (batch processing) आणि ‘कॅशिंग’ (caching) यांसारखे अद्वितीय फायदे आहेत. तथापि, त्यांच्या स्वायत्त स्वरूपामुळे अधिक मजबूत सुरक्षा उपायांची आणि विस्तृत गुणवत्ता हमीची आवश्यकता असते.
या लेखात, ॲमेझॉनच्या जनरेटिव्ह एआयच्या चार वेगवेगळ्या ॲप्लिकेशन प्रकरणांचा शोध घेतला आहे:
- ॲमेझॉन उत्पादन माहिती निर्मिती आणि कॅटलॉग डेटा गुणवत्ता सुधारणा (Amazon product information creation and catalog data quality improvement) – LLM कशा प्रकारे मोठ्या प्रमाणावर उच्च-गुणवत्तेची उत्पादन माहिती तयार करण्यासाठी मदत करतात हे स्पष्ट करते.
- ॲमेझॉन फार्मसीमध्ये प्रिस्क्रिप्शन प्रक्रिया (Prescription processing in Amazon Pharmacy) – उच्च नियामक वातावरणातील (highly regulated environment) अंमलबजावणी आणि ‘एजंट वर्कफ्लो’ साठी कार्य विभाजन (task decomposition) दर्शवते.
- समीक्षा ठळक मुद्दे (Review Highlights) – मोठ्या प्रमाणात बॅच प्रोसेसिंग, पारंपरिक मशीन लर्निंग (Machine Learning - ML) एकत्रीकरण (integration), लहान LLM चा वापर आणि खर्च-प्रभावी (cost-effective) उपाय स्पष्ट करते.
- ॲमेझॉन ॲडव्हर्टायझिंग क्रिएटिव्ह प्रतिमा आणि व्हिडिओ निर्मिती (Amazon Advertising creative image and video generation) – सर्जनशील कार्यात मल्टीमॉडल जनरेटिव्ह एआय (multimodal generative AI) आणि जबाबदार एआय पद्धती (responsible AI practices) यावर प्रकाश टाकते.
प्रत्येक केस स्टडी (case study) तांत्रिक आर्किटेक्चरपासून (technical architecture) ते ऑपरेशनल विचारांपर्यंत (operational considerations) गैर-संभाषणात्मक जनरेटिव्ह एआय ॲप्लिकेशन्सच्या अंमलबजावणीचे विविध पैलू उघड करते. या उदाहरणांद्वारे, Amazon Bedrock आणि Amazon SageMaker यांसारख्या AWS सेवांचा संपूर्ण संच (full suite) यशस्वीतेसाठी महत्त्वाचा कसा आहे हे आपण शिकतो. शेवटी, विविध उपयोगांमध्ये (use cases) सामायिक केलेले महत्त्वाचे अनुभव सूचीबद्ध केले आहेत.
ॲमेझॉनवर उच्च-गुणवत्तेची उत्पादन माहिती तयार करणे (Creating High-Quality Product Information on Amazon)
उत्पादनाबद्दलची सर्वंकष माहिती (comprehensive details) देऊन उच्च-गुणवत्तेची उत्पादन माहिती तयार करणे, ग्राहकांना माहितीपूर्ण खरेदी निर्णय घेण्यास मदत करते. पारंपरिकपणे, विक्रेते (selling partners) प्रत्येक उत्पादनाची अनेक वैशिष्ट्ये (attributes) स्वतःहून (manually) प्रविष्ट करतात. 2024 मध्ये सादर केलेले नवीन जनरेटिव्ह एआय सोल्यूशन (solution), ब्रँड वेबसाइट्स (brand websites) आणि इतर स्त्रोतांकडून सक्रियपणे उत्पादनाची माहिती मिळवून ग्राहक अनुभव सुधारते, ज्यामुळे ही प्रक्रिया बदलते.
जनरेटिव्ह एआय माहिती विविध स्वरूपात (जसे की URL, उत्पादन प्रतिमा किंवा स्प्रेडशीट) इनपुट (input) करण्यास समर्थन देऊन आणि ती आपोआप आवश्यक संरचनेत (structure) आणि स्वरूपात रूपांतरित करून विक्रेत्यांचा अनुभव सुलभ करते. 900,000 हून अधिक विक्रेत्यांनी याचा वापर केला आहे आणि तयार केलेल्या उत्पादन माहितीच्या जवळपास 80% मसुद्या स्वीकारल्या जातात, ज्यात अगदी कमी संपादन (editing) करण्याची आवश्यकता असते. एआय-जनरेटेड (AI-generated) सामग्री (content) उत्पादनाची सर्वंकष माहिती प्रदान करते, जी स्पष्टता आणि अचूकता सुधारण्यास मदत करते, ज्यामुळे ग्राहकांच्या शोधात उत्पादने शोधली जाण्याची शक्यता वाढते.
नवीन उत्पादन माहितीसाठी, विक्रेत्याने प्राथमिक माहिती (initial information) प्रदान केल्याने वर्कफ्लो (workflow) सुरू होतो. त्यानंतर, सिस्टीम (system) शीर्षक, वर्णन आणि तपशीलवार वैशिष्ट्यांसह (detailed attributes) संपूर्ण उत्पादन माहिती तयार करण्यासाठी अनेक माहिती स्त्रोतांचा वापर करते. तयार केलेली (generated) उत्पादन माहिती मंजुरी (approval) किंवा संपादनासाठी (editing) विक्रेत्यासोबत सामायिक केली जाते.
विद्यमान उत्पादन माहितीसाठी, सिस्टीम अतिरिक्त डेटा वापरून आणखी समृद्ध (enrich) करता येतील अशा उत्पादनांची ओळख करते.
मोठ्या प्रमाणात आउटपुटसाठी डेटा एकत्रीकरण आणि प्रक्रिया (Data Integration and Processing for Large-Scale Output)
ॲमेझॉनच्या टीमने Amazon Bedrock आणि इतर AWS सेवा वापरून LLM-फ्रेंडली API साठी मजबूत अंतर्गत आणि बाह्य स्त्रोत कनेक्टर (connectors) तयार केले आहेत, ज्यामुळे Amazon.com च्या बॅकएंड सिस्टीममध्ये (backend systems) अखंडपणे (seamlessly) एकत्रीकरण होते.
50 हून अधिक गुणधर्मांमध्ये (attributes) (ज्यात मजकूर आणि संख्यात्मक डेटा (numerical data) समाविष्ट आहे) सुसंगत (coherent) उत्पादन माहितीमध्ये विविध डेटा एकत्रित करणे हे एक मोठे आव्हान आहे. LLM ला अचूकपणे ई-कॉमर्स (e-commerce) संकल्पना स्पष्ट करण्यासाठी विशिष्ट नियंत्रण यंत्रणा (control mechanisms) आणि सूचनांची आवश्यकता असते, कारण ते इतक्या जटिल, विविध डेटासह सर्वोत्तम कार्यप्रदर्शन (optimal performance) देऊ शकत नाहीत. उदाहरणार्थ, LLM “क्षमते”ला (capacity) चाकूच्या ब्लॉकमधील स्लॉटची संख्या (number of slots) म्हणून चुकीचे समजू शकते किंवा “फिट वेअर” (Fit Wear) ला ब्रँड नावाऐवजी (brand name) शैलीचे वर्णन (style description) म्हणून गृहीत धरू शकते. अशा परिस्थितीत, ‘प्रॉम्प्ट इंजिनीअरिंग’ (prompt engineering) आणि ‘फाइन-ट्यूनिंग’चा (fine-tuning) मोठ्या प्रमाणावर उपयोग केला जातो.
LLM चा वापर करून निर्मिती आणि पडताळणी (Generation and Verification using LLM)
तयार केलेली उत्पादन माहिती पूर्ण आणि अचूक असावी. हे उद्दिष्ट साध्य करण्यासाठी, सोल्यूशन एक बहु-चरण (multi-step) वर्कफ्लो लागू करते, जे गुणधर्मांची (attributes) निर्मिती आणि पडताळणी करण्यासाठी LLM चा वापर करते. ही दुहेरी LLM पद्धत ‘हॅल्युसिनेशन’ (hallucinations) टाळण्यास मदत करते, जे सुरक्षा धोके (safety hazards) किंवा तांत्रिक वैशिष्ट्ये (technical specifications) हाताळताना महत्त्वाचे आहे. टीमने प्रगत ‘सेल्फ-रिफ्लेक्शन’ (self-reflection) तंत्रज्ञान विकसित केले आहे, जेणेकरून निर्मिती आणि पडताळणी प्रक्रिया एकमेकांना प्रभावीपणे पूरक ठरतील.
मानवी अभिप्रायासह बहु-स्तरीय गुणवत्ता हमी (Multi-Layered Quality Assurance with Human Feedback)
मानवी अभिप्राय (human feedback) हे सोल्यूशनच्या गुणवत्ता हमीचा (quality assurance) एक महत्त्वाचा भाग आहे. या प्रक्रियेत Amazon.com च्या तज्ञांकडून प्राथमिक मूल्यांकन (initial assessment) आणि विक्रेत्यांकडून (selling partners) मंजुरी किंवा संपादनासाठी (editing) इनपुटचा समावेश असतो. हे उच्च-गुणवत्तेचे आउटपुट (output) प्रदान करते आणि एआय मॉडेल (AI model) सतत सुधारण्यास सक्षम करते.
गुणवत्ता हमी प्रक्रियेत ML, अल्गोरिदम (algorithms) किंवा LLM-आधारित मूल्यांकनांचा (LLM-based evaluations) समावेश असलेल्या स्वयंचलित चाचणी पद्धतींचा (automated testing methods) समावेश आहे. अयशस्वी उत्पादन माहिती पुन्हा तयार केली जाते आणि यशस्वी उत्पादन माहितीची पुढील चाचणी केली जाते. [कारणात्मक अनुमान मॉडेल] (causal inference model) वापरून, आम्ही उत्पादन माहितीच्या कार्यक्षमतेवर परिणाम करणारे अंतर्निहित वैशिष्ट्ये (underlying characteristics) आणि समृद्धीच्या संधी (enrichment opportunities) निश्चित करतो. शेवटी, गुणवत्ता तपासणीद्वारे (quality checks) तपासलेली आणि विक्रेत्याने स्वीकारलेली उत्पादन माहिती प्रकाशित केली जाते, ज्यामुळे ग्राहकांना अचूक आणि सर्वंकष उत्पादन माहिती मिळेल याची खात्री होते.
अचूकता आणि खर्चासाठी ॲप्लिकेशन-स्तरीय सिस्टीम ऑप्टिमायझेशन (Application-Level System Optimization for Accuracy and Cost)
अचूकता आणि पूर्णतेच्या उच्च मानकांमुळे, टीमने एक व्यापक (comprehensive) प्रायोगिक (experimental) दृष्टिकोन स्वीकारला आहे आणि स्वयंचलित ऑप्टिमायझेशन सिस्टीमने (automated optimization system) सज्ज आहे. ही सिस्टीम LLM, प्रॉम्प्ट्स (prompts), प्लेबुक्स (playbooks), वर्कफ्लो (workflows) आणि एआय टूल्सच्या (AI tools) विविध संयोजनांचा शोध घेते, ज्यामुळे खर्चासह उच्च व्यवसाय मेट्रिक्स (business metrics) सुधारता येतील. सतत मूल्यांकन (continuous assessment) आणि स्वयंचलित चाचणीद्वारे (automated testing), उत्पादन माहिती जनरेटर कार्यक्षमतेत (performance), खर्चात (cost) आणि कार्यक्षमतेत (efficiency) प्रभावीपणे संतुलन साधू शकते, तसेच नवीन एआय विकासांना (AI developments) स्वीकारू शकते. या दृष्टिकोन म्हणजे ग्राहकांना उच्च-गुणवत्तेच्या उत्पादन माहितीचा लाभ मिळू शकतो आणि विक्रेत्यांना कार्यक्षम उत्पादन माहिती निर्मितीसाठी अत्याधुनिक (cutting-edge) साधनांमध्ये प्रवेश मिळू शकतो.
ॲमेझॉन फार्मसीमध्ये जनरेटिव्ह एआय-आधारित प्रिस्क्रिप्शन प्रक्रिया (Generative AI-Based Prescription Processing in Amazon Pharmacy)
वर चर्चा केलेल्या विक्रेता उत्पादन माहितीच्या उदाहरणामध्ये, मानवी-मशीन मिश्रित वर्कफ्लोवर (human-machine hybrid workflow) आधारित, ॲमेझॉन फार्मसी [हेल्थ इन्शुरन्स पोर्टेबिलिटी अँड अकाउंटेबिलिटी ॲक्ट] (Health Insurance Portability and Accountability Act - HIPAA) द्वारे नियंत्रित उद्योगात (regulated industry) हेच तत्त्व (principle) कसे लागू केले जातात हे दर्शवते. [ॲमेझॉन फार्मसी Amazon SageMaker वापरून LLM-आधारित चॅटबॉट (chatbot) कसे तयार करते] या लेखात, आम्ही रुग्ण-काळजी तज्ञांसाठी (patient-care specialists) संभाषणात्मक सहाय्यकावर (conversational assistant) लक्ष केंद्रित केले होते आणि आता आम्ही स्वयंचलित प्रिस्क्रिप्शन प्रक्रियेवर (automated prescription processing) लक्ष केंद्रित करत आहोत.
ॲमेझॉन फार्मसीमध्ये, आम्ही Amazon Bedrock आणि SageMaker वर आधारित एक एआय सिस्टीम (AI system) विकसित केली आहे, जी फार्मासिस्ट टेक्निशियनना (pharmacist technicians) औषधांच्या सूचना अधिक अचूकपणे आणि कार्यक्षमतेने (efficiently) process करण्यास मदत करते. हे सोल्यूशन मानवी तज्ञांना (human experts) LLM मध्ये एकत्रित करते, जेणेकरून ते दिशा (directions) तयार करण्याच्या आणि प्रमाणित (validate) करण्याच्या भूमिकेत मदत करू शकतील, ज्यामुळे रुग्णांच्या औषधांच्या निर्देशांची अचूकता वाढेल.
आरोग्यसेवा अचूकतेसाठी डेलिगेटेड वर्कफ्लो डिझाइन (Delegated Workflow Design for Healthcare Accuracy)
प्रिस्क्रिप्शन प्रक्रिया सिस्टीम (prescription processing system) दिशा (directions) सूचना आणि अभिप्राय (feedback) देण्यासाठी मानवी कौशल्ये (डेटा एंट्री ऑपरेटर आणि फार्मासिस्ट) आणि एआय समर्थनाचा (AI support) वापर करते. वर्कफ्लो (workflow) फार्मसी नॉलेज बेस प्रीप्रोसेसरने (pharmacy knowledge base preprocessor) सुरू होतो, जो [Amazon DynamoDB] मधील मूळ (raw) प्रिस्क्रिप्शन मजकूर प्रमाणित (normalize) करतो. त्यानंतर SageMaker वरील फाइन-ट्यून केलेल्या (fine-tuned) लहान भाषिक मॉडेलचा (Small Language Model - SLM) उपयोग करून महत्त्वाचे घटक (डोस, वारंवारता) ओळखले जातात.
सिस्टीम डेटा एंट्री ऑपरेटर (data entry operators) आणि फार्मासिस्ट (pharmacists) यांसारख्या तज्ञांना अखंडपणे एकत्रित करते, जिथे जनरेटिव्ह एआय संपूर्ण वर्कफ्लोला पूरक ठरते, ज्यामुळे चपळता (agility) आणि अचूकता सुधारते आणि आमच्या रुग्णांना अधिक चांगली सेवा मिळते. त्यानंतर, सुरक्षा उपायांसह (safety measures) दिशा असेंबली सिस्टीम (direction assembly system), डेटा एंट्री ऑपरेटरसाठी सूचना तयार करते, जेणेकरून ते सूचना मॉड्यूलद्वारे (suggestion module) त्यांनी टाइप केलेल्या दिशा तयार करू शकतील. मार्किंग मॉड्यूल (marking module) त्रुटी (errors) चिन्हांकित (mark) किंवा दुरुस्त (correct) करते आणि डेटा एंट्री ऑपरेटरना दिलेल्या अभिप्रायाचा (feedback) भाग म्हणून अतिरिक्त सुरक्षा उपाय (safety measures) लागू करते. तंत्रज्ञ (technicians) शेवटी उच्च अचूकता आणि सुरक्षितपणे टाइप केलेल्या दिशा निश्चित करतात, जे फार्मासिस्टना अभिप्राय देण्यासाठी किंवा पुढील कार्यवाहीसाठी (downstream services) दिशा कार्यान्वित करण्यासाठी उपलब्ध असतात.
या सोल्यूशनमधील (solution) एक महत्त्वाचा भाग म्हणजे ‘कार्य विभाजनाचा’ (task decomposition) वापर, जो अभियंते (engineers) आणि शास्त्रज्ञांना संपूर्ण प्रक्रियेला अनेक चरणांमध्ये विभाजित करण्यास सक्षम करतो. यात उप-चरणांचा (sub-steps) समावेश असलेले विविध मॉड्यूल्स (modules) आहेत. टीमने फाइन-ट्यून केलेल्या SLM चा मोठ्या प्रमाणावर उपयोग केला. याव्यतिरिक्त, प्रक्रियेत पारंपरिक ML प्रोग्राम (traditional ML programs) जसे की [नेमड एंटिटी रिकग्निशन (Named Entity Recognition - NER)] किंवा अंतिम आत्मविश्वासाचा (final confidence) अंदाज लावण्यासाठी [रिग्रेशन मॉडेल] (regression model) चा वापर केला जातो. SLM आणि पारंपरिक ML चा वापर या नियंत्रित (controlled) आणि स्पष्टपणे परिभाषित केलेल्या प्रक्रियेत (explicitly defined process) केल्याने प्रक्रिया गती लक्षणीयरीत्या (significantly) वाढवते, तर विशिष्ट चरणांमध्ये योग्य सुरक्षा उपायांमुळे कडक सुरक्षा मानके (strict safety standards) राखली जातात.
सिस्टीममध्ये अनेक स्पष्टपणे परिभाषित केलेले उप-चरण (sub-steps) समाविष्ट आहेत, ज्यात प्रत्येक उप-प्रक्रिया (sub-process) विशेष घटक म्हणून कार्य करते आणि संपूर्ण उद्दिष्टांच्या दिशेने अर्ध-स्वायत्त (semi-autonomous) परंतु सहकार्याने (collaboratively) कार्य करते. विभागणीचा (decomposition) हा दृष्टिकोन प्रत्येक टप्प्यावर विशिष्ट प्रमाणीकरण (validation) करतो, जे ‘एंड-टू-एंड’ (end-to-end) सोल्यूशनपेक्षा (solution) अधिक प्रभावी असल्याचे सिद्ध होते. तसेच, यात फाइन-ट्यून केलेले SLM वापरले जाऊ शकतात. टीमने वर्कफ्लो (workflow) समन्वयित (coordinate) करण्यासाठी [AWS Fargate] चा उपयोग केला, कारण ते सध्याच्या बॅकएंड सिस्टीममध्ये (backend system) एकत्रित (integrated) आहे.
टीमच्या उत्पादन विकास प्रक्रियेदरम्यान, त्यांनी Amazon Bedrock कडे मोर्चा वळवला, जे जनरेटिव्ह एआय ॲप्लिकेशन्ससाठी (generative AI applications) तयार केलेल्या वापरण्यास सोप्या वैशिष्ट्यांसह उच्च-कार्यक्षमतेचे (high-performance) LLM प्रदान करते. SageMaker अतिरिक्त LLM निवड, अधिक सखोल सानुकूलन (customization) आणि पारंपरिक ML पद्धतींना समर्थन देते. या तंत्रज्ञानाबद्दल अधिक माहितीसाठी, [कार्य विभाजन आणि लहान LLM कशा प्रकारे एआयला अधिक परवडणारे बनवू शकतात] हे वाचा आणि [ॲमेझॉन फार्मसी व्यवसाय केस स्टडी] (Amazon Pharmacy business case study) चा अभ्यास करा.
सुरक्षा उपाय आणि HITL सह एक विश्वासार्ह ॲप्लिकेशन तयार करणे (Building a Reliable Application with Safety Measures and HITL)
HIPAA मानकांचे पालन (compliance) करण्यासाठी आणि रुग्णांची गोपनीयता (patient privacy) जपण्यासाठी, आम्ही कडक डेटा गव्हर्नन्स पद्धती (data governance practices) लागू केल्या आहेत. तसेच, Amazon Bedrock API वापरून फाइन-ट्यून केलेले LLM आणि [Amazon OpenSearch Service] वापरून [रिट्रिव्हल ॲ augmented जनरेशन] (Retrieval Augmented Generation - RAG) एकत्रित करणारी संकरित (hybrid) पद्धत अवलंबली आहे. हे संयोजन कार्यक्षम ज्ञान प्राप्ती (knowledge retrieval) सक्षम करते, तर विशिष्ट उप-कार्यांसाठी (sub-tasks) उच्च अचूकता (high precision) राखते.
LLM ‘हॅल्युसिनेशन’ (hallucinations) व्यवस्थापित (manage) करणे (जे आरोग्यसेवा क्षेत्रात (healthcare sector) महत्त्वपूर्ण आहे) हे मोठ्या डेटासेटवर फाइन-ट्यूनिंग करण्यापेक्षा अधिक आवश्यक आहे. आमच्या सोल्यूशनने [Amazon Bedrock Guardrails] वर आधारित डोमेन-विशिष्ट सुरक्षा उपाय (domain-specific safety measures) लागू केले आहेत आणि सिस्टीमची (system) विश्वासार्हता सुधारण्यासाठी मानवी-इन-द-लूप (Human-in-the-Loop - HITL) पर्यवेक्षणाद्वारे (supervision) ते पूरक आहेत.
ॲमेझॉन फार्मसी टीम फार्मासिस्टकडून (pharmacists) रिअल-टाइम अभिप्राय (real-time feedback) आणि विस्तारित प्रिस्क्रिप्शन स्वरूप क्षमतांद्वारे (extended prescription format capabilities) सिस्टीम सुधारणे सुरू ठेवते. नवोपक्रम (innovation), डोमेन कौशल्य (domain expertise), प्रगत एआय सेवा (advanced AI services) आणि मानवी पर्यवेक्षण (human supervision) यांचा हा संतुलित दृष्टिकोन केवळ कार्यान्वयन क्षमता (operational efficiency) वाढवत नाही, तर एआय सिस्टीम आरोग्यसेवा व्यावसायिकांना (healthcare professionals) योग्यरित्या सक्षम करते, ज्यामुळे रुग्णांची सर्वोत्तम काळजी (optimal patient care) घेणे शक्य होते.
जनरेटिव्ह एआय-आधारित ग्राहक पुनरावलोकन ठळक मुद्दे (Generative AI-Based Customer Review Highlights)
आमचे मागील उदाहरण ॲमेझॉन फार्मसीने प्रिस्क्रिप्शन प्रक्रियेसाठी LLM ला रिअल-टाइम वर्कफ्लोमध्ये (real-time workflow) कसे एकत्रित केले हे दर्शवते, तर हे उपयोग प्रकरण (use case) दर्शवते की कशा प्रकारे तत्सम तंत्रज्ञान (SLM, पारंपरिक ML आणि विचारपूर्वक वर्कफ्लो डिझाइन) मोठ्या प्रमाणावर [ऑफलाइन बॅच इन्फरन्स] (offline batch inference) साठी वापरले जाऊ शकते.
ॲमेझॉनने 200 दशलक्षाहून अधिक वार्षिक उत्पादन पुनरावलोकने (annual product reviews) आणि रेटिंग्ज (ratings) process करण्यासाठी [एआय-जनरेटेड ग्राहक पुनरावलोकन ठळक मुद्दे] (AI-generated customer review highlights) सादर केले आहेत. हे वैशिष्ट्य सामायिक केलेल्या ग्राहक मतांना (customer opinions) संक्षिप्त परिच्छेदांमध्ये (concise paragraphs) रूपांतरित करते, जे उत्पादन आणि त्याच्या कार्यक्षमतेबद्दल सकारात्मक, तटस्थ (neutral) आणि नकारात्मक अभिप्राय (negative feedback) दर्शवतात. खरेदीदार त्वरित एकमत (consensus) मिळवू शकतात, त्याच वेळी संबंधित ग्राहक पुनरावलोकनांमध्ये प्रवेश देऊन आणि मूळ पुनरावलोकने (original reviews) राखून पारदर्शकता (transparency) राखली जाते.
हे सिस्टीम (system) ग्राहकांना विशिष्ट वैशिष्ट्ये (features) (उदाहरणार्थ, चित्राची गुणवत्ता, रिमोट कार्यक्षमता किंवा फायर टीव्हीची (Fire TV) सुलभ स्थापना) निवडून पुनरावलोकन ठळक मुद्दे एक्सप्लोर (explore) करता येतील अशा इंटरफेसद्वारे खरेदी निर्णयांना (shopping decisions) सक्षम करते. ही वैशिष्ट्ये सकारात्मक भावनेसाठी (positive sentiment) हिरव्या रंगाच्या खुणांनी दर्शविली जातात, नकारात्मक भावनेसाठी (negative sentiment) नारंगी रंगाच्या ऋण चिन्हाने (negative sign) दर्शविली जातात आणि तटस्थ भावनेसाठी (neutral sentiment) राखाडी रंगाने दर्शविली जातात - याचा अर्थ खरेदीदार सत्यापित (verified) खरेदी पुनरावलोकनांवर (purchase reviews) आधारित उत्पादनाचे फायदे आणि तोटे त्वरित ओळखू शकतात.
खर्च-प्रभावी पद्धतीने ऑफलाइन वापरासाठी LLM चा वापर (Using LLM for Offline Use Cases in a Cost-EffectiveManner)
टीमने पारंपरिक ML पद्धती आणि विशेष SLM एकत्रित करून एक खर्च-प्रभावी संकरित आर्किटेक्चर (cost-effective hybrid architecture) विकसित केले. या दृष्टिकोन भावना विश्लेषण (sentiment analysis) आणि कीवर्ड काढणे (keyword extraction) यांसारखी कार्ये पारंपरिक ML ला देतो, तर जटिल मजकूर निर्मिती कार्यांसाठी (complex text generation tasks) ऑप्टिमाइज्ड SLM चा वापर करतो, ज्यामुळे अचूकता (accuracy) आणि प्रक्रिया कार्यक्षमतेत (processing efficiency) सुधारणा होते.
हे वैशिष्ट्य (feature) एसिंक्रोनस प्रोसेसिंगसाठी (asynchronous processing) [SageMaker बॅच ट्रान्सफॉर्म] (SageMaker Batch Transform) वापरते, जे रिअल-टाइम एंडपॉइंट्सच्या (real-time endpoints) तुलनेत खर्च लक्षणीयरीत्या कमी करू शकते. जवळजवळ शून्य ‘लेटेंसी’चा (zero latency) अनुभव देण्यासाठी, सोल्यूशन काढलेले निष्कर्ष (extracted insights) आणि विद्यमान पुनरावलोकने (existing reviews) [कॅश] (cache) करते, ज्यामुळे प्रतीक्षा वेळ कमी होतो आणि अतिरिक्त गणन (computation) न करता एकाच वेळी अनेक ग्राहकांना प्रवेश मिळतो. ही सिस्टीम नवीन पुनरावलोकने वाढत्या (incrementally) क्रमाने process करते आणि संपूर्ण डेटासेट (dataset) पुन्हा process न करता निष्कर्ष अद्यतनित (update) करते. उत्तम कार्यक्षमतेसाठी (optimal performance) आणि खर्च प्रभावीतेसाठी, हे वैशिष्ट्य बॅच ट्रान्सफॉर्म जॉब्ससाठी (batch transform jobs) [Amazon Elastic Compute Cloud] (Amazon EC2) [Inf2 इंस्टेंसेस] (Inf2 instances) वापरते, जे [पर्यायी उपायांच्या तुलनेत 40% पर्यंत अधिक चांगली किंमत-कार्यक्षमता प्रदान करतात].
या सर्वंकष (comprehensive) दृष्टिकोनचे पालन करून, टीमने मोठ्या प्रमाणात पुनरावलोकने आणि उत्पादने प्रभावीपणे व्यवस्थापित केली, ज्यामुळे हे सोल्यूशन कार्यक्षम आणि स्केलेबल (scalable) दोन्ही बनले.
ॲमेझॉन ॲडव्हर्टायझिंग एआय-आधारित क्रिएटिव्ह प्रतिमा आणि व्हिडिओ निर्मिती (Amazon Advertising AI-Driven Creative Image and Video Generation)
मागील उदाहरणांमध्ये, आपण प्रामुख्याने मजकूर-केंद्रित (text-centric) जनरेटिव्ह एआय ॲप्लिकेशन्स (generative AI applications) पाहिले, आता आपण [ॲमेझॉन ॲडव्हर्टायझिंग स्पॉन्सर्ड ॲड्स क्रिएटिव्ह कंटेंट जनरेशन] (Amazon Advertising Sponsored Ads Creative Content Generation) सह मल्टीमॉडल जनरेटिव्ह एआय (multimodal generative AI) कडे वळूया. या सोल्यूशनमध्ये [प्रतिमा] (image) आणि [व्हिडिओ] (video) निर्मिती क्षमता आहेत आणि या विभागामध्ये (section) आम्ही या वैशिष्ट्यांबद्दल तपशीलवार माहिती सामायिक करणार आहोत. एकंदरीत, [ॲमेझॉन नोव्हा] (Amazon Nova) क्रिएटिव्ह कंटेंट जनरेशन मॉडेल (creative content generation model) या सोल्यूशनच्या केंद्रस्थानी आहे.
ग्राहकांच्या गरजा लक्षात घेऊन, ॲमेझॉनने मार्च 2023 मध्ये केलेल्या सर्वेक्षणात असे दिसून आले की जवळपास 75% जाहिरातदारांना (advertisers) जाहिरात मोहीम (advertising campaign) यशस्वी करण्यात अडचणी येत आहेत, कारण क्रिएटिव्ह कंटेंट जनरेशन हे त्यांचे मुख्य आव्हान (challenge) आहे. अनेक जाहिरातदार (विशेषत: ज्यांच्याकडे अंतर्गत क्षमता किंवा एजन्सी सपोर्ट (agency support) नाही) उच्च-गुणवत्तेचे व्हिज्युअल (visuals) तयार करण्याच्या तज्ञांच्या अभावामुळे आणि खर्चामुळे महत्त्वपूर्ण अडथळ्यांचा सामना करत आहेत. ॲमेझॉन ॲडव्हर्टायझिंग सोल्यूशन (Amazon Advertising solution) व्हिज्युअल कंटेंट (visual content) निर्मितीचे लोकशाहीकरण (democratizes) करते, ज्यामुळे विविध आकारांच्या जाहिरातदारांना ते वापरणे सोपे आणि प्रभावी होते. याचा परिणाम खूप मोठा आहे: [स्पॉन्सर्ड ब्रँड] (Sponsored Brand) जाहिरात मोहिमेत (advertising campaign) एआय-जनरेटेड (AI-generated) प्रतिमा (image) वापरणाऱ्या जाहिरातदारांचा [क्लिक-थ्रू रेट (Click-Through Rate - CTR)] जवळपास 8% आहे आणि गैर-वापरकर्त्यांपेक्षा (non-users) 88% जास्त मोहिमा सादर केल्या जातात.
गेल्या वर्षी, AWS मशीन लर्निंग ब्लॉगने (AWS Machine Learning Blog) [इमेज जनरेशन सोल्यूशनचे तपशीलवार वर्णन] (detailed description of the image generation solution) असलेला लेख प्रकाशित केला होता. तेव्हापासून, ॲमेझॉनने क्रिएटिव्ह इमेज जनरेशनसाठी (creative image generation) [Amazon Nova Canvas] चा उपयोग केला आहे. मजकूर किंवा इमेज प्रॉम्प्ट (image prompt) वापरून, मजकूर-आधारित संपादन वैशिष्ट्ये (text-based editing features) आणि रंग योजना (color scheme) व लेआउट ॲ adjustडजस्टमेंट कंट्रोल (layout adjustment controls) यांच्या संयोजनाने व्यावसायिक-दर्जाच्या (professional-grade) प्रतिमा (images) तयार केल्या जातात.
सप्टेंबर 2024 मध्ये, ॲमेझॉन ॲडव्हर्टायझिंग टीमने उत्पादन प्रतिमांपासून [लघुपट व्हिडिओ जाहिरात] (short video ad) तयार करण्याचे वैशिष्ट्य जोडले. हे वैशिष्ट्य [Amazon Bedrock वर उपलब्ध असलेले फाउंडेशन मॉडेल्स ](foundation models) वापरते, जे ग्राहकांना नैसर्गिक भाषेचा (natural language) वापर करून व्हिज्युअल शैली (visual style), लय (rhythm), कॅमेरा मूव्हमेंट (camera movement), रोटेशन (rotation) आणि झूम (zoom) नियंत्रित करण्याची सुविधा देते. हे व्हिडिओ स्टोरीबोर्डचे (video storyboard) वर्णन करण्यासाठी आणि नंतर स्टोरी कंटेंट (story content) तयार करण्यासाठी ‘एजंट वर्कफ्लो’ (agent workflow) वापरते.
मूळ (original) लेखात चर्चा केल्याप्रमाणे, [जबाबदार एआय] (responsible AI) या सोल्यूशनच्या केंद्रस्थानी आहे आणि Amazon Nova क्रिएटिव्ह मॉडेलमध्ये सुरक्षित (safe) आणि जबाबदार एआय (responsible AI) वापरास समर्थन देण्यासाठी वॉटरमार्किंग (watermarking) आणि कंटेंट मॉडरेटिंगसह (content moderating) अंगभूत नियंत्रणे (built-in controls) आहेत.
हे सोल्यूशन इमेज आणि व्हिडिओ जनरेशन प्रक्रियेचे समन्वय (coordinate) साधण्यासाठी [AWS Step Functions] आणि [AWS Lambda] फंक्शन्सचा वापर करते. तयार केलेली सामग्री [Amazon Simple Storage Service] (Amazon S3) मध्ये साठवली जाते, मेटाडेटा (metadata) DynamoDB मध्ये साठवला जातो आणि [Amazon API Gateway] ग्राहकांना निर्मिती (generation) वैशिष्ट्यांमध्ये प्रवेश प्रदान करते. हे सोल्यूशन आता Amazon Bedrock Guardrails चा देखील वापर करते, जेणेकरून प्रत्येक टप्प्यावर [Amazon Rekognition] आणि [Amazon Comprehend] चे एकत्रीकरण (integration) सुरक्षितता तपासणीसाठी (safety checks) कायम राखता येईल.
मोठ्या प्रमाणावर उच्च-गुणवत्तेच्या (high-quality) जाहिरात कल्पना (advertising ideas) तयार करणे हे एक गुंतागुंतीचे आव्हान (complex challenge) आहे. जनरेटिव्ह एआय मॉडेलला (generative AI model) विविध उत्पादन श्रेणींमध्ये (product categories) आणि जाहिरात वातावरणांमध्ये (advertising environments) आकर्षक (engaging) आणि ब्रँड इमेजला (brand image) साजेशा प्रतिमा (images) तयार करणे आवश्यक आहे, त्याच वेळी ते सर्व तंत्रज्ञानाचा अनुभव असलेल्या (all technical skill levels) जाहिरातदारांना सहज उपलब्ध असले पाहिजे. गुणवत्ता हमी (quality assurance) आणि सुधारणा (improvement) ही इमेज आणि व्हिडिओ जनरेशन वैशिष्ट्यांचा आधार आहे. ही सिस्टीम [Amazon SageMaker Ground Truth] द्वारे कार्यान्वित केलेल्या विस्तृत HITL प्रक्रियेद्वारे सतत सुधारित केली जाते. हे अंमलबजावणी एक शक्तिशाली साधन (powerful tool) प्रदान करते, जे जाहिरातदारांच्या निर्मिती प्रक्रियेत बदल घडवून आणू शकते, ज्यामुळे विविध उत्पादन श्रेणी (product category) आणि वातावरणांमध्ये (environment) उच्च-गुणवत्तेचे व्हिज्युअल (visual content) तयार करणे अधिक सोपे होते.
ॲमेझॉन ॲडव्हर्टायझिंग (Amazon Advertising) जाहिरात उद्दिष्टांसाठी (advertising goals) योग्य सामग्री (content) तयार करण्याची आवश्यकता असलेल्या जाहिरातदारांना मदत करण्यासाठी जनरेटिव्ह एआयचा (generative AI) वापर करत आहे, याची ही केवळ सुरुवात आहे. हे सोल्यूशन दर्शवते की निर्मितीतील अडथळे (creation barriers) कसे कमी केल्याने जाहिरात मोहिम थेट सुधारू शकते, त्याच वेळी जबाबदार एआय वापराचे (responsible AI use) उच्च मानके राखली जाऊ शकतात.
महत्त्वाची तांत्रिक माहिती आणि चर्चा (Key Technical Experiences and Discussions)
गैर-संभाषणात्मक ॲप्लिकेशन्सना (non-conversational applications) उच्च ‘लेटेंसी टॉलरन्स’चा (latency tolerance) फायदा होतो, ज्यामुळे बॅच प्रोसेसिंग (batch processing) आणि कॅशिंग (caching) शक्य होते, परंतु त्यांच्या स्वायत्ततेमुळे (autonomy) मजबूत प्रमाणीकरण यंत्रणा (validation mechanisms) आणि अधिक मजबूत सुरक्षा उपायांची (security measures) आवश्यकता असते. हे निष्कर्ष गैर-संभाषणात्मक (non-conversational) आणि संभाषणात्मक (conversational) एआय अंमलबजावणीसाठी (AI implementation) लागू आहेत:
- कार्य विभाजन आणि एजंट वर्कफ्लो (Task Decomposition and Agent Workflow) – जटिल समस्यांचे लहान घटकांमध्ये विभाजन करणे विविध अंमलबजावणीमध्ये (implementations) मौल्यवान असल्याचे सिद्ध झाले आहे. डोमेन तज्ञांनी (domain experts) केलेले हे विचारपूर्वक विभाजन विशिष्ट उप-कार्यांसाठी (sub-tasks) विशेष मॉडेल (specialized model) तयार करण्यास सक्षम करते. ॲमेझॉन फार्मसी प्रिस्क्रिप्शन प्रक्रियेत (Amazon Pharmacy prescription processing) हे दिसून येते, जिथे फाइन-ट्यून केलेले SLM डोस ओळखण्यासारखी (dose identification) स्वतंत्र कार्ये (discrete tasks) हाताळू शकते. ही रणनीती (strategy) स्पष्ट प्रमाणीकरण चरणांसह (validation steps) विशेष एजंट (specialized agent) तयार करण्यास परवानगी देते, ज्यामुळे विश्वासार्हता (reliability) वाढते आणि देखभाल (maintenance) सुलभ होते. ॲमेझॉन विक्रेता उत्पादन माहिती उपयोग प्रकरण (Amazon seller product information use case) स्वतंत्र निर्मिती (generation) आणि प्रमाणीकरण प्रक्रियेसह (validation process) असलेल्या बहु-चरणीय वर्कफ्लोद्वारे (multi-step workflow) याचे उदाहरण देते. याव्यतिरिक्त, पुनरावलोकन ठळक मुद्दे उपयोग प्रकरण (review highlights use case) खर्च-प्रभावी (cost-effective) आणि नियंत्रित LLM चा वापर दर्शवते, म्हणजेच भावना विश्लेषणासाठी (sentiment analysis) पारंपरिक ML चा वापर करून पूर्व-प्रक्रिया (pre-process) करणे आणि LLM कार्यांशी (LLM tasks) संबंधित भाग कार्यान्वित करणे.
- संकरित आर्किटेक्चर आणि मॉडेल निवड (Hybrid Architecture and Model Selection) – केवळ LLM दृष्टिकोनच्या (LLM approach) तुलनेत, पारंपरिक ML ला LLM सोबत एकत्रित केल्याने अधिक चांगले नियंत्रण (control) आणि खर्च-प्रभावीता (cost-effectiveness) मिळते. पारंपरिक ML चांगल्या प्रकारे परिभाषित (well-defined) केलेल्या कामांसाठी उत्कृष्ट आहे, जसे की भावना विश्लेषण (sentiment analysis) आणि माहिती काढण्यासाठी पुनरावलोकन ठळक मुद्दे प्रणालीमध्ये दर्शविले आहे. ॲमेझॉन टीमने (Amazon Team) गरजेनुसार मोठ्या आणि लहान भाषिक मॉडेलची (large and small language models) धोरणात्मकपणे (strategically) योजना आखली आहे, RAG ला ॲमेझॉन फार्मसीच्या अंमलबजावणीसारख्या (Amazon Pharmacy implementation) प्रभावी डोमेन-विशिष्ट ॲप्लिकेशन्ससाठी (domain-specific applications) फाइन-ट्यूनिंग (fine-tuning) सोबत एकत्रित केले आहे.
- खर्च ऑप्टिमायझेशन धोरणे (Cost Optimization Strategies) – ॲमेझॉन टीमने बॅच प्रोसेसिंग (batch processing), मोठ्या प्रमाणात ऑपरेशन्ससाठी कॅशिंग यंत्रणा (caching mechanisms), [AWS Inferentia] आणि [AWS Trainium] सारखे विशेष इंस्टेंस प्रकार (specialized instance types) आणि ऑप्टिमाइझ केलेले मॉडेल निवडून कार्यक्षमता (efficiency) साध्य केली आहे. पुनरावलोकन ठळक मुद्दे दर्शवतात की वाढत्या क्रमाने प्रक्रिया (incremental processing) केल्याने संगणकीय आवश्यकता (computational requirements) कशी कमी होतात, तर ॲमेझॉन ॲडव्हर्टायझिंग (Amazon Advertising) क्रिएटिव्ह सामग्री (creative content) प्रभावीपणे (effectively) तयार करण्यासाठी Amazon Nova [फाउंडेशन मॉडेल] (foundation models) (FM) वापरते.
- गुणवत्ता हमी आणि नियंत्रण यंत्रणा (Quality Assurance and Control Mechanisms) – गुणवत्ता नियंत्रण (quality control) Amazon Bedrock Guardrails द्वारे डोमेन-विशिष्ट सुरक्षा उपायांवर (domain-specific safety measures) आणि स्वयंचलित चाचणी (automated testing) आणि मानवी मूल्यांकनासह (human evaluation) बहु-स्तरीय प्रमाणीकरणावर (multi-layered validation) अवलंबून असते. निर्मिती (generation) आणि प्रमाणीकरणासाठी (validation) दुहेरी LLM पद्धत ॲमेझॉन विक्रेता उत्पादन माहितीमध्ये (Amazon seller product information) हॅल्युसिनेशन (hallucination) टाळण्यास मदत करते, तर सेल्फ-रिफ्लेक्शन तंत्रज्ञान (self-reflection technology) अचूकता (accuracy) वाढवते. Amazon Nova क्रिएटिव्ह FM (Creative FM) अंगभूत जबाबदार एआय (responsible AI) नियंत्रणे प्रदान करते आणि सतत A/B चाचणी (A/B testing) आणि कार्यप्रदर्शन मापनाद्वारे (performance measurement) ते पूरक आहेत.
- HITL अंमलबजावणी (HITL Implementation) – HITL पद्धत अनेक स्तरांवर पसरलेली आहे, ज्यात फार्मासिस्टच्या (pharmacist) तज्ञांचे मूल्यांकन (expert assessments) ते विक्रेता भागीदारांच्या (selling partners) अंतिम वापरकर्त्यांच्या अभिप्रायापर्यंत (end-user feedback) चा समावेश आहे. ॲमेझॉन टीमने संरचित सुधारणा वर्कफ्लो (structured improvement workflow) स्थापित केले आहेत, जे विशिष्ट डोमेन आवश्यकता (domain requirements) आणि जोखीम प्रोफाइलनुसार (risk profile) स्वयंचलन (automation) आणि मानवी पर्यवेक्षणामध्ये (human supervision) संतुलन राखतात.
- जबाबदार एआय आणि अनुपालन (Responsible AI and Compliance) – जबाबदार एआय (responsible AI) पद्धतींमध्ये नियामकाने नियंत्रित केलेल्या वातावरणासाठी (regulated environment) सामग्री (content) घेण्यासाठी सुरक्षा उपायांचा (safety measures) आणि HIPAA सारख्या नियमांचे पालन करण्याचा समावेश होतो. ॲमेझॉन टीमने वापरकर्ता-মুখী (user-facing) ॲप्लिकेशन्ससाठी (applications) सामग्रीचे परीक्षण (content moderation) एकत्रित केले आहे, पुनरावलोकन ठळक मुद्द्यांमध्ये (review highlights) स्त्रोत माहितीमध्ये (source information) प्रवेश देऊन पारदर्शकता (transparency) राखली आहे आणि गुणवत्ता (quality) व अनुपालन (compliance) सुधारण्यासाठी देखरेखेसह (monitoring) डेटा गव्हर्नन्स (data governance) लागू केले आहे.
ही मॉडेल्स (models) गुणवत्ता (quality) आणि जबाबदारीची मानके (responsibility standards) राखून स्केलेबल (scalable), विश्वसनीय (reliable) आणि खर्च-प्रभावी (cost-effective) जनरेटिव्ह एआय सोल्यूशन्स (generative AI solutions) सक्षम करतात. ही अंमलबजावणी दर्शवते की प्रभावी सोल्यूशन्सना केवळ प्रगत मॉडेलची (advanced models) आवश्यकता नसते, तर आर्किटेक्चर (architecture), ऑपरेशन्स (operations) आणि गव्हर्नन्सकडे (governance) बारकाईने लक्ष देणे आवश्यक आहे आणि AWS सेवा व प्रस्थापित पद्धतींद्वारे (established practices) समर्थित असणे आवश्यक आहे.
पुढील टप्पे (Next steps)
या लेखात सामायिक केलेली ॲमेझॉनची उदाहरणे स्पष्ट करतात की जनरेटिव्ह एआय (generative AI) पारंपरिक संभाषणात्मक सहाय्यकांच्या (conversational assistants) पलीकडे मूल्य कसे निर्माण करू शकते. आम्ही तुम्हाला या उदाहरणांचे अनुसरण करण्यासाठी किंवा तुमचे स्वतःचे सोल्यूशन्स (solutions) तयार करण्यासाठी आमंत्रित करतो, जेणेकरून जनरेटिव्ह एआय तुमचा व्यवसाय किंवा तुमचा उद्योग कसा बदलू शकतो हे तुम्हाला समजेल. कल्पना प्रक्रिया सुरू करण्यासाठी तुम्ही [AWS जनरेटिव्ह एआय उपयोग प्रकरणे] (AWS generative AI use cases) या पेजला भेट देऊ शकता.
ही उदाहरणे दर्शवतात की प्रभावी जनरेटिव्ह एआय अंमलबजावणीला (generative AI implementation) अनेकदा वेगवेगळ्या प्रकारच्या मॉडेल्स (different types of models) आणि वर्कफ्लो (workflows) एकत्रित करण्याचा फायदा होतो. AWS सेवा कोणत्या FM ला सपोर्ट (support) करतात हे जाणून घेण्यासाठी, [Amazon Bedrock मध्ये सपोर्ट केलेले फाउंडेशन मॉडेल्स] (Foundation Models supported in Amazon Bedrock) आणि [Amazon SageMaker JumpStart फाउंडेशन मॉडेल्स] (Amazon SageMaker JumpStart Foundation Models) चा संदर्भ घ्या. आम्ही तुम्हाला [Amazon Bedrock