هوش مصنوعی مولد در حال متحول کردن عملیات تجاری از طریق کاربردهای مختلفی است، از جمله دستیارهای مکالمه مانند Rufus و Amazon Seller Assistant که متعلق به آمازون هستند. علاوه بر این، برخی از تأثیرگذارترین برنامههای هوش مصنوعی مولد بهطور مستقل در پسزمینه عمل میکنند، قابلیتی ضروری که به شرکتها امکان میدهد تا عملیات، پردازش دادهها و ایجاد محتوای خود را در مقیاس بزرگ تغییر دهند. این پیادهسازیهای غیرمکالمهای معمولاً به شکل گردشهای کاری مبتنی بر عامل (agent) هستند که توسط مدلهای زبانی بزرگ (LLM) هدایت میشوند، که اهداف تجاری خاص را در صنایع مختلف بدون نیاز به تعامل مستقیم کاربر انجام میدهند.
در مقایسه با برنامههای مکالمهای که از بازخورد و نظارت بیدرنگ (Real-time) کاربر بهره میبرند، برنامههای غیرمکالمهای دارای مزایای منحصربهفردی مانند تحمل بیشتر تأخیر، پردازش دستهای و ذخیرهسازی (Caching) هستند، اما ماهیت خودکار آنها نیازمند اقدامات امنیتی قویتر و تضمین کیفیت کاملتر است.
این مقاله به بررسی چهار مورد استفاده مختلف از هوش مصنوعی مولد در آمازون میپردازد:
- ایجاد فهرست محصولات آمازون و بهبود کیفیت دادههای کاتالوگ – نشان میدهد که چگونه LLMها به شرکای فروش و آمازون کمک میکنند تا فهرستهای محصولات با کیفیت بالاتری را در مقیاس بزرگ ایجاد کنند.
- پردازش نسخههای داروخانه آمازون – نشان میدهد پیادهسازیها و تفکیک وظایف برای گردشهای کاری عامل در یک محیط به شدت قانونگذاری شده چگونه است.
- نکات برجسته نظرات – نشان میدهد پردازش دستهای در مقیاس بزرگ، یکپارچهسازی یادگیری ماشین سنتی (ML)، استفاده از LLMهای کوچک و راهحلهای مقرونبهصرفه چگونه است.
- تولید تصویر و ویدئوی خلاقانه آگهیهای آمازون – شیوههای هوش مصنوعی مولد چندوجهی و مسئولانه در کار خلاقانه چگونه است.
هر یک از این مطالعات موردی جنبههای مختلف پیادهسازی برنامههای هوش مصنوعی مولد غیرمکالمهای، از معماری فنی گرفته تا ملاحظات عملیاتی را آشکار میکند. از طریق این مثالها، خواهید آموخت که چگونه مجموعهای کامل از سرویسهای AWS از جمله Amazon Bedrock و Amazon SageMaker میتواند کلید موفقیت باشد. در نهایت، ما تجربیات کلیدی مشترک در میان موارد استفاده مختلف را فهرست میکنیم.
ایجاد فهرست محصولات با کیفیت بالا در آمازون
ایجاد فهرست محصولات با کیفیت بالا با جزئیات جامع، به مشتریان کمک میکند تا تصمیمات خرید آگاهانه بگیرند. بهطور سنتی، شرکای فروش بسیاری از ویژگیهای هر محصول را بهصورت دستی وارد میکنند. راهحل جدید هوش مصنوعی مولد که در سال 2024 عرضه شد، با بازیابی فعال اطلاعات محصول از وبسایتهای برند و سایر منابع، تجربه مشتری را بهبود میبخشد و این فرآیند را متحول میکند.
هوش مصنوعی مولد با پشتیبانی از ورودی اطلاعات در قالبهای مختلف (مانند URL، تصاویر محصول یا صفحات گسترده) و تبدیل خودکار آن به ساختار و قالب مورد نظر، تجربه شرکای فروش را ساده میکند. بیش از 900,000 شریک فروش از آن استفاده کردهاند و نزدیک به 80 درصد از پیشنویسهای فهرست محصولات تولید شده پذیرفته شدهاند و فقط نیاز به حداقل ویرایش دارند. محتوای تولید شده توسط هوش مصنوعی، جزئیات جامع محصول را ارائه میدهد، که به بهبود وضوح و دقت کمک میکند، بنابراین به یافتن محصول در جستجوی مشتری کمک میکند.
برای فهرستهای محصول جدید، گردش کار با ارائه اطلاعات اولیه توسط شریک فروش آغاز میشود. سپس، سیستم از چندین منبع اطلاعاتی برای ایجاد فهرست محصول جامع، از جمله عنوان، توضیحات و ویژگیهای دقیق استفاده میکند. لیستهای تولید شده برای تأیید یا ویرایش با شرکای فروش به اشتراک گذاشته میشوند.
برای فهرستهای محصول موجود، سیستم محصولاتی را که میتوان با دادههای اضافی غنی کرد، شناسایی میکند.
یکپارچهسازی و پردازش داده برای خروجی زیاد
تیم آمازون با استفاده از Amazon Bedrock و سایر سرویسهای AWS، کانکتورهای داخلی و خارجی قوی برای APIهای LLM-friendly ایجاد کرد که به طور یکپارچه با سیستمهای پشتیبان Amazon.com ادغام میشوند.
یک چالش اصلی، سنتز دادههای مختلف در یک فهرست محصول منسجم در بیش از 50 ویژگی (از جمله متن و عدد) بود. LLMها برای تفسیر دقیق مفاهیم تجارت الکترونیک به مکانیسمهای کنترل و دستورالعملهای خاص نیاز دارند، زیرا ممکن است با چنین دادههای پیچیده و متنوعی به بهترین شکل عمل نکنند. به عنوان مثال، یک LLM ممکن است “ظرفیت” در یک جاچاقویی را به اشتباه به عنوان اندازه به جای تعداد شکافها تفسیر کند یا “Fit Wear” را به اشتباه به عنوان توضیحات سبک به جای نام تجاری در نظر بگیرد. مهندسی سریع و Fine-tuning بهطور گسترده برای رسیدگی به این موارد استفاده شد.
تولید و اعتبارسنجی با استفاده از LLM
فهرستهای محصول تولید شده باید کامل و صحیح باشند. برای کمک به دستیابی به این هدف، راهحل یک گردش کار چند مرحلهای را پیادهسازی میکند که از LLMها برای تولید و اعتبارسنجی ویژگیها استفاده میکند. این روش دوگانه LLM به جلوگیری از توهم کمک میکند، که هنگام برخورد با نگرانیهای ایمنی یا مشخصات فنی بسیار مهم است. این تیم فناوریهای خوداندیشی پیشرفتهای را برای اطمینان از اینکه فرآیندهای تولید و اعتبارسنجی به طور موثر مکمل یکدیگر هستند، توسعه داده است.
تضمین کیفیت چند لایه با بازخورد انسانی
بازخورد انسانی هسته اصلی تضمین کیفیت راهحل است. این فرآیند شامل ارزیابی اولیه توسط کارشناسان Amazon.com و همچنین ارائه ورودی توسط شرکای فروش برای پذیرش یا ویرایش است. این امر خروجی با کیفیت بالا را فراهم میکند و امکان بهبود مستمر مدلهای هوش مصنوعی را فراهم میسازد.
فرآیند تضمین کیفیت شامل ترکیب روشهای تست خودکار با ارزیابیهای مبتنی بر ML، الگوریتم یا LLM است. فهرستهای محصول ناموفق دوباره تولید میشوند و فهرستهای محصول موفق برای آزمایش بیشتر ارسال میشوند. با استفاده از [مدلهای استدلال علی](Causal Inference Models)، ما ویژگیهای زیربنایی را که بر عملکرد فهرست محصول تأثیر میگذارند و فرصتهای غنیسازی را شناسایی میکنیم. در نهایت، فهرست محصولات پس از بررسی کیفیت و پذیرش توسط شریک فروش، منتشر میشود و اطمینان حاصل میشود که مشتریان اطلاعات دقیق و جامعی در مورد محصول دریافت میکنند.
بهینهسازی سیستم در سطح برنامه برای دقت و هزینه
با توجه به استانداردهای بالای دقت و کامل بودن، این تیم یک روش تجربی جامع را با یک سیستم بهینهسازی خودکار به کار گرفت. این سیستم ترکیبات مختلف LLMها، Promptها، فیلمنامهها، گردشهای کار و ابزارهای هوش مصنوعی را برای بهبود معیارهای تجاری بالاتر، از جمله هزینه، بررسی میکند. با ارزیابی و آزمایش خودکار مداوم، مولد فهرست محصولات میتواند به طور موثر عملکرد، هزینه و کارایی را متعادل کند و در عین حال با تحولات جدید هوش مصنوعی سازگار شود. این روش بدان معناست که مشتریان میتوانند از اطلاعات محصول با کیفیت بالا بهرهمند شوند و شرکای فروش میتوانند به ابزارهای پیشرفته برای ایجاد کارآمد فهرست محصولات دسترسی داشته باشند.
پردازش نسخههای مبتنی بر هوش مصنوعی مولد داروخانه آمازون
در مثال فهرست فروشندگانی که قبلاً مورد بحث قرار گرفت، که مبنای آن یک گردش کار انسان-ماشین بود، داروخانه آمازون نشان میدهد که چگونه این اصول را میتوان در یک صنعت تنظیم شده قانون قابلیت انتقال و پاسخگویی بیمه سلامت اعمال کرد. در مقاله [درک چگونگی استفاده داروخانه آمازون از AmazonSageMaker برای ایجاد یک ربات گفتگو مبتنی بر LLM](Understanding how Amazon Pharmacy uses Amazon SageMaker to create an LLM-based chatbot)، ما یک دستیار مکالمه برای متخصصان مراقبت از بیمار را به اشتراک گذاشتیم، اکنون تمرکز ما بر پردازش خودکار نسخه است.
در داروخانه آمازون، ما یک سیستم هوش مصنوعی ساخته شده بر روی Amazon Bedrock و SageMaker توسعه دادهایم تا به تکنسینهای داروساز کمک کنیم تا دستورالعملهای دارویی را دقیقتر و کارآمدتر پردازش کنند. این راهحل متخصصان انسانی را با LLM در نقشهای ایجاد و اعتبارسنجی ادغام میکند تا دقت دستورالعملهای دارویی بیمار را افزایش دهد.
طراحی گردش کار محول شده برای دقت مراقبتهای بهداشتی
سیستم پردازش نسخه، تخصص انسانی (کارشناسان ورود داده و داروسازان) را با پشتیبانی هوش مصنوعی ترکیب میکند تا توصیههای جهتدار و بازخورد ارائه دهد. گردش کار با پیشپردازنده پایگاه دانش داروخانه آغاز میشود، که متن نسخه خام را در [Amazon DynamoDB] استاندارد میکند، سپس از یک مدل زبان کوچک (SLM) Fine-tuned شده در SageMaker برای شناسایی اجزای کلیدی (دوز، فرکانس) استفاده میکند.
این سیستم بهطور یکپارچه متخصصانی مانند متخصصان ورود داده و داروسازان را ادغام میکند، در حالی که هوش مصنوعی مولد مکمل گردش کار کلی است، بنابراین چابکی و دقت را بهبود میبخشد تا خدمات بهتری به بیماران خود ارائه دهیم. سپس، سیستم مونتاژ جهتدار با اقدامات ایمنی، برای ایجاد دستورالعملهایی که وارد میکنند، به متخصصان ورود داده دستورالعمل تولید میکند تا از طریق یک ماژول پیشنهادی ایجاد شود. ماژول علامتگذاری خطاها را پرچمگذاری یا تصحیح میکند و اقدامات ایمنی اضافی را به عنوان بازخورد ارائه شده به متخصص ورود داده اعمال میکند. تکنسینها در نهایت دستورالعملهای تایپ شده بسیار دقیق و ایمن را نهایی میکنند تا داروسازان بازبینی کنند یا خدمات پاییندستی را برای اجرای دستورالعملها انجام دهند.
یکی از نکات برجسته این راهحل، استفاده از تجزیه وظیفه است، که به مهندسان و دانشمندان اجازه میدهد کل فرآیند را به چندین مرحله تقسیم کنند، که شامل ماژولهای جداگانه است که از زیرمجموعهها تشکیل شدهاند. این تیم به طور گسترده از SLMهای Fine-tuned شده استفاده کرده است. علاوه بر این، این فرآیند از برنامههای ML سنتی مانند [شناسایی موجودیت نامگذاری شده (NER)](Named Entity Recognition) یا استفاده از [مدلهای رگرسیونی](Regression Models) برای تخمین درجه اطمینان نهایی استفاده میکند. استفاده از SLMها و ML سنتی در این فرآیند کنترل شده و مشخص، میتواند به طور قابل توجهی سرعت پردازش را بهبود بخشد در حالی که استانداردهای ایمنی سختگیرانه را حفظ میکند؛ زیرا اقدامات امنیتی مناسب در مراحل خاص گنجانده شده است.
این سیستم شامل چندین زیرمرحله مشخص است که هر زیرفرآیند به عنوان یک جزء تخصصی عمل میکند، که به روشی نیمه مستقل اما مشارکتی در تلاش برای رسیدن به هدف کلی در گردش کار عمل میکند. این رویکرد تجزیه با اعتبارسنجی خاص در هر مرحله ثابت کرده است که کارآمدتر از یک راهحل سرتاسری است، در حالی که استفاده از SLMهای Fine-tuned شده را امکانپذیر میکند. این تیم از [AWS Fargate](AWS Fargate) برای هماهنگی گردش کار استفاده میکند؛ زیرا در حال حاضر در سیستمهای پشتیبان موجود ادغام شده است.
در جریان توسعه محصول تیم، آنها به Amazon Bedrock روی آوردند، محصولی که LLMهای با عملکرد بالا را ارائه میدهد و ویژگیهای آسان برای استفاده را برای برنامههای هوش مصنوعی تولیدی دارد. SageMaker از انتخاب LLM بیشتر، سفارشیسازی عمیقتر و روشهای ML سنتی پشتیبانی میکند. برای کسب اطلاعات بیشتر در مورد این فناوری، [بیاموزید که چگونه تجزیه وظایف و LLMهای کوچکتر میتوانند هوش مصنوعی را مقرون به صرفهتر کنند](Find out how task decomposition and smaller LLMs can make AI more affordable)، و مطالعه [مطالعه موردی تجارت داروخانه آمازون](Amazon Pharmacy business case study).
ایجاد یک برنامه قابل اعتماد با اقدامات ایمنی و HITL
برای انطباق با استانداردهای HIPAA و ارائه حریم خصوصی بیمار، ما شیوههای حاکمیت دادههای سختگیرانهای را اجرا کردیم، در حالی که از روشی ترکیبی استفاده میکردیم که LLMهای Fine-tuned شده را با استفاده از APIهای Amazon Bedrock و [تولید افزایش یافته بازیابی](Retrieval Augmented Generation) (RAG) با استفاده از [Amazon OpenSearch Service](Amazon OpenSearch Service) ترکیب میکرد. این ترکیب بازیابی دانش کارآمد را در عین حفظ دقت بالا برای وظایف فرعی خاص امکانپذیر میکند.
مدیریت توهمهای LLM، که در حوزه مراقبتهای بهداشتی بسیار مهم است، فراتر از Fine-tuning در مجموعههای داده بزرگ نیاز دارد. راهحل ما اقدامات ایمنی خاص دامنه را پیادهسازی کرده است که روی [Amazon Bedrock Guardrails] ساخته شده است و با نظارت حلقه انسانی (HITL) تکمیل میشود تا قابلیت اطمینان سیستم را افزایش دهد.
تیم داروخانه آمازون به بهبود این سیستم از طریق بازخورد بلادرنگ داروسازان و قابلیتهای توسعه یافته قالبهای نسخهای ادامه میدهد. این رویکرد متعادل از نوآوری، تخصص دامنه، خدمات پیشرفته هوش مصنوعی و نظارت انسانی نه تنها کارایی عملیاتی را بهبود میبخشد، بلکه به این معنی است که سیستمهای هوش مصنوعی میتوانند به درستی متخصصان مراقبتهای بهداشتی را توانمند سازند و در نتیجه بهترین مراقبت از بیمار را ارائه دهند.
نکات برجسته بررسی مشتری مبتنی بر هوش مصنوعی مولد
در مثال قبلی خود، نشان دادیم که چگونه داروخانه آمازون LLMها را در یک گردش کار بیدرنگ برای پردازش نسخهها ادغام میکند، در حالی که این مورد استفاده نشان میدهد که چگونه میتوان فناوریهای مشابه (SLM، ML سنتی و طراحی متفکرانه گردش کار) را در [استنتاج دستهای آفلاین](offline batch inference) در مقیاس بزرگ به کار برد.
آمازون [نکات برجسته بررسی مشتری تولید شده توسط هوش مصنوعی](AI-generated customer review highlights) را برای رسیدگی به بیش از 200 میلیون بررسی و رتبهبندی محصول سالانه معرفی کرده است. این ویژگی، نظرات به اشتراک گذاشته شده مشتریان را در پاراگرافهای مختصر خلاصه میکند و بازخورد مثبت، خنثی و منفی در مورد محصول و ویژگیهای آن را برجسته میکند. خریداران میتوانند به سرعت درک روشنی از توافق کلی داشته باشند، در حالی که با ارائه دسترسی به بررسیهای مربوطه مشتری و حفظ بررسی اصلی، شفافیت را حفظ میکنند.
این سیستم از طریق رابطی که مشتریان میتوانند با انتخاب ویژگیهای خاص (مانند کیفیت تصویر، قابلیت کنترل از راه دور یا سهولت نصب Fire TV) نکات برجسته بررسی را بررسی کنند، تصمیمگیری خرید را بهبود میبخشد. این ویژگیها با علامت تیک سبز برای احساسات مثبت، علامت منفی نارنجی برای احساسات منفی و خاکستری برای بیطرفی مشخص میشوند - این بدان معناست که خریداران میتوانند به سرعت نقاط قوت و ضعف محصول را بر اساس بررسیهای خرید تأیید شده شناسایی کنند.
استفاده از LLMها به روشی مقرون به صرفه برای موارد استفاده آفلاین
این تیم یک معماری ترکیبی مقرون به صرفه ایجاد کرده است که روشهای ML سنتی را با SLMهای تخصصی ترکیب میکند. با اختصاص تجزیه و تحلیل احساسات و استخراج کلمات کلیدی به ML سنتی، در حالی که از SLMهای بهینهسازی شده برای کارهای پیچیده تولید متن استفاده میکند، این روش دقت و کارایی پردازش را بهبود میبخشد.
این ویژگی از [تبدیل دستهای SageMaker ](SageMaker Batch Transform)برای پردازش ناهمزمان استفاده میکند، که در مقایسه با نقاط پایانی بیدرنگ، میتواند هزینهها را به میزان قابل توجهی کاهش دهد. برای ارائه تجربهای نزدیک به تأخیر صفر، این راهحل بینشهای استخراج شده و بررسیهای موجود را ذخیره میکند، بنابراین زمان انتظار را کاهش میدهد و به مشتریان متعدد اجازه میدهد تا به طور همزمان بدون نیاز به محاسبات اضافی به آن دسترسی داشته باشند. این سیستم بهطور فزاینده بررسیهای جدید را پردازش میکند و بینشها را بدون نیاز به پردازش مجدد مجموعه داده کامل بهروز میکند. برای بهینهسازی عملکرد و مقرون به صرفه بودن، این ویژگی از [موتور محاسباتی ابری الاستیک آمازون](Amazon Elastic Compute Cloud) (Amazon EC2) [نمونه Inf2](Inf2 instance) برای کارهای تبدیل دستهای استفاده میکند، [که در مقایسه با جایگزینها، تا 40 درصد قیمت بهتری ارائه میدهد](offering up to 40% higher price performance compared to alternatives).
با پیروی از این روش جامع، این تیم به طور موثر هزینهها را مدیریت میکند در حالی که حجم زیادی از نظرات و محصولات را پردازش میکند و در نتیجه این راهحل را هم کارآمد و هم مقیاسپذیر میکند.
نسل تصاویر و ویدئوهای خلاقانه آگهی آمازون مبتنی بر هوش مصنوعی
در مثالهای قبلی، عمدتاً برنامههای کاربردی هوش مصنوعی مولد با محوریت متن را بررسی کردیم، اکنون به هوش مصنوعی مولد چندوجهی با [تولید محتوای خلاقانه آگهیهای حمایت شده آمازون](Sponsored Ads creative content generation) میپردازیم. این راهحل دارای قابلیتهای تولید تصویر و ویدئو است و ما در این بخش جزئیات مربوط به این ویژگیها را به اشتراک خواهیم گذاشت. بهطور کلی، هسته این راه حل از [Amazon Nova] مدل تولید محتوای خلاقانه استفاده میکند.
با بررسی نیازهای مشتری، نظرسنجی انجام شده توسط آمازون در مارس 2023 نشان داد که نزدیک به 75 درصد از تبلیغکنندگان، تولید محتوای خلاقانه را به عنوان چالش اصلی خود در تلاش برای دستیابی به موفقیت در کمپینهای تبلیغاتی خود فهرست کردهاند. بسیاری از تبلیغکنندگان (به ویژه آنهایی که فاقد ظرفیت داخلی یا پشتیبانی آژانس هستند) با موانع قابل توجهی به دلیل تخصص و هزینه تولید تصاویر با کیفیت بالا مواجه هستند. راهحل تبلیغاتی آمازون، ایجاد محتوای بصری را دموکراتیک میکند و آن را برای تبلیغکنندگان در هر اندازه در دسترس و کارآمد میسازد. تأثیر آن بسیار زیاد است: تبلیغکنندگانی که از تصاویر تولید شده توسط هوش مصنوعی در کمپینهای تبلیغاتی [برندهای حمایت شده](Sponsored Brands) استفاده میکنند، [نرخ کلیک (CTR)](click-through rate (CTR)) نزدیک به 8 درصد دارند و کمپینهای ارسالی 88 درصد بیشتر از کاربران غیرکاربر است.
سال گذشته، وبلاگ یادگیری ماشینی AWS مقالهای [با جزئیات راهحل تولید تصویر](detailed article about the image generation solution) منتشر کرد. از آن زمان، آمازون [Amazon Nova Canvas] را به عنوان مبنای تولید تصویر خلاقانه پذیرفته است. با استفاده از درخواستهای متنی یا تصویری، همراه با قابلیتهای ویرایش مبتنی بر متن و کنترلهای طرح رنگ و تنظیم طرحبندی، تصاویر درجه یک حرفهای ایجاد میکند.
در سپتامبر 2024، تیم تبلیغات آمازون قابلیت ایجاد [تبلیغات ویدئویی کوتاه](short video ads) از تصاویر محصول را اضافه کرد. این ویژگی با استفاده از [مدلهای بنیاد](foundation models) در [Amazon Bedrock](Amazon Bedrock)، ارائه شده از طریق کنترل زبان طبیعی بر سبک بصری، آهنگ، حرکت دوربین، چرخش و بزرگنمایی، به مشتریان کنترل میدهند. از یک جریان کار代理 برای توصیف ابتدا storyboard ویدئو استفاده میکند، سپس محتوای داستان را تولید میکند.
همانطور که در مقاله اصلی مورد بحث قرار گرفت، [هوش مصنوعی مسئولانه](responsible AI) هسته این راهحل است و مدل خلاقانه آمازون Nova با کنترلهای داخلی برای پشتیبانی از استفاده ایمن و مسئولانه از هوش مصنوعی، از جمله علامتگذاری با واترمارک و تعدیل محتوا ارائه میشود.
این راهحل از [AWS Step Functions](AWS Step Functions) و [AWS Lambda] برای هماهنگی هماهنگی بدون سرور فرآیندهای تولید تصویر و ویدئو استفاده میکند. محتوای تولید شده در [Amazon Simple Storage Service] (Amazon S3) ذخیره میشود، فراداده در DynamoDB ذخیره میشود و [Amazon API Gateway] دسترسی مشتری به قابلیتهای تولید را فراهم میکند. این راهحل اکنون از [Amazon Bedrock Guardrails] علاوه بر حفظ [Amazon Rekognition](Amazon Rekognition) و [Amazon Comprehend](Amazon Comprehend) در مراحل مختلف برای بررسیهای ایمنی اضافی استفاده میکند.
ایجاد تبلیغات خلاقانه با کیفیت بالا در مقیاس بزرگ چالشهای پیچیدهای را به همراه دارد. مدلهای هوش مصنوعی مولد باید تصاویری جذاب و متناسب با برند را در دستههای مختلف محصولات و محیطهای تبلیغاتی تولید کنند، در حالی که اطمینان حاصل شود که برای تبلیغکنندگان در تمام سطوح فنی به راحتی در دسترس است. تضمین کیفیت و بهبود اساس قابلیتهای تولید تصویر و ویدئو است. این سیستم به طور مداوم از طریق یک فرآیند گسترده HITL که از طریق [Amazon SageMaker Ground Truth] فعال شده است، بهبود مییابد. این پیادهسازی ابزاری قدرتمند ارائه میدهد که میتواند فرآیند ایجاد تبلیغکنندگان را متحول کند، بنابراین ایجاد محتوای بصری با کیفیت بالا را در هر دسته محصول و محیط آسانتر میکند.
این تنها آغاز استفاده آگهی آمازون از هوش مصنوعی مولد برای کمک به تبلیغکنندگانی است که نیاز به ایجاد محتوای متناسب با اهداف تبلیغاتی خود دارند. این راهحل نشان میدهد که چگونه کاهش موانع ایجاد میتواند مستقیماً کمپینهای تبلیغاتی را بهبود بخشد و در عین حال استانداردهای بالایی از استفاده مسئولانه از هوش مصنوعی را حفظ کند.
تجربیات و بحثهای کلیدی فناوری
برنامههای غیرمکالمهای از تحمل تأخیر بالاتر بهره میبرند، بنابراین امکان پردازش دستهای و Cachig را فراهم میکنند، اما به دلیل خودمختاری، به مکانیسمهای اعتبارسنجی قوی و اقدامات امنیتی قویتری نیاز دارند. این بینشها برای پیادهسازیهای هوش مصنوعی غیرمکالمهای و مکالمهای کاربرد دارند:
تجزیه وظیفه و جریانات کاری عامل – ثابت شده است که شکستن مسائل پیچیده به مؤلفههای کوچکتر در پیادهسازیهای مختلف ارزشمند است. این تجزیه متفکرانه که توسط کارشناسان حوزه انجام میشود، امکان ایجاد مدلهای تخصصی را برای وظایف فرعی خاص فراهم میکند، همانطور که در پردازش نسخه داروخانه آمازون نشان داده شده است، جایی که SLMهای fine-tuned شده میتوانند وظایف گسسته مانند شناسایی دوز را مدیریت کنند. این استراتژی به ایجاد agents تخصصی با مراحل اعتبارسنجی واضح اجازه میدهد، بنابراین قابلیت اطمینان را بهبود میبخشد و نگهداری را ساده میکند. مورد استفاده فهرست فروشندگان آمازون این را از طریق جریان کار چند مرحلهای خود با فرآیندهای تولید و اعتبارسنجی جداگانه مثال میزند. علاوه بر این، مورد استفاده نکات برجسته بررسی، استفاده مقرون به صرفه و کنترل شده از LLM را نشان میدهد، یعنی از طریق استفاده از ML سنتی برای پیش پردازش و انجام بخشهایی که میتوانند به وظایف LLM مرتبط باشند.
معماریهای ترکیبی و انتخاب مدل – ترکیب ML سنتی با LLMها کنترل و مقرون به صرفهتری نسبت به رویکردهای LLM خالص ارائه میدهد. ML سنتی در دست زدن به وظایف دقیق تعریف شده تبحر دارد، همانطور که سیستم نکات برجسته بررسی برای تجزیه و تحلیل احساسات و استخراج اطلاعات نشان داده است. تیمهای آمازون به طور استراتژیک مدلهای زبانی بزرگ و کوچک را بر اساس نیاز مستقر کردهاند، ترکیبی از RAG با Fine-tuning برای برنامههای کاربردی خاص دامنه مانند پیادهسازیهای داروخانه آمازون استفاده کردهاند.
استراتژیهای بهینهسازی هزینه – تیمهای آمازون با پردازش دستهای، مکانیسمهای Cachig برای عملیات با حجم بالا، [AWS Inferentia] و [AWS Trainium] مانند انواع نمونه تخصصی و انتخاب مدل بهینهسازی شده به کارایی دست یافتهاند. نکات برجسته بررسی نشان میدهد که چگونه پردازش incremental نیازهای محاسباتی را کاهش میدهد، در حالی که آگهی آمازون از [مدلهای بنیاد](foundation models) آمازون Nova برای ایجاد محتوای خلاقانه استفاده میکند.
تضمین کیفیت و مکانیسمهای کنترل – کنترل کیفیت متکی به اقدامات ایمنی خاص دامنه، از طریق Amazon Bedrock Guardrails و اعتبارسنجی چند لایه است که تستهای خودکار را با ارزیابی انسانی ترکیب میکند. یک روش dual-LLM برای تولید و اعتبارسنجی به جلوگیری از توهمات در فهرست فروشندگان آمازون کمک میکند، در حالی که فناوریهای خوداندیشی دقت را بهبود میبخشند. Amazon Nova creative FM کنترلهای هوش مصنوعی مسئولیتپذیر ذاتی را ارائه میدهد و از طریق تست A/B مداوم و اندازهگیری عملکرد تکمیل میشود.
پیادهسازی HITL – روشهای HITL چندین لایه را در بر میگیرد، از ارزیابیهای کارشناسانه توسط داروسازان گرفته تا بازخورد کاربر نهایی توسط شرکای فروش. تیمهای آمازون جریانات کاری بهبود ساختاریافتهای ایجاد کردهاند، بنابراین اتوماسیون و نظارت انسانی را بر اساس الزامات دامنه خاص و پروفایلهای ریسک متعادل میکنند.
هوش مصنوعی و انطباق مسئولانه – شیوههای هوش مصنوعی مسئولانه شامل اقدامات ایمنی انحصاری محتوا برای محیطهای تنظیم شده و انطباق با مقرراتی مانند HIPAA است. تیمهای آمازون تعدیل محتوا را برای برنامههای کاربردی رو به کاربر ادغام کردهاند، با ارائه دسترسی به اطلاعات منبع، شفافیت نکات برجسته بررسی را حفظ کردهاند و حاکمیت دادهها را با نظارت برای ارتقای کیفیت و انطباق اجرا کردهاند.
مدلهای فوق امکان پیادهسازی راهحلهای هوش مصنوعی مولدی را فراهم میکنند که مقیاسپذیر، قابل اعتماد و مقرون به صرفه هستند، در حالی که استانداردهای کیفیت و مسئولیتپذیری را حفظ میکنند. این پیادهسازیها نشان میدهد که راهحلهای مؤثر نه تنها به مدلهای پیشرفته، بلکه به توجه دقیق به معماری، عملیات و حکمرانی نیز نیاز دارند و از سرویسهای AWS و رویههای تثبیتشده پشتیبانی میشوند.
مراحل بعدی
مثالهای فوق از آمازون نشان میدهد که چگونه هوش مصنوعی مولد میتواند ارزشی فراتر از دستیارهای مکالمهای سنتی ایجاد کند. ما از شما دعوت میکنیم تا از این مثالها پیروی کنید یا راهحلهای خود را ایجاد کنید، تا درک کنید که چگونه هوش مصنوعی مولد میتواند کسبوکارتان یا حتی صنعتتان را متحول کند. برای شروع فرآیند ایدهپردازی میتوانید به صفحه [موارد استفاده هوش مصنوعی مولد AWS](AWS generative AI use cases) مراجعه کنید.
این مثالها نشان میدهد که پیادهسازیهای مؤثر هوش مصنوعی مولد اغلب از ترکیب انواع مختلف مدل و گردش کار بهره میبرند. برای اینکه بدانید کدام FMها توسط سرویسهای AWS پشتیبانی میشوند، به [مدلهای بنیاد پشتیبانیشده در Amazon Bedrock](Supported foundation models in Amazon Bedrock) و [مدلهای بنیاد JumpStart Amazon SageMaker](Amazon SageMaker JumpStart Foundation Models) مراجعه کنید. ما همچنین به شما توصیه میکنیم [Amazon Bedrock Flows] را بررسی کنید، که میتواند مسیری را برای ایجاد گردش کار ساده کند. علاوه بر این، ما به شما یادآوری میکنیم که شتابدهندههای Trainium و Inferentia در این برنامهها صرفهجوییهای مهمی در هزینه ارائه میدهند.
همانطور که در مثالهایی که نشان دادیم نشان داده شده است، گردشهای کاری Agent به ویژه ارزشمند ثابت شدهاند. توصیه میکنیم [Agents Amazon Bedrock] را مرور کنید تا به سرعت گردشهای کاری Agent را ایجاد کنید.
پیادهسازی موفقیتآمیز هوش مصنوعی مولد چیزی فراتر از انتخاب مدل است—این نشاندهنده یک فرآیند توسعه نرمافزار جامع از آزمایش تا نظارت بر برنامه است. برای شروع ساخت پایههای خود در این سرویسهای ضروری، شما را به مرور [Amazon QuickStart] دعوت میکنیم.
برای کسب اطلاعات بیشتر در مورد نحوه استفاده آمازون از هوش مصنوعی، هوش مصنوعی در آمازون نیوز را ببینید.