فراتر از دستیارهای هوش مصنوعی: مورد آمازون

هوش مصنوعی مولد در حال متحول کردن عملیات تجاری از طریق کاربردهای مختلفی است، از جمله دستیارهای مکالمه مانند Rufus و Amazon Seller Assistant که متعلق به آمازون هستند. علاوه بر این، برخی از تأثیرگذارترین برنامه‌های هوش مصنوعی مولد به‌طور مستقل در پس‌زمینه عمل می‌کنند، قابلیتی ضروری که به شرکت‌ها امکان می‌دهد تا عملیات، پردازش داده‌ها و ایجاد محتوای خود را در مقیاس بزرگ تغییر دهند. این پیاده‌سازی‌های غیرمکالمه‌ای معمولاً به شکل گردش‌های کاری مبتنی بر عامل (agent) هستند که توسط مدل‌های زبانی بزرگ (LLM) هدایت می‌شوند، که اهداف تجاری خاص را در صنایع مختلف بدون نیاز به تعامل مستقیم کاربر انجام می‌دهند.

در مقایسه با برنامه‌های مکالمه‌ای که از بازخورد و نظارت بی‌درنگ (Real-time) کاربر بهره می‌برند، برنامه‌های غیرمکالمه‌ای دارای مزایای منحصربه‌فردی مانند تحمل بیشتر تأخیر، پردازش دسته‌ای و ذخیره‌سازی (Caching) هستند، اما ماهیت خودکار آنها نیازمند اقدامات امنیتی قوی‌تر و تضمین کیفیت کامل‌تر است.

این مقاله به بررسی چهار مورد استفاده مختلف از هوش مصنوعی مولد در آمازون می‌پردازد:

  • ایجاد فهرست محصولات آمازون و بهبود کیفیت داده‌های کاتالوگ – نشان می‌دهد که چگونه LLMها به شرکای فروش و آمازون کمک می‌کنند تا فهرست‌های محصولات با کیفیت بالاتری را در مقیاس بزرگ ایجاد کنند.
  • پردازش نسخه‌های داروخانه آمازون – نشان می‌دهد پیاده‌سازی‌ها و تفکیک وظایف برای گردش‌های کاری عامل در یک محیط به شدت قانون‌گذاری شده چگونه است.
  • نکات برجسته نظرات – نشان می‌دهد پردازش دسته‌ای در مقیاس بزرگ، یکپارچه‌سازی یادگیری ماشین سنتی (ML)، استفاده از LLMهای کوچک و راه‌حل‌های مقرون‌به‌صرفه چگونه است.
  • تولید تصویر و ویدئوی خلاقانه آگهی‌های آمازون – شیوه‌های هوش مصنوعی مولد چندوجهی و مسئولانه در کار خلاقانه چگونه است.

هر یک از این مطالعات موردی جنبه‌های مختلف پیاده‌سازی برنامه‌های هوش مصنوعی مولد غیرمکالمه‌ای، از معماری فنی گرفته تا ملاحظات عملیاتی را آشکار می‌کند. از طریق این مثال‌ها، خواهید آموخت که چگونه مجموعه‌ای کامل از سرویس‌های AWS از جمله Amazon Bedrock و Amazon SageMaker می‌تواند کلید موفقیت باشد. در نهایت، ما تجربیات کلیدی مشترک در میان موارد استفاده مختلف را فهرست می‌کنیم.

ایجاد فهرست محصولات با کیفیت بالا در آمازون

ایجاد فهرست محصولات با کیفیت بالا با جزئیات جامع، به مشتریان کمک می‌کند تا تصمیمات خرید آگاهانه بگیرند. به‌طور سنتی، شرکای فروش بسیاری از ویژگی‌های هر محصول را به‌صورت دستی وارد می‌کنند. راه‌حل جدید هوش مصنوعی مولد که در سال 2024 عرضه شد، با بازیابی فعال اطلاعات محصول از وب‌سایت‌های برند و سایر منابع، تجربه مشتری را بهبود می‌بخشد و این فرآیند را متحول می‌کند.

هوش مصنوعی مولد با پشتیبانی از ورودی اطلاعات در قالب‌های مختلف (مانند URL، تصاویر محصول یا صفحات گسترده) و تبدیل خودکار آن به ساختار و قالب مورد نظر، تجربه شرکای فروش را ساده می‌کند. بیش از 900,000 شریک فروش از آن استفاده کرده‌اند و نزدیک به 80 درصد از پیش‌نویس‌های فهرست محصولات تولید شده پذیرفته شده‌اند و فقط نیاز به حداقل ویرایش دارند. محتوای تولید شده توسط هوش مصنوعی، جزئیات جامع محصول را ارائه می‌دهد، که به بهبود وضوح و دقت کمک می‌کند، بنابراین به یافتن محصول در جستجوی مشتری کمک می‌کند.

برای فهرست‌های محصول جدید، گردش کار با ارائه اطلاعات اولیه توسط شریک فروش آغاز می‌شود. سپس، سیستم از چندین منبع اطلاعاتی برای ایجاد فهرست محصول جامع، از جمله عنوان، توضیحات و ویژگی‌های دقیق استفاده می‌کند. لیست‌های تولید شده برای تأیید یا ویرایش با شرکای فروش به اشتراک گذاشته می‌شوند.

برای فهرست‌های محصول موجود، سیستم محصولاتی را که می‌توان با داده‌های اضافی غنی کرد، شناسایی می‌کند.

یکپارچه‌سازی و پردازش داده برای خروجی زیاد

تیم آمازون با استفاده از Amazon Bedrock و سایر سرویس‌های AWS، کانکتورهای داخلی و خارجی قوی برای APIهای LLM-friendly ایجاد کرد که به طور یکپارچه با سیستم‌های پشتیبان Amazon.com ادغام می‌شوند.

یک چالش اصلی، سنتز داده‌های مختلف در یک فهرست محصول منسجم در بیش از 50 ویژگی (از جمله متن و عدد) بود. LLMها برای تفسیر دقیق مفاهیم تجارت الکترونیک به مکانیسم‌های کنترل و دستورالعمل‌های خاص نیاز دارند، زیرا ممکن است با چنین داده‌های پیچیده و متنوعی به بهترین شکل عمل نکنند. به عنوان مثال، یک LLM ممکن است “ظرفیت” در یک جاچاقویی را به اشتباه به عنوان اندازه به جای تعداد شکاف‌ها تفسیر کند یا “Fit Wear” را به اشتباه به عنوان توضیحات سبک به جای نام تجاری در نظر بگیرد. مهندسی سریع و Fine-tuning به‌طور گسترده برای رسیدگی به این موارد استفاده شد.

تولید و اعتبارسنجی با استفاده از LLM

فهرست‌های محصول تولید شده باید کامل و صحیح باشند. برای کمک به دستیابی به این هدف، راه‌حل یک گردش کار چند مرحله‌ای را پیاده‌سازی می‌کند که از LLMها برای تولید و اعتبارسنجی ویژگی‌ها استفاده می‌کند. این روش دوگانه LLM به جلوگیری از توهم کمک می‌کند، که هنگام برخورد با نگرانی‌های ایمنی یا مشخصات فنی بسیار مهم است. این تیم فناوری‌های خوداندیشی پیشرفته‌ای را برای اطمینان از اینکه فرآیندهای تولید و اعتبارسنجی به طور موثر مکمل یکدیگر هستند، توسعه داده است.

تضمین کیفیت چند لایه با بازخورد انسانی

بازخورد انسانی هسته اصلی تضمین کیفیت راه‌حل است. این فرآیند شامل ارزیابی اولیه توسط کارشناسان Amazon.com و همچنین ارائه ورودی توسط شرکای فروش برای پذیرش یا ویرایش است. این امر خروجی با کیفیت بالا را فراهم می‌کند و امکان بهبود مستمر مدل‌های هوش مصنوعی را فراهم می‌سازد.

فرآیند تضمین کیفیت شامل ترکیب روش‌های تست خودکار با ارزیابی‌های مبتنی بر ML، الگوریتم یا LLM است. فهرست‌های محصول ناموفق دوباره تولید می‌شوند و فهرست‌های محصول موفق برای آزمایش بیشتر ارسال می‌شوند. با استفاده از [مدل‌های استدلال علی](Causal Inference Models)، ما ویژگی‌های زیربنایی را که بر عملکرد فهرست محصول تأثیر می‌گذارند و فرصت‌های غنی‌سازی را شناسایی می‌کنیم. در نهایت، فهرست محصولات پس از بررسی کیفیت و پذیرش توسط شریک فروش، منتشر می‌شود و اطمینان حاصل می‌شود که مشتریان اطلاعات دقیق و جامعی در مورد محصول دریافت می‌کنند.

بهینه‌سازی سیستم در سطح برنامه برای دقت و هزینه

با توجه به استانداردهای بالای دقت و کامل بودن، این تیم یک روش تجربی جامع را با یک سیستم بهینه‌سازی خودکار به کار گرفت. این سیستم ترکیبات مختلف LLMها، Promptها، فیلمنامه‌ها، گردش‌های کار و ابزارهای هوش مصنوعی را برای بهبود معیارهای تجاری بالاتر، از جمله هزینه، بررسی می‌کند. با ارزیابی و آزمایش خودکار مداوم، مولد فهرست محصولات می‌تواند به طور موثر عملکرد، هزینه و کارایی را متعادل کند و در عین حال با تحولات جدید هوش مصنوعی سازگار شود. این روش بدان معناست که مشتریان می‌توانند از اطلاعات محصول با کیفیت بالا بهره‌مند شوند و شرکای فروش می‌توانند به ابزارهای پیشرفته برای ایجاد کارآمد فهرست محصولات دسترسی داشته باشند.

پردازش نسخه‌های مبتنی بر هوش مصنوعی مولد داروخانه آمازون

در مثال فهرست فروشندگانی که قبلاً مورد بحث قرار گرفت، که مبنای آن یک گردش کار انسان-ماشین بود، داروخانه آمازون نشان می‌دهد که چگونه این اصول را می‌توان در یک صنعت تنظیم شده قانون قابلیت انتقال و پاسخگویی بیمه سلامت اعمال کرد. در مقاله [درک چگونگی استفاده داروخانه آمازون از AmazonSageMaker برای ایجاد یک ربات گفتگو مبتنی بر LLM](Understanding how Amazon Pharmacy uses Amazon SageMaker to create an LLM-based chatbot)، ما یک دستیار مکالمه برای متخصصان مراقبت از بیمار را به اشتراک گذاشتیم، اکنون تمرکز ما بر پردازش خودکار نسخه است.

در داروخانه آمازون، ما یک سیستم هوش مصنوعی ساخته شده بر روی Amazon Bedrock و SageMaker توسعه داده‌ایم تا به تکنسین‌های داروساز کمک کنیم تا دستورالعمل‌های دارویی را دقیق‌تر و کارآمدتر پردازش کنند. این راه‌حل متخصصان انسانی را با LLM در نقش‌های ایجاد و اعتبارسنجی ادغام می‌کند تا دقت دستورالعمل‌های دارویی بیمار را افزایش دهد.

طراحی گردش کار محول شده برای دقت مراقبت‌های بهداشتی

سیستم پردازش نسخه، تخصص انسانی (کارشناسان ورود داده و داروسازان) را با پشتیبانی هوش مصنوعی ترکیب می‌کند تا توصیه‌های جهت‌دار و بازخورد ارائه دهد. گردش کار با پیش‌پردازنده پایگاه دانش داروخانه آغاز می‌شود، که متن نسخه خام را در [Amazon DynamoDB] استاندارد می‌کند، سپس از یک مدل زبان کوچک (SLM) Fine-tuned شده در SageMaker برای شناسایی اجزای کلیدی (دوز، فرکانس) استفاده می‌کند.

این سیستم به‌طور یکپارچه متخصصانی مانند متخصصان ورود داده و داروسازان را ادغام می‌کند، در حالی که هوش مصنوعی مولد مکمل گردش کار کلی است، بنابراین چابکی و دقت را بهبود می‌بخشد تا خدمات بهتری به بیماران خود ارائه دهیم. سپس، سیستم مونتاژ جهت‌دار با اقدامات ایمنی، برای ایجاد دستورالعمل‌هایی که وارد می‌کنند، به متخصصان ورود داده دستورالعمل تولید می‌کند تا از طریق یک ماژول پیشنهادی ایجاد شود. ماژول علامت‌گذاری خطاها را پرچم‌گذاری یا تصحیح می‌کند و اقدامات ایمنی اضافی را به عنوان بازخورد ارائه شده به متخصص ورود داده اعمال می‌کند. تکنسین‌ها در نهایت دستورالعمل‌های تایپ شده بسیار دقیق و ایمن را نهایی می‌کنند تا داروسازان بازبینی کنند یا خدمات پایین‌دستی را برای اجرای دستورالعمل‌ها انجام دهند.

یکی از نکات برجسته این راه‌حل، استفاده از تجزیه وظیفه است، که به مهندسان و دانشمندان اجازه می‌دهد کل فرآیند را به چندین مرحله تقسیم کنند، که شامل ماژول‌های جداگانه است که از زیرمجموعه‌ها تشکیل شده‌اند. این تیم به طور گسترده از SLMهای Fine-tuned شده استفاده کرده است. علاوه بر این، این فرآیند از برنامه‌های ML سنتی مانند [شناسایی موجودیت نامگذاری شده (NER)](Named Entity Recognition) یا استفاده از [مدل‌های رگرسیونی](Regression Models) برای تخمین درجه اطمینان نهایی استفاده می‌کند. استفاده از SLMها و ML سنتی در این فرآیند کنترل شده و مشخص، می‌تواند به طور قابل توجهی سرعت پردازش را بهبود بخشد در حالی که استانداردهای ایمنی سختگیرانه را حفظ می‌کند؛ زیرا اقدامات امنیتی مناسب در مراحل خاص گنجانده شده است.

این سیستم شامل چندین زیرمرحله مشخص است که هر زیرفرآیند به عنوان یک جزء تخصصی عمل می‌کند، که به روشی نیمه مستقل اما مشارکتی در تلاش برای رسیدن به هدف کلی در گردش کار عمل می‌کند. این رویکرد تجزیه با اعتبارسنجی خاص در هر مرحله ثابت کرده است که کارآمدتر از یک راه‌حل سرتاسری است، در حالی که استفاده از SLMهای Fine-tuned شده را امکان‌پذیر می‌کند. این تیم از [AWS Fargate](AWS Fargate) برای هماهنگی گردش کار استفاده می‌کند؛ زیرا در حال حاضر در سیستم‌های پشتیبان موجود ادغام شده است.

در جریان توسعه محصول تیم، آنها به Amazon Bedrock روی آوردند، محصولی که LLMهای با عملکرد بالا را ارائه می‌دهد و ویژگی‌های آسان برای استفاده را برای برنامه‌های هوش مصنوعی تولیدی دارد. SageMaker از انتخاب LLM بیشتر، سفارشی‌سازی عمیق‌تر و روش‌های ML سنتی پشتیبانی می‌کند. برای کسب اطلاعات بیشتر در مورد این فناوری، [بیاموزید که چگونه تجزیه وظایف و LLMهای کوچکتر می‌توانند هوش مصنوعی را مقرون به صرفه‌تر کنند](Find out how task decomposition and smaller LLMs can make AI more affordable)، و مطالعه [مطالعه موردی تجارت داروخانه آمازون](Amazon Pharmacy business case study).

ایجاد یک برنامه قابل اعتماد با اقدامات ایمنی و HITL

برای انطباق با استانداردهای HIPAA و ارائه حریم خصوصی بیمار، ما شیوه‌های حاکمیت داده‌های سختگیرانه‌ای را اجرا کردیم، در حالی که از روشی ترکیبی استفاده می‌کردیم که LLMهای Fine-tuned شده را با استفاده از APIهای Amazon Bedrock و [تولید افزایش یافته بازیابی](Retrieval Augmented Generation) ‏(RAG) با استفاده از [Amazon OpenSearch Service](Amazon OpenSearch Service)‎ ترکیب می‌کرد. این ترکیب بازیابی دانش کارآمد را در عین حفظ دقت بالا برای وظایف فرعی خاص امکان‌پذیر می‌کند.

مدیریت توهم‌های LLM، که در حوزه مراقبت‌های بهداشتی بسیار مهم است، فراتر از Fine-tuning در مجموعه‌های داده بزرگ نیاز دارد. راه‌حل ما اقدامات ایمنی خاص دامنه را پیاده‌سازی کرده است که روی [Amazon Bedrock Guardrails] ساخته شده است و با نظارت حلقه انسانی (HITL) تکمیل می‌شود تا قابلیت اطمینان سیستم را افزایش دهد.

تیم داروخانه آمازون به بهبود این سیستم از طریق بازخورد بلادرنگ داروسازان و قابلیت‌های توسعه یافته قالب‌های نسخه‌ای ادامه می‌دهد. این رویکرد متعادل از نوآوری، تخصص دامنه، خدمات پیشرفته هوش مصنوعی و نظارت انسانی نه تنها کارایی عملیاتی را بهبود می‌بخشد، بلکه به این معنی است که سیستم‌های هوش مصنوعی می‌توانند به درستی متخصصان مراقبت‌های بهداشتی را توانمند سازند و در نتیجه بهترین مراقبت از بیمار را ارائه دهند.

نکات برجسته بررسی مشتری مبتنی بر هوش مصنوعی مولد

در مثال قبلی خود، نشان دادیم که چگونه داروخانه آمازون LLMها را در یک گردش کار بی‌درنگ برای پردازش نسخه‌ها ادغام می‌کند، در حالی که این مورد استفاده نشان می‌دهد که چگونه می‌توان فناوری‌های مشابه (SLM، ML سنتی و طراحی متفکرانه گردش کار) را در [استنتاج دسته‌ای آفلاین](offline batch inference) در مقیاس بزرگ به کار برد.

آمازون [نکات برجسته بررسی مشتری تولید شده توسط هوش مصنوعی](AI-generated customer review highlights) را برای رسیدگی به بیش از 200 میلیون بررسی و رتبه‌بندی محصول سالانه معرفی کرده است. این ویژگی، نظرات به اشتراک گذاشته شده مشتریان را در پاراگراف‌های مختصر خلاصه می‌کند و بازخورد مثبت، خنثی و منفی در مورد محصول و ویژگی‌های آن را برجسته می‌کند. خریداران می‌توانند به سرعت درک روشنی از توافق کلی داشته باشند، در حالی که با ارائه دسترسی به بررسی‌های مربوطه مشتری و حفظ بررسی اصلی، شفافیت را حفظ می‌کنند.

این سیستم از طریق رابطی که مشتریان می‌توانند با انتخاب ویژگی‌های خاص (مانند کیفیت تصویر، قابلیت کنترل از راه دور یا سهولت نصب Fire TV) نکات برجسته بررسی را بررسی کنند، تصمیم‌گیری خرید را بهبود می‌بخشد. این ویژگی‌ها با علامت تیک سبز برای احساسات مثبت، علامت منفی نارنجی برای احساسات منفی و خاکستری برای بی‌طرفی مشخص می‌شوند - این بدان معناست که خریداران می‌توانند به سرعت نقاط قوت و ضعف محصول را بر اساس بررسی‌های خرید تأیید شده شناسایی کنند.

استفاده از LLMها به روشی مقرون به صرفه برای موارد استفاده آفلاین

این تیم یک معماری ترکیبی مقرون به صرفه ایجاد کرده است که روش‌های ML سنتی را با SLMهای تخصصی ترکیب می‌کند. با اختصاص تجزیه و تحلیل احساسات و استخراج کلمات کلیدی به ML سنتی، در حالی که از SLMهای بهینه‌سازی شده برای کارهای پیچیده تولید متن استفاده می‌کند، این روش دقت و کارایی پردازش را بهبود می‌بخشد.

این ویژگی از [تبدیل دسته‌ای SageMaker ](SageMaker Batch Transform)برای پردازش ناهمزمان استفاده می‌کند، که در مقایسه با نقاط پایانی بی‌درنگ، می‌تواند هزینه‌ها را به میزان قابل توجهی کاهش دهد. برای ارائه تجربه‌ای نزدیک به تأخیر صفر، این راه‌حل بینش‌های استخراج شده و بررسی‌های موجود را ذخیره می‌کند، بنابراین زمان انتظار را کاهش می‌دهد و به مشتریان متعدد اجازه می‌دهد تا به طور همزمان بدون نیاز به محاسبات اضافی به آن دسترسی داشته باشند. این سیستم به‌طور فزاینده بررسی‌های جدید را پردازش می‌کند و بینش‌ها را بدون نیاز به پردازش مجدد مجموعه داده کامل به‌روز می‌کند. برای بهینه‌سازی عملکرد و مقرون به صرفه بودن، این ویژگی از [موتور محاسباتی ابری الاستیک آمازون](Amazon Elastic Compute Cloud) ‏(Amazon EC2) ‏[نمونه Inf2](Inf2 instance) برای کارهای تبدیل دسته‌ای استفاده می‌کند، [که در مقایسه با جایگزین‌ها، تا 40 درصد قیمت بهتری ارائه می‌دهد](offering up to 40% higher price performance compared to alternatives).

با پیروی از این روش جامع، این تیم به طور موثر هزینه‌ها را مدیریت می‌کند در حالی که حجم زیادی از نظرات و محصولات را پردازش می‌کند و در نتیجه این راه‌حل را هم کارآمد و هم مقیاس‌پذیر می‌کند.

نسل تصاویر و ویدئوهای خلاقانه آگهی آمازون مبتنی بر هوش مصنوعی

در مثال‌های قبلی، عمدتاً برنامه‌های کاربردی هوش مصنوعی مولد با محوریت متن را بررسی کردیم، اکنون به هوش مصنوعی مولد چندوجهی با [تولید محتوای خلاقانه آگهی‌های حمایت شده آمازون](Sponsored Ads creative content generation)‎ می‌پردازیم. این راه‌حل دارای قابلیت‌های تولید تصویر و ویدئو است و ما در این بخش جزئیات مربوط به این ویژگی‌ها را به اشتراک خواهیم گذاشت. به‌طور کلی، هسته این راه حل از [Amazon Nova] مدل تولید محتوای خلاقانه استفاده می‌کند.

با بررسی نیازهای مشتری، نظرسنجی انجام شده توسط آمازون در مارس 2023 نشان داد که نزدیک به 75 درصد از تبلیغ‌کنندگان، تولید محتوای خلاقانه را به عنوان چالش اصلی خود در تلاش برای دستیابی به موفقیت در کمپین‌های تبلیغاتی خود فهرست کرده‌اند. بسیاری از تبلیغ‌کنندگان (به ویژه آنهایی که فاقد ظرفیت داخلی یا پشتیبانی آژانس هستند) با موانع قابل توجهی به دلیل تخصص و هزینه تولید تصاویر با کیفیت بالا مواجه هستند. راه‌حل تبلیغاتی آمازون، ایجاد محتوای بصری را دموکراتیک می‌کند و آن را برای تبلیغ‌کنندگان در هر اندازه در دسترس و کارآمد می‌سازد. تأثیر آن بسیار زیاد است: تبلیغ‌کنندگانی که از تصاویر تولید شده توسط هوش مصنوعی در کمپین‌های تبلیغاتی [برندهای حمایت شده](Sponsored Brands)‎ استفاده می‌کنند، [نرخ کلیک (CTR)](click-through rate (CTR)) نزدیک به 8 درصد دارند و کمپین‌های ارسالی 88 درصد بیشتر از کاربران غیرکاربر است.

سال گذشته، وبلاگ یادگیری ماشینی AWS مقاله‌ای [با جزئیات راه‌حل تولید تصویر](detailed article about the image generation solution) منتشر کرد. از آن زمان، آمازون [Amazon Nova Canvas] را به عنوان مبنای تولید تصویر خلاقانه پذیرفته است. با استفاده از درخواست‌های متنی یا تصویری، همراه با قابلیت‌های ویرایش مبتنی بر متن و کنترل‌های طرح رنگ و تنظیم طرح‌بندی، تصاویر درجه یک حرفه‌ای ایجاد می‌کند.

در سپتامبر 2024، تیم تبلیغات آمازون قابلیت ایجاد [تبلیغات ویدئویی کوتاه](short video ads)‎ از تصاویر محصول را اضافه کرد. این ویژگی با استفاده از [مدل‌های بنیاد](foundation models)‎ در [Amazon Bedrock](Amazon Bedrock)‎، ارائه شده از طریق کنترل زبان طبیعی بر سبک بصری، آهنگ، حرکت دوربین، چرخش و بزرگنمایی، به مشتریان کنترل می‌دهند. از یک جریان کار代理 برای توصیف ابتدا storyboard ویدئو استفاده می‌کند، سپس محتوای داستان را تولید می‌کند.

همانطور که در مقاله اصلی مورد بحث قرار گرفت، [هوش مصنوعی مسئولانه](responsible AI) هسته این راه‌حل است و مدل خلاقانه آمازون Nova با کنترل‌های داخلی برای پشتیبانی از استفاده ایمن و مسئولانه از هوش مصنوعی، از جمله علامت‌گذاری با واترمارک و تعدیل محتوا ارائه می‌شود.

این راه‌حل از [AWS Step Functions](AWS Step Functions)‎ و [AWS Lambda]‎ برای هماهنگی هماهنگی بدون سرور فرآیندهای تولید تصویر و ویدئو استفاده می‌کند. محتوای تولید شده در [Amazon Simple Storage Service] (Amazon S3) ذخیره می‌شود، فراداده در DynamoDB ذخیره می‌شود و [Amazon API Gateway]‎ دسترسی مشتری به قابلیت‌های تولید را فراهم می‌کند. این راه‌حل اکنون از [Amazon Bedrock Guardrails] علاوه بر حفظ [Amazon Rekognition](Amazon Rekognition)‎ و [Amazon Comprehend](Amazon Comprehend)‎ در مراحل مختلف برای بررسی‌های ایمنی اضافی استفاده می‌کند.

ایجاد تبلیغات خلاقانه با کیفیت بالا در مقیاس بزرگ چالش‌های پیچیده‌ای را به همراه دارد. مدل‌های هوش مصنوعی مولد باید تصاویری جذاب و متناسب با برند را در دسته‌های مختلف محصولات و محیط‌های تبلیغاتی تولید کنند، در حالی که اطمینان حاصل شود که برای تبلیغ‌کنندگان در تمام سطوح فنی به راحتی در دسترس است. تضمین کیفیت و بهبود اساس قابلیت‌های تولید تصویر و ویدئو است. این سیستم به طور مداوم از طریق یک فرآیند گسترده HITL که از طریق [Amazon SageMaker Ground Truth]‎ فعال شده است، بهبود می‌یابد. این پیاده‌سازی ابزاری قدرتمند ارائه می‌دهد که می‌تواند فرآیند ایجاد تبلیغ‌کنندگان را متحول کند، بنابراین ایجاد محتوای بصری با کیفیت بالا را در هر دسته محصول و محیط آسان‌تر می‌کند.

این تنها آغاز استفاده آگهی آمازون از هوش مصنوعی مولد برای کمک به تبلیغ‌کنندگانی است که نیاز به ایجاد محتوای متناسب با اهداف تبلیغاتی خود دارند. این راه‌حل نشان می‌دهد که چگونه کاهش موانع ایجاد می‌تواند مستقیماً کمپین‌های تبلیغاتی را بهبود بخشد و در عین حال استانداردهای بالایی از استفاده مسئولانه از هوش مصنوعی را حفظ کند.

تجربیات و بحث‌های کلیدی فناوری

  • برنامه‌های غیرمکالمه‌ای از تحمل تأخیر بالاتر بهره می‌برند، بنابراین امکان پردازش دسته‌ای و Cachig را فراهم می‌کنند، اما به دلیل خودمختاری، به مکانیسم‌های اعتبارسنجی قوی و اقدامات امنیتی قوی‌تری نیاز دارند. این بینش‌ها برای پیاده‌سازی‌های هوش مصنوعی غیرمکالمه‌ای و مکالمه‌ای کاربرد دارند:

  • تجزیه وظیفه و جریانات کاری عامل – ثابت شده است که شکستن مسائل پیچیده به مؤلفه‌های کوچک‌تر در پیاده‌سازی‌های مختلف ارزشمند است. این تجزیه متفکرانه که توسط کارشناسان حوزه انجام می‌شود، امکان ایجاد مدل‌های تخصصی را برای وظایف فرعی خاص فراهم می‌کند، همانطور که در پردازش نسخه داروخانه آمازون نشان داده شده است، جایی که SLMهای fine-tuned شده می‌توانند وظایف گسسته مانند شناسایی دوز را مدیریت کنند. این استراتژی به ایجاد agents تخصصی با مراحل اعتبارسنجی واضح اجازه می‌دهد، بنابراین قابلیت اطمینان را بهبود می‌بخشد و نگهداری را ساده می‌کند. مورد استفاده فهرست فروشندگان آمازون این را از طریق جریان کار چند مرحله‌ای خود با فرآیندهای تولید و اعتبارسنجی جداگانه مثال می‌زند. علاوه بر این، مورد استفاده نکات برجسته بررسی، استفاده مقرون به صرفه و کنترل شده از LLM را نشان می‌دهد، یعنی از طریق استفاده از ML سنتی برای پیش پردازش و انجام بخش‌هایی که می‌توانند به وظایف LLM مرتبط باشند.

  • معماری‌های ترکیبی و انتخاب مدل – ترکیب ML سنتی با LLMها کنترل و مقرون به صرفه‌تری نسبت به رویکردهای LLM خالص ارائه می‌دهد. ML سنتی در دست زدن به وظایف دقیق تعریف شده تبحر دارد، همانطور که سیستم نکات برجسته بررسی برای تجزیه و تحلیل احساسات و استخراج اطلاعات نشان داده است. تیم‌های آمازون به طور استراتژیک مدل‌های زبانی بزرگ و کوچک را بر اساس نیاز مستقر کرده‌اند، ترکیبی از RAG با Fine-tuning برای برنامه‌های کاربردی خاص دامنه مانند پیاده‌سازی‌های داروخانه آمازون استفاده کرده‌اند.

  • استراتژی‌های بهینه‌سازی هزینه – تیم‌های آمازون با پردازش دسته‌ای، مکانیسم‌های Cachig برای عملیات با حجم بالا، [AWS Inferentia]‎ و [AWS Trainium]‎ مانند انواع نمونه تخصصی و انتخاب مدل بهینه‌سازی شده به کارایی دست یافته‌اند. نکات برجسته بررسی نشان می‌دهد که چگونه پردازش incremental نیازهای محاسباتی را کاهش می‌دهد، در حالی که آگهی آمازون از [مدل‌های بنیاد](foundation models)‎ آمازون Nova برای ایجاد محتوای خلاقانه استفاده می‌کند.

  • تضمین کیفیت و مکانیسم‌های کنترل – کنترل کیفیت متکی به اقدامات ایمنی خاص دامنه، از طریق Amazon Bedrock Guardrails و اعتبارسنجی چند لایه است که تست‌های خودکار را با ارزیابی انسانی ترکیب می‌کند. یک روش dual-LLM برای تولید و اعتبارسنجی به جلوگیری از توهمات در فهرست فروشندگان آمازون کمک می‌کند، در حالی که فناوری‌های خوداندیشی دقت را بهبود می‌بخشند. Amazon Nova creative FM کنترل‌های هوش مصنوعی مسئولیت‌پذیر ذاتی را ارائه می‌دهد و از طریق تست A/B مداوم و اندازه‌گیری عملکرد تکمیل می‌شود.

  • پیاده‌سازی HITL – روش‌های HITL چندین لایه را در بر می‌گیرد، از ارزیابی‌های کارشناسانه توسط داروسازان گرفته تا بازخورد کاربر نهایی توسط شرکای فروش. تیم‌های آمازون جریانات کاری بهبود ساختاریافته‌ای ایجاد کرده‌اند، بنابراین اتوماسیون و نظارت انسانی را بر اساس الزامات دامنه خاص و پروفایل‌های ریسک متعادل می‌کنند.

  • هوش مصنوعی و انطباق مسئولانه – شیوه‌های هوش مصنوعی مسئولانه شامل اقدامات ایمنی انحصاری محتوا برای محیط‌های تنظیم شده و انطباق با مقرراتی مانند HIPAA است. تیم‌های آمازون تعدیل محتوا را برای برنامه‌های کاربردی رو به کاربر ادغام کرده‌اند، با ارائه دسترسی به اطلاعات منبع، شفافیت نکات برجسته بررسی را حفظ کرده‌اند و حاکمیت داده‌ها را با نظارت برای ارتقای کیفیت و انطباق اجرا کرده‌اند.

مدل‌های فوق امکان پیاده‌سازی راه‌حل‌های هوش مصنوعی مولدی را فراهم می‌کنند که مقیاس‌پذیر، قابل اعتماد و مقرون به صرفه هستند، در حالی که استانداردهای کیفیت و مسئولیت‌پذیری را حفظ می‌کنند. این پیاده‌سازی‌ها نشان می‌دهد که راه‌حل‌های مؤثر نه تنها به مدل‌های پیشرفته، بلکه به توجه دقیق به معماری، عملیات و حکمرانی نیز نیاز دارند و از سرویس‌های AWS و رویه‌های تثبیت‌شده پشتیبانی می‌شوند.

مراحل بعدی

مثال‌های فوق از آمازون نشان می‌دهد که چگونه هوش مصنوعی مولد می‌تواند ارزشی فراتر از دستیارهای مکالمه‌ای سنتی ایجاد کند. ما از شما دعوت می‌کنیم تا از این مثال‌ها پیروی کنید یا راه‌حل‌های خود را ایجاد کنید، تا درک کنید که چگونه هوش مصنوعی مولد می‌تواند کسب‌وکارتان یا حتی صنعتتان را متحول کند. برای شروع فرآیند ایده‌پردازی می‌توانید به صفحه [موارد استفاده هوش مصنوعی مولد AWS](AWS generative AI use cases)‎ مراجعه کنید.

این مثال‌ها نشان می‌دهد که پیاده‌سازی‌های مؤثر هوش مصنوعی مولد اغلب از ترکیب انواع مختلف مدل و گردش کار بهره می‌برند. برای اینکه بدانید کدام FMها توسط سرویس‌های AWS پشتیبانی می‌شوند، به [مدل‌های بنیاد پشتیبانی‌شده در Amazon Bedrock](Supported foundation models in Amazon Bedrock)‎ و [مدل‌های بنیاد JumpStart Amazon SageMaker](Amazon SageMaker JumpStart Foundation Models)‎ مراجعه کنید. ما همچنین به شما توصیه می‌کنیم [Amazon Bedrock Flows] را بررسی کنید، که می‌تواند مسیری را برای ایجاد گردش کار ساده کند. علاوه بر این، ما به شما یادآوری می‌کنیم که شتاب‌دهنده‌های Trainium و Inferentia در این برنامه‌ها صرفه‌جویی‌های مهمی در هزینه ارائه می‌دهند.

همانطور که در مثال‌هایی که نشان دادیم نشان داده شده است، گردش‌های کاری Agent به ویژه ارزشمند ثابت شده‌اند. توصیه می‌کنیم [Agents Amazon Bedrock] را مرور کنید تا به سرعت گردش‌های کاری Agent را ایجاد کنید.

پیاده‌سازی موفقیت‌آمیز هوش مصنوعی مولد چیزی فراتر از انتخاب مدل است—این نشان‌دهنده یک فرآیند توسعه نرم‌افزار جامع از آزمایش تا نظارت بر برنامه است. برای شروع ساخت پایه‌های خود در این سرویس‌های ضروری، شما را به مرور [Amazon QuickStart] دعوت می‌کنیم.

برای کسب اطلاعات بیشتر در مورد نحوه استفاده آمازون از هوش مصنوعی، هوش مصنوعی‎ در آمازون نیوز را ببینید.