超越AI助手:亞馬遜重塑產業案例

生成式人工智能 (Generative AI) 正在通過各種應用徹底改變業務運營,其中包括亞馬遜旗下的 Rufus 和 Amazon Seller Assistant 等對話式助手。此外,一些最具影響力的生成式人工智能應用在後台自主運行,這是一項必不可少的功能,使企業能夠大規模地轉變其運營、數據處理和內容創建。這些非對話實施通常以由大型語言模型 (LLM) 驅動的代理工作流程的形式出現,無需直接用戶交互即可跨行業執行特定的業務目標。

與受益於實時用戶反饋和監督的對話式應用相比,非對話式應用具有更高的延遲容忍度、批量處理和緩存等獨特優勢,但其 автоном 性質需要更強的安全措施和詳盡的質量保證。

本文探討了亞馬遜的四個不同的生成式人工智能應用案例:

  • 亞馬遜商品信息創建和目錄數據質量改進 – 展示了 LLM 如何幫助銷售合作夥伴和亞馬遜大規模創建更高質量的商品信息
  • 亞馬遜藥房的處方處理 – 展示了在高度監管環境中的實施和用於代理工作流程的任務分解
  • 評論亮點 – 說明了大規模批量處理、傳統機器學習 (ML) 集成、小型 LLM 的使用以及經濟高效的解決方案
  • 亞馬遜廣告創意圖像和視頻生成 – 突出了創意工作中多模態生成式人工智能和負責人的人工智能實踐

每個案例研究都揭示了實施非對話式生成式人工智能應用不同的方面,從技術架構到運營考慮。通過這些示例,您將了解包括 Amazon Bedrock 和 Amazon SageMaker 在內的整套 AWS 服務如何成為成功的關鍵。最後,我們列出了各種用例中普遍分享的關鍵經驗。

在亞馬遜上創建高品質商品信息

創建具有全面細節的高質量商品信息有助於客戶做出明智的購買決策。傳統上,銷售合作夥伴會手動輸入每個產品的許多屬性。2024 年推出的全新生成式人工智能解決方案通過主動從品牌網站和其他來源獲取產品信息來改進客戶體驗,從而改變了這一流程。

生成式人工智能通過支持以各種格式(例如 URL、產品圖像或電子表格)輸入信息,並自動將其轉換為所需的結構和格式,從而簡化了銷售合作夥伴的體驗。超過 900,000 家銷售合作夥伴使用過它,近 80% 的生成的商品信息草稿被接受,只需進行最少的編輯。人工智能生成的内容提供全面的產品詳細信息,這有助於提高清晰度和准確性,從而有助於在客戶搜索中發現產品。

對於新商品信息,工作流程從銷售合作夥伴提供初始信息開始。然後,系統使用多個信息來源生成全面的商品信息,包括標題、描述和詳細屬性。生成的商品信息與銷售合作夥伴共享以供批准或編輯。

對於現有商品信息,系統會識別可以使用其他數據豐富的產品。

用於大量輸出的數據集成和處理

亞馬遜團隊使用 Amazon Bedrock 和其他 AWS 服務為 LLM 友好型 API 構建了强大的内部和外部來源連接器,從而無縫集成到 Amazon.com 後端系統。

一個主要挑戰是將各種數據綜合為跨 50 多個屬性(包括文本和數字)的連貫商品信息。LLM 需要特定的控制機制和說明才能準確地解釋電子商務概念,因為它們可能無法以如此複雜、多樣的數據進行最佳性能。例如,LLM 可能会将刀座中的「容量」誤認為是尺寸而不是槽的數量,或者将「Fit Wear」誤認為是款式描述而不是品牌名稱。提示工程和微調被廣泛用於解決這些案例。

使用 LLM 進行生成和驗證

生成的商品信息應完整且正確。為了幫助實現此目標,該解決方案實現了一個多步骤工作流程,使用 LLM 進行屬性的生成和驗證。這種雙 LLM 方法有助於防止幻覺,這在處理安全隱患或技術規格時至關重要。該團隊開發了先進的自我反思技術,以確保生成和驗證過程有效地相互補充。

具有人工反饋的多層質量保證

人工反饋是解決方案質量保證的核心。該過程包括 Amazon.com 專家進行初步評估,以及銷售合作夥伴提供輸入以供接受或編輯。這提供了高質量輸出,並能够不斷增强人工智能模型。

質量保證過程包括結合 ML、算法或基於 LLM 的評估的自動化測試方法。失敗的商品信息會重新生成,成功的商品信息會進行进一步測試。使用[因果推理模型],我們確定影響商品信息性能的底層特征以及豐富機會。最终,通过質量檢查並接受銷售合作夥伴的商品信息會被發布,從而確保客戶收到準確且全面的產品信息。

用於準確性和成本的應用程式級系統優化

鑒於對準確性和完整性的高標準,該團隊採用了一種綜合的實驗方法,並配備了一個自動化優化系統。該系統探索 LLM、提示、劇本、工作流程和人工智能工具的各種组合,以提高包括成本在内的更高業務指標。通過持續評估和自動化測試,產品商品信息生成器可以有效地平衡性能、成本和效率,同時適應新的人工智能發展。這種方法意味著客戶可以從高質量的產品信息中受益,銷售合作夥伴可以訪問用於高效創建商品信息的尖端工具。

亞馬遜藥房中基於生成式人工智能的處方處理

在之前討論的賣家商品信息示例中,以人機混合工作流程為基礎,亞馬遜藥房展示了如何將這些原則應用於 健康保險流通與責任法案 監管的行業。在[了解亞馬遜藥房如何使用 Amazon SageMaker 創建基於 LLM 的聊天機器人]一文中,我們分享了一個用於患者護理專家的對話式助手,現在我們關注的是自動化的處方處理。

在亞馬遜藥房,我們開發了一個基於 Amazon Bedrock 和 SageMaker 構建的人工智能系統,以幫助藥劑師技術人員更准確、更高效地處理藥物說明。該解決方案將人類專家與 LLM 集成到創建和驗證角色中,以提高患者藥物說明的準確性。

醫療保健準確性的委託工作流程設計

處方處理系統將人類專業知識(數據錄入員和藥劑師)與人工智能支持相結合,以提供方向建議和反饋。工作流程從藥房知識庫預處理器開始,該預處理器將 [Amazon DynamoDB] 中的原始處方文本標準化,然後使用 SageMaker 上的微調小型語言模型 (SLM) 來識別關鍵組件(劑量、頻率)。

該系統無縫集成了數據錄入員和藥劑師等專家,其中生成式人工智能與整體工作流程相輔相成,從而提高敏捷性和准確性,從而更好地服務於我們的患者。然後,帶有安全措施的方向組裝系統生成給數據錄入員的說明,以通過建議模塊創建他們鍵入的方向。標記模塊會標記或糾正錯誤,並强制執行其他安全措施,作為提供給數據錄入員的反饋。技術人員最终確定高度準確、安全鍵入的方向,供藥劑師提供反饋或向下游服務執行方向。

該解決方案的一個亮點是任務分解的使用,這使工程師和科學家能够將整個過程分解為多個步骤,其中包括由子步骤組成的各個模塊。該團隊廣泛使用了微調的 SLM。此外,該過程還採用了傳統的 ML 程序,例如[命名實體識別 (NER)]或使用 [回歸模型 ]對最终置信度進行估計。在這種受控的、明確定義的過程中使用 SLM 和傳統的 ML 可以顯著提高處理速度,同時由於在特定步骤中加入了適當的安全措施,因此可以保持嚴格的安全標準。

該系統包含多個明確定義的子步骤,每個子流程都作為專門的组件運行,在工作流程中以半自主但協作的方式朝着總體目標工作。這種分解的方法在每個階段都具有特定的驗證,證明比端到端解決方案更有效,同時可以使用微調的 SLM。該團隊使用 [AWS Fargate ]來協調工作流程,因為它當前已集成到現有的後端系統中。

在該團隊的產品開發過程中,他們转向了 Amazon Bedrock,該產品提供高性能的 LLM,並具有針對生成式人工智能應用量身定制的易用特性。SageMaker 支持进一步的 LLM 選擇、更深層次的定制以及傳統的 ML 方法。要了解有關此技術的更多信息,請參閱[任務分解和較小的 LLM 如何才能使人工智能更經濟實惠],並閱讀[亞馬遜藥房業務案例研究]。

構建具有安全措施和 HITL 的可靠應用程式

為了遵守 HIPAA 標準並提供患者隱私,我們實施了嚴格的數據治理實踐,同時採用了一種混合方法,該方法將使用 Amazon Bedrock API 的微調的 LLM 和使用 [Amazon OpenSearch Service ]的 检索增強生成 相結合。這種組合可以實現高效的知識檢索,同時保持特定子任務的高精度。

管理 LLM 幻覺(這在醫療保健領域至關重要)需要的不仅仅是在大型數據集上進行微調。我們的解決方案實施了基於 [Amazon Bedrock Guardrails ]構建的特定於領域的安全措施,並通過人機環路 (HITL) 監督進行補充,以提高系統的可靠性。

亞馬遜藥房團隊繼續通過藥劑師的實時反饋和擴展的處方格式功能來增强該系統。創新、領域專業知識、高級人工智能服務和人工監督的這種平衡方法不僅提高了運營效率,而且還意味著人工智能系統能够正確地增强醫療保健專業人員的能力,從而提供最佳的患者護理。

基於生成式人工智能的客戶評論亮點

我們的上一個示例展示了亞馬遜藥房如何將 LLM 集成到實時工作流程中以進行處方處理,而此用例展示了如何將類似的技術(SLM、傳統 ML 和周到的工作流程設計)應用於大規模的 [離線批量推斷]。

亞馬遜推出了 [人工智能生成的客戶評論重點 ],以處理超過 2 億條年度產品評論和評分。此功能將共享的客戶意見提煉成簡潔的段落,突出有關產品及其功能的正面、中性和負面反饋。購物者可以快速掌握共識,同時通過提供對相關客戶評論的訪問權限並保留原始評論來保持透明度。

該系統通過客戶可以通過選擇特定功能(例如圖片質量、遥控功能或 Fire TV 的易安裝性)來探索評論重點的介面來增强購物決策。這些功能通過綠色複選標記表示正面情緒,橙色負號表示負面情緒,灰色表示中性——這意味著購物者可以根據經過驗證的購買評論快速識別產品的優缺點。

以經濟高效的方式使用 LLM 進行離線用例

該團隊開發了一種經濟高效的混合架構,將傳統 ML 方法與專業的 SLM 相結合。這種方法將情感分析和關鍵字提取分配給傳統的 ML,同時使用優化的 SLM 進行複雜的文本生成任務,從而提高準確性和處理效率。

該功能採用 [SageMaker 批量轉換 ]進行異步處理,與實時endpoints相比,可以顯著降低成本。為了提供接近零延遲的體驗,該解決方案 [緩存 ]提取的見解和現有評論,從而减少了等待時間,並允許多個客戶同時訪問,而無需進行額外的計算。該系統以增量方式處理新評論,更新見解而無需重新處理完整的數據集。為了獲得最佳性能和成本效益,該功能使用 [Amazon Elastic Compute Cloud ](Amazon EC2) [Inf2 實例 ]進行批量轉換作業,[與替代方案相比,可提供高达 40% 的更高性價比]。

通過遵循這種全面的方法,該團隊有效地管理了成本,同時處理了大量的評論和產品,從而使該解決方案既高效又可擴展。

亞馬遜廣告人工智能驅動的創意圖像和視頻生成

在之前的示例中,我們主要探討了以文本為中心的生成式人工智能應用,現在我們將转向帶有 [亞馬遜廣告贊助廣告創意內容生成 ]的多模態生成式人工智能。該解決方案具有 [圖像 ]和 [視頻 ]生成功能,我們將在本節中分享有關這些功能的詳細信息。總的來說,該解決方案的核心使用了 [亞馬遜 Nova] 創意內容生成模型。

根據客戶需求倒推,亞馬遜在 2023 年 3 月進行的一項調查顯示,近 75% 的廣告商在努力取得廣告活動成功時,將創意內容生成列為他們的主要挑戰。許多廣告商(尤其是那些沒有内部能力或代理支持的廣告商)由於生產高質量視覺效果的專業知識和成本而面臨重大障礙。亞馬遜廣告解決方案使視覺内容創建民主化,使不同規模的廣告商都可以訪問和高效地使用它。影響是巨大的:在 [贊助品牌 ]廣告活動中使用人工智能生成的圖像的廣告商的 [點擊率 (CTR)] 接近 8%,並且提交的廣告活動比非用戶多 88%。

去年,AWS機器學習博客发表了一篇 [詳細介紹圖像生成解決方案 ]的文章。從那時起,亞馬遜採用了 [Amazon Nova Canvas ]作為創意圖像生成的基础。利用文字或圖像提示,結合基於文字的編輯功能和顏色方案及布局調整控制,創造專業級圖像。

2024 年 9 月,亞馬遜廣告團隊添加了從產品圖像創建 [短視頻廣告 ]的功能。此功能使用 [Amazon Bedrock 上提供的foundation models ],通過自然語言控制視覺風格、節奏、相機運動、旋轉和縮放,從而為客戶提供控制權。它使用一種代理工作流程來首先描述視頻故事板,然後生成故事內容。

正如原始文章中所討論的那樣,[負責人的人工智能 ]是該解決方案的核心,而 Amazon Nova 創意模型帶有内置控件,以支持安全和負責人的人工智能使用,包括水印和内容審核。

該解決方案使用 [AWS Step Functions ]和 [AWS Lambda ]函数來協調圖像和視頻生成流程的無服務器協調。生成的內容存在 [Amazon Simple Storage Service ](Amazon S3) 中,元數據存在 DynamoDB 中,而 [Amazon API Gateway ]提供客戶對生成功能的訪問。該解決方案現在除了在各個步骤中保持 [Amazon Rekognition ]和 [Amazon Comprehend ]集成以進行其他安全檢查之外,還採用了 Amazon Bedrock Guardrails。

大規模創建高質量的廣告創意帶來了複雜的挑戰。生成式人工智能模型需要在各種產品類別和廣告環境下生成引人入勝且適合品牌形象的圖像,同時讓所有技術水平的廣告商都可以輕鬆訪問。質量保證和改進是圖像和視頻生成功能的基礎。該系統通過 [Amazon SageMaker Ground Truth ]實現的廣泛 HITL 流程不斷增强。這種實施提供了一個强大的工具,可以轉變廣告商的創作過程,從而使各個產品類別和環境中的高質量視覺内容創建更加容易。

這仅仅是亚马逊广告使用生成式人工智能來幫助需要創建適合廣告目標的内容的廣告客戶的開始。該解決方案表明,减少創作障礙如何能够直接提高廣告活動,同時保持負責人的人工智能使用的高標準。

關鍵技術經驗和討論

非對話式應用受益於更高的延遲容忍度,從而能够進行批量處理和緩存,但由於其自主性,因此需要强大的驗證機制和更强的安全措施。這些見解適用於非對話式和對話式人工智能實施:

  • 任務分解和代理工作流程 – 將複雜的問題分解為較小的组件已被證明在各種實施中都很有價值。領域專家進行的這種深思熟慮的分解能够為特定子任務創建專門的模型,正如亞馬遜藥房處方處理中所展示的那樣,在處方處理中,微調的 SLM 可以處理離散任務,例如劑量識別。這種策略允許創建具有清晰驗證步骤的專門agent,從而提高可靠性並簡化維護。亞馬遜卖家商品信息用例通過其具有單獨生成和驗證流程的多步骤工作流程對此作了例證。此外,評論重點用例展示了經濟高效且受控的 LLM 使用,即通過使用傳統的 ML 進行預處理以及執行可以與 LLM 任務相關聯的部分。
  • 混合架構和模型選擇 – 與純 LLM 方法相比,將傳統的 ML 與 LLM 相結合可提供更好的控制和成本效益。傳統的 ML 擅長處理定義明確的任務,正如評論重點系統用於情感分析和信息提取所顯示的那樣。亞馬遜團隊已根據需求戰略性地部署了大型和小型語言模型,將 RAG 與微調相結合,用於有效的特定於領域的應用,例如亞馬遜藥房的實施。
  • 成本優化策略 – 亞馬遜團隊通過批量處理、用於大容量運營的緩存機制、[AWS Inferentia ]和 [AWS Trainium ]等專門的實例類型以及優化的模型選擇來實現了效率。評論重點展示了增量處理如何减少計算需求,而亞馬遜廣告使用 Amazon Nova foundation models 來經濟高效地創建創意内容。
  • 質量保證和控制機制 – 質量控制依賴於通過 Amazon Bedrock Guardrails 的特定於領域的安全措施和結合了自動化測試與人工評估的多層驗證。用於生成和驗證的雙 LLM 方法有助於防止亞馬遜卖家商品信息中出現幻覺,而自我反思技術可提高準確性。Amazon Nova 創意 FM 提供固有的負責人的人工智能控制,並通過持續的 A/B 測試和性能測量進行補充。
  • HITL 實施 – HITL 方法跨越多個層,從藥劑師的專家評估到銷售合作夥伴的最終用戶反饋。亞馬遜團隊建立了結構化的改進工作流程,從而根據特定的領域要求和風險配置文件平衡了自動化和人工監督。
  • 負責人的人工智能和合規性 – 負責人的人工智能實踐包括針對受監管環境的内容攝取安全措施以及遵守 HIPAA 等法規。亞馬遜團隊集成了針對面向用戶的應用的内容審核,通過提供對源信息的訪問權限來保持評論重點的透明性,並實施了具有監控的數據治理來提高質量和合規性。

這些模式能够實現可擴展、可靠且經濟高效的生成式人工智能解決方案,同時保持質量和責任標準。這些實施表明,有效的解決方案不仅需要先進的模型,还需要仔細關注架構、運營和治理,並由 AWS 服務和已建立的做法提供支持。

後續步骤

本文中分享的亞馬遜示例說明了生成式人工智能如何創造超越傳統對話式助手的價值。我們邀請您遵循這些示例或創建自己的解決方案,以了解生成式人工智能如何能够重塑您的業務甚至您的行業。您可以訪問 [AWS 生成式人工智能用例 ]頁面來啟動構思過程。

這些示例表明,有效的生成式人工智能實施通常受益於结合不同類型的模型和工作流程。要了解 AWS 服務支持哪些 FM,請參閱 [Amazon Bedrock 中支持的foundation models ]和 [Amazon SageMaker JumpStart Foundation Models]。我們還建議您探索 [Amazon Bedrock Flows ],這可以簡化構建工作流程的路徑。此外,我們提醒您,Trainium 和 Inferentia 加速器在這些應用中提供了重要的成本節省。

正如我們所說明的示例中顯示的那樣,代理工作流程已被證明特別有價值。我們建議您瀏覽 [Amazon Bedrock Agents ]以快速構建代理工作流程。

成功實施生成式人工智能不仅仅是模型選擇——它代表了從實驗到應用監控的全面軟件開發過程。要開始構建您跨這些基本服務的基礎,我們邀請您瀏覽 [Amazon QuickStart]。

要詳細了解亞馬遜如何使用人工智能,請參閱亞馬遜新聞中的 [人工智能]。