生成式人工智能正在通过各种应用彻底改变业务运营,其中包括亚马逊旗下的 Rufus 和 Amazon Seller Assistant 等对话式助手。此外,一些最具影响力的生成式人工智能应用在后台自主运行,这是一项必不可少的功能,使企业能够大规模地转变其运营、数据处理和内容创建。这些非对话实施通常以由大型语言模型 (LLM) 驱动的代理工作流程的形式出现,无需直接用户交互即可跨行业执行特定的业务目标。
与受益于实时用户反馈和监督的对话式应用相比,非对话式应用具有更高的延迟容忍度、批量处理和缓存等独特优势,但其 автоном 性质需要更强的安全措施和详尽的质量保证。
本文探讨了亚马逊的四个不同的生成式人工智能应用案例:
- 亚马逊商品信息创建和目录数据质量改进 – 展示了 LLM 如何帮助销售合作伙伴和亚马逊大规模创建更高质量的商品信息
- 亚马逊药房的处方处理 – 展示了在高度监管环境中的实施和用于代理工作流程的任务分解
- 评论亮点 – 说明了大规模批量处理、传统机器学习 (ML) 集成、小型 LLM 的使用以及经济高效的解决方案
- 亚马逊广告创意图像和视频生成 – 突出了创意工作中多模态生成式人工智能和负责任的人工智能实践
每个案例研究都揭示了实施非对话式生成式人工智能应用的不同方面,从技术架构到运营考虑。通过这些示例,您将了解包括 Amazon Bedrock 和 Amazon SageMaker 在内的全套 AWS 服务如何成为成功的关键。最后,我们列出了各种用例中普遍分享的关键经验。
在亚马逊上创建高质量商品信息
创建具有全面细节的高质量商品信息有助于客户做出明智的购买决策。传统上,销售合作伙伴会手动输入每个产品的许多属性。2024 年推出的全新生成式人工智能解决方案通过主动从品牌网站和其他来源获取产品信息来改进客户体验,从而改变了这一流程。
生成式人工智能通过支持以各种格式(例如 URL、产品图像或电子表格)输入信息,并自动将其转换为所需的结构和格式,从而简化了销售合作伙伴的体验。超过 900,000 家销售合作伙伴使用过它,近 80% 的生成的商品信息草稿被接受,只需进行最少的编辑。人工智能生成的内容提供全面的产品详细信息,这有助于提高清晰度和准确性,从而有助于在客户搜索中发现产品。
对于新商品信息,工作流程从销售合作伙伴提供初始信息开始。然后,系统使用多个信息来源生成全面的商品信息,包括标题、描述和详细属性。生成的商品信息与销售合作伙伴共享以供批准或编辑。
对于现有商品信息,系统会识别可以使用其他数据丰富的产品。
用于大量输出的数据集成和处理
亚马逊团队使用 Amazon Bedrock 和其他 AWS 服务为 LLM 友好型 API 构建了强大的内部和外部来源连接器,从而无缝集成到 Amazon.com 后端系统。
一个主要挑战是将各种数据综合成跨 50 多个属性(包括文本和数字)的连贯商品信息。LLM 需要特定的控制机制和说明才能准确地解释电子商务概念,因为它们可能无法以如此复杂、多样的数据进行最佳性能。例如,LLM 可能会将刀座中的“容量”误认为是尺寸而不是槽的数量,或者将“Fit Wear”误认为是款式描述而不是品牌名称。提示工程和微调被广泛用于解决这些案例。为了确保 LLM 能够理解和正确处理这些复杂的数据,团队采用了prompt engineering和fine-tuning等技术。这些技术帮助 LLM 更好地识别和区分电子商务中的各种概念,从而提高了数据处理的准确性。
使用 LLM 进行生成和验证
生成的商品信息应完整且正确。为了帮助实现此目标,该解决方案实现了一个多步骤工作流程,使用 LLM 进行属性的生成和验证。这种双 LLM 方法有助于防止幻觉,这在处理安全隐患或技术规格时至关重要。该团队开发了先进的自我反思技术,以确保生成和验证过程有效地相互补充。这种自我反思技术允许 LLM 在生成信息的同时,对其自身的工作进行评估和纠正,从而进一步减少了错误的可能性。
具有人工反馈的多层质量保证
人工反馈是解决方案质量保证的核心。该过程包括 Amazon.com 专家进行初步评估,以及销售合作伙伴提供输入以供接受或编辑。这提供了高质量输出,并能够不断增强人工智能模型。
质量保证过程包括结合 ML、算法或基于 LLM 的评估的自动化测试方法。失败的商品信息会重新生成,成功的商品信息会进行进一步测试。使用[因果推理模型],我们确定影响商品信息性能的底层特征以及丰富机会。最终,通过质量检查并接受销售合作伙伴的商品信息会被发布,从而确保客户收到准确且全面的产品信息。为了确保商品信息的最终质量能够满足客户的需求,亚马逊还进行了A/B测试,确保最终上线的商品信息的转化率高于预期。
用于准确性和成本的应用程序级系统优化
鉴于对准确性和完整性的高标准,该团队采用了一种综合的实验方法,并配备了一个自动化优化系统。该系统探索 LLM、提示、剧本、工作流程和人工智能工具的各种组合,以提高包括成本在内的更高业务指标。通过持续评估和自动化测试,产品商品信息生成器可以有效地平衡性能、成本和效率,同时适应新的人工智能发展。这种方法意味着客户可以从高质量的产品信息中受益,销售合作伙伴可以访问用于高效创建商品信息的尖端工具。此外,团队还采用了持续集成的模式,能够快速应用人工智能领域的最新进展。
亚马逊药房中基于生成式人工智能的处方处理
在之前讨论的卖家商品信息示例中,以人机混合工作流程为基础,亚马逊药房展示了如何将这些原则应用于 健康保险流通与责任法案 监管的行业。在[了解亚马逊药房如何使用 Amazon SageMaker 创建基于 LLM 的聊天机器人]一文中,我们分享了一个用于患者护理专家的对话式助手,现在我们关注的是自动化的处方处理。
在亚马逊药房,我们开发了一个基于 Amazon Bedrock 和 SageMaker 构建的人工智能系统,以帮助药剂师技术人员更准确、更高效地处理药物说明。该解决方案将人类专家与 LLM 集成到创建和验证角色中,以提高患者药物说明的准确性。
医疗保健准确性的委托工作流程设计
处方处理系统将人类专业知识(数据录入员和药剂师)与人工智能支持相结合,以提供方向建议和反馈。工作流程从药房知识库预处理器开始,该预处理器将 [Amazon DynamoDB] 中的原始处方文本标准化,然后使用 SageMaker 上的微调小型语言模型 (SLM) 来识别关键组件(剂量、频率)。
该系统无缝集成了数据录入员和药剂师等专家,其中生成式人工智能与整体工作流程相辅相成,从而提高敏捷性和准确性,从而更好地服务于我们的患者。然后,带有安全措施的方向组装系统生成给数据录入员的说明,以通过建议模块创建他们键入的方向。标记模块会标记或纠正错误,并强制执行其他安全措施,作为提供给数据录入员的反馈。技术人员最终确定高度准确、安全键入的方向,供药剂师提供反馈或向下游服务执行方向。
该解决方案的一个亮点是任务分解的使用,这使工程师和科学家能够将整个过程分解为多个步骤,其中包括由子步骤组成的各个模块。该团队广泛使用了微调的 SLM。此外,该过程还采用了传统的 ML 程序,例如[命名实体识别 (NER)]或使用 [回归模型 ]对最终置信度进行估计。在这种受控的、明确定义的过程中使用 SLM 和传统的 ML 可以显着提高处理速度,同时由于在特定步骤中加入了适当的安全措施,因此可以保持严格的安全标准。在具体实践中,团队严格按照HIPAA(健康保险流通与责任法案)的标准,对用户数据进行加密处理,保证数据的安全性。
该系统包含多个明确定义的子步骤,每个子流程都作为专门的组件运行,在工作流程中以半自主但协作的方式朝着总体目标工作。这种分解的方法在每个阶段都具有特定的验证,证明比端到端解决方案更有效,同时可以使用微调的 SLM。该团队使用 [AWS Fargate ]来协调工作流程,因为它当前已集成到现有的后端系统中。
在该团队的产品开发过程中,他们转向了 Amazon Bedrock,该产品提供高性能的 LLM,并具有针对生成式人工智能应用量身定制的易用特性。SageMaker 支持进一步的 LLM 选择、更深层次的定制以及传统的 ML 方法。要了解有关此技术的更多信息,请参阅[任务分解和较小的 LLM 如何才能使人工智能更经济实惠],并阅读[亚马逊药房业务案例研究]。
构建具有安全措施和 HITL 的可靠应用程序
为了遵守 HIPAA 标准并提供患者隐私,我们实施了严格的数据治理实践,同时采用了一种混合方法,该方法将使用 Amazon Bedrock API 的微调的 LLM 和使用 [Amazon OpenSearch Service ]的 检索增强生成 相结合。这种组合可以实现高效的知识检索,同时保持特定子任务的高精度。
管理 LLM 幻觉(这在医疗保健领域至关重要)需要的不仅仅是在大型数据集上进行微调。我们的解决方案实施了基于 [Amazon Bedrock Guardrails ]构建的特定于领域的安全措施,并通过人机环路 (HITL) 监督进行补充,以提高系统的可靠性。该安全措施包括对模型输出的有效性进行持续的监控,并且通过人工审查来进行干预,以确保最终结果的准确性。
亚马逊药房团队继续通过药剂师的实时反馈和扩展的处方格式功能来增强该系统。创新、领域专业知识、高级人工智能服务和人工监督的这种平衡方法不仅提高了运营效率,而且还意味着人工智能系统能够正确地增强医疗保健专业人员的能力,从而提供最佳的患者护理。人工智能的应用让药剂师能够将更多精力集中在更复杂的病例上,从而提高医疗服务的整体质量。
基于生成式人工智能的客户评论亮点
我们的前一个示例展示了亚马逊药房如何将 LLM 集成到实时工作流程中以进行处方处理,而此用例展示了如何将类似的技术(SLM、传统 ML 和周到的工作流程设计)应用于大规模的 [离线批量推断]。
亚马逊推出了 [人工智能生成的客户评论重点 ],以处理超过 2 亿条年度产品评论和评分。此功能将共享的客户意见提炼成简洁的段落,突出有关产品及其功能的正面、中性和负面反馈。购物者可以快速掌握共识,同时通过提供对相关客户评论的访问权限并保留原始评论来保持透明度。
该系统通过客户可以通过选择特定功能(例如图片质量、遥控功能或 Fire TV 的易安装性)来探索评论重点的界面来增强购物决策。这些功能通过绿色复选标记表示正面情绪,橙色负号表示负面情绪,灰色表示中性——这意味着购物者可以根据经过验证的购买评论快速识别产品的优缺点。 评论亮点功能极大地提升了用户的购物体验,帮助用户更快更准确地做出购买决策。
以经济高效的方式使用 LLM 进行离线用例
该团队开发了一种经济高效的混合架构,将传统 ML 方法与专业的 SLM 相结合。这种方法将情感分析和关键字提取分配给传统的 ML,同时使用优化的 SLM 进行复杂的文本生成任务,从而提高准确性和处理效率。传统ML算法在该任务中发挥着至关重要的作用,一方面在于算法已经比较成熟,能够保证准确性,另一方面也能够降低成本,帮助企业降本增效。
该功能采用 [SageMaker 批量转换 ]进行异步处理,与实时endpoints相比,可以显着降低成本。为了提供接近零延迟的体验,该解决方案 [缓存 ]提取的见解和现有评论,从而减少了等待时间,并允许多个客户同时访问,而无需进行额外的计算。该系统以增量方式处理新评论,更新见解而无需重新处理完整的数据集。为了获得最佳性能和成本效益,该功能使用 [Amazon Elastic Compute Cloud ](Amazon EC2) [Inf2 实例 ]进行批量转换作业,[与替代方案相比,可提供高达 40% 的更高性价比]。该策略能够显著降低运行成本,为企业带来更多的经济效益。
通过遵循这种全面的方法,该团队有效地管理了成本,同时处理了大量的评论和产品,从而使该解决方案既高效又可扩展。评论亮点功能不仅提高了运营效率,还提升了客户满意度。
亚马逊广告人工智能驱动的创意图像和视频生成
在之前的示例中,我们主要探讨了以文本为中心的生成式人工智能应用,现在我们将转向带有 [亚马逊广告赞助广告创意内容生成 ]的多模态生成式人工智能。该解决方案具有 [图像 ]和 [视频 ]生成功能,我们将在本节中分享有关这些功能的详细信息。总的来说,该解决方案的核心使用了 [亚马逊 Nova] 创意内容生成模型。
根据客户需求倒推,亚马逊在 2023 年 3 月进行的一项调查显示,近 75% 的广告商在努力取得广告活动成功时,将创意内容生成列为他们的主要挑战。许多广告商(尤其是那些没有内部能力或代理支持的广告商)由于生产高质量视觉效果的专业知识和成本而面临重大障碍。 亚马逊广告解决方案使视觉内容创建民主化,使不同规模的广告商都可以访问和高效地使用它。影响是巨大的:在 [赞助品牌 ]广告活动中使用人工智能生成的图像的广告商的 [点击率 (CTR)] 接近 8%,并且提交的广告活动比非用户多 88%。生成式人工智能技术的应用,大幅降低了广告创意产生的门槛,使得更多的广告主能够参与到创意内容生成中来。
去年,AWS机器学习博客发表了一篇 [详细介绍图像生成解决方案 ]的文章。从那时起,亚马逊采用了 [Amazon Nova Canvas ]作为创意图像生成的基础。利用文字或图像提示,结合基于文字的编辑功能和颜色方案及布局调整控制,创造专业级图像。 Amazon Nova Canvas 提供了一个强大且易于使用的平台,帮助广告商快速生成各种高质量的图像。
2024 年 9 月,亚马逊广告团队添加了从产品图像创建 [短视频广告 ]的功能。此功能使用 [Amazon Bedrock 上提供的foundation models ],通过自然语言控制视觉风格、节奏、相机运动、旋转和缩放,从而为客户提供控制权。它使用一种代理工作流程来首先描述视频故事板,然后生成故事内容。 进一步降低了视频广告制作的门槛,使得更多的广告主能够通过简单地输入自然语言,即可快速生成各种高质量的视频广告。
正如原始文章中所讨论的那样,[负责任的人工智能 ]是该解决方案的核心,而 Amazon Nova 创意模型带有内置控件,以支持安全和负责任的人工智能使用,包括水印和内容审核。亚马逊采取了多项措施来确保内容的安全性和合规性,包括内容审核,以防止生成不当内容;水印,以确保用户知晓其为AI生成内容。
该解决方案使用 [AWS Step Functions ]和 [AWS Lambda ]函数来协调图像和视频生成流程的无服务器协调。生成的内容存储在 [Amazon Simple Storage Service ](Amazon S3) 中,元数据存储在 DynamoDB 中,而 [Amazon API Gateway ]提供客户对生成功能的访问。该解决方案现在除了在各个步骤中保持 [Amazon Rekognition ]和 [Amazon Comprehend ]集成以进行其他安全检查之外,还采用了 Amazon Bedrock Guardrails。 通过集成各种AWS 服务, 确保整个流程的稳定性、可扩展性和安全性。
大规模创建高质量的广告创意带来了复杂的挑战。生成式人工智能模型需要在各种产品类别和广告环境下生成引人入胜且适合品牌形象的图像,同时让所有技术水平的广告商都可以轻松访问。质量保证和改进是图像和视频生成功能的基础。该系统通过 [Amazon SageMaker Ground Truth ]实现的广泛 HITL 流程不断增强。 这种实施提供了一个强大的工具,可以转变广告商的创作过程,从而使各个产品类别和环境中的高质量视觉内容创建更加容易。HITL的加入,能够让AI更好地理解广告主的意图,从而生成更加符合需求的广告创意。
这仅仅是亚马逊广告使用生成式人工智能来帮助需要创建适合广告目标的内容的广告客户的开始。该解决方案表明,减少创作障碍如何能够直接提高广告活动,同时保持负责任的人工智能使用的高标准。未来,亚马逊将会继续加大在生成式人工智能方面的投入,帮助广大的广告主能够轻松地创建符合广告目标的内容。
关键技术经验和讨论
非对话式应用受益于更高的延迟容忍度,从而能够进行批量处理和缓存,但由于其自主性,因此需要强大的验证机制和更强的安全措施。这些见解适用于非对话式和对话式人工智能实施:
- 任务分解和代理工作流程 – 将复杂的问题分解为较小的组件已被证明在各种实施中都很有价值。领域专家进行的这种深思熟虑的分解能够为特定子任务创建专门的模型,正如亚马逊药房处方处理中所展示的那样,在处方处理中,微调的 SLM 可以处理离散任务,例如剂量识别。这种策略允许创建具有清晰验证步骤的专门agent,从而提高可靠性并简化维护。亚马逊卖家商品信息用例通过其具有单独生成和验证流程的多步骤工作流程对此作了例证。此外,评论重点用例展示了经济高效且受控的 LLM 使用,即通过使用传统的 ML 进行预处理以及执行可以与 LLM 任务相关联的部分。任务分解极大地提高了效率和准确性,使得团队能够针对特定的子任务进行优化。
- 混合架构和模型选择 – 与纯 LLM 方法相比,将传统的 ML 与 LLM 相结合可提供更好的控制和成本效益。传统的 ML 擅长处理定义明确的任务,正如评论重点系统用于情感分析和信息提取所显示的那样。亚马逊团队已根据需求战略性地部署了大型和小型语言模型,将 RAG 与微调相结合,用于有效的特定于领域的应用,例如亚马逊药房的实施。 混合架构能够兼顾性能和成本,为企业提供最优的解决方案。
- 成本优化策略 – 亚马逊团队通过批量处理、用于大容量运营的缓存机制、[AWS Inferentia ]和 [AWS Trainium ]等专门的实例类型以及优化的模型选择来实现了效率。评论重点展示了增量处理如何减少计算需求,而亚马逊广告使用 Amazon Nova foundation models 来经济高效地创建创意内容。 通过各种技术手段降低成本,是企业应用人工智能技术的重要考虑因素。
- 质量保证和控制机制 – 质量控制依赖于通过 Amazon Bedrock Guardrails 的特定于领域的安全措施和结合了自动化测试与人工评估的多层验证。用于生成和验证的双 LLM 方法有助于防止亚马逊卖家商品信息中出现幻觉,而自我反思技术可提高准确性。Amazon Nova 创意 FM 提供固有的负责任的人工智能控制,并通过持续的 A/B 测试和性能测量进行补充。 质量保证体系能够确保模型输出的准确性和可靠性,从而提升用户体验。
- HITL 实施 – HITL 方法跨越多个层,从药剂师的专家评估到销售合作伙伴的最终用户反馈。亚马逊团队建立了结构化的改进工作流程,从而根据特定的领域要求和风险配置文件平衡了自动化和人工监督。 人工参与能够有效地纠正模型产生的错误,并对模型进行持续的优化。
- 负责任的人工智能和合规性 – 负责任的人工智能实践包括针对受监管环境的内容摄取安全措施以及遵守 HIPAA 等法规。亚马逊团队集成了针对面向用户的应用的内容审核,通过提供对源信息的访问权限来保持评论重点的透明性,并实施了具有监控的数据治理来提高质量和合规性。 负责任的人工智能不仅能够保护用户的权益,还有助于提升企业的声誉和品牌价值。
这些模式能够实现可扩展、可靠且经济高效的生成式人工智能解决方案,同时保持质量和责任标准。这些实施表明,有效的解决方案不仅需要先进的模型,还需要仔细关注架构、运营和治理,并由 AWS 服务和已建立的做法提供支持。
后续步骤
本文中分享的亚马逊示例说明了生成式人工智能如何创造超越传统对话式助手的价值。我们邀请您遵循这些示例或创建自己的解决方案,以了解生成式人工智能如何能够重塑您的业务甚至您的行业。您可以访问 [AWS 生成式人工智能用例 ]页面来启动构思过程。
这些示例表明,有效的生成式人工智能实施通常受益于结合不同类型的模型和工作流程。要了解 AWS 服务支持哪些 FM,请参阅 [Amazon Bedrock 中支持的foundation models ]和 [Amazon SageMaker JumpStart Foundation Models]。我们还建议您探索 [Amazon Bedrock Flows ],这可以简化构建工作流程的路径。此外,我们提醒您,Trainium 和 Inferentia 加速器在这些应用中提供了重要的成本节省。
正如我们所说明的示例中显示的那样,代理工作流程已被证明特别有价值。我们建议您浏览 [Amazon Bedrock Agents ]以快速构建代理工作流程。
成功实施生成式人工智能不仅仅是模型选择——它代表了从实验到应用监控的全面软件开发过程。要开始构建您跨这些基本服务的基础,我们邀请您浏览 [Amazon QuickStart]。
要详细了解亚马逊如何使用人工智能,请参阅亚马逊新闻中的 [人工智能]。