生成的人工知能(Generative AI)は、Amazon傘下の Rufus や Amazon Seller Assistant などの対話型アシスタントを含め、さまざまなアプリケーションを通じてビジネスオペレーションに革命を起こしています。さらに、最も影響力のある生成的人工知能アプリケーションの中には、バックグラウンドで自律的に動作するものがあり、これは企業がオペレーション、データ処理、コンテンツ作成を大規模に変革することを可能にする不可欠な機能です。これらの非対話型の実装は通常、大規模言語モデル(LLM)によって駆動されるエージェントワークフローの形式で行われ、直接的なユーザーインタラクションなしで業界全体にわたって特定のビジネス目標を実行します。
リアルタイムのユーザーフィードバックと監督の恩恵を受ける対話型アプリケーションとは異なり、非対話型アプリケーションは、より高いレイテンシ許容度、バッチ処理、およびキャッシングなどの独自の利点を備えていますが、その自律性という性質上、より強力なセキュリティ対策と詳細な品質保証が必要になります。
この記事では、Amazonの4つの異なる生成的人工知能アプリケーションの事例について検討します。
- Amazonの商品情報作成とカタログデータ品質の改善 – LLMが販売パートナーとAmazonがより高品質の商品情報を大規模に作成するのにどのように役立つかを示します。
- Amazon薬局の処方処理 – 厳しく規制された環境での実装と、エージェントワークフローで使用されるタスク分解を示します。
- レビューハイライト – 大規模なバッチ処理、従来の機械学習(ML)統合、小型LLMの使用、および費用対効果の高いソリューションについて説明します。
- Amazon広告のクリエイティブな画像と動画の生成 – クリエイティブな作業におけるマルチモーダル生成的人工知能と責任ある人工知能の実践を強調します。
各ケーススタディでは、技術アーキテクチャから運用上の考慮事項まで、非対話型の生成的人工知能アプリケーションの実装に関するさまざまな側面が明らかになります。これらの例を通して、Amazon BedrockやAmazon SageMakerを含むAWSサービスのスイート全体が成功の鍵となる理由を理解することができます。最後に、さまざまなユースケースで共通して共有されている主要な教訓をリストアップします。
Amazonでの高品質な商品情報の作成
包括的な詳細を含む高品質の商品情報を作成することは、お客様が十分な情報に基づいた購入決定を下すのに役立ちます。従来、販売パートナーは各製品の多くの属性を手動で入力していました。2024年に導入された新しい生成的人工知能ソリューションは、ブランドのウェブサイトやその他の情報源から積極的に製品情報を取得することによって顧客体験を改善することで、このプロセスを変革しました。
生成的人工知能は、URL、製品画像、またはスプレッドシートなどのさまざまな形式での情報の入力をサポートし、それを必要な構造と形式に自動的に変換することで、販売パートナーのエクスペリエンスを簡素化します。90万を超える販売パートナーがこれを使用しており、生成された商品情報の草案の約80%が、最小限の編集で受け入れられています。人工知能によって生成されたコンテンツは、包括的な製品詳細を提供し、明瞭さと正確さを向上させ、顧客の検索で製品を見つけやすくすることに役立ちます。
新しい商品情報の場合、ワークフローは販売パートナーが初期情報を提供することから始まります。次に、システムは、タイトル、説明、詳細な属性など、複数の情報源を使用して包括的な商品情報を作成します。生成された商品情報は、承認または編集のために販売パートナーと共有されます。
既存の商品情報の場合、システムは追加のデータで充実させることができる製品を識別します。
大量出力のためのデータ統合と処理
Amazonのチームは、Amazon Bedrockやその他のAWSサービスを使用してLLMフレンドリーなAPIの堅牢な内部および外部ソースコネクタを構築することで、Amazon.comのバックエンドシステムへのシームレスな統合を実現しました。
主な課題の1つは、テキストや数字を含む50を超える属性にわたる一貫性のある商品情報にさまざまなデータを統合することです。LLMは、eコマースの概念を正確に解釈するための特定の制御メカニズムと指示を必要とします。これは、LLMがそれほど複雑で多様なデータで最適なパフォーマンスを発揮できない可能性があるためです。たとえば、LLMはナイフブロックの「容量」をスロット数ではなくサイズと誤解したり、「Fit Wear」をブランド名ではなくスタイルの説明と誤解したりする可能性があります。プロンプトエンジニアリングとファインチューニングは、これらのケースに対処するために広く使用されました。
LLMを使用した生成と検証
生成された商品情報は完全かつ正確である必要があります。この目標を達成するために、このソリューションは、属性の生成と検証にLLMを使用する多段階のワークフローを実装しています。この2つのLLMメソッドは、安全上の懸念や技術仕様を処理する際に重要な幻覚を防ぐのに役立ちます。チームは、生成プロセスと検証プロセスが効果的に相互に補完することを保証するために、高度な自己反省技術を開発しました。
人工フィードバックによる多層品質保証
人工フィードバックは、ソリューションの品質保証の中核です。このプロセスには、Amazon.comの専門家による初期評価と、受け入れまたは編集のための入力を行う販売パートナーが含まれます。これにより、高品質の出力が提供され、人工知能モデルを継続的に強化することができます。
品質保証プロセスには、ML、アルゴリズム、またはLLMベースの評価を組み込んだ自動テスト方法が含まれます。失敗した商品情報は再生成され、成功した商品情報はさらにテストされます。[因果推論モデル]を使用して、商品情報のパフォーマンスに影響を与える根本的な特徴と、充実させる機会を特定します。最終的に、品質チェックに合格し、販売パートナーによって受け入れられた商品情報が公開され、顧客が正確で包括的な製品情報を受け取ることが保証されます。
精度とコストのためのアプリケーションレベルのシステム最適化
精度と完全性に対する高い基準を考慮して、チームは包括的な実験的アプローチを採用し、自動最適化システムを備えています。このシステムは、コストを含むより高いビジネス指標を改善するために、LLM、プロンプト、プレイブック、ワークフロー、および人工知能ツールのさまざまな組み合わせを探索します。継続的な評価と自動テストを通じて、製品商品情報ジェネレーターは、パフォーマンス、コスト、および効率のバランスを効果的に調整しながら、新しい人工知能の開発に適応することができます。このアプローチは、顧客が高品質の製品情報からメリットを得ることができ、販売パートナーが高効率な商品情報を作成するための最先端のツールにアクセスできることを意味します。
Amazon薬局における生成的人工知能に基づく処方処理
前に議論したセラー商品情報の例では、人機混合ワークフローに基づいています。Amazon薬局は、これらの原則を医療保険の携行性と責任に関する法律で規制された業界にどのように適用できるかを示しています。[Amazon薬局がAmazon SageMakerを使用してLLMベースのチャットボットを作成する方法について]の記事では、患者ケアスペシャリスト向けの対話型アシスタントについて共有しました。ここでは、自動化された処方処理に焦点を当てます。
Amazon薬局では、薬剤師の技術者が投薬指示をより正確かつ効率的に処理するのに役立つ人工知能システムをAmazon BedrockとSageMaker上に構築しました。このソリューションは、人間の専門家をLLMと統合して作成と検証の役割を行うことで、患者の投薬指示の精度を向上させます。
ヘルスケアの精度に向けた委任ワークフローの設計
処方処理システムは、人間の専門知識(データ入力者と薬剤師)と人工知能サポートを組み合わせて、方向に関する推奨事項とフィードバックを提供します。ワークフローは、[Amazon DynamoDB]の生の処方箋テキストを標準化する薬局ナレッジベースプリプロセッサから始まり、次にSageMaker上のファインチューニングされた小型言語モデル(SLM)を使用して、主要なコンポーネント(用量、頻度)を識別します。
このシステムは、生成的人工知能が全体的なワークフローを補完するデータエントリ担当者や薬剤師などの専門家をシームレスに統合し、患者をより適切にケアするための俊敏性と正確性を向上させます。次に、セキュリティ対策を備えた指示アセンブリシステムは、データエントリ担当者が提案モジュールを介して入力する指示を作成するための指示を生成します。マーキングモジュールは、エラーにフラグを立てるか修正し、データエントリ担当者に提供されるフィードバックとして、その他の安全対策を実施します。技術者は、薬局がフィードバックを提供したり、ダウンストリームサービスに対して指示を実行したりするために、高度に正確で安全に入力された指示を最終的に確定します。
このソリューションのハイライトの1つは、タスク分解の使用です。これにより、エンジニアと科学者はプロセス全体を複数のステップに分解できます。これらのステップには、サブステップで構成される個々のモジュールが含まれます。チームはファインチューニングされたSLMを幅広く使用しました。さらに、このプロセスでは、[名前付きエンティティ認識(NER)]などの従来のMLプログラムや、[回帰モデル]を使用した最終的な信頼度を推定するプログラムが採用されています。この制御された明確に定義されたプロセスでSLMと従来のMLを使用することで、特定のステップに適切な安全対策が組み込まれているため、厳格な安全基準を維持しながら、処理速度を大幅に向上させることができます。
このシステムには、明確に定義された複数のサブステップが含まれており、各サブプロセスは、ワークフロー内で半自律的でありながら協調的な方法で全体的な目標に向かって動作する専門コンポーネントとして動作します。この分解アプローチは、各段階で特定の検証が行われ、エンドツーエンドのソリューションよりも効果的であることが証明されており、同時にファインチューニングされたSLMを使用できます。チームは、既存のバックエンドシステムに現在統合されているため、ワークフローの調整に[AWS Fargate]を使用しました。
チームの製品開発プロセスでは、生成的人工知能アプリケーション向けに調整された使いやすい機能を備えた高性能LLMを提供するAmazon Bedrockに移行しました。SageMakerは、LLMをさらに選択し、より深いカスタマイズ、および従来のMLメソッドをサポートします。このテクノロジーの詳細については、[タスク分解と小型LLMで人工知能をより手頃な価格にする方法]を参照し、[Amazon薬局のビジネスケーススタディ]をお読みください。
安全対策とHITLを備えた堅牢なアプリケーションの構築
HIPAA標準に準拠し、患者のプライバシーを提供するために、[Amazon OpenSearch Service]を使用した検索拡張生成とAmazon Bedrock APIを使用したファインチューニングされたLLMを組み合わせたハイブリッドアプローチを採用しながら、厳格なデータガバナンスプラクティスを実装しました。この組み合わせにより、特定のサブタスクで高い精度を維持しながら、効率的な知識検索が可能になります。
医療分野で重要なLLMの幻覚を管理するには、大規模なデータセットでのファインチューニングだけでは不十分です。当社のソリューションは、[Amazon Bedrock Guardrails]に基づいて構築されたドメイン固有の安全対策を実装し、システムの信頼性を向上させるために、人機連携ループ(HITL)監視によって補完されています。
Amazon薬局のチームは、薬剤師からのリアルタイムフィードバックと拡張された処方箋形式機能を通じて、システムを強化し続けています。イノベーション、ドメイン専門知識、高度な人工知能サービス、および人間の監視のこのバランスの取れたアプローチは、運用効率を向上させるだけでなく、人工知能システムが医療専門家を適切に支援し、最適な患者ケアを提供できることを意味します。
生成的人工知能に基づく顧客レビューのハイライト
前の例では、Amazon薬局がLLMを処方箋処理のためのリアルタイムワークフローに統合する方法について説明しましたが、このユースケースでは、同様のテクノロジー(SLM、従来のML、および周到なワークフロー設計)を大規模な[オフラインバッチ推論]にどのように適用できるかを示します。
Amazonは、年間2億件を超える製品レビューと評価を処理するために、[人工知能によって生成された顧客レビューのハイライト]を導入しました。この機能は、共有された顧客の意見を簡潔な段落に抽出し、製品とその機能に関する肯定的なフィードバック、中立的なフィードバック、および否定的なフィードバックを強調します。買い物客は、関連する顧客レビューへのアクセスを提供し、元のレビューを保持することで透明性を維持しながら、コンセンサスをすばやく把握できます。
このシステムは、顧客が特定の機能(画像品質、リモコン機能、またはFire TVの簡単なインストールなど)を選択してレビューのハイライトを探索できるインターフェイスを提供することで、ショッピングの意思決定を強化します。これらの機能は、緑色のチェックマークは肯定的な感情、オレンジ色のマイナス記号は否定的な感情、灰色は中立的な感情を示します。つまり、買い物客は検証済みの購入レビューに基づいて製品の長所と短所をすばやく識別できます。
費用対効果の高い方法でLLMをオフラインユースケースに使用する
チームは、従来のMLメソッドと専門のSLMを組み合わせた、費用対効果の高いハイブリッドアーキテクチャを開発しました。このアプローチは、感情分析とキーワード抽出を従来のMLに割り当て、複雑なテキスト生成タスクには最適化されたSLMを使用することで、精度と処理効率を向上させます。
この機能では、[SageMakerバッチ変換]を使用して非同期処理を行うことで、リアルタイムエンドポイントと比較してコストを大幅に削減できます。ほぼゼロの遅延のエクスペリエンスを提供するために、このソリューションでは、抽出された洞察と既存のレビューを[キャッシュ]に保存することで、待機時間を短縮し、追加の計算なしで複数の顧客が同時にアクセスできるようにします。このシステムは、新しいレビューを段階的に処理し、完全なデータセットを再処理することなく洞察を更新します。最適なパフォーマンスと費用対効果のために、この機能では、[Amazon Elastic Compute Cloud](Amazon EC2)[Inf2インスタンス]をバッチ変換ジョブに使用して、[代替手段と比較して最大40%高い価格パフォーマンスを提供します]。
この包括的な方法に従うことで、チームはコストを効果的に管理しながら、大量のレビューと製品を処理し、ソリューションを効率的かつスケーラブルにしました。
Amazon広告の人工知能駆動のクリエイティブな画像と動画の生成
前の例では、主にテキスト中心の生成的人工知能アプリケーションについて説明しましたが、ここでは、[Amazon広告のスポンサーブランド広告クリエイティブコンテンツ生成]によるマルチモーダル生成的人工知能に移行します。このソリューションには[画像]と[動画]の生成機能があり、これらの機能に関する詳細をこのセクションで共有します。全体として、このソリューションの中核では[Amazon Nova]クリエイティブコンテンツ生成モデルが使用されています。
顧客のニーズから逆算すると、Amazonが2023年3月に実施した調査では、広告活動の成功に苦労している広告主のほぼ75%が、クリエイティブコンテンツの生成を主要な課題として挙げています。多くの広告主(特に内部能力や代理店サポートがない広告主)は、高品質のビジュアルを作成するための専門知識とコストが大きな障害となっています。Amazon広告ソリューションは、ビジュアルコンテンツの作成を民主化し、さまざまな規模の広告主がアクセスして効率的に使用できるようにします。影響は大きく、[スポンサーブランド]広告活動で人工知能によって生成された画像を使用している広告主は、[クリック率(CTR)]がほぼ8%向上し、非ユーザーよりも88%多く広告活動を送信しています。
昨年、AWS Machine Learningのブログで[画像生成ソリューションの詳細]について説明した記事が公開されました。それ以来、Amazonはクリエイティブな画像を作成するための基盤として[Amazon Nova Canvas]を採用しました。テキストまたは画像のプロンプトを利用し、テキストベースの編集機能とカラースキームとレイアウト調整コントロールを組み合わせて、プロフェッショナルグレードの画像を作成します。
2024年9月、Amazon広告のチームは、製品画像から[短い動画広告]を作成する機能を追加しました。この機能では、[Amazon Bedrockで提供されている基盤モデル]を使用して、自然言語で視覚スタイル、リズム、カメラの動き、回転、およびズームを制御することで、顧客に制御を提供します。エージェントワークフローを使用して、まず動画のストーリーボードを記述し、次にストーリーコンテンツを生成します。
元の記事で説明したように、[責任ある人工知能]はこのソリューションの中核であり、Amazon Novaクリエイティブモデルには、透かしとコンテンツのレビューを含む、安全で責任ある人工知能の使用をサポートするための組み込みコントロールが付属しています。
このソリューションでは、[AWS Step Functions]と[AWS Lambda]関数を使用して、画像と動画の生成プロセスのサーバーレス調整を調整します。生成されたコンテンツは[Amazon Simple Storage Service](Amazon S3)に保存され、メタデータはDynamoDBに保存され、[Amazon API Gateway]は生成機能への顧客アクセスを提供します。このソリューションでは、さまざまなステップで[Amazon Rekognition]と[Amazon Comprehend]の統合を維持して追加の安全チェックを行うことに加えて、Amazon Bedrock Guardrailsを採用しています。
高品質の広告クリエイティブを大規模に作成するには、複雑な課題があります。生成的人工知能モデルは、さまざまな製品カテゴリや広告環境全体で魅力的でブランドイメージに適した画像を生成すると同時に、あらゆる技術レベルの広告主が簡単にアクセスできるようにする必要があります。品質保証と改善は、画像と動画の生成機能の基盤です。このシステムは、[Amazon SageMaker Ground Truth]によって実装される広範なHITLプロセスによって継続的に強化されています。この実装により、広告主の制作プロセスを変革し、さまざまな製品カテゴリや環境全体で高品質のビジュアルコンテンツの作成を容易にする強力なツールが提供されます。
これは、Amazon広告が広告目標に適したコンテンツを作成する必要のある広告主を支援するために生成的人工知能を使用し始めたばかりです。このソリューションは、制作の障壁を減らすと広告活動を直接的に改善できることを示し、同時に責任ある人工知能の使用に関する高い基準を維持します。
主要な技術的経験と議論
非対話型アプリケーションは、より高い遅延許容度を利用できるため、バッチ処理とキャッシュが可能になりますが、自律性があるため、堅牢な検証メカニズムとより強力なセキュリティ対策が必要です。これらの洞察は、非対話型および対話型人工知能の実装に適用できます。
- タスク分解とエージェントワークフロー – 複雑な問題をより小さなコンポーネントに分解すると、さまざまな実装で価値があることが証明されています。分野の専門家によるこの入念な分解により、Amazon薬局の処方処理で示されているように、特定のサブタスク用に専門モデルを作成できます。処方処理では、ファインチューニングされたSLMで用量認識などの離散タスクを処理できます。この戦略により、明確な検証ステップを備えた専門化されたエージェントを作成できるため、信頼性が向上し、メンテナンスが簡素化されます。Amazonセラーの商品情報のユースケースでは、個別の生成プロセスと検証プロセスを備えた多段階のワークフローを通じて、そのことが例示されています。さらに、レビューハイライトのユースケースでは、費用対効果が高く制御されたLLMの使用方法が示されています。つまり、従来のMLを使用して前処理を行い、LLMタスクに関連付けることができる部分を実行します。
- ハイブリッドアーキテクチャとモデル選択 – 純粋なLLMアプローチと比較して、従来のMLとLLMを組み合わせると、より優れた制御と費用対効果が得られます。従来のMLは、感情分析と情報抽出のためにレビューハイライトシステムで使用されているように、明確に定義されたタスクの処理に優れています。Amazonのチームは、ニーズに応じて大規模言語モデルと小型言語モデルを戦略的にデプロイし、RAGとファインチューニングを組み合わせて、Amazon薬局における実装など、効果的なドメイン固有のアプリケーションを作成しました。
- コスト最適化戦略 – Amazonのチームは、バッチ処理、大量運用向けのキャッシュメカニズム、[AWS Inferentia]や[AWS Trainium]などの専用インスタンスタイプ、および最適化されたモデル選択を通じて効率を実現しました。レビューハイライトでは、増分処理によって計算要件を削減する方法が示されており、Amazon広告ではAmazon Nova基盤モデルを使用してクリエイティブコンテンツを費用対効果の高い方法で作成しています。
- 品質保証および制御メカニズム – 品質管理は、Amazon Bedrock Guardrailsによるドメイン固有の安全対策と、自動テストと人間の評価を組み合わせた多層検証に依存しています。生成と検証のためのデュアルLLMアプローチは、Amazonセラーの商品情報に幻覚が発生するのを防ぎ、自己反省技術は精度を向上させます。Amazon NovaクリエイティブFMは、固有の責任あるAIコントロールを提供しており、継続的なA/Bテストとパフォーマンス測定によって補完されています。
- HITLの実装 – HITLメソッドは複数のレイヤーにまたがっており、薬剤師の専門的な評価から販売パートナーのエンドユーザーフィードバックまで含まれます。Amazonのチームは、構造化された改善ワークフローを確立し、特定のドメイン要件とリスクプロファイルに基づいて自動化と人間の監視のバランスを取りました。
- 責任あるAIとコンプライアンス – 責任あるAIプラクティスには、規制対象環境向けのコンテンツ取り込み安全対策と、HIPAAなどの規制の遵守が含まれます。Amazonのチームは、ユーザー向けのアプリケーション向けにコンテンツのレビューを統合し、レビューハイライトでソース情報へのアクセスを提供することで透明性を維持し、品質とコンプライアンスを向上させるために監視付きのデータガバナンスを実装しました。
これらのパターンを使用すると、品質と責任の基準を維持しながら、スケーラブルで信頼性が高く費用対効果の高い生成的人工知能ソリューションを実現できます。これらの実装は、効果的なソリューションには、高度なモデルだけでなく、アーキテクチャ、運用、ガバナンスに注意を払い、AWSサービスと確立されたプラクティスによってサポートされる必要があることを示しています。
次のステップ
この記事で共有されているAmazonの例は、生成的人工知能が従来の対話型アシスタントを超える価値をどのように生み出すことができるかを示しています。これらの例に従うか、独自のソリューションを作成して、生成的人工知能がビジネスや業界をどのように変革できるかを確認することをお勧めします。思考プロセスを開始するために、[AWS生成的人工知能のユースケース]ページにアクセスできます。
これらの例は、効果的な生成的人工知能の実装は、多くの場合、さまざまなタイプのモデルとワークフローを組み合わせることでメリットが得られることを示しています。AWSサービスがサポートするFMについては、[Amazon Bedrockでサポートされている基盤モデル]と[Amazon SageMaker JumpStart Foundation Models]を参照してください。ワークフローの構築を簡素化できる[Amazon Bedrock Flows]も探索することをお勧めします。さらに、TrainiumおよびInferentiaアクセラレータは、これらのアプリケーションで重要なコスト削減を提供することを思い出してください。
例で説明したように、エージェントワークフローは特に価値があることが証明されています。[Amazon Bedrock Agents]を参照して、エージェントワークフローを迅速に構築することをお勧めします。
生成的人工知能を正常に実装することは、モデルの選択だけではありません。実験からアプリケーションの監視までの包括的なソフトウェア開発プロセスを表しています。これらの基本的なサービス全体で基盤の構築を開始するには、[Amazon QuickStart]を参照することをお勧めします。
Amazonが人工知能をどのように使用しているかの詳細については、Amazonニュースの[人工知能]を参照してください。