Organisationen müssen heutzutage riesige Mengen unstrukturierter Daten verarbeiten, die in verschiedenen Formaten vorliegen, darunter Dokumente, Bilder, Audiodateien und Videodateien. In der Vergangenheit erforderte die Extraktion sinnvoller Erkenntnisse aus diesen unterschiedlich formatierten Daten komplexe Verarbeitungsworkflows und erhebliche Entwicklungsanstrengungen. Die generative KI-Technologie revolutioniert diesen Bereich jedoch grundlegend und bietet leistungsstarke Funktionen zur automatischen Verarbeitung, Analyse und Gewinnung von Erkenntnissen aus diesen unterschiedlichen Dokumentformaten. Dies reduziert den manuellen Aufwand erheblich und verbessert gleichzeitig die Genauigkeit und Skalierbarkeit.
Mit Amazon Bedrock Data Automation und Amazon Bedrock Knowledge Bases können Sie jetzt auf einfache Weise leistungsstarke multimodale RAG-Anwendungen erstellen. Gemeinsam ermöglichen sie es Unternehmen, Informationen in ihren multimodalen Inhalten effektiv zu verarbeiten, zu organisieren und abzurufen, und verändern so die Art und Weise, wie sie unstrukturierte Daten verwalten und nutzen.
Dieser Artikel führt Sie durch die Erstellung einer vollständigen Stack-Anwendung, die Amazon Bedrock Data Automation zur Verarbeitung multimodaler Inhalte verwendet, extrahierte Informationen in Amazon Bedrock Knowledge Bases speichert und natürliche Sprachabfragen über eine RAG-basierte Frage- und Antwortschnittstelle ermöglicht.
Praxisbeispiele
Die Integration von Amazon Bedrock Data Automation und Amazon Bedrock Knowledge Bases bietet eine leistungsstarke Lösung für die Verarbeitung großer Mengen unstrukturierter Daten in verschiedenen Branchen, wie z. B.:
- Im Gesundheitswesen müssen Organisationen große Mengen von Patientenakten verarbeiten, darunter medizinische Formulare, Diagnosebilder und Beratungsaufzeichnungen. Amazon Bedrock Data Automation kann diese Informationen automatisch extrahieren und strukturieren, während Amazon Bedrock Knowledge Bases es medizinischem Fachpersonal ermöglicht, natürliche Sprachabfragen zu verwenden, z. B. „Was war der letzte Blutdruckwert des Patienten?“ oder „Zeige die Behandlungsgeschichte von Diabetespatienten“.
- Finanzinstitute verarbeiten täglich Tausende von Dokumenten, von Kreditanträgen bis hin zu Finanzberichten. Amazon Bedrock Data Automation kann wichtige Finanzkennzahlen und Compliance-Informationen extrahieren, während Amazon Bedrock Knowledge Bases es Analysten ermöglicht, Fragen wie die folgenden zu stellen: „Welche Risikofaktoren werden im letzten Quartalsbericht erwähnt?“ oder „Zeige alle Kreditanträge mit hohem Kredit-Score an“.
- Anwaltskanzleien müssen große Mengen von Falldokumenten verarbeiten, die Gerichtsdokumente, Beweisfotos und Zeugenaussagen enthalten. Amazon Bedrock Data Automation kann diese verschiedenen Quellen verarbeiten, während Amazon Bedrock Knowledge Bases es Anwälten ermöglicht, „Welche Beweise wurden zu den Ereignissen vom 15. März vorgelegt?“ oder „Finde alle Zeugenaussagen, in denen der Angeklagte erwähnt wird“ abzufragen.
- Medienunternehmen können diese Integration verwenden, um intelligente, kontextbezogene Anzeigenplatzierungen zu ermöglichen. Amazon Bedrock Data Automation verarbeitet Videoinhalte, Untertitel und Audio, um Szenenkontext, Dialoge und Emotionen zu verstehen, und analysiert gleichzeitig Werbemittel und Werbekampagnenanforderungen. Amazon Bedrock Knowledge Bases ermöglicht dann komplexe Abfragen, um Anzeigen mit den entsprechenden Inhaltsmomenten abzugleichen, z. B. „Finde positive Outdoor-Szenen mit Anzeigen für Sportgeräte“ oder „Identifiziere Reiseanzeigensegmente, in denen über Tourismus diskutiert wird“. Dieser intelligente, kontextbezogene Abgleich ermöglicht eine relevantere und effektivere Anzeigenplatzierung und gewährleistet gleichzeitig die Markensicherheit.
Diese Beispiele zeigen, wie die Extraktionsfunktionen von Amazon Bedrock Data Automation in Kombination mit den Abfragemöglichkeiten in natürlicher Sprache von Amazon Bedrock Knowledge Bases die Art und Weise verändern, wie Unternehmen mit ihren unstrukturierten Daten interagieren.
Lösungsübersicht
Diese umfassende Lösung demonstriert die fortschrittlichen Funktionen von Amazon Bedrock bei der Verarbeitung und Analyse multimodaler Inhalte (Dokumente, Bilder, Audiodateien und Videodateien). Dies wird durch drei Schlüsselkomponenten erreicht: Amazon Bedrock Data Automation, Amazon Bedrock Knowledge Bases und Basismodelle, die über Amazon Bedrock bereitgestellt werden. Benutzer können verschiedene Arten von Inhalten hochladen, darunter Audiodateien, Bilder, Videos oder PDFs, zur automatischen Verarbeitung und Analyse.
Wenn Sie Inhalte hochladen, verarbeitet Amazon Bedrock Data Automation diese mithilfe von Standard- oder benutzerdefinierten Blaupausen, um wertvolle Erkenntnisse zu extrahieren. Die extrahierten Informationen werden im JSON-Format in einem Amazon Simple Storage Service (Amazon S3)-Bucket gespeichert, während der Auftragsstatus über Amazon EventBridge verfolgt und in Amazon DynamoDB gespeichert wird. Die Lösung führt eine benutzerdefinierte Analyse der extrahierten JSON-Daten durch, um mit der Wissensdatenbank kompatible Dokumente zu erstellen, die dann in Amazon Bedrock Knowledge Bases gespeichert und indiziert werden.
Über eine intuitive Benutzeroberfläche zeigt die Lösung gleichzeitig die hochgeladenen Inhalte und die extrahierten Informationen an. Benutzer können über ein Frage- und Antwortsystem, das auf Retrieval Augmented Generation (RAG) basiert und von Amazon Bedrock Foundation-Modellen unterstützt wird, mit den verarbeiteten Daten interagieren. Dieser integrierte Ansatz ermöglicht es Unternehmen, verschiedene Inhaltsformate effizient zu verarbeiten, zu analysieren und daraus Erkenntnisse zu gewinnen, und gleichzeitig eine robuste und skalierbare Infrastruktur zu nutzen, die mit AWS Cloud Development Kit (AWS CDK) bereitgestellt wird.
Architektur
Das folgende Architekturschema veranschaulicht den Ablauf der Lösung:
- Benutzer interagieren mit der Front-End-Anwendung und authentifizieren sich über Amazon Cognito.
- API-Anforderungen werden von Amazon API Gateway- und AWS Lambda-Funktionen verarbeitet.
- Dateien werden zur Verarbeitung in einen S3-Bucket hochgeladen.
- Amazon Bedrock Data Automation verarbeitet die Dateien und extrahiert Informationen.
- EventBridge verwaltet den Auftragsstatus und löst die Nachbearbeitung aus.
- Der Auftragsstatus wird in DynamoDB gespeichert und die verarbeiteten Inhalte werden in Amazon S3 gespeichert.
- Lambda-Funktionen analysieren die verarbeiteten Inhalte und indizieren sie in Amazon Bedrock Knowledge Bases.
- Das RAG-basierte Frage- und Antwortsystem verwendet Amazon Bedrock-Basismodelle, um Benutzerabfragen zu beantworten.
Voraussetzungen
Back-End
Für das Back-End benötigen Sie die folgenden Voraussetzungen:
- Ein AWS-Konto.
- Python 3.11 oder höher.
- Docker.
- GitHub (wenn Sie ein Code-Repository verwenden).
- AWS CDK. Weitere Informationen und Voraussetzungen finden Sie unter Erste Schritte mit AWS CDK.
- Aktivieren Sie den Zugriff auf Basemodelle in Amazon Bedrock:
- Claude 3.5 Sonnet v2.0 von Anthropic
- Amazon Nova Pro v1.0
- Claude 3.7 Sonnet v1.0 von Anthropic
Front-End
Für das Front-End benötigen Sie die folgenden Voraussetzungen:
- Node/npm: v18.12.1
- Ein bereitgestelltes Back-End.
- Mindestens ein Benutzer, der dem entsprechenden Amazon Cognito-Benutzerpool hinzugefügt wurde (erforderlich für authentifizierte API-Aufrufe).
Alles, was Sie benötigen, steht Ihnen in Form von Open-Source-Code in unserem GitHub-Repository zur Verfügung.
Bereitstellungsleitfaden
Diese Beispielanwendungscodebasis ist in die folgenden Schlüsselordner unterteilt:
samples/bedrock-bda-media-solution