Integracja Danych w Czasie Rzeczywistym z Bedrock

Wykorzystanie Wglądów w Czasie Rzeczywistym: Streaming Danych z Kafka do Baz Wiedzy Amazon Bedrock za Pomocą Niestandardowych Łączników

Krajobraz sztucznej inteligencji dynamicznie się rozwija, a Retrieval Augmented Generation (RAG) staje się kluczową techniką. RAG umożliwia systemom AI dostarczanie bardziej świadomych i kontekstowo odpowiednich odpowiedzi poprzez płynne łączenie możliwości generatywnych modeli AI z zewnętrznymi źródłami danych. Podejście to wykracza poza ograniczenia polegania wyłącznie na istniejącej bazie wiedzy modelu. W tym artykule zagłębiamy się w transformacyjny potencjał niestandardowych łączników danych w Bazach Wiedzy Amazon Bedrock, pokazując, jak usprawniają one tworzenie przepływów pracy RAG, które wykorzystują niestandardowe dane wejściowe. Ta funkcjonalność umożliwia Bazom Wiedzy Amazon Bedrock pozyskiwanie danych strumieniowych, pozwalając programistom dynamicznie dodawać, aktualizować lub usuwać informacje w swoich bazach wiedzy za pomocą bezpośrednich wywołań API.

Rozważmy niezliczone zastosowania, w których pozyskiwanie danych w czasie rzeczywistym ma kluczowe znaczenie: analiza wzorców clickstream, przetwarzanie transakcji kart kredytowych, interpretacja danych z czujników Internetu Rzeczy (IoT), prowadzenie analizy dzienników i monitorowanie cen towarów. W takich scenariuszach zarówno aktualne dane, jak i historyczne trendy odgrywają istotną rolę w podejmowaniu świadomych decyzji. Tradycyjnie włączenie tak krytycznych danych wejściowych wymagało przygotowania danych w obsługiwanym źródle danych, a następnie inicjowania lub planowania zadania synchronizacji danych. Czas trwania tego procesu różnił się w zależności od jakości i objętości danych. Jednak dzięki niestandardowym łącznikom danych organizacje mogą szybko pozyskiwać określone dokumenty z niestandardowych źródeł danych bez konieczności pełnej synchronizacji, a także pozyskiwać dane strumieniowe bez polegania na pośrednim przechowywaniu. Podejście to minimalizuje opóźnienia i eliminuje narzut związany z przechowywaniem, co prowadzi do szybszego dostępu do danych, zmniejszenia opóźnień i poprawy wydajności aplikacji.

Dzięki strumieniowemu pozyskiwaniu za pośrednictwem niestandardowych łączników, Bazy Wiedzy Amazon Bedrock mogą przetwarzać dane strumieniowe bez potrzeby pośrednich źródeł danych. Pozwala to na udostępnienie danych niemal w czasie rzeczywistym. Ta funkcja automatycznie segmentuje i konwertuje dane wejściowe na osadzenia za pomocą wybranego modelu Amazon Bedrock, przechowując wszystko w backendowej bazie danych wektorowych. Ten usprawniony proces dotyczy zarówno nowych, jak i istniejących baz danych, pozwalając skupić się na tworzeniu aplikacji AI bez obciążenia orkiestracją dzielenia danych na fragmenty, generowania osadzeń lub udostępniania i indeksowania wektorowych magazynów. Ponadto możliwość pozyskiwania określonych dokumentów z niestandardowych źródeł danych zmniejsza opóźnienia i obniża koszty operacyjne, eliminując wymagania dotyczące pośredniego przechowywania.

Amazon Bedrock: Podstawa Generatywnej Sztucznej Inteligencji

Amazon Bedrock to w pełni zarządzana usługa, która oferuje różnorodny wybór wysokowydajnych modeli podstawowych (FMs) od wiodących firm AI, takich jak Anthropic, Cohere, Meta, Stability AI i Amazon, dostępnych za pośrednictwem ujednoliconego API. Ta kompleksowa usługa zapewnia szeroki zakres możliwości, które umożliwiają tworzenie generatywnych aplikacji AI z solidnymi funkcjami bezpieczeństwa, prywatności i odpowiedzialnej AI. Dzięki Amazon Bedrock możesz eksplorować i oceniać najlepsze FMs dla konkretnego przypadku użycia, dostosowywać je prywatnie za pomocą własnych danych, stosując techniki takie jak dostrajanie i RAG, oraz konstruować inteligentnych agentów, którzy mogą wykonywać zadania przy użyciu systemów i źródeł danych przedsiębiorstwa.

Bazy Wiedzy Amazon Bedrock: Wzbogacanie AI o Wiedzę

Bazy Wiedzy Amazon Bedrock umożliwiają organizacjom budowanie w pełni zarządzanych potoków RAG, które wzbogacają odpowiedzi AI o informacje kontekstowe pochodzące z prywatnych źródeł danych. Prowadzi to do bardziej trafnych, dokładnych i spersonalizowanych interakcji. Wykorzystując Bazy Wiedzy Amazon Bedrock, możesz tworzyć aplikacje, które są ulepszone o kontekst uzyskany z zapytań do bazy wiedzy. Przyspiesza to czas wprowadzenia na rynek, abstrahując od złożoności budowania potoków i zapewniając gotowe rozwiązanie RAG. Skraca to czas opracowywania aplikacji.

Niestandardowe Łączniki: Klucz do Bezproblemowego Strumieniowego Pozyskiwania

Bazy Wiedzy Amazon Bedrock zapewniają obsługę niestandardowych łączników i strumieniowego pozyskiwania danych. Pozwala to na dodawanie, aktualizowanie i usuwanie danych w bazie wiedzy za pomocą bezpośrednich wywołań API, oferując bezprecedensową elastyczność i kontrolę.

Budowanie Generatywnego Analizatora Cen Akcji AI z RAG: Przegląd Rozwiązania

W tym artykule demonstrujemy architekturę RAG wykorzystującą Bazy Wiedzy Amazon Bedrock, niestandardowe łączniki i tematy utworzone za pomocą Amazon Managed Streaming for Apache Kafka (Amazon MSK), aby umożliwić użytkownikom analizę trendów cen akcji. Amazon MSK to usługa strumieniowania danych, która upraszcza zarządzanie infrastrukturą i operacjami Apache Kafka, ułatwiając uruchamianie aplikacji Apache Kafka w Amazon Web Services (AWS). Rozwiązanie umożliwia analizę w czasie rzeczywistym opinii klientów za pośrednictwem osadzeń wektorowych i dużych modeli językowych (LLMs).

Komponenty Architektury

Architektura składa się z dwóch głównych komponentów:

  • Przepływ Pracy Wstępnego Przetwarzania Danych Strumieniowych:

    1. Plik .csv zawierający dane cen akcji jest przesyłany do tematu MSK, symulując wejście strumieniowe.
    2. Powoduje to uruchomienie funkcji AWS Lambda.
    3. Funkcja pozyskuje zużyte dane do bazy wiedzy.
    4. Baza wiedzy wykorzystuje model osadzeń do przekształcenia danych w indeks wektorowy.
    5. Indeks wektorowy jest przechowywanyw bazie danych wektorowych w bazie wiedzy.
  • Wykonanie w Czasie Rzeczywistym Podczas Zapytań Użytkownika:

    1. Użytkownicy przesyłają zapytania dotyczące cen akcji.
    2. Model podstawowy wykorzystuje bazę wiedzy do znalezienia odpowiednich odpowiedzi.
    3. Baza wiedzy zwraca odpowiednie dokumenty.
    4. Użytkownik otrzymuje odpowiedź na podstawie tych dokumentów.

Projekt Implementacji: Przewodnik Krok po Kroku

Implementacja obejmuje następujące kluczowe kroki:

  1. Konfiguracja Źródła Danych: Skonfiguruj temat MSK do strumieniowego przesyłania cen akcji.
  2. Konfiguracja Baz Wiedzy Amazon Bedrock: Utwórz bazę wiedzy w Amazon Bedrock, korzystając z opcji szybkiego tworzenia nowego magazynu wektorowego, która automatycznie udostępnia i konfiguruje magazyn wektorowy.
  3. Zużycie i Pozyskiwanie Danych: Ilekroć dane docierają do tematu MSK, uruchom funkcję Lambda, aby wyodrębnić indeksy akcji, ceny i informacje o znacznikach czasowych i wprowadza do niestandardowego łącznika dla Baz Wiedzy Amazon Bedrock.
  4. Testowanie Bazy Wiedzy: Oceń analizę opinii klientów za pomocą bazy wiedzy.

Prezentacja Rozwiązania: Budowanie Narzędzia do Analizy Akcji

Postępuj zgodnie z instrukcjami w poniższych sekcjach, aby zbudować generatywne narzędzie do analizy akcji AI przy użyciu Baz Wiedzy Amazon Bedrock i niestandardowych łączników.

Konfiguracja Architektury: Wdrażanie Szablonu CloudFormation

Aby zaimplementować tę architekturę, wdróż szablon AWS CloudFormation z tego repozytorium GitHub na swoim koncie AWS. Ten szablon wdraża następujące komponenty:

  1. Wirtualne chmury prywatne (VPCs), podsieci, grupy zabezpieczeń i role AWS Identity and Access Management (IAM).
  2. Klaster MSK hostujący temat wejściowy Apache Kafka.
  3. Funkcję Lambda do zużywania danych tematu Apache Kafka.
  4. Notebook Amazon SageMaker Studio do konfiguracji i włączenia.

Tworzenie Tematu Apache Kafka: Konfiguracja Strumienia Danych

W wstępnie utworzonym klastrze MSK brokery są już wdrożone i gotowe do użycia. Następnym krokiem jest połączenie się z klastrem MSK i utworzenie tematu strumienia testowego przy użyciu terminala SageMaker Studio. Postępuj zgodnie ze szczegółowymi instrukcjami w Tworzenie tematu w klastrze Amazon MSK.

Ogólne kroki to:

  1. Pobierz i zainstaluj najnowszego klienta Apache Kafka.
  2. Połącz się z instancją brokera klastra MSK.
  3. Utwórz temat strumienia testowego na instancji brokera.

Tworzenie Bazy Wiedzy w Amazon Bedrock: Połączenie z Danymi

Aby utworzyć bazę wiedzy w Amazon Bedrock, wykonaj następujące kroki:

  1. W konsoli Amazon Bedrock, na lewej stronie nawigacyjnej w sekcji Narzędzia programistyczne, wybierz Bazy wiedzy.
  2. Aby rozpocząć tworzenie bazy wiedzy, w menu rozwijanym Utwórz, wybierz Baza wiedzy z magazynem wektorowym, jak pokazano na poniższym zrzucie ekranu.
  3. W panelu Podaj szczegóły bazy wiedzy wprowadź BedrockStreamIngestKnowledgeBase jako Nazwę bazy wiedzy.
  4. W sekcji Uprawnienia IAM wybierz opcję domyślną, Utwórz i użyj nowej roli usługi, i (opcjonalnie) podaj Nazwę roli usługi, jak pokazano na poniższym zrzucie ekranu.
  5. W panelu Wybierz źródło danych wybierz Niestandardowe jako źródło danych, w którym przechowywany jest zbiór danych.
  6. Wybierz Dalej, jak pokazano na poniższym zrzucie ekranu.
  7. W panelu Skonfiguruj źródło danych wprowadź BedrockStreamIngestKBCustomDS jako Nazwę źródła danych.
  8. W sekcji Strategia analizowania wybierz Domyślny parser Amazon Bedrock, a dla Strategii dzielenia na fragmenty wybierz Domyślne dzielenie na fragmenty. Wybierz Dalej, jak pokazano na poniższym zrzucie ekranu.
  9. W panelu Wybierz model osadzeń i skonfiguruj magazyn wektorowy, dla Modelu osadzeń wybierz Titan Text Embeddings v2. Dla Typu osadzeń wybierz Zmiennoprzecinkowe osadzenia wektorowe. Dla Wymiarów wektorowych wybierz 1024, jak pokazano na poniższym zrzucie ekranu. Upewnij się, że zażądałeś i otrzymałeś dostęp do wybranego FM w Amazon Bedrock. Aby dowiedzieć się więcej, zapoznaj się z Dodawanie lub usuwanie dostępu do modeli podstawowych Amazon Bedrock.
  10. W panelu Baza danych wektorowych wybierz Szybko utwórz nowy magazyn wektorowy i wybierz nową opcję Amazon OpenSearch Serverless jako magazyn wektorowy.
  11. Na następnym ekranie przejrzyj swoje wybory. Aby zakończyć konfigurację, wybierz Utwórz.
  12. W ciągu kilku minut konsola wyświetli nowo utworzoną bazę wiedzy.

Konfiguracja Konsumenta Apache Kafka AWS Lambda: Uruchamianie Pozyskiwania Danych

Teraz skonfiguruj funkcję Lambda konsumenta, aby uruchamiała się, gdy tylko temat wejściowy Apache Kafka otrzyma dane za pomocą wywołań API.

  1. Skonfiguruj ręcznie utworzony identyfikator bazy wiedzy Amazon Bedrock i jego niestandardowy identyfikator źródła danych jako zmienne środowiskowe w funkcji Lambda. Podczas korzystania z przykładowego notebooka, odpowiednie nazwy funkcji i identyfikatory zostaną wypełnione automatycznie.

Dogłębna Analiza: Odkrywanie Mocy Baz Wiedzy Amazon Bedrock z Niestandardowymi Łącznikami do Pozyskiwania Danych w Czasie Rzeczywistym

Konwergencja generatywnej AI i strumieni danych w czasie rzeczywistym odblokowuje bezprecedensowe możliwości dla firm w zakresie uzyskiwania głębszych wglądów, automatyzacji krytycznych procesów i dostarczania spersonalizowanych doświadczeń. Bazy Wiedzy Amazon Bedrock, w połączeniu z niestandardowymi łącznikami, znajdują się na czele tej rewolucji, umożliwiając organizacjom bezproblemową integrację danych strumieniowych z różnych źródeł, takich jak Apache Kafka, z aplikacjami opartymi na AI.

Ta funkcja wykracza poza ograniczenia tradycyjnych metod pozyskiwania danych, które często obejmują złożone procesy przygotowywania, transformacji i synchronizacji. Dzięki niestandardowym łącznikom dane mogą być pozyskiwane bezpośrednio do Bazy Wiedzy niemal w czasie rzeczywistym, eliminując opóźnienia i umożliwiając modelom AI dynamiczne reagowanie na zmieniające się warunki.

Przypadki Użycia w Różnych Branżach

Korzyści z tego podejścia są dalekosiężne i mają zastosowanie w szerokim zakresie branż.

  • Usługi Finansowe: Banki i firmy inwestycyjne mogą wykorzystywać dane rynkowe w czasie rzeczywistym i strumienie transakcji klientów do wykrywania oszustw, personalizowania rekomendacji inwestycyjnych i automatyzacji strategii handlowych. Wyobraź sobie system oparty na AI, który analizuje transakcje kartami kredytowymi w czasie rzeczywistym, oznaczając podejrzane działania i zapobiegając oszukańczym zakupom, zanim do nich dojdzie.
  • Handel Detaliczny: Firmy e-commerce mogą analizować dane clickstream i kanały mediów społecznościowych, aby zrozumieć zachowanie klientów, personalizować rekomendacje produktów i optymalizować strategie cenowe. Pozwala to na dynamiczne dostosowywanie kampanii marketingowych i zarządzanie zapasami w oparciu o popyt w czasie rzeczywistym.
  • Produkcja: Producenci mogą wykorzystywać dane z czujników IoT z urządzeń fabrycznych do przewidywania potrzeb konserwacyjnych, optymalizacji procesów produkcyjnych i poprawy jakości produktów. Na przykład system AI może analizować dane wibracji z maszyny, aby zidentyfikować potencjalne awarie, zanim doprowadzą one do kosztownych przestojów.
  • Opieka Zdrowotna: Szpitale mogą analizować strumienie danych pacjentów, aby wykrywać wczesne objawy choroby, personalizować plany leczenia i poprawiać wyniki leczenia pacjentów. Monitorowanie parametrów życiowych w czasie rzeczywistym może ostrzegać personel medyczny o krytycznych zmianach w stanie pacjenta, umożliwiając szybszą interwencję i lepszą opiekę.

Kluczowe Korzyści: Więcej Niż Dane w Czasie Rzeczywistym

Zalety korzystania z Baz Wiedzy Amazon Bedrock z niestandardowymi łącznikami wykraczają poza proste pozyskiwanie danych w czasie rzeczywistym.

  • Zmniejszone Opóźnienia: Eliminując potrzebę pośredniego przechowywania i procesów synchronizacji, organizacje mogą znacznie skrócić czas potrzebny na udostępnienie danych modelom AI. Prowadzi to do szybszych czasów odpowiedzi i bardziej dynamicznych aplikacji.
  • Niższe Koszty Operacyjne: Niestandardowe łączniki zmniejszają koszty operacyjne, eliminując potrzebę zarządzania i utrzymywania złożonych potoków danych. Uwalnia to cenne zasoby, które można zainwestować w innych obszarach działalności.
  • Poprawiona Jakość Danych: Pozyskując dane bezpośrednio ze źródła, organizacje mogą zapewnić, że ich modele AI pracują z najdokładniejszymi i aktualnymi informacjami. Prowadzi to do lepszych wglądów i bardziej wiarygodnych wyników.
  • Zwiększona Elastyczność: Niestandardowe łączniki pozwalają organizacjom łączyć się z szerokim zakresem źródeł danych, niezależnie od ich formatu i lokalizacji. Zapewnia to elastyczność wykorzystania wszystkich zasobów danych, niezależnie od miejsca ich przechowywania.
  • Uproszczone Opracowywanie: Bazy Wiedzy Amazon Bedrock zapewniają uproszczone środowisko programistyczne, abstrahując od złożoności pozyskiwania i zarządzania danymi. Pozwala to programistom skupić się na tworzeniu aplikacji AI, które zapewniają rzeczywistą wartość biznesową.

Dogłębna Analiza: Niestandardowe Łączniki od Podszewki

Aby w pełni docenić moc niestandardowych łączników, ważne jest, aby zrozumieć, jak one działają. Niestandardowy łącznik to zasadniczo fragment kodu, który umożliwia Bazom Wiedzy Amazon Bedrock łączenie się z określonym źródłem danych. Kod ten jest odpowiedzialny za wyodrębnianie danych ze źródła, przekształcanie ich do formatu zgodnego z Bazą Wiedzy i pozyskiwanie ich do systemu.

  • Integracja API: Niestandardowe łączniki zwykle współpracują ze źródłami danych za pośrednictwem interfejsów API. Interfejsy API zapewniają standardowy sposób dostępu do danych i wykonywania operacji.
  • Transformacja Danych: Transformacja danych jest krytycznym krokiem w procesie. Niestandardowe łączniki często muszą przekształcać dane z ich natywnego formatu do formatu zgodnego z Bazą Wiedzy. Może to obejmować konwersję typów danych, czyszczenie danych i wzbogacanie danych o dodatkowe informacje.
  • Strumieniowe Pozyskiwanie: Kluczem do pozyskiwania danych w czasie rzeczywistym jest możliwość ciągłego strumieniowania danych. Niestandardowe łączniki często używają interfejsów API strumieniowania do odbierania danych w momencie ich generowania, co pozwala na aktualizacje Bazy Wiedzy niemal w czasie rzeczywistym.
  • Bezpieczeństwo: Bezpieczeństwo jest sprawą najwyższej wagi podczas łączenia się ze źródłami danych. Niestandardowe łączniki muszą być projektowane z myślą o bezpieczeństwie, zapewniając ochronę danych zarówno podczas przesyłania, jak i w stanie spoczynku.

Podsumowanie: Wykorzystanie Przyszłości AI z Danymi w Czasie Rzeczywistym

Bazy Wiedzy Amazon Bedrock z niestandardowymi łącznikami stanowią znaczący postęp w dziedzinie AI. Umożliwiając organizacjom bezproblemową integrację strumieni danych w czasie rzeczywistym z ich aplikacjami AI, technologia ta odblokowuje bogactwo nowych możliwości innowacji i wzrostu biznesowego. W miarę jak AI ewoluuje, możliwość wykorzystania danych w czasie rzeczywistym będzie stawać się coraz bardziej krytyczna. Bazy Wiedzy Amazon Bedrock są pozycjonowane jako kluczowy element umożliwiający ten trend, umożliwiając organizacjom budowanie rozwiązań AI, które są bardziej dynamiczne, responsywne i inteligentne niż kiedykolwiek wcześniej.