అమెజాన్ బెడ్‌రాక్ డేటా ఆటోమేషన్‌తో యాప్ నిర్మాణం

వివిధ ఫార్మాట్‌లలోని నిర్మాణరహిత డేటాను ప్రాసెస్ చేయడానికి అమెజాన్ బెడ్‌రాక్ డేటా ఆటోమేషన్ మరియు అమెజాన్ బెడ్‌రాక్ నాలెడ్జ్ బేస్‌లను ఉపయోగించడం.

నేడు సంస్థలు డాక్యుమెంట్లు, చిత్రాలు, ఆడియో ఫైళ్లు మరియు వీడియో ఫైళ్లు వంటి వివిధ ఫార్మాట్‌లలో ఉన్న భారీ నిర్మాణరహిత డేటాను నిర్వహించాల్సిన అవసరం ఉంది. గతంలో ఈ విభిన్న ఫార్మాట్ల నుండి విలువైన సమాచారాన్ని సేకరించాలంటే సంక్లిష్టమైన ప్రాసెసింగ్ ప్రక్రియలు మరియు అభివృద్ధి పనుల కోసం చాలా సమయం పట్టేది. కానీ జనరేటివ్ కృత్రిమ మేధస్సు(Generative AI) టెక్నాలజీ ఈ రంగాన్ని సమూలంగా మార్చివేసింది. ఇది వివిధ డాక్యుమెంట్ ఫార్మాట్‌ల నుండి డేటాను స్వయంచాలకంగా ప్రాసెస్ చేయడానికి, విశ్లేషించడానికి మరియు అంతర్దృష్టులను సేకరించడానికి శక్తివంతమైన సామర్థ్యాలను అందిస్తుంది. తద్వారా మాన్యువల్ పనిని బాగా తగ్గిస్తుంది, ఖచ్చితత్వాన్ని మరియు విస్తరణను పెంచుతుంది.

Amazon Bedrock Data Automation మరియు Amazon Bedrock Knowledge Bases సహాయంతో ఇప్పుడు మీరు సులభంగా శక్తివంతమైన ముల్టీమోడల్ RAG అప్లికేషన్‌లను నిర్మించవచ్చు. ఈ రెండు టూల్స్ కలిసి సంస్థలు తమ ముల్టీమోడల్ కంటెంట్‌లోని సమాచారాన్ని సమర్థవంతంగా ప్రాసెస్ చేయడానికి, నిర్వహించడానికి మరియు తిరిగి పొందడానికి వీలు కల్పిస్తాయి. తద్వారా వారు నిర్మాణరహిత డేటాను నిర్వహించే మరియు ఉపయోగించే విధానాన్ని మారుస్తాయి.

ఈ కథనం అమెజాన్ బెడ్‌రాక్ డేటా ఆటోమేషన్‌ను ఉపయోగించి ముల్టీమోడల్ కంటెంట్‌ను ప్రాసెస్ చేయడానికి, సేకరించిన సమాచారాన్ని అమెజాన్ బెడ్‌రాక్ నాలెడ్జ్ బేస్‌లో నిల్వ చేయడానికి మరియు RAG ఆధారిత ప్రశ్న మరియు సమాధానం ఇంటర్‌ఫేస్ ద్వారా సహజ భాష ప్రశ్నలను ఎనేబుల్ చేయడానికి ఒక పూర్తి-స్టాక్ అప్లికేషన్‌ను ఎలా నిర్మించాలో మీకు మార్గనిర్దేశం చేస్తుంది.

నిజ జీవితానికి సంబంధించిన ఉపయోగకరమైన ఉదాహరణలు

అమెజాన్ బెడ్‌రాక్ డేటా ఆటోమేషన్ మరియు అమెజాన్ బెడ్‌రాక్ నాలెడ్జ్ బేస్‌ల కలయిక వివిధ పరిశ్రమలలోని భారీ నిర్మాణరహిత డేటాను ప్రాసెస్ చేయడానికి శక్తివంతమైన పరిష్కారాన్ని అందిస్తుంది. కొన్ని ఉదాహరణలు:

  • ఆరోగ్య సంరక్షణ రంగంలో, సంస్థలు రోగి రికార్డులు, రోగనిర్ధారణ చిత్రాలు మరియు సంప్రదింపుల ఆడియో రికార్డింగ్‌లతో సహా పెద్ద మొత్తంలో డేటాను నిర్వహించాల్సిన అవసరం ఉంది. Amazon Bedrock Data Automation ఈ సమాచారాన్ని స్వయంచాలకంగా సేకరించి నిర్మిస్తుంది. అమెజాన్ బెడ్‌రాక్ నాలెడ్జ్ బేస్ వైద్య నిపుణులు రోగి యొక్క చివరి రక్తపోటు రీడింగ్ ఎంత? లేదా డయాబెటిస్ ఉన్న రోగులకు చికిత్స చరిత్రను చూపించు వంటి సహజ భాషా ప్రశ్నలను ఉపయోగించడానికి అనుమతిస్తుంది.
  • ఆర్థిక సంస్థలు ప్రతిరోజూ లోన్ అప్లికేషన్ల నుండి ఆర్థిక నివేదికల వరకు వేలాది పత్రాలను ప్రాసెస్ చేస్తుంటాయి. Amazon Bedrock Data Automation కీలకమైన ఆర్థిక సూచికలను మరియు సమ్మతి సమాచారాన్ని సేకరించగలదు. అమెజాన్ బెడ్‌రాక్ నాలెడ్జ్ బేస్ విశ్లేషకులను తాజా త్రైమాసిక నివేదికలో ఏ రిస్క్ ఫ్యాక్టర్స్ పేర్కొనబడ్డాయి? లేదా అధిక క్రెడిట్ స్కోర్‌లు కలిగిన అన్ని లోన్ అప్లికేషన్‌లను చూపించు వంటి ప్రశ్నలను అడగడానికి అనుమతిస్తుంది.
  • న్యాయ సంస్థలు కోర్టు పత్రాలు, సాక్ష్యాల ఫోటోలు మరియు సాక్షుల వాంగ్మూలాలతో సహా భారీ మొత్తంలో కేసు ఫైళ్లను నిర్వహించాల్సి ఉంటుంది. Amazon Bedrock Data Automation ఈ విభిన్న వనరులను ప్రాసెస్ చేయగలదు. అమెజాన్ బెడ్‌రాక్ నాలెడ్జ్ బేస్ న్యాయవాదులను మార్చి 15న జరిగిన సంఘటన గురించి ఎలాంటి సాక్ష్యం సమర్పించబడింది? లేదా నిందితుడిని ప్రస్తావించే సాక్షుల వాంగ్మూలాలన్నింటినీ కనుగొను వంటి ప్రశ్నలను అడగడానికి అనుమతిస్తుంది.
  • మీడియా కంపెనీలు ఈ కలయికను ఉపయోగించి తెలివైన సందర్భోచిత ప్రకటనలను అందించగలవు. Amazon Bedrock Data Automation వీడియో కంటెంట్, సబ్‌టైటిల్స్ మరియు ఆడియోను సన్నివేశం యొక్క సందర్భం, సంభాషణ మరియు భావోద్వేగాలను అర్థం చేసుకోవడానికి ప్రాసెస్ చేస్తుంది. అలాగే ప్రకటనల ఆస్తులు మరియు ప్రచార అవసరాలను విశ్లేషిస్తుంది. ఆ తర్వాత అమెజాన్ బెడ్‌రాక్ నాలెడ్జ్ బేస్‌ ప్రకటనలను తగిన కంటెంట్ క్షణాలతో సరిపోల్చడానికి సంక్లిష్టమైన ప్రశ్నలను అడగడానికి అనుమతిస్తుంది. ఉదాహరణకు స్పోర్ట్స్ పరికరాల ప్రకటనతో కూడిన సానుకూల అవుట్‌డోర్ యాక్టివిటీ సన్నివేశాల కోసం చూడండి లేదా టూరిజం గురించి చర్చించే ట్రావెల్ యాడ్ విభాగాలను గుర్తించండి. ఈ తెలివైన సందర్భోచిత మ్యాచింగ్ మరింత సందర్భోచితమైన మరియు ప్రభావవంతమైన ప్రకటనలను అందిస్తుంది. అదే సమయంలో బ్రాండ్ భద్రతను కూడా కాపాడుతుంది.

అమెజాన్ బెడ్‌రాక్ డేటా ఆటోమేషన్ యొక్క ఎక్స్‌ట్రాక్షన్ సామర్థ్యాలు అమెజాన్ బెడ్‌రాక్ నాలెడ్జ్ బేస్‌ల సహజ భాషా ప్రశ్నలతో ఎలా కలిసి పనిచేస్తాయో ఈ ఉదాహరణలు తెలియజేస్తాయి. తద్వారా సంస్థలు వారి నిర్మాణరహిత డేటాతో వ్యవహరించే విధానాన్ని మారుస్తాయి.

సొల్యూషన్ యొక్క అవలోకనం

ఈ సమగ్ర పరిష్కారం ముల్టీమోడల్ కంటెంట్(పత్రాలు, చిత్రాలు, ఆడియో ఫైళ్లు మరియు వీడియో ఫైళ్లు)ను ప్రాసెస్ చేయడంలో మరియు విశ్లేషించడంలో అమెజాన్ బెడ్‌రాక్ యొక్క అధునాతన సామర్థ్యాలను ప్రదర్శిస్తుంది. ఇది మూడు కీలకమైన భాగాల ద్వారా సాధ్యమవుతుంది: అమెజాన్ బెడ్‌రాక్ డేటా ఆటోమేషన్, అమెజాన్ బెడ్‌రాక్ నాలెడ్జ్ బేస్ మరియు అమెజాన్ బెడ్‌రాక్ ద్వారా అందించబడే పునాది నమూనాలు. వినియోగదారులు ఆడియో ఫైళ్లు, చిత్రాలు, వీడియోలు లేదా PDFలతో సహా వివిధ రకాల కంటెంట్‌ను ఆటోమేటిక్ ప్రాసెసింగ్ మరియు విశ్లేషణ కోసం అప్‌లోడ్ చేయవచ్చు.

మీరు కంటెంట్‌ను అప్‌లోడ్ చేసినప్పుడు అమెజాన్ బెడ్‌రాక్ డేటా ఆటోమేషన్ స్టాండర్డ్ లేదా కస్టమ్ బ్లూప్రింట్‌లను ఉపయోగించి విలువైన సమాచారాన్ని సేకరిస్తుంది. సేకరించిన సమాచారం JSON ఫార్మాట్‌లో అమెజాన్ సింపుల్ స్టోరేజ్ సర్వీస్ (Amazon S3) బకెట్‌లో నిల్వ చేయబడుతుంది. టాస్క్ స్టేటస్‌ను Amazon EventBridge ద్వారా ట్రాక్ చేయవచ్చు మరియు Amazon DynamoDBలో సేవ్ చేయవచ్చు. ఈ పరిష్కారం నాలెడ్జ్ బేస్‌కు అనుకూలమైన డాక్యుమెంట్లను చేయడానికి JSONను కస్టమ్ పార్సింగ్ చేస్తుంది. ఆ తర్వాత వాటిని అమెజాన్ బెడ్‌రాక్ నాలెడ్జ్ బేస్‌లో నిల్వ చేసి ఇండెక్స్ చేస్తుంది.

వినియోగదారు ఇంటర్‌ఫేస్ ద్వారా ఈ సొల్యూషన్ అప్‌లోడ్ చేసిన కంటెంట్‌ను మరియు సేకరించిన సమాచారాన్ని రెండింటినీ చూపిస్తుంది. వినియోగదారులు అమెజాన్ బెడ్‌రాక్ ఫౌండేషన్ మోడల్స్ ద్వారా అందించబడే రిట్రీవల్ ఆగ్మెంటెడ్ జనరేషన్ (RAG) ఆధారిత ప్రశ్న మరియు సమాధానం సిస్టమ్‌తో ప్రాసెస్ చేసిన డేటాతో ఇంటరాక్ట్ అవ్వవచ్చు. ఈ ఇంటిగ్రేటెడ్ పద్ధతి సంస్థలను వివిధ కంటెంట్ ఫార్మాట్‌ల నుండి సమాచారాన్ని సమర్థవంతంగా ప్రాసెస్ చేయడానికి, విశ్లేషించడానికి మరియు పొందడానికి సహాయపడుతుంది. AWS క్లౌడ్ డెవలప్‌మెంట్ కిట్ (AWS CDK)ను ఉపయోగించి విస్తరించిన బలమైన మరియు విస్తరించదగిన మౌలిక సదుపాయాలను కూడా అందిస్తుంది.

ఆర్కిటెక్చర్

దిగువ ఆర్కిటెక్చర్ రేఖాచిత్రం పరిష్కారం యొక్క ఫ్లోను వివరిస్తుంది:

  1. వినియోగదారులు Amazon Cognito ద్వారా ప్రామాణీకరణ పొంది ఫ్రంట్-ఎండ్ అప్లికేషన్‌తో ఇంటరాక్ట్ అవుతారు.
  2. API అభ్యర్థనలను Amazon API గేట్‌వే మరియు AWS లాంబ్డా ఫంక్షన్ నిర్వహిస్తాయి.
  3. ప్రాసెసింగ్ కోసం ఫైళ్లు S3 బకెట్‌కు అప్‌లోడ్ చేయబడతాయి.
  4. Amazon Bedrock Data Automation ఫైళ్లను ప్రాసెస్ చేసి సమాచారాన్ని సేకరిస్తుంది.
  5. EventBridge టాస్క్ స్టేటస్‌ను మేనేజ్ చేస్తుంది మరియు పోస్ట్-ప్రాసెసింగ్‌ను ట్రిగ్గర్ చేస్తుంది.
  6. టాస్క్ స్టేటస్ DynamoDBలో నిల్వ చేయబడుతుంది మరియు ప్రాసెస్ చేసిన కంటెంట్ Amazon S3లో నిల్వ చేయబడుతుంది.
  7. లాంబ్డా ఫంక్షన్ ప్రాసెస్ చేయబడిన కంటెంట్‌ను పార్స్ చేస్తుంది మరియు Amazon Bedrock Knowledge Basesలో ఇండెక్స్ చేస్తుంది.
  8. RAG ఆధారిత ప్రశ్న మరియు సమాధానం సిస్టమ్ వినియోగదారు ప్రశ్నలకు సమాధానం ఇవ్వడానికి Amazon Bedrock ఫౌండేషన్ మోడల్‌ను ఉపయోగిస్తుంది.

అవసరాలు

బ్యాక్ ఎండ్

బ్యాక్ ఎండ్ కోసం మీకు ఈ క్రింది అవసరాలు ఉన్నాయి:

  • AWS ఖాతా.
  • Python 3.11 లేదా తworకటి కొత్త వెర్షన్.
  • Docker.
  • GitHub (కోడ్ రిపోజిటరీని ఉపయోగిస్తుంటే).
  • AWS CDK. మరింత సమాచారం మరియు అవసరాల కోసం AWS CDKతో ప్రారంభించడం చూడండి.
  • Amazon Bedrockలో ఫౌండేషన్ మోడల్స్‌కు యాక్సెస్ ప్రారంభించండి:
    • Anthropic యొక్క Claude 3.5 Sonnet v2.0
    • Amazon Nova Pro v1.0
    • Anthropic యొక్క Claude 3.7 Sonnet v1.0

ఫ్రంట్ ఎండ్

ఫ్రంట్ ఎండ్ కోసం మీకు ఈ అవసరాలు ఉన్నాయి:

  • Node/npm: v18.12.1
  • విస్తరించిన బ్యాక్ ఎండ్.
  • సంబంధిత Amazon Cognito యూజర్ పూల్‌కు కనీసం ఒక యూజర్‌నైనా జోడించాలి (ప్రామాణీకరణ కోసం API కాల్స్ అవసరం).

మీకు కావలసినవన్నీ ఓపెన్ సోర్స్ కోడ్‌గా మా GitHub రిపోజిటరీలో అందుబాటులో ఉన్నాయి.

విస్తరణ మార్గదర్శి

ఈ నమూనా అప్లికేషన్ కోడ్‌బేస్ క్రింది ముఖ్యమైన ఫోల్డర్‌లుగా విభజించబడింది:

samples/bedrock-bda-media-solution.