Mashirika yanashughulikia kiasi kikubwa cha data isiyo na muundo katika fomati tofauti kama vile hati, picha, faili za sauti, na faili za video. Hapo zamani, kupata maarifa muhimu kutoka kwa data hii ilihitaji michakato tata na kazi kubwa ya uendelezaji. Teknolojia ya Akili Bandia (Generative AI) inaleta mapinduzi katika uwanja huu, ikitoa uwezo wa kiotomatiki wa kushughulikia, kuchambua, na kupata maarifa kutoka kwa fomati hizi tofauti za hati, kupunguza sana kazi ya mikono na kuboresha usahihi na upanuzi.
Kwa usaidizi wa Amazon Bedrock Data Automation na Amazon Bedrock Knowledge Bases, unaweza sasa kujenga programu thabiti za RAG za mbalimbali kwa urahisi. Kwa pamoja, zinaruhusu mashirika kushughulikia, kupanga, na kupata taarifa kwa ufanisi kutoka kwa maudhui yao ya mbalimbali, kubadilisha njia wanazosimamia na kutumia data isiyo na muundo.
Makala haya yatakuongoza katika kujenga programu kamili ambayo hutumia Amazon Bedrock Data Automation kushughulikia maudhui ya mbalimbali, kuhifadhi taarifa iliyopatikana katika Amazon Bedrock Knowledge Bases, na kuwezesha maswali ya lugha asilia kupitia kiolesura cha maswali na majibu (Q&A) kinachotegemea RAG.
Matumizi Halisi ya Kesi
Muunganisho wa Amazon Bedrock Data Automation na Amazon Bedrock Knowledge Bases hutoa suluhisho thabiti la kushughulikia kiasi kikubwa cha data isiyo na muundo katika viwanda mbalimbali, kama vile:
- Katika sekta ya afya, mashirika yanahitaji kushughulikia kiasi kikubwa cha rekodi za wagonjwa, ikiwa ni pamoja na fomu za matibabu, picha za uchunguzi, na rekodi za ushauri. Amazon Bedrock Data Automation inaweza kiotomatiki kuchimba na kujenga taarifa hii, huku Amazon Bedrock Knowledge Bases inaruhusu wafanyakazi wa afya kutumia maswali ya lugha asilia, kama vile “Shinikizo la damu la mwisho la mgonjwa lilikuwa ngapi?” au “Onyesha historia ya matibabu ya wagonjwa wa kisukari.”
- Taasisi za kifedha hushughulikia maelfu ya hati kila siku, kutoka kwa maombi ya mkopo hadi taarifa za kifedha. Amazon Bedrock Data Automation inaweza kuchimba viashiria muhimu vya kifedha na taarifa za kufuata sheria, huku Amazon Bedrock Knowledge Bases inaruhusu wachambuzi kuuliza maswali kama vile: “Ni mambo gani ya hatari yaliyotajwa katika ripoti ya hivi karibuni ya kila robo mwaka?” au “Onyesha maombi yote ya mkopo yenye alama za juu za mikopo.”
- Makampuni ya sheria yanahitaji kushughulikia kiasi kikubwa cha faili za kesi, zilizo na hati za mahakama, picha za ushahidi, na ushuhuda wa mashahidi. Amazon Bedrock Data Automation inaweza kushughulikia vyanzo hivi tofauti, huku Amazon Bedrock Knowledge Bases inaruhusu mawakili kuuliza “Ushahidi gani uliwasilishwa kuhusu matukio ya Machi 15?” au “Pata taarifa zote za mashahidi zinazomtaja mshtakiwa.”
- Makampuni ya vyombo vya habari yanaweza kutumia muunganisho huu kwa utoaji wa matangazo ya muktadha yenye akili. Amazon Bedrock Data Automation hushughulikia maudhui ya video, manukuu, na sauti ili kuelewa muktadha wa tukio, mazungumzo, na hisia, huku ikichambua mali za matangazo na mahitaji ya kampeni ya utangazaji. Kisha, Amazon Bedrock Knowledge Bases inaruhusu maswali tata ili kulinganisha matangazo na wakati unaofaa wa maudhui, kama vile “Tafuta matukio ya nje yenye ari nzuri yenye matangazo ya vifaa vya michezo” au “Tambua sehemu za matangazo ya utalii zinazojadili sekta ya utalii.” Ulinganishaji huu wa muktadha wenye akili hutoa utoaji wa matangazo unaofaa zaidi na unaofaa, huku ukiweka usalama wa chapa.
Mifano hii inaonyesha jinsi uwezo wa uchimbaji wa Amazon Bedrock Data Automation, pamoja na maswali ya lugha asilia kutoka Amazon Bedrock Knowledge Bases, yanaweza kubadilisha jinsi mashirika yanavyoingiliana na data yao isiyo na muundo.
Muhtasari wa Suluhisho
Suluhisho hili kamili linaonyesha uwezo mkuu wa Amazon Bedrock katika kushughulikia na kuchambua maudhui ya mbalimbali (hati, picha, faili za sauti, na faili za video), inafanikisha hili kupitia vipengele vitatu muhimu: Amazon Bedrock Data Automation, Amazon Bedrock Knowledge Bases, na miundo msingi inayopatikana kupitia Amazon Bedrock. Watumiaji wanaweza kupakia aina mbalimbali za maudhui, ikiwa ni pamoja na faili za sauti, picha, video au PDF, kwa ajili ya usindikaji na uchambuzi wa kiotomatiki.
Unapopakia maudhui, Amazon Bedrock Data Automation hutumia mipango ya kawaida au iliyobinafsishwa kuichakata, ili kupata maarifa muhimu. Taarifa iliyopatikana huhifadhiwa katika fomati ya JSON katika Amazon Simple Storage Service (Amazon S3) hifadhi, huku hali ya kazi ikifuatiliwa kupitia Amazon EventBridge na kuhifadhiwa katika Amazon DynamoDB. Suluhisho hili hufanya uchambuzi maalum wa JSON iliyopatikana ili kuunda hati zinazooana na hifadhi ya maarifa, ambazo kisha huhifadhiwa katika Amazon Bedrock Knowledge Bases na kuwekwa index.
Kupitia kiolesura cha mtumiaji angavu, suluhisho huonyesha maudhui yaliyopakiwa na taarifa iliyopatikana kwa wakati mmoja. Watumiaji wanaweza kuingiliana na data iliyochakatwa kupitia mfumo wa Maswali na Majibu (Q&A) unaotegemea Uzalishaji Ulioimarishwa wa Urejeshaji (RAG), unaoendeshwa na miundo msingi ya Amazon Bedrock. Mbinu hii iliyounganishwa inaruhusu mashirika kushughulikia, kuchambua, na kupata maarifa kwa ufanisi kutoka kwa fomati mbalimbali za maudhui, huku wakitumia miundombinu thabiti na inayoweza kupanuliwa iliyotumwa kwa kutumia AWS Cloud Development Kit (AWS CDK).
Usanifu
Mchoro ufuatao wa usanifu unaonyesha mtiririko wa suluhisho:
- Watumiaji huwasiliana na programu ya mbele, wakithibitishwa kupitia Amazon Cognito.
- Maombi ya API yanashughulikiwa na Amazon API Gateway na vitendaji vya AWS Lambda.
- Faili hupakiwa kwenye hifadhi ya S3 kwa ajili ya usindikaji.
- Amazon Bedrock Data Automation huchakata faili na kupata taarifa.
- EventBridge husimamia hali ya kazi na kuanzisha uchakataji wa baadae.
- Hali ya kazi imehifadhiwa katika DynamoDB, na maudhui yaliyochakatwa yamehifadhiwa katika Amazon S3.
- Vitendaji vya Lambda huchambua maudhui yaliyochakatwa na kuviweka index katika Amazon Bedrock Knowledge Bases.
- Mfumo wa Maswali na Majibu (Q&A) unaotegemea RAG hutumia miundo msingi ya Amazon Bedrock kujibu maswali ya watumiaji.
Masharti
Nyuma
Kwa nyuma, unahitaji kuwa na masharti yafuatayo:
- Akaunti ya AWS.
- Python 3.11 au toleo jipya zaidi.
- Docker.
- GitHub (ikiwa unatumia hifadhi ya msimbo).
- AWS CDK. Kwa maelezo zaidi na masharti, angalia Kuanza na AWS CDK.
- Wezesha ufikiaji wa miundo msingi katika Amazon Bedrock:
- Claude 3.5 Sonnet v2.0 ya Anthropic
- Amazon Nova Pro v1.0
- Claude 3.7 Sonnet v1.0 ya Anthropic
Mbele
Kwa mbele, unahitaji kuwa na masharti yafuatayo:
- Node/npm: v18.12.1
- Nyuma iliyotumwa.
- Angalau mtumiaji mmoja ameongezwa kwenye kidimbwi cha watumiaji cha Amazon Cognito (kinachohitajika kwa simu za API zilizothibitishwa).
Kila kitu unachohitaji kinapatikana katika mfumo wa msimbo wa chanzo huria katika hifadhi yetu ya GitHub.
Mwongozo wa Utekelezaji
Hifadhi ya msimbo wa programu hii ya mfano imepangwa katika folda muhimu zifuatazo:
samples/bedrock-bda-media-solution