تواجه المؤسسات اليوم تحدياً يتمثل في التعامل مع كميات هائلة من البيانات غير المهيكلة الموجودة بتنسيقات متنوعة، بما في ذلك المستندات والصور والملفات الصوتية وملفات الفيديو. في الماضي، كان استخلاص رؤى ذات معنى من هذه البيانات بتنسيقاتها المختلفة يتطلب عمليات معالجة معقدة وجهود تطوير كبيرة. ومع ذلك، فإن تقنيات الذكاء الاصطناعي التوليدي تُحدث ثورة في هذا المجال، حيث توفر قدرات قوية لأتمتة معالجة وتحليل البيانات من هذه التنسيقات المختلفة واستخلاص رؤى منها، مما يقلل بشكل كبير من الجهد اليدوي ويحسن الدقة وقابلية التوسع.
بفضل Amazon Bedrock Data Automation و Amazon Bedrock Knowledge Bases، يمكنك الآن إنشاء تطبيقات RAG قوية متعددة الوسائط بسهولة. إنهما يمكّنان المؤسسات معًا من معالجة وتنظيم واسترجاع المعلومات بكفاءة من محتواها متعدد الوسائط، مما يغير الطريقة التي تدير بها البيانات غير المهيكلة وتستخدمها.
ستوجهك هذه المقالة خلال إنشاء تطبيق كامل المكدس يستخدم Amazon Bedrock Data Automation لمعالجة المحتوى متعدد الوسائط وتخزين المعلومات المستخرجة في Amazon Bedrock Knowledge Bases، وتمكين استعلامات اللغة الطبيعية من خلال واجهة Q&A القائمة على RAG.
حالات الاستخدام العملية
يوفر تكامل Amazon Bedrock Data Automation و Amazon Bedrock Knowledge Bases حلاً قويًا لمعالجة كميات كبيرة من البيانات غير المهيكلة عبر مختلف الصناعات، على سبيل المثال:
- في مجال الرعاية الصحية، تحتاج المؤسسات إلى معالجة كميات هائلة من سجلات المرضى، بما في ذلك النماذج الطبية وصور التشخيص وتسجيلات الاستشارات الصوتية. يمكن لـ Amazon Bedrock Data Automation استخراج هذه المعلومات وتنظيمها تلقائيًا، بينما تسمح Amazon Bedrock Knowledge Bases للعاملين في المجال الطبي باستخدام استعلامات اللغة الطبيعية، مثل “ما هو آخر قراءة لضغط دم المريض؟” أو “اعرض التاريخ العلاجي لمرضى السكري”.
- المؤسسات المالية تعالج يوميًا آلاف المستندات، من طلبات القروض إلى البيانات المالية. يمكن لـ Amazon Bedrock Data Automation استخراج المؤشرات المالية الرئيسية ومعلومات الامتثال، بينما تسمح Amazon Bedrock Knowledge Bases للمحللين بطرح أسئلة مثل: “ما هي عوامل الخطر المذكورة في أحدث تقرير فصلي؟” أو “اعرض جميع طلبات القروض ذات التصنيفات الائتمانية العالية”.
- تحتاج مكاتب المحاماة إلى التعامل مع كميات كبيرة من ملفات القضايا، والتي تحتوي على مستندات المحكمة والصور الفوتوغرافية للأدلة وشهادات الشهود. يمكن لـ Amazon Bedrock Data Automation معالجة هذه المصادر المختلفة، بينما تسمح Amazon Bedrock Knowledge Bases للمحامين بالاستعلام عن “ما هي الأدلة المقدمة بشأن الأحداث التي وقعت في 15 مارس؟” أو “ابحث عن جميع تصريحات الشهود التي تذكر المدعى عليه”.
- يمكن لشركات الإعلام استخدام هذا التكامل لتحقيق استهداف إعلاني ذكي وسياقي. تعالج Amazon Bedrock Data Automation محتوى الفيديو والترجمة الصوتية والتسجيلات الصوتية لفهم سياق المشهد والحوار والعواطف، مع تحليل الأصول الإعلانية ومتطلبات الحملة الإعلانية. ثم، تسمح Amazon Bedrock Knowledge Bases بإجراء استعلامات معقدة لمطابقة الإعلانات مع لحظات المحتوى المناسبة، مثل “ابحث عن مشاهد نشاط خارجي إيجابية تعرض إعلانات للمعدات الرياضية” أو “حدد مقاطع الفيديو الإعلانية للسياحة التي تناقش صناعة السفر”. توفر هذه المطابقة الذكية والسياقية استهدافًا إعلانيًا أكثر صلة وفعالية، مع الحفاظ على سلامة العلامة التجارية.
توضح هذه الأمثلة كيف يمكن لميزات الاستخراج في Amazon Bedrock Data Automation، جنبًا إلى جنب مع استعلامات اللغة الطبيعية في Amazon Bedrock Knowledge Bases، تغيير الطريقة التي تتفاعل بها المؤسسات مع بياناتها غير المهيكلة.
نظرة عامة على الحل
يوضح هذا الحل الشامل قدرات Amazon Bedrock المتقدمة في معالجة وتحليل المحتوى متعدد الوسائط (المستندات والصور والملفات الصوتية وملفات الفيديو)، ويتم تحقيقه من خلال ثلاثة مكونات رئيسية: Amazon Bedrock Data Automation و Amazon Bedrock Knowledge Bases والنماذج الأساسية التي توفرها Amazon Bedrock. يمكن للمستخدمين تحميل أنواع مختلفة من المحتوى، بما في ذلك الملفات الصوتية أو الصور أو مقاطع الفيديو أو ملفات PDF، للمعالجة والتحليل التلقائيين.
عندما تقوم بتحميل المحتوى، تعالج Amazon Bedrock Data Automation المحتوى باستخدام مخطط قياسي أو مخصص لاستخراج رؤى قيمة. يتم تخزين المعلومات المستخرجة بتنسيق JSON في حاوية Amazon Simple Storage Service (Amazon S3)، بينما تتم متابعة حالة المهمة من خلال Amazon EventBridge وحفظها في Amazon DynamoDB. يقوم الحل بتنفيذ تحليل مخصص لملف JSON المستخرج لإنشاء مستندات متوافقة مع قاعدة المعرفة، ثم يتم تخزينها في قواعد معرفة Amazon Bedrock وفهرستها.
من خلال واجهة مستخدم بديهية، يعرض الحل المحتوى الذي تم تحميله والمعلومات المستخرجة منه في وقت واحد. يمكن للمستخدمين التفاعل مع البيانات التي تمت معالجتها من خلال نظام أسئلة وأجوبة يعتمد على جيل الاسترجاع المعزز (RAG)، والذي تدعمه نماذج Amazon Bedrock الأساسية المُدارة. يمكّن هذا الأسلوب المتكامل المؤسسات من معالجة وتحليل المحتوى بكفاءة من مختلف تنسيقات المحتوى واكتساب رؤى منه، مع استخدام بنية تحتية قوية وقابلة للتطوير يتم نشرها باستخدام AWS Cloud Development Kit (AWS CDK).
البنية
يوضح مخطط البنية التالي تدفق الحل:
- يتفاعل المستخدمون مع تطبيق الواجهة الأمامية، ويتم المصادقة عليهم من خلال Amazon Cognito.
- تتم معالجة طلبات واجهة برمجة التطبيقات (API) بواسطة Amazon API Gateway ووظائف AWS Lambda.
- يتم تحميل الملفات إلى حاوية S3 للمعالجة.
- تعالج Amazon Bedrock Data Automation الملفات وتستخرج المعلومات.
- تدير EventBridge حالة المهمة وتشغل المعالجة اللاحقة.
- يتم تخزين حالة المهمة في DynamoDB، ويتم تخزين المحتوى الذي تمت معالجته في Amazon S3.
- تقوم وظائف Lambda بتحليل المحتوى الذي تمت معالجته وفهرسته في Amazon Bedrock Knowledge Bases.
- يستخدم نظام الأسئلة والأجوبة المستند إلى RAG نماذج Amazon Bedrock الأساسية للإجابة على استعلامات المستخدم.
المتطلبات الأساسية
الواجهة الخلفية
بالنسبة للواجهة الخلفية، تحتاج إلى المتطلبات الأساسية التالية:
- حساب AWS.
- Python 3.11 أو إصدار أحدث.
- Docker.
- GitHub (إذا كنت تستخدم مستودع التعليمات البرمجية).
- AWS CDK. لمزيد من التفاصيل والمتطلبات الأساسية، راجع بدء استخدام AWS CDK.
- تمكين الوصول إلى النماذج الأساسية في Amazon Bedrock:
- Claude 3.5 Sonnet v2.0 من Anthropic
- Amazon Nova Pro v1.0
- Claude 3.7 Sonnet v1.0 من Anthropic
الواجهة الأمامية
بالنسبة للواجهة الأمامية، تحتاج إلى المتطلبات الأساسية التالية:
- Node/npm: v18.12.1
- واجهة خلفية تم نشرها.
- تمت إضافة مستخدم واحد على الأقل إلى تجمع مستخدمي Amazon Cognito المقابل (مطلوب لمصادقة استدعاءات واجهة برمجة التطبيقات (API)).
كل ما تحتاجه متاح كرمز مفتوح المصدر في مستودع GitHub الخاص بنا.
دليل النشر
تم تنظيم قاعدة رموز تطبيق المثال هذه في المجلدات الرئيسية التالية:
samples/bedrock-bda-media-solution