چشمانداز هوش مصنوعی به سرعت در حال تحول است و Retrieval Augmented Generation (RAG) به عنوان یک تکنیک محوری ظهور کرده است. RAG سیستمهای هوش مصنوعی را قادر میسازد تا با ادغام یکپارچه قابلیتهای مدلهای هوش مصنوعی مولد با منابع داده خارجی، پاسخهای آگاهانهتر و مرتبط با زمینه ارائه دهند. این رویکرد از محدودیتهای تکیه صرفاً بر پایگاه دانش از پیش موجود یک مدل فراتر میرود. در این مقاله، ما به پتانسیل تحولآفرین اتصالدهندههای داده سفارشی در پایگاههای دانش Amazon Bedrock میپردازیم و نشان میدهیم که چگونه آنها ایجاد جریانهای کاری RAG را ساده میکنند که از دادههای ورودی سفارشی استفاده میکنند. این عملکرد به پایگاههای دانش Amazon Bedrock اجازه میدهد تا دادههای جریانی را دریافت کنند و به توسعهدهندگان اجازه میدهد تا به طور پویا اطلاعات را در پایگاههای دانش خود از طریق فراخوانی مستقیم API اضافه، بهروزرسانی یا حذف کنند.
برنامههای بیشماری را در نظر بگیرید که در آن دریافت داده بیدرنگ بسیار مهم است: تجزیه و تحلیل الگوهای کلیک، پردازش تراکنشهای کارت اعتباری، تفسیر دادهها از حسگرهای اینترنت اشیا (IoT)، انجام تجزیه و تحلیل گزارش و نظارت بر قیمت کالاها. در چنین سناریوهایی، هم دادههای فعلی و هم روندهای تاریخی نقش حیاتی در تصمیمگیری آگاهانه ایفا میکنند. بهطور سنتی، گنجاندن چنین ورودیهای داده حیاتی مستلزم آمادهسازی دادهها در یک منبع داده پشتیبانیشده و سپس آغاز یا زمانبندی یک کار همگامسازی داده بود. مدت زمان این فرآیند بسته به کیفیت و حجم داده متفاوت بود. با این حال، با اتصالدهندههای داده سفارشی، سازمانها میتوانند به سرعت اسناد خاص را از منابع داده سفارشی بدون نیاز به همگامسازی کامل دریافت کرده و دادههای جریانی را بدون تکیه بر ذخیرهسازی واسطه دریافت کنند. این رویکرد تاخیرها را به حداقل میرساند و سربار ذخیرهسازی را حذف میکند و منجر به دسترسی سریعتر به دادهها، کاهش تأخیر و بهبود عملکرد برنامه میشود.
با دریافت جریانی از طریق اتصالدهندههای سفارشی، پایگاههای دانش Amazon Bedrock میتوانند دادههای جریانی را بدون نیاز به منابع داده میانی پردازش کنند. این امر به دادهها اجازه میدهد تا تقریباً در زمان واقعی در دسترس قرار گیرند. این قابلیت به طور خودکار دادههای ورودی را با استفاده از مدل Amazon Bedrock انتخاب شده، به قطعات تقسیم و تبدیل میکند و همه چیز را در پایگاه داده برداری پشتیبان ذخیره میکند. این فرآیند ساده شده برای پایگاههای داده جدید و موجود اعمال میشود و به شما امکان میدهد بدون بار ساماندهی قطعهبندی دادهها، تولید جاسازی یا تهیه و نمایه سازی فروشگاه برداری، بر ساخت برنامههای هوش مصنوعی تمرکز کنید. علاوه بر این، توانایی دریافت اسناد خاص از منابع داده سفارشی، تأخیر را کاهش میدهد و هزینههای عملیاتی را با حذف الزامات ذخیرهسازی میانی کاهش میدهد.
Amazon Bedrock: پایهای برای هوش مصنوعی مولد
Amazon Bedrock یک سرویس کاملاً مدیریتشده است که مجموعهای متنوع از مدلهای پایه با کارایی بالا (FM) را از شرکتهای پیشرو هوش مصنوعی مانند Anthropic، Cohere، Meta، Stability AI و Amazon ارائه میدهد که از طریق یک API واحد قابل دسترسی هستند. این سرویس جامع طیف گستردهای از قابلیتها را فراهم میکند که به شما امکان میدهد برنامههای هوش مصنوعی مولد را با امنیت قوی، حریم خصوصی و ویژگیهای هوش مصنوعی مسئولانه توسعه دهید. با Amazon Bedrock، میتوانید FMهای سطح بالا را برای مورد استفاده خاص خود کشف و ارزیابی کنید، آنها را به طور خصوصی با دادههای خود با استفاده از تکنیکهایی مانند تنظیم دقیق و RAG سفارشی کنید و عوامل هوشمندی بسازید که بتوانند وظایف را با استفاده از سیستمهای سازمانی و منابع داده شما اجرا کنند.
پایگاههای دانش Amazon Bedrock: تقویت هوش مصنوعی با دانش
پایگاههای دانش Amazon Bedrock سازمانها را قادر میسازند تا خطوط لوله RAG کاملاً مدیریتشده بسازند که پاسخهای هوش مصنوعی را با اطلاعات متنی برگرفته از منابع داده خصوصی غنی میکنند. این منجر به تعاملات مرتبطتر، دقیقتر و شخصیتر میشود. با استفاده از پایگاههای دانش Amazon Bedrock، میتوانید برنامههایی ایجاد کنید که توسط زمینه به دست آمده از پرس و جو از یک پایگاه دانش تقویت میشوند. این امر با حذف پیچیدگیهای ساخت خطوط لوله و ارائه یک راه حل RAG خارج از جعبه، زمان ورود به بازار را تسریع میکند. این امر زمان توسعه برای برنامههای شما را کاهش میدهد.
اتصالدهندههای سفارشی: کلید دریافت جریانی یکپارچه
پایگاههای دانش Amazon Bedrock از اتصالدهندههای سفارشی و دریافت دادههای جریانی پشتیبانی میکند. این به شما امکان میدهد تا دادهها را در پایگاه دانش خود از طریق فراخوانی مستقیم API اضافه، بهروزرسانی و حذف کنید و انعطافپذیری و کنترل بیسابقهای را ارائه دهید.
ساخت یک تحلیلگر قیمت سهام هوش مصنوعی مولد با RAG: مروری بر راه حل
در این مقاله، ما یک معماری RAG را با استفاده از پایگاههای دانش Amazon Bedrock، اتصالدهندههای سفارشی و موضوعات ایجاد شده با Amazon Managed Streaming for Apache Kafka (Amazon MSK) نشان میدهیم تا کاربران را قادر سازیم تا روندهای قیمت سهام را تجزیه و تحلیل کنند. Amazon MSK یک سرویس داده جریانی است که مدیریت زیرساخت و عملیات Apache Kafka را ساده میکند و اجرای برنامههای Apache Kafka را در Amazon Web Services (AWS) آسان میکند. این راه حل تجزیه و تحلیل بیدرنگ بازخورد مشتری را از طریق جاسازی برداری و مدلهای زبانی بزرگ (LLM) امکانپذیر میکند.
اجزای معماری
این معماری از دو جزء اصلی تشکیل شده است:
جریان کار پردازش دادههای جریانی:
- یک فایل .csv حاوی دادههای قیمت سهام در یک موضوع MSK آپلود میشود که ورودی جریانی را شبیهسازی میکند.
- این امر یک تابع AWS Lambda را فعال میکند.
- این تابع دادههای مصرف شده را در یک پایگاه دانش دریافت میکند.
- پایگاه دانش از یک مدل جاسازی برای تبدیل دادهها به یک شاخص برداری استفاده میکند.
- شاخص برداری در یک پایگاه داده برداری در داخل پایگاه دانش ذخیره میشود.
اجرای زمان اجرا در طول پرس و جوهای کاربر:
- کاربران پرس و جوهایی را در مورد قیمت سهام ارسال میکنند.
- مدل پایه از پایگاه دانش برای یافتن پاسخهای مرتبط استفاده میکند.
- پایگاه دانش اسناد مربوطه را برمیگرداند.
- کاربر بر اساس این اسناد پاسخی دریافت میکند.
طراحی پیادهسازی: یک راهنمای گام به گام
پیادهسازی شامل مراحل کلیدی زیر است:
- تنظیم منبع داده: یک موضوع MSK را برای جریان ورودی قیمت سهام پیکربندی کنید.
- تنظیم پایگاههای دانش Amazon Bedrock: یک پایگاه دانش در Amazon Bedrock با استفاده از گزینه ایجاد سریع یک فروشگاه برداری جدید ایجاد کنید، که به طور خودکار فروشگاه برداری را تهیه و تنظیم میکند.
- مصرف و دریافت داده: هر زمان که دادهها در موضوع MSK وارد میشوند، یک تابع Lambda را فعال کنید تا شاخصهای سهام، قیمتها و اطلاعات مهر زمانی را استخراج کند و به اتصالدهنده سفارشی برای پایگاههای دانش Amazon Bedrock وارد کند.
- آزمایش پایگاه دانش: تجزیه و تحلیل بازخورد مشتری را با استفاده از پایگاه دانش ارزیابی کنید.
راهنمای راه حل: ساخت ابزار تجزیه و تحلیل سهام خود
برای ساخت یک ابزار تجزیه و تحلیل سهام هوش مصنوعی مولد با استفاده از پایگاههای دانش Amazon Bedrock و اتصالدهندههای سفارشی، دستورالعملهای موجود در بخشهای زیر را دنبال کنید.
پیکربندی معماری: استقرار قالب CloudFormation
برای پیادهسازی این معماری، قالب AWS CloudFormation را از این مخزن GitHub در حساب AWS خود مستقر کنید. این قالب اجزای زیر را مستقر میکند:
- ابر خصوصی مجازی (VPC)، زیرشبکهها، گروههای امنیتی و نقشهای AWS Identity and Access Management (IAM).
- یک خوشه MSK میزبانی یک موضوع ورودی Apache Kafka.
- یک تابع Lambda برای مصرف دادههای موضوع Apache Kafka.
- یک نوتبوک Amazon SageMaker Studio برای تنظیم و فعالسازی.
ایجاد یک موضوع Apache Kafka: تنظیم جریان داده
در خوشه MSK از پیش ایجاد شده، کارگزارها قبلاً مستقر شده و آماده استفاده هستند. مرحله بعدی اتصال به خوشه MSK و ایجاد موضوع جریان آزمایشی با استفاده از یک نمونه ترمینال SageMaker Studio است. دستورالعملهای دقیق را در ایجاد یک موضوع در خوشه Amazon MSK دنبال کنید.
مراحل کلی عبارتند از:
- آخرین کلاینت Apache Kafka را دانلود و نصب کنید.
- به نمونه کارگزار خوشه MSK متصل شوید.
- موضوع جریان آزمایشی را در نمونه کارگزار ایجاد کنید.
ایجاد یک پایگاه دانش در Amazon Bedrock: اتصال به دادههای خود
برای ایجاد یک پایگاه دانش در Amazon Bedrock، این مراحل را دنبال کنید:
- در کنسول Amazon Bedrock، در صفحه ناوبری سمت چپ در زیر ابزارهای سازنده، پایگاههای دانش را انتخاب کنید.
- برای شروع ایجاد پایگاه دانش، در منوی کشویی ایجاد، پایگاه دانش با فروشگاه برداری را انتخاب کنید، همانطور که در تصویر زیر نشان داده شده است.
- در پنجره ارائه جزئیات پایگاه دانش،
BedrockStreamIngestKnowledgeBase
را به عنوان نام پایگاه دانش وارد کنید. - در زیر مجوزهای IAM، گزینه پیش فرض ایجاد و استفاده از یک نقش سرویس جدید را انتخاب کنید و (اختیاری) یک نام نقش سرویس ارائه دهید، همانطور که در تصویر زیر نشان داده شده است.
- در پنجره انتخاب منبع داده، سفارشی را به عنوان منبع داده ای که مجموعه داده شما در آن ذخیره شده است، انتخاب کنید
- بعدی را انتخاب کنید، همانطور که در تصویر زیر نشان داده شده است
- در پنجره پیکربندی منبع داده،
BedrockStreamIngestKBCustomDS
را به عنوان نام منبع داده وارد کنید. - در زیر استراتژی تجزیه، تجزیهگر پیشفرض Amazon Bedrock را انتخاب کنید و برای استراتژی قطعهبندی، قطعهبندی پیشفرض را انتخاب کنید. بعدی را انتخاب کنید، همانطور که در تصویر زیر نشان داده شده است.
- در پنجره انتخاب مدل جاسازی و پیکربندی فروشگاه برداری، برای مدل جاسازی، Titan Text Embeddings v2 را انتخاب کنید. برای نوع جاسازی، جاسازی برداری ممیز شناور را انتخاب کنید. برای ابعاد بردار، 1024 را انتخاب کنید، همانطور که در تصویر زیر نشان داده شده است. اطمینان حاصل کنید که دسترسی به FM انتخاب شده را در Amazon Bedrock درخواست کرده و دریافت کرده اید. برای کسب اطلاعات بیشتر، به اضافه یا حذف دسترسی به مدلهای پایه Amazon Bedrock مراجعه کنید.
- در پنجره پایگاه داده برداری، ایجاد سریع یک فروشگاه برداری جدید را انتخاب کنید و گزینه جدید Amazon OpenSearch Serverless را به عنوان فروشگاه برداری انتخاب کنید.
- در صفحه بعدی، انتخابهای خود را بررسی کنید. برای نهایی کردن تنظیمات، ایجاد را انتخاب کنید.
- در عرض چند دقیقه، کنسول پایگاه دانش تازه ایجاد شده شما را نمایش می دهد.
پیکربندی مصرف کننده AWS Lambda Apache Kafka: فعال کردن دریافت داده
اکنون، تابع Lambda مصرف کننده را طوری پیکربندی کنید که به محض دریافت داده توسط موضوع ورودی Apache Kafka با استفاده از فراخوانی API فعال شود.
- شناسه پایگاه دانش Amazon Bedrock و شناسه منبع داده سفارشی آن را به عنوان متغیرهای محیطی در داخل تابع Lambda پیکربندی کنید. هنگامی که از نوت بوک نمونه استفاده می کنید، نام و شناسه های توابع ارجاع شده به طور خودکار پر می شوند.
غواصی عمیق: آشکار کردن قدرت پایگاههای دانش Amazon Bedrock با اتصالدهندههای سفارشی برای دریافت داده بیدرنگ
همگرایی هوش مصنوعی مولد و جریانهای داده بیدرنگ، فرصتهای بیسابقهای را برای کسبوکارها برای به دست آوردن بینشهای عمیقتر، خودکارسازی فرآیندهای حیاتی و ارائه تجربیات شخصیشده باز میکند. پایگاههای دانش Amazon Bedrock، همراه با اتصالدهندههای سفارشی، در خط مقدم این انقلاب قرار دارند و سازمانها را قادر میسازند تا به طور یکپارچه دادههای جریانی را از منابع متنوع مانند Apache Kafka در برنامههای مجهز به هوش مصنوعی خود ادغام کنند.
این قابلیت از محدودیتهای روشهای دریافت داده سنتی فراتر میرود، که اغلب شامل مراحل پیچیده آمادهسازی، تبدیل و همگامسازی است. با اتصالدهندههای سفارشی، دادهها میتوانند مستقیماً در زمان واقعی در پایگاه دانش دریافت شوند، تاخیر را از بین ببرند و مدلهای هوش مصنوعی را قادر سازند تا به طور پویا به شرایط در حال تغییر واکنش نشان دهند.
موارد استفاده در سراسر صنایع
مزایای این رویکرد دوربرد است و برای طیف گستردهای از صنایع قابل اجرا است.
- خدمات مالی: بانکها و شرکتهای سرمایهگذاری میتوانند از دادههای بازار بیدرنگ و جریانهای تراکنش مشتری برای شناسایی تقلب، شخصیسازی توصیههای سرمایهگذاری و خودکارسازی استراتژیهای معاملاتی استفاده کنند. سیستمی را تصور کنید که توسط هوش مصنوعی تغذیه میشود و تراکنشهای کارت اعتباری را در زمان واقعی تجزیه و تحلیل میکند، فعالیت مشکوک را علامتگذاری میکند و از خریدهای متقلبانه قبل از وقوع آنها جلوگیری میکند.
- خردهفروشی: کسبوکارهای تجارت الکترونیک میتوانند دادههای کلیک و فیدهای رسانههای اجتماعی را تجزیه و تحلیل کنند تا رفتار مشتری را درک کنند، توصیههای محصول را شخصیسازی کنند و استراتژیهای قیمتگذاری را بهینهسازی کنند. این امکان تنظیمات پویا برای کمپینهای بازاریابی و مدیریت موجودی بر اساس تقاضای بیدرنگ را فراهم میکند.
- تولید: تولیدکنندگان میتوانند از دادههای حسگر IoT از تجهیزات کارخانه برای پیشبینی نیازهای نگهداری، بهینهسازی فرآیندهای تولید و بهبود کیفیت محصول استفاده کنند. به عنوان مثال، یک سیستم هوش مصنوعی میتواند دادههای ارتعاش از یک ماشین را تجزیه و تحلیل کند تا خرابیهای احتمالی را قبل از اینکه منجر به خرابی پرهزینه شود، شناسایی کند.
- مراقبتهای بهداشتی: بیمارستانها میتوانند جریانهای داده بیمار را تجزیه و تحلیل کنند تا علائم اولیه بیماری را تشخیص دهند، برنامههای درمانی را شخصیسازی کنند و نتایج بیمار را بهبود بخشند. نظارت بیدرنگ علائم حیاتی میتواند کارکنان پزشکی را از تغییرات بحرانی در وضعیت بیمار آگاه کند و امکان مداخله سریعتر و بهبود مراقبت را فراهم کند.
مزایای کلیدی: فراتر از داده بیدرنگ
مزایای استفاده از پایگاههای دانش Amazon Bedrock با اتصالدهندههای سفارشی فراتر از صرفاً دریافت دادهها در زمان واقعی است.
- کاهش تأخیر: با از بین بردن نیاز به ذخیرهسازی میانی و فرآیندهای همگامسازی، سازمانها میتوانند به طور قابل توجهی زمان لازم برای در دسترس قرار دادن دادهها برای مدلهای هوش مصنوعی را کاهش دهند. این منجر به زمان پاسخگویی سریعتر و برنامههای پویا تر میشود.
- کاهش هزینههای عملیاتی: اتصالدهندههای سفارشی با از بین بردن نیاز به مدیریت و نگهداری خطوط لوله داده پیچیده، هزینههای عملیاتی را کاهش میدهند. این امر منابع ارزشمندی را آزاد میکند که میتوان در سایر زمینههای کسبوکار سرمایهگذاری کرد.
- بهبود کیفیت داده: با دریافت دادهها مستقیماً از منبع، سازمانها میتوانند اطمینان حاصل کنند که مدلهای هوش مصنوعی آنها با دقیقترین و بهروزترین اطلاعات کار میکنند. این منجر به بینشهای بهتر و نتایج قابل اعتمادتر میشود.
- افزایش انعطافپذیری: اتصالدهندههای سفارشی به سازمانها اجازه میدهند تا به طیف گستردهای از منابع داده متصل شوند، صرف نظر از قالب یا مکان آنها. این انعطافپذیری را برای استفاده از تمام داراییهای داده خود، صرف نظر از محل ذخیره آنها، فراهم میکند.
- توسعه سادهشده: پایگاههای دانش Amazon Bedrock با انتزاع پیچیدگیهای دریافت و مدیریت دادهها، تجربه توسعه سادهشدهای را ارائه میدهند. این به توسعهدهندگان اجازه میدهد تا بر ساخت برنامههای هوش مصنوعی که ارزش تجاری واقعی ارائه میدهند، تمرکز کنند.
غواصی عمیقتر: اتصالدهندههای سفارشی زیر کاپوت
برای قدردانی کامل از قدرت اتصالدهندههای سفارشی، مهم است که نحوه کار آنها را درک کنید. یک اتصالدهنده سفارشی اساساً یک قطعه کد است که به پایگاههای دانش Amazon Bedrock اجازه میدهد تا به یک منبع داده خاص متصل شوند. این کد مسئول استخراج دادهها از منبع، تبدیل آن به قالبی که با پایگاه دانش سازگار باشد و دریافت آن در سیستم است.
- یکپارچهسازی API: اتصالدهندههای سفارشی معمولاً از طریق API با منابع داده تعامل دارند. این APIها راهی استاندارد برای دسترسی به دادهها و انجام عملیات ارائه میدهند.
- تبدیل داده: تبدیل داده یک گام حیاتی در این فرآیند است. اتصالدهندههای سفارشی اغلب نیاز دارند تا دادهها را از قالب بومی خود به قالبی که با پایگاه دانش سازگار است، تبدیل کنند. این ممکن است شامل تبدیل انواع داده، پاکسازی دادهها و غنیسازی دادهها با اطلاعات اضافی باشد.
- دریافت جریانی: کلید دریافت داده بیدرنگ، توانایی جریان مداوم دادهها است. اتصالدهندههای سفارشی اغلب از APIهای جریانی برای دریافت دادهها در حین تولید استفاده میکنند و امکان بهروزرسانی تقریباً بیدرنگ پایگاه دانش را فراهم میکنند.
- امنیت: امنیت یک نگرانی اساسی هنگام اتصال به منابع داده است. اتصالدهندههای سفارشی باید با در نظر گرفتن امنیت طراحی شوند و اطمینان حاصل کنند که دادهها هم در حین انتقال و هم در حالت استراحت محافظت میشوند.
نتیجهگیری: پذیرش آینده هوش مصنوعی با داده بیدرنگ
پایگاههای دانش Amazon Bedrock با اتصالدهندههای سفارشی نشان دهنده پیشرفت قابل توجهی در زمینه هوش مصنوعی است. این فناوری با توانمندسازی سازمانها برای ادغام یکپارچه جریانهای داده بیدرنگ در برنامههای هوش مصنوعی خود، ثروت جدیدی از فرصتها را برای نوآوری و رشد کسبوکار باز میکند. با ادامه تکامل هوش مصنوعی، توانایی استفاده از دادههای بیدرنگ به طور فزایندهای حیاتی خواهد شد. پایگاههای دانش Amazon Bedrock به عنوان یک عامل کلیدی در این روند قرار گرفتهاند و سازمانها را قادر میسازند تا راهحلهای هوش مصنوعی بسازند که پویاتر، پاسخگوتر و هوشمندتر از همیشه هستند.