امروزه، در چشمانداز فناوری که به سرعت در حال تحول است، مدلهای زبانی بزرگ (LLM) به عنوان ابزارهای قدرتمند برای پردازش زبان طبیعی ظهور کردهاند. با این حال، اتکای آنها به دادههای آموزشی ایستا، توانایی آنها را برای انطباق با سناریوهای دنیای واقعی محدود میکند. از آنجا که صنایع به طور فزایندهای خواستار راهحلهای هوش مصنوعی هستند که قادر به تصمیمگیری آگاهانه باشند، ادغام ابزارها و APIهای خارجی از اهمیت بالایی برخوردار شده است. دقت در استفاده از این ابزارها برای افزایش قابلیتهای تصمیمگیری و کارایی عملیاتی عوامل خودمختار بسیار مهم است و در نهایت راه را برای توسعه گردشهای کاری پیچیده باز میکند.
این مقاله به جنبههای فنی فراخوانی ابزار با استفاده از مدلهای Amazon Nova از طریق Amazon Bedrock میپردازد. علاوه بر این، روشهای مختلفی برای سفارشیسازی این مدلها برای دستیابی به دقت بیشتر در استفاده از ابزار را بررسی میکند.
گسترش قابلیتهای LLM با استفاده از ابزار
LLMها در طیف گستردهای از وظایف زبان طبیعی مهارت قابل توجهی از خود نشان دادهاند. با این حال، پتانسیل واقعی آنها از طریق ادغام یکپارچه با ابزارهای خارجی مانند APIها و چارچوبهای محاسباتی باز میشود. این ابزارها LLMها را قادر میسازند تا به دادههای بیدرنگ دسترسی داشته باشند، محاسبات خاص دامنه را انجام دهند و اطلاعات دقیق را بازیابی کنند، در نتیجه قابلیت اطمینان و تطبیقپذیری آنها را افزایش میدهند.
ادغام یک API آب و هوا را در نظر بگیرید، که LLMها را قادر میسازد تا پیشبینیهای دقیق و به روز آب و هوا را ارائه دهند. به طور مشابه، یک API ویکیپدیا میتواند LLMها را به مخزن وسیعی از اطلاعات مجهز کند و به آنها امکان میدهد تا با دقت بیشتری به پرسشهای پیچیده پاسخ دهند. در زمینههای علمی، ابزارهایی مانند ماشینحسابها و موتورهای نمادین میتوانند به LLMها کمک کنند تا بر نارساییهای عددی غلبه کنند و آنها را برای محاسبات پیچیده قابل اعتمادتر کنند.
با ادغام یکپارچه با این ابزارها، LLMها به سیستمهای قوی و آگاه از دامنه تبدیل میشوند که قادر به انجام وظایف پویا و تخصصی با کاربرد در دنیای واقعی هستند.
مدلهای Amazon Nova و Amazon Bedrock
مدلهای Amazon Nova که در AWS re:Invent در دسامبر 2024 معرفی شدند، برای ارائه ارزش استثنایی قیمت و عملکرد طراحی شدهاند. این مدلها در عین حفظ مقرون به صرفه بودن، عملکرد پیشرفتهای را در معیارهای کلیدی درک متن ارائه میدهند. این سری شامل سه نوع است:
- Micro: یک مدل فقط متنی که برای استفاده در لبه بهینه شده است و عملکرد فوقالعاده کارآمدی را ارائه میدهد.
- Lite: یک مدل چندوجهی که تعادلی بین تطبیقپذیری و عملکرد ایجاد میکند.
- Pro: یک مدل چندوجهی با کارایی بالا که برای مقابله با وظایف پیچیده طراحی شده است.
مدلهای Amazon Nova میتوانند برای طیف گستردهای از وظایف، از جمله تولید و توسعه گردشهای کاری agentic استفاده شوند. این مدلها از طریق فرآیندی به نام فراخوانی ابزار، قابلیت تعامل با ابزارها یا خدمات خارجی را دارند. این قابلیت از طریق کنسول Amazon Bedrock و APIهایی مانند Converse و Invoke قابل دسترسی است.
علاوه بر استفاده از مدلهای از پیش آموزشدیده، توسعهدهندگان این امکان را دارند که این مدلها را با دادههای چندوجهی (Pro و Lite) یا دادههای متنی (Pro، Lite و Micro) به طور دقیق تنظیم کنند. این انعطافپذیری توسعهدهندگان را قادر میسازد تا به سطوح مورد نظر از دقت، تأخیر و مقرون به صرفه بودن دست یابند. علاوه بر این، توسعهدهندگان میتوانند از کنسول Amazon Bedrock و APIها برای انجام تنظیم دقیق خودکار و تقطیر مدلهای بزرگتر به مدلهای کوچکتر استفاده کنند.
بررسی اجمالی راه حل
این راه حل شامل تهیه یک مجموعه داده سفارشی است که به طور خاص برای استفاده از ابزار طراحی شده است. سپس این مجموعه داده برای ارزیابی عملکرد مدلهای Amazon Nova از طریق Amazon Bedrock، با استفاده از APIهای Converse و Invoke استفاده میشود. متعاقباً، مدلهای AmazonNova Micro و Amazon Nova Lite با استفاده از مجموعه داده آماده شده از طریق Amazon Bedrock به طور دقیق تنظیم میشوند. پس از اتمام فرآیند تنظیم دقیق، این مدلهای سفارشیسازی شده از طریق توان عملیاتی تهیه شده ارزیابی میشوند.
ابزارها
استفاده از ابزار در LLMها شامل دو عملیات اساسی است: انتخاب ابزار و استخراج یا تولید آرگومان. به عنوان مثال، ابزاری را در نظر بگیرید که برای بازیابی اطلاعات آب و هوا برای یک مکان خاص طراحی شده است. هنگامی که با پرسشی مانند ‘هوا در لندن در حال حاضر چگونه است؟’ روبرو میشوید، LLM ابزارهای موجود خود را ارزیابی میکند تا مشخص کند که آیا ابزار مناسبی وجود دارد یا خیر. اگر ابزار مناسبی شناسایی شود، مدل آن را انتخاب میکند و آرگومانهای لازم - در این مورد، ‘لندن’ - را برای ساختن فراخوانی ابزار استخراج میکند.
هر ابزار به طور دقیق با یک مشخصات رسمی تعریف میشود که عملکرد مورد نظر، آرگومانهای اجباری و اختیاری و انواع دادههای مرتبط را مشخص میکند. این تعاریف دقیق که به آنها tool config گفته میشود، اطمینان حاصل میکنند که فراخوانیهای ابزار به درستی اجرا میشوند و تجزیه آرگومانها با الزامات عملیاتی ابزار مطابقت دارد. با رعایت این الزام، مجموعه داده مورد استفاده در این مثال هشت ابزار متمایز را تعریف میکند که هر کدام دارای آرگومانها و پیکربندیهای خاص خود هستند که همگی در قالب JSON ساختار یافتهاند. هشت ابزار تعریف شده به شرح زیر است:
- weather_api_call: یک ابزار سفارشی طراحی شده برای بازیابی اطلاعات آب و هوا.
- stat_pull: یک ابزار سفارشی برای شناسایی آمار.
- text_to_sql: یک ابزار سفارشی برای تبدیل متن به پرس و جوهای SQL.
- terminal: ابزاری برای اجرای اسکریپتها در یک محیط ترمینال.
- wikipedia: یک ابزار API ویکیپدیا برای جستجو در صفحات ویکیپدیا.
- duckduckgo_results_json: یک ابزار جستجوی اینترنتی که از DuckDuckGo برای انجام جستجوها استفاده میکند.
- youtube_search: یک ابزار جستجوی API یوتیوب برای جستجوی فهرستهای ویدیو.
- pubmed_search: یک ابزار جستجوی PubMed برای جستجوی چکیدههای PubMed.
مجموعه داده
مجموعه داده مورد استفاده در این راه حل یک مجموعه داده فراخوانی ابزار مصنوعی است که با کمک یک مدل پایه (FM) از Amazon Bedrock ایجاد شده و متعاقباً به صورت دستی اعتبارسنجی و تنظیم شده است. این مجموعه داده برای مجموعه هشت ابزار که قبلاً مورد بحث قرار گرفت ایجاد شد، با هدف تولید مجموعهای متنوع از سؤالات و فراخوانیهای ابزار که مدل دیگری را قادر میسازد از این مثالها یاد بگیرد و به فراخوانیهای ابزار دیده نشده تعمیم دهد.
هر ورودی در مجموعه داده به عنوان یک شیء JSON ساختار یافته است، حاوی جفتهای کلید-مقدار که سؤال (پرسش زبان طبیعی کاربر برای مدل)، ابزار حقیقت زمین مورد نیاز برای پاسخ به پرسش کاربر، آرگومانهای آن (فرهنگی حاوی پارامترهای مورد نیاز برای اجرای ابزار) و محدودیتهای اضافی مانند order_matters: boolean
را تعریف میکند، که نشان میدهد آیا ترتیب آرگومانها حیاتی است یا خیر، و arg_pattern: optional
، یک عبارت منظم (regex) برای اعتبارسنجی یا قالببندی آرگومان. این برچسبهای حقیقت زمین برای نظارت بر آموزش مدلهای از پیش آموزشدیده Amazon Nova استفاده میشوند و آنها را برای استفاده از ابزار تطبیق میدهند. این فرآیند که به عنوان supervised fine-tuning شناخته میشود، در بخشهای زیر بیشتر مورد بررسی قرار میگیرد.
مجموعه آموزشی شامل 560 سؤال است، در حالی که مجموعه آزمایشی شامل 120 سؤال است. مجموعه آزمایشی به گونهای ساختار یافته است که شامل 15 سؤال در هر دسته ابزار باشد و در مجموع 120 سؤال باشد.
آمادهسازی مجموعه داده برای Amazon Nova
برای استفاده مؤثر از این مجموعه داده با مدلهای Amazon Nova، لازم است دادهها را مطابق با یک الگوی گفتگوی خاص قالببندی کنید. فراخوانی ابزار بومی شامل یک لایه ترجمه است که ورودیها را قبل از ارسال آنها به مدل به فرمت مناسب قالببندی میکند. در این راه حل، یک رویکرد استفاده از ابزار DIY اتخاذ شده است که از یک الگوی اعلان سفارشی استفاده میکند. به طور خاص، اعلان سیستم، پیام کاربر تعبیه شده با پیکربندی ابزار و برچسبهای حقیقت زمین باید به عنوان پیام دستیار اضافه شوند.
بارگذاری مجموعه داده در Amazon S3
این مرحله برای فعال کردن دسترسی Amazon Bedrock به دادههای آموزشی در طول فرآیند تنظیم دقیق ضروری است. مجموعه داده را میتوان از طریق کنسول Amazon Simple Storage Service (Amazon S3) یا به صورت برنامهنویسی بارگذاری کرد.
فراخوانی ابزار با مدلهای پایه از طریق Amazon Bedrock API
با ایجاد و قالببندی مجموعه داده استفاده از ابزار مطابق با نیاز، میتوان از آن برای آزمایش مدلهای Amazon Nova استفاده کرد. از هر دو APIهای Converse و Invoke میتوان برای استفاده از ابزار در Amazon Bedrock استفاده کرد. API Converse مکالمات پویا و آگاه از زمینه را فعال میکند و به مدلها اجازه میدهد تا در گفتگوهای چند نوبتی شرکت کنند، در حالی که API Invoke به کاربران اجازه میدهد تا مدلهای زیربنایی را در Amazon Bedrock فراخوانی و با آنها تعامل داشته باشند.
برای استفاده از API Converse، پیامها، اعلان سیستم (در صورت وجود) و پیکربندی ابزار مستقیماً به API ارسال میشوند.
برای تجزیه ابزار و آرگومانها از پاسخ LLM، سؤال: ‘سلام، دمای هوا در پاریس در حال حاضر چقدر است؟’ را در نظر بگیرید. خروجی تجزیه میشود تا ابزار و آرگومانهای مورد نیاز برای پاسخ به سؤال شناسایی شوند.
تنظیم دقیق مدلهای Amazon Nova برای استفاده پیشرفته از ابزار
تنظیم دقیق یک گام مهم در تطبیق مدلهای زبانی از پیش آموزشدیده مانند Amazon Nova با وظایف خاص است. با آموزش مدل بر روی مجموعهای از دادهها که متناسب با برنامه مورد نظر است، مدل میتواند یاد بگیرد که وظیفه را با دقت و کارایی بیشتری انجام دهد. در زمینه استفاده از ابزار، تنظیم دقیق میتواند به طور قابل توجهی توانایی مدل را در انتخاب ابزار مناسب و استخراج آرگومانهای صحیح بهبود بخشد.
فرآیند تنظیم دقیق شامل تنظیم پارامترهای داخلی مدل برای به حداقل رساندن تفاوت بین پیشبینیهای آن و برچسبهای حقیقت زمین در مجموعه داده آموزشی است. این کار معمولاً از طریق یک فرآیند تکراری انجام میشود، جایی که مدل به طور مکرر در معرض دادههای آموزشی قرار میگیرد و پارامترهای آن بر اساس خطاهای مشاهده شده تنظیم میشوند.
آمادهسازی مجموعه داده تنظیم دقیق
مجموعه داده تنظیم دقیق باید با دقت انتخاب شود تا انواع سؤالات و فراخوانیهای ابزاری را که انتظار میرود مدل در سناریوهای دنیای واقعی با آنها سروکار داشته باشد، منعکس کند. مجموعه داده باید شامل طیف متنوعی از مثالها باشد که دستههای مختلف ابزار و الگوهای آرگومان را پوشش میدهد.
هر مثال در مجموعه داده باید شامل یک سؤال، ابزار مربوطه برای فراخوانی و آرگومانهای مورد نیاز برای اجرای ابزار باشد. آرگومانها باید به صورت ساختاریافته، معمولاً به عنوان یک شیء JSON قالببندی شوند.
فرآیند تنظیم دقیق
فرآیند تنظیم دقیق را میتوان با استفاده از کنسول Amazon Bedrock یا APIها انجام داد. این فرآیند شامل تعیین مدل برای تنظیم دقیق، مجموعه داده تنظیم دقیق و پارامترهای آموزشی مورد نظر است.
پارامترهای آموزشی جنبههای مختلف فرآیند تنظیم دقیق را کنترل میکنند، مانند نرخ یادگیری، اندازه دسته و تعداد دورهها. نرخ یادگیری величинهی تنظیمات پارامترها را در طول هر تکرار تعیین میکند. اندازه دسته تعداد مثالهای پردازش شده در هر تکرار را تعیین میکند. تعداد دورهها تعداد دفعاتی را تعیین میکند که مدل در معرض کل مجموعه داده آموزشی قرار میگیرد.
ارزیابی مدل تنظیم دقیق
پس از اتمام فرآیند تنظیم دقیق، ارزیابی عملکرد مدل تنظیم دقیق ضروری است. این کار را میتوان با آزمایش مدل بر روی یک مجموعه داده آزمایشی جداگانه که در طول فرآیند تنظیم دقیق استفاده نشده است، انجام داد.
مجموعه داده آزمایشی باید نماینده انواع سؤالات و فراخوانیهای ابزاری باشد که انتظار میرود مدل در سناریوهای دنیای واقعی با آنها سروکار داشته باشد. عملکرد مدل را میتوان با اندازهگیری معیارهایی مانند دقت، صحت، فراخوانی و امتیاز F1 ارزیابی کرد.
مزایای سفارشیسازی مدلهای Amazon Nova برای استفاده از ابزار
سفارشیسازی مدلهای Amazon Nova برای استفاده از ابزار مزایای متعددی دارد:
- بهبود دقت: تنظیم دقیق مدل بر روی یک مجموعه داده خاص وظیفه میتواند به طور قابل توجهی دقت انتخاب ابزار و استخراج آرگومان را بهبود بخشد.
- افزایش کارایی: مدلهای تنظیم دقیق اغلب میتوانند وظایف استفاده از ابزار را کارآمدتر از مدلهای از پیش آموزشدیده انجام دهند.
- بهبود انطباقپذیری: تنظیم دقیق به مدل اجازه میدهد تا با دامنهها و موارد استفاده خاص سازگار شود.
- کاهش هزینهها: در برخی موارد، تنظیم دقیق میتواند منابع محاسباتی مورد نیاز برای انجام وظایف استفاده از ابزار را کاهش دهد.
نتیجهگیری
سفارشیسازی مدلهای Amazon Nova برای استفاده از ابزار یک تکنیک ارزشمند برای افزایش عملکرد و انطباقپذیری LLMها است. با تنظیم دقیق مدل بر روی یک مجموعه داده خاص وظیفه، توسعهدهندگان میتوانند به طور قابل توجهی دقت، کارایی و انطباقپذیری برنامههای استفاده از ابزار را بهبود بخشند. از آنجا که صنایع به طور فزایندهای خواستار راهحلهای هوش مصنوعی هستند که قادر به تصمیمگیری آگاهانه باشند، سفارشیسازی LLMها برای استفاده از ابزار اهمیت فزایندهای پیدا خواهد کرد.