بهبود کارایی ابزار با سفارشی‌سازی مدل‌های Amazon Nova

امروزه، در چشم‌انداز فناوری که به سرعت در حال تحول است، مدل‌های زبانی بزرگ (LLM) به عنوان ابزارهای قدرتمند برای پردازش زبان طبیعی ظهور کرده‌اند. با این حال، اتکای آنها به داده‌های آموزشی ایستا، توانایی آنها را برای انطباق با سناریوهای دنیای واقعی محدود می‌کند. از آنجا که صنایع به طور فزاینده‌ای خواستار راه‌حل‌های هوش مصنوعی هستند که قادر به تصمیم‌گیری آگاهانه باشند، ادغام ابزارها و APIهای خارجی از اهمیت بالایی برخوردار شده است. دقت در استفاده از این ابزارها برای افزایش قابلیت‌های تصمیم‌گیری و کارایی عملیاتی عوامل خودمختار بسیار مهم است و در نهایت راه را برای توسعه گردش‌های کاری پیچیده باز می‌کند.

این مقاله به جنبه‌های فنی فراخوانی ابزار با استفاده از مدل‌های Amazon Nova از طریق Amazon Bedrock می‌پردازد. علاوه بر این، روش‌های مختلفی برای سفارشی‌سازی این مدل‌ها برای دستیابی به دقت بیشتر در استفاده از ابزار را بررسی می‌کند.

گسترش قابلیت‌های LLM با استفاده از ابزار

LLMها در طیف گسترده‌ای از وظایف زبان طبیعی مهارت قابل توجهی از خود نشان داده‌اند. با این حال، پتانسیل واقعی آنها از طریق ادغام یکپارچه با ابزارهای خارجی مانند APIها و چارچوب‌های محاسباتی باز می‌شود. این ابزارها LLMها را قادر می‌سازند تا به داده‌های بی‌درنگ دسترسی داشته باشند، محاسبات خاص دامنه را انجام دهند و اطلاعات دقیق را بازیابی کنند، در نتیجه قابلیت اطمینان و تطبیق‌پذیری آنها را افزایش می‌دهند.

ادغام یک API آب و هوا را در نظر بگیرید، که LLMها را قادر می‌سازد تا پیش‌بینی‌های دقیق و به روز آب و هوا را ارائه دهند. به طور مشابه، یک API ویکی‌پدیا می‌تواند LLMها را به مخزن وسیعی از اطلاعات مجهز کند و به آنها امکان می‌دهد تا با دقت بیشتری به پرسش‌های پیچیده پاسخ دهند. در زمینه‌های علمی، ابزارهایی مانند ماشین‌حساب‌ها و موتورهای نمادین می‌توانند به LLMها کمک کنند تا بر نارسایی‌های عددی غلبه کنند و آنها را برای محاسبات پیچیده قابل اعتمادتر کنند.

با ادغام یکپارچه با این ابزارها، LLMها به سیستم‌های قوی و آگاه از دامنه تبدیل می‌شوند که قادر به انجام وظایف پویا و تخصصی با کاربرد در دنیای واقعی هستند.

مدل‌های Amazon Nova و Amazon Bedrock

مدل‌های Amazon Nova که در AWS re:Invent در دسامبر 2024 معرفی شدند، برای ارائه ارزش استثنایی قیمت و عملکرد طراحی شده‌اند. این مدل‌ها در عین حفظ مقرون به صرفه بودن، عملکرد پیشرفته‌ای را در معیارهای کلیدی درک متن ارائه می‌دهند. این سری شامل سه نوع است:

  • Micro: یک مدل فقط متنی که برای استفاده در لبه بهینه شده است و عملکرد فوق‌العاده کارآمدی را ارائه می‌دهد.
  • Lite: یک مدل چندوجهی که تعادلی بین تطبیق‌پذیری و عملکرد ایجاد می‌کند.
  • Pro: یک مدل چندوجهی با کارایی بالا که برای مقابله با وظایف پیچیده طراحی شده است.

مدل‌های Amazon Nova می‌توانند برای طیف گسترده‌ای از وظایف، از جمله تولید و توسعه گردش‌های کاری agentic استفاده شوند. این مدل‌ها از طریق فرآیندی به نام فراخوانی ابزار، قابلیت تعامل با ابزارها یا خدمات خارجی را دارند. این قابلیت از طریق کنسول Amazon Bedrock و APIهایی مانند Converse و Invoke قابل دسترسی است.

علاوه بر استفاده از مدل‌های از پیش آموزش‌دیده، توسعه‌دهندگان این امکان را دارند که این مدل‌ها را با داده‌های چندوجهی (Pro و Lite) یا داده‌های متنی (Pro، Lite و Micro) به طور دقیق تنظیم کنند. این انعطاف‌پذیری توسعه‌دهندگان را قادر می‌سازد تا به سطوح مورد نظر از دقت، تأخیر و مقرون به صرفه بودن دست یابند. علاوه بر این، توسعه‌دهندگان می‌توانند از کنسول Amazon Bedrock و APIها برای انجام تنظیم دقیق خودکار و تقطیر مدل‌های بزرگتر به مدل‌های کوچکتر استفاده کنند.

بررسی اجمالی راه حل

این راه حل شامل تهیه یک مجموعه داده سفارشی است که به طور خاص برای استفاده از ابزار طراحی شده است. سپس این مجموعه داده برای ارزیابی عملکرد مدل‌های Amazon Nova از طریق Amazon Bedrock، با استفاده از APIهای Converse و Invoke استفاده می‌شود. متعاقباً، مدل‌های AmazonNova Micro و Amazon Nova Lite با استفاده از مجموعه داده آماده شده از طریق Amazon Bedrock به طور دقیق تنظیم می‌شوند. پس از اتمام فرآیند تنظیم دقیق، این مدل‌های سفارشی‌سازی شده از طریق توان عملیاتی تهیه شده ارزیابی می‌شوند.

ابزارها

استفاده از ابزار در LLMها شامل دو عملیات اساسی است: انتخاب ابزار و استخراج یا تولید آرگومان. به عنوان مثال، ابزاری را در نظر بگیرید که برای بازیابی اطلاعات آب و هوا برای یک مکان خاص طراحی شده است. هنگامی که با پرسشی مانند ‘هوا در لندن در حال حاضر چگونه است؟’ روبرو می‌شوید، LLM ابزارهای موجود خود را ارزیابی می‌کند تا مشخص کند که آیا ابزار مناسبی وجود دارد یا خیر. اگر ابزار مناسبی شناسایی شود، مدل آن را انتخاب می‌کند و آرگومان‌های لازم - در این مورد، ‘لندن’ - را برای ساختن فراخوانی ابزار استخراج می‌کند.

هر ابزار به طور دقیق با یک مشخصات رسمی تعریف می‌شود که عملکرد مورد نظر، آرگومان‌های اجباری و اختیاری و انواع داده‌های مرتبط را مشخص می‌کند. این تعاریف دقیق که به آنها tool config گفته می‌شود، اطمینان حاصل می‌کنند که فراخوانی‌های ابزار به درستی اجرا می‌شوند و تجزیه آرگومان‌ها با الزامات عملیاتی ابزار مطابقت دارد. با رعایت این الزام، مجموعه داده مورد استفاده در این مثال هشت ابزار متمایز را تعریف می‌کند که هر کدام دارای آرگومان‌ها و پیکربندی‌های خاص خود هستند که همگی در قالب JSON ساختار یافته‌اند. هشت ابزار تعریف شده به شرح زیر است:

  • weather_api_call: یک ابزار سفارشی طراحی شده برای بازیابی اطلاعات آب و هوا.
  • stat_pull: یک ابزار سفارشی برای شناسایی آمار.
  • text_to_sql: یک ابزار سفارشی برای تبدیل متن به پرس و جوهای SQL.
  • terminal: ابزاری برای اجرای اسکریپت‌ها در یک محیط ترمینال.
  • wikipedia: یک ابزار API ویکی‌پدیا برای جستجو در صفحات ویکی‌پدیا.
  • duckduckgo_results_json: یک ابزار جستجوی اینترنتی که از DuckDuckGo برای انجام جستجوها استفاده می‌کند.
  • youtube_search: یک ابزار جستجوی API یوتیوب برای جستجوی فهرست‌های ویدیو.
  • pubmed_search: یک ابزار جستجوی PubMed برای جستجوی چکیده‌های PubMed.

مجموعه داده

مجموعه داده مورد استفاده در این راه حل یک مجموعه داده فراخوانی ابزار مصنوعی است که با کمک یک مدل پایه (FM) از Amazon Bedrock ایجاد شده و متعاقباً به صورت دستی اعتبارسنجی و تنظیم شده است. این مجموعه داده برای مجموعه هشت ابزار که قبلاً مورد بحث قرار گرفت ایجاد شد، با هدف تولید مجموعه‌ای متنوع از سؤالات و فراخوانی‌های ابزار که مدل دیگری را قادر می‌سازد از این مثال‌ها یاد بگیرد و به فراخوانی‌های ابزار دیده نشده تعمیم دهد.

هر ورودی در مجموعه داده به عنوان یک شیء JSON ساختار یافته است، حاوی جفت‌های کلید-مقدار که سؤال (پرسش زبان طبیعی کاربر برای مدل)، ابزار حقیقت زمین مورد نیاز برای پاسخ به پرسش کاربر، آرگومان‌های آن (فرهنگی حاوی پارامترهای مورد نیاز برای اجرای ابزار) و محدودیت‌های اضافی مانند order_matters: boolean را تعریف می‌کند، که نشان می‌دهد آیا ترتیب آرگومان‌ها حیاتی است یا خیر، و arg_pattern: optional، یک عبارت منظم (regex) برای اعتبارسنجی یا قالب‌بندی آرگومان. این برچسب‌های حقیقت زمین برای نظارت بر آموزش مدل‌های از پیش آموزش‌دیده Amazon Nova استفاده می‌شوند و آنها را برای استفاده از ابزار تطبیق می‌دهند. این فرآیند که به عنوان supervised fine-tuning شناخته می‌شود، در بخش‌های زیر بیشتر مورد بررسی قرار می‌گیرد.

مجموعه آموزشی شامل 560 سؤال است، در حالی که مجموعه آزمایشی شامل 120 سؤال است. مجموعه آزمایشی به گونه‌ای ساختار یافته است که شامل 15 سؤال در هر دسته ابزار باشد و در مجموع 120 سؤال باشد.

آماده‌سازی مجموعه داده برای Amazon Nova

برای استفاده مؤثر از این مجموعه داده با مدل‌های Amazon Nova، لازم است داده‌ها را مطابق با یک الگوی گفتگوی خاص قالب‌بندی کنید. فراخوانی ابزار بومی شامل یک لایه ترجمه است که ورودی‌ها را قبل از ارسال آنها به مدل به فرمت مناسب قالب‌بندی می‌کند. در این راه حل، یک رویکرد استفاده از ابزار DIY اتخاذ شده است که از یک الگوی اعلان سفارشی استفاده می‌کند. به طور خاص، اعلان سیستم، پیام کاربر تعبیه شده با پیکربندی ابزار و برچسب‌های حقیقت زمین باید به عنوان پیام دستیار اضافه شوند.

بارگذاری مجموعه داده در Amazon S3

این مرحله برای فعال کردن دسترسی Amazon Bedrock به داده‌های آموزشی در طول فرآیند تنظیم دقیق ضروری است. مجموعه داده را می‌توان از طریق کنسول Amazon Simple Storage Service (Amazon S3) یا به صورت برنامه‌نویسی بارگذاری کرد.

فراخوانی ابزار با مدل‌های پایه از طریق Amazon Bedrock API

با ایجاد و قالب‌بندی مجموعه داده استفاده از ابزار مطابق با نیاز، می‌توان از آن برای آزمایش مدل‌های Amazon Nova استفاده کرد. از هر دو APIهای Converse و Invoke می‌توان برای استفاده از ابزار در Amazon Bedrock استفاده کرد. API Converse مکالمات پویا و آگاه از زمینه را فعال می‌کند و به مدل‌ها اجازه می‌دهد تا در گفتگوهای چند نوبتی شرکت کنند، در حالی که API Invoke به کاربران اجازه می‌دهد تا مدل‌های زیربنایی را در Amazon Bedrock فراخوانی و با آنها تعامل داشته باشند.

برای استفاده از API Converse، پیام‌ها، اعلان سیستم (در صورت وجود) و پیکربندی ابزار مستقیماً به API ارسال می‌شوند.

برای تجزیه ابزار و آرگومان‌ها از پاسخ LLM، سؤال: ‘سلام، دمای هوا در پاریس در حال حاضر چقدر است؟’ را در نظر بگیرید. خروجی تجزیه می‌شود تا ابزار و آرگومان‌های مورد نیاز برای پاسخ به سؤال شناسایی شوند.

تنظیم دقیق مدل‌های Amazon Nova برای استفاده پیشرفته از ابزار

تنظیم دقیق یک گام مهم در تطبیق مدل‌های زبانی از پیش آموزش‌دیده مانند Amazon Nova با وظایف خاص است. با آموزش مدل بر روی مجموعه‌ای از داده‌ها که متناسب با برنامه مورد نظر است، مدل می‌تواند یاد بگیرد که وظیفه را با دقت و کارایی بیشتری انجام دهد. در زمینه استفاده از ابزار، تنظیم دقیق می‌تواند به طور قابل توجهی توانایی مدل را در انتخاب ابزار مناسب و استخراج آرگومان‌های صحیح بهبود بخشد.

فرآیند تنظیم دقیق شامل تنظیم پارامترهای داخلی مدل برای به حداقل رساندن تفاوت بین پیش‌بینی‌های آن و برچسب‌های حقیقت زمین در مجموعه داده آموزشی است. این کار معمولاً از طریق یک فرآیند تکراری انجام می‌شود، جایی که مدل به طور مکرر در معرض داده‌های آموزشی قرار می‌گیرد و پارامترهای آن بر اساس خطاهای مشاهده شده تنظیم می‌شوند.

آماده‌سازی مجموعه داده تنظیم دقیق

مجموعه داده تنظیم دقیق باید با دقت انتخاب شود تا انواع سؤالات و فراخوانی‌های ابزاری را که انتظار می‌رود مدل در سناریوهای دنیای واقعی با آنها سروکار داشته باشد، منعکس کند. مجموعه داده باید شامل طیف متنوعی از مثال‌ها باشد که دسته‌های مختلف ابزار و الگوهای آرگومان را پوشش می‌دهد.

هر مثال در مجموعه داده باید شامل یک سؤال، ابزار مربوطه برای فراخوانی و آرگومان‌های مورد نیاز برای اجرای ابزار باشد. آرگومان‌ها باید به صورت ساختاریافته، معمولاً به عنوان یک شیء JSON قالب‌بندی شوند.

فرآیند تنظیم دقیق

فرآیند تنظیم دقیق را می‌توان با استفاده از کنسول Amazon Bedrock یا APIها انجام داد. این فرآیند شامل تعیین مدل برای تنظیم دقیق، مجموعه داده تنظیم دقیق و پارامترهای آموزشی مورد نظر است.

پارامترهای آموزشی جنبه‌های مختلف فرآیند تنظیم دقیق را کنترل می‌کنند، مانند نرخ یادگیری، اندازه دسته و تعداد دوره‌ها. نرخ یادگیری величинه‌ی تنظیمات پارامترها را در طول هر تکرار تعیین می‌کند. اندازه دسته تعداد مثال‌های پردازش شده در هر تکرار را تعیین می‌کند. تعداد دوره‌ها تعداد دفعاتی را تعیین می‌کند که مدل در معرض کل مجموعه داده آموزشی قرار می‌گیرد.

ارزیابی مدل تنظیم دقیق

پس از اتمام فرآیند تنظیم دقیق، ارزیابی عملکرد مدل تنظیم دقیق ضروری است. این کار را می‌توان با آزمایش مدل بر روی یک مجموعه داده آزمایشی جداگانه که در طول فرآیند تنظیم دقیق استفاده نشده است، انجام داد.

مجموعه داده آزمایشی باید نماینده انواع سؤالات و فراخوانی‌های ابزاری باشد که انتظار می‌رود مدل در سناریوهای دنیای واقعی با آنها سروکار داشته باشد. عملکرد مدل را می‌توان با اندازه‌گیری معیارهایی مانند دقت، صحت، فراخوانی و امتیاز F1 ارزیابی کرد.

مزایای سفارشی‌سازی مدل‌های Amazon Nova برای استفاده از ابزار

سفارشی‌سازی مدل‌های Amazon Nova برای استفاده از ابزار مزایای متعددی دارد:

  • بهبود دقت: تنظیم دقیق مدل بر روی یک مجموعه داده خاص وظیفه می‌تواند به طور قابل توجهی دقت انتخاب ابزار و استخراج آرگومان را بهبود بخشد.
  • افزایش کارایی: مدل‌های تنظیم دقیق اغلب می‌توانند وظایف استفاده از ابزار را کارآمدتر از مدل‌های از پیش آموزش‌دیده انجام دهند.
  • بهبود انطباق‌پذیری: تنظیم دقیق به مدل اجازه می‌دهد تا با دامنه‌ها و موارد استفاده خاص سازگار شود.
  • کاهش هزینه‌ها: در برخی موارد، تنظیم دقیق می‌تواند منابع محاسباتی مورد نیاز برای انجام وظایف استفاده از ابزار را کاهش دهد.

نتیجه‌گیری

سفارشی‌سازی مدل‌های Amazon Nova برای استفاده از ابزار یک تکنیک ارزشمند برای افزایش عملکرد و انطباق‌پذیری LLMها است. با تنظیم دقیق مدل بر روی یک مجموعه داده خاص وظیفه، توسعه‌دهندگان می‌توانند به طور قابل توجهی دقت، کارایی و انطباق‌پذیری برنامه‌های استفاده از ابزار را بهبود بخشند. از آنجا که صنایع به طور فزاینده‌ای خواستار راه‌حل‌های هوش مصنوعی هستند که قادر به تصمیم‌گیری آگاهانه باشند، سفارشی‌سازی LLMها برای استفاده از ابزار اهمیت فزاینده‌ای پیدا خواهد کرد.