پیش‌نویس سوم آیین‌نامه GPAI

پیشینه

قانون هوش مصنوعی اتحادیه اروپا (مقررات (EU) 2024/1689، یا ‘قانون هوش مصنوعی’) تعهدات خاصی را بر ارائه‌دهندگان مدل‌های هوش مصنوعی با کاربرد عمومی (‘GPAI’) تحمیل می‌کند. این مدل‌ها، از جمله مدل‌های خانواده GPT، Llama و Gemini، باید از الزاماتی مانند مستندسازی جامع و ایجاد سیاستی برای اطمینان از انطباق با قانون کپی‌رایت اتحادیه اروپا پیروی کنند.

برای تسهیل پایبندی به این مقررات، قانون هوش مصنوعی توسعه آیین‌نامه‌های رفتاری متناسب با مدل‌های GPAI را پیش‌بینی می‌کند. به دنبال دعوت دفتر هوش مصنوعی، کارشناسان و ذینفعان مختلف، چهار گروه کاری را برای تهیه پیش‌نویس اولیه آیین‌نامه تشکیل دادند. تأیید این آیین‌نامه توسط کمیسیون اتحادیه اروپا به آن ‘اعتبار عمومی’ در سراسر اتحادیه اروپا می‌دهد. پذیرش آیین‌نامه رفتاری GPAI تأیید شده، به شرکت‌ها وسیله‌ای برای نشان دادن انطباق فعالانه ارائه می‌دهد و به طور بالقوه نظارت قانونی و مجازات‌های مرتبط را کاهش می‌دهد.

دفتر هوش مصنوعی اخیراً سومین پیش‌نویس آیین‌نامه رفتاری (‘پیش‌نویس سوم’) تولید شده توسط این گروه‌های کاری را منتشر کرد. این پیش‌نویس چندین حوزه کلیدی را در بر می‌گیرد:

  • تعهدات
  • شفافیت
  • کپی‌رایت
  • ایمنی و امنیت

نسخه نهایی این آیین‌نامه رفتاری قرار است در 2 مه 2025 منتشر شود.

این سند به جزئیات مهم در بخش کپی‌رایت پیش‌نویس سوم می‌پردازد. یک تغییر قابل توجه نسبت به پیش‌نویس دوم (‘پیش‌نویس دوم’)، رویکرد ساده و مختصر پیش‌نویس سوم است. یک تغییر کلیدی این است که پیش‌نویس سوم عموماً حکم می‌کند که تلاش‌های انطباق باید متناسب با اندازه و قابلیت‌های ارائه‌دهنده باشد، برخلاف پیش‌نویس دوم.

این برای چه کسانی مرتبط است؟

آیین‌نامه رفتاری در درجه اول ارائه‌دهندگان مدل‌های GPAI را هدف قرار می‌دهد. این مدل‌ها با عمومیت قابل توجه و توانایی آنها در اجرای ماهرانه طیف گسترده‌ای از وظایف متمایز مشخص می‌شوند. این شامل ارائه‌دهندگان مدل‌های زبان بزرگ شناخته شده مانند GPT (OpenAI)، Llama (Meta)، Gemini (Google) و Mistral (Mistral AI) می‌شود. با این حال، ارائه‌دهندگان مدل‌های کوچکتر نیز ممکن است تحت پوشش آن قرار گیرند، مشروط بر اینکه مدل‌های آنها بتوانند برای طیف متنوعی از وظایف مورد استفاده قرار گیرند. علاوه بر این، کسب‌وکارهایی که مدل‌ها را برای کاربردهای خاص خود تنظیم می‌کنند نیز ممکن است به عنوان ارائه‌دهندگان مدل GPAI طبقه‌بندی شوند.

‘ارائه‌دهندگان پایین‌دستی’، یا کسب‌وکارهایی که مدل‌های GPAI را در سیستم‌های هوش مصنوعی خود ادغام می‌کنند، نیز باید با آیین‌نامه رفتاری آشنا شوند. این آیین‌نامه قرار است به یک استاندارد شبه‌رسمی برای مدل‌های GPAI تبدیل شود و انتظارات توسعه‌دهندگان سیستم‌های هوش مصنوعی را در مورد قابلیت‌های مدل GPAI تعریف کند. این درک می‌تواند در طول مذاکرات قرارداد با ارائه‌دهندگان مدل GPAI بسیار مهم باشد.

مفاهیم کلیدی آیین‌نامه رفتاری در مورد قانون کپی‌رایت

ارائه‌دهندگان مدل‌های GPAI موظفند سیاستی را ایجاد کنند که انطباق با قانون کپی‌رایت اتحادیه اروپا را تضمین کند (ماده 53 (1) (c) قانون هوش مصنوعی). با توجه به تازگی این الزام، راهنمایی عملی در مورد ساختار و محتوای چنین سیاستی وجود نداشته است. هدف آیین‌نامه رفتاری رفع این شکاف است.

آیین‌نامه رفتاری حکم می‌کند که ارائه‌دهندگان اقدامات زیر را اجرا کنند:

سیاست کپی‌رایت

ارائه‌دهندگانی که آیین‌نامه رفتاری را امضا می‌کنند (‘امضاکنندگان’) ملزم به تدوین، حفظ و اجرای سیاست کپی‌رایتی هستند که با قانون کپی‌رایت اتحادیه اروپا همسو باشد. این الزام مستقیماً از قانون هوش مصنوعی گرفته شده است. امضاکنندگان همچنین باید اطمینان حاصل کنند که سازمان‌هایشان به این سیاست کپی‌رایت پایبند هستند.

یک انحراف قابل توجه از پیش‌نویس دوم این است که پیش‌نویس سوم دیگر انتشار سیاست کپی‌رایت را الزامی نمی‌کند. امضاکنندگان صرفاً به انجام این کار تشویق می‌شوند. این الزام کاهش یافته منطقی است، زیرا خود قانون هوش مصنوعی، ارائه‌دهندگان مدل را مجبور به انتشار سیاست‌های کپی‌رایت خود نمی‌کند.

خزش وب محتوای دارای کپی‌رایت

امضاکنندگان عموماً مجاز به استفاده از خزنده‌های وب برای اهداف استخراج متن و داده (‘TDM’) برای جمع‌آوری داده‌های آموزشی برای مدل‌های GPAI خود هستند. با این حال، آنها باید اطمینان حاصل کنند که این خزنده‌ها به فناوری‌های طراحی شده برای محدود کردن دسترسی به مواد دارای کپی‌رایت، مانند دیوارهای پرداخت، احترام می‌گذارند.

علاوه بر این، امضاکنندگان موظفند ‘دامنه‌های دزدی’ را که منابع آنلاینی هستند که عمدتاً در توزیع مواد ناقض کپی‌رایت فعالیت می‌کنند، حذف کنند.

خزش وب و شناسایی و پیروی از انصراف‌های TDM

امضاکنندگان باید اطمینان حاصل کنند که خزنده‌های وب، انصراف‌های TDM اعلام شده توسط دارندگان حق را شناسایی و به آنها احترام می‌گذارند. در حالی که قانون کپی‌رایت اتحادیه اروپا به طور کلی TDM را مجاز می‌داند، دارندگان حق، حق انصراف را حفظ می‌کنند. برای محتوای وب، این انصراف باید قابل خواندن توسط ماشین باشد. پیش‌نویس سوم الزامات مربوط به خزنده‌های وب را تشریح می‌کند و مشخص می‌کند که آنها باید پروتکل robots.txt که به طور گسترده پذیرفته شده است را شناسایی و از آن پیروی کنند. علاوه بر این، خزنده‌های وب باید به سایر انصراف‌های TDM قابل خواندن توسط ماشین، مانند فراداده‌های تعیین شده به عنوان استاندارد صنعتی یا راه‌حل‌های رایج مورد استفاده توسط دارندگان حق، پایبند باشند.

امضاکنندگان ملزم به برداشتن گام‌های منطقی برای اطلاع‌رسانی به دارندگان حق در مورد خزنده‌های وب در حال استفاده و نحوه برخورد این خزنده‌ها با دستورالعمل‌های robots.txt هستند. این اطلاعات می‌تواند از طریق کانال‌های مختلف، مانند فید وب، منتشر شود. قابل ذکر است، پیش‌نویس سوم دیگر شامل تعهدی برای انتشار این اطلاعات نیست.

شناسایی و پیروی از انصراف TDM برای محتوای غیر خزیده شده در وب

ارائه‌دهندگان مدل GPAI ممکن است به جای انجام خزش وب، مجموعه داده‌ها را از اشخاص ثالث نیز به دست آورند. در حالی که پیش‌نویس دوم، بررسی دقیق کپی‌رایت مجموعه داده‌های شخص ثالث را الزامی می‌کرد، پیش‌نویس سوم نیازمند تلاش‌های منطقی برای کسب اطلاعات در مورد اینکه آیا خزنده‌های وب مورد استفاده برای جمع‌آوری اطلاعات از پروتکل‌های robots.txt پیروی کرده‌اند یا خیر، است.

کاهش ریسک برای جلوگیری از تولید خروجی ناقض کپی‌رایت

یک خطر قابل توجه مرتبط با استفاده از هوش مصنوعی، پتانسیل هوش مصنوعی برای تولید خروجی است که کپی‌رایت را نقض می‌کند. این می‌تواند شامل کپی کردن کد یا تصاویر موجود در اینترنت باشد که توسط کپی‌رایت محافظت می‌شوند.

امضاکنندگان ملزم به انجام تلاش‌های منطقی برای کاهش این خطر هستند. این نشان‌دهنده رویکردی ملایم‌تر در مقایسه با پیش‌نویس دوم است که اقداماتی را برای جلوگیری از ‘بیش‌برازش’ تجویز می‌کرد. پیش‌نویس سوم موضعی بی‌طرفانه‌تر از نظر فناوری اتخاذ می‌کند و بر تلاش‌های منطقی تأکید می‌کند.

علاوه بر این، امضاکنندگان باید بندی را در شرایط و ضوابط خود (یا اسناد مشابه) برای ارائه‌دهندگان سیستم‌های هوش مصنوعی پایین‌دستی بگنجانند که استفاده از مدل GPAI آنها را به گونه‌ای که کپی‌رایت را نقض کند، ممنوع می‌کند.

تعیین نقطه تماس

امضاکنندگان ملزم به ارائه یک نقطه تماس برای دارندگان حق هستند. آنها همچنین باید مکانیزمی ایجاد کنند که به دارندگان حق اجازه دهد شکایات مربوط به نقض کپی‌رایت را ارسال کنند.

طبق پیش‌نویس سوم، امضاکنندگان این اختیار را دارند که از پردازش شکایاتی که بی‌اساس یا بیش از حد تلقی می‌شوند، خودداری کنند.

بررسی عمیق‌تر: بررسی دقیق‌تر مقررات کپی‌رایت

پیش‌نویس سوم، در حالی که به ظاهر ساده شده است، تفاوت‌های ظریف و تغییراتی در تأکید ایجاد می‌کند که نیاز به بررسی دقیق‌تری دارد. بیایید هر بخش را بیشتر تجزیه کنیم:

سیاست کپی‌رایت: تغییر از انتشار به تشویق

الزام اولیه برای انتشار سیاست کپی‌رایت، که در پیش‌نویس دوم وجود داشت، نگرانی‌هایی را در مورد معایب رقابتی بالقوه و افشای اطلاعات حساس ایجاد کرد. حرکت پیش‌نویس سوم به تشویق انتشار، به جای الزام به آن، این نگرانی‌ها را تصدیق می‌کند. این تغییر به ارائه‌دهندگان اجازه می‌دهد تا حدی از محرمانگی را در مورد استراتژی‌های انطباق داخلی خود حفظ کنند، در حالی که همچنان شفافیت را ترویج می‌کنند. با این حال، جنبه ‘تشویق’ همچنان فشار ظریفی را بر ارائه‌دهندگان وارد می‌کند تا در مورد سیاست‌های خود باز باشند، که به طور بالقوه منجر به استاندارد واقعی انتشار در طول زمان می‌شود.

خزش وب: ایجاد تعادل بین کسب داده و احترام به کپی‌رایت

مجوز صریح برای خزش وب، همراه با الزام به احترام به محدودیت‌های دسترسی مانند دیوارهای پرداخت، نشان‌دهنده یک عمل متعادل‌کننده ظریف است. قانون هوش مصنوعی اهمیت داده‌ها را برای آموزش مدل‌های هوش مصنوعی تشخیص می‌دهد، اما همچنین بر لزوم احترام به حقوق تولیدکنندگان محتوا تأکید می‌کند. حذف ‘دامنه‌های دزدی’ یک افزودنی مهم است که به طور صریح منابعی را که فعالانه در نقض کپی‌رایت شرکت می‌کنند، هدف قرار می‌دهد. این بند این اصل را تقویت می‌کند که توسعه هوش مصنوعی نباید بر پایه فعالیت‌های غیرقانونی بنا شود.

انصراف‌های TDM: ویژگی فنی انطباق

تأکید پیش‌نویس سوم بر پروتکل robots.txt و سایر مکانیزم‌های انصراف قابل خواندن توسط ماشین، جنبه‌های فنی انطباق را برجسته می‌کند. این ویژگی، وضوح را هم برای ارائه‌دهندگان GPAI و هم برای دارندگان حق فراهم می‌کند. برای ارائه‌دهندگان، مراحل مشخصی را که باید برای اطمینان از اینکه خزنده‌هایشان به درخواست‌های انصراف احترام می‌گذارند، انجام دهند، مشخص می‌کند. برای دارندگان حق، روشن می‌کند که چگونه می‌توانند به طور مؤثر ترجیحات خود را در مورد TDM اعلام کنند. گنجاندن فراداده‌های ‘استاندارد صنعتی’ و راه‌حل‌های ‘به طور گسترده پذیرفته شده’ تصدیق می‌کند که چشم‌انداز مکانیزم‌های انصراف در حال تکامل است و انعطاف‌پذیری ضروری است.

محتوای غیر خزیده شده در وب: تغییر مسئولیت و بررسی دقیق

تغییر از ‘بررسی دقیق کپی‌رایت’ به ‘تلاش‌های منطقی برای کسب اطلاعات’ در مورد مجموعه داده‌های شخص ثالث، نشان‌دهنده تغییر ظریف اما قابل توجهی در مسئولیت است. در حالی که پیش‌نویس دوم بار سنگین‌تری را بر ارائه‌دهندگان GPAI برای بررسی فعال وضعیت کپی‌رایت مجموعه داده‌ها قرار می‌داد، پیش‌نویس سوم بر تأیید اینکه آیا فرآیند جمع‌آوری داده (توسط شخص ثالث) به robots.txt احترام گذاشته است یا خیر، تمرکز می‌کند. این به طور ضمنی تصدیق می‌کند که ارائه‌دهندگان GPAI ممکن است همیشه کنترل مستقیمی بر شیوه‌های کسب داده اشخاص ثالث نداشته باشند، اما همچنان مسئولیت دارند در مورد انطباق سؤال کنند.

کاهش خروجی ناقض: از ‘بیش‌برازش’ به ‘تلاش‌های منطقی’

دور شدن از اصطلاح ‘بیش‌برازش’ یک تغییر خوشایند است. ‘بیش‌برازش’، یک اصطلاح فنی در یادگیری ماشین، به مدلی اشاره دارد که در داده‌های آموزشی عملکرد خوبی دارد اما در داده‌های جدید عملکرد ضعیفی دارد. در حالی که بیش‌برازش می‌تواند به نقض کپی‌رایت کمک کند (به عنوان مثال، با به خاطر سپردن و بازتولید مطالب دارای کپی‌رایت)، تنها علت آن نیست. تمرکز گسترده‌تر پیش‌نویس سوم بر ‘تلاش‌های منطقی برای کاهش ریسک’، طیف وسیع‌تری از سناریوهای نقض بالقوه را در بر می‌گیرد و امکان انعطاف‌پذیری بیشتر در اجرا را فراهم می‌کند. این تغییر همچنین تصدیق می‌کند که پیشگیری کامل از نقض کپی‌رایت ممکن است غیرقابل دستیابی باشد و رویکرد مبتنی بر ریسک عملی‌تر است.

نقطه تماس و مکانیزم شکایت: ساده‌سازی فرآیند

الزام به یک نقطه تماس تعیین شده و یک مکانیزم شکایت، به دارندگان حق راه روشنی برای رسیدگی به نقض‌های احتمالی کپی‌رایت ارائه می‌دهد. توانایی امضاکنندگان برای رد شکایات ‘بی‌اساس یا بیش از حد’، یک افزودنی عملی است که از غرق شدن سیستم توسط ادعاهای بی‌اهمیت جلوگیری می‌کند. این بند کمک می‌کند تا اطمینان حاصل شود که مکانیزم شکایت به عنوان یک ابزار عملی و کارآمد برای رسیدگی به نگرانی‌های قانونی کپی‌رایت باقی می‌ماند.

پیامدهای گسترده‌تر و ملاحظات آتی

پیش‌نویس سوم آیین‌نامه رفتاری GPAI گامی مهم در جهت عملیاتی کردن مقررات کپی‌رایت قانون هوش مصنوعی است. این راهنمایی و وضوح بسیار مورد نیاز را برای ارائه‌دهندگان GPAI فراهم می‌کند، در حالی که همچنین به دنبال حمایت از حقوق تولیدکنندگان محتوا است. با این حال، چندین پیامد گسترده‌تر و ملاحظات آتی باقی می‌ماند:

  • استاندارد ‘تلاش‌های منطقی’: استفاده مکرر از عبارت ‘تلاش‌های منطقی’ درجه‌ای از ذهنیت را معرفی می‌کند. آنچه ‘منطقی’ تلقی می‌شود احتمالاً در معرض تفسیر قرار خواهد گرفت و ممکن است در طول زمان از طریق چالش‌های قانونی و بهترین شیوه‌های صنعت تکامل یابد. این ابهام می‌تواند منجر به عدم اطمینان برای ارائه‌دهندگان شود، اما همچنین امکان انعطاف‌پذیری و سازگاری با زمینه‌های مختلف را فراهم می‌کند.

  • نقش ارائه‌دهندگان پایین‌دستی: در حالی که این آیین‌نامه عمدتاً ارائه‌دهندگان GPAI را هدف قرار می‌دهد، ارائه‌دهندگان پایین‌دستی علاقه زیادی به درک مقررات آن دارند. این آیین‌نامه انتظاراتی را برای کیفیت و انطباق مدل‌های GPAI تعیین می‌کند، که می‌تواند مذاکرات قرارداد و ارزیابی‌های ریسک را آگاه کند. ارائه‌دهندگان پایین‌دستی نیز ممکن است با فشار غیرمستقیم برای اطمینان از اینکه استفاده آنها از مدل‌های GPAI با اصول آیین‌نامه همسو است، مواجه شوند.

  • تکامل فناوری: سرعت سریع توسعه هوش مصنوعی به این معنی است که آیین‌نامه رفتاری باید یک سند زنده باشد. تکنیک‌های جدیدی برای کسب داده، آموزش مدل و تولید خروجی ممکن است پدیدار شوند که نیاز به به‌روزرسانی مقررات آیین‌نامه دارند. اشاره به فراداده‌های ‘استاندارد صنعتی’ و راه‌حل‌های ‘به طور گسترده پذیرفته شده’ این نیاز به سازگاری مداوم را تصدیق می‌کند.

  • هماهنگی بین‌المللی: قانون هوش مصنوعی اتحادیه اروپا یک قانون پیشگام است، اما در خلاء عمل نمی‌کند. سایر حوزه‌های قضایی نیز با چالش‌های تنظیم هوش مصنوعی دست و پنجه نرم می‌کنند. هماهنگی بین‌المللی مقررات هوش مصنوعی، از جمله مقررات کپی‌رایت، برای جلوگیری از پراکندگی و تضمین یک زمین بازی برابر برای توسعه‌دهندگان هوش مصنوعی بسیار مهم خواهد بود.

  • تأثیر بر نوآوری: هدف آیین‌نامه رفتاری ایجاد تعادل بین ترویج نوآوری هوش مصنوعی و حمایت از کپی‌رایت است. با این حال، تأثیر این مقررات بر سرعت و جهت توسعه هوش مصنوعی هنوز مشخص نیست. برخی استدلال می‌کنند که مقررات بیش از حد سخت می‌تواند نوآوری را خفه کند، در حالی که برخی دیگر ادعا می‌کنند که قوانین روشن برای تقویت توسعه مسئولانه هوش مصنوعی ضروری است.

  • اجرا و نظارت: پایبندی چگونه بررسی خواهد شد؟ اثربخشی کدها تا حد زیادی به مکانیسم‌های ایجاد شده برای اجرا و نظارت بستگی دارد.

پیش‌نویس سوم آیین‌نامه رفتاری GPAI یک سند پیچیده و در حال تکامل با پیامدهای گسترده است. این نشان‌دهنده یک تلاش قابل توجه برای رسیدگی به چالش‌های انطباق با کپی‌رایت در عصر هوش مصنوعی است، اما همچنین یک کار در حال پیشرفت است. گفتگوی مداوم بین ذینفعان، از جمله ارائه‌دهندگان GPAI، دارندگان حق، سیاست‌گذاران و جامعه گسترده‌تر هوش مصنوعی، برای اطمینان از اینکه این آیین‌نامه به اهداف مورد نظر خود دست می‌یابد و در مواجهه با تغییرات سریع فناوری مرتبط باقی می‌ماند، ضروری خواهد بود.