پیشینه
قانون هوش مصنوعی اتحادیه اروپا (مقررات (EU) 2024/1689، یا ‘قانون هوش مصنوعی’) تعهدات خاصی را بر ارائهدهندگان مدلهای هوش مصنوعی با کاربرد عمومی (‘GPAI’) تحمیل میکند. این مدلها، از جمله مدلهای خانواده GPT، Llama و Gemini، باید از الزاماتی مانند مستندسازی جامع و ایجاد سیاستی برای اطمینان از انطباق با قانون کپیرایت اتحادیه اروپا پیروی کنند.
برای تسهیل پایبندی به این مقررات، قانون هوش مصنوعی توسعه آییننامههای رفتاری متناسب با مدلهای GPAI را پیشبینی میکند. به دنبال دعوت دفتر هوش مصنوعی، کارشناسان و ذینفعان مختلف، چهار گروه کاری را برای تهیه پیشنویس اولیه آییننامه تشکیل دادند. تأیید این آییننامه توسط کمیسیون اتحادیه اروپا به آن ‘اعتبار عمومی’ در سراسر اتحادیه اروپا میدهد. پذیرش آییننامه رفتاری GPAI تأیید شده، به شرکتها وسیلهای برای نشان دادن انطباق فعالانه ارائه میدهد و به طور بالقوه نظارت قانونی و مجازاتهای مرتبط را کاهش میدهد.
دفتر هوش مصنوعی اخیراً سومین پیشنویس آییننامه رفتاری (‘پیشنویس سوم’) تولید شده توسط این گروههای کاری را منتشر کرد. این پیشنویس چندین حوزه کلیدی را در بر میگیرد:
- تعهدات
- شفافیت
- کپیرایت
- ایمنی و امنیت
نسخه نهایی این آییننامه رفتاری قرار است در 2 مه 2025 منتشر شود.
این سند به جزئیات مهم در بخش کپیرایت پیشنویس سوم میپردازد. یک تغییر قابل توجه نسبت به پیشنویس دوم (‘پیشنویس دوم’)، رویکرد ساده و مختصر پیشنویس سوم است. یک تغییر کلیدی این است که پیشنویس سوم عموماً حکم میکند که تلاشهای انطباق باید متناسب با اندازه و قابلیتهای ارائهدهنده باشد، برخلاف پیشنویس دوم.
این برای چه کسانی مرتبط است؟
آییننامه رفتاری در درجه اول ارائهدهندگان مدلهای GPAI را هدف قرار میدهد. این مدلها با عمومیت قابل توجه و توانایی آنها در اجرای ماهرانه طیف گستردهای از وظایف متمایز مشخص میشوند. این شامل ارائهدهندگان مدلهای زبان بزرگ شناخته شده مانند GPT (OpenAI)، Llama (Meta)، Gemini (Google) و Mistral (Mistral AI) میشود. با این حال، ارائهدهندگان مدلهای کوچکتر نیز ممکن است تحت پوشش آن قرار گیرند، مشروط بر اینکه مدلهای آنها بتوانند برای طیف متنوعی از وظایف مورد استفاده قرار گیرند. علاوه بر این، کسبوکارهایی که مدلها را برای کاربردهای خاص خود تنظیم میکنند نیز ممکن است به عنوان ارائهدهندگان مدل GPAI طبقهبندی شوند.
‘ارائهدهندگان پاییندستی’، یا کسبوکارهایی که مدلهای GPAI را در سیستمهای هوش مصنوعی خود ادغام میکنند، نیز باید با آییننامه رفتاری آشنا شوند. این آییننامه قرار است به یک استاندارد شبهرسمی برای مدلهای GPAI تبدیل شود و انتظارات توسعهدهندگان سیستمهای هوش مصنوعی را در مورد قابلیتهای مدل GPAI تعریف کند. این درک میتواند در طول مذاکرات قرارداد با ارائهدهندگان مدل GPAI بسیار مهم باشد.
مفاهیم کلیدی آییننامه رفتاری در مورد قانون کپیرایت
ارائهدهندگان مدلهای GPAI موظفند سیاستی را ایجاد کنند که انطباق با قانون کپیرایت اتحادیه اروپا را تضمین کند (ماده 53 (1) (c) قانون هوش مصنوعی). با توجه به تازگی این الزام، راهنمایی عملی در مورد ساختار و محتوای چنین سیاستی وجود نداشته است. هدف آییننامه رفتاری رفع این شکاف است.
آییننامه رفتاری حکم میکند که ارائهدهندگان اقدامات زیر را اجرا کنند:
سیاست کپیرایت
ارائهدهندگانی که آییننامه رفتاری را امضا میکنند (‘امضاکنندگان’) ملزم به تدوین، حفظ و اجرای سیاست کپیرایتی هستند که با قانون کپیرایت اتحادیه اروپا همسو باشد. این الزام مستقیماً از قانون هوش مصنوعی گرفته شده است. امضاکنندگان همچنین باید اطمینان حاصل کنند که سازمانهایشان به این سیاست کپیرایت پایبند هستند.
یک انحراف قابل توجه از پیشنویس دوم این است که پیشنویس سوم دیگر انتشار سیاست کپیرایت را الزامی نمیکند. امضاکنندگان صرفاً به انجام این کار تشویق میشوند. این الزام کاهش یافته منطقی است، زیرا خود قانون هوش مصنوعی، ارائهدهندگان مدل را مجبور به انتشار سیاستهای کپیرایت خود نمیکند.
خزش وب محتوای دارای کپیرایت
امضاکنندگان عموماً مجاز به استفاده از خزندههای وب برای اهداف استخراج متن و داده (‘TDM’) برای جمعآوری دادههای آموزشی برای مدلهای GPAI خود هستند. با این حال، آنها باید اطمینان حاصل کنند که این خزندهها به فناوریهای طراحی شده برای محدود کردن دسترسی به مواد دارای کپیرایت، مانند دیوارهای پرداخت، احترام میگذارند.
علاوه بر این، امضاکنندگان موظفند ‘دامنههای دزدی’ را که منابع آنلاینی هستند که عمدتاً در توزیع مواد ناقض کپیرایت فعالیت میکنند، حذف کنند.
خزش وب و شناسایی و پیروی از انصرافهای TDM
امضاکنندگان باید اطمینان حاصل کنند که خزندههای وب، انصرافهای TDM اعلام شده توسط دارندگان حق را شناسایی و به آنها احترام میگذارند. در حالی که قانون کپیرایت اتحادیه اروپا به طور کلی TDM را مجاز میداند، دارندگان حق، حق انصراف را حفظ میکنند. برای محتوای وب، این انصراف باید قابل خواندن توسط ماشین باشد. پیشنویس سوم الزامات مربوط به خزندههای وب را تشریح میکند و مشخص میکند که آنها باید پروتکل robots.txt که به طور گسترده پذیرفته شده است را شناسایی و از آن پیروی کنند. علاوه بر این، خزندههای وب باید به سایر انصرافهای TDM قابل خواندن توسط ماشین، مانند فرادادههای تعیین شده به عنوان استاندارد صنعتی یا راهحلهای رایج مورد استفاده توسط دارندگان حق، پایبند باشند.
امضاکنندگان ملزم به برداشتن گامهای منطقی برای اطلاعرسانی به دارندگان حق در مورد خزندههای وب در حال استفاده و نحوه برخورد این خزندهها با دستورالعملهای robots.txt هستند. این اطلاعات میتواند از طریق کانالهای مختلف، مانند فید وب، منتشر شود. قابل ذکر است، پیشنویس سوم دیگر شامل تعهدی برای انتشار این اطلاعات نیست.
شناسایی و پیروی از انصراف TDM برای محتوای غیر خزیده شده در وب
ارائهدهندگان مدل GPAI ممکن است به جای انجام خزش وب، مجموعه دادهها را از اشخاص ثالث نیز به دست آورند. در حالی که پیشنویس دوم، بررسی دقیق کپیرایت مجموعه دادههای شخص ثالث را الزامی میکرد، پیشنویس سوم نیازمند تلاشهای منطقی برای کسب اطلاعات در مورد اینکه آیا خزندههای وب مورد استفاده برای جمعآوری اطلاعات از پروتکلهای robots.txt پیروی کردهاند یا خیر، است.
کاهش ریسک برای جلوگیری از تولید خروجی ناقض کپیرایت
یک خطر قابل توجه مرتبط با استفاده از هوش مصنوعی، پتانسیل هوش مصنوعی برای تولید خروجی است که کپیرایت را نقض میکند. این میتواند شامل کپی کردن کد یا تصاویر موجود در اینترنت باشد که توسط کپیرایت محافظت میشوند.
امضاکنندگان ملزم به انجام تلاشهای منطقی برای کاهش این خطر هستند. این نشاندهنده رویکردی ملایمتر در مقایسه با پیشنویس دوم است که اقداماتی را برای جلوگیری از ‘بیشبرازش’ تجویز میکرد. پیشنویس سوم موضعی بیطرفانهتر از نظر فناوری اتخاذ میکند و بر تلاشهای منطقی تأکید میکند.
علاوه بر این، امضاکنندگان باید بندی را در شرایط و ضوابط خود (یا اسناد مشابه) برای ارائهدهندگان سیستمهای هوش مصنوعی پاییندستی بگنجانند که استفاده از مدل GPAI آنها را به گونهای که کپیرایت را نقض کند، ممنوع میکند.
تعیین نقطه تماس
امضاکنندگان ملزم به ارائه یک نقطه تماس برای دارندگان حق هستند. آنها همچنین باید مکانیزمی ایجاد کنند که به دارندگان حق اجازه دهد شکایات مربوط به نقض کپیرایت را ارسال کنند.
طبق پیشنویس سوم، امضاکنندگان این اختیار را دارند که از پردازش شکایاتی که بیاساس یا بیش از حد تلقی میشوند، خودداری کنند.
بررسی عمیقتر: بررسی دقیقتر مقررات کپیرایت
پیشنویس سوم، در حالی که به ظاهر ساده شده است، تفاوتهای ظریف و تغییراتی در تأکید ایجاد میکند که نیاز به بررسی دقیقتری دارد. بیایید هر بخش را بیشتر تجزیه کنیم:
سیاست کپیرایت: تغییر از انتشار به تشویق
الزام اولیه برای انتشار سیاست کپیرایت، که در پیشنویس دوم وجود داشت، نگرانیهایی را در مورد معایب رقابتی بالقوه و افشای اطلاعات حساس ایجاد کرد. حرکت پیشنویس سوم به تشویق انتشار، به جای الزام به آن، این نگرانیها را تصدیق میکند. این تغییر به ارائهدهندگان اجازه میدهد تا حدی از محرمانگی را در مورد استراتژیهای انطباق داخلی خود حفظ کنند، در حالی که همچنان شفافیت را ترویج میکنند. با این حال، جنبه ‘تشویق’ همچنان فشار ظریفی را بر ارائهدهندگان وارد میکند تا در مورد سیاستهای خود باز باشند، که به طور بالقوه منجر به استاندارد واقعی انتشار در طول زمان میشود.
خزش وب: ایجاد تعادل بین کسب داده و احترام به کپیرایت
مجوز صریح برای خزش وب، همراه با الزام به احترام به محدودیتهای دسترسی مانند دیوارهای پرداخت، نشاندهنده یک عمل متعادلکننده ظریف است. قانون هوش مصنوعی اهمیت دادهها را برای آموزش مدلهای هوش مصنوعی تشخیص میدهد، اما همچنین بر لزوم احترام به حقوق تولیدکنندگان محتوا تأکید میکند. حذف ‘دامنههای دزدی’ یک افزودنی مهم است که به طور صریح منابعی را که فعالانه در نقض کپیرایت شرکت میکنند، هدف قرار میدهد. این بند این اصل را تقویت میکند که توسعه هوش مصنوعی نباید بر پایه فعالیتهای غیرقانونی بنا شود.
انصرافهای TDM: ویژگی فنی انطباق
تأکید پیشنویس سوم بر پروتکل robots.txt و سایر مکانیزمهای انصراف قابل خواندن توسط ماشین، جنبههای فنی انطباق را برجسته میکند. این ویژگی، وضوح را هم برای ارائهدهندگان GPAI و هم برای دارندگان حق فراهم میکند. برای ارائهدهندگان، مراحل مشخصی را که باید برای اطمینان از اینکه خزندههایشان به درخواستهای انصراف احترام میگذارند، انجام دهند، مشخص میکند. برای دارندگان حق، روشن میکند که چگونه میتوانند به طور مؤثر ترجیحات خود را در مورد TDM اعلام کنند. گنجاندن فرادادههای ‘استاندارد صنعتی’ و راهحلهای ‘به طور گسترده پذیرفته شده’ تصدیق میکند که چشمانداز مکانیزمهای انصراف در حال تکامل است و انعطافپذیری ضروری است.
محتوای غیر خزیده شده در وب: تغییر مسئولیت و بررسی دقیق
تغییر از ‘بررسی دقیق کپیرایت’ به ‘تلاشهای منطقی برای کسب اطلاعات’ در مورد مجموعه دادههای شخص ثالث، نشاندهنده تغییر ظریف اما قابل توجهی در مسئولیت است. در حالی که پیشنویس دوم بار سنگینتری را بر ارائهدهندگان GPAI برای بررسی فعال وضعیت کپیرایت مجموعه دادهها قرار میداد، پیشنویس سوم بر تأیید اینکه آیا فرآیند جمعآوری داده (توسط شخص ثالث) به robots.txt احترام گذاشته است یا خیر، تمرکز میکند. این به طور ضمنی تصدیق میکند که ارائهدهندگان GPAI ممکن است همیشه کنترل مستقیمی بر شیوههای کسب داده اشخاص ثالث نداشته باشند، اما همچنان مسئولیت دارند در مورد انطباق سؤال کنند.
کاهش خروجی ناقض: از ‘بیشبرازش’ به ‘تلاشهای منطقی’
دور شدن از اصطلاح ‘بیشبرازش’ یک تغییر خوشایند است. ‘بیشبرازش’، یک اصطلاح فنی در یادگیری ماشین، به مدلی اشاره دارد که در دادههای آموزشی عملکرد خوبی دارد اما در دادههای جدید عملکرد ضعیفی دارد. در حالی که بیشبرازش میتواند به نقض کپیرایت کمک کند (به عنوان مثال، با به خاطر سپردن و بازتولید مطالب دارای کپیرایت)، تنها علت آن نیست. تمرکز گستردهتر پیشنویس سوم بر ‘تلاشهای منطقی برای کاهش ریسک’، طیف وسیعتری از سناریوهای نقض بالقوه را در بر میگیرد و امکان انعطافپذیری بیشتر در اجرا را فراهم میکند. این تغییر همچنین تصدیق میکند که پیشگیری کامل از نقض کپیرایت ممکن است غیرقابل دستیابی باشد و رویکرد مبتنی بر ریسک عملیتر است.
نقطه تماس و مکانیزم شکایت: سادهسازی فرآیند
الزام به یک نقطه تماس تعیین شده و یک مکانیزم شکایت، به دارندگان حق راه روشنی برای رسیدگی به نقضهای احتمالی کپیرایت ارائه میدهد. توانایی امضاکنندگان برای رد شکایات ‘بیاساس یا بیش از حد’، یک افزودنی عملی است که از غرق شدن سیستم توسط ادعاهای بیاهمیت جلوگیری میکند. این بند کمک میکند تا اطمینان حاصل شود که مکانیزم شکایت به عنوان یک ابزار عملی و کارآمد برای رسیدگی به نگرانیهای قانونی کپیرایت باقی میماند.
پیامدهای گستردهتر و ملاحظات آتی
پیشنویس سوم آییننامه رفتاری GPAI گامی مهم در جهت عملیاتی کردن مقررات کپیرایت قانون هوش مصنوعی است. این راهنمایی و وضوح بسیار مورد نیاز را برای ارائهدهندگان GPAI فراهم میکند، در حالی که همچنین به دنبال حمایت از حقوق تولیدکنندگان محتوا است. با این حال، چندین پیامد گستردهتر و ملاحظات آتی باقی میماند:
استاندارد ‘تلاشهای منطقی’: استفاده مکرر از عبارت ‘تلاشهای منطقی’ درجهای از ذهنیت را معرفی میکند. آنچه ‘منطقی’ تلقی میشود احتمالاً در معرض تفسیر قرار خواهد گرفت و ممکن است در طول زمان از طریق چالشهای قانونی و بهترین شیوههای صنعت تکامل یابد. این ابهام میتواند منجر به عدم اطمینان برای ارائهدهندگان شود، اما همچنین امکان انعطافپذیری و سازگاری با زمینههای مختلف را فراهم میکند.
نقش ارائهدهندگان پاییندستی: در حالی که این آییننامه عمدتاً ارائهدهندگان GPAI را هدف قرار میدهد، ارائهدهندگان پاییندستی علاقه زیادی به درک مقررات آن دارند. این آییننامه انتظاراتی را برای کیفیت و انطباق مدلهای GPAI تعیین میکند، که میتواند مذاکرات قرارداد و ارزیابیهای ریسک را آگاه کند. ارائهدهندگان پاییندستی نیز ممکن است با فشار غیرمستقیم برای اطمینان از اینکه استفاده آنها از مدلهای GPAI با اصول آییننامه همسو است، مواجه شوند.
تکامل فناوری: سرعت سریع توسعه هوش مصنوعی به این معنی است که آییننامه رفتاری باید یک سند زنده باشد. تکنیکهای جدیدی برای کسب داده، آموزش مدل و تولید خروجی ممکن است پدیدار شوند که نیاز به بهروزرسانی مقررات آییننامه دارند. اشاره به فرادادههای ‘استاندارد صنعتی’ و راهحلهای ‘به طور گسترده پذیرفته شده’ این نیاز به سازگاری مداوم را تصدیق میکند.
هماهنگی بینالمللی: قانون هوش مصنوعی اتحادیه اروپا یک قانون پیشگام است، اما در خلاء عمل نمیکند. سایر حوزههای قضایی نیز با چالشهای تنظیم هوش مصنوعی دست و پنجه نرم میکنند. هماهنگی بینالمللی مقررات هوش مصنوعی، از جمله مقررات کپیرایت، برای جلوگیری از پراکندگی و تضمین یک زمین بازی برابر برای توسعهدهندگان هوش مصنوعی بسیار مهم خواهد بود.
تأثیر بر نوآوری: هدف آییننامه رفتاری ایجاد تعادل بین ترویج نوآوری هوش مصنوعی و حمایت از کپیرایت است. با این حال، تأثیر این مقررات بر سرعت و جهت توسعه هوش مصنوعی هنوز مشخص نیست. برخی استدلال میکنند که مقررات بیش از حد سخت میتواند نوآوری را خفه کند، در حالی که برخی دیگر ادعا میکنند که قوانین روشن برای تقویت توسعه مسئولانه هوش مصنوعی ضروری است.
اجرا و نظارت: پایبندی چگونه بررسی خواهد شد؟ اثربخشی کدها تا حد زیادی به مکانیسمهای ایجاد شده برای اجرا و نظارت بستگی دارد.
پیشنویس سوم آییننامه رفتاری GPAI یک سند پیچیده و در حال تکامل با پیامدهای گسترده است. این نشاندهنده یک تلاش قابل توجه برای رسیدگی به چالشهای انطباق با کپیرایت در عصر هوش مصنوعی است، اما همچنین یک کار در حال پیشرفت است. گفتگوی مداوم بین ذینفعان، از جمله ارائهدهندگان GPAI، دارندگان حق، سیاستگذاران و جامعه گستردهتر هوش مصنوعی، برای اطمینان از اینکه این آییننامه به اهداف مورد نظر خود دست مییابد و در مواجهه با تغییرات سریع فناوری مرتبط باقی میماند، ضروری خواهد بود.