آموزش هوش مصنوعی: آری یا نه؟

ظهور استثنائات حق تکثیر برای آموزش هوش مصنوعی

در سال‌های اخیر، تعداد فزاینده‌ای از کشورها استثناهایی را در قوانین حق تکثیر خود ایجاد کرده‌اند تا به‌طور خاص، استخراج متن و داده توسط شرکت‌های هوش مصنوعی را تسهیل کنند. هدف از این استثناها، تقویت نوآوری در زمینه هوش مصنوعی با اجازه دادن به LLM ها برای آموزش بر روی مجموعه داده‌های وسیع بدون نیاز به اجازه صریح از هر دارنده حق تکثیر است.

به عنوان مثال، سنگاپور قانون حق تکثیر خود را در سال 2021 اصلاح کرد تا چنین استثنایی ایجاد کند. این اقدام راه را برای توسعه دهندگان هوش مصنوعی در این کشور هموار کرد تا به آثار دارای حق تکثیر دسترسی پیدا کرده و آنها را برای آموزش مدل‌های خود پردازش کنند. اکنون، سایر حوزه‌های قضایی در آسیا، از جمله هنگ کنگ و اندونزی، در حال بررسی تغییرات قانونی مشابه هستند.

دیدگاه چین: یک پرونده نقض برجسته

چین، به عنوان یک بازیگر اصلی در چشم انداز جهانی هوش مصنوعی، همچنین با پیچیدگی‌های حق تکثیر در عصر LLM ها دست و پنجه نرم می‌کند. یک پرونده برجسته، iQiyi در مقابل MiniMax، این موضوع را به کانون توجه تبدیل کرده است.

در این پرونده، iQiyi، یک پلتفرم پخش ویدئوی برجسته، از MiniMax، یک شرکت هوش مصنوعی، به دلیل استفاده غیرمجاز از مواد ویدئویی دارای حق تکثیر خود برای آموزش مدل‌های هوش مصنوعی شکایت کرد. این دادخواست یک پیشرفت مهم را به عنوان اولین پرونده نقض LLM ویدئویی هوش مصنوعی چین نشان می‌دهد و نگرانی‌های فزاینده در مورد استفاده غیرمجاز از محتوای دارای حق تکثیر در توسعه فناوری‌های هوش مصنوعی را برجسته می‌کند.

صنعت نشر هند شیوه‌های آموزش LLM را به چالش می‌کشد

این بحث فراتر از آسیا گسترش می‌یابد. در هند، چندین انتشارات علیه توسعه دهندگان LLM اقدام قانونی کرده‌اند و ادعا می‌کنند که این مدل‌ها بر روی داده‌های استخراج شده‌ای آموزش داده می‌شوند که شامل آثار دارای حق تکثیر آنها می‌شود. این موارد تنش بین تمایل به پیشرفت قابلیت‌های هوش مصنوعی و نیاز به حفاظت از حقوق مالکیت معنوی خالقان را برجسته می‌کند.

فراتر از بلعیدن ساده: ظرافت‌های آموزش LLM

چالش‌های ناشی از آموزش LLM بسیار پیچیده‌تر از صرفاً عمل بلعیدن و پردازش داده‌ها هستند. موارد هندی و مفاد محدود تعریف شده در قانون سنگاپور، ماهیت چندوجهی این موضوع را برجسته می‌کند.

بسیاری از صاحبان مالکیت معنوی صریحاً دسترسی و استفاده از آثار دارای حق تکثیر خود را محدود می‌کنند، در حالی که دیگران با چنین دسترسی و تکثیری موافقت نمی‌کنند. تعداد قابل توجهی از خالقان به مدل‌های صدور مجوز به عنوان بخش اصلی کسب و کار خود متکی هستند و استفاده غیرمجاز از آثار آنها برای آموزش هوش مصنوعی مستقیماً این مدل‌ها را تضعیف می‌کند.

علاوه بر این، این واقعیت که بخش عمده‌ای از آموزش می‌تواند در ابر (cloud) رخ دهد، سؤالات قضایی پیچیده‌ای را ایجاد می‌کند. تعیین اینکه کدام قوانین در هنگام پردازش داده‌ها در مرزهای بین‌المللی اعمال می‌شوند، لایه دیگری از پیچیدگی را به یک چشم‌انداز حقوقی پیچیده اضافه می‌کند.

در نهایت، مسئله اصلی حول این محور می‌چرخد که LLM ها چگونه داده‌های آموزشی خود را ایمن می‌کنند و آیا و چگونه باید به دارندگان حق تکثیر برای استفاده از آن غرامت بپردازند.

سازمان‌های حق تکثیر ایالات متحده به استثنائات قانونی اعتراض می‌کنند

این بحث به کشورهای منفرد محدود نمی‌شود. بلکه به عرصه بین‌المللی نیز سرایت کرده است. ائتلافی متشکل از نزدیک به 50 انجمن تجاری و گروه‌های صنعتی در ایالات متحده، معروف به Digital Creators Coalition، اعتراضات شدیدی را نسبت به ایجاد استثنائات قانونی برای آموزش LLM در قوانین حق تکثیر بدون در نظر گرفتن مجوز یا غرامت ابراز کرده است.

این سازمان‌ها نظرات خود را به نماینده تجاری ایالات متحده (USTR) ارائه کرده‌اند و از این آژانس خواسته‌اند تا به این موضوع در بررسی سالانه ویژه 301 خود، که شیوه‌های حفاظت و اجرای مالکیت معنوی در سراسر جهان را بررسی می‌کند، رسیدگی کند. این ائتلاف فهرستی از کشورهایی را که چنین استثناهایی را اجرا کرده‌اند یا پیشنهاد می‌کنند، ارائه کرده است و مقیاس جهانی این نگرانی را برجسته می‌کند.

بحث ایالات متحده: موضع OpenAI و تناقضات درونی

حتی در داخل ایالات متحده، این بحث همچنان بسیار زنده است. OpenAI، شرکت پشت ChatGPT محبوب، با ارسال نامه‌ای سرگشاده به دفتر علوم و فناوری کاخ سفید، صدای خود را به این بحث اضافه کرده است.

در این نامه، OpenAI از حق استخراج داده‌ها از اینترنت تحت اصول استفاده منصفانه دفاع می‌کند و عملاً برای دسترسی گسترده به مواد دارای حق تکثیر برای اهداف آموزشی استدلال می‌کند. با این حال، به طور متناقض، OpenAI همچنین پیشنهاد می‌کند که توسعه دهندگان LLM خارجی باید از انجام همین کار، احتمالاً از طریق استفاده از سیاست‌های صادراتی ایالات متحده، منع شوند. این موضع یک تناقض درونی را آشکار می‌کند، که از دسترسی آزاد برای خود حمایت می‌کند و در عین حال به دنبال محدود کردن دسترسی دیگران است.

مسیر پیش رو: یک بحث ادامه دار

با نزدیک شدن به سال 2025، بحث در مورد حق تکثیر و آموزش هوش مصنوعی مطمئناً تشدید خواهد شد. با ادامه ظهور LLM های جدید در سراسر جهان، نیاز به یک چارچوب قانونی روشن و متعادل به طور فزاینده‌ای ضروری می‌شود.

چشم انداز حقوقی فعلی مجموعه‌ای از قوانین ملی است، برخی با استثنائات صریح برای آموزش هوش مصنوعی و برخی دیگر فاقد چنین مقرراتی هستند. این ناسازگاری عدم اطمینان را هم برای توسعه دهندگان هوش مصنوعی و هم برای دارندگان حق تکثیر ایجاد می‌کند، مانع نوآوری می‌شود و به طور بالقوه حقوق خالقان را تضعیف می‌کند.

ملاحظات کلیدی برای یک چارچوب متعادل:

  • شفافیت و پاسخگویی: توسعه دهندگان LLM باید در مورد منابع داده مورد استفاده برای آموزش مدل‌های خود شفاف باشند و در قبال هرگونه استفاده غیرمجاز از مواد دارای حق تکثیر پاسخگو باشند.
  • غرامت منصفانه: سازوکارهایی برای جبران خسارت دارندگان حق تکثیر برای استفاده از آثارشان در آموزش هوش مصنوعی باید بررسی شود. این می‌تواند شامل توافق‌نامه‌های صدور مجوز، مدیریت حقوق جمعی یا سایر راه‌حل‌های نوآورانه باشد.
  • هماهنگ‌سازی بین‌المللی: تلاش‌ها برای هماهنگ‌سازی قوانین حق تکثیر مربوط به آموزش هوش مصنوعی در حوزه‌های قضایی مختلف، عدم اطمینان حقوقی را کاهش می‌دهد و همکاری فرامرزی را تسهیل می‌کند.
  • ایجاد تعادل بین نوآوری و حقوق خالقان: چارچوب قانونی باید بین تقویت نوآوری در هوش مصنوعی و حمایت از حقوق خالقان تعادل ایجاد کند. این امر مستلزم بررسی دقیق منافع مختلف در معرض خطر است.
  • نقش استفاده منصفانه: کاربرد اصول استفاده منصفانه در آموزش هوش مصنوعی باید روشن شود. این ممکن است شامل تعریف معیارهای خاص برای تعیین اینکه آیا استفاده از مواد دارای حق تکثیر برای اهداف آموزشی به عنوان استفاده منصفانه واجد شرایط است یا خیر.

بحث جاری پیرامون حق تکثیر و آموزش هوش مصنوعی، چالش‌های انطباق چارچوب‌های قانونی موجود با فناوری‌های به سرعت در حال تحول را برجسته می‌کند. یافتن راه‌حلی که منافع همه ذینفعان را متعادل کند، مستلزم گفتگوی مستمر، همکاری و تمایل به انطباق با چشم‌انداز در حال تغییر عصر دیجیتال است. آینده توسعه هوش مصنوعی و حمایت از آثار خلاقانه، ممکن است به نتیجه این بحث حیاتی بستگی داشته باشد. سوال آموزش برای مدت طولانی با ما خواهد بود.