اثر Ghibli: مولد تصویر OpenAI و جنجال کپی‌رایت

دنیای دیجیتال با سرعت برق‌آسا حرکت می‌کند و این امر در هیچ کجا به اندازه قلمرو هوش مصنوعی مشهود نیست. تنها ظرف یک روز پس از آنکه OpenAI آخرین قابلیت‌های تولید تصویر خود را که در ChatGPT ادغام شده بود، عرضه کرد، پلتفرم‌های رسانه‌های اجتماعی به بوم‌هایی برای یک گرایش هنری عجیب و غریب، اما فوراً قابل تشخیص تبدیل شدند: میم‌ها و تصاویری که به سبک متمایز و خیال‌انگیز Studio Ghibli ارائه شده بودند. این استودیوی انیمیشن محبوب ژاپنی، نیروی خلاق پشت گنجینه‌های سینمایی مانند ‘همسایه من توتورو’ (My Neighbor Totoro) و برنده جایزه اسکار ‘شهر اشباح’ (Spirited Away)، ناگهان زیبایی‌شناسی منحصربه‌فرد خود را دید که تا حد اشباع تکثیر شده و بر روی همه چیز، از میلیاردرهای فناوری گرفته تا حماسه‌های فانتزی، اعمال می‌شود.

این پدیده نامحسوس نبود. فیدها مملو از تفاسیر Ghibli-گونه از چهره‌های معاصر و جهان‌های داستانی شدند. ما شاهد بودیم که Elon Musk به عنوان شخصیتی که بالقوه در جنگلی عرفانی سرگردان است، بازآفرینی شد، صحنه‌هایی از ‘ارباب حلقه‌ها’ (The Lord of the Rings) لمس نرم و نقاشی‌گونه انیمه دریافت کردند، و حتی یک رئیس‌جمهور سابق ایالات متحده، Donald Trump، از طریق این لنز هنری خاص به تصویر کشیده شد. این روند چنان جذابیتی پیدا کرد که به نظر می‌رسید Sam Altman، مدیرعامل خود OpenAI، پرتره‌ای به سبک Ghibli را که احتمالاً توسط همان ابزاری که بحث را برانگیخته بود تولید شده بود، به عنوان عکس پروفایل خود انتخاب کرده است. مکانیسم ساده به نظر می‌رسید: کاربران تصاویر موجود را به ChatGPT می‌دادند و از هوش مصنوعی می‌خواستند تا آنها را به شیوه نمادین Ghibli بازتفسیر کند. این انفجار تقلید سبکی، در حالی که سرگرمی ویروسی ایجاد می‌کرد، بلافاصله نگرانی‌های عمیق پیرامون هوش مصنوعی و حقوق مالکیت معنوی را دوباره مطرح کرد.

جرقه ویروسی و پژواک‌های آن

این اولین نمونه از یک ویژگی جدید هوش مصنوعی نبود که موج‌هایی مرتبط با دستکاری تصویر و کپی‌رایت ایجاد می‌کرد. به‌روزرسانی GPT-4o از OpenAI، که این تحول سبکی را امکان‌پذیر می‌کرد، اندکی پس از آن ارائه شد که Google قابلیت‌های مشابه تصویر هوش مصنوعی را در مدل Gemini Flash خود معرفی کرد. آن عرضه نیز، در اوایل ماه مارس، لحظه بدنامی ویروسی خود را داشت، البته به دلیلی متفاوت: کاربران کشف کردند که در حذف واترمارک‌ها از تصاویر مهارت دارد، عملی که مستقیماً کنترل عکاسان و هنرمندان بر آثارشان را به چالش می‌کشد.

این پیشرفت‌ها از سوی غول‌های فناوری مانند OpenAI و Google نشان‌دهنده جهشی قابل توجه در دسترسی و قابلیت ایجاد محتوای مبتنی بر هوش مصنوعی است. آنچه زمانی به نرم‌افزار تخصصی و مهارت هنری قابل توجهی نیاز داشت - تکثیر یک سبک بصری پیچیده - اکنون می‌تواند با یک دستور متنی ساده تقریب زده شود. تایپ کنید ‘به سبک Studio Ghibli’، و هوش مصنوعی اطاعت می‌کند. در حالی که کاربران از تازگی و پتانسیل خلاقانه لذت می‌برند، این سهولت تکثیر، نور تندی را بر یک سوال اساسی که صنعت هوش مصنوعی را آزار می‌دهد، می‌تاباند: این مدل‌های قدرتمند چگونه برای دستیابی به چنین تقلیدی آموزش دیده‌اند؟ اصل موضوع در داده‌هایی نهفته است که توسط این سیستم‌ها بلعیده می‌شوند. آیا شرکت‌هایی مانند OpenAI الگوریتم‌های خود را با مقادیر عظیمی از مواد دارای کپی‌رایت، از جمله فریم‌هایی از فیلم‌های Studio Ghibli، بدون اجازه یا جبران خسارت تغذیه می‌کنند؟ و مهمتر از آن، آیا چنین آموزشی نقض کپی‌رایت محسوب می‌شود؟

زیر سطح: معمای کپی‌رایت

این سوال صرفاً آکادمیک نیست؛ بلکه پایه و اساس دعاوی حقوقی متعدد و پرمخاطره‌ای است که در حال حاضر علیه توسعه‌دهندگان مدل‌های هوش مصنوعی مولد در جریان است. چشم‌انداز قانونی پیرامون داده‌های آموزشی هوش مصنوعی، به بیان ملایم، مبهم است. Evan Brown، وکیل مالکیت معنوی مرتبط با شرکت حقوقی Neal & McDevitt، وضعیت فعلی را به عنوان فعالیت در یک “منطقه خاکستری قانونی” قابل توجه توصیف می‌کند.

یک نکته کلیدی پیچیدگی این است که سبک هنری، به طور مجزا، عموماً توسط قانون کپی‌رایت محافظت نمی‌شود. کپی‌رایت از بیان خاص یک ایده محافظت می‌کند - نقاشی تمام شده، رمان نوشته شده، آهنگ ضبط شده، فریم‌های واقعی فیلم - نه تکنیک، حالت، یا عناصر بصری مشخصه‌ای که یک “سبک” را تشکیل می‌دهند. بنابراین، Brown خاطرنشان می‌کند، OpenAI ممکن است صرفاً با تولید تصاویری که به نظر می‌رسد می‌توانستند از Studio Ghibli آمده باشند، متن قانون را نقض نکند. عمل تولید یک تصویر جدید به سبکی خاص، به خودی خود، نقض کپی‌رایت خود سبک نیست.

با این حال، تحلیل نمی‌تواند در اینجا متوقف شود. موضوع حیاتی، همانطور که Brown تأکید می‌کند، حول فرآیندی می‌چرخد که طی آن هوش مصنوعی یاد می‌گیرد آن سبک را تکرار کند. کارشناسان استدلال می‌کنند که بسیار محتمل است که دستیابی به چنین شبیه‌سازی سبکی دقیقی مستلزم آموزش مدل هوش مصنوعی بر روی یک مجموعه داده عظیم باشد که به طور بالقوه شامل میلیون‌ها تصویر دارای کپی‌رایت - شاید حتی فریم‌های مستقیم - از کتابخانه سینمایی Ghibli باشد. عمل کپی کردن این آثار در یک پایگاه داده آموزشی، حتی به منظور “یادگیری”، می‌تواند خود نقض محسوب شود، صرف نظر از اینکه خروجی نهایی یک کپی مستقیم از هر فریم واحد باشد یا خیر.

Brown در مصاحبه‌ای اظهار داشت: «این واقعاً ما را به سوال اساسی بازمی‌گرداند که در چند سال گذشته در حال جوشش بوده است.» «پیامدهای نقض کپی‌رایت این سیستم‌ها که به وب می‌روند، می‌خزند و مقادیر عظیمی از محتوای بالقوه دارای کپی‌رایت را در پایگاه‌های داده آموزشی خود می‌بلعند، چیست؟» چالش اصلی قانونی در تعیین این است که آیا این مرحله کپی‌برداری اولیه، که برای عملکرد هوش مصنوعی ضروری است، تحت چارچوب‌های کپی‌رایت موجود مجاز است یا خیر.

بندبازی استفاده منصفانه

دفاع اصلی که اغلب توسط شرکت‌های هوش مصنوعی در این زمینه مورد استناد قرار می‌گیرد، دکترین استفاده منصفانه (fair use) است. استفاده منصفانه یک اصل حقوقی پیچیده در قانون کپی‌رایت ایالات متحده است که استفاده محدود از مواد دارای کپی‌رایت را بدون اجازه از صاحب حق تحت شرایط خاص مجاز می‌داند. دادگاه‌ها معمولاً چهار عامل را برای تعیین اینکه آیا یک استفاده خاص به عنوان استفاده منصفانه واجد شرایط است، تجزیه و تحلیل می‌کنند:

  1. هدف و ماهیت استفاده: آیا استفاده تحول‌آفرین است (افزودن معنا یا پیام جدید)؟ آیا تجاری است یا غیرانتفاعی/آموزشی؟ شرکت‌های هوش مصنوعی استدلال می‌کنند که آموزش مدل‌ها تحول‌آفرین است زیرا هوش مصنوعی الگوها را یاد می‌گیرد نه اینکه فقط کپی‌ها را ذخیره کند، و هدف نهایی ایجاد آثار جدید است. منتقدان استدلال می‌کنند که استفاده بسیار تجاری است و اغلب مستقیماً با بازار آثار اصلی رقابت می‌کند.
  2. ماهیت اثر دارای کپی‌رایت: استفاده از آثار واقعی به طور کلی بر آثار بسیار خلاقانه ترجیح داده می‌شود. آموزش بر روی آثار هنری مانند فیلم‌ها یا رمان‌ها ممکن است علیه استفاده منصفانه باشد. فیلم‌های Studio Ghibli، که بسیار اصیل و خلاقانه هستند، در دسته دوم قرار می‌گیرند.
  3. مقدار و اهمیت بخش استفاده شده: چه مقدار از اثر اصلی کپی شده است؟ در حالی که یک هوش مصنوعی ممکن است کل فیلم را بازتولید نکند، آموزش احتمالاً شامل کپی کردن مقادیر زیادی از فریم‌ها یا تصاویر است. آیا کپی کردن میلیون‌ها فریم به منزله استفاده از بخش “قابل توجهی” از مجموعه آثار Ghibli است، حتی اگر هیچ خروجی واحدی بخش بزرگی را تکرار نکند؟ این یک نکته بحث‌برانگیز باقی مانده است.
  4. تأثیر استفاده بر بازار بالقوه یا ارزش اثر دارای کپی‌رایت: آیا محتوای تولید شده توسط هوش مصنوعی جایگزین بازار آثار اصلی یا مشتقات دارای مجوز می‌شود؟ اگر کاربران بتوانند تصاویر به سبک Ghibli را در صورت تقاضا تولید کنند، آیا این امر ارزش هنر رسمی Ghibli، کالاها یا فرصت‌های صدور مجوز را کاهش می‌دهد؟ خالقان به شدت استدلال می‌کنند که چنین است.

در حال حاضر، چندین دادگاه در حال دست و پنجه نرم کردن با این موضوع هستند که آیا آموزش مدل‌های زبان بزرگ (LLMs) و مولدهای تصویر بر روی داده‌های دارای کپی‌رایت، استفاده منصفانه محسوب می‌شود یا خیر. هیچ سابقه قانونی قطعی که به طور خاص به این زمینه فناوری مدرن بپردازد وجود ندارد، که نتایج را بسیار نامشخص می‌کند. تصمیمات در این پرونده‌ها پیامدهای عمیقی برای آینده توسعه هوش مصنوعی و صنایع خلاق خواهد داشت.

بندبازی OpenAI: سیاست و عمل

OpenAI در پیمایش این قلمرو قانونی نامشخص، تلاش کرده است خطوطی را ترسیم کند، هرچند خطوطی که در بررسی دقیق‌تر تا حدودی مبهم به نظر می‌رسند. طبق بیانیه‌ای که سخنگوی OpenAI به TechCrunch ارائه کرده است، سیاست این شرکت حکم می‌کند که ChatGPT باید درخواست‌ها برای تکرار “سبک هنرمندان زنده منفرد” را رد کند. با این حال، همین سیاست صراحتاً اجازه تکرار “سبک‌های استودیویی گسترده‌تر” را می‌دهد.

این تمایز بلافاصله سوالاتی را ایجاد می‌کند. اگر “سبک استودیویی گسترده‌تر” مجموع دیدگاه و اجرای هنرمندان کلیدی مرتبط با آن استودیو نباشد، چیست؟ در مورد Studio Ghibli، زیبایی‌شناسی استودیو به طور جدایی‌ناپذیری با دیدگاه بنیانگذار و کارگردان اصلی آن، Hayao Miyazaki، که یک هنرمند بسیار زنده است، مرتبط است. آیا واقعاً می‌توان “سبک Ghibli” را از کارگردانی، طراحی شخصیت و دغدغه‌های موضوعی امضای Miyazaki جدا کرد؟ به نظر می‌رسد این سیاست بر تمایزی بالقوه مصنوعی تکیه دارد که ممکن است تحت بررسی دقیق، به ویژه هنگامی که هویت استودیو به شدت با خالقان خاص و قابل شناسایی گره خورده است، دوام نیاورد.

علاوه بر این، پدیده Ghibli یک حادثه مجزا نیست. کاربران به راحتی توانایی مولد تصویر GPT-4o را در تقلید از سبک‌های قابل تشخیص دیگر نشان داده‌اند. گزارش‌هایی از پرتره‌های ایجاد شده به سبک غیرقابل انکار Dr. Seuss (Theodor Geisel، متوفی، اما املاک او به شدت از سبک متمایز او محافظت می‌کند) و عکس‌های شخصی که با ظاهر و احساس مشخص Pixar Animation Studios بازآفرینی شده‌اند، منتشر شد. این نشان می‌دهد که قابلیت تقلید سبکی گسترده است و تمایز سیاستی بین “هنرمندان زنده” و “سبک‌های استودیویی” ممکن است بیشتر یک اقدام واکنشی باشد تا یک مرز فنی قوی یا از نظر اخلاقی سازگار. آزمایش بر روی مولدهای تصویر هوش مصنوعی مختلف این مشاهده را تأیید می‌کند: در حالی که دیگران مانند Gemini از Google، Grok از xAI و Playground.ai می‌توانند شبیه‌سازی سبکی را امتحان کنند، آخرین نسخه OpenAI به نظر می‌رسد به ویژه در ثبت ظرایف زیبایی‌شناسی Studio Ghibli مهارت دارد و آن را به کانون بحث فعلی تبدیل کرده است.

طوفان در حال تجمع: چشم‌انداز دعاوی حقوقی

تصاویر ویروسی Ghibli به عنوان تصویری زنده از موضوعاتی عمل می‌کنند که در قلب نبردهای حقوقی بزرگی که از قبل در جریان هستند، قرار دارند. چندین شکایت برجسته، خالقان و ناشران را در مقابل توسعه‌دهندگان هوش مصنوعی قرار می‌دهد و قانونی بودن شیوه‌های آموزشی آنها را به چالش می‌کشد.

  • The New York Times و سایر ناشران علیه OpenAI: این پرونده برجسته ادعا می‌کند که OpenAI با آموزش مدل‌های خود، از جمله ChatGPT، بر روی میلیون‌ها مقاله خبری دارای کپی‌رایت بدون اجازه، ذکر منبع یا پرداخت، مرتکب نقض گسترده کپی‌رایت شده است. ناشران استدلال می‌کنند که این امر مدل‌های تجاری آنها را تضعیف می‌کند و رقابت ناعادلانه محسوب می‌شود.
  • Authors Guild و نویسندگان منفرد علیه OpenAI و Microsoft: ادعاهای مشابهی توسط نویسندگانی دنبال می‌شود که ادعا می‌کنند کتاب‌هایشان به طور غیرقانونی برای آموزش مدل‌های زبان بزرگ کپی شده است.
  • هنرمندان علیه Stability AI، Midjourney، DeviantArt: هنرمندان تجسمی شکایات دسته‌جمعی علیه شرکت‌های تولید تصویر هوش مصنوعی تنظیم کرده‌اند و استدلال می‌کنند که آثارشان بدون رضایت از اینترنت جمع‌آوری و برای آموزش استفاده شده است، که به هوش مصنوعی امکان می‌دهد آثاری را تولید کند که مستقیماً با آنها رقابت می‌کند.
  • Getty Images علیه Stability AI: غول عکس‌های استوک از Stability AI به دلیل کپی کردن میلیون‌ها تصویر خود، در برخی موارد همراه با واترمارک، برای آموزش مدل Stable Diffusion شکایت می‌کند.

این دعاوی حقوقی به طور جمعی استدلال می‌کنند که بلعیدن غیرمجاز مواد دارای کپی‌رایت برای آموزش مدل‌های هوش مصنوعی، نقض حقوق انحصاری دارندگان کپی‌رایت برای تکثیر، توزیع و ایجاد آثار مشتق است. آنها نه تنها به دنبال خسارات پولی هستند، بلکه به طور بالقوه به دنبال دستوراتی هستند که می‌تواند شرکت‌های هوش مصنوعی را مجبور کند مدل‌های خود را با استفاده از داده‌های دارای مجوز مناسب بازآموزی کنند - وظیفه‌ای که بسیار گران و زمان‌بر خواهد بود و به طور بالقوه قابلیت‌های فعلی آنها را فلج می‌کند. متهمان، برعکس، به شدت بر استدلال‌های استفاده منصفانه تکیه می‌کنند و ادعا می‌کنند که فناوری آنها نوآوری را تقویت می‌کند و اشکال جدیدی از بیان را ایجاد می‌کند.

مسابقه تسلیحاتی فناوری در مقابل حسابرسی قانونی

علیرغم تهدیدات قانونی قریب‌الوقوع و معضلات اخلاقی آشکار، سرعت توسعه هوش مصنوعی هیچ نشانه‌ای از کند شدن نشان نمی‌دهد. شرکت‌هایی مانند OpenAI و Google در یک نبرد رقابتی شدید قفل شده‌اند و دائماً ویژگی‌ها و مدل‌های جدیدی را برای تصاحب سهم بازار و نشان دادن برتری فناوری عرضه می‌کنند. استقرار سریع ابزارهای پیشرفته تولید تصویر، که قادر به تقلید سبکی پیچیده هستند، به نظر می‌رسد ناشی از تمایل به جذب کاربران و نمایش پیشرفت باشد، حتی اگر پایه‌های قانونی متزلزل باقی بمانند.

این واقعیت که OpenAI چنان تقاضای بالایی برای ابزار تصویر جدید خود تجربه کرد که مجبور شد عرضه آن را برای کاربران سطح رایگان به تعویق بیندازد، بر شیفتگی و اشتیاق عمومی برای تعامل با این قابلیت‌ها تأکید می‌کند. برای شرکت‌های هوش مصنوعی، تعامل کاربر و نمایش ویژگی‌های پیشرفته ممکن است در حال حاضر بر خطرات قانونی بالقوه غلبه کند، یا شاید این یک قمار حساب شده باشد که قانون در نهایت به نفع آنها سازگار خواهد شد، یا اینکه می‌توان به توافقاتی دست یافت.

این وضعیت تنش فزاینده‌ای را بین شتاب نمایی قابلیت‌های فناوری و سرعت سنجیده‌تر و حساب‌شده‌تر چارچوب‌های قانونی و اخلاقی برجسته می‌کند. قانون اغلب از فناوری عقب می‌ماند و هوش مصنوعی مولد چالش به‌ویژه پیچیده‌ای را ارائه می‌دهد و جامعه را مجبور می‌کند تا مفاهیم دیرینه نویسندگی، خلاقیت و مالکیت معنوی را در عصر دیجیتال بازنگری کند.

پژواک‌ها و سوابق

تاریخ، موارد مشابهی را ارائه می‌دهد که در آن فناوری‌های پیشگامانه هنجارهای تثبیت شده کپی‌رایت را مختل کردند. ظهور دستگاه فتوکپی نگرانی‌هایی را در مورد تکثیر غیرمجاز ایجاد کرد. پیانوی خودکار تعاریف حقوق اجرای موسیقی را به چالش کشید. دستگاه ضبط ویدئو کاست (VCR) منجر به ‘پرونده Betamax’ برجسته (Sony Corp. of America v. Universal City Studios, Inc.) شد، جایی که دادگاه عالی ایالات متحده حکم داد که ضبط برنامه‌های تلویزیونی برای مشاهده بعدی (‘تغییر زمان’) استفاده منصفانه محسوب می‌شود، تا حدی به این دلیل که این فناوری کاربردهای غیر ناقض قابل توجهی داشت. بعدها، پلتفرم‌های اشتراک‌گذاری موسیقی دیجیتال مانند Napster موج دیگری از نبردهای قانونی را بر سر توزیع آنلاین و نقض کپی‌رایت به راه انداختند که در نهایت منجر به مدل‌های صدور مجوز جدید مانند iTunes و خدمات پخش جریانی شد.

در حالی که این نمونه‌های تاریخی زمینه را فراهم می‌کنند، مقیاس و ماهیت هوش مصنوعی مولد چالش‌های منحصربه‌فردی را ارائه می‌دهد. برخلاف VCR، که عمدتاً کپی‌برداری شخصی را امکان‌پذیر می‌کرد، هوش مصنوعی مولد محتوای جدیدی را بر اساس الگوهای آموخته شده از مقادیر بالقوه عظیمی از ورودی‌های دارای کپی‌رایت ایجاد می‌کند و سوالات متفاوتی را در مورد تحول و آسیب به بازار مطرح می‌کند. اینکه آیا دادگاه‌ها آموزش هوش مصنوعی را مشابه تغییر زمان یا بیشتر شبیه به نقض گسترده تسهیل شده توسط Napster خواهند یافت، باید دید.

آینده نانوشته

هیجان فعلی پیرامون تصاویر به سبک Ghibli تولید شده توسط هوش مصنوعی چیزی بیش از یک روند زودگذر اینترنتی نیست؛ این نشانه‌ای از یک مبارزه بسیار بزرگتر و مداوم برای تعریف مرزهای مالکیت معنوی در عصر هوش مصنوعی است. نتایج دعاوی حقوقی در حال رسیدگی، اقدامات قانونی بالقوه، و تکامل شیوه‌های صنعتی (مانند توافق‌نامه‌های صدور مجوز برای داده‌های آموزشی) مسیر توسعه هوش مصنوعی و تأثیر آن بر حرفه‌های خلاق را برای سال‌های آینده شکل خواهد داد.

آیا دادگاه‌ها حکم خواهند داد که آموزش بر روی داده‌های دارای کپی‌رایت مستلزم اجازه صریح و صدور مجوز است، که به طور بالقوه بازسازی پرهزینه مدل‌های هوش مصنوعی موجود را تحمیل می‌کند؟ یا خواهند یافت که چنین آموزشی تحت استفاده منصفانه قرار می‌گیرد، که راه را برای توسعه سریع مداوم هموار می‌کند اما به طور بالقوه ارزش محتوای ایجاد شده توسط انسان را کاهش می‌دهد؟ آیا می‌تواند یک راه میانه پدیدار شود، که شامل طرح‌های جدید صدور مجوز اجباری یا توافق‌نامه‌های سراسری صنعت باشد؟

پاسخ‌ها همچنان مبهم هستند. آنچه واضح است این است که سهولتی که هوش مصنوعی اکنون می‌تواند سبک‌های هنری متمایز را تقلید کند، ما را با سوالات اساسی در مورد خلاقیت، مالکیت و ارزشی که برای بیان انسانی قائل هستیم، روبرو می‌کند. میم‌های خیال‌انگیز Ghibli که اینترنت را پر کرده‌اند، صرفاً سطح جذاب و قابل هضم کوه یخ عمیق و پیچیده قانونی و اخلاقی هستند که ابعاد کامل آن تازه در حال آشکار شدن است. حل این مسائل نه تنها آینده هوش مصنوعی، بلکه چشم‌انداز هنرمندان، نویسندگان، موسیقی‌دانان و خالقان از هر نوع را در دهه‌های آینده تعیین خواهد کرد.