نبرد حق تکثیر Generative AI: ناشران خبری Cohere را هدف قرار می‌دهند

چشم‌انداز توسعه هوش مصنوعی بار دیگر درگیر یک رویارویی قانونی شده است، زیرا گروهی از سازمان‌های خبری و رسانه‌ای برجسته، شکایت نقض حق تکثیر و علامت تجاری را علیه استارت‌آپ هوش مصنوعی Generative به نام Cohere تشکیل داده‌اند. این شکایت که در فوریه 2025 در دادگاه منطقه‌ای ایالات متحده برای منطقه جنوبی نیویورک ثبت شده است، بیش از دوازده شاکی را نام می‌برد، از جمله نشریات معتبری مانند Forbes، The Guardian و Los Angeles Times. در قلب این موضوع، استفاده Cohere از فناوری تولید تقویت‌شده با بازیابی (Retrieval-Augmented Generation - RAG) قرار دارد، که شاکیان ادعا می‌کنند شامل استفاده غیرمجاز از مطالب دارای حق چاپ آن‌ها برای ساخت پایگاه‌های داده و تولید خروجی‌ها است.

فناوری RAG زیر ذره‌بین

تولید تقویت‌شده با بازیابی (RAG) به عنوان راه‌حلی بالقوه برای برخی از چالش‌های ذاتی مرتبط با مدل‌های زبانی بزرگ (LLMs) ظاهر شد. RAG که توسط پاتریک لوئیس و همکارانش در سال 2020 پیشنهاد شد، هدفش کاهش مشکلاتی مانند توهم (تولید اطلاعات نادرست یا بی‌معنی از نظر واقعیت)، دانش قدیمی و عدم شفافیت در استدلال مدل است. جالب اینجاست که خود پاتریک لوئیس در حال حاضر محقق Cohere است و به کار خود بر روی فناوری RAG ادامه می‌دهد. پذیرش RAG گسترده بوده است و بازیگران بزرگی مانند Microsoft، Google، Amazon و NVIDIA آن را در سیستم‌های هوش مصنوعی خود ادغام کرده‌اند.

این شکایت که توسط ناشران خبری مطرح شده است، بر چندین ادعای کلیدی نقض حق تکثیر علیه Cohere متمرکز است. این ادعاها سوالات حقوقی پیچیده‌ای را پیرامون استفاده از مطالب دارای حق چاپ در آموزش و بهره‌برداری از مدل‌های هوش مصنوعی مولد برجسته می‌کند.

ادعاهای نقض حق تکثیر علیه Cohere

ادعاهای شاکیان علیه Cohere را می‌توان به چهار دسته اصلی تقسیم کرد:

1. آموزش مدل هوش مصنوعی

هسته اصلی استدلال شاکیان حول این موضوع می‌چرخد که Cohere چگونه مدل زبانی بزرگ خود را که با نام «خانواده فرمان (Command Family)» شناخته می‌شود، آموزش داده است. آنها ادعا می‌کنند Cohere در «خراشیدن (scraping)» گسترده متن از اینترنت، از جمله محتوای دارای حق چاپ از نشریات شاکیان، شرکت داشته است. سپس این داده‌های خراشیده شده برای ایجاد مجموعه داده‌های لازم برای آموزش مدل خانواده فرمان استفاده شده است. علاوه بر این، شاکیان ادعا می‌کنند که Cohere از مجموعه داده‌های شخص ثالث مانند C4 Common Crawl، که حاوی مقادیر قابل توجهی از مطالب دارای حق چاپ آن‌ها است، بدون کسب مجوزهای لازم استفاده کرده است.

استفاده از مطالب دارای حق چاپ در آموزش مدل هوش مصنوعی به یک موضوع بحث‌برانگیز تبدیل شده است. توسعه‌دهندگان هوش مصنوعی اغلب استدلال می‌کنند که چنین استفاده‌ای تحت دکترین «استفاده منصفانه (fair use)» قرار می‌گیرد، که اجازه استفاده محدود از مطالب دارای حق چاپ را برای اهدافی مانند انتقاد، تفسیر، گزارش خبری، تدریس، دانش‌پژوهی یا تحقیق می‌دهد. با این حال، دارندگان حق تکثیر استدلال می‌کنند که خراشیدن و استفاده در مقیاس بزرگ از محتوای آن‌ها برای اهداف تجاری، مانند آموزش مدل‌های هوش مصنوعی، فراتر از محدوده استفاده منصفانه است. این نبرد حقوقی احتمالاً به این بستگی دارد که آیا دادگاه با ارزیابی شاکیان موافقت کند یا خیر.

2. استفاده در زمان واقعی/ RAG

یکی دیگر از جنبه‌های کلیدی این دادخواست، بر چگونگی استفاده خدمات Cohere، به ویژه رابط چت آن، از فناوری RAG در زمان واقعی متمرکز است. شاکیان ادعا می‌کنند که مدل‌های Cohere محتوا را از منابع خارجی، از جمله وب‌سایت‌های آن‌ها، می‌خراشند تا به سؤالات کاربران پاسخ دهند. این خراشیدن در زمان واقعی، به گفته شاکیان، نقض حق تکثیر را تشکیل می‌دهد، به ویژه زمانی که مدل‌های Cohere از دیوارهای پرداخت (paywalls) عبور می‌کنند یا دستورالعمل‌های “robots.txt” را نادیده می‌گیرند، که دستوراتی هستند که به خزنده‌های وب (از جمله آن‌هایی که توسط مدل‌های هوش مصنوعی استفاده می‌شوند) دستور می‌دهند محتوای خاصی را از وب‌سایت خراش ندهند.

عبور از دیوارهای پرداخت و دستورالعمل‌های robots.txt سوالات جدی اخلاقی و قانونی را مطرح می‌کند. دیوارهای پرداخت برای محافظت از محتوای دارای حق چاپ و اطمینان از اینکه ناشران برای کار خود غرامت دریافت می‌کنند، طراحی شده‌اند. دستورالعمل‌های Robots.txt یک مکانیسم استاندارد برای صاحبان وب‌سایت است تا نحوه دسترسی و استفاده از محتوای خود توسط خزنده‌های وب را کنترل کنند. Cohere با نادیده گرفتن این محافظ‌ها، متهم به نشان دادن بی‌توجهی به قوانین حق تکثیر و حقوق تولیدکنندگان محتوا است.

3. خروجی‌های نقض‌کننده

شاکیان ادعا می‌کنند که خدمات Cohere خروجی‌های نقض‌کننده‌ای را در قالب نسخه‌ها، گزیده‌های اساسی یا خلاصه جانشین از آثار دارای حق چاپ خود در پاسخ به سؤالات کاربران ارائه می‌دهند. آن‌ها به نمونه‌هایی از خروجی‌های Cohere Chat استناد می‌کنند که در آن پنل “Under the Hood” مقالات کامل یا جزئی را که مستقیماً از وب‌سایت‌های شاکیان کپی شده‌اند، نمایش می‌دهد.

شاکیان استدلال می‌کنند که این خروجی‌ها، چه نسخه‌های کلام به کلام باشند و چه خلاصه، مستقیماً جایگزین نیاز کاربران به بازدید از مقالات اصلی می‌شوند. این به نوبه خود به اشتراک دیجیتال و درآمدهای تبلیغاتی که شاکیان برای حفظ تجارت خود به آن تکیه می‌کنند، آسیب می‌رساند. هسته اصلی این استدلال این است که مدل‌های هوش مصنوعی Cohere اساساً به عنوان توزیع‌کنندگان غیرمجاز محتوای دارای حق چاپ عمل می‌کنند و ناشران اصلی را از غرامت قانونی خود محروم می‌کنند.

4. اقتباس غیرمجاز

خدمات Cohere علاوه بر نمایش بخش‌هایی از آثار شاکیان در پنل “Under the Hood”، خلاصه یا چکیده‌ای از این آثار را نیز ارائه می‌دهند. مدعیان استدلال می‎کنند سطحی از جزئیات در این چکیده‎ها بسیار زیاد است به طوری که در اصل جایگزین اثرهای اصلی شده‎اند و فراتر از حدود استفاده منصفانه پیش رفته‎اند.

قانون حق تألیف نه تنها از تکثیر کلمه به کلمه آثار دارای حق تألیف محافظت می‌کند، بلکه از ایجاد آثار مشتق شده نیز محفوظ می‎دارد که اقتباس‎ها یا تحولاتی در اثر اصلی محسوب می‎شوند. مدعیان استدلال می‎کنند خلاصه‎های Cohere آنقدر جامع است که آثار مشتق شده غیرمجاز را تشکیل می‎دهند و حق انحصاری آن‎ها برای ایجاد و توزیع اقتباس‎هایی از مطالب دارای حق تألیف خود را نقض می‎کند.

مسئولیت ثانویه در قبال اقدامات کاربر

مدعیان علاوه بر ادعای نقض مستقیم حق مؤلف، ادعا می‎کنند Cohere به طور ثانویه نسبت به اقدامات نقض حقوق کاربران خود نیز مسئول است. آنها استدلال می‎کنند سرویس‎های Cohere تکثیر، نمایش و توزیع آثار مدعیان توسط کاربران را تسهیل می‎کند و Cohere نمی‎تواند با نسبت دادن نقض حقوق صرفاً به اقدامات کاربر، از مسئولیت شانه خالی کند. اساس این ادعا این است که محصول Cohere تنها پس از وارد کردن یک پیام توسط کاربر پاسخی ایجاد می‎کند و همین امر این شرکت را به یک شرکت‎کننده در فعالیت نقض قانون تبدیل می‎کند.

این استدلال مسئولیت ثانویه حائز اهمیت است، زیرا به دنبال آن است توسعه‎دهندگان هوش مصنوعی را در قبال اقدامات کاربران خود مسئول بداند، حتی زمانی که آن کاربران مستقیماً درگیر نقض حق تألیف هستند. اگر این استدلال موفقیت‎آمیز باشد، می‎تواند پیامدهای گسترده‎ای برای توسعه و استقرار فناوری‎های هوش مصنوعی داشته باشد، زیرا مستلزم آن می‎شود توسعه‎دهندگان به منظور جلوگیری از نقض حق مؤلف توسط کاربران خود، محافظت‎هایی را ارائه دهند.

ادعاهای نقض علامت تجاری

این دادخواست فراتر از نقض حق مؤلف به ادعاهای نقض علامت تجاری نیز گسترش می‎یابد. مدعیان ادعا می‎کنند اقدام Cohere در نسبت دادن منابع، نقض علامت تجاری را تشکیل می‎دهد، زیرا از علائم تجاری مشهور مدعیان بدون کسب اجازه یا به منظور مرتبط کردن آن‎ها به محتوای اشتباهی که توسط هوش مصنوعی تولید شده، استفاده می‎کند. به گفته آن‎ها، این امر منجر به خسارت به اعتبار برند مدعیان و کاهش تمایز آن‎ها می‎شود.

علائم تجاری نمادها، طرح‎ها یا عباراتی هستند که به طور قانونی برای نشان دادن یک شرکت یا محصول ثبت شده‎اند. استفاده غیرمجاز از یک علامت تجاری می‎تواند باعث سردرگمی در میان مصرف کنندگان و آسیب به اعتبار برند شود. مدعیان استدلال می‎کنند استفاده Cohere از علائم تجاری‎شان در رابطه با محتوای تولید شده توسط هوش مصنوعی می‎تواند کاربران را به این باور برساند که مدعیان خدمات Cohere را تأیید یا با آن‎ها همکاری می‎کنند، که چنین نیست.

زمینه گسترده‎تر: RAG و آینده قانون حق تألیف هوش مصنوعی

این دادخواست علیه Cohere یک حادثه مجزا نیست. این دادخواست در پی یک دادخواست حق تألیف قبلی در ایالات متحده در اکتبر 2024 صورت می‌گیرد که بر برنامه RAG در خدمات هوش مصنوعی نیز متمرکز بود. این تعداد رو به رشد پرونده‌ها، تنش فزاینده بین توسعه‌دهندگان هوش مصنوعی و دارندگان حق تکثیر را در حالی که معماری RAG در خدمات هوش مصنوعی رایج‌تر می‌شود، برجسته می‌کند.

نبردهای قانونی پیرامون فناوری RAG احتمالاً به موضوع مهمی در آینده قانون حق تکثیر هوش مصنوعی تبدیل خواهد شد. RAG چالش‌های منحصربه‌فردی را ارائه می‌کند زیرا شامل بازیابی و استفاده از مطالب دارای حق تکثیر در زمان واقعی برای تولید خروجی‌ها می‌شود. این سوالات پیچیده‌ای را در مورد دامنه استفاده منصفانه، مسئولیت توسعه‌دهندگان هوش مصنوعی در قبال اقدامات کاربر و حفاظت از مالکیت معنوی در عصر هوش مصنوعی مطرح می‌کند.

نتیجه این دادخواست‌ها می‌تواند تأثیر عمیقی بر توسعه و استقرار فناوری‌های هوش مصنوعی داشته باشد. اگر دادگاه‌ها به نفع دارندگان حق تکثیر رای دهند، توسعه‌دهندگان هوش مصنوعی ممکن است مجبور شوند محافظت‌های سخت‌گیرانه‌تری را برای جلوگیری از نقض حق تکثیر اجرا کنند، که می‌تواند هزینه و پیچیدگی توسعه مدل‌های هوش مصنوعی را افزایش دهد. از طرف دیگر، اگر دادگاه‌ها به نفع توسعه‌دهندگان هوش مصنوعی رای دهند، دارندگان حق تکثیر ممکن است نیاز به یافتن راه‌های جدیدی برای محافظت از مالکیت معنوی خود در مواجهه با فناوری‌های هوش مصنوعی پیچیده‌تر داشته باشند.

برخورد بین ناشران خبری و Cohere به عنوان یک مقطع حساس در بحث مداوم پیرامون هوش مصنوعی، حق تکثیر و آینده ایجاد محتوا عمل می‌کند. نتیجه این پرونده، همراه با موارد مشابه دیگر، بدون شک چشم‌انداز قانونی هوش مصنوعی مولد و تعامل آن با مطالب دارای حق تکثیر را برای سال‌های آینده شکل خواهد داد. از آنجایی که هوش مصنوعی به تکامل و ادغام بیشتر در جنبه‌های مختلف زندگی ما ادامه می‌دهد، ضروری است که تعادلی بین ترویج نوآوری و حمایت از حقوق تولیدکنندگان محتوا ایجاد کنیم. دادگاه‌ها، قانون‌گذاران و جامعه هوش مصنوعی باید با هم کار کنند تا دستورالعمل‌ها و مقررات روشنی را ایجاد کنند که خلاقیت را تقویت کرده و در عین حال اطمینان حاصل کنند که به مالکیت معنوی احترام گذاشته می‌شود.

صنعت خبر، به ویژه، با مجموعه‌ای از چالش‌های منحصربه‌فرد در عصر هوش مصنوعی مواجه است. از آنجایی که مدل‌های هوش مصنوعی به طور فزاینده‌ای قادر به تولید محتوای خبری هستند، بسیار مهم است که ناشران برای استفاده از مطالب دارای حق تکثیر خود غرامت دریافت کنند و از یکپارچگی برندهایشان محافظت شود. این دادخواست علیه Cohere نشان‌دهنده تلاشی از سوی ناشران خبری برای احقاق حقوق خود و اطمینان از اینکه کارشان توسط شرکت‌های هوش مصنوعی بدون مجوز مناسب مورد بهره‌برداری قرار نمی‌گیرد، است.