چشمانداز توسعه هوش مصنوعی بار دیگر درگیر یک رویارویی قانونی شده است، زیرا گروهی از سازمانهای خبری و رسانهای برجسته، شکایت نقض حق تکثیر و علامت تجاری را علیه استارتآپ هوش مصنوعی Generative به نام Cohere تشکیل دادهاند. این شکایت که در فوریه 2025 در دادگاه منطقهای ایالات متحده برای منطقه جنوبی نیویورک ثبت شده است، بیش از دوازده شاکی را نام میبرد، از جمله نشریات معتبری مانند Forbes، The Guardian و Los Angeles Times. در قلب این موضوع، استفاده Cohere از فناوری تولید تقویتشده با بازیابی (Retrieval-Augmented Generation - RAG) قرار دارد، که شاکیان ادعا میکنند شامل استفاده غیرمجاز از مطالب دارای حق چاپ آنها برای ساخت پایگاههای داده و تولید خروجیها است.
فناوری RAG زیر ذرهبین
تولید تقویتشده با بازیابی (RAG) به عنوان راهحلی بالقوه برای برخی از چالشهای ذاتی مرتبط با مدلهای زبانی بزرگ (LLMs) ظاهر شد. RAG که توسط پاتریک لوئیس و همکارانش در سال 2020 پیشنهاد شد، هدفش کاهش مشکلاتی مانند توهم (تولید اطلاعات نادرست یا بیمعنی از نظر واقعیت)، دانش قدیمی و عدم شفافیت در استدلال مدل است. جالب اینجاست که خود پاتریک لوئیس در حال حاضر محقق Cohere است و به کار خود بر روی فناوری RAG ادامه میدهد. پذیرش RAG گسترده بوده است و بازیگران بزرگی مانند Microsoft، Google، Amazon و NVIDIA آن را در سیستمهای هوش مصنوعی خود ادغام کردهاند.
این شکایت که توسط ناشران خبری مطرح شده است، بر چندین ادعای کلیدی نقض حق تکثیر علیه Cohere متمرکز است. این ادعاها سوالات حقوقی پیچیدهای را پیرامون استفاده از مطالب دارای حق چاپ در آموزش و بهرهبرداری از مدلهای هوش مصنوعی مولد برجسته میکند.
ادعاهای نقض حق تکثیر علیه Cohere
ادعاهای شاکیان علیه Cohere را میتوان به چهار دسته اصلی تقسیم کرد:
1. آموزش مدل هوش مصنوعی
هسته اصلی استدلال شاکیان حول این موضوع میچرخد که Cohere چگونه مدل زبانی بزرگ خود را که با نام «خانواده فرمان (Command Family)» شناخته میشود، آموزش داده است. آنها ادعا میکنند Cohere در «خراشیدن (scraping)» گسترده متن از اینترنت، از جمله محتوای دارای حق چاپ از نشریات شاکیان، شرکت داشته است. سپس این دادههای خراشیده شده برای ایجاد مجموعه دادههای لازم برای آموزش مدل خانواده فرمان استفاده شده است. علاوه بر این، شاکیان ادعا میکنند که Cohere از مجموعه دادههای شخص ثالث مانند C4 Common Crawl، که حاوی مقادیر قابل توجهی از مطالب دارای حق چاپ آنها است، بدون کسب مجوزهای لازم استفاده کرده است.
استفاده از مطالب دارای حق چاپ در آموزش مدل هوش مصنوعی به یک موضوع بحثبرانگیز تبدیل شده است. توسعهدهندگان هوش مصنوعی اغلب استدلال میکنند که چنین استفادهای تحت دکترین «استفاده منصفانه (fair use)» قرار میگیرد، که اجازه استفاده محدود از مطالب دارای حق چاپ را برای اهدافی مانند انتقاد، تفسیر، گزارش خبری، تدریس، دانشپژوهی یا تحقیق میدهد. با این حال، دارندگان حق تکثیر استدلال میکنند که خراشیدن و استفاده در مقیاس بزرگ از محتوای آنها برای اهداف تجاری، مانند آموزش مدلهای هوش مصنوعی، فراتر از محدوده استفاده منصفانه است. این نبرد حقوقی احتمالاً به این بستگی دارد که آیا دادگاه با ارزیابی شاکیان موافقت کند یا خیر.
2. استفاده در زمان واقعی/ RAG
یکی دیگر از جنبههای کلیدی این دادخواست، بر چگونگی استفاده خدمات Cohere، به ویژه رابط چت آن، از فناوری RAG در زمان واقعی متمرکز است. شاکیان ادعا میکنند که مدلهای Cohere محتوا را از منابع خارجی، از جمله وبسایتهای آنها، میخراشند تا به سؤالات کاربران پاسخ دهند. این خراشیدن در زمان واقعی، به گفته شاکیان، نقض حق تکثیر را تشکیل میدهد، به ویژه زمانی که مدلهای Cohere از دیوارهای پرداخت (paywalls) عبور میکنند یا دستورالعملهای “robots.txt” را نادیده میگیرند، که دستوراتی هستند که به خزندههای وب (از جمله آنهایی که توسط مدلهای هوش مصنوعی استفاده میشوند) دستور میدهند محتوای خاصی را از وبسایت خراش ندهند.
عبور از دیوارهای پرداخت و دستورالعملهای robots.txt سوالات جدی اخلاقی و قانونی را مطرح میکند. دیوارهای پرداخت برای محافظت از محتوای دارای حق چاپ و اطمینان از اینکه ناشران برای کار خود غرامت دریافت میکنند، طراحی شدهاند. دستورالعملهای Robots.txt یک مکانیسم استاندارد برای صاحبان وبسایت است تا نحوه دسترسی و استفاده از محتوای خود توسط خزندههای وب را کنترل کنند. Cohere با نادیده گرفتن این محافظها، متهم به نشان دادن بیتوجهی به قوانین حق تکثیر و حقوق تولیدکنندگان محتوا است.
3. خروجیهای نقضکننده
شاکیان ادعا میکنند که خدمات Cohere خروجیهای نقضکنندهای را در قالب نسخهها، گزیدههای اساسی یا خلاصه جانشین از آثار دارای حق چاپ خود در پاسخ به سؤالات کاربران ارائه میدهند. آنها به نمونههایی از خروجیهای Cohere Chat استناد میکنند که در آن پنل “Under the Hood” مقالات کامل یا جزئی را که مستقیماً از وبسایتهای شاکیان کپی شدهاند، نمایش میدهد.
شاکیان استدلال میکنند که این خروجیها، چه نسخههای کلام به کلام باشند و چه خلاصه، مستقیماً جایگزین نیاز کاربران به بازدید از مقالات اصلی میشوند. این به نوبه خود به اشتراک دیجیتال و درآمدهای تبلیغاتی که شاکیان برای حفظ تجارت خود به آن تکیه میکنند، آسیب میرساند. هسته اصلی این استدلال این است که مدلهای هوش مصنوعی Cohere اساساً به عنوان توزیعکنندگان غیرمجاز محتوای دارای حق چاپ عمل میکنند و ناشران اصلی را از غرامت قانونی خود محروم میکنند.
4. اقتباس غیرمجاز
خدمات Cohere علاوه بر نمایش بخشهایی از آثار شاکیان در پنل “Under the Hood”، خلاصه یا چکیدهای از این آثار را نیز ارائه میدهند. مدعیان استدلال میکنند سطحی از جزئیات در این چکیدهها بسیار زیاد است به طوری که در اصل جایگزین اثرهای اصلی شدهاند و فراتر از حدود استفاده منصفانه پیش رفتهاند.
قانون حق تألیف نه تنها از تکثیر کلمه به کلمه آثار دارای حق تألیف محافظت میکند، بلکه از ایجاد آثار مشتق شده نیز محفوظ میدارد که اقتباسها یا تحولاتی در اثر اصلی محسوب میشوند. مدعیان استدلال میکنند خلاصههای Cohere آنقدر جامع است که آثار مشتق شده غیرمجاز را تشکیل میدهند و حق انحصاری آنها برای ایجاد و توزیع اقتباسهایی از مطالب دارای حق تألیف خود را نقض میکند.
مسئولیت ثانویه در قبال اقدامات کاربر
مدعیان علاوه بر ادعای نقض مستقیم حق مؤلف، ادعا میکنند Cohere به طور ثانویه نسبت به اقدامات نقض حقوق کاربران خود نیز مسئول است. آنها استدلال میکنند سرویسهای Cohere تکثیر، نمایش و توزیع آثار مدعیان توسط کاربران را تسهیل میکند و Cohere نمیتواند با نسبت دادن نقض حقوق صرفاً به اقدامات کاربر، از مسئولیت شانه خالی کند. اساس این ادعا این است که محصول Cohere تنها پس از وارد کردن یک پیام توسط کاربر پاسخی ایجاد میکند و همین امر این شرکت را به یک شرکتکننده در فعالیت نقض قانون تبدیل میکند.
این استدلال مسئولیت ثانویه حائز اهمیت است، زیرا به دنبال آن است توسعهدهندگان هوش مصنوعی را در قبال اقدامات کاربران خود مسئول بداند، حتی زمانی که آن کاربران مستقیماً درگیر نقض حق تألیف هستند. اگر این استدلال موفقیتآمیز باشد، میتواند پیامدهای گستردهای برای توسعه و استقرار فناوریهای هوش مصنوعی داشته باشد، زیرا مستلزم آن میشود توسعهدهندگان به منظور جلوگیری از نقض حق مؤلف توسط کاربران خود، محافظتهایی را ارائه دهند.
ادعاهای نقض علامت تجاری
این دادخواست فراتر از نقض حق مؤلف به ادعاهای نقض علامت تجاری نیز گسترش مییابد. مدعیان ادعا میکنند اقدام Cohere در نسبت دادن منابع، نقض علامت تجاری را تشکیل میدهد، زیرا از علائم تجاری مشهور مدعیان بدون کسب اجازه یا به منظور مرتبط کردن آنها به محتوای اشتباهی که توسط هوش مصنوعی تولید شده، استفاده میکند. به گفته آنها، این امر منجر به خسارت به اعتبار برند مدعیان و کاهش تمایز آنها میشود.
علائم تجاری نمادها، طرحها یا عباراتی هستند که به طور قانونی برای نشان دادن یک شرکت یا محصول ثبت شدهاند. استفاده غیرمجاز از یک علامت تجاری میتواند باعث سردرگمی در میان مصرف کنندگان و آسیب به اعتبار برند شود. مدعیان استدلال میکنند استفاده Cohere از علائم تجاریشان در رابطه با محتوای تولید شده توسط هوش مصنوعی میتواند کاربران را به این باور برساند که مدعیان خدمات Cohere را تأیید یا با آنها همکاری میکنند، که چنین نیست.
زمینه گستردهتر: RAG و آینده قانون حق تألیف هوش مصنوعی
این دادخواست علیه Cohere یک حادثه مجزا نیست. این دادخواست در پی یک دادخواست حق تألیف قبلی در ایالات متحده در اکتبر 2024 صورت میگیرد که بر برنامه RAG در خدمات هوش مصنوعی نیز متمرکز بود. این تعداد رو به رشد پروندهها، تنش فزاینده بین توسعهدهندگان هوش مصنوعی و دارندگان حق تکثیر را در حالی که معماری RAG در خدمات هوش مصنوعی رایجتر میشود، برجسته میکند.
نبردهای قانونی پیرامون فناوری RAG احتمالاً به موضوع مهمی در آینده قانون حق تکثیر هوش مصنوعی تبدیل خواهد شد. RAG چالشهای منحصربهفردی را ارائه میکند زیرا شامل بازیابی و استفاده از مطالب دارای حق تکثیر در زمان واقعی برای تولید خروجیها میشود. این سوالات پیچیدهای را در مورد دامنه استفاده منصفانه، مسئولیت توسعهدهندگان هوش مصنوعی در قبال اقدامات کاربر و حفاظت از مالکیت معنوی در عصر هوش مصنوعی مطرح میکند.
نتیجه این دادخواستها میتواند تأثیر عمیقی بر توسعه و استقرار فناوریهای هوش مصنوعی داشته باشد. اگر دادگاهها به نفع دارندگان حق تکثیر رای دهند، توسعهدهندگان هوش مصنوعی ممکن است مجبور شوند محافظتهای سختگیرانهتری را برای جلوگیری از نقض حق تکثیر اجرا کنند، که میتواند هزینه و پیچیدگی توسعه مدلهای هوش مصنوعی را افزایش دهد. از طرف دیگر، اگر دادگاهها به نفع توسعهدهندگان هوش مصنوعی رای دهند، دارندگان حق تکثیر ممکن است نیاز به یافتن راههای جدیدی برای محافظت از مالکیت معنوی خود در مواجهه با فناوریهای هوش مصنوعی پیچیدهتر داشته باشند.
برخورد بین ناشران خبری و Cohere به عنوان یک مقطع حساس در بحث مداوم پیرامون هوش مصنوعی، حق تکثیر و آینده ایجاد محتوا عمل میکند. نتیجه این پرونده، همراه با موارد مشابه دیگر، بدون شک چشمانداز قانونی هوش مصنوعی مولد و تعامل آن با مطالب دارای حق تکثیر را برای سالهای آینده شکل خواهد داد. از آنجایی که هوش مصنوعی به تکامل و ادغام بیشتر در جنبههای مختلف زندگی ما ادامه میدهد، ضروری است که تعادلی بین ترویج نوآوری و حمایت از حقوق تولیدکنندگان محتوا ایجاد کنیم. دادگاهها، قانونگذاران و جامعه هوش مصنوعی باید با هم کار کنند تا دستورالعملها و مقررات روشنی را ایجاد کنند که خلاقیت را تقویت کرده و در عین حال اطمینان حاصل کنند که به مالکیت معنوی احترام گذاشته میشود.
صنعت خبر، به ویژه، با مجموعهای از چالشهای منحصربهفرد در عصر هوش مصنوعی مواجه است. از آنجایی که مدلهای هوش مصنوعی به طور فزایندهای قادر به تولید محتوای خبری هستند، بسیار مهم است که ناشران برای استفاده از مطالب دارای حق تکثیر خود غرامت دریافت کنند و از یکپارچگی برندهایشان محافظت شود. این دادخواست علیه Cohere نشاندهنده تلاشی از سوی ناشران خبری برای احقاق حقوق خود و اطمینان از اینکه کارشان توسط شرکتهای هوش مصنوعی بدون مجوز مناسب مورد بهرهبرداری قرار نمیگیرد، است.