هوش مصنوعی Llama متا: درآمد و جنجال کپی‌رایت

پرده‌برداری از زیربنای مالی Llama

یک سند دادگاهی که اخیراً از حالت محرمانه خارج شده و تاریخ ۱۹ مارس را دارد، جنبه‌ای از مدل‌های هوش مصنوعی Llama متا را که قبلاً فاش نشده بود، روشن کرده است. این سند، که بخشی از پرونده‌ی حقوقی جاری Kadrey v. Meta در مورد نقض کپی‌رایت است، نشان می‌دهد که متا صرفاً این مدل‌ها را به‌عنوان ابزارهای متن‌باز توسعه و منتشر نمی‌کند؛ بلکه این شرکت از طریق توافق‌نامه‌های تقسیم درآمد با ارائه‌دهندگان مختلف هاستینگ ابری، فعالانه از آن‌ها سود می‌برد. این افشاگری لایه‌ی جدیدی از پیچیدگی را به روایت پیرامون Llama اضافه می‌کند و با اظهارات قبلی رهبری متا در مورد مدل کسب‌وکارشان در تضاد است.

هسته‌ی اصلی این دادخواست حول محور این ادعا می‌چرخد که متا مدل‌های Llama خود را با استفاده از حجم عظیمی از کتاب‌های الکترونیکی دزدی‌شده - به‌طور دقیق، صدها ترابایت - آموزش داده است. شاکیان استدلال می‌کنند که این استفاده‌ی غیرمجاز از مطالب دارای کپی‌رایت، اساس قابلیت‌های Llama را تشکیل می‌دهد. با این حال، اسناد دادگاهی که به‌تازگی فاش شده‌اند، بُعد دیگری را معرفی می‌کنند: سود مالی متا از توزیع این مدل‌ها. در این اسناد آمده است که متا ‘درصدی از درآمد’ تولید شده توسط شرکت‌هایی که دسترسی به هوش مصنوعی Llama را ارائه می‌دهند، ‘به اشتراک می‌گذارد’.

در حالی که شرکت‌های هاستینگ خاصی که در این توافق‌نامه‌های تقسیم درآمد دخیل هستند، در سند غیرمحرمانه نام‌گذاری نشده‌اند، متا به‌طور عمومی چندین شریک را که Llama را میزبانی می‌کنند، تأیید کرده است. این شرکا شامل بازیگران اصلی صنعت رایانش ابری می‌شوند:

  • Azure (Microsoft)
  • Google Cloud
  • AWS (Amazon Web Services)
  • Nvidia
  • Databricks
  • Groq
  • Dell
  • Snowflake

این فهرست بخش قابل‌توجهی از بازار زیرساخت ابری را نشان می‌دهد، که حاکی از آن است که دسترسی متا و جریان درآمد بالقوه‌ی آن، چشمگیر است.

موضع زاکربرگ: یک تناقض؟

افشای توافق‌نامه‌های تقسیم درآمد، در تضاد با اظهارات قبلی مارک زاکربرگ، مدیرعامل متا، به نظر می‌رسد. زاکربرگ در یک پست وبلاگی در ۲۳ جولای ۲۰۲۴، به‌صراحت بیان کرد که فروش دسترسی به Llama بخشی از مدل کسب‌وکار متا نیست. او رویکرد متا را اساساً متفاوت از ‘ارائه‌دهندگان مدل بسته’ قرار داد و بر ماهیت متن‌باز Llama تأکید کرد.

زاکربرگ نوشت: ‘یک تفاوت کلیدی بین متا و ارائه‌دهندگان مدل بسته این است که فروش دسترسی به مدل‌های هوش مصنوعی، مدل کسب‌وکار ما نیست.’ ‘این بدان معناست که انتشار آزادانه‌ی Llama، درآمد، پایداری یا توانایی ما برای سرمایه‌گذاری در تحقیقات را مانند ارائه‌دهندگان بسته، تضعیف نمی‌کند.’

این اظهارات اکنون در تضاد آشکار با شواهد ارائه‌شده در پرونده‌های دادگاه قرار دارد. در حالی که توسعه‌دهندگان از نظر فنی آزاد هستند که مدل‌های Llama را به‌طور مستقل دانلود و مستقر کنند و شرکای هاستینگ ابری را دور بزنند، واقعیت این است که بسیاری ترجیح می‌دهند از این پلتفرم‌ها استفاده کنند. ارائه‌دهندگان ابری طیف وسیعی از ابزارها و خدمات اضافی را ارائه می‌دهند که پیاده‌سازی و مدیریت مدل‌های هوش مصنوعی را ساده می‌کند و آن‌ها را به گزینه‌ای جذاب برای بسیاری از کاربران تبدیل می‌کند. این راحتی، به‌نوبه‌ی خود، درآمدی ایجاد می‌کند که بخشی از آن به متا بازمی‌گردد.

استراتژی‌های کسب درآمد: یک چشم‌انداز در حال تغییر

زاکربرگ قبلاً به استراتژی‌های بالقوه‌ی کسب درآمد برای Llama اشاره کرده بود، البته به شیوه‌ای غیرمستقیم‌تر. او در طول یک تماس تلفنی در آوریل ۲۰۲۴، به بررسی راه‌های مختلفی اشاره کرد، از جمله:

  1. مجوز دسترسی به هوش مصنوعی: این امر نشان‌دهنده‌ی یک تغییر بالقوه به سمت یک مدل مجوز نرم‌افزار سنتی‌تر است، که در آن کاربران برای حق استفاده از Llama هزینه پرداخت می‌کنند.
  2. پیام‌رسانی تجاری: ادغام Llama در پلتفرم‌های ارتباطی تجاری می‌تواند از طریق هزینه‌های اشتراک یا هزینه‌های مبتنی بر استفاده، درآمد ایجاد کند.
  3. تبلیغات در تعاملات هوش مصنوعی: این امر سناریویی را متصور می‌شود که در آن تبلیغات در زمینه‌ی مکالمات یا برنامه‌های کاربردی مبتنی بر هوش مصنوعی نمایش داده می‌شوند.

در آن زمان، زاکربرگ اشاره کرد که متا قصد دارد بخشی از درآمد تولید شده توسط شرکت‌هایی را که خدمات هوش مصنوعی ساخته‌شده بر روی Llama را دوباره می‌فروشند، تضمین کند. این اظهارات، در حالی که با توافق‌نامه‌های تقسیم درآمد که به‌تازگی فاش شده‌اند، همسو است، به‌عنوان یک احتمال آینده به‌جای یک رویه‌ی موجود ارائه شد.

اتهامات نقض کپی‌رایت: ‘کاشت’ جنجال

دادخواست Kadrey v. Meta صرفاً بر جنبه‌های مالی Llama متمرکز نیست. هسته‌ی اصلی استدلال شاکیان بر استفاده‌ی ادعایی از محتوای دزدی‌شده برای آموزش مدل‌های هوش مصنوعی متمرکز است. آن‌ها ادعا می‌کنند که متا نه‌تنها Llama را بر روی این مطالب غیرمجاز آموزش داده است، بلکه از طریق فرآیندی که آن‌ها به‌عنوان ‘کاشت’ (seeding) توصیف می‌کنند، فعالانه نقض بیشتر کپی‌رایت را تسهیل کرده است.

شاکیان ادعا می‌کنند که فرآیند آموزش متا شامل تکنیک‌های اشتراک‌گذاری فایل بوده است که ذاتاً مطالب دارای کپی‌رایت را در دسترس دیگران قرار می‌داده است. این ‘کاشت’ ظاهراً شامل توزیع کتاب‌های الکترونیکی از طریق روش‌های مخفی تورنت بوده است و عملاً متا را به توزیع‌کننده‌ی محتوای دزدی‌شده تبدیل می‌کند. این اتهام، در صورت اثبات، پیامدهای قابل‌توجهی برای متا خواهد داشت و به‌طور بالقوه این شرکت را در معرض پیامدهای حقوقی و مالی قابل‌توجهی قرار می‌دهد.

سرمایه‌گذاری متا در هوش مصنوعی: یک تلاش پرهزینه

در ژانویه، متا برنامه‌های بلندپروازانه‌ای را برای سرمایه‌گذاری تا ۶۵ میلیارد دلار در سال ۲۰۲۵ برای گسترش زیرساخت مرکز داده‌ی خود و تقویت تیم‌های توسعه‌ی هوش مصنوعی خود اعلام کرد. این سرمایه‌گذاری عظیم بر تعهد متا برای باقی‌ماندن در خط مقدم انقلاب هوش مصنوعی تأکید می‌کند. با این حال، همچنین بار مالی قابل‌توجه مرتبط با توسعه و استقرار فناوری‌های پیشرفته‌ی هوش مصنوعی را برجسته می‌کند.

در تلاشی آشکار برای جبران بخشی از این هزینه‌های هنگفت، گزارش شده است که متا در حال بررسی معرفی یک سرویس اشتراک ممتاز برای Meta AI است. این سرویس قابلیت‌ها و ویژگی‌های پیشرفته‌ای را برای دستیار هوش مصنوعی خود ارائه می‌دهد و به‌طور بالقوه یک جریان درآمد جدید برای پشتیبانی از توسعه و گسترش مداوم ابتکارات هوش مصنوعی خود فراهم می‌کند. این حرکت نشان‌دهنده‌ییک تغییر بالقوه به سمت یک استراتژی کسب درآمد متنوع‌تر است که دسترسی متن‌باز را با پیشنهادات ممتاز و پولی ترکیب می‌کند.

بررسی عمیق‌تر اشتراک درآمد و اکوسیستم ابری

مکانیک توافق‌نامه‌های تقسیم درآمد بین متا و شرکای هاستینگ ابری آن، نیازمند بررسی بیشتر است. در حالی که شرایط دقیق محرمانه باقی می‌ماند، اصل کلی روشن است: متا بخشی از درآمد تولید شده توسط این شرکا را زمانی که آن‌ها دسترسی به مدل‌های Llama را فراهم می‌کنند، دریافت می‌کند. این ترتیب یک اکوسیستم سودمند متقابل ایجاد می‌کند، جایی که:

  • متا از توزیع گسترده و پذیرش Llama سود می‌برد و دسترسی و نفوذ خود را در چشم‌انداز هوش مصنوعی گسترش می‌دهد. همچنین بدون اینکه مستقیماً درگیر کسب‌وکار فروش دسترسی به مدل‌ها شود، بازدهی مالی از سرمایه‌گذاری خود در توسعه‌ی Llama به دست می‌آورد.
  • شرکای هاستینگ ابری به یک مدل هوش مصنوعی پیشرفته دسترسی پیدا می‌کنند، پیشنهادات خدمات خود را افزایش می‌دهند و مشتریانی را که به دنبال قابلیت‌های پیشرفته‌ی هوش مصنوعی هستند، جذب می‌کنند. آن‌ها می‌توانند از تخصص و تحقیقات متا بدون متحمل شدن هزینه‌ی کامل توسعه‌ی مدل‌های قابل‌مقایسه‌ی خود، استفاده کنند.
  • کاربران نهایی از دسترسی آسان‌تر به Llama، همراه با ابزارها و خدمات اضافی ارائه‌شده توسط پلتفرم‌های ابری، سود می‌برند. این امر استقرار و مدیریت مدل‌های هوش مصنوعی را ساده می‌کند و آن‌ها را برای طیف وسیع‌تری از کاربران، از جمله کسانی که فاقد تخصص فنی گسترده هستند، در دسترس‌تر می‌کند.

این رابطه‌ی همزیستی، با این حال، اکنون به‌دلیل اتهامات نقض کپی‌رایت تحت بررسی است. اگر مشخص شود که متا Llama را بر روی محتوای دزدی‌شده آموزش داده است، کل اکوسیستم می‌تواند آلوده شود و به‌طور بالقوه منجر به چالش‌های حقوقی برای شرکای هاستینگ ابری نیز شود.

پیامدهای ‘کاشت’ و قانون کپی‌رایت

اتهام ‘کاشت’ علیه متا به‌ویژه در زمینه‌ی قانون کپی‌رایت حائز اهمیت است. قانون کپی‌رایت حقوق انحصاری را به خالقان آثارشان اعطا می‌کند، از جمله حق تکثیر، توزیع و ایجاد آثار مشتق‌شده. استفاده‌ی غیرمجاز از مطالب دارای کپی‌رایت برای آموزش مدل‌های هوش مصنوعی یک موضوع بحث‌برانگیز است، با نبردهای حقوقی و بحث‌های جاری پیرامون مفهوم ‘استفاده‌ی منصفانه’.

شاکیان در Kadrey v. Meta استدلال می‌کنند که اقدامات متا فراتر از صرفاً استفاده‌ی غیرمجاز است. آن‌ها ادعا می‌کنند که متا به‌طور فعال کتاب‌های الکترونیکی دزدی‌شده را از طریق ‘کاشت’ توزیع کرده است و عملاً به‌عنوان توزیع‌کننده‌ی محتوای ناقض عمل کرده است. این اتهام، در صورت اثبات، نقض فاحش‌تری از قانون کپی‌رایت را نسبت به صرفاً استفاده از مطالب برای اهداف آموزشی نشان می‌دهد.

نتیجه‌ی این پرونده می‌تواند پیامدهای گسترده‌ای برای صنعت هوش مصنوعی داشته باشد. این می‌تواند سابقه‌ای برای نحوه‌ی اعمال قانون کپی‌رایت بر آموزش مدل‌های هوش مصنوعی ایجاد کند و به‌طور بالقوه بر توسعه و استقرار فناوری‌های هوش مصنوعی در آینده تأثیر بگذارد. حکم علیه متا می‌تواند شرکت‌ها را مجبور کند که در مورد داده‌هایی که برای آموزش استفاده می‌کنند، محتاط‌تر باشند، که به‌طور بالقوه منجر به افزایش هزینه‌ها و چرخه‌های توسعه‌ی کندتر می‌شود.

آینده‌ی Llama و استراتژی هوش مصنوعی متا

افشاگری‌های پیرامون مدل‌های هوش مصنوعی Llama متا، سؤالاتی را در مورد آینده‌ی این پروژه و استراتژی کلی هوش مصنوعی متا ایجاد می‌کند. این شرکت با یک عمل متعادل‌کننده‌ی ظریف روبرو است:

  • حفظ ماهیت متن‌باز Llama: متا Llama را به‌عنوان یک جایگزین متن‌باز برای مدل‌های هوش مصنوعی بسته و اختصاصی معرفی کرده است. این رویکرد حمایت جامعه‌ی توسعه‌دهندگان را جلب کرده و نوآوری را تقویت کرده است. با این حال، توافق‌نامه‌های تقسیم درآمد و حرکت بالقوه به سمت یک سرویس اشتراک ممتاز می‌تواند به‌عنوان انحراف از این اخلاق متن‌باز تلقی شود.
  • رسیدگی به اتهامات نقض کپی‌رایت: دادخواست Kadrey v. Meta یک خطر حقوقی و اعتباری قابل‌توجه برای این شرکت ایجاد می‌کند. متا باید از خود در برابر این اتهامات دفاع کند و در عین حال در چشم‌انداز حقوقی پیچیده‌ی پیرامون هوش مصنوعی و کپی‌رایت نیز حرکت کند.
  • کسب درآمد از سرمایه‌گذاری‌های هوش مصنوعی: متا سرمایه‌گذاری‌های عظیمی در هوش مصنوعی انجام داده است و باید راه‌هایی برای ایجاد بازدهی از این سرمایه‌گذاری‌ها پیدا کند. این شرکت در حال بررسی استراتژی‌های مختلف کسب درآمد است، اما باید این کار را به شیوه‌ای انجام دهد که با چشم‌انداز و ارزش‌های کلی آن همسو باشد.

ماه‌ها و سال‌های آینده برای متا حیاتی خواهد بود، زیرا این چالش‌ها را پشت سر می‌گذارد. نتیجه‌ی دادخواست، تکامل استراتژی‌های کسب درآمد آن و پاسخ جامعه‌ی توسعه‌دهندگان، همگی آینده‌ی Llama و موقعیت متا را در چشم‌انداز به‌سرعت در حال تحول هوش مصنوعی شکل خواهند داد. تنش بین اصول متن‌باز، الزامات مالی و تعهدات قانونی همچنان یک عامل تعیین‌کننده در توسعه‌ی فناوری‌های هوش مصنوعی خواهد بود.