לאמן בינה מלאכותית או לא?

עלייתם של חריגים בזכויות יוצרים עבור אימון AI

בשנים האחרונות, מספר גדל והולך של מדינות חוקקו חריגים בחוקי זכויות היוצרים שלהן, במיוחד כדי לאפשר כריית טקסט ונתונים על ידי חברות AI. חריגים אלה נועדו לטפח חדשנות בתחום הבינה המלאכותית על ידי מתן אפשרות ל-LLMs להתאמן על מערכי נתונים עצומים ללא צורך באישור מפורש מכל בעל זכויות יוצרים.

סינגפור, למשל, תיקנה את חוק זכויות היוצרים שלה בשנת 2021 כדי ליצור חריג כזה. מהלך זה סלל את הדרך למפתחי AI במדינה לגשת ולעבד יצירות המוגנות בזכויות יוצרים לצורך אימון המודלים שלהם. כעת, תחומי שיפוט אחרים באסיה, כולל הונג קונג ואינדונזיה, שוקלים שינויי חקיקה דומים.

הפרספקטיבה הסינית: מקרה הפרה תקדימי

סין, שחקנית מרכזית בנוף הבינה המלאכותית העולמי, מתמודדת גם היא עם המורכבות של זכויות יוצרים בעידן ה-LLMs. מקרה תקדימי, iQiyi נגד MiniMax, הביא את הנושא הזה לידי ביטוי חד.

במקרה זה, iQiyi, פלטפורמת הזרמת וידאו בולטת, תבעה את MiniMax, חברת AI, בטענה שהשתמשה בחומרי הווידאו המוגנים בזכויות יוצרים שלה כדי לאמן מודלים של AI ללא אישור. תביעה זו מסמנת התפתחות משמעותית כמקרה הפרת זכויות היוצרים הראשון של LLM וידאו AI בסין, ומדגישה את החששות הגוברים לגבי שימוש לא מורשה בתוכן המוגן בזכויות יוצרים בפיתוח טכנולוגיות AI.

תעשיית ההוצאה לאור בהודו מאתגרת את נוהלי האימון של LLM

הדיון משתרע מעבר לאסיה. בהודו, מספר בתי הוצאה לאור פתחו בהליכים משפטיים נגד מפתחי LLM, בטענה שמודלים אלה מאומנים על נתונים שנאספו הכוללים את היצירות המוגנות בזכויות יוצרים שלהם. מקרים אלה מדגישים את המתח בין הרצון לקדם את יכולות הבינה המלאכותית לבין הצורך להגן על זכויות הקניין הרוחני של היוצרים.

מעבר לבליעה פשוטה: הניואנסים של אימון LLM

האתגרים שמציב אימון LLM מורכבים הרבה יותר מאשר פעולת הבליעה והעיבוד של נתונים. המקרים ההודיים וההוראות המוגדרות באופן צר של החוק בסינגפור מדגישים את האופי הרב-גוני של הנושא הזה.

בעלי קניין רוחני רבים מגבילים במפורש את הגישה והשימוש ביצירותיהם המוגנות בזכויות יוצרים, בעוד שאחרים אינם מסכימים לגישה ושכפול כאלה. מספר לא מבוטל של יוצרים מסתמכים על מודלים של רישוי כחלק מרכזי מהעסק שלהם, והשימוש הלא מורשה ביצירותיהם לאימון AI חותר ישירות תחת מודלים אלה.

יתר על כן, העובדה שחלק ניכר מהאימונים יכול להתרחש בענן מעלה שאלות שיפוט מורכבות. קביעה אילו חוקים חלים כאשר נתונים מעובדים מעבר לגבולות בינלאומיים מוסיפה שכבה נוספת של מורכבות לנוף משפטי מורכב ממילא.

בסופו של דבר, סוגיית הליבה סובבת סביב האופן שבו LLMs מאבטחים את נתוני האימון שלהם והאם, וכיצד, עליהם לפצות את בעלי זכויות היוצרים על השימוש בהם.

ארגוני זכויות יוצרים בארה”ב מתנגדים לחריגים סטטוטוריים

הדיון אינו מוגבל למדינות בודדות; הוא גלש גם לזירה הבינלאומית. קואליציה של כמעט 50 איגודי סחר וקבוצות תעשייה בארצות הברית, הידועה בשם Digital Creators Coalition, הביעה התנגדות נחרצת ליצירת חריגים סטטוטוריים לאימון LLM בחוקי זכויות יוצרים ללא הוראות לאישור או פיצוי.

ארגונים אלה הגישו הערות לנציב הסחר של ארצות הברית (USTR), ודחקו בסוכנות לטפל בנושא זה בסקירת Special 301 השנתית שלה, הבוחנת את ההגנה על קניין רוחני ונהלי אכיפה ברחבי העולם. הקואליציה סיפקה רשימה של מדינות שיישמו או מציעות חריגים כאלה, תוך הדגשת ההיקף העולמי של חשש זה.

הדיון בארה”ב: עמדת OpenAI והסתירות הפנימיות

אפילו בתוך ארצות הברית, הדיון נותר חי מאוד. OpenAI, החברה שמאחורי ChatGPT הפופולרי, הוסיפה את קולה לדיון על ידי הגשת מכתב פתוח למשרד המדע והטכנולוגיה של הבית הלבן.

במכתב זה, OpenAI תומכת בזכות לגרוף נתונים מהאינטרנט תחת עקרונות השימוש ההוגן, ולמעשה טוענת לגישה רחבה לחומר המוגן בזכויות יוצרים למטרות אימון. עם זאת, באופן פרדוקסלי, OpenAI גם מציעה שמפתחי LLM זרים יוגבלו מלעשות את אותו הדבר, אולי באמצעות שימוש במדיניות הייצוא של ארה”ב. עמדה זו חושפת סתירה פנימית, הדוגלת בגישה פתוחה לעצמה תוך שהיא מבקשת להגביל את הגישה של אחרים.

הדרך קדימה: דיון מתמשך

ככל ש-2025 מתקרבת, הדיון על זכויות יוצרים ואימון AI צפוי להתעצם. עם הופעתם המתמשכת של LLMs חדשים ברחבי העולם, הצורך במסגרת משפטית ברורה ומאוזנת הופך דחוף יותר ויותר.

הנוף המשפטי הנוכחי הוא טלאים של חוקים לאומיים, חלקם עם חריגים מפורשים לאימון AI ואחרים חסרים הוראות כאלה. חוסר עקביות זה יוצר אי ודאות הן למפתחי AI והן לבעלי זכויות יוצרים, מעכב חדשנות ועלול לערער את זכויות היוצרים.

שיקולים מרכזיים למסגרת מאוזנת:

  • שקיפות ואחריות: מפתחי LLM צריכים להיות שקופים לגבי מקורות הנתונים המשמשים לאימון המודלים שלהם ואחראים לכל שימוש לא מורשה בחומר המוגן בזכויות יוצרים.
  • פיצוי הוגן: יש לבחון מנגנונים לפיצוי בעלי זכויות יוצרים על השימוש ביצירותיהם באימון AI. זה יכול לכלול הסכמי רישוי, ניהול זכויות קולקטיבי או פתרונות חדשניים אחרים.
  • התאמה בינלאומית: מאמצים להתאים את חוקי זכויות היוצרים הקשורים לאימון AI בתחומי שיפוט שונים יפחיתו את אי הוודאות המשפטית ויקלו על שיתוף פעולה חוצה גבולות.
  • איזון בין חדשנות לזכויות יוצרים: המסגרת המשפטית צריכה לאזן בין טיפוח חדשנות ב-AI לבין הגנה על זכויות היוצרים. זה דורש התחשבות זהירה באינטרסים השונים המונחים על כף המאזניים.
  • תפקידו של שימוש הוגן: יש להבהיר את תחולתם של עקרונות השימוש ההוגן על אימון AI. זה עשוי לכלול הגדרת קריטריונים ספציפיים לקביעה האם השימוש בחומר המוגן בזכויות יוצרים למטרות אימון נחשב לשימוש הוגן.

הדיון המתמשך סביב זכויות יוצרים ואימון AI מדגיש את האתגרים של התאמת מסגרות משפטיות קיימות לטכנולוגיות המתפתחות במהירות. מציאת פתרון המאזן בין האינטרסים של כל בעלי העניין תדרוש דיאלוג מתמשך, שיתוף פעולה ונכונות להסתגל לנוף המשתנה של העידן הדיגיטלי. עתיד פיתוח הבינה המלאכותית, וההגנה על יצירות יצירתיות, עשויים להיות תלויים בתוצאות הדיון המכריע הזה. שאלת האימון תלווה אותנו עוד זמן רב.