רקע
חוק הבינה המלאכותית האירופי (תקנה (EU) 2024/1689, או ‘חוק הבינה המלאכותית’) מטיל חובות ספציפיות על ספקים של מודלי בינה מלאכותית לשימוש כללי (‘GPAI’). מודלים אלה, כולל אלה ממשפחת GPT, Llama ו-Gemini, חייבים לעמוד בדרישות כגון תיעוד מקיף וקביעת מדיניות המבטיחה עמידה בחוקי זכויות היוצרים של האיחוד האירופי.
כדי להקל על עמידה בהוראות אלה, חוק הבינה המלאכותית צופה פיתוח של קודי התנהגות המותאמים למודלי GPAI. בעקבות הזמנה ממשרד הבינה המלאכותית, מומחים ובעלי עניין שונים הקימו ארבע קבוצות עבודה המוקדשות לניסוח קוד התנהגות ראשוני. אישור קוד זה על ידי נציבות האיחוד האירופי יעניק לו ‘תוקף כללי’ ברחבי האיחוד האירופי. אימוץ קוד ההתנהגות המאושר של GPAI מציע לחברות אמצעי להפגין ציות יזום, מה שעשוי להפחית את הבדיקה הרגולטורית ואת העונשים הנלווים.
משרד הבינה המלאכותית פרסם לאחרונה את הטיוטה השלישית של קוד ההתנהגות (‘טיוטה שלישית’) שהופקה על ידי קבוצות עבודה אלה. טיוטה זו מקיפה מספר תחומים מרכזיים:
- התחייבויות
- שקיפות
- זכויות יוצרים
- בטיחות ואבטחה
הגרסה הסופית של קוד התנהגות זה מתוכננת להתפרסם ב-2 במאי 2025.
מסמך זה יעמיק בפרטים המשמעותיים בתוך סעיף זכויות היוצרים של הטיוטה השלישית. שינוי בולט מהטיוטה השנייה (‘טיוטה שנייה’) הוא הגישה היעילה והתמציתית של הטיוטה השלישית. שינוי מרכזי הוא שהטיוטה השלישית מחייבת בדרך כלל שמאמצי הציות יהיו תואמים לגודל וליכולות של הספק, בניגוד לטיוטה השנייה.
עבור מי זה רלוונטי?
קוד ההתנהגות מיועד בעיקר לספקים של מודלי GPAI. מודלים אלה מאופיינים בכלליותם המשמעותית וביכולתם לבצע במיומנות קשת רחבה של משימות מובחנות. זה כולל ספקים של מודלי שפה גדולים ידועים כמו GPT (OpenAI), Llama (Meta), Gemini (Google) ו-Mistral (Mistral AI). עם זאת, ספקי מודלים קטנים יותר עשויים גם הם להיכלל בתחום זה, בתנאי שניתן להשתמש במודלים שלהם למגוון רחב של משימות. יתר על כן, עסקים שמכווננים מודלים ליישומים הספציפיים שלהם עשויים גם הם להיות מסווגים כספקי מודלי GPAI.
‘ספקי המשך’, או עסקים שמשלבים מודלי GPAI במערכות הבינה המלאכותית שלהם, צריכים גם הם להכיר את קוד ההתנהגות. קוד זה עומד להפוך לתקן מעין-תקני עבור מודלי GPAI, המגדיר את הציפיות ממפתחי מערכות בינה מלאכותית לגבי יכולות מודל GPAI. הבנה זו יכולה להיות מכרעת במהלך משא ומתן חוזי עם ספקי מודלי GPAI.
מושגי מפתח של קוד ההתנהגות בנושא חוק זכויות יוצרים
ספקים של מודלי GPAI מחויבים לקבוע מדיניות המבטיחה עמידה בחוק זכויות היוצרים של האיחוד האירופי (סעיף 53 (1) (ג) לחוק הבינה המלאכותית). בהתחשב בחידוש של דרישה זו, חסרה הדרכה מעשית לגבי המבנה והתוכן של מדיניות כזו. קוד ההתנהגות נועד לתת מענה לפער זה.
קוד ההתנהגות מחייב את הספקים ליישם את האמצעים הבאים:
מדיניות זכויות יוצרים
ספקים שחותמים על קוד ההתנהגות (‘חתומים’) נדרשים לגבש, לתחזק וליישם מדיניות זכויות יוצרים התואמת את חוק זכויות היוצרים של האיחוד האירופי. דרישה זו נגזרת ישירות מחוק הבינה המלאכותית. החתומים חייבים גם להבטיח שהארגונים שלהם יעמדו במדיניות זכויות יוצרים זו.
סטייה משמעותית מהטיוטה השנייה היא שהטיוטה השלישית אינה מחייבת עוד את פרסום מדיניות זכויות היוצרים. החתומים רק מעודדים לעשות זאת. דרישה מופחתת זו היא הגיונית, שכן חוק הבינה המלאכותית עצמו אינו מחייב את ספקי המודלים לפרסם את מדיניות זכויות היוצרים שלהם.
סריקת אינטרנט של תוכן המוגן בזכויות יוצרים
החתומים רשאים בדרך כלל להשתמשבסורקי אינטרנט למטרות כריית טקסט ונתונים (‘TDM’) כדי לאסוף נתוני אימון עבור מודלי ה-GPAI שלהם. עם זאת, עליהם להבטיח שסורקים אלה מכבדים טכנולוגיות שנועדו להגביל את הגישה לחומרים המוגנים בזכויות יוצרים, כגון חומות תשלום.
יתר על כן, החתומים מחויבים לא לכלול ‘תחומי פיראטיות’, שהם מקורות מקוונים העוסקים בעיקר בהפצה של חומרים המפרים זכויות יוצרים.
סריקת אינטרנט וזיהוי וציות לביטולי הסכמה ל-TDM
החתומים חייבים להבטיח שסורקי אינטרנט מזהים ומכבדים ביטולי הסכמה ל-TDM שהוכרזו על ידי בעלי זכויות. בעוד שחוק זכויות היוצרים של האיחוד האירופי מתיר בדרך כלל TDM, בעלי זכויות שומרים לעצמם את הזכות לבטל את הסכמתם. עבור תוכן אינטרנט, ביטול הסכמה זה חייב להיות קריא במכונה. הטיוטה השלישית מפרטת את הדרישות לסורקי אינטרנט, ומציינת שהם חייבים לזהות ולציית לפרוטוקול robots.txt הנפוץ. בנוסף, סורקי אינטרנט חייבים לדבוק בביטולי הסכמה אחרים רלוונטיים ל-TDM הניתנים לקריאה במכונה, כגון מטא נתונים שנקבעו כתקן בתעשייה או פתרונות הנפוצים בשימוש על ידי בעלי זכויות.
החתומים נדרשים לנקוט בצעדים סבירים כדי ליידע את בעלי הזכויות על סורקי האינטרנט הנמצאים בשימוש וכיצד סורקים אלה מטפלים בהנחיות robots.txt. מידע זה יכול להיות מופץ בערוצים שונים, כגון הזנת אינטרנט. יש לציין כי הטיוטה השלישית אינה כוללת עוד חובה לפרסם מידע זה.
זיהוי וציות לביטול הסכמה ל-TDM עבור תוכן שאינו נסרק באינטרנט
ספקי מודלי GPAI עשויים גם לרכוש מערכי נתונים מצדדים שלישיים במקום לבצע סריקת אינטרנט בעצמם. בעוד שהטיוטה השנייה חייבה בדיקת נאותות של זכויות יוצרים של מערכי נתונים של צד שלישי, הטיוטה השלישית דורשת מאמצים סבירים להשיג מידע לגבי האם סורקי אינטרנט ששימשו לאיסוף המידע צייתו לפרוטוקולי robots.txt.
הפחתת סיכון למניעת ייצור של פלט המפר זכויות יוצרים
סיכון משמעותי הקשור לשימוש בבינה מלאכותית הוא הפוטנציאל של הבינה המלאכותית ליצור פלט המפר זכויות יוצרים. זה יכול לכלול שכפול קוד או תמונות שנמצאו באינטרנט המוגנים בזכויות יוצרים.
החתומים נדרשים לעשות מאמצים סבירים כדי להפחית סיכון זה. זה מייצג גישה מקלה יותר בהשוואה לטיוטה השנייה, שקבעה אמצעים להימנע מ’התאמת יתר’. הטיוטה השלישית נוקטת עמדה ניטרלית יותר מבחינה טכנולוגית, ומדגישה מאמצים סבירים.
יתר על כן, החתומים חייבים לשלב סעיף בתנאים וההגבלות שלהם (או במסמכים דומים) עבור ספקים של מערכות בינה מלאכותית במורד הזרם, האוסר על השימוש במודל ה-GPAI שלהם באופן המפר זכויות יוצרים.
ייעוד איש קשר
החתומים נדרשים לספק איש קשר לבעלי זכויות. עליהם גם להקים מנגנון המאפשר לבעלי זכויות להגיש תלונות בנוגע להפרות זכויות יוצרים.
על פי הטיוטה השלישית, לחתומים יש אפשרות לסרב לטפל בתלונות הנחשבות בלתי מבוססות או מוגזמות.
העמקה: בחינה מפורטת יותר של הוראות זכויות היוצרים
הטיוטה השלישית, שנראית לכאורה יעילה יותר, מציגה ניואנסים ושינויים בדגש שמצדיקים מבט מקרוב. בואו ננתח כל חלק לעומק:
מדיניות זכויות יוצרים: המעבר מפרסום לעידוד
המנדט הראשוני לפרסם את מדיניות זכויות היוצרים, שהיה קיים בטיוטה השנייה, העלה חששות לגבי חסרונות תחרותיים פוטנציאליים וחשיפה של מידע רגיש. המעבר של הטיוטה השלישית לעידוד פרסום, במקום לדרוש זאת, מכיר בחששות אלה. שינוי זה מאפשר לספקים לשמור על מידה מסוימת של סודיות לגבי אסטרטגיות הציות הפנימיות שלהם, תוך קידום שקיפות. עם זאת, היבט ה’עידוד’ עדיין מפעיל לחץ עדין על הספקים להיות פתוחים לגבי המדיניות שלהם, מה שעלול להוביל לתקן דה-פקטו של פרסום לאורך זמן.
סריקת אינטרנט: איזון בין רכישת נתונים לבין כיבוד זכויות יוצרים
ההיתר המפורש לסריקת אינטרנט, יחד עם הדרישה לכבד מגבלות גישה כמו חומות תשלום, משקף איזון עדין. חוק הבינה המלאכותית מכיר בחשיבות הנתונים לאימון מודלי בינה מלאכותית, אך הוא גם מדגיש את הצורך לכבד את זכויותיהם של יוצרי תוכן. אי הכללה של ‘תחומי פיראטיות’ היא תוספת מכרעת, המכוונת במפורש למקורות העוסקים באופן פעיל בהפרת זכויות יוצרים. הוראה זו מחזקת את העיקרון שפיתוח בינה מלאכותית לא צריך להיות בנוי על בסיס פעילויות בלתי חוקיות.
ביטולי הסכמה ל-TDM: הספציפיות הטכנית של הציות
הדגש של הטיוטה השלישית על פרוטוקול robots.txt ומנגנוני ביטול הסכמה אחרים הניתנים לקריאה במכונה מדגיש את ההיבטים הטכניים של הציות. ספציפיות זו מספקת בהירות הן לספקי GPAI והן לבעלי זכויות. עבור ספקים, היא מתווה צעדים קונקרטיים שעליהם לנקוט כדי להבטיח שהסורקים שלהם יכבדו בקשות לביטול הסכמה. עבור בעלי זכויות, היא מבהירה כיצד הם יכולים לאותת ביעילות על העדפותיהם לגבי TDM. הכללת מטא נתונים ‘תקן תעשייתי’ ופתרונות ‘מאומצים באופן נרחב’ מכירה בכך שהנוף של מנגנוני ביטול הסכמה מתפתח וכי גמישות נחוצה.
תוכן שאינו נסרק באינטרנט: העברת אחריות ובדיקת נאותות
השינוי מ’בדיקת נאותות של זכויות יוצרים’ ל’מאמצים סבירים להשיג מידע’ לגבי מערכי נתונים של צד שלישי מייצג שינוי עדין אך משמעותי באחריות. בעוד שהטיוטה השנייה הטילה נטל כבד יותר על ספקי GPAI לחקור באופן פעיל את מצב זכויות היוצרים של מערכי נתונים, הטיוטה השלישית מתמקדת באימות האם תהליך איסוף הנתונים (על ידי הצד השלישי) כיבד את robots.txt. זה מכיר במשתמע בכך שלספקי GPAI לא תמיד תהיה שליטה ישירה על נוהלי רכישת הנתונים של צדדים שלישיים, אך עדיין יש להם אחריות לברר לגבי ציות.
הפחתת פלט מפר: מ’התאמת יתר’ ל’מאמצים סבירים’
ההתרחקות מהמונח ‘התאמת יתר’ היא שינוי מבורך. ‘התאמת יתר’, מונח טכני בלמידת מכונה, מתייחס למודל שמבצע היטב על נתוני אימון אך בצורה גרועה על נתונים חדשים. בעוד שהתאמת יתר יכולה לתרום להפרת זכויות יוצרים (למשל, על ידי שינון ושכפול של חומר המוגן בזכויות יוצרים), היא אינה הסיבה היחידה. ההתמקדות הרחבה יותר של הטיוטה השלישית ב’מאמצים סבירים להפחתת סיכון’ מקיפה מגוון רחב יותר של תרחישי הפרה פוטנציאליים ומאפשרת גמישות רבה יותר ביישום. שינוי זה גם מכיר בכך שמניעה מושלמת של הפרת זכויות יוצרים עשויה להיות בלתי ניתנת להשגה, וגישה מבוססת סיכון היא מעשית יותר.
איש קשר ומנגנון תלונות: ייעול התהליך
הדרישה לאיש קשר ייעודי ולמנגנון תלונות מספקת לבעלי זכויות דרך ברורה לטפל בהפרות זכויות יוצרים פוטנציאליות. היכולת של החתומים לסרב לתלונות ‘בלתי מבוססות או מוגזמות’ היא תוספת מעשית, המונעת מהמערכת להיות מוצפת בתביעות קלות דעת. הוראה זו מסייעת להבטיח שמנגנון התלונות יישאר כלי בר-קיימא ויעיל לטיפול בחששות לגיטימיים בנוגע לזכויות יוצרים.
ההשלכות הרחבות יותר ושיקולים עתידיים
הטיוטה השלישית של קוד ההתנהגות של GPAI מייצגת צעד משמעותי לקראת הפעלה של הוראות זכויות היוצרים של חוק הבינה המלאכותית. היא מספקת בהירות והכוונה נחוצות לספקי GPAI, תוך שהיא מבקשת להגן על זכויותיהם של יוצרי תוכן. עם זאת, נותרו מספר השלכות רחבות יותר ושיקולים עתידיים:
תקן ‘המאמצים הסבירים’: השימוש החוזר בביטוי ‘מאמצים סבירים’ מציג מידה של סובייקטיביות. מה שמהווה ‘סביר’ כנראה יהיה נתון לפרשנות ועשוי להתפתח עם הזמן באמצעות אתגרים משפטיים ושיטות עבודה מומלצות בתעשייה. עמימות זו עלולה להוביל לאי ודאות עבור ספקים, אך היא גם מאפשרת גמישות והתאמה להקשרים שונים.
תפקידם של ספקי המשך: בעוד שהקוד מכוון בעיקר לספקי GPAI, לספקי המשך יש אינטרס מובהק בהבנת הוראותיו. הקוד קובע ציפיות לאיכות ולציות של מודלי GPAI, שיכולים להשפיע על משא ומתן חוזי והערכות סיכונים. ספקי המשך עשויים גם לעמוד בפני לחץ עקיף להבטיח שהשימוש שלהם במודלי GPAI תואם את עקרונות הקוד.
התפתחות הטכנולוגיה: הקצב המהיר של פיתוח הבינה המלאכותית פירושו שקוד ההתנהגות יצטרך להיות מסמך חי. טכניקות חדשות לרכישת נתונים, אימון מודלים ויצירת פלט עשויות להופיע, המחייבות עדכונים להוראות הקוד. ההתייחסות למטא נתונים ‘תקן תעשייתי’ ולפתרונות ‘מאומצים באופן נרחב’ מכירה בצורך זה בהתאמה מתמשכת.
התאמה בינלאומית: חוק הבינה המלאכותית של האיחוד האירופי הוא חקיקה חלוצית, אך הוא אינו פועל בחלל ריק. תחומי שיפוט אחרים מתמודדים גם הם עם האתגרים של הסדרת בינה מלאכותית. התאמה בינלאומית של תקנות בינה מלאכותית, כולל הוראות זכויות יוצרים, תהיה מכרעת כדי למנוע פיצול ולהבטיח מגרש משחקים שווה למפתחי בינה מלאכותית.
ההשפעה על חדשנות: קוד ההתנהגות נועד ליצור איזון בין קידום חדשנות בבינה מלאכותית לבין הגנה על זכויות יוצרים. עם זאת, ההשפעה של תקנות אלה על הקצב והכיוון של פיתוח הבינה המלאכותית עדיין לא נראתה. יש הטוענים שתקנות מחמירות מדי עלולות לחנוק חדשנות, בעוד שאחרים טוענים שכללים ברורים נחוצים כדי לטפח פיתוח אחראי של בינה מלאכותית.
אכיפה וניטור: כיצד תיבדק ההקפדה? האפקטיביות של הקודים תהיה תלויה במידה רבה במנגנונים שיוקמו לאכיפה ולניטור.
הטיוטה השלישית של קוד ההתנהגות של GPAI היא מסמך מורכב ומתפתח עם השלכות מרחיקות לכת. היא מייצגת מאמץ משמעותי להתמודד עם האתגרים של ציות לזכויות יוצרים בעידן הבינה המלאכותית, אך היא גם עבודה בתהליך. דיאלוג מתמשך בין בעלי עניין, כולל ספקי GPAI, בעלי זכויות, קובעי מדיניות וקהילת הבינה המלאכותית הרחבה יותר, יהיה חיוני כדי להבטיח שהקוד ישיג את מטרותיו המיועדות ויישאר רלוונטי לנוכח השינוי הטכנולוגי המהיר.