מטא מואשמת בהסוואה של קוד פתוח

מטא, ענקית הטכנולוגיה, נמצאת בעיצומו של גל חדש של ביקורת, כאשר היא עומדת בפני האשמות של “הסוואה של קוד פתוח” (Open Washing). מחלוקת זו נובעת מחסותה על נייר מחקר של קרן לינוקס (Linux Foundation) אשר מתעמק בנוף המתפתח של פתרונות AI בקוד פתוח (open-source AI solutions). ליבת הבעיה טמונה בתפיסה שמטא ממנפת את החסות הזו כדי לקדם את מודלי ה-Llama AI שלה, תוך עקיפת ההגדרה האמיתית של “קוד פתוח”.

המחקר של קרן לינוקס: חרב פיפיות

המחקר של קרן לינוקס, שפורסם בתחילת החודש, תומך ביתרונות של מערכות AI בקוד פתוח, תוך הדגשת הכדאיות הכלכלית שלהן עבור עסקים בכל הגדלים, במיוחד ארגונים קטנים. המחקר מצביע על כך שארגונים הבוחרים במודלי AI בקוד סגור עלולים לשאת בהוצאות תוכנה הגבוהות פי שלושה וחצי מאלה המשתמשים בחלופות קוד פתוח.

מחקר זה תואם למאגר גדל והולך של עדויות התומכות ביתרונות של AI בקוד פתוח. לדוגמה, סקר שנערך על ידי IBM ו-Morning Consult בינואר חשף כי ליותר ממחצית מהארגונים המשתמשים בכלי AI בקוד פתוח יש סיכוי גבוה יותר לחוות החזר השקעה (ROI) חיובי. יתר על כן, שני חמישיות מהמשיבים שטרם אימצו פתרונות AI בקוד פתוח הביעו את כוונתם לשלב כלים אלה בפרויקטי ה-AI שלהם בשנה הקרובה.

עם זאת, מעורבותה של מטא במחקר של קרן לינוקס הציתה מחלוקת, כאשר מבקרים טוענים כי היא משמשת מסע שיווק מוסווה היטב עבור מודלי ה-Llama AI של החברה.

הדילמה של “קוד פתוח”: Llama תחת ביקורת

אמנדה ברוק (Amanda Brock), מנכ”לית OpenUK, טוענת כי מודלי ה-Llama של מטא אינם עומדים בקריטריונים הדרושים כדי להיות מסווגים כ”קוד פתוח” אמיתי. היא מציינת כי לא מטא ולא המחקר מכירים בסתירה הזו.

“Llama אינו ‘קוד פתוח’, ללא קשר להגדרה שתבחרו”, הצהירה ברוק. “אני באופן אישי מעדיפה את הגדרת תוכנת הקוד הפתוח (OSD) מיוזמת הקוד הפתוח (OSI). Llama לא מצליחה לעמוד בתקן הקוד הפתוח שלה מסיבות שונות, כולל שילוב של הגבלה מסחרית ברישוי שלה”.

ברוק פירטה עוד על ההשלכות של הגבלה זו: “מגבלה זו משבשת את הזרימה החופשית המרכזית ברישוי קוד פתוח ויוצרת חיכוך. אנו מסתמכים על כך שקוד פתוח יהיה שמיש על ידי כל אחד לכל מטרה, ו-Llama אינו ממלא דרישה זו”.

טענות הקוד הפתוח של מטא: סוגיה שנויה במחלוקת

טווח מודלי ה-Llama של מטא מסומנים כ”קוד פתוח”, אך החברה התמודדה עם אתגרים מתמשכים מבעלי עניין בתעשייה בנוגע לטענה זו. נקודת המחלוקת העיקרית סובבת סביב פרשנויות שונות לגבי מה מהווה באמת “קוד פתוח”.

ליבת המחלוקת טמונה בתנאי הרישוי המוטלים על משתמשים ברגע שהם מגיעים לרמה מסוימת של מסחור. בעוד שמודלי Llama מציעים גישה פתוחה, מגבלות מוטלות על משתמשים בנסיבות ספציפיות.

מוקדם יותר השנה, יוזמת הקוד הפתוח (OSI) מתחה ביקורת פומבית על מטא בנושא זה, בטענה שהחברה “ממשיכה לקדם באופן שקרי את Llama כקוד פתוח”.

ברוק מכירה במאמצים של מטא עם טווח ה-Llama כ”צעד בכיוון הנכון” בקידום מודעות לקוד פתוח, ומדגישה כי עדיין נדרשת התקדמות משמעותית כדי לטפל ביעילות ב”הסוואה של קוד פתוח” בתוך תעשיית הטכנולוגיה.

“כאשר אתר האינטרנט של מטא מדגיש טייק אווי מרכזי מהדו”ח שלהם כ’מחקר של קרן לינוקס מראה כיצד מודלי AI בקוד פתוח, כמו Llama, מניעים צמיחה כלכלית, חדשנות ותחרות על ידי הנגשת פתרונות טכנולוגיים חיוניים יותר’, אין זה מפתיע שה-OSI קמה על רגליה האחוריות ומאשימה את קרן לינוקס בתמיכה בהסוואה של קוד פתוח”, ציינה ברוק.

היא הדגישה עוד את ההשלכות הרחבות יותר של הסוואה של קוד פתוח, באומרה, “הסוואה של קוד פתוח היא לא רק נושא של קוד פתוח כיום. כאשר רגולטורים כמו האיחוד האירופי משתמשים במונח קוד פתוח כבסיס לחריגים לאחריות בבינה מלאכותית ובסטנדרטים שיש לעמוד בהם בבינה מלאכותית, ההשפעה של הסוואה של קוד פתוח הפכה לחברתית”.

מעבר למטא: מגמה תעשייתית רחבה יותר

מטא אינה היחידה מפתחת בתעשייה שנלכדה בצלב האש של הוויכוח על הגדרת הקוד הפתוח.

במרץ 2024, Databricks השיקה מודל שפה גדול משלה, DBRX, אשר מומחים טענו גם הוא שלא דבק בתקני קוד פתוח. זה יוחס להכללת מדיניות שימוש מקובלת חיצונית ולפעולה שלו תחת רישיון מחוץ לתחום השיפוט של מסגרת ה-OSI. מחלוקת ה-DBRX מדגישה עוד יותר את העמימות והמורכבות סביב המונח “קוד פתוח” ואת האתגרים העומדים בפני מפתחים בניווט בין הפרשנויות השונות שלו. הוויכוח מדגיש את הצורך בבהירות ותקינה רבה יותר בהגדרת עקרונות קוד פתוח, במיוחד בתחום הבינה המלאכותית המתפתח במהירות. ללא הגדרה מקובלת אוניברסלית, הסיכון להסוואה של קוד פתוח ימשיך להתקיים, ועלול לערער את המהימנות והיושרה של תנועת הקוד הפתוח.

הגדרת קוד פתוח: העקרונות המרכזיים

כדי להבין את המחלוקת סביב Llama של מטא ו-DBRX של Databricks, חיוני להתעמק בעקרונות היסוד המגדירים תוכנת קוד פתוח. יוזמת הקוד הפתוח (OSI) מספקת הגדרה מוכרת באופן נרחב, המתארת עשרה קריטריונים מרכזיים שרישיון תוכנה חייב לעמוד בהם כדי להיחשב לקוד פתוח:

  1. הפצה חוזרת חופשית: הרישיון לא יגביל אף צד למכור או למסור את התוכנה כרכיב בהפצת תוכנה מצטברת המכילה תוכניות ממקורות שונים. הרישיון לא ידרוש תמלוגים או עמלה אחרת עבור מכירה כזו.
  2. קוד מקור: התוכנית חייבת לכלול קוד מקור, וחייבת לאפשר הפצה בקוד מקור כמו גם בצורה מהודרת. כאשר צורה כלשהי של מוצר אינה מופצת עם קוד מקור, חייבת להיות אמצעי מפורסם היטב להשגת קוד המקור בעלות שעתוק סבירה בלבד - רצוי, הורדה דרך האינטרנט ללא תשלום. קוד המקור חייב להיות הצורה המועדפת שבה מתכנת היה משנה את התוכנית. קוד מקור מוסווה בכוונה אינו מותר. צורות ביניים כגון הפלט של מעבד מקדים או מתרגם אינן מותרות.
  3. עבודות נגזרות: הרישיון חייב לאפשר שינויים ועבודות נגזרות, וחייב לאפשר להפיץ אותן תחת אותם תנאים כמו הרישיון של התוכנה המקורית.
  4. שלמות קוד המקור של המחבר: הרישיון עשוי להגביל קוד מקור מהפצה בצורה שונה רק אם הרישיון מאפשר הפצה של “קבצי תיקון” עם קוד המקור לצורך שינוי התוכנית בזמן הבנייה. הרישיון חייב לאפשר במפורש הפצה של תוכנה שנבנתה מקוד מקור שונה. הרישיון עשוי לדרוש שעבודות נגזרות ישאו שם או מספר גרסה שונים מהתוכנה המקורית.
  5. אין אפליה נגד אנשים או קבוצות: הרישיון אסור להפלות נגד אדם או קבוצת אנשים כלשהי.
  6. אין אפליה נגד תחומי מאמץ: הרישיון אסור להגביל אף אחד מלעשות שימוש בתוכנית בתחום ספציפי של מאמץ. לדוגמה, הוא עשוי שלא להגביל את השימוש בתוכנית בעסק, או לשימוש במחקר גנטי.
  7. הפצת רישיון: הזכויות הקשורות לתוכנית חייבות לחול על כל מי שאליו מופצת התוכנית מחדש ללא צורך בביצוע רישיון נוסף על ידי צדדים אלה.
  8. הרישיון אסור להיות ספציפי למוצר: הזכויות הקשורות לתוכנית אסור שתלויות בתוכנית כחלק מהפצת תוכנה מסוימת. אם התוכנית מחולצת מהפצה זו ומשתמשת או מופצת בתוך תנאי הרישיון של התוכנית, לכל הצדדים שאליהם מופצת התוכנית מחדש צריכות להיות אותן זכויות כמו הזכויות המוענקות בשילוב עם הפצת התוכנה המקורית.
  9. הרישיון אסור להגביל תוכנה אחרת: הרישיון אסור להטיל הגבלות על תוכנה אחרת המופצת יחד עם התוכנה המורשית. לדוגמה, הרישיון אסור להתעקש שכל התוכניות האחרות המופצות על אותו מדיום יהיו תוכנת קוד פתוח.
  10. הרישיון חייב להיות ניטרלי טכנולוגית: אין להתבסס על הוראה ברישיון על טכנולוגיה אינדיבידואלית או סגנון ממשק כלשהו.

עקרונות אלה מדגישים את החשיבות של חופש, שקיפות ושיתוף פעולה במערכת האקולוגית של הקוד הפתוח. כאשר רישיון תוכנה חורג מעקרונות אלה, הוא מעלה שאלות לגבי האם ניתן באמת לראות בתוכנה קוד פתוח. במקרה של Llama של מטא ו-DBRX של Databricks, החששות סובבים סביב הגבלות מסחריות, מדיניות שימוש מקובלות ומסגרות רישיון שאולי אינן תואמות באופן מלא את ההגדרה של ה-OSI.

ההשלכות של “הסוואה של קוד פתוח”

התופעה של “הסוואה של קוד פתוח”, שבה חברות מציגות באופן שגוי את התוכנה שלהן כקוד פתוח כאשר היא אינה עומדת במלואה בקריטריונים, עלולה להיות בעלת מספר השלכות שליליות:

  • שחיקת אמון: זה יכול לשחוק את האמון בתנועת הקוד הפתוח כולה, מה שמקשה על משתמשים להבחין בין פרויקטי קוד פתוח אמיתיים לבין כאלה שרק מעמידים פנים.
  • הרתעת תרומה: זה יכול להרתיע תרומות ממפתחים שמחויבים לעקרונות הקוד הפתוח, מכיוון שהם עשויים להרגיש שהמאמצים שלהם נחלשים על ידי חברות שלא משחקות לפי אותם כללים.
  • אי ודאות משפטית: זה יכול ליצור אי ודאות משפטית עבור משתמשים שמסתמכים על התוכנה, מכיוון שהם עשויים להיות לא בטוחים לגבי הזכויות והחובות שלהם תחת הרישיון.
  • עיכוב חדשנות: זה יכול לעכב חדשנות על ידי הגבלת החופש לשנות ולהפיץ מחדש את התוכנה, שהוא מניע מרכזי של חדשנות בקהילת הקוד הפתוח.

לכן, חיוני שחברות יהיו שקופות לגבי תנאי הרישוי של התוכנה שלהן וימנעו מלהעלות טענות מטעות לגבי מעמד הקוד הפתוח שלה.

הצורך בבהירות וסטנדרטיזציה רבה יותר

הוויכוח המתמשך על Llama של מטא ו-DBRX של Databricks מדגיש את הצורך בבהירות וסטנדרטיזציה רבה יותר בהגדרת עקרונות קוד פתוח. היעדר הגדרה מקובלת אוניברסלית יוצר בלבול ומאפשר לחברות לנצל פרצות ולעסוק בהסוואה של קוד פתוח.

מספר יוזמות מתקיימות כדי לטפל בנושא זה:

  • יוזמת הקוד הפתוח (OSI): ה-OSI ממשיכה למלא תפקיד מכריע בהגדרת וקידום עקרונות קוד פתוח. הוא מספק הגדרה מוכרת באופן נרחב של קוד פתוח ומאשר רישיונות העומדים בקריטריונים שלו.
  • קרן לינוקס: קרן לינוקס פועלת לקידום שיתוף פעולה וחדשנות בקהילת הקוד הפתוח. הוא מספק פלטפורמה לפרויקטי קוד פתוח ומארח אירועים המפגישים מפתחים, משתמשים וחברות.
  • האיחוד האירופי (EU): האיחוד האירופי מכיר יותר ויותר בחשיבות הקוד הפתוח ומשלב אותו במדיניות ובתקנות שלו. הוא משתמש במונח “קוד פתוח” כבסיס לחריגים לאחריות בבינה מלאכותית ולבסטנדרטים שיש לעמוד בהם בבינה מלאכותית.

יוזמות אלה מסייעות ליצור מערכת אקולוגית שקופה וסטנדרטית יותר של קוד פתוח. עם זאת, יש צורך בעבודה נוספת כדי להבטיח שעקרונות הקוד הפתוח מוגדרים בבירור ומיושמים באופן עקבי.

התקדמות: שקיפות ואחריות

כדי להילחם ביעילות בהסוואה של קוד פתוח ולקדם קוד פתוח אמיתי, נדרשת גישה רב-גונית:

  • שקיפות: חברות חייבות להיות שקופות לגבי תנאי הרישוי של התוכנה שלהן וימנעו מלהעלות טענות מטעות לגבי מעמד הקוד הפתוח שלה.
  • אחריות: ארגונים בתעשייה וגופים רגולטוריים חייבים להטיל על חברות אחריות על טענות הקוד הפתוח שלהן ולנקוט פעולה נגד אלה העוסקים בהסוואה של קוד פתוח.
  • חינוך: יש לחנך משתמשים ומפתחים לגבי עקרונות קוד פתוח וכיצד לזהות פרויקטי קוד פתוח אמיתיים.
  • שיתוף פעולה: קהילת הקוד הפתוח חייבת להמשיך לשתף פעולה כדי להגדיר ולקדם עקרונות קוד פתוח ולפתח כלים ומשאבים שעוזרים למשתמשים ולמפתחים לנווט במערכת האקולוגית של הקוד הפתוח.

על ידי עבודה משותפת, אנו יכולים ליצור מערכת אקולוגית שקופה, אחראית וחדשנית יותר של קוד פתוח שממטבת את כולם. עתיד הבינה המלאכותית וטכנולוגיות אחרות תלוי בכך.