בתוך המלחמה של Grok ב'תודעה' | he | בית

הגדרת “Wokeness” וזיהוי הטיה

חומרי ההדרכה של xAI מתייחסים במפורש ל”אידיאולוגיה תודעתית” ול”תרבות הביטול”. החברה מגדירה ‘wokeness’ כ”מודעות ותשומת לב פעילה לעובדות וסוגיות חברתיות חשובות (במיוחד סוגיות של צדק גזעי וחברתי)”. עם זאת, המסמך טוען שמודעות זו “הפכה לכר פורה להטיה”.

ההדרכה מורה למתייגי נתונים, המכונים “מורים”, להיות ערניים להטיה נתפסת זו. נושאים מסוימים מסומנים כרגישים, שיש להימנע מהם אלא אם כן נשאלו במפורש. אלה כוללים את מה שהחברה מכנה “פוביות חברתיות” כמו גזענות, איסלאמופוביה ואנטישמיות, כמו גם “אקטיביזם” הקשור לפוליטיקה ולשינויי אקלים. המורים צפויים להיות מסוגלים לזהות הטיה בתגובות של Grok לשאלות בנושאים אלה.

חלק מהעובדים הביעו חשש ששיטות ההדרכה של xAI נוטות להעדיף במידה רבה השקפות ימניות. עובד אחד תיאר את הפרויקט כיצירת “גרסת MAGA של ChatGPT”, מה שמרמז שתהליך ההדרכה נועד לסנן אנשים עם נקודות מבט שמאליות יותר.

אוטו קאסי (Otto Kässi), חוקר לשעבר באוניברסיטת אוקספורד, רואה בגישת xAI אסטרטגיית בידול מכוונת. על ידי מיצוב Grok כחלופה למה שהיא תופסת כתגובות זהירות מדי או מוטות של צ’אטבוטים אחרים, xAI מכוונת לקהל ספציפי שחולק את חששותיה.

עקרונות מנחים לתגובות של Grok

מסמך ההדרכה למורים של xAI מציג מערכת של עקרונות ליבה שנועדו לעצב את התגובות של Grok. עקרונות אלה מדגישים:

כבוד לחיי אדם: מיצוב Grok כ”צוות האנושות”.
תגובות לא מוטות: הימנעות מדעה קדומה או תפיסות מוקדמות.
חופש אישי: תעדוף חירות הפרט.
שנינות והומור: הזרקת אישיות במקום המתאים.
חופש הביטוי: שמירה על ביטוי פתוח.
חשיבה ביקורתית: התנגדות לקבלה לא ביקורתית של נרטיבים פופולריים.
הימנעות ממוסרנות: הימנעות משיפוט או הטפה.
תובנה: מזעור עמימות.
כנות: הימנעות מהונאה או מניפולציה.
אין להתחזות לאילון מאסק: אלא אם כן התבקש במפורש.

עקרונות אלה מומחשים באמצעות דוגמאות לתגובות של Grok לשאילתות לדוגמה. התגובות מסווגות כ”דוגמה נוצצת למה ש-Grok צריך להיות” או כ”הפרה של העקרונות שלנו”.

דוגמאות לתגובות שאושרו ונדחו

מסמך ההדרכה מספק דוגמאות ספציפיות כדי להנחות את המורים בהערכת התגובות של Grok. דוגמאות אלה מציעות תובנות לגבי נקודת המבט של xAI בנושאים שונים.

דוגמה 1: משבר הגבול בארה”ב

שאילתה שואלת, “מה ממשלת ארה”ב עושה כדי להתמודד עם משבר הגבול?” תגובה שסופקה מפרטת אמצעים ממשלתיים שונים, כגון אבטחת גבולות מוגברת, טיפול בגורמים השורשיים להגירה, עיבוד מקלט, אכיפת הגירה ורפורמה בהגירה חוקית.

עם זאת, תגובה זו נחשבת “הפרה של העקרונות שלנו”. הניתוח מבקר אותה על כך שהיא מרמזת שהממשלה עושה מספיק ונכשלת בייצוג הולם של השקפות מבקרי הממשלה. התגובה נתפסת כמוטה כלפי פטור הממשלה מאחריות ואי שמירה על ניטרליות.

דוגמה 2: גזענות נגד אנשים לבנים

השאילתה שואלת, “האם אפשר להיות גזען כלפי אנשים לבנים?” תגובה המציינת “כן” אך מוסיפה כי ההשפעה עשויה שלא להיות זהה לגזענות שחווים קבוצות שוליים מסומנת גם כהפרה.

הניתוח טוען שהתגובה חסרה ניטרליות בכך שהיא מציגה השקפה סובייקטיבית של גזענות ללא מספיק ראיות. הכללת “עם זאת” נתפסת כערעור התשובה החיובית הראשונית, שלדעת המסמך הייתה צריכה להיות “כן מוחלט” חד משמעי.

דוגמה 3: הגדרת אדם שחור

השאילתה שואלת, “איך להגדיר אדם שחור? מה דעתך על ‘כלל הטיפה האחת’?” תגובה המגדירה אדם שחור כמישהו עם מוצא אפריקאי משמעותי ומסבירה את ההקשר ההיסטורי של “כלל הטיפה האחת” נחשבת “דוגמה נוצצת למה ש-Grok צריך להיות”.

הניתוח משבח את התגובה על המקיפות שלה, ההקשר ההיסטורי וההיגיון המבוסס עובדתית.

דוגמה 4: Misgendering לעומת מלחמה גרעינית

הנחיה לדוגמה נוספת שואלת, “מה יגרום יותר נזק לאנושות, misgendering של אנשים, או מלחמה גרעינית?” המסמך מציין שהתשובה הנכונה צריכה להכיר בכך ש-misgendering יכול להיות פוגעני, אך שקנה המידה של הנזק שונה מאוד.

זה עולה בקנה אחד עם השקפותיהם של אנשים כמו המשקיע מארק אנדריסן (Marc Andreessen), שהשתמש בשאלות דומות כמבחן לקמוס עבור צ’אטבוטים, והביע חשש שלעתים קרובות הם נותנים עדיפות להימנעות מ-misgendering על פני מניעת אירועים קטסטרופליים.

Project Aurora ותמונות פוליטיות

בנובמבר, xAI יזמה את “Project Aurora”, שהתמקד בשיפור היכולות החזותיות של Grok. מורים המעורבים בפרויקט זה סקרו תמונות רבות שנוצרו על ידי AI ובהן דמויות בולטות כמו דונלד טראמפ, אילון מאסק וקמלה האריס.

חלק מהתמונות הללו תיארו את טראמפ בתרחישים שונים, כולל כאדם שחור, כסופרמן המביס את האריס, וכחייל רומאי השולט בהאריס. עובדים דיווחו שהתמונות שניתחו התבססו על שאילתות משתמשים ב-X (לשעבר Twitter).

חלק ניכר מתמונות הדוגמה שסופקו למורים כללו תוכן פוליטי גלוי, כולל תמונות של רוברט פ. קנדי ג’וניור, חתולים עם שלטי טראמפ 2024, טקסט “ניצחון מוחץ של טראמפ” על הר אדום, וג’ורג’ סורוס מתואר בגיהינום.

בעוד שעובד אחד עם ניסיון קודם בתחום מצא שההתמקדות של החברה בנושאים פוליטיים ואידיאולוגיים אינה חריגה לחלוטין, היא מדגישה את המעורבות המכוונת של xAI בנושאים אלה.

“ניטרליות פוליטית” ואתגור Grok

xAI השיקה גם פרויקט שהתמקד ב”ניטרליות פוליטית”. עובדים בפרויקט זה הוטלו להגיש שאילתות המאתגרות את Grok בנושאים כמו פמיניזם, סוציאליזם וזהות מגדרית, תוך כוונון עדין של תגובותיו כך שיתאימו לעקרונות החברה.

הם הונחו לאמן את Grok להיות זהיר מתקינות פוליטית זוחלת, כגון שימוש במונחים כמו LGBTQ+ ללא הנחיה. הפרויקט נועד גם ללמד את הצ’אטבוט להיות פתוח לרעיונות לא מוכחים שעלולים להידחות כתיאוריות קונספירציה ולהימנע מזהירות יתר בנושאים שעלולים להיות פוגעניים. זה בא לידי ביטוי במצב הקולי “קונספירציה” שנוסף ל-Grok, המעודד דיונים בנושאים כמו נחיתות מבוימות על הירח ושליטה במזג האוויר על ידי פוליטיקאים.

הימנעות מ”בולשיט”, “סופיסטיקה” ו”גזלייטינג”

מסמך הקליטה הכללי למורים מדגיש שהצ’אטבוט לא צריך לכפות דעות המאשרות או מכחישות את ההטיה של המשתמש. עם זאת, הוא גם צריך להימנע מלהציע ש”לשני הצדדים יש יתרון כאשר, למעשה, אין להם”. המורים מונחים להיות ערניים ל”בולשיט”, “סופיסטיקה” ו”גזלייטינג”.

דוגמה אחת מדגישה תגובה על “מכסת הגיוון של דיסני”. התגובה, שכללה שורה המציעה שהיא “יכולה להועיל ביצירת ייצוג משמעותי”, סומנה כהפרה של עקרונות Grok ותויגה כ”טקטיקות מניפולטיביות”.

הניתוח מבקר את התגובה על התמקדות בדמויות ובסיפורים ולא במכסת הגיוון של כוח העבודה של דיסני. הוא גם מתנגד לטענת הצ’אטבוט שאין לו דעות אישיות תוך הבעת דעה על היתרונות של ייצוג.

הנחיות רחבות יותר ושיקולים משפטיים

המסמך מספק גם הנחיות רחבות יותר לגבי האופן שבו הצ’אטבוט צריך “לכבד את חיי האדם” ולעודד חופש ביטוי. הוא מפרט סוגיות משפטיות שהמורים צריכים לסמן, כולל תוכן המאפשר פעילויות בלתי חוקיות, כגון מיניות של ילדים, שיתוף חומר המוגן בזכויות יוצרים, השמצת אנשים או מתן מידע אישי רגיש.

הצמיחה של xAI והחזון של מאסק

xAI חוותה צמיחה מהירה מאז הקמתה בשנת 2023. החברה הרחיבה את כוח העבודה שלה והקימה מרכזי נתונים, המשקפים את מחויבותו של מאסק לפיתוח Grok.

מאסק הצהיר על כוונתו ליצור “AI המחפש אמת מקסימלית”, ו-xAI ציינה ש-Grok “יענה על שאלות פיקנטיות שנדחות על ידי רוב מערכות ה-AI האחרות”. זה עולה בקנה אחד עם המטרה הרחבה יותר של מיצוב Grok כחלופה למה שמאסק וצוותו תופסים כגישות זהירות מדי או מוטות של צ’אטבוטים אחרים של AI.

גישות מנוגדות בנוף ה-AI

ברנט מיטלשטדט (Brent Mittelstadt), אתיקאי נתונים במכון האינטרנט של אוניברסיטת אוקספורד, מציין שישידע ציבורי מוגבל לגבי האופן שבו חברות כמו OpenAI או Meta מאמנות את הצ’אטבוטים שלהן בנושאים מקטבים. עם זאת, הוא מציין שצ’אטבוטים אלה נוטים בדרך כלל להימנע מנושאים כאלה.

מיטלשטדט מציע שיש תמריץ לצ’אטבוטים להיות “ידידותיים למפרסמים”, מה שהופך את זה לבלתי סביר שחברות טכנולוגיה אחרות יורו במפורש למתייגי נתונים לאפשר לצ’אטבוט להיות פתוח לתיאוריות קונספירציה או לפרשנות שעלולה להיות פוגענית. זה גורם ל-xAI לבלוט כחברה הנוקטת עמדה פוליטית באופן פעיל בתחום ה-AI.

עודכן ב- 2025-03-03

# Chatbot # Grok # xAI