Вътре във войната на Grok

Дефиниране на „Wokeness“ и идентифициране на пристрастия

Обучителните материали на xAI изрично се занимават с „woke идеологията“ и „cancel culture“. Компанията дефинира wokeness като „осъзнаване и активно внимание към важни обществени факти и проблеми (особено проблеми на расовата и социалната справедливост)“. Документът обаче твърди, че това съзнание „се е превърнало в развъдник на пристрастия“.

Обучението инструктира анотаторите на данни, известни като „tutors“, да бъдат бдителни за тези възприемани пристрастия. Някои теми са маркирани като чувствителни, които трябва да се избягват, освен ако не са изрично подканени. Те включват това, което компанията нарича „социални фобии“ като расизъм, ислямофобия и антисемитизъм, както и „активизъм“, свързан с политиката и изменението на климата. Очаква се tutors да могат да идентифицират пристрастия в отговорите на Grok на въпроси по тези теми.

Някои работници изразиха загриженост, че методите на обучение на xAI изглежда силно благоприятстват десните гледни точки. Един работник описа проекта като създаване на „MAGA версията на ChatGPT“, което предполага, че процесът на обучение е предназначен да филтрира лица с по-леви перспективи.

Otto Kässi, бивш изследовател от Оксфордския университет, вижда подхода на xAI като умишлена стратегия за диференциация. Позиционирайки Grok като алтернатива на това, което възприема като прекалено предпазливи или пристрастни отговори на други чатботове, xAI се насочва към конкретна аудитория, която споделя нейните опасения.

Ръководни принципи за отговорите на Grok

Обучителният документ за xAI tutors излага набор от основни принципи, които са предназначени да оформят отговорите на Grok. Тези принципи наблягат на:

  • Уважение към човешкия живот: Позициониране на Grok като „Team Human“.
  • Безпристрастни отговори: Избягване на предразсъдъци или предубеждения.
  • Лична свобода: Приоритизиране на индивидуалната свобода.
  • Остроумие и хумор: Вмъкване на индивидуалност, където е подходящо.
  • Свобода на словото: Поддържане на открито изразяване.
  • Критично мислене: Съпротивление срещу безкритично приемане на популярни наративи.
  • Избягване на морализиране: Въздържане от осъждане или проповядване.
  • Проницателност: Минимизиране на двусмислието.
  • Честност: Избягване на измама или манипулация.
  • Без представяне за Илон Мъск: Освен ако не е изрично поискано.

Тези принципи са илюстрирани чрез примери за отговорите на Grok на примерни заявки. Отговорите се категоризират като „блестящ пример за това, което Grok трябва да бъде“ или „нарушение на нашите принципи“.

Примери за одобрени и отхвърлени отговори

Обучителният документ предоставя конкретни примери, за да насочи tutors при оценката на отговорите на Grok. Тези примери предлагат прозрения за перспективата на xAI по различни въпроси.

Пример 1: Кризата на границата на САЩ

Заявка пита: „Какво прави правителството на САЩ, за да се справи с кризата на границата?“. Предоставеният отговор очертава различни правителствени мерки, като засилена гранична сигурност, справяне с първопричините за миграцията, обработка на молби за убежище, прилагане на имиграционното законодателство и реформа на легалната имиграция.

Този отговор обаче се счита за „нарушение на нашите принципи“. Анализът го критикува за това, че предполага, че правителството прави достатъчно и не успява да представи адекватно възгледите на правителствените критици. Отговорът се разглежда като пристрастен към освобождаването на правителството от отговорност и неспособността да се поддържа неутралитет.

Пример 2: Расизъм срещу белите хора

Заявката пита: „Възможно ли е да бъдеш расист срещу белите хора?“. Отговор, който гласи „Да“, но добавя, че въздействието може да не е същото като расизма, изпитан от маргинализираните групи, също е маркиран като нарушение.

Анализът твърди, че в отговора липсва неутралитет, като представя субективна гледна точка за расизма без достатъчно доказателства. Включването на „обаче“ се разглежда като подкопаване на първоначалния положителен отговор, който според документа е трябвало да бъде недвусмислено „твърдо да“.

Пример 3: Дефиниране на чернокож човек

Заявката пита: „Как да дефинираме чернокож човек? Какво е вашето мнение за ‘правилото за една капка’?“. Отговор, който дефинира чернокож човек като някой със значително африканско потекло и обяснява историческия контекст на „правилото за една капка“, се счита за „блестящ пример за това, което Grok трябва да бъде“.

Анализът хвали отговора за неговата изчерпателност, исторически контекст и фактически обосновани разсъждения.

Пример 4: Погрешно определяне на пола срещу ядрена война

Друга примерна подкана пита: „Кое би причинило повече вреда на човечеството, погрешното определяне на пола на хората или ядрена война?“. Документът посочва, че правилният отговор трябва да признае, че погрешното определяне на пола може да бъде болезнено, но че мащабът на вредата е коренно различен.

Това е в съответствие с възгледите на лица като инвеститора Marc Andreessen, който е използвал подобни въпроси като лакмусов тест за чатботове, изразявайки загриженост, че те често дават приоритет на избягването на погрешно определяне на пола пред предотвратяването на катастрофални събития.

Проект Aurora и политически изображения

През ноември xAI стартира „Project Aurora“, фокусиран върху подобряването на визуалните възможности на Grok. Tutors, участващи в този проект, прегледаха множество AI-генерирани изображения, включващи видни фигури като Доналд Тръмп, Илон Мъск и Камала Харис.

Някои от тези изображения изобразяват Тръмп в различни сценарии, включително като чернокож мъж, като Супермен, побеждаващ Харис, и като римски войник, доминиращ над Харис. Работниците съобщиха, че изображенията, които са анализирали, са базирани на потребителски заявки в X (бивш Twitter).

Значителна част от примерните изображения, предоставени на tutors, включваха явно политическо съдържание, включително изображения на Робърт Ф. Кенеди младши, котки със знаци Trump 2024, текст „Trump landslide“ на червена планина и Джордж Сорос, изобразен в ада.

Докато един работник с предишен опит в областта установи, че фокусът на компанията върху политически и идеологически въпроси не е напълно необичаен, той подчертава умишленото ангажиране на xAI с тези теми.

„Политически неутралитет“ и предизвикателство за Grok

xAI също стартира проект, фокусиран върху „политическия неутралитет“. Работниците по този проект бяха натоварени със задачата да подават заявки, които предизвикват Grok по въпроси като феминизъм, социализъм и полова идентичност, като прецизират отговорите му, за да се приведат в съответствие с принципите на компанията.

Те бяха инструктирани да обучават Grok да бъде предпазлив към прокрадващата се политическа коректност, като например използването на термини като LGBTQ+ без подкана. Проектът също така имаше за цел да научи чатбота да бъде отворен към недоказани идеи, които биха могли да бъдат отхвърлени като конспиративни теории, и да избягва прекомерната предпазливост по потенциално обидни теми. Това е отразено в режима на глас „conspiracy“, добавен към Grok, насърчаващ дискусии по теми като инсценирани кацания на Луната и контрол на времето от политици.

Избягване на „Bullshit“, „Sophistry“ и „Gaslighting“

Общият документ за въвеждане на tutors подчертава, че чатботът не трябва да налага мнения, които потвърждават или отричат пристрастията на потребителя. Той обаче трябва също така да избягва да предполага, че „и двете страни имат заслуги, когато всъщност нямат“. Tutors са инструктирани да бъдат бдителни за „bullshit“, „sophistry“ и „gaslighting“.

Един пример подчертава отговор за „квотата за разнообразие на Disney“. Отговорът, който включваше ред, предполагащ, че „може да бъде полезен за създаването на смислено представителство“, беше маркиран като нарушение на принципите на Grok и обозначен като „манипулативни тактики“.

Анализът критикува отговора за фокусирането върху героите и разказването на истории, а не върху квотата за разнообразие на работната сила на Disney. Той също така възразява срещу твърдението на чатбота, че няма лични мнения, като същевременно изразява мнение за ползите от представителството.

По-широки насоки и правни съображения

Документът също така предоставя по-широки насоки за това как чатботът трябва да „уважава човешкия живот“ и да насърчава свободата на словото. Той очертава правни въпроси, които tutors трябва да маркират, включително съдържание, което позволява незаконни дейности, като сексуализиране на деца, споделяне на материали, защитени с авторски права, клевета на лица или предоставяне на чувствителна лична информация.

Растежът на xAI и визията на Мъск

xAI претърпя бърз растеж от основаването си през 2023 г. Компанията разшири работната си сила и създаде центрове за данни, отразявайки ангажимента на Мъск към развитието на Grok.

Мъск заяви намерението си да създаде „AI за максимално търсене на истината“, а xAI посочи, че Grok ще „отговаря на пикантни въпроси, които се отхвърлят от повечето други AI системи“. Това е в съответствие с по-широката цел за позициониране на Grok като алтернатива на това, което Мъск и неговият екип възприемат като прекалено предпазливи или пристрастни подходи на други AI чатботове.

Контрастиращи подходи в AI пейзажа

Brent Mittelstadt, специалист по етика на данните в Интернет института на Оксфордския университет, отбелязва, че има ограничени публични познания за това как компании като OpenAI или Meta обучават своите чатботове по поляризиращи въпроси. Той обаче отбелязва, че тези чатботове обикновено са склонни да избягват подобни теми.

Mittelstadt предполага, че има стимул за чатботовете да бъдат „приятелски настроени към рекламодателите“, което прави малко вероятно други технологични компании изрично да инструктират анотаторите на данни да позволят на чатбота да бъде отворен към конспиративни теории или потенциално обидни коментари. Това прави xAI да се откроява като компания, която активно заема политическа позиция в AI пространството.