Athari ya Ghibli: Jenereta ya Picha ya OpenAI Yazua Mzozo

Ulimwengu wa kidijitali unaenda kwa kasi ya umeme, na hakuna mahali ambapo hili linaonekana wazi zaidi kuliko katika uwanja wa akili bandia. Ndani ya siku moja tu tangu OpenAI iachilie uwezo wake wa hivi karibuni wa kutengeneza picha uliojumuishwa kwenye ChatGPT, majukwaa ya mitandao ya kijamii yaligeuka kuwa turubai za mtindo wa kisanii wa kipekee, lakini unaotambulika mara moja: meme na picha zilizotolewa kwa mtindo tofauti, wa kuvutia wa Studio Ghibli. Kampuni hii pendwa ya uhuishaji ya Kijapani, nguvu ya ubunifu nyuma ya hazina za sinema kama ‘My Neighbor Totoro’ na mshindi wa Tuzo ya Academy ‘Spirited Away,’ ghafla iliona uzuri wake wa kipekee ukiigwa kupita kiasi, ukitumika kwa kila kitu kuanzia mabilionea wa teknolojia hadi hadithi za njozi.

Jambo hilo halikuwa la siri. Milisho ilijaa tafsiri za mtindo wa Ghibli za watu wa kisasa na ulimwengu wa kubuni. Tulishuhudia Elon Musk akifafanuliwa upya kama mhusika anayeweza kuwa anazurura msituni wa fumbo, matukio kutoka ‘The Lord of the Rings’ yaliyopewa mguso laini, wa rangi wa anime, na hata Rais wa zamani wa Marekani, Donald Trump, akionyeshwa kupitia lenzi hii maalum ya kisanii. Mtindo huo ulipata mvuto kiasi kwamba Mkurugenzi Mtendaji wa OpenAI mwenyewe, Sam Altman, alionekana kutumia picha ya wasifu ya mtindo wa Ghibli, ambayo huenda ilitengenezwa na zana ileile iliyozua mjadala huo. Utaratibu ulionekana kuwa rahisi: watumiaji waliingiza picha zilizopo kwenye ChatGPT, wakiiagiza AI kuzitafsiri upya kwa mtindo maarufu wa Ghibli. Mlipuko huu wa uigaji wa kimtindo, ingawa ulizua burudani iliyoenea kwa kasi, ulifufua mara moja wasiwasi mkubwa unaohusu akili bandia na haki za mali ubunifu.

Cheche Iliyoenea na Mwangwi Wake

Hii haikuwa mara ya kwanza kwa kipengele kipya cha AI kusababisha mivutano inayohusiana na ubadilishaji wa picha na hakimiliki. Sasisho la GPT-4o la OpenAI, lililowezesha mabadiliko haya ya kimtindo, lilifika muda mfupi baada ya Google kuanzisha utendaji kazi sawa wa picha za AI ndani ya modeli yake ya Gemini Flash. Toleo hilo, pia, lilikuwa na wakati wake wa umaarufu ulioenea mapema Machi, ingawa kwa sababu tofauti: watumiaji waligundua ustadi wake katika kuondoa alama za maji (watermarks) kutoka kwa picha, kitendo ambacho kinapinga moja kwa moja udhibiti wa wapiga picha na wasanii juu ya kazi zao.

Maendeleo haya kutoka kwa makampuni makubwa ya teknolojia kama OpenAI na Google yanaashiria hatua kubwa katika upatikanaji na uwezo wa uundaji wa maudhui unaoendeshwa na AI. Kile ambacho hapo awali kilihitaji programu maalum na ujuzi mkubwa wa kisanii - kuiga mtindo tata wa kuona - sasa kinaweza kukadiriwa kwa agizo rahisi la maandishi. Andika ‘kwa mtindo wa Studio Ghibli,’ na AI inatii. Wakati watumiaji wakifurahia upya na uwezo wa ubunifu, urahisi huu wa kuiga unaangazia swali la msingi linaloisumbua tasnia ya AI: Je, modeli hizi zenye nguvu hufunzwa vipi kufikia uigaji huo? Kiini cha suala hilo kiko kwenye data inayomezwa na mifumo hii. Je, kampuni kama OpenAI zinalisha algoriti zao kiasi kikubwa cha nyenzo zenye hakimiliki, ikiwa ni pamoja na fremu kutoka kwa filamu za Studio Ghibli, bila ruhusa au fidia? Na muhimu zaidi, je, mafunzo kama hayo yanajumuisha ukiukaji wa hakimiliki?

Chini ya Uso: Utata wa Hakimiliki

Swali hili si la kitaaluma tu; linaunda msingi wa vita vingi vya kisheria vya hali ya juu vinavyoendelea sasa dhidi ya watengenezaji wa modeli za AI za kuzalisha maudhui. Mazingira ya kisheria yanayozunguka data ya mafunzo ya AI, kwa kusema kidogo, yana ukungu. Evan Brown, wakili wa mali ubunifu anayehusishwa na kampuni ya sheria ya Neal & McDevitt, anafafanua hali ya sasa kama inayofanya kazi ndani ya ‘eneo kubwa la kijivu kisheria.’

Jambo muhimu la utata ni kwamba mtindo wa kisanii, peke yake, kwa ujumla haulindwi na sheria ya hakimiliki. Hakimiliki hulinda usemi maalum wa wazo - uchoraji uliokamilika, riwaya iliyoandikwa, wimbo uliorekodiwa, fremu halisi za filamu - sio mbinu ya msingi, hisia, au vipengele vya kuona vya tabia vinavyounda ‘mtindo.’ Kwa hivyo, Brown anabainisha, OpenAI inaweza isiwe inakiuka sheria kwa kutoa tu picha ambazo zinaonekana kama zingeweza kutoka Studio Ghibli. Kitendo cha kutengeneza picha mpya kwa mtindo fulani si, kwa uso wake, ukiukaji wa hakimiliki wa mtindo wenyewe.

Hata hivyo, uchambuzi hauwezi kuishia hapo. Suala muhimu, kama Brown anavyosisitiza, linahusu mchakato ambao AI hujifunza kuiga mtindo huo. Inawezekana sana, wataalam wanahoji, kwamba kufikia uigaji sahihi wa kimtindo kulihitaji modeli ya AI kufunzwa kwenye seti kubwa ya data, ambayo inaweza kujumuisha mamilioni ya picha zenye hakimiliki - labda hata fremu za moja kwa moja - kutoka kwa maktaba ya sinema ya Ghibli. Kitendo cha kunakili kazi hizi kwenye hifadhidata ya mafunzo, hata kwa madhumuni ya ‘kujifunza,’ kinaweza chenyewe kuchukuliwa kuwa ukiukaji, bila kujali kama matokeo ya mwisho ni nakala ya moja kwa moja ya fremu yoyote moja.

‘Hili kwa kweli linaturudisha kwenye swali la msingi ambalo limekuwa likijitokeza kwa miaka michache iliyopita,’ Brown alisema katika mahojiano. ‘Je, ni zipi athari za ukiukaji wa hakimiliki za mifumo hii kwenda nje, kutambaa kwenye wavuti, na kumeza kiasi kikubwa cha maudhui yanayoweza kuwa na hakimiliki kwenye hifadhidata zao za mafunzo?’ Changamoto kuu ya kisheria iko katika kuamua ikiwa awamu hii ya awali ya kunakili, muhimu kwa utendaji kazi wa AI, inaruhusiwa chini ya mifumo iliyopo ya hakimiliki.

Kamba Nyembamba ya Matumizi Halali

Utetezi mkuu ambao mara nyingi huombwa na kampuni za AI katika muktadha huu ni fundisho la matumizi halali (fair use). Matumizi halali ni kanuni tata ya kisheria ndani ya sheria ya hakimiliki ya Marekani ambayo inaruhusu matumizi machache ya nyenzo zenye hakimiliki bila ruhusa kutoka kwa mwenye haki chini ya hali maalum. Mahakama kwa kawaida huchambua mambo manne ili kuamua ikiwa matumizi fulani yanahitimu kama matumizi halali:

  1. Madhumuni na tabia ya matumizi: Je, matumizi ni ya kubadilisha (kuongeza maana mpya au ujumbe)? Je, ni ya kibiashara au yasiyo ya faida/kielimu? Kampuni za AI zinahoji kuwa mafunzo ya modeli ni ya kubadilisha kwa sababu AI hujifunza mifumo badala ya kuhifadhi nakala tu, na lengo kuu ni kuunda kazi mpya. Wakosoaji wanahoji matumizi ni ya kibiashara sana na mara nyingi hushindana moja kwa moja na soko la kazi za asili.
  2. Asili ya kazi yenye hakimiliki: Kutumia kazi za ukweli kwa ujumla hupendelewa zaidi kuliko kazi za ubunifu wa hali ya juu. Kufunza juu ya kazi za kisanii kama filamu au riwaya kunaweza kupima dhidi ya matumizi halali. Filamu za Studio Ghibli, zikiwa za asili sana na za ubunifu, zinaangukia katika kategoria ya mwisho.
  3. Kiasi na umuhimu wa sehemu iliyotumika: Ni kiasi gani cha kazi ya asili kilinakiliwa? Ingawa AI inaweza isitoe filamu nzima, mafunzo yanawezekana yanahusisha kunakili kiasi kikubwa cha fremu au picha. Je, kunakili mamilioni ya fremu kunajumuisha kutumia sehemu ‘muhimu’ ya kazi za Ghibli, hata kama hakuna tokeo moja linaloiga sehemu kubwa? Hili linabaki kuwa hoja yenye utata.
  4. Athari ya matumizi juu ya soko linalowezekana la au thamani ya kazi yenye hakimiliki: Je, maudhui yaliyozalishwa na AI yanachukua nafasi ya soko la kazi za asili au bidhaa zinazotokana na leseni? Ikiwa watumiaji wanaweza kutengeneza picha za mtindo wa Ghibli kwa mahitaji, je, hiyo inapunguza thamani ya sanaa rasmi ya Ghibli, bidhaa, au fursa za leseni? Waumbaji wanahoji kwa nguvu kwamba inafanya hivyo.

Hivi sasa, mahakama nyingi zinakabiliana na swali la ikiwa kufunza modeli kubwa za lugha (LLMs) na jenereta za picha kwenye data yenye hakimiliki kunajumuisha matumizi halali. Hakuna uamuzi wa kisheria wa uhakika unaoshughulikia haswa muktadha huu wa kiteknolojia wa kisasa, na kufanya matokeo kuwa yasiyo na uhakika sana. Maamuzi katika kesi hizi yatakuwa na athari kubwa kwa mustakabali wa maendeleo ya AI na tasnia za ubunifu.

Matembezi ya OpenAI Kwenye Kamba Nyembamba: Sera na Mazoezi

Katika kuabiri eneo hili la kisheria lisilo na uhakika, OpenAI imejaribu kuchora mistari kwenye mchanga, ingawa ni mistari inayoonekana kuwa na ukungu kiasi inapochunguzwa kwa karibu. Kulingana na taarifa iliyotolewa na msemaji wa OpenAI kwa TechCrunch, sera ya kampuni hiyo inaelekeza kwamba ChatGPT inapaswa kukataa maombi ya kuiga ‘mtindo wa wasanii binafsi walio hai.’ Hata hivyo, sera hiyo hiyo inaruhusu waziwazi kuiga ‘mitindo mipana ya studio.’

Tofauti hii mara moja inazua maswali. Ni nini kinachojumuisha ‘mtindo mpana wa studio’ ikiwa si maono na utekelezaji wa jumla wa wasanii muhimu wanaohusishwa na studio hiyo? Katika kesi ya Studio Ghibli, uzuri wa studio hiyo unahusishwa bila kutenganishwa na maono ya mwanzilishi mwenza na mkurugenzi wake mkuu, Hayao Miyazaki, ambaye ni msanii aliye hai sana. Je, mtu anaweza kweli kutenganisha ‘mtindo wa Ghibli’ kutoka kwa mwelekeo wa saini wa Miyazaki, muundo wa wahusika, na mada zinazohusika? Sera inaonekana kutegemea tofauti inayoweza kuwa ya kubuni ambayo inaweza isisimame imara inapochunguzwa, haswa wakati utambulisho wa studio umeunganishwa sana na waundaji maalum, wanaotambulika.

Zaidi ya hayo, jambo la Ghibli si tukio la pekee. Watumiaji wameonyesha kwa urahisi uwezo wa jenereta ya picha ya GPT-4o kuiga mitindo mingine inayotambulika. Ripoti ziliibuka za picha zilizoundwa kwa mtindo usiokosewa wa Dr. Seuss (Theodor Geisel, marehemu, lakini ambaye mali yake inalinda kwa ukali mtindo wake tofauti) na picha za kibinafsi zilizofafanuliwa upya kwa mwonekano na hisia za tabia za Pixar Animation Studios. Hii inapendekeza kuwa uwezo wa uigaji wa kimtindo ni mpana, na tofauti ya sera kati ya ‘wasanii walio hai’ na ‘mitindo ya studio’ inaweza kuwa zaidi hatua ya kukabiliana na hali kuliko mpaka thabiti wa kiufundi au kimaadili. Majaribio katika jenereta mbalimbali za picha za AI yanathibitisha uchunguzi huo: wakati wengine kama Gemini ya Google, Grok ya xAI, na Playground.ai wanaweza kujaribu uigaji wa kimtindo, toleo la hivi karibuni la OpenAI linaonekana kuwa na ustadi hasa katika kunasa nuances za uzuri wa Studio Ghibli, na kuifanya kuwa kitovu cha utata wa sasa.

Dhoruba Inayokusanyika: Mazingira ya Kesi za Kisheria

Picha za Ghibli zilizoenea kwa kasi zinatumika kama kielelezo dhahiri cha masuala yaliyo kiini cha vita vikubwa vya kisheria ambavyo tayari vinaendelea. Kesi kadhaa maarufu zinawakutanisha waundaji na wachapishaji dhidi ya watengenezaji wa AI, zikipinga uhalali wa mazoea yao ya mafunzo.

  • The New York Times na wachapishaji wengine dhidi ya OpenAI: Kesi hii muhimu inadai kuwa OpenAI ilijihusisha na ukiukaji mkubwa wa hakimiliki kwa kufunza modeli zake, ikiwa ni pamoja na ChatGPT, kwenye mamilioni ya makala za habari zenye hakimiliki bila ruhusa, utambulisho, au malipo. Wachapishaji wanahoji kuwa hii inadhoofisha mifumo yao ya biashara na inajumuisha ushindani usio wa haki.
  • Authors Guild na waandishi binafsi dhidi ya OpenAI na Microsoft: Madai kama hayo yanafuatiliwa na waandishi ambao wanadai vitabu vyao vilinakiliwa kinyume cha sheria ili kufunza modeli kubwa za lugha.
  • Wasanii dhidi ya Stability AI, Midjourney, DeviantArt: Wasanii wa kuona wamewasilisha kesi za pamoja dhidi ya kampuni za kutengeneza picha za AI, wakidai kazi zao zilichukuliwa kutoka kwenye mtandao na kutumika kwa mafunzo bila ridhaa, na kuwezesha AI kutengeneza kazi zinazoshindana nao moja kwa moja.
  • Getty Images dhidi ya Stability AI: Kampuni kubwa ya picha za hisa inaishtaki Stability AI kwa madai ya kunakili mamilioni ya picha zake, kamili na alama za maji katika baadhi ya kesi, ili kufunza modeli ya Stable Diffusion.

Kesi hizi kwa pamoja zinahoji kuwa umezaji usioidhinishwa wa nyenzo zenye hakimiliki kwa ajili ya kufunza modeli za AI ni ukiukaji wa haki za kipekee za wamiliki wa hakimiliki za kuzalisha, kusambaza, na kuunda kazi zinazotokana. Hazitafuti tu fidia ya fedha lakini uwezekano wa amri ambazo zinaweza kulazimisha kampuni za AI kufunza upya modeli zao kwa kutumia tu data iliyoidhinishwa ipasavyo - kazi ambayo ingekuwa ya gharama kubwa sana na inayotumia muda mwingi, na uwezekano wa kulemaza uwezo wao wa sasa. Washtakiwa, kinyume chake, wanategemea sana hoja za matumizi halali na wanasisitiza kuwa teknolojia yao inakuza uvumbuzi na kuunda aina mpya za usemi.

Mbio za Silaha za Kiteknolojia dhidi ya Hukumu ya Kisheria

Licha ya vitisho vya kisheria vinavyojitokeza na utata dhahiri wa kimaadili, kasi ya maendeleo ya AI haionyeshi dalili za kupungua. Kampuni kama OpenAI na Google zimefungwa katika vita vikali vya ushindani, zikisukuma kila mara vipengele vipya na modeli ili kunyakua sehemu ya soko na kuonyesha ubora wa kiteknolojia. Upelekaji wa haraka wa zana za hali ya juu za kutengeneza picha, zenye uwezo wa uigaji wa kimtindo wa kisasa, unaonekana kuendeshwa na hamu ya kuvutia watumiaji na kuonyesha maendeleo, hata kama misingi ya kisheria inabaki kuwa tete.

Ukweli kwamba OpenAI ilipata mahitaji makubwa kwa zana yake mpya ya picha kiasi kwamba ilibidi kuchelewesha uzinduzi kwa watumiaji wa kiwango cha bure unasisitiza mvuto wa umma na hamu ya kujihusisha na uwezo huu. Kwa kampuni za AI, ushiriki wa watumiaji na kuonyesha vipengele vya kisasa kunaweza kwa sasa kuzidi hatari zinazowezekana za kisheria, au labda ni kamari iliyokokotolewa kwamba sheria hatimaye itabadilika kwa niaba yao, au kwamba suluhu zinaweza kufikiwa.

Hali hii inaangazia mvutano unaokua kati ya kasi ya kuongezeka kwa uwezo wa kiteknolojia na kasi ya makusudi zaidi, iliyopimwa ya mifumo ya kisheria na kimaadili. Sheria mara nyingi hubaki nyuma ya teknolojia, na AI ya kuzalisha maudhui inaleta changamoto ngumu haswa, ikilazimisha jamii kufikiria upya dhana za muda mrefu za uandishi, ubunifu, na mali ubunifu katika enzi ya kidijitali.

Mwangwi na Mifano ya Awali

Historia inatoa mifano ambapo teknolojia za kimapinduzi zilivuruga kanuni zilizowekwa za hakimiliki. Ujio wa mashine ya kunakili (photocopier) ulizua wasiwasi kuhusu urudufishaji usioidhinishwa. Piano ya kujicheza (player piano) ilipinga ufafanuzi wa haki za utendaji wa muziki. Kinasa sauti cha kanda za video (VCR) kilisababisha kesi muhimu ya ‘Betamax case’ (Sony Corp. of America v. Universal City Studios, Inc.), ambapo Mahakama Kuu ya Marekani iliamua kuwa kurekodi vipindi vya televisheni kwa ajili ya kutazama baadaye (‘time-shifting’) kulijumuisha matumizi halali, kwa sehemu kwa sababu teknolojia hiyo ilikuwa na matumizi mengi yasiyokiuka sheria. Baadaye, majukwaa ya kushiriki muziki wa kidijitali kama Napster yalizua wimbi jingine la vita vya kisheria juu ya usambazaji mtandaoni na ukiukaji wa hakimiliki, hatimaye kusababisha mifumo mipya ya leseni kama iTunes na huduma za utiririshaji.

Ingawa mifano hii ya kihistoria inatoa muktadha, ukubwa na asili ya AI ya kuzalisha maudhui inaleta changamoto za kipekee. Tofauti na VCR, ambayo kimsingi iliwezesha unakili wa kibinafsi, AI ya kuzalisha maudhui huunda maudhui mapya kulingana na mifumo iliyojifunza kutoka kwa kiasi kikubwa cha pembejeo zenye hakimiliki, ikizua maswali tofauti kuhusu mabadiliko na madhara ya soko. Iwapo mahakama zitapata mafunzo ya AI kuwa sawa na ‘time-shifting’ au zaidi kama ukiukaji mkubwa uliowezeshwa na Napster bado haijajulikana.

Mustakabali Usioandikwa

Msisimko wa sasa unaozunguka picha za mtindo wa Ghibli zilizozalishwa na AI ni zaidi ya mtindo wa muda mfupi wa mtandao; ni dalili ya mapambano makubwa zaidi, yanayoendelea ya kufafanua mipaka ya mali ubunifu katika enzi ya akili bandia. Matokeo ya kesi zinazosubiri, hatua zinazowezekana za kisheria, na mageuzi ya mazoea ya tasnia (kama vile makubaliano ya leseni kwa data ya mafunzo) yataunda mwelekeo wa maendeleo ya AI na athari zake kwa taaluma za ubunifu kwa miaka ijayo.

Je, mahakama zitaamua kuwa mafunzo kwenye data yenye hakimiliki yanahitaji ruhusa ya wazi na leseni, na uwezekano wa kulazimisha urekebishaji wa gharama kubwa wa modeli zilizopo za AI? Au zitapata kuwa mafunzo kama hayo yanaangukia chini ya matumizi halali, na kufungua njia kwa maendeleo ya haraka yanayoendelea lakini uwezekano wa kushusha thamani ya maudhui yaliyoundwa na binadamu? Je, njia ya kati inaweza kujitokeza, ikihusisha mifumo mipya ya leseni za lazima au makubaliano ya tasnia nzima?

Majibu yanabaki kuwa magumu. Kilicho wazi ni kwamba urahisi ambao AI sasa inaweza kuiga mitindo tofauti ya kisanii unalazimisha makabiliano na maswali ya msingi kuhusu ubunifu, umiliki, na thamani tunayoweka kwenye usemi wa binadamu. Meme za Ghibli za kuvutia zinazofurika kwenye mtandao ni uso tu wa kupendeza, unaoeleweka kwa urahisi wa jiwe kubwa la barafu la kisheria na kimaadili, ambalo vipimo vyake kamili ndio vinaanza kuonekana. Utatuzi wa masuala haya utaamua sio tu mustakabali wa AI bali pia mazingira kwa wasanii, waandishi, wanamuziki, na waundaji wa kila aina katika miongo ijayo.