Teknolojia ya deepfake inazidi kuongezeka siku hadi siku, na kuleta changamoto kubwa kwa uaminifu wa jamii na usalama wa habari. Ili kukabiliana na tatizo hili, uelewa kamili wa teknolojia ya deepfake ni muhimu. Makala hii inachunguza jinsi ya kuzuia teknolojia ya deepfake ya akili bandia.
Injini za Deepfake: Uchambuzi wa Kiufundi
Msingi wa deepfake ni mifumo ya uzalishaji, aina ya akili bandia ambayo inaweza kujifunza kutoka makusanyo makubwa ya data na kutoa picha, video, na sauti zinazoonekana halisi. Mitandao ya uzalishaji dhidi ya uadui (GAN) imebadilika na kuwa mifumo ya usambazaji, ambayo ina uwezo zaidi. Kwa hivyo, ni muhimu kufanya uchambuzi wa kiufundi wa injini hizi za uzalishaji ili kuunda mfumo thabiti wa kuzuia.
Mchezo wa Ushindani: Mitandao ya Uzalishaji Dhidi ya Uadui (GAN)
GAN inaundwa na mitandao miwili ya neva: jenereta na kibaguzi. Jenereta ina jukumu la kuunda data bandia ambayo inaiga data halisi ya ulimwengu. Huanza na ingizo la nasibu (mara nyingi huitwa vekta ya latent) na inajaribu kuibadilisha kuwa matokeo yenye uwiano. Kwa upande mwingine, kibaguzi hufanya kazi kama kigawanyaji, akitathmini data ili kubaini ikiwa ni halisi (kutoka kwa seti halisi ya data ya mafunzo) au bandia (iliyoundwa na jenereta).
Mchakato wa mafunzo unajumuisha kitanzi cha maoni kinachoendelea kati ya mitandao miwili, sawa na mchezo wa jumla sifuri. Jenereta huunda picha bandia na kuipitisha kwa kibaguzi, ambaye pia hupokea picha halisi kutoka kwa seti ya mafunzo. Kisha, kibaguzi hutabiri uhalisi wa kila picha. Ikiwa kibaguzi anatambua kwa usahihi matokeo ya jenereta kama bandia, hutoa maoni. Jenereta hutumia maoni haya kupitia uenezi wa nyuma ili kurekebisha vigezo vyake vya ndani ili kutoa picha za kushawishi zaidi katika marudio yanayofuata. Wakati huo huo, kibaguzi hurekebisha vigezo vyake ili kugundua bandia vizuri zaidi. Ushindani huu wa uadui unaendelea hadi mfumo ufike mahali pa usawa, wakati mwingine huitwa usawa wa Nash, ambapo matokeo ya jenereta ni ya kweli kiasi kwamba kibaguzi hawezi tena kuyatofautisha kwa uhakika kutoka kwa data halisi na anafanya nadhani kwa usahihi wa takriban 50%.
GAN imeonyesha uwezo wa kutoa media bandia kwa ufanisi na iliweka msingi wa mifumo mingi yenye ushawishi ya deepfake. Usanifu kama vile GAN ya kina ya convolution (DCGAN) ilianzisha maboresho muhimu kwa kuboresha utulivu kwa kubadilisha tabaka za kuunganisha na kutumia urekebishaji wa kundi. StyleGAN ya NVIDIA na warithi wake StyleGAN2 na StyleGAN3 walifikia uhalisia wa picha ambao haujawahi kushuhudiwa katika utengenezaji wa uso kwa kurekebisha mabaki ya tabia na kuendeleza usanifu wa mfumo. Tofauti zingine kama CycleGAN zilitimiza majukumu ya ubadilishaji wa mtindo na kwa hivyo zilitumiwa sana katika programu kama vile Face App kubadilisha umri wa muonekano wa mtu.
Licha ya uwezo wao mkubwa, GAN zinajulikana kuwa ngumu kufundisha. Usawa dhaifu kati ya jenereta na kibaguzi unaweza kuvunjika kwa urahisi, na kusababisha ukosefu wa utulivu wa mafunzo, muunganiko polepole, au hali muhimu ya kushindwa inayoitwa "kuporomoka kwa hali". Kuporomoka kwa hali hutokea wakati jenereta inagundua udhaifu katika kibaguzi na inautumia kwa kutoa tu aina ndogo ya matokeo (ambayo inajua inaweza kumdanganya kibaguzi), ikishindwa kunasa utofauti halisi wa data ya mafunzo. Changamoto hizi za asili pamoja na mabaki madogo ambayo mara nyingi huzaa, yalikuwa malengo makuu ya mifumo ya mapema ya kugundua deepfake.
Ugeuzaji wa Machafuko: Mifumo ya Usambazaji
Katika akili bandia ya uzalishaji, teknolojia ya hivi karibuni imeelekeza kwa uamuzi kwa darasa jipya la mifumo: mifumo ya usambazaji. Mifumo ya usambazaji imehamasishwa na dhana za thermodynamics zisizo na usawa, hufanya kazi kwa kanuni tofauti kabisa na ushindani wa uadui wa GAN. Ni mifumo ya uzalishaji wa uwezekano ambayo inaweza kutoa data ya ubora wa kipekee na utofauti kwa kujifunza kubatilisha mchakato wa uharibifu wa taratibu.
Mbinu ya mifumo ya usambazaji ni mchakato wa awamu mbili:
Mchakato wa kusambaza mbele: Awamu hii inaongeza kiasi kidogo cha kelele ya Gaussian kwa picha kwa utaratibu na hatua kwa hatua kwa muda (kwa mfano, hatua za T). Huu ni mchakato wa mnyororo wa Markov, ambapo kila hatua imewekwa kwa hatua iliyotangulia, ikipunguza polepole ubora wa picha hadi wakati wa mwisho T, inakuwa haiwezi kutofautishwa na kelele safi isiyoandaliwa.
Mchakato wa kinyume wa kuondoa kelele: Muhimu kwa mfumo ni mtandao wa neva (kwa kawaida unachukua usanifu wa U-Net) ambao umepewa mafunzo ili kubatilisha mchakato huu. Inajifunza kutabiri kelele iliyoongezwa katika kila hatua ya wakati katika mchakato wa kusambaza mbele na kuiondoa. Baada ya mafunzo, mfumo unaweza kutoa picha mpya za ubora wa juu kwa kuchukua sampuli ya kelele ya bahati nasibu na kutumia kwa kurudia kitendaji hiki kilichojifunza cha "kuondoa kelele", kubadilisha machafuko kuwa sampuli zenye uwiano kutoka kwa usambazaji wa data asili.
Mchakato huu wa uboreshaji wa marudio huwezesha mifumo ya usambazaji kufikia viwango vya uhalisia wa picha na utofauti bora kuliko GAN bora au hata bora zaidi. Mchakato wao wa mafunzo pia una utulivu zaidi kuliko mchakato wa mafunzo wa GAN, kuepuka matatizo kama vile kuporomoka kwa hali, na kutoa matokeo ya kuaminika zaidi na tofauti zaidi. Faida hii ya kiufundi imefanya mifumo ya usambazaji kuwa msingi wa zana za akili bandia za uzalishaji zilizo maarufu na zenye nguvu zaidi leo, ikiwa ni pamoja na mifumo ya maandishi hadi picha ya DALL-E 2 ya OpenAI, Imagen ya Google, na Stable Diffusion ya Stability AI, pamoja na mifumo ya maandishi hadi video kama Sora ya OpenAI. Upatikanaji mpana na ubora bora wa matokeo ya mifumo hii umeongeza kwa kiasi kikubwa tishio la deepfake.
Mbinu za Uendeshaji za Vile Vile
Iwe ni GAN au mifumo ya usambazaji, injini za uzalishaji za msingi zinatumika kupitia mbinu kadhaa maalum ili kuunda video za deepfake. Mbinu hizi hushughulikia vipengele mbalimbali vya video lengwa ili kufikia athari za udanganyifu zinazohitajika.
Uigizaji upya: Mbinu hii huhamisha maneno ya uso, harakati za kichwa, na harakati zinazohusiana na hotuba za mhusika mkuu hadi kwenye lengo katika video. Mchakato kwa kawaida unajumuisha hatua tatu kuu: kwanza, kufuatilia vipengele vya uso katika video ya chanzo na video lengwa; pili, kupanga vipengele hivi na mfumo wa uso wa 3D wa jumla kwa kutumia kipimo cha uwiano; tatu, kuhamisha maneno kutoka kwa chanzo hadi kwenye lengo, ikifuatiwa na uboreshaji wa baadae ili kuongeza uhalisia na uwiano.
Usawazishaji wa mdomo: Mbinu za deepfake za usawazishaji wa mdomo zimejitolea pekee kushughulikia hotuba, hasa kwa kutumia ingizo la sauti ili kutoa harakati halisi za mdomo. Sauti hubadilishwa kuwa maumbo na maumbo ya mdomo yanayobadilika, ambayo kisha yanalandanishwa kwa uangalifu na kuchanganywa na video lengwa ili kuleta udanganyifu kwamba mhusika anasema sauti inayobadilika.
Usanisi wa msingi wa maandishi: Mbinu hii iliyoboreshwa sana hubadilisha video kulingana na script ya maandishi. Inafanya kazi kwa kuchanganua maandishi kuwa fonimu zake zinazounda (vitengo vya sauti) na visima (uwakilishi wa kuona wa sauti za usemi). Kisha hulinganishwa na mfuatano unaolingana katika video ya chanzo, na vigezo vya mfumo wa kichwa wa 3D hutumiwa kutoa na kulainisha harakati za midomo ili kuendana na maandishi mapya, na kuwezesha uhariri wa neno kwa neno la kile ambacho mhusika anaonekana kusema.
Maendeleo ya kiteknolojia kutoka kwa GAN hadi mifumo ya usambazaji sio tu uboreshaji wa hatua kwa hatua; ni mabadiliko ya dhana ambayo hubadilisha kimsingi mazingira ya mikakati ya kuzuia deepfake. GAN, ingawa zina nguvu, zipo udhaifu unaojulikana wa usanifu kama vile ukosefu wa utulivu wa mafunzo na kuporomoka kwa hali, ambayo kwa kawaida huleta mabaki yanayoweza kutabirika na kutambulika katika kikoa cha masafa ya picha. Kama matokeo, kizazi kizima cha zana za kugundua zimeundwa mahsusi ili kutambua vidole hivi mahususi vya GAN. Hata hivyo, mifumo ya usambazaji ina utulivu zaidi kufundisha, na hutoa matokeo tofauti zaidi, ya kweli, na yanalingana kwa karibu zaidi na takwimu za data halisi, na hivyo hana kasoro nyingi ambazo watangulizi wake walikuwa nazo.
Kwa hivyo, sehemu kubwa ya miundombinu iliyopo ya kugundua deepfake inapitwa na wakati haraka. Utafiti unaonyesha kuwa kigunduzi kilichofunzwa kwenye picha zilizotolewa na GAN kinapotumika kwa maudhui kutoka kwa mifumo ya usambazaji, "utendaji usiofaa mkubwa" hutokea. Ni muhimu kuzingatia kwamba kigunduzi kilichofunzwa kwenye picha za mifumo ya usambazaji kinaweza kutambua kwa mafanikio maudhui yaliyotolewa na GAN, lakini kinyume chake si kweli, ambayo inaonyesha kwamba mifumo ya usambazaji inawakilisha darasa la bandia ngumu zaidi na zenye changamoto. Ukweli kwamba haya tayari yameanzisha upya mbio za silaha za kiteknolojia, zinahitaji mikakati ya ulinzi ibuniwe upya ili kukabiliana na sifa za kipekee na dhaifu zaidi za vyombo vya habari vilivyotolewa na usambazaji.
Zaidi ya hayo, asili ya "sanduku jeusi" ya mifumo hii ya uzalishaji huongeza utata wa juhudi za kuzuia chanzo. GAN na mifumo ya usambazaji hufanya kazi kwa njia isiyo ya usimamizi au nusu ya usimamizi, kujifunza kuiga usambazaji wa kitakwimu wa seti za data bila lebo za wazi za kisemantiki. Hawajifunzi "sura ya mwanadamu ni nini" kwa njia ambayo wanadamu wanaweza kuelewa, badala yake wanajifunza "ni aina gani za muundo wa pikseli zinawezekana katika seti ya data ya nyuso". Hii inafanya kuwa vigumu sana kuweka vikwazo moja kwa moja kwenye mchakato wa uzalishaji (kwa mfano, "usitoe picha hatari"). Mfumo unaboresha tu kazi ya hisabati, ama kumdanganya kibaguzi au kugeuza mchakato wa kelele. Hii ina maana kwamba kuzuia hakuwezi kutegemea kusimamia algorithms za msingi kutoka ndani. Kuingilia kati kunakowezekana zaidi lazima kutokee kabla ya uzalishaji (kwa kudhibiti data ya mafunzo) au baada ya uzalishaji (kupitia ugunduzi, alama za maji, na chimbuko), kwani tendo la uumbaji lenyewe ni kupinga usimamizi wa moja kwa moja.
Uchambuzi Linganishi wa Injini za Uzalishaji
Kuelewa tofauti za kimkakati kati ya GAN na mifumo ya usambazaji ni muhimu kwa wadau wowote (kutoka kwa watunga sera hadi maafisa wa usalama wa kampuni). Mabadiliko ya utawala wa kiufundi kutoka ya zamani hadi ya mwisho yana athari kubwa kwa ugumu wa ugunduzi, uwezekano wa udanganyifu, na hali ya jumla ya tishio.
Kipengele | Mitandao ya Uzalishaji Dhidi ya Uadui (GAN) | Mifumo ya Usambazaji | Umuhimu wa Mkakati |
---|---|---|---|
Mbinu ya Msingi | Jenereta na kibaguzi hushindana katika mchezo wa jumla sifuri. | Mtandao wa neva unajifunza kubatilisha mchakato wa "kelele" wa taratibu. | Mchakato wa uboreshaji wa marudio wa usambazaji hutoa usahihi wa hali ya juu na makosa machache ya muundo. |
Mchakato wa Mafunzo | Inajulikana kwa kukosekana kwa utulivu; huathirika kwa "kuporomoka kwa hali" na muunganiko polepole. | Mchakato wa mafunzo una utulivu na wa kuaminika, lakini unatumia kompyuta sana. | Kizingiti cha kuingia kwa kupata matokeo ya ubora wa juu kwa kutumia mifumo ya usambazaji ni cha chini, na hivyo kuongeza uwezekano wa tishio. |
Ubora wa Matokeo | Inaweza kutoa picha za ubora wa juu, lakini inaweza kujumuisha mabaki madogo. | Kiwango cha juu zaidi cha uhalisia wa picha na utofauti kwa sasa; mara nyingi haitambuliki kutoka kwa picha halisi. | Bandia huwa za kushawishi zaidi, zinaharibu mbinu ya "kuona ni kuamini" na changamoto ugunduzi wa binadamu. |
Utambulikaji | Mbinu za kugundua za zamani mara nyingi hubadilishwa ili kupata mabaki mahususi ya GAN (kwa mfano, ukosefu wa usawa wa masafa). | Hufanya vigunduzi vingi vya msingi wa GAN kuwa duni. Picha zina mabaki machache na zinalingana kwa karibu zaidi na takwimu za data halisi. | "Mbio za silaha" za deepfake zimewekwa upya. Utafiti na maendeleo ya kugundua lazima yaelekee kwenye kulenga habari mahususi za usambazaji. |
Aina Maarufu | StyleGAN, CycleGAN | DALL-E, Stable Diffusion, Imagen, Sora | Zana zenye nguvu zaidi na zinazotumiwa sana kwa sasa zinatokana na usambazaji, na hivyo kuharakisha tishio. |
Mfumo wa Kinga ya Dijiti: Uchambuzi Linganishi wa Mbinu za Kugundua
Ili kukabiliana na ongezeko la vyombo vya habari synthesized, uwanja tofauti wa mbinu za kugundua umejitokeza, na kuunda "mfumo wa kinga ya dijiti" mchanga. Teknolojia hizi zinahusisha uchambuzi wa kisheria wa mabaki ya dijiti, pamoja na mbinu mpya za kuchunguza ishara za uwezekano za kibaolojia. Hata hivyo, ufanisi wa mfumo huu wa kinga unaendelea kupingwa na mageuzi ya haraka ya mifumo ya uzalishaji na mashambulizi ya uadui yaliyoundwa ili kukwepa ugunduzi. Mapambano yanayoendelea kati ya uumbaji na ugunduzi ni kitendawili cha "Malkia Mwekundu", ambapo watetezi lazima waendelee kubuni ili kudumisha hali ilivyo.
Uchambuzi wa Kisheria wa Mabaki ya Dijiti
Kategoria iliyoanzishwa zaidi ya ugunduzi wa deepfake inahusisha uchambuzi wa kisheria wa mabaki ya dijiti, ambayo ni kasoro ndogo na kutokwenda ambazo huachwa nyuma na mchakato wa uzalishaji. Kasoro hizi na kutokwenda kwa kawaida ni vigumu kutambua na haziwezi kutambulika kwa jicho la uchi, lakini zinaweza kutambuliwa na hesabu maalum.
Ukosefu wa usawa wa kuona na wa anatomia: Baadhi ya mifumo ya mapema na hata ya sasa ya uzalishaji inapata shida kunakili kikamilifu utata wa anatomy ya mwili wa binadamu na sifa za kimwili za ulimwengu halisi. Mbinu za kugundua hutumia udhaifu huu kwa kuchambua matukio mahususi yasiyo ya kawaida katika vyombo vya habari. Hizi ni pamoja na mifumo isiyo ya kawaida ya kupepesa, ambayo ni kupepesa sana, kupepesa kidogo sana, au kuto kupepesa kabisa (mara nyingi ni kwa sababu ya ukosefu wa picha za macho yaliyofungwa katika data ya mafunzo), harakati za macho za roboti au zisizoendana, na midomo iliyozuiliwa au maumbo ya mdomo ambayo meno ya chini hayatakuwa milele. Viashiria vingine ni ukosefu wa mabadiliko madogo katika pua wakati wa kuzungumza, nuru isiyolingana na vivuli visivyoendana na mazingira yanayozunguka, na tafakari zisizo sahihi au zilizokosekana kwenye miwani au nyuso zingine za kutafakari.
Pikseli na uchambuzi wa mgandamizo: Teknolojia hizi hufanya kazi kwa kiwango cha chini, kuchunguza muundo wa dijiti wa picha au video. Uchambuzi wa kiwango cha makosa (ELA) ni mbinu ya kutambua maeneo katika picha ambayo yana viwango tofauti vya mgandamizo. Kwa sababu maeneo yaliyobadilishwa mara nyingi huhifadhiwa tena au kugandamizwa tena, yanaweza kuonyesha viwango vya makosa tofauti na sehemu za asili za picha, na hivyo kuangazia bandia. Inahusiana kwa karibu na hii ni uchambuzi wa makali na mchanganyiko, ambayo huchunguza kwa uangalifu mipaka na muhtasari kati ya vipengele vilivyotengenezwa (kwa mfano, nyuso zilizobadilishwa) na asili halisi. Maeneo haya yanaweza kufichua uendeshaji kupitia ishara kama vile pikseli zisizoambatana, ukali au ukungu usio wa kawaida, na tofauti ndogo katika rangi na muundo.
Uchambuzi wa kikoa cha masafa: Badala ya kuchanganua pikseli moja kwa moja, mbinu hizi hubadilisha picha kuwa vipengele vyake vya masafa ili kupata mifumo isiyo ya kawaida. Kwa sababu jenereta za GAN zinatumia usanifu ambazo zimepandishwa sampuli, kwa kawaida huacha mabaki ya tabia ya spectral, na kuunda mifumo ya mara kwa mara ambayo haipo katika picha halisi. Ingawa hii inafanya kazi kwa GAN nyingi, mbinu hii ina kiwango cha chini cha mafanikio kwa mifumo ya usambazaji, ambayo hutoa picha zenye muhtasari wa masafa ya asili zaidi. Hata hivyo, baadhi ya tafiti zinaonyesha kuwa mifumo ya usambazaji bado inaweza kuonyesha kutolingana kunakotambulika katika maelezo ya masafa ya juu ikilinganishwa na picha halisi, ambayo hutoa njia inayowezekana ya kugundua.
Uchambuzi wa Ishara za Kibaolojia: "Mapigo ya Moyo" ya Deepfake
Uwanja mpya na wenye ahadi kubwa katika ugunduzi wa deepfake unahusisha kuchambua uwepo wa ishara halisi za kibaolojia kwenye vyombo vya habari. Dhana yake kuu ni kwamba ingawa mifumo ya uzalishaji inakuwa bora zaidi kunakili muonekano wa kuona, haiwezi kuiga michakato ya kisaikolojia ya msingi ya mtu aliye hai.
Teknolojia kuu katika uwanja huu ni photoplethysmography ya mbali (rPPG). Teknolojia hii hutumia kamera ya kawaida kutambua mabadiliko madogo ya mara kwa mara katika rangi ya ngozi, ambayo hutokea wakati moyo unapiga damu kwenye vyombo vidogo vya damu vya uso. Katika video halisi ya mtu, hii hutoa ishara dhaifu lakini thabiti ya kunde. Katika deepfake, ishara hii kwa kawaida haipo, imepotoshwa, au haiamini.
Mbinu za kugundua zinajumuisha hatua kadhaa:
Utoaji wa ishara: Ishara za rPPG hutolewa kwenye maeneo mengi ya kupendeza (ROI) kwenye uso wa mtu kwenye video.
Uchakataji wa ishara: Kelele huondolewa kutoka kwa ishara mbichi, ambayo kisha inachakatwa (kwa kawaida kwa kutumia ubadilishaji wa haraka wa Fourier (FFT)) ili kuchanganua sifa zake za kikoa cha muda na kikoa cha spectral. FFT inaweza kufichua masafa ya faida ya ishara, ambayo yanalingana na mapigo ya moyo.
Uainishaji: Kigawanyaji kimefundishwa (kwa mfano, CNN) ili kutofautisha mifumo thabiti, ya mdundo ya mapigo halisi ya moyo kutoka kwa ishara za kelele, zisizoendana, au zisizopo zinazopatikana kwenye video bandia.
Katika mazingira yaliyodhibitiwa ya majaribio, mbinu hii imefikia usahihi wa juu sana wa kugundua, na baadhi ya tafiti zikiripoti viwango vya usahihi vya hadi 99.22%. Hata hivyo, mbinu hii ina udhaifu muhimu. Teknolojia za deepfake za hali ya juu zaidi (hasa zile zinazohusisha uigizaji upya) zinaweza kurithi ishara za kisaikolojia kutoka kwa video ya chanzo au "inayoendesha". Hii ina maana kwamba bandia inaweza kuonyesha ishara ya rPPG ya kawaida kabisa na thabiti kikamilifu. Itakuwa tu mapigo ya moyo ya muigizaji wa chanzo, na sio ya mhusika anayeonyeshwa kwenye video ya mwisho. Ugunduzi huu unachallenge dhana rahisi ya ukosefu wa ishara za kisaikolojia katika deepfake na huongeza kizingiti cha kugundua. Mbinu za baadaye lazima zipite zaidi ya kukagua tu uwepo wa kunde, bali zinapaswa kuthibitisha uwiano wa kisaikolojia na sifa mahususi za utambulisho wa ishara.
Mbio za Silaha za Kugundua: Changamoto ya Mifumo ya Usambazaji na Mashambulizi ya Uadui
Uwanja wa ugunduzi wa deepfake unafafanuliwa na mbio za silaha zisizo na huruma. Mara tu mbinu ya kuaminika ya kugundua inapoendelezwa, mifumo ya uzalishaji inaendelea kubadilika ili kuishinda. Ongezeko la hivi karibuni la mifumo ya usambazaji na matumizi ya mashambulizi ya uadui ni changamoto mbili muhimu zaidi zinazoikabili vizuia vya kisasa.
Kushindwa kwa ujumlishaji: Udhaifu mkuu wa mifumo mingi ya kugundua ni kutoweza kuunganisha. Vigunduzi vilivyofunzwa vinaweza kutambua bandia kutoka kwa mfumo maalum wa uzalishaji (kwa mfano, StyleGAN2) au kwenye seti maalum ya data mara nyingi hushindwa wanapokabiliwa na mbinu mpya za uendeshaji au vikoa tofauti vya data. Mifumo ya usambazaji inafanya tatizo hili kuwa kubwa hasa. Kwa sababu matokeo yao yana mabaki machache dhahiri, maudhui yana utofauti zaidi, na yanafaa kwa karibu zaidi sifa za takwimu za picha halisi, wanaweza kukwepa vigunduzi vilivyoundwa kwa GAN kwa ufanisi. Ili kushughulikia tatizo hili, watafiti wanaendeleza seti mpya na ngumu zaidi za data za alama za maji ambazo zinajumuisha deepfake za usambazaji za hali ya juu zaidi ili kuongeza uumbaji wa vigunduzi thabiti na vya jumla zaidi.
Mashambulizi ya uadui: Hata vigunduzi sahihi sana huathirika na uharibifu wa moja kwa moja kupitia mashambulizi ya uadui. Katika kesi hii, washambuliaji huingiza usumbufu mdogo usioonekana kwenye pikseli za picha ya deepfake. Ingawa mabadiliko haya hayaonekani kwa wanadamu, yameundwa mahsusi ili kutumia udhaifu katika mitandao ya neva ya vigunduzi, na hivyo kusababisha kuainisha picha bandia kama picha halisi kwa makosa. Tishio hili lipo katika mazingira ya "sanduku jeupe" (ambapo mshambuliaji anaelewa kikamilifu usanifu wa kigunduzi) na mazingira ya kweli zaidi ya "sanduku jeusi" (ambapo mshambuliaji anaweza tu kuuliza kigunduzi na kuchunguza matokeo yake).
Ili kukabiliana na hili, jamii ya utafiti inalenga kuendeleza kizazi kijacho cha vigunduzi na uhimilivu ulioongezeka. Mikakati muhimu ni pamoja na:
Tofauti ya data ya mafunzo: Imeonyeshwa kuwa kuongeza seti za data za mafunzo ili kujumuisha bandia mbalimbali kutoka kwa GAN na mifumo ya usambazaji, pamoja na vikoa mbalimbali vya picha, huongeza uwezo wa ujumlishaji.
Mikakati ya hali ya juu zaidi ya mafunzo: Teknolojia mpya (kama vile "kuongeza ugumu wa kasi") zinachunguzwa ili uzani sampuli kulingana na ugumu wa uainishaji wa sampuli za msingi, kusaidia mifumo kufundisha kwa ufanisi zaidi kwenye seti za data zisizo sawa.
Usanifu thabiti: Usanifu mpya umeundwa ili uwe na ukinzani zaidi dhidi ya mashambulizi. Njia moja ya kuahidi ni kutumia mkusanyiko usio ambatana ambapo mifumo mingi inafunzwa kwenye sehemu tofauti na zisizoingiliana za wigo wa masafa ya picha. Hii inamlazimu mshambuliaji kupata usumbufu ambao unaweza kudanganya mifumo mingi kwa wakati mmoja, kazi ngumu sana. Mbinu zingine mseto huunganisha vipengele kutoka kwa kikoa cha anga na kikoa cha masafa ili kujenga mfumo kamili zaidi wa data.
Mzunguko unaoendelea kati ya teknolojia za uzalishaji na teknolojia za ugunduzi unaonyesha kuwa ulinzi wowote tuli lazima uweze kupitwa na wakati. Kadiri mifumo ya uzalishaji inavyoendelea kuondo