Derin sahtecilik teknolojisi, toplumsal güvene ve bilgi güvenliğine yönelik benzeri görülmemiş zorluklar sunarak hızla gelişiyor. Derin sahteciliğin yayılmasını engelleme yeteneği, konuyla ilgili kapsamlı bir anlayışa bağlı olduğundan, bu makale yapay zeka destekli derin sahteciliğin nasıl önleneceğini araştıracaktır.
Derin Sahteciliğin Motoru: Teknik Analiz
Derin sahteciliğin kalbinde, devasa veri kümelerinden öğrenip gerçekçi görüntüler, videolar ve sesler üretebilen bir AI türü olan üretken modeller yer alır. Son yıllarda, Üretken Çekişmeli Ağlar (GAN’lar), daha da güçlü yeteneklere sahip, yaygın modeller haline geldi. Bu nedenle, sağlam bir önleme çerçevesi oluşturmak için bu üretken motorlara teknik bir analiz yapmak gerekir.
Çekişmeli Oyun: Üretken Çekişmeli Ağlar (GAN’lar)
GAN’lar, iki sinir ağından oluşur: üreteç ve ayrıştırıcı. Üretecin görevi, gerçek dünyadaki verileri taklit eden sentetik veri oluşturmaktır. Genellikle gizli vektör olarak adlandırılan rastgele bir girdiden başlar ve bunu tutarlı bir çıktıya dönüştürmeye çalışır. Öte yandan, ayrıştırıcı bir sınıflandırıcı görevi görür ve verileri değerlendirerek gerçek (gerçek eğitim veri kümesinden) mi yoksa sahte (üreteç tarafından oluşturulmuş) mi olduğunu belirler.
Eğitim süreci, sıfır toplamlı bir oyuna benzer şekilde, iki ağ arasında sürekli bir geri bildirim döngüsünü içerir. Üreteç, sahte bir görüntü oluşturur ve ayrıştırıcıya iletir; ayrıştırıcı da eğitim kümesinden gerçek görüntüler alır. Ayrıştırıcı, ardından her görüntünün gerçekliğini tahmin eder. Ayrıştırıcı, üretecin çıktısını sahte olarak doğru bir şekilde tanımlarsa, geri bildirim sağlar. Üreteç, bu geri bildirimi iç parametrelerini ayarlamak için geri yayılım yoluyla kullanır, böylece bir sonraki yinelemede daha ikna edici bir görüntü oluşturur. Aynı zamanda, ayrıştırıcı, sahteleri tespit etmede daha iyi olmak için kendi parametrelerini ayarlar. Bu çekişmeli rekabet, sistemin bir denge noktasına veya bazen Nash dengesi olarak adlandırılan, üretecin çıktısının o kadar gerçek olduğu noktaya ulaşana kadar devam eder ki ayrıştırıcı artık onları gerçek verilerden güvenilir bir şekilde ayıramaz ve yaklaşık %50 doğrulukla tahmin eder.
GAN’lar, sentetik medya oluşturmada etkili olduğunu kanıtlamış ve birçok etkili derin sahtecilik modelinin temelini oluşturmuştur. Derin Evrişimli GAN’lar (DCGAN’lar) gibi mimariler, havuzlama katmanlarını değiştirerek ve toplu normalleştirme kullanarak kararlılığı artırarak önemli iyileştirmeler sunmuştur. NVIDIA’nın StyleGAN’ı ve halefleri StyleGAN2 ve StyleGAN3, yüz oluşturmada emsalsiz bir foto gerçekçiliğe ulaşmış, özellik yapıtlarını düzeltmiş ve model mimarilerini ilerletmiştir. CycleGAN gibi diğer varyantlar, stil aktarım görevlerini başarmış ve bu nedenle bir kişinin görünüm yaşını değiştirmek için Face App gibi uygulamalarda yaygın olarak kullanılmıştır.
GAN’ların gücüne rağmen, onları eğitmenin zor olduğu iyi bilinmektedir. Üreteç ve ayrıştırıcı arasındaki hassas denge kolayca bozulabilir, bu da eğitimde istikrarsızlığa, yavaş yakınsamaya veya “model çöküşü” olarak bilinen önemli bir arıza moduna yol açar. Model çöküşü, üreteç ayrıştırıcıdaki bir zayıflığı keşfettiğinde ve yalnızca ayrıştırıcıyı kandırabileceğini bildiği sınırlı türde çıktılar üreterek bunu kullandığında meydana gelir ve bu da eğitim verilerinin gerçek çeşitliliğini yakalamayı başaramaz. Bu doğal zorluklar ve genellikle ürettikleri ince yapıtlar, erken derin sahtecilik tespit sistemlerinin birincil hedefleri haline geldi.
Kaosun Tersine Çevrilmesi: Yaygın Modeller
Üretken AI’daki en son teknolojiler, yeni bir model sınıfı olan yaygın modellere kesin bir geçiş yapmıştır. Denge dışı termodinamik kavramlarından ilham alan yaygın modeller, GAN’ların çekişmeli rekabetten temelde farklı bir şekilde çalışır. Anormal derecede yüksek kaliteli ve çeşitli veriler üretmek için aşamalı olarak bozulma sürecini tersine çevirmeyi öğrenerek bunu yapabilen olasılıksal üretken modellerdir.
Yaygın model mekanizması iki aşamalı bir süreçtir:
İleri Yaygınlaştırma Süreci: Bu aşama, bir görüntüye kademeli olarak küçük miktarlarda Gauss gürültüsü ekleyerek, zaman içinde (örneğin, T adımları) sistematik ve aşamalı olarak meydana gelir. Bu, her adımın bir öncekine koşullandırıldığı bir Markov zinciri işlemidir, görüntü kalitesini kademeli olarak azaltır, öyle ki son zaman adımında T, yapılandırılmamış gürültüden ayırt edilemez hale gelir.
Ters Gürültü Giderme Süreci: Modelin anahtarı, bu süreci tersine çevirmek için eğitilmiş bir sinir ağıdır (genellikle bir U-Net mimarisi şeklinde). İleri işlem sırasında her zaman adımında eklenen gürültüyü tahmin etmeyi ve çıkarmayı öğrenir. Eğitimden sonra, model rastgele bir gürültü örneğinden başlayabilir ve kaosu orijinal veri dağıtımının tutarlı bir örneğine dönüştürerek yeni yüksek kaliteli görüntüler üretmek için bu öğrenilmiş “gürültü giderme” işlevini yinelemeli olarak geriye doğru uygulayabilir.
Bu yinelemeli iyileştirme süreci, yaygın modellerin en iyi GAN’lardan daha da iyi foto gerçekçilik ve çeşitlilik seviyelerine ulaşmasını sağlar. Eğitim süreçleri de GAN’larınkinden önemli ölçüde daha kararlıdır, model çöküşü gibi sorunları önler ve daha güvenilir ve çeşitli çıktılar üretir. Bu teknik avantajlar, yaygın modelleri günümüzün en önemli ve güçlü üretken AI araçlarının temeli haline getirmiştir, buna OpenAI’nin DALL-E 2’si, Google’ın Imagen’i ve Stability AI’nın Stable Diffusion’ı gibi metinden görüntüye modeller ve OpenAI’nin Sora’sı gibi metinden videoya modeller dahildir. Bu modellerin yaygın kullanılabilirliği ve olağanüstü çıktı kalitesi, derin sahtecilik tehdidini önemli ölçüde artırmıştır.
Çalışma Yöntemleri
İster GAN ister yaygın modeller olsun, altta yatan üretken motor, derin sahtecilik videoları oluşturmak için çeşitli belirli teknikler aracılığıyla uygulanır. Bu yöntemler, istenen aldatma etkisini elde etmek için hedef videonun çeşitli yönlerini ele alır.
Yeniden Canlandırma: Bu teknik, kaynak karakterinin yüz ifadelerini, baş hareketlerini ve konuşma ile ilgili hareketlerini bir videodaki hedef nesneye aktarır. İşlem genellikle üç ana adımdan oluşur: İlk olarak, kaynak ve hedef videolardaki yüz özelliklerini izler; ikinci olarak, bu özellikleri tutarlılık ölçümleri kullanılarak genel bir 3B yüz modeliyle hizalar; ve son olarak, ifadeleri kaynaktan hedefe aktarır, ardından gerçekçilik ve tutarlılığı artırmak için sonraki iyileştirmeler yapılır.
Dudak Senkronizasyonu: Dudak senkronizasyonu derin sahtecilik teknikleri, özellikle konuşmayı ele almaya adanmıştır ve esas olarak gerçekçi ağız hareketleri oluşturmak için ses girişini kullanır. Ses, dinamik ağız şekillerine ve dokularına dönüştürülür, ardından hedef videoyla dikkatlice eşleştirilir ve karıştırılır, bu da hedef karakterin girdi sesini söylediği yanılsamasını yaratır.
Metin Tabanlı Sentez: Bu son derece karmaşık yöntem, bir metin senaryosuna göre bir videoyu değiştirir. Metni, onu oluşturan fonemlere (ses birimleri) ve görsel fonemlere (konuşma sesinin görsel temsilleri) ayrıştırarak çalışır. Bunlar daha sonra kaynak videodaki karşılık gelen sekanslarla eşleştirilir ve karakterin söylüyor gibi göründüğü şeyi kelimesi kelimesine düzenlemeye olanak tanıyan yeni metne uyacak şekilde dudak hareketlerini oluşturmak ve düzeltmek için 3B bir kafa modelinin parametreleri kullanılır.
GAN’lardan yaygın modellere geçiş, aşamalı bir iyileştirmeden daha fazlasıydı; bu temelde derin sahtecilik önleme stratejilerinin manzarasını yeniden şekillendiren bir paradigma kaymasıdır. GAN’lar, güçlü olmasına rağmen, hem eğitimde istikrarsızlık hem de genellikle görüntülerin frekans alanında tahmin edilebilir ve tespit edilebilir yapıtlarla sonuçlanan model çöküşü gibi bilinen mimari zayıflıklara sahipti. Sonuç olarak, tüm bir tespit araçları nesli özellikle bu GAN’a özgü parmak izlerini tanımlamak için oluşturulmuştur. Ancak, yaygın modeller daha kararlı bir şekilde eğitilir ve daha çeşitli, gerçekçi çıktılar üretir ve istatistiksel olarak gerçek görüntülere daha yakın olduğu için, seleflerinin sahip olduğu belirgin kusurların çoğuna sahip değildir.
Sonuç olarak, mevcut derin sahtecilik tespit altyapısının büyük bir kısmı hızla modası geçmektedir. Araştırmalar, GAN tarafından oluşturulan görüntüler üzerinde eğitilmiş tespit cihazlarının yaygın modellerden gelen içeriklere uygulandığında “ciddi bir performans düşüşü” yaşadığını göstermiştir. Önemli bir şekilde, yaygın model görüntülerinde eğitilmiş tespit cihazları GAN tarafından oluşturulan içeriği başarıyla tanımlayabilirken, bunun tersi geçerli değildir, bu da yaygın modellerin daha karmaşık ve zorlu bir sahtecilik sınıfını temsil ettiğini göstermektedir. Aslında, bu teknik silahlanma yarışını etkili bir şekilde sıfırladı, yaygın olarak oluşturulan medyanın benzersiz ve daha ince özellikleriyle başa çıkmak için savunma stratejilerinin yeniden tasarlanmasını gerektiriyor.
Ek olarak, bu üretken modellerin “kara kutu” özelliği, kaynakta önleme çabalarını karmaşıklaştırmaktadır. Hem GAN’lar hem de yaygın modeller, denetimsiz veya yarı denetimli bir şekilde çalışarak, veri kümelerinin istatistiksel dağılımlarını taklit etmeyi, açık semantik etiketlere ihtiyaç duymadan öğrenir. “Bir yüzün ne olduğunu” insanların anlayabileceği bir şekilde öğrenmek yerine, “bir yüz veri kümesinde hangi piksel desenlerinin mümkün olduğunu” öğrenirler. Bu, kısıtlamaları doğrudan oluşturma sürecine programlamayı olağanüstü derecede zorlaştırır (örneğin, “zararlı görüntüler oluşturmayın”). Model sadece bir matematiksel işlevi optimize eder: ya ayrıştırıcıyı kandırmak ya da gürültü sürecini tersine çevirmek. Bu, önlemenin çekirdek algoritmayı içeriden düzenlemeye dayanamayacağı anlamına gelir. Önleme için en uygulanabilir müdahaleler, oluşturmadan önce (eğitim verilerini kontrol ederek) veya oluşturmadan sonra (tespit, filigranlama ve köken yoluyla) gerçekleşmelidir, çünkü eylem kendisi doğası gereği doğrudan yönetime karşı dirençlidir.
Üretken Motorların Karşılaştırmalı Analizi
GAN’lar ve yaygın modeller arasındaki stratejik farklılıkları anlamak, politika yapıcılarından kurumsal güvenlik yetkililerine kadar her paydaş için zorunludur. İlkinden ikincisine olan teknik baskınlık kaymasının, tespit zorluğu, aldatma olasılığı ve genel tehdit ortamı üzerinde derin etkileri vardır.
Özellik | Üretken Çekişmeli Ağlar (GAN’lar) | Yaygın Modeller | Stratejik İmplikasyon |
---|---|---|---|
Temel Mekanizma | Üreteç ve ayrıştırıcı, sıfır toplamlı bir oyunda rekabet eder. | Sinir ağları, aşamalı bir “gürültü giderme” sürecini tersine çevirmeyi öğrenir. | Yaygınlaştırmanın yinelemeli iyileştirme süreci, daha fazla doğruluk ve daha az yapısal hata ile sonuçlanır. |
Eğitim Süreci | İstikrarsızlığı ile bilinir; “model çöküşüne” ve yavaş yakınsamaya yatkındır. | Eğitim, kararlı ve güvenilirdir, ancak yoğun bilgi işlem gerektirir. | Yaygın modellerle yüksek kaliteli sonuçlar elde etmek için giriş engeli düşüktür ve bu da tehdidi demokratikleştirir. |
Çıktı Kalitesi | Yüksek kaliteli görüntüler üretebilir, ancak ince yapıtlar içerebilir. | Şu anda foto gerçekçiliğinin ve çeşitliliğinin en yüksek seviyeleri; genellikle gerçek fotoğraflardan ayırt edilemez. | Sahtecilikler daha ikna edici hale gelir, “görmek inanmaktır” sezgisini aşındırır ve insan tespitine meydan okur. |
Tespit Edilebilirlik | Daha eski tespit yöntemleri genellikle GAN’a özgü yapıtları (örneğin, frekans dengesizlikleri) bulmak için ayarlanmıştır. | GAN tabanlı tespit cihazlarının çoğunu eskimiş hale getirir. Görüntüler daha az yapıt içerir ve gerçek veri istatistikleriyle daha yakından eşleşir. | Derin sahtecilik “silahlanma yarışı” sıfırlanmıştır. Tespit araştırmaları ve geliştirme, yaygın dağılıma özgü ipuçlarına özel olarak odaklanmaya kaymalıdır. |
Ünlü Modeller | StyleGAN, CycleGAN | DALL-E, Stable Diffusion, Imagen, Sora | Şu anda en güçlü ve yaygın olarak kullanılan araçlar yaygınlamaya dayanır ve bu da tehdidi hızlandırır. |
Dijital Bağışıklık Sistemi: Tespit Yöntemlerinin Karşılaştırmalı Analizi
Sentetik medyanın yayılmasına karşı koymak için, yeni bir “dijital bağışıklık sistemi” oluşturan çeşitli tespit yöntemleri alanı ortaya çıkmıştır. Bu teknikler, dijital yapıtların adli analizinden, potansiyel biyolojik sinyalleri yoklayan yeni yöntemlere kadar uzanır. Ancak, bu bağışıklık sisteminin etkinliği, üretken modellerdeki hızlı gelişmelerden ve tespitinden kaçınmak için tasarlanmış çekişmeli saldırılardan sürekli olarak etkilenir. Oluşturma ve tespit arasındaki sürekli mücadele, savunucuların statükoyu korumak için sürekli olarak yenilikler geliştirmesi gereken bir “Kırmızı Kraliçe” paradoksudur.
Dijital Yapıtların Adli Analizi
En yerleşik derin sahtecilik tespit kategorisi, dijital yapıtların adli analizini içerir, yani üretim süreci tarafından bırakılan ince kusurlar ve tutarsızlıklardır. Bu kusurlar ve tutarsızlıkları tanımlamak genellikle zordur ve çıplak gözle algılanamaz, ancak özel algoritmalar tarafından tespit edilebilir.
Görsel ve Anatomik Tutarsızlıklar: Erken ve hatta günümüzdeki üretken modellerin bazılarının insan anatomisinin karmaşıklığını ve gerçek dünya fiziğini mükemmel bir şekilde kopyalaması zordur. Tespit yöntemleri, medyadaki belirli anormallikleri analiz ederek bu kusurlardan yararlanır. Bunlara doğal olmayan göz kırpma desenleri, yani çok fazla göz kırpma, çok az göz kırpma veya hiç göz kırpmama (genellikle eğitim verilerinde kapalı göz görüntüleri eksikliğinden kaynaklanır), robotik veya tutarsız göz hareketleri ve alt dişlerin asla gösterilmediği kısıtlanmış dudaklar veya ağız şekli dahildir. Diğer göstergeler arasında konuşma sırasında burun deliklerinde ince değişikliklerin olmaması, çevreyle uyuşmayan aydınlatmada tutarsızlıklar ve gözlüklerde veya diğer yansıtıcı yüzeylerde hatalı veya eksik yansımalar yer alır.
Piksel ve Sıkıştırma Analizi: Bu teknikler daha düşük bir seviyede çalışır ve bir görüntü veya videonun dijital yapısını inceler. Hata Seviyesi Analizi (ELA), bir görüntüdeki farklı sıkıştırma seviyelerine sahip bölgeleri tanımlama tekniğidir. Manipüle edilmiş bölgeler genellikle yeniden kaydedildiği veya yeniden sıkıştırıldığı için, görüntünün orijinal bölümlerinden farklı hata seviyeleri gösterebilir ve bu da sahte görüntüyü vurgular. Bununla yakından ilişkili olan Kenar ve Karıştırma Analizi, sentetik öğeler (örneğin, değiştirilmiş yüzler) ve gerçek arka plan arasındaki sınırları ve ana hatları yakından inceler. Bu alanlar, tutarsız pikselleşme, doğal olmayan keskinlik veya bulanıklık ve renk ve dokudaki ince varyasyonlar gibi işaretler aracılığıyla manipülasyonu ortaya çıkarabilir.
Frekans Alanı Analizi: Bu yöntemler, pikselleri doğrudan analizlemek yerine, doğal olmayan desenler bulmak için bir görüntüyü frekans bileşenlerine dönüştürür. GAN’ların üreteçleri yukarı örnekleme kullanan mimariler sunduğu için, genellikle karakteristik spektral yapıtlar bırakarak gerçek görüntülerde bulunmayan periyodik desenler oluşturur. Bu, çoğu GAN için etkili olsa da, yaygın dağılıma sahip modellerle daha az başarılıdır, bu da daha doğal frekans profillerine sahip görüntüler üretir. Bununla birlikte, bazı araştırmalar, yaygın dağılıma sahip modellerin yine de gerçek görüntülere kıyasla yüksek frekanslı ayrıntılarda tespit edilebilir uyumsuzluklar sergileyebileceğini ve bu da tespit için potansiyel bir yol sağladığını göstermektedir.
Biyolojik Sinyal Analizi: Derin Sahteciliğin “Kalp Atışı”
Derin sahtecilik tespiti alanındaki daha yeni ve umut verici bir alan, medyada gerçek biyolojik sinyallerin varlığını analiz etmeyi içerir. Bunun temel önermesi, üretken modeller görsel görünümleri çoğaltmada gittikçe daha iyi hale gelirken, canlı bir insanın altta yatan fizyolojik süreçlerini simüle edememeleridir.
Bu alandaki başlıca teknik uzaktan fotopletismografi (rPPG)‘dir. Bu teknik, kalbin yüzey kan damarlarına kan pompaladığında meydana gelen cilt rengindeki küçük döngüsel değişiklikleri tespit etmek için standart bir kamera kullanır. Bir insanın gerçek bir videosunda, bu zayıf ama tutarlı bir nabız sinyali üretir. Derin sahteciliklerde, bu sinyal genellikle yoktur, bozulur veya tutarsızdır.
Tespit yöntemi birkaç adımı içerir:
Sinyal Çıkarma: Videodaki bir kişinin yüzündeki birden fazla ilgi alanından (ROI) rPPG sinyalleri çıkarılır.
Sinyal İşleme: Orijinal sinyaldeki gürültü temizlenir, ardından zamansal ve spektral alan özelliklerini analiz etmek için işlenir (tipik olarak hızlı Fourier dönüşümü (FFT) kullanılarak). FFT, sinyalin baskın frekansını ortaya çıkarabilir, bu frekans kalp atış hızına karşılık gelir.
Sınıflandırma: Sahte videolarda bulunan gürültülü, tutarsız veya mevcut olmayan sinyallerden gerçek bir kalp atışının tutarlı ritmik desenlerini ayırt etmek için bir sınıflandırıcı (örneğin, bir CNN) eğitilir.
Kontrollü deneysel ortamlarda, bu yöntem çok yüksek tespit doğruluğu elde etmiştir, bazı araştırmalar %99,22’ye kadar rapor vermiştir. Ancak, bu yöntemin önemli bir güvenlik açığı vardır. Daha gelişmiş derin sahtecilik teknikleri (özellikle yeniden canlandırmayı içerenler), bir kaynak videoya veya “sürücü” videoya ait fizyolojik sinyalleri miras alabilir. Bu, derin sahteciliklerin tamamen doğal ve tutarlı rPPG sinyalleri gösterebileceği anlamına gelir. Bu sadece hedef videoda sergilenen kişinin değil, kaynak aktörün kalp atışı olacaktır. Bu bulgu, derin sahteciliklerde fizyolojik sinyallerin olmaması şeklindeki basit varsayımına meydan okur ve tespit için çıtayı yükseltir. Gelecekteki yaklaşımlar, sadece nabzın varlığını kontrol etmenin ötesine geçmeli ve sinyalin fizyolojik tutarlılığını ve kimliğe özgü özelliklerini doğrulamalıdır.
Tespit Silahlanma Yarışı: Yaygın Modellerin ve Çekişmeli Saldırıların Zorlukları
Derin sahtecilik tespit alanı, acımasız bir silahlanma yarışı ile tanımlanır. Güvenilir bir tespit yöntemi geliştirildiğinde, üretken modeller onu aşmak için sürekli olarak gelişecektir. Yaygın modellerin yakın zamandaki yükselişi ve çekişmeli saldırıların kullanımı, modern tespit cihazları için en önemli iki zorluğu temsil etmektedir.
Genelleme Başarısızlığı: Birçok tespit modelinin temel bir zayıflığı, genelleştirme yetenekleridir. Belirli bir üretken modelden (örneğin, StyleGAN2) veya belirli bir veri kümesindeki sahtecilikleri tanımak için eğitilmiş tespit cihazları, yeni manipülasyon teknikleri veya farklı veri alanları ile karşılaştıklarında sıklıkla başarısız olurlar. Yaygın modeller bu sorunu özellikle şiddetlendirir. Çıktıları daha az belirgin yapıt içerdiğinden, içerik daha çeşitli olduğundan ve gerçek görüntülerle istatistiksel özellikleri daha yakından eşleştiğinden, GAN’lar için tasarlanmış tespit cihazlarından etkili bir şekilde kaçabilirler. Bu sorunu ele almak için, araştırmacılar daha sağlam ve daha genel tespit cihazları oluşturmayı desteklemek için en yeni yaygın derin sahtecilikleri içeren yeni ve daha zorlu kıyaslama veri kümeleri geliştiriyorlar.
Çekişmeli Saldırılar: Son derece doğru tespit cihazları bile, çekişmeli saldırılar yoluyla doğrudan bozulmaya karşı savunmasızdır. Bu durumda, saldırganlar derin taklit görüntülerinin piksellerinde küçük, algılaması zor değişiklikler yaparlar. Bu değişiklikler insanlar tarafından görünür olmasa da, taklit edici görüntüyü gerçek görüntü olarak yanlış sınıflandırmasına neden olarak, tespit cihazı sinir ağındaki zayıflıklardan yararlanmak için özel olarak tasarlanmıştır. Bu tehdit hem “beyaz kutu” ortamında (saldırganın tespit cihazının mimarisi hakkında eksiksiz bilgiye sahip olduğu) hem de daha gerçekçi “kara kutu” ortamında (saldırgan yalnızca tespit cihazını sorgulayabileceği ve çıktılarını gözlemleyebileceği) mevcuttur.
Buna karşılık, araştırma topluluğu, gelişmiş kurtarma özelliklerine sahip, sonraki nesil tespit cihazları geliştirmeye odaklanmıştır. Temel stratejiler şunları içerir:
Eğitim Veri Çeşitliliği: Eğitim veri kümelerinin hem GAN’lardan hem de yaygın modellerden gelen çeşitli sahteciliklerle hem de çeşitli görüntü etki alanlarıyla artırılmasının genelleme özelliklerini geliştirdiği kanıtlanmıştır.
Gelişmiş Eğitim Stratejileri: Örnekleri, sınıflandırma zorluğuna dayalı olarak dinamik olarak ağırlıklandırarak karmaşık veri kümeleri üzerinde daha etkili bir şekilde eğitim almalarına yardımcı olmak için modeli zorlamak için “momentum zorluğu artırma” gibi yeni teknikler araştırılmaktadır.
Sağlam Mimariler: Doğası gereği saldırılara karşı daha dirençli yeni mimariler tasarlanmaktadır. Promising yaklaşımlardan biri, görüntülerin frekans spektrumunun farklı ve ayrı alt kümelerinde birden fazla modelin eğitildiği zıt toplulukları kullanmaktır. Bu, saldırganları aynı anda birden fazla modeli kandırabilecek kesintileri bulmaya zorlar ve bu çok daha zor bir görevdir. Diğer karma hibrit yaklaşımlar, verilerin daha kapsamlı bir modelini oluşturmak için uzamsal ve frekans etki alanlarından gelen özellikleri birleştirir.
Üretken ve tespit teknikleri arasında sürekli bir gidiş dönüş, herhangi bir statik savunmanın eskimeye mahkum olduğunu gösterir. Bir göz kırpma anomalisi veya GAN yapıtı gibi işaretleri gidermek için üretken modeller gelişmeye devam ettikçe, tespit cihazları yüksek frekans uyumsuzlukları veya rPPG imzaları gibi daha ince sinyallere geçmelidir. Buna karşılık, bir kaynaktan gelen rPPG sinyalini miras alanında görüldüğü gibi, bu işaretleri taklit etmek için üretken modeller eğitilebilir. Bu sürekli döngü, tek başına reaktif tespitine güvenen bir önleme stratejisininpahalı ve potansiyel olarak kazanılamaz bir silahlanma yarışı içinde bulunduğunu gösterir.
En kalıcı tespit stratejileri, dijital simülasyon ile fiziksel gerçeklik arasındaki temel boşluklardan yararlanan stratejiler olacaktır. Görsel yapıtlar, daha iyi algoritmalar ve daha fazla bilgi işlem gücü kullanılarak aşamalı olarak giderilebilen simülasyondaki kusurlar iken, yeni ortaya çıkan biyoloji ve fizik özelliklerini ilkelerden modellenmesi AI için çok daha zordur. Üretken Modeller insan kardiyovasküler sistemini “anlamaz”. Sadece yüzlerle ilişkilendirilen piksel desenlerini kopyalamayı öğrenir. Bir kalp atışının görsel sonuçlarını taklit etmek için eğitebileceği halde, yeni bir kimlik için fizyolojik olarak tutarlı ve doğru bir sinyal oluşturmak, tüm bir biyolojik sistemi modellemeyi gerektirecektir ve bu daha yüksek sıralı bir zorluktur. Bu nedenle, en sağlam tespit araştırması sadece rPPG’yi değil, karmaşık biyolojik süreçler tarafından kontrol edilen ve yüksek doğrulukta simüle edilmesi zor olan ince solunum paternleri, isteksiz öğrenci dilatasyonu ve mikro ifadeler gibi diğer işaretleri de içerebilecek olan bu “fiziksellik boşluklarına” odaklanacaktır.
Dijital Güven Oluşturma: Filigranlama ve Kaynak ile Proaktif Önleme
Saf reaktif tespit stratejilerinin kalıcı sınırlamaları nedeniyle taklit tehlikesini daha esnek ve sürdürülebilir bir şekilde önleme planı, proaktif önlemleri içerir. Bu teknikler, başından beri dijital medya ekosistemine güven ve sorumluluk oluşturmayı amaçlar. Bu örnek, oluşturma ve yaymadan sonra sahtecilikleri belirlemeye odaklanmak yerine, meşru içeriğin özgünlüğünü ve kaynağını doğrulamaya odaklanmaya kayar. Bu alandaki iki önde gelen teknik arasında adli dijital filigranlama ve blok zinciri tabanlı içerik kaynağı yer alır.
Adli Dijital Filigranlama: Gizli İmzalar
Adli dijital filigranlama, benzersiz ve kolayca algılaması zor olan bir tanımlayıcıyı doğrudan dijital içeriğe (örneğin, resim, video veya belge) yerleştiren proaktif bir tekniktir. Bir görüntü üzerine yerleştirilmiş bir logo gibi görünür filigranlardan farklı olarak, adli filigranlar dosyanın verilerde gizlidir ve olağanüstü derecede sağlam olacak şekilde tasarlanmıştır. İyi tasarlanmış bir adli filigran, sıkıştırma, kırpma, yeniden boyutlandırma, renk ayarlamaları ve hatta ekran görüntüleri veya ekrandan kameraya kadar genel dosya işlemlerinden kurtulabilir.
Derin taklitlenmeyi önleme bağlamında, adli filigranlamanın birkaç temel işlevi vardır:
Kaynak İzleme ve Sorumluluk: Oluşturucunun, kullanıcının belirleyici bilgilerini yerleştirerek veya dağıtım kanallarını belirleyerek, kötü amaçlı derin taklitlenme sızdırılırsa veya kötüye kullanılırsa, filigran kaynağını izlemek için kullanılabilir. Örneğin, bir video isteği (VOD) veya iş ortamında, sistem A/B filigranlaması sağlayarak her kullanıcıya biraz farklı olan, benzersiz filigranlara sahip video sürümleri gönderebilir. Bir kopyanın çevrimiçi olarak ortaya çıkması durumunda, filigran sızıntının tam kaynağını tanımlamak ve yasal veya idari işlemlerde güçlü kanıt sağlamak için çıkarılabilir.
Özgünlük Doğrulaması: Filigran, resmi içeriğin özgünlük damgası olarak kullanılabilir. Hükümet kurumları, şirketler veya haber kuruluşları, meşru medyasına benzersiz bir filigran yerleştirebilir. Bu, gerçek iletişimi doğrulayabilir ve taklit yoluyla derin taklitlerle yapılan girişimleri tespit etmeye ve engellemeye yardımcı olur.
Yaşam Döngüsü İzleme: Destekçiler, filigranların içerik yaşam döngüsünün çeşitli aşamalarına entegre edilebileceğini öne sürüyorlar. Örneğin, taklit oluşturma derin uygulamaları tarafından bile izlenebilir kayıtlar oluşturmak için sosyal medyaya, mesajlaşma uygulamalarına yükleyebilir ve hatta medyaya yerleştirebilir.
Derin taklitlerle mücadele etmek için özel olarak gelişmiş filigran teknikleri geliştiriliyor. Yeni yaklaşımlardan biri, filigranı doğrudan yüz görüntüsünün kimlik özelliklerine yerleştiren bir sinir ağı tasarlamayı içeriyor. Bu, taklitler geleneksel görüntü modifikasyonlarında (compression, size adjustment ) sağlam kalırken, bu manipülasyon kimlik özelliklerini içsel olarak değiştirir ve bu nedenle filigranı bozar.
Filigranlamanın sunduğu umutlu görünümüne rağmen, önemli zorluklarla karşı karşıyadır. İlk olarak, filigranlar yenilmez değildir. Araştırmalar, yerleşik filigranları etkili bir şekilde kaldırmak için görüntüleri “çözmek” veya yeniden yapılandırmak için (özellikle yaygın modeller kullanılarak) antagonist teknikler kullanılabileceğini göstermiştir. İkincisi ve daha da önemlisi, bir sistem çözümü olarak filigranlamanın etkinliği, yaygın benimsenmeye bağlıdır. Şu anda, derin taklit uygulamalarının veya sosyal platformların filigranlamayı uygulaması gerektiği ile ilgili yasal veya düzenleyici bir gereklilik bulunmuyor, bu da kullanımını gönüllü ve dağıtık hale getiriyor.
Blok Zinciri ve İçerik Kaynağı: Değiştirilemez Defterler
Tamamlayıcı bir proaktif strateji, güvenilir, doğrulanabilir ve değiştirilemez kaynak ve yaşam döngüsü ve kaynak geçmişi kayıtlar oluşturmak için blok zinciri teknolojisini kullanmaktır. Bu yaklaşım, kalıcı bir doğruluk kaydı oluşturmak için dağıtılmış ve değişmez tutulması bakımından blok zincirinin temel özelliklerinden yararlanır.
Blok zinciri tabanlı kaynak oluşturmaya genellikle üç adım dahildir:
İçerik Parmağı: Oluşturma sırasında tekli şifreleme, paylaşılan bir platforma yüklendiği zaman benzersiz olduğu tespit edildiğinde veri kümelerinin oluşturulmasından gelir. Bu güvenilen dijital parmak izi, minimumda bile benzersizdir ve dosyalanmıştır.
Blok Zinciri Kaydı: Benzersiz ana verilere (oluşturucunun doğrulanan kimliği, damgası, detaylı bilgi gibi) zincirler dağıtılmış ve şifreli ağlar zincircilerde bir işlem olarak gelir. Bu kayıt zinciri şifrelenerek veya dağıtılarak silinemeyen veya değiştirilemeyen kalıcı kayıt zincirleri haline gelebilir.
Devamlı Doğrulama: Gelecekte her kişi ve kişiler tüm medyanın gerçekliliğini doğrulayabilir. Bu sadece işleyeceği ve blok zincirinde depolananlar ile karşılaştırılacak olan bir akım dosyası hesaplamaktır. Eğer etiketler eşleşiyorsa, bunun nedeni dosyanın eşleştirimdeki zamanda olduğu değişmemiş olmasına işarettir. Eğer farklıysa dosya kurcalanmıştır.
Bu sistem, dijital içerik için açık ve doğrulanabilir bir “denetim zinciri” oluşturur. Oluşturucuların eserlerinizi özel anahtarlarını kullanarak dijital olarak imzalamalarına olanak tanır ve eserlerinin özgünlüğünü garanti altına alır. Platformlar, çevrimiçi olarak görünmeden önce içeriği otomatik olarak ve blok zincirine yerleştirebilir ve geçerli bir menşe kaydı olmayan medyayı işaretleyebilir veya engelleyebilir. Bunları blok zincirindeki filigranlayarak dijital olarak bir araya getirilecek olan sistemler, son derede yüksek hassasiyetle tespit özelliklerine yer verilerek %95’e varan doğruluk sağlanacaktır.
Ancak, filigranlar gibi blok zinciri tabanlı kökenlerin de sınırlamaları vardır. Asıl olarak, zincirde kurulmuş olan ağlara bağlıdır. Eğer içerik yaratıcıları, teknoloji platformları ve tüketim aygıları, bunu evrensel bir davranış olarak kabul ederse, bu sistem değere biner. Ek olarak, bu yöntemin yalnızca dijital dosyaların kayıt anında başlayıp, o andan itibaren bütünlediklerini doğruladığı unutmamak önemlidir.
Bu proaktif tekniklerin kullanımı, derin tekel karşıtı stratejiler için kritik dönemsel bir dönüşüme işaret eder. Bu yöntemler, pasif filigran sahte oyunlarında bulunulamayan bir silahlanma zinciri zinciri oluşturmaya değinmek yerine, izleyiciler gerçeklerin kaynaşmasını desteklemeye yöneliktir. Silahlanma takılmasa bile yeni üretken model karmaşık tespit araçlarının ekside kalacağını sürekli olarak kanıtlamaya başlanmıştır. Aksine, proaktif ölçüler içeriği yayınlanırken veya yayınlanmadan önce de yayınlayarak içeriğin kimlik doğrulamasını sağlayabilirler. Amacınız artık bir kusur bularak bir medyanın sahte olduğunu kanıtlamak değildir, tam olarak bunu da yapabilirsiniz.
Bu değişim, tüm bilgi ekosisteminde olası etkileri yaratır. Sentetik içeriklerle giderek daha fazla dolup taşan bir dünyada, yıllar olabileceği ve çevrimiçi varlıkların olabileceğine göre varsayımlar da önlenmelidir. Dijital zincirleme ve filigranlama gibi zincir güvenliği teknolojileri desteklenerek zincirleme sağlam tutulur. Bunların, daha fazla birikimlerin sahte olarak desteklenmenin yükümlülükleri ortaya çıkarılarak kimlikleri doğrulanacaktır.
Ancak, daha esnek bu geleceğe olabildiğince büyük ölçekli bir koordinasyon sağlanılması gerektiğinde tüm engeller teknik olmaz. Filigranlama ve blok zinciri tabanlı menşe teknolojileri halihazırda mevcuttur; ancak bunlardan her birinin teknik düzeyine odaklanmayacağız.