loader

Bu raporun amacı, çeşitli politika tavsiyesi uygulamalarında bireysel düzeyde gizlilik yükü olmayan sentetik verilerin kullanılmasının olası avantajlarını incelemektir.
Politika oluşturma desteğinde kullanılan verilerin ayrıntı düzeyi, bireysel ancak karmaşık ve çoğu zaman erişilemeyen veriler ile bireysel bilgileri korumak ve birleştirmek için bir araya getirilen veriler arasında sancılı bir seçimin sonucu olmuştur. Daha yüksek veri toplamaların kullanımı daha uygundur ancak ayrıntıları gizleme eğilimindedir ve aslında nüfus gruplarının politika yanlılığına ve kümülatif dezavantajlarına yol açabilir.
Bu nedenle, bireysel verileri kullanmanın temel avantajı, ayrıntı düzeyi değil, yapı düzeyidir. Veri kümeleri, verilerden önemli bilgileri yok eder ve çarpık politikalara yol açar. Araştırma alanındaki nüfusun %30’u üniversite mezunu, %30’u 65 yaş üstü ise 65 yaş üstü kişilerin bir kısmının veya tamamının üniversite mezunu olup olmadığını nasıl anlarız?
Veri sentezi, eksik verilerin atfedilmesinden yapay popülasyonlar oluşturmaya kadar kullanılan onlarca yıllık bir kavramdır. 2019’dan bu yana, gerçekçi sentetik veri kopyaları oluşturma vaadiyle yeni üretken çekişmeli ağ yöntemleri ortaya çıkıyor. Bu tür bir veri, orijinal verilerin istatistiksel niteliklerinin ve bilgi zenginliğinin çoğunu korur, ancak gizliliği tamamen korur. Gizliliği ifşa eden bilgileri kesmeye dayanan eski gizlilik koruma yöntemlerinden farklı olarak, sentez yöntemleri orijinal dağıtımlarından veri üretir. Veriler oluşturulduğundan, izlenebilir kayıtlar arası benzerlik yoktur.
Rapor, veri sentezinin üç seviyesini ve bunların uygulamalarını göstermektedir: İlk kullanım örneği, Amsterdam politika aracı çalışmasında “fakir adam” istatistiksel veri ayrıştırmasını tanımlamaktadır. İkinci kullanım durumunda, etkinlik temelli modellemede uyguladığımız yapılandırılmış nüfus sayımı kaynaklı istatistiksel kişiler. Hiyerarşik kanser hasta kayıtlarının derin öğrenmeye dayalı sentezi, doğrulama yöntemleriyle birlikte üçüncü kullanım durumunda incelenmiştir.
Ayrıntılı (nüfus) verilere engelsiz geniş erişim, yeni politika araçlarının ortaya çıkmasına neden olma potansiyeline sahiptir. Daha da önemlisi, bu tür bir erişim, karar vermede kullanılan tüm veriler paylaşılabileceğinden, bu araçların tam kamusal ve akademik incelemesini sağlayabilir.