Deanonimizacja - KamilTaylan.blog
4 maja 2021 17:30

Deanonimizacja

Co to jest dezanonimizacja?

Dezanonimizacja to technika używana w eksploracji danych, która próbuje ponownie zidentyfikować zaszyfrowane lub zaszyfrowane informacje. Dezanonimizacja, zwana również ponowną identyfikacją danych, polega na powiązaniu zanonimizowanych informacji z innymi dostępnymi danymi w celu identyfikacji osoby, grupy lub transakcji.

Kluczowe wnioski

  • Deanonimizacja to praktyka odtwarzania prywatnych informacji przechowywanych w zaszyfrowanych lub w inny sposób zaszyfrowanych danych.
  • Zanonimizowane dane są powszechnie wykorzystywane w transakcjach internetowych i finansowych, a także w mediach społecznościowych i innych formach elektronicznego przesyłania wiadomości i komunikacji.
  • Ponowna identyfikacja zanonimizowanych danych może zagrozić tożsamości osobistej i bezpieczeństwu finansowemu do celów niezgodnych z prawem, a także podważyć zaufanie konsumentów.

Zrozumienie dezanonimizacji

Era obeznana z technologią gwałtownie zaburza tradycyjny sposób działania w różnych sektorach gospodarki. W ostatnich latach w branży finansowej pojawiło się wiele produktów cyfrowych wprowadzonych do jej sektora przez firmy fintech. Te innowacyjne produkty promowały włączenie finansowe, dzięki czemu więcej konsumentów ma dostęp do produktów i usług finansowych po niższych kosztach niż pozwalają na to tradycyjne instytucje finansowe. Rozwój technologii spowodował wzrost gromadzenia, przechowywania i wykorzystywania danych.

Narzędzia technologiczne, takie jak platformy mediów społecznościowych, platformy płatności cyfrowych i technologia smartfonów, ujawniły mnóstwo danych wykorzystywanych przez różne firmy do usprawnienia interakcji z konsumentami. Ta tona danych nazywa się big data i jest powodem do niepokoju wśród osób fizycznych i organów regulacyjnych wzywających do wprowadzenia większej liczby przepisów chroniących tożsamość i prywatność użytkowników.

Jak działa dezanonimizacja

W dobie dużych zbiorów danych, w których wrażliwe informacje o działaniach użytkownika w Internecie są udostępniane natychmiast poprzez przetwarzanie w chmurze, w celu ochrony tożsamości użytkowników zastosowano narzędzia do anonimizacji danych. Anonimizacja maskuje dane osobowe (PII) użytkowników przeprowadzających transakcje w różnych dziedzinach, takich jak usługi zdrowotne, platformy mediów społecznościowych, handel elektroniczny itp. Dane osobowe obejmują takie informacje, jak data urodzenia, numer ubezpieczenia społecznego (SSN), kod pocztowy i adres IP adres. Potrzeba zamaskowania cyfrowych śladów pozostawionych przez działania online doprowadziła do wdrożenia strategii anonimizacji, takich jak szyfrowanie, usuwanie, uogólnianie i perturbacje. Chociaż naukowcy zajmujący się danymi wykorzystują te strategie do oddzielania poufnych informacji od udostępnianych danych, nadal zachowują oryginalne informacje, otwierając w ten sposób drzwi do możliwości ponownej identyfikacji.

Dezanonimizacja odwraca proces anonimizacji poprzez dopasowanie udostępnionych, ale ograniczonych zbiorów danych do zestawów danych, które są łatwo dostępne online. Eksploratorzy danych mogą następnie pobrać pewne informacje z każdego dostępnego zestawu danych, aby zestawić tożsamość osoby lub transakcję. Na przykład eksplorator danych może pobrać zestaw danych udostępniony przez firmę telekomunikacyjną, serwis społecznościowy, platformę handlu elektronicznego oraz publicznie dostępny wynik spisu, aby określić nazwisko i częste działania użytkownika.

Jak używana jest deanonimizacja

Ponowna identyfikacja może się powieść, gdy nowe informacje zostaną ujawnione lub gdy wdrożona strategia anonimizacji nie zostanie wykonana prawidłowo. Przy ogromnej podaży danych i ograniczonej ilości czasu dostępnego w ciągu dnia analitycy danych i górnicy wdrażają przy podejmowaniu decyzji skróty zwane heurystykami. Chociaż heurystyka oszczędza cenny czas i zasoby podczas przeczesywania zestawu danych, może również tworzyć luki, które można by wykorzystać, gdyby zaimplementowano niewłaściwe narzędzie heurystyczne. Luki te mogą zostać zidentyfikowane przez osoby poszukujące danych, które chcą usunąć anonimizację zbioru danych do celów zgodnych z prawem lub nielegalnych.

Informacje umożliwiające identyfikację osoby uzyskane nielegalnie za pomocą technik dezanonimizacji mogą być sprzedawane na podziemnych targowiskach, które są również formą platform anonimizacyjnych. Informacje, które wpadną w niepowołane ręce, mogą być wykorzystywane do przymusu, wymuszeń i zastraszania, co prowadzi do obaw o prywatność i powoduje ogromne koszty dla przedsiębiorstw, które padają ofiarą.

Dezanonimizacja może być również stosowana legalnie. Na przykładwitryna Silk Road, podziemny rynek nielegalnych narkotyków, była obsługiwana przez anonimową sieć o nazwie Tor, która wykorzystuje strategię cebulową do zaciemniania adresów IP swoich użytkowników. Sieć Tor obsługuje również kilka innych nielegalnych rynków, na których handluje się bronią, skradzionymi kartami kredytowymi i poufnymi informacjami korporacyjnymi. Korzystając ze złożonych narzędzi do dezanonimizacji, FBI z powodzeniem włamało się i zamknęło Silk Road oraz strony zajmujące się pornografią dziecięcą.

Sukces procesów ponownej identyfikacji dowiódł, że anonimowość nie jest gwarantowana. Nawet gdyby dziś wdrożono przełomowe narzędzia do anonimizacji w celu maskowania danych, dane mogłyby zostać ponownie zidentyfikowane za kilka lat, gdy pojawią się nowe technologie i nowe zestawy danych.