4 maja 2021 17:27

Anonimizacja danych

Co to jest anonimizacja danych?

Anonimizacja danych ma na celu ochronę danych prywatnych lub wrażliwych poprzez usuwanie lub szyfrowanie danych osobowych z bazy danych. Anonimizacja danych ma na celu ochronę prywatnych działań osób fizycznych lub firm przy jednoczesnym zachowaniu integralności gromadzonych i udostępnianych danych.

Anonimizacja danych jest również znana jako „zaciemnianie danych”, „maskowanie danych” lub „dezidentyfikacja danych”. Można to porównać z deanonimizacją, czyli technikami używanymi w eksploracji danych, które próbują ponownie zidentyfikować zaszyfrowane lub zaszyfrowane informacje.

Kluczowe wnioski

  • Anonimizacja danych oznacza usuwanie lub szyfrowanie danych osobowych lub identyfikacyjnych z danych wrażliwych.
  • Ponieważ firmy, rządy, systemy opieki zdrowotnej i inne organizacje coraz częściej przechowują informacje o osobach na serwerach lokalnych lub w chmurze, anonimizacja danych ma kluczowe znaczenie dla zachowania integralności danych i zapobiegania naruszeniom bezpieczeństwa.
  • W bardzo wrażliwych sektorach opieki zdrowotnej i finansowej dane pacjentów lub klientów muszą być ukrywane w taki sposób, aby spełniały wymogi regulacyjne.

Zrozumienie anonimizacji danych

Korporacje generują, przechowują i przetwarzają ogromne ilości wrażliwych danych w ramach normalnej działalności biznesowej. Postęp technologiczny rozwijał się dzięki odpowiednim informacjom zawartym w danych, które zostały wygenerowane i udostępnione w różnych sektorach i krajach. Innowacje finansowe w technologii ( fintech ) poczyniły nieograniczone postępy w dostosowywaniu usług finansowych do klientów, dzięki danym udostępnionym z takich sektorów, jak media społecznościowe i przedsiębiorstwa handlu elektronicznego.

Dane wymieniane między mediami cyfrowymi a firmami handlu elektronicznego pomogły obu sektorom lepiej reklamować produkty w swoich witrynach konkretnym użytkownikom lub konsumentom. Aby jednak udostępniane dane były przydatne bez narażania tożsamości klientów zgromadzonych w bazie danych, należy zastosować anonimizację.

Anonimizacja danych w praktyce

Anonimizacja danych jest przeprowadzana w większości branż, które mają do czynienia z poufnymi informacjami, np. W służbie zdrowia, finansach i mediach cyfrowych, jednocześnie promując integralność udostępniania danych. Anonimizacja danych zmniejsza ryzyko niezamierzonego ujawnienia podczas udostępniania danych między krajami, branżami, a nawet działami w tej samej firmie. Zmniejsza również możliwości wystąpienia kradzieży tożsamości.

Na przykład szpital udostępniający poufne dane swoich pacjentów laboratorium badawczemu lub firmie farmaceutycznej mógłby to zrobić w sposób etyczny, gdyby zachował anonimowość swoich pacjentów. Można to zrobić, usuwając nazwiska, numery ubezpieczenia społecznego, daty urodzenia i adresy swoich pacjentów ze wspólnej listy, pozostawiając ważne elementy wymagane do badań medycznych, takie jak wiek, dolegliwości, wzrost, waga, płeć, rasa itp.

Techniki anonimizacji danych

Anonimizacja danych odbywa się na różne sposoby, w tym przez usuwanie, szyfrowanie, uogólnianie i wiele innych. Firma może albo usunąć dane osobowe (PII) ze swoich zebranych danych, albo zaszyfrować te informacje silnym hasłem. Firma może również zdecydować się na uogólnienie informacji zgromadzonych w jej bazie danych. Na przykład tabela zawiera dokładny dochód brutto uzyskany przez pięciu dyrektorów generalnych w sektorze detalicznym. Załóżmy, że zarejestrowane dochody wynoszą 520 000, 230 000, 109 000, 875 000 i 124 000 USD. Informacje te można uogólnić na kategorie, takie jak „<500 000 USD” i „≥ 500 000 USD”. Chociaż dane są zaciemnione, nadal będą przydatne dla użytkownika.

Uzasadnienie anonimizacji danych

Anonimizacja danych polega na tym, że informacje niejawne są oczyszczane i maskowane w taki sposób, że w przypadku naruszenia pozyskane dane są bezużyteczne dla winowajców. Potrzeba ochrony danych powinna być traktowana priorytetowo w każdej organizacji, ponieważ informacje niejawne, które wpadną w niepowołane ręce, mogą zostać wykorzystane w niewłaściwy sposób, celowo lub nieumyślnie. Brak wrażliwości przy przetwarzaniu wrażliwych informacji o klientach może wiązać się z dużymi kosztami dla firm, ponieważ organy regulacyjne zwalczają rażące zaniedbania. Wymogi prawne i dotyczące zgodności, takie jak PCI DSS (Standard bezpieczeństwa danych w branży kart płatniczych) nakładają wysokie grzywny na instytucje finansowe w przypadku naruszenia karty kredytowej.1  PIPEDA, kanadyjskie prawo, reguluje ujawnianie i wykorzystywanie danych osobowych przez korporacje. Istnieje wiele innych organów regulacyjnych, które zostały utworzone w celu monitorowania wykorzystywania lub niewłaściwego wykorzystywania danych osobowych przez organizację.

Dekodowanie zanonimizowanych danych jest możliwe dzięki procesowi znanemu jako dezanonimizacja (lub „ponowna identyfikacja”). Ze względu na to, że zanonimizowane dane można dekodować i rozwikłać, krytycy uważają, że anonimizacja zapewnia fałszywe poczucie bezpieczeństwa.