dane zanonimizowane

Czy po anonimowych danych można Cię rozpoznać? Oczywiście, że tak

2 minuty czytania
Komentarze

Dane, dla wielu firm, są czymś bardzo wartościowym, często o wiele cenniejszym niż pieniądze. Z tego powodu korporacje takie jak Google czy Microsoft nieustannie proszą o dostęp do niektórych informacji, takich jak statystyki użytkowania aplikacji. Podobnie jest z wieloma innymi firmami, które zbierają lub sprzedają anonimowe dane swoich klientów – ci natomiast informowani są, że nic im nie grozi, ponieważ z udostępnianych informacji usunięte zostały wszystkie prywatne elementy. Niestety okazuje się, że nie jest tak kolorowo, ponieważ nawet przy pomocy zanonimizowanych danych bez problemu można rozpoznać osobę.

Jak rozpoznać osobę po anonimowych danych? Wystarczy ogólnodostępny program

dane zanonimizowane

Naukowcy z The Imperial College of Science, Technology and Medicine oraz Université Catholique de Louvain poinformowali redakcję magazynu Nature Communications o tym, że udało im się stworzyć specjalny algorytm, przy pomocy którego rozpoznać można dowolną osobę ze Stanów Zjednoczonych – do tego celu wystarczą jedynie „anonimowe” dane osobowe, które muszą zawierać co najmniej 15 różnych informacji, takich jak np. kod pocztowy, płeć czy status małżeński. Najlepiej oczywiście jest skorzystać ze zanonimizowanej dokumentacji medycznej. Badacze chwalą się dokładnością na poziomie 99.98%. Program jest zatem przerażająco skuteczny.

Zobacz także: Zdjęcia Google w lekkiej wersji? Poznajcie aplikację Galeria Go.

Może wydawać się, że 15 różnych informacji na temat domostwa lub osoby to sporo – w końcu kto udostępnia aż tyle informacji w ramach anonimowych danych? Okazuje się, że robi to bardzo wiele firm i większość z nich w sprzedawanych paczkach zawiera znacznie więcej rekordów. Dla przykładu, jakiś czas temu firma Experian zajmująca się informacjami kredytowymi sprzedała zanonimizowaną bazę danych, która dotyczyła 120 milionów klientów. Co ważne, na temat każdego z nich można było znaleźć aż 248 różnych informacji – znacznie więcej niż 15, co wymagane jest przez ogólnodostępny algorytm. Dlaczego jednak został on upubliczniony?

Naukowcy: upublicznienie algorytmu to jedyne wyjście

dane zanonimizowane

Odpowiadając na pytanie z poprzedniego akapitu – naukowcy z wymienionych wcześniej uczelni doszli do wniosku, że upublicznienie stworzonego przez nich programu to jedyny sposób, by przykuć uwagę instytucji oraz konsumentów. Celem algorytmu jest ujawnienie problemu prywatności – pomimo tego, że firmy zapewniają nas, że nasze dane są bezpieczne, to tak naprawdę bez większego problemu można je z nami powiązać. Badacze mają nadzieję, że dzięki ich pracy korporacje zmienią sposób, w jaki dzielą się informacjami – oznacza to, że powinny one być znacznie lepiej anonimizowane bądź ich udostępnianie powinno być dokładniej regulowane. Pamiętajcie, że opisywany w artykule problem może dotyczyć również Was, nie jest on ekskluzywny dla Stanów Zjednoczonych. Z tego powodu dbajcie o bezpieczeństwo swoich danych oraz prywatność i nie zgadzajcie się na bezpodstawne korzystanie z informacji o Was. Zachowajcie ostrożność!

Źródło: Nature

Motyw