Анонімізація персональних даних – спосіб введення надмірної персональної інформації. Тобто дані обробляються інструментами з відкритим кодом у спосіб, який неможливий для ідентифікації конкретної особи. Немає єдиної методики анонімізації, придатної для всіх типів даних.
Псевдонімізовані дані (якщо інформаційні поля, які ідентифікують особу, в записі даних замінено одним або кількома штучними ідентифікаторами), можуть бути відновлені до початкового стану з додаванням інформації, яка надалі дозволяє повторну ідентифікацію особи, тоді як анонімні дані ніколи не можуть бути відновлені до початкового стану. Анонімізація – це незворотний процес.
Шаблон плану анонімізації FSD
Ось переклад тексту українською мовою:
Версія 1.0 (12.4.2019)
Фінський архів даних із соціальних наук (FSD)
Розробник(и) плану:
Особа(и), що здійснюють анонімізацію:
Нижче наведено фактори, що впливають на прийняття рішень щодо анонімізації.
1. Популяція та вибірка:
Хто був цільовою групою дослідження та як здійснювався відбір? Скільки осіб із популяції потрапило до вибірки? Що заздалегідь відомо про популяцію (наприклад, розподіл за статтю та віком)? Чи притаманне особам із цієї популяції якесь рідкісне явище?
2. Зміст даних:
а) Які типи прямих та непрямих ідентифікаторів містять дані? Які комбінації відомостей у даних можуть бути використані для ідентифікації особи?
б) Чи містить набір даних інформацію про третіх осіб і чи можна ідентифікувати суб'єктів на основі цієї інформації?
в) Чи містить набір даних виняткову або унікальну інформацію?
г) Чи містить набір даних конфіденційну (чутливу) інформацію?
3. Вік набору даних:
Чи змінилися дані про популяцію в наборі даних з плином часу?
4. Інформація про респондентів, доступна з інших джерел:
Чи можливо зіставити інформацію в даних з інформацією з інших джерел? Чи можливо ідентифікувати осіб на основі інформації, доступної в інших джерелах?
5. Корисність проти анонімності:
Які типи інформації в даних є найбільш значущими з точки зору дослідження, тобто яку інформацію необхідно зберегти під час анонімізації, а яку можна видалити?
Рішення щодо анонімізації:
Що саме видаляється, категоризується або узагальнюється?
Кількісні набори даних: Як обробляються відкриті відповіді?
Примітка: будь-які документи, що стосуються анонімізації, не можуть містити псевдонімізовану інформацію або інші дані, на основі яких все ще можна ідентифікувати осіб. Наприклад, списки псевдонімів, використаних замість справжніх імен, мають бути знищені, коли вони більше не потрібні.
Обґрунтування анонімізації та оцінка ризику розкриття даних після анонімізації:
Надайте обґрунтування рішень та політик щодо анонімізації. Оцініть можливість ідентифікації осіб у даних зараз і в майбутньому. Поміркуйте, коли слід повторно переглянути рівень анонімності даних (оцінка залишкового ризику).
Ви також можете надати додаткову інформацію, наприклад, про процес анонімізації, спосіб маркування анонімізованих даних та можливі помилки, які слід враховувати вторинним користувачам даних.
________________________________________________________________