Показ дописів із міткою конфіденційність. Показати всі дописи
Показ дописів із міткою конфіденційність. Показати всі дописи

2026/02/18

Приватність vs Конфіденційність

Терміни Приватність та  Конфіденційність часто плутають, але в науці вони мають різні «точки відповідальності»:

  1. Приватність (Privacy): Це право учасника. Його право вирішувати, чи хоче він ділитися своїми показниками серцевого ритму або політичними поглядами. Це «кордон», який ви не маєте права перетинати без згоди.

  2. Конфіденційність (Confidentiality): Це обов'язок дослідника. Коли учасник уже переступив свій поріг приватності й надав вам дані, ви обіцяєте тримати їх у таємниці.

Простими словами: Приватність — це замок на дверях учасника. Конфіденційність — це ваш сейф, куди ви поклали ключ, який він вам довірив.

Чому це важливо для якості науки?

Наука тримається на довірі. Якщо учасник дослідження (наприклад, студент КПІ, що бере участь в опитуванні про психологічний клімат у групі) не впевнений у безпеці, він буде:

  • Приховувати правду.

  • Надавати неповні дані.

  • Відмовлятися від участі.

Наслідок для дослідника: Дані стають поверхневими, а результати — недостовірними. Якісна наука можлива лише тоді, коли респондент почувається в безпеці.

Приклад із життя дослідника 

Уявіть, що ви працюєте на ФБМІ (Факультет біомедичної інженерії) над системою моніторингу реабілітації ветеранів.

  • Ризик: Ви випадково залишили таблицю з результатами (ПІБ + діагноз) у відкритому доступі на Google Drive.

  • Порушення приватності: Ви втрутилися в особисте життя людини без її контролю.

  • Порушення конфіденційності: Ви не дотримали слова захищати ці дані.

  • Результат: Людина більше ніколи не візьме участь у ваших тестах, а університет може отримати судовий позов та етичну догану.

Як захиститися? (Золоті правила)

  1. Анонімізація: Видаляйте імена та ідентифікатори одразу після збору, замінюючи їх кодами (наприклад, "Учасник №102").

  2. Шифрування: Зберігайте дані на захищених серверах Університету або у зашифрованих архівах, а не на звичайних флешках.

  3. Чітка інструкція: На етапі вебінарів та планування чітко прописуйте, як і де будуть зберігатися дані.

Витоки даних

Управління науковими даними в сучасних умовах — це не лише питання технічного порядку, а передусім етична та безпекова відповідальність. Коли ми говоримо про захист інформації, мова йде не про абстрактні цифри, а про життєздатність цілих інфраструктур та репутацію дослідників.

Контекст загроз: Від глобальної статистики до локальних криз

Сьогодення переповнене історіями про масштабні витоки даних. Візуалізація проєкту Information is Beautiful, яка аналізує найбільші хакерські атаки з 2012 по 2022 роки, демонструє лякаючу тенденцію: обсяги викраденої інформації зростають експоненціально.

Source: McCandless, D., Evans, T. and Barton, P. (2022) World's biggest data breaches & hacks, Information is Beautiful. Information is Beautiful. Available at: https://www.informationisbeautiful.net/visualizations/worlds-biggest-data-breaches-hacks/ (Accessed: January 27, 2023)
Реальний кейс: Атака на «Київстар» (12.12.2023) Найяскравішим прикладом того, як вразливість однієї системи може паралізувати країну, стала атака на українського оператора «Київстар».

  • Причина: Зловмисне використання доступу до облікового запису одного співробітника.

  • Наслідки: Відсутність зв'язку та інтернету тривала майже десять днів (до 21.12.2023). Це спричинило ланцюгову реакцію: припинили роботу системи вуличного освітлення, банківські термінали, а також критично важливі сервіси — Уклон, Тabletki.ua, Нова пошта.

Цей випадок доводить: людський фактор та недбале управління доступом є найслабшою ланкою в ланцюгу безпеки.


Ризики для дослідника: Чому «авось» не працює?

Недбале ставлення до конфіденційності в науковій діяльності тягне за собою реальні та болючі наслідки:

  1. Руйнація кар’єри: Втрата довіри колег та грантодавців після витоку персональних даних піддослідних може поставити крапку на професійному майбутньому.

  2. Удар по інституції: Університет або дослідницький центр втрачають акредитацію, фінансування або міжнародне партнерство.

  3. Юридичні та фінансові санкції: Порушення регламентів (наприклад, GDPR в ЄС) передбачає величезні штрафи та навіть кримінальну відповідальність.


Етична дилема: Опублікувати чи приховати?

Через страх перед витоками дослідники часто обирають шлях найменшого опору — повне виключення конфіденційних даних з публікації.

Аналіз заяв до інституційних комісій з етичного схвалення (IRB — Institutional Review Boards) показує, що вчені часто керуються такими мотивами:

  • Переконання, що публікація таких даних апріорі є неетичною.

  • Впевненість, що це прямо заборонено законодавством.

  • Уявлення про те, що забезпечити безпеку даних «надто складно».

Наслідок: Величезні масиви цінної інформації стають «мертвим вантажем». Вони недоступні для перевірки, повторного аналізу або використання в нових дослідженнях, що сповільнює науковий прогрес.


Як діяти? Планування як засіб захисту

Щоб не обирати між безпекою та науковою цінністю, планування управління даними (DMP) має починатися ще до початку збору інформації.

  1. Ідентифікація: Чітко визначте, які дані є дійсно конфіденційними (ПІБ, геолокація, медичні показники).

  2. Анонімізація: Використовуйте методи деідентифікації, щоб дані можна було публікувати без ризику для осіб.

  3. Контроль доступу: Як показує досвід «Київстару», доступ повинен бути суворо обмеженим та захищеним (двофакторна автентифікація, шифрування).

Висновок: Безпека даних — це не лише технічна задача ІТ-відділу, а професійна гігієна кожного дослідника.

2026/02/10

Конфіденційна інформація vs Комерційна таємниця

 Для дослідника важливо розуміти різницю між цими двома поняттями, щоб не наразити на ризик бізнес-партнерів та не порушити умови контрактів.

1. Конфіденційна інформація vs Комерційна таємниця

Уявіть два кола: велике — це конфіденційна інформація, а всередині нього менше — це комерційна таємниця.

  • Конфіденційна інформація — це будь-які дані, доступ до яких обмежила сама особа (фізична або юридична). Це найширше поняття (ст. 21 ЗУ «Про інформацію»).

  • Комерційна таємниця — це вужчий, професійний тип інформації. Це секрети, які мають комерційну цінність: технічні розробки, списки клієнтів, стратегії (ст. 505 Цивільного кодексу України).

2. Що саме є комерційною таємницею?

Закон не дає вичерпного списку, але бізнес сам вирішує, що «ховати». Верховний Суд підтвердив, що до цього списку входять:

  • Повні списки постачальників та клієнтів з контактами.

  • Розміри торговельних націнок та знижок.

  • Обсяги закупівель та плани продажів.

Головна умова: Юридична особа має вжити заходів для захисту цієї інформації (наприклад, підписати з працівниками та дослідниками договір про нерозголошення — NDA).

3. Що НЕ МОЖЕ бути таємницею?

Існують дані, які закон забороняє приховувати, навіть якщо керівник дуже цього хоче.

  • Згідно з Постановою КМУ №611: не є таємницею кількість працівників, їхня зарплата (загалом та за посадами) та наявність вільних вакансій.

    • Цікавий нюанс: Хоча зарплата не є комерційною таємницею, вона все одно залишається конфіденційною інформацією про конкретну людину.

  • Згідно зі ст. 21 ЗУ «Про інформацію»: не можна обмежувати доступ до інформації про:

    • стан довкілля (екологію);

    • якість продуктів і товарів;

    • аварії, катастрофи та стан здоров'я населення;

    • порушення прав людини або незаконні дії влади.

Що це означає для дослідника?

  1. Право власності на секрети: Якщо ви проводите дослідження на базі підприємства, пам'ятайте: бізнес-процеси, які ви бачите (собівартість, умови договорів), — це комерційна таємниця. Їх не можна публікувати без дозволу.

  2. Договірна робота: Завжди перевіряйте, чи підписували ви зобов'язання про конфіденційність. Якщо ви розголосите комерційну таємницю, яка завдасть збитків компанії (наприклад, її використають конкуренти), це може призвести до судових позовів.

  3. Зарплати в звітах: Ви можете вказувати в дослідженні середні зарплати в компанії (це не таємниця), але не можете вказувати ПІБ та конкретну суму окремого працівника без його згоди (це конфіденційні дані особи).

Резюме: Конфіденційність — це про приватність, а комерційна таємниця — про гроші та конкуренцію. Як дослідник, ви маєте поважати обидва рівні захисту.

Неперсоніфікована конфіденційна інформація

Це поняття на перший погляд здається суперечливим: як дані можуть бути конфіденційними, якщо вони неперсоніфіковані (тобто анонімні)?

Насправді все просто: навіть якщо в даних немає вашого імені, вони все одно описують чиєсь життя, гроші чи звички. Якщо ці цифри потраплять не в ті руки, вони можуть стати зброєю.

Ось як це працює в деталях:

Що таке неперсоніфікована конфіденційна інформація?

Це дані, з яких видалили імена, але залишили цінний зміст. Вони не підпадають під закон про персональні дані (бо особи не видно), але їх все одно треба ховати від сторонніх, бо вони «чутливі».

1. Дані про фінанси

Це цифри про суми, час та напрямки платежів.

  • Чому це конфіденційно? Навіть без ПІБ клієнта, знаючи графік великих переказів, шахраї можуть підробити квитанцію або вирахувати «жирну» ціль для кібератаки.

2. Дані про геолокацію

Ваші маршрути, координати та час перебування в певних точках.

  • Чому це конфіденційно? Якщо дослідник бачить, що «Користувач №45» щодня о 08:00 виходить з однієї точки, а о 18:00 повертається — йому не треба знати прізвище, щоб зрозуміти, де людина живе і коли її немає вдома. Це ідеальна інформація для стеження.

3. Дані про поведінку

Історія браузера, покупки в магазинах, використання додатків.

  • Чому це конфіденційно? Це ваш «цифровий портрет». Навіть анонімно ці дані дозволяють маніпулювати вашим вибором через рекламу або створювати профілі для шантажу.

Що це означає для дослідника?

Для вас це означає, що анонімізація — це не фініш, а лише початок захисту.

  1. Ризик повторної ідентифікації: Пам'ятайте, що неперсоніфіковані дані можна «деанонімізувати». Якщо ви об'єднаєте анонімну геолокацію з відкритим реєстром нерухомості, ви отримаєте ім'я. Це великий ризик для безпеки учасників.

  2. Етична відповідальність: Навіть якщо закон дозволяє вільно працювати з анонімними даними, ви як дослідник відповідаєте за те, щоб ці масиви не стали інструментом шкоди (наприклад, щоб дані про покупки певної групи людей не використали для їх дискримінації).

  3. Режим доступу: Такі дані не можна викладати у відкритий доступ «як є». Ви повинні використовувати:

    • Агрегацію: показувати не окремі маршрути, а середні показники по району.

    • Захищені сховища: доступ до сирих неперсоніфікованих даних мають мати лише перевірені колеги.

  4. Специфіка об'єктів:

    • Юридичні особи: Інформація про їхні фінанси може бути комерційною таємницею.

    • Померлі особи: Хоча закон про ПД на них не діє, їхні дані можуть зашкодити репутації або безпеці живих родичів.

Неперсоніфіковані дані — це «заряджена зброя». Імен немає, але небезпека залишається.

Неконфіденційні дані

Не все, що стосується людини, є таємницею. Іноді закон каже: «Ці дані мають бути публічними», і тоді особа не може заборонити їх використовувати. В управлінні даними такі відомості називаються неконфіденційними.

Ось три прості ситуації, коли персональні дані стають відкритими для всіх:


1. Публічність за посадою (Службові особи)

Якщо людина працює на державу або громаду, її приватність дещо звужується на користь суспільного контролю.

  • Повноваження: Не є секретом дані про те, як посадовець виконує свою роботу (ст. 5 ЗУ «Про захист персональних даних»).

  • Гроші та майно: ПІБ осіб, які отримали бюджетні кошти або державне майно (наприклад, виграли тендер чи отримали земельну ділянку), завжди відкриті (ст. 6 ЗУ «Про доступ до публічної інформації»).

  • Кваліфікація: Дані про освіту, досвід роботи чи знання мов кандидата на посаду не є конфіденційними, якщо закон вимагає цих знань для роботи.


2. Загальнодоступна інформація (Ви зробили це самі)

Як тільки ви самі винесли інформацію «на люди», вона втрачає статус конфіденційної.

  • Соціальні мережі: Якщо ви написали свою адресу та номер телефону в профілі Facebook або Instagram — ці дані стали неконфіденційними.

  • Інтерв’ю: Розповідь журналісту про стан здоров’я робить цю медичну інформацію публічною.

  • Дії: Будь-хто може збирати та обробляти такі дані без вашого дозволу, бо вони вже є у відкритому доступі.


3. Державні реєстри та «Відкриті дані»

Деякі дані є публічними «за замовчуванням», бо держава зобов’язана показувати їх для прозорості ринку та безпеки.

  • Реєстри: В Україні понад 100 реєстрів (наприклад, ЄДРПОУ, Реєстр нерухомості, Реєстр судових рішень), де інформація про ФОПів, власників квартир чи учасників судів є доступною.

  • Принцип Open Data: Розпорядники (держоргани) мають оприлюднювати все, що є у їхньому володінні, окрім державної таємниці (Постанова КМУ №835).


Чому це важливо для дослідника?

Якщо у вашому дослідженні використовуються неконфіденційні дані (наприклад, ви аналізуєте декларації чиновників або відкритий реєстр судових рішень):

  1. Вам не потрібно отримувати згоду кожної особи на обробку цих даних.

  2. Ці дії не підпадають під жорстке регулювання Закону «Про захист персональних даних».

  3. Ви можете вільно поширювати ці результати, якщо це в інтересах науки, суспільства чи нацбезпеки (ст. 11 ЗУ «Про інформацію»).

Резюме: Неконфіденційні дані — це інформація, яка «належить громаді» через закон, посаду особи або її власне рішення стати публічною.

Персональні дані та конфіденційна інформація не тотожні

 Поняття «конфіденційна інформація» та «персональні дані» часто плутають, але в управлінні дослідницькими даними важливо бачити різницю. Персональні дані стають конфіденційними лише тоді, коли їх такими визнає закон або сама людина.

Ось логічний розбір цього поняття згідно із Законом України «Про інформацію».


1. Що таке конфіденційна інформація?

Це інформація про фізичну особу, доступ до якої обмежений самою особою або законом (ст. 21, п. 2). Вона належить до категорії інформації з обмеженим доступом (ст. 21, п. 1).


2. Що саме туди входить?

Закон (ст. 11, ч. 2) наводить орієнтовний перелік даних, які є конфіденційними:

  • Особисті факти: дата і місце народження, адреса.

  • Соціальний статус: освіта, сімейний стан.

  • Переконання та ідентичність: національність, релігійні переконання.

  • Чутливі дані: стан здоров'я.

Важливо: Цей перелік не є вичерпним. Людина може визначити як конфіденційні й інші відомості про себе.


3. Головне правило для дослідника: Згода

Конфіденційна інформація не може вільно «гуляти» мережею. Її поширення можливе лише за двох умов (ст. 21, ч. 2):

  1. Бажання особи: людина сама хоче поділитися інформацією.

  2. Чітка згода: особа визначає порядок і умови, за яких ви можете використовувати її дані.

Не дозволяється збирання, зберігання, використання поширення конфіденційної інформації фізичної особи без її згоди (окрім виключень згідно ЗУ в інтересах безпеки, економічного добробуту, прав людини)

ч.2 ст. 32 Конституції України

Для вашого дослідження це означає: ви не маєте права обробляти чи публікувати ці дані, поки не отримаєте письмову або іншу зафіксовану згоду учасника дослідження.


4. Винятки (Коли згода не потрібна)

Закон передбачає ситуації, коли конфіденційність може бути «порушена» без згоди особи, але це стосується виключно:

  • Інтересів національної безпеки.

  • Економічного добробуту.

  • Захисту прав людини.

  • Випадків, прямо встановлених законом.

Резюме для управління даними: Конфіденційна інформація — це «приватна територія» учасника дослідження. Щоб зайти на неї, ви мусите мати юридичний «дозвіл» (згоду), де чітко прописано, що ви будете робити з даними та як їх захищатимете.

Типи конфіденційної інформації

Є типи інформації, що потребують особливого захисту.  Це перш за все стосується даних, що  набувають характер конфіденційності: дані, що стосуються людей (персональні дані), видів тварин або рослин, даних, створених або використаних відповідно до обмежувальної угоди про фінансування комерційних досліджень, а також будь-яких даних, які можуть мати значний негативний вплив на громадськість у разі оприлюднення.

Дані про людей-учасників дослідження.

Цей вид конфіденційних даних часто називають «Персональними даними». Персональні дані - це інформація, яка може бути використана для ідентифікації учасника дослідження або суб'єкта з ризиком дискримінації, шкоди чи іншим чином небажаної уваги. Персональні дані включають таку інформацію, як імена та адреси, а також адреси електронної пошти, IP-адреси, інформацію про здоров’я та сексуальність, а також про «фізичну, фізіологічну, генетичну, психічну, культурну чи соціальну ідентичність». Як правило, персональні дані не можуть бути передані в їх початковому вигляді.

Наприклад, якщо ви створюєте  Базу даних, що містить дату народження, поштовий індекс і стать осіб з рідкісним генетичним захворюванням - майте на увазі, що

дата народження та поштовий індекс можуть бути достатньою інформацією для ідентифікації осіб, але особливо в поєднанні з іншою інформацією, яка стосуватиметься лише невеликої кількості осіб. Тобто ці дані потребують особливого захисту та обробки.

Дані, що стосуються видів рослин або тварин. Дані, що включають інформацію про рідкісні чи зникаючі види, або іншу природоохоронну діяльність, часто класифікуються як конфіденційні дані. Визначити, коли ці дані є конфіденційними, може бути складно; наприклад, вид може бути під загрозою в одній географічній зоні, але не в іншій, тому розкриття даних про місцезнаходження може завдати потенційної шкоди. 

Наприклад, якщо ви створюєте Електронну таблицю з фізичними параметрами зразків рідкісних рослин в країні N

НІ, описи фізичних характеристик рідкісного виду навряд чи завдадуть йому шкоди, якщо також не буде розкрито географічне розташування виду або екологічна інформація, яка вказує на певний регіон.

Хоча наразі не існує законодавчого визначення, загальний консенсус полягає в тому, що якщо оприлюднення даних збільшує ймовірність ризику чи шкоди цьому виду чи зусиллям щодо збереження, їх слід класифікувати як чутливі.

Комерційно конфіденційні дані
. Дані, розголошення яких може завдати економічної шкоди вважаються конфіденційними. Це включає таку інформацію, як посилання на поточні переговори, комерційна таємниця або дані, отримані в рамках угоди про комерційне фінансування. Хоча спонсори зараз роблять наголос на обмін даними за замовчуванням, розуміємо, що дані, розголошення яких може поставити під загрозу механізми фінансування та комерціалізацію продуктів, за деяких обставин можуть вважатися конфіденційними.

Дані, що становлять загрозу для інших - інформація, яка, якщо стане доступною, стане загрозою національній безпеці або матиме негативний вплив на громадськість.

2026/02/09

Що ми розуміємо під безпекою даних?

Безпека даних - забезпечення безпеки ваших дослідницьких даних від пошкодження та належний контроль доступу. 
Важливо подбати про безпеку ваших даних, щоб запобігти випадковому чи зловмисному пошкодженню чи модифікації, крадіжці, порушенню конфіденційності та передчасному оприлюдненню даних. Подумайте, кому потрібен доступ до даних, а також коли і як ви будете застосовувати будь-які необхідні дозволи чи обмеження. Ви також повинні мати чітку політику та вказівки щодо того, хто може робити копії даних і чи можна їх зберігати на такому пристрої, як ноутбуки, смартфони або USB-накопичувачі. Це особливо важливо, якщо ви створюєте конфіденційні дані. 

Забезпечення безпеки даних є частиною безпеки інформаційних технологій. На офісному та домашньому комп’ютерах завжди має бути встановлено найновіше антивірусне програмне забезпечення. Якщо у вас є конфіденційні дані, краще зберігати їх на комп’ютері, не під’єднаному до жодної мережі. Якщо це неможливо, слід зашифрувати дані. Тому що не підключений до мережі комп’ютер усе ще вразливий до крадіжки або зловмисного пошкодження чи зміни даних. Конфіденційні дані слід зберігати в закритій кімнаті або в сейфі, коли вони не використовуються.


Хто відповідає за управління та контроль даних?

  • Хто контролює дані (наприклад, PI, студент, ваша лабораторія, ваш університет, ваш спонсор)? Перш ніж витратити багато часу на те, як зберігати дані, ділитися ними, називати їх тощо, переконайтеся, що у вас є на це повноваження.

Для чого або кого призначені дані?

  • Хто є цільовою аудиторією даних? Як, на вашу думку, вони використовуватимуть дані? Як довго слід зберігати дані?

  • Чи є якісь вимоги щодо збереження даних? Якщо так, то як довго? 3-5 років, 10-20 років, постійно? Не всі дані потрібно зберігати, а деякі дані, які потрібно зберігати, не потрібно зберігати нескінченно довго. Добре розумійте свої зобов’язання щодо збереження даних.


Перетворення даних

На відміну від переміщення файлів з одного формату в інший, перетворення даних передбачає зміну фактичних даних. 

Є кілька причин, чому ви можете захотіти перетворити свої дані під час проєкту або після нього.
Наприклад, у даних опитування, зібраних з анкет, відповіді з множинним вибором та інші типи відповідей зазвичай кодуються цифрами, а не рядками символів. Перевага цього простого типу перетворення полягає в тому, що він полегшує введення даних, якщо ви вводите відповіді на папері, а також дозволяє уникнути невідповідностей, таких як друкарські помилки в значеннях даних. Такі якісні дані, як стенограми інтерв’ю, можна перетворити на кількісні дані шляхом застосування методів текстового кодування та категоризації. 

Іншою причиною для перетворення даних може бути більш ефективна візуалізація даних. Простим прикладом є перетворення даних, із співвідношень (чисельник і знаменник) у відсотки, щоб ви могли відобразити їх на гістограмі чи секторній діаграмі. 

Для перетворення конфіденційних даних, щоб ними можна було ділитися з іншими дослідниками, можна використовувати ряд методів. До них належать агрегація та анонімізація. Нагадаю, агрегація — процес укрупнення показників. Анонімізація - процес видалення даних (з документів, баз даних тощо) з метою приховування джерела інформації, дійової особи тощо. Типові приклади класичної анонімізації, які ми бачимо на слайді, - це узагальнення, придушення атрибутів, стирання, перестановка даних, маскування символів.

https://www.syntho.ai/uk/classic-anonymization/


2026/02/03

Етичні та правові питання роботи з даними

MIT : Етичні та правові питання
Питання конфіденційності, питання інтелектуальної власності (з посиланнями на Creative Commons та контактними даними кампусу щодо авторських прав)
Архів даних Великої Британії: згода та етика
Архів даних Великої Британії щодо згоди та етики збору даних. Як захистити конфіденційну інформацію, рекомендації щодо інформованої згоди та анонімізації.
Університет Міннесоти: Управління конфіденційними даними
Керівні принципи роботи з людьми, етичні та правові міркування.
Університет Орегону: Суб'єкти дослідження
Чудовий список тематичних, асоціаційних та суспільних рекомендацій щодо етичних міркувань.

2026/01/26

Етика дослідження та захист конфіденційності



Ембарго

Контроль доступу забезпечується заходом безпеки. Іноді вам може знадобитися заборонити на короткий час іншим особам доступ до ваших даних дослідження, перш ніж вони стануть загальнодоступними; це можна зробити, застосувавши ембарго для отримання відповідних патентів та/або інших прав інтелектуальної власності та підготовки наукових публікацій на їх основі. Після його завершення стає можливою публікація даних дослідження. Багато донорів схвалять короткі ембарго, але важливо перевірити політику ваших донорів.

Анонімізація персональних даних

Анонімізація персональних даних – спосіб введення надмірної персональної інформації. Тобто дані обробляються інструментами з відкритим кодом у спосіб, який неможливий для ідентифікації конкретної особи. Немає єдиної методики анонімізації, придатної для всіх типів даних. 

Псевдонімізовані дані (якщо інформаційні поля, які ідентифікують особу, в записі даних замінено одним або кількома штучними ідентифікаторами), можуть бути відновлені до початкового стану з додаванням інформації, яка надалі дозволяє повторну ідентифікацію особи, тоді як анонімні дані ніколи не можуть бути відновлені до початкового стану. Анонімізація – це незворотний процес.

Шаблон плану анонімізації FSD

Ось переклад тексту українською мовою:


Версія 1.0 (12.4.2019) Фінський архів даних із соціальних наук (FSD)

Розробник(и) плану: Особа(и), що здійснюють анонімізацію:

Нижче наведено фактори, що впливають на прийняття рішень щодо анонімізації.

1. Популяція та вибірка:

Хто був цільовою групою дослідження та як здійснювався відбір? Скільки осіб із популяції потрапило до вибірки? Що заздалегідь відомо про популяцію (наприклад, розподіл за статтю та віком)? Чи притаманне особам із цієї популяції якесь рідкісне явище?

2. Зміст даних:

  • а) Які типи прямих та непрямих ідентифікаторів містять дані? Які комбінації відомостей у даних можуть бути використані для ідентифікації особи?

  • б) Чи містить набір даних інформацію про третіх осіб і чи можна ідентифікувати суб'єктів на основі цієї інформації?

  • в) Чи містить набір даних виняткову або унікальну інформацію?

  • г) Чи містить набір даних конфіденційну (чутливу) інформацію?

3. Вік набору даних:

Чи змінилися дані про популяцію в наборі даних з плином часу?

4. Інформація про респондентів, доступна з інших джерел:

Чи можливо зіставити інформацію в даних з інформацією з інших джерел? Чи можливо ідентифікувати осіб на основі інформації, доступної в інших джерелах?

5. Корисність проти анонімності:

Які типи інформації в даних є найбільш значущими з точки зору дослідження, тобто яку інформацію необхідно зберегти під час анонімізації, а яку можна видалити?


Рішення щодо анонімізації: Що саме видаляється, категоризується або узагальнюється? Кількісні набори даних: Як обробляються відкриті відповіді?

Примітка: будь-які документи, що стосуються анонімізації, не можуть містити псевдонімізовану інформацію або інші дані, на основі яких все ще можна ідентифікувати осіб. Наприклад, списки псевдонімів, використаних замість справжніх імен, мають бути знищені, коли вони більше не потрібні.

Обґрунтування анонімізації та оцінка ризику розкриття даних після анонімізації: Надайте обґрунтування рішень та політик щодо анонімізації. Оцініть можливість ідентифікації осіб у даних зараз і в майбутньому. Поміркуйте, коли слід повторно переглянути рівень анонімності даних (оцінка залишкового ризику).

Ви також можете надати додаткову інформацію, наприклад, про процес анонімізації, спосіб маркування анонімізованих даних та можливі помилки, які слід враховувати вторинним користувачам даних.

________________________________________________________________

Конфіденційність і етичні проблеми

Дослідники повинні регулювати протиріччя між вимогами конфіденційності та забезпеченості архівування та публікації даних. Конфіденційною інформацією є: розкриття расового або етнічного походження, політичних поглядів, релігійних чи ідеологічних переконань, членства в профспілці, генетичних чи біометричних даних (користуються для однозначної ідентифікації фізичної особи), дані про здоров’я, сексуальну приналежність чи сексуальну орієнтацію тощо. 


Більшість досліджень конфіденційності даних можна етично поділити за допомогою підключення інформаційної згоди, анонімізації та контролю доступу до даних.