Яка інформація вважається персональною?
Все, що дозволяє вас ідентифікувати, потрапляє до цієї категорії:
Посібник фахівця з управління дослідницькими даними: відкритий освітній ресурс
Все, що дозволяє вас ідентифікувати, потрапляє до цієї категорії:
Коли ви працюєте з міжнародними проєктами, правила гри диктують три основні "кити": GDPR, британський DPA та американські галузеві правила.
1. Європа та Велика Британія (GDPR та DPA 2018) У ЄС та Британії діє найсуворіший регламент захисту даних — GDPR. Він каже: будь-яка дія з даними людини (збирання, аналіз чи навіть видалення) — це «обробка».
Особлива увага: Дані про расу, політику, здоров’я та сексуальну орієнтацію вважаються «чутливими» (особливої категорії). Для їх обробки потрібні надзвичайно вагомі підстави.
Штучний інтелект: Зараз Європа активно впроваджує етичні рекомендації для ШІ, щоб алгоритми не порушували приватність і не створювали соціальної несправедливості.
2. Сполучені Штати (Common Rule, FERPA, HIPAA) В США немає єдиного закону, як GDPR, але є чіткі галузеві правила:
The Common Rule: Головний закон для дослідників. Він зобов'язує створювати етичні комісії (IRBs) та отримувати інформовану згоду.
FERPA: Захищає приватність студентів та їхні оцінки.
HIPAA: "Священна книга" медичних даних. Тут популярний метод «Safe Harbor» (Безпечна гавань) — щоб зробити дані відкритими, з них треба видалити рівно 18 типів ідентифікаторів.
Українське законодавство активно адаптується до європейських норм, спираючись на фундамент прав людини.
1. Міжнародний фундамент: Конвенція 108+ Україна є частиною глобальної системи захисту. Ми ратифікували Конвенцію 108+, яка вимагає від держави дотримуватися п'яти принципів:
Прозорість (людина знає, що з її даними роблять);
Мінімізація (збирати тільки те, що реально треба);
Підзвітність (дослідник відповідає за безпеку);
Пропорційність та Privacy by design (захист даних має бути частиною архітектури системи ще на етапі розробки).
2. Український пакет законів В Україні приватність захищає цілий набір документів:
Конституція (ст. 32): Пряма заборона збирати чи поширювати інформацію про особу без її згоди (крім випадків національної безпеки).
Закон «Про захист персональних даних»: Основний робочий інструмент для дослідника. Він визначає, як правильно обробляти дані.
Закон «Про доступ до публічної інформації»: Балансує право на приватність із правом громадянина знати, як працює держава.
Закон «Про офіційну статистику»: Окремо регулює конфіденційність даних, зібраних для статистичних цілей.
Примітка: У січні 2026 року набув чинності Закон №4212-IX, який посилив прозорість роботи держорганів.
Ці закони мають «екстратериторіальну» дію — якщо ви досліджуєте громадян ЄС, ви зобов'язані їх виконувати:
Для роботи з американськими партнерами зверніть увагу на ці федеральні ресурси:
NB! Завжди перевіряйте статус «Чинний» (In force) на офіційних сайтах, оскільки закони у сфері цифрових послуг та ШІ у 2026 році змінюються надзвичайно швидко.
Особа, яка юридично володіє даними, має остаточний контроль над їх поширенням, збереженням та знищенням. Щоб цей процес був законним, використовуються спеціальні інструменти:
Інформормована згода: Документ, через який суб'єкт дозволяє досліднику використовувати свої дані.
Ліцензування: Дані можуть бути захищені ліцензіями (наприклад, Creative Commons), які дозволяють іншим використовувати їх за умови вказівки авторства або заборони комерційного використання.
Вторинне використання: Якщо ви використовуєте чужі дані, ви повинні посилатися на першоджерело. Публікувати чужі дані без дозволу або спеціальної ліцензії (наприклад, відкритої чи платної) заборонено.
Як повторний користувач даних ви можете підтвердити свої опубліковані дослідження, посилаючись на першоджерело даних у всіх статтях, презентаціях і будь-яких заявках на гранти, які базуються на даних. У більшості випадків ви не можете публікувати дані, які ви не збирали чи створювали, оскільки у вас немає на це законного права.Винятками є дані, які отримали ліцензію власника даних на перерозподіл (наприклад, за ліцензією Creative Commons або іншою відкритою ліцензією) або в ситуаціях, коли ви заплатили власнику прав за дозвіл на перерозподіл частин набору даних (тобто це дозволено на умовах платної ліцензії).
Міжнародна співпраця: Закони різних країн щодо конфіденційності відрізняються, що може створювати складнощі в спільних проєктах. Важливо з’ясувати це до початку збору даних. Через складність законодавства (особливо при міжнародній співпраці), дослідникам варто звертатися до юристів або спеціалістів з інформації.
Питання власності дещо заплутані через різні зацікавлені сторони, залучені до збору та створення даних, та їхні ролі.
ЗУ Про захист персональних даних Стаття 4. Суб'єкти відносин, пов'язаних із персональними даними:
суб'єкт персональних даних;
володілець персональних даних;
розпорядник персональних даних;
одержувач, у т.ч. третя особа;
Уповноважений Верховної Ради України з прав людини (далі - Уповноважений).
суб’єкт персональних даних - фізична особа, персональні дані якої обробляються; Він має право: знати що, де, як і для чого збирають, знати механізм обробки. Дослідникам часто потрібно отримати дозвіл від суб’єкта даних, щоб на законних підставах надавати доступ до оригінальних або похідних даних. Але Суб’єкт має право відкликати згоду та заборонити обробку!
володілець персональних даних - фізична або юридична особа, яка визначає мету обробки персональних даних, встановлює склад цих даних та процедури їх обробки, якщо інше не визначено законом. Йому Потрібен дозвіл на обробку персональних даних відповідно до закону виключно для здійснення його повноважень.
розпорядник персональних даних - фізична чи юридична особа, якій володільцем персональних даних або законом надано право обробляти ці дані від імені володільця;
одержувач - фізична чи юридична особа, якій надаються персональні дані, у тому числі третя особа;
третя особа - будь-яка особа, за винятком суб’єкта персональних даних, володільця чи розпорядника персональних даних та Уповноваженого Верховної Ради України з прав людини, якій володільцем чи розпорядником персональних даних здійснюється передача персональних даних.
Раннє вирішення проблем власності на дані є особливо важливим, оскільки особа, яка володіє даними, остаточно контролює їх поширення, збереження та знищення.
Права інтелектуальної власності охоплюють будь-який результат, створений завдяки інтелектуальним зусиллям людини або організації. Проте у світі даних існують певні нюанси:
Персональні дані: Кожна фізична особа має невід'ємні та непорушні немайнові права на відомості про себе.
Факти проти оформлення: У багатьох країнах (наприклад, США) самі факти не підлягають авторському праву. Проте спосіб їх представлення — діаграми, таблиці чи візуалізації — може бути об’єктом авторського права.
Інституційний вплив: Технічно дані часто можуть належати університету або установі, де працює дослідник. Важливо, щоб дослідники зверталися до своєї установи, якщо вони не впевнені щодо своїх прав інтелектуальної власності. Наприклад, у Політиці відкритої науки КПІ імені Ігоря Сікорського ці питання регулюються окремим розділом 8 “Інтелектуальна власність та етика”, відповідно до якого дані є інтелектуальною власністю Університету як службові об'єкти, проте дослідникам наполегливо рекомендується залишати за собою авторські та майнові права у відносинах із третіми сторонами (видавцями).
Донори та гранти: Організації, що фінансують дослідження, не претендують на право власності на дані, але часто мають власну політику, яка визначає, як і де дослідник зобов'язаний ділитися отриманими результатами, накладає обмеження на розповсюдження даних.
Персональні дані — це будь-яка інформація, яка дозволяє прямо чи опосередковано ідентифікувати живу людину. У дослідницькій діяльності важливо розрізняти типи ідентифікаторів, щоб не порушити закон та не нашкодити учасникам.
Прямі ідентифікатори Це дані, які явно вказують на конкретну особу. Для досліджень це означає, що такі дані підпадатимуть під дію законів про захист даних.
До них належать:
Повне ім'я та прізвище.
Номери паспорта, ідентифікаційної картки або телефону.
Домашня та електронна адреси.
Дані про місцезнаходження, IP-адреса, відбитки пальців або записи з камер відеоспостереження.
Важливо розуміти: саме по собі ім'я «Джон Сміт» може не бути персональним даним, якщо людей з таким іменем багато. Але в поєднанні з місцем роботи чи поштою (johnsmith@companyN.com) воно стає прямим ідентифікатором.
Непрямі ідентифікатори Це характеристики, які самі по собі не називають особу, але описують її. Приклади:
Стать та етнічна приналежність.
Рідкісні захворювання або специфічний досвід.
Соціально-економічні дані та параметри тіла.
Географічні ідентифікатори Вони можуть бути як непрямими (поштовий індекс), так і прямими (повна фізична адреса).
Дослідники часто припускають, що видалення імен та телефонів робить дані безпечними. Проте існує ризик тріангуляції — коли комбінація кількох непрямих ідентифікаторів дозволяє вирахувати людину.
Приклад дослідження науковців США (1991 рік): Розглянемо приклад набору даних, у якому видалено прямі ідентифікатори, з онлайн курсу від Університету Північної Кароліни Чаппел-Гілл (США) та Единбурзького Університету (Велика Британія) Research data management and sharing https://www.coursera.org/learn/data-management.
Набір даних представляє популяцію громадян США, які здобули докторський ступінь у 1991 році.Початковий набір даних — 25 000 осіб без імен. Змінні включають основну галузь навчання, расу, стать і географічний регіон навчального закладу, у якому було здобуто ступінь. Без прямих ідентифікаторів, таких як ім’я, номер телефону, поштова адреса, номер соціального страхування та іншої інформації, яка безпосередньо пов’язує особу особи, здавалося б, що було б неможливо відрізнити будь-яку особу, представлену в цьому наборі даних, який включає понад 25 000 чоловік.
Звужуємо до галузі (наука і техніка) — 14 000 осіб.
Обираємо лише фізичні науки — 2 119 осіб.
Додаємо стать (чоловіки) та расу (чорношкірі) — залишається 20 осіб.
Обираємо спеціальність (астрономи) — лише 8 осіб.
Додаємо регіон (Нью-Йорк) — особу ідентифіковано.
Це демонструє, що навіть за відсутності імен, сукупність ознак (стать + раса + професія + місто) робить людину впізнаваною.
Щоб мінімізувати ризики (як у трагічному випадку з розголошенням даних студента Максима Глєбова), простого видалення прямих ідентифікаторів недостатньо. Необхідно враховувати ризики при об'єднанні різних наборів даних та застосовувати методи глибокої анонімізації.
Дані про людей-учасників дослідження.
Цей вид конфіденційних даних часто називають «Персональними даними». Персональні дані - це інформація, яка може бути використана для ідентифікації учасника дослідження або суб'єкта з ризиком дискримінації, шкоди чи іншим чином небажаної уваги. Персональні дані включають таку інформацію, як імена та адреси, а також адреси електронної пошти, IP-адреси, інформацію про здоров’я та сексуальність, а також про «фізичну, фізіологічну, генетичну, психічну, культурну чи соціальну ідентичність». Як правило, персональні дані не можуть бути передані в їх початковому вигляді.
Наприклад, якщо ви створюєте Базу даних, що містить дату народження, поштовий індекс і стать осіб з рідкісним генетичним захворюванням - майте на увазі, що
дата народження та поштовий індекс можуть бути достатньою інформацією для ідентифікації осіб, але особливо в поєднанні з іншою інформацією, яка стосуватиметься лише невеликої кількості осіб. Тобто ці дані потребують особливого захисту та обробки.
Дані, що стосуються видів рослин або тварин. Дані, що включають інформацію про рідкісні чи зникаючі види, або іншу природоохоронну діяльність, часто класифікуються як конфіденційні дані. Визначити, коли ці дані є конфіденційними, може бути складно; наприклад, вид може бути під загрозою в одній географічній зоні, але не в іншій, тому розкриття даних про місцезнаходження може завдати потенційної шкоди.
Наприклад, якщо ви створюєте Електронну таблицю з фізичними параметрами зразків рідкісних рослин в країні N
НІ, описи фізичних характеристик рідкісного виду навряд чи завдадуть йому шкоди, якщо також не буде розкрито географічне розташування виду або екологічна інформація, яка вказує на певний регіон.
Хоча наразі не існує законодавчого визначення, загальний консенсус полягає в тому, що якщо оприлюднення даних збільшує ймовірність ризику чи шкоди цьому виду чи зусиллям щодо збереження, їх слід класифікувати як чутливі.
Комерційно конфіденційні дані. Дані, розголошення яких може завдати економічної шкоди вважаються конфіденційними. Це включає таку інформацію, як посилання на поточні переговори, комерційна таємниця або дані, отримані в рамках угоди про комерційне фінансування. Хоча спонсори зараз роблять наголос на обмін даними за замовчуванням, розуміємо, що дані, розголошення яких може поставити під загрозу механізми фінансування та комерціалізацію продуктів, за деяких обставин можуть вважатися конфіденційними.