2026/02/10

Персональні дані

Персональні дані — це не просто набір літер та цифр у вашому паспорті. Це будь-яка інформація, за якою можна «вирахувати» конкретну живу людину.  

Персональні дані - відомості чи сукупність відомостей про фізичну особу, яка ідентифікована або може бути конкретно ідентифікована. 

Простими словами, це ваш «цифровий відбиток» у світі.

Яка інформація вважається персональною?

Все, що дозволяє вас ідентифікувати, потрапляє до цієї категорії:

Закони про захист даних

1. Західні стандарти: GDPR та американська модель

Коли ви працюєте з міжнародними проєктами, правила гри диктують три основні "кити": GDPR, британський DPA та американські галузеві правила.

1. Європа та Велика Британія (GDPR та DPA 2018) У ЄС та Британії діє найсуворіший регламент захисту даних — GDPR. Він каже: будь-яка дія з даними людини (збирання, аналіз чи навіть видалення) — це «обробка».

  • Особлива увага: Дані про расу, політику, здоров’я та сексуальну орієнтацію вважаються «чутливими» (особливої категорії). Для їх обробки потрібні надзвичайно вагомі підстави.

  • Штучний інтелект: Зараз Європа активно впроваджує етичні рекомендації для ШІ, щоб алгоритми не порушували приватність і не створювали соціальної несправедливості.

2. Сполучені Штати (Common Rule, FERPA, HIPAA) В США немає єдиного закону, як GDPR, але є чіткі галузеві правила:

  • The Common Rule: Головний закон для дослідників. Він зобов'язує створювати етичні комісії (IRBs) та отримувати інформовану згоду.

  • FERPA: Захищає приватність студентів та їхні оцінки.

  • HIPAA: "Священна книга" медичних даних. Тут популярний метод «Safe Harbor» (Безпечна гавань) — щоб зробити дані відкритими, з них треба видалити рівно 18 типів ідентифікаторів.

2. Україна: Від Конституції до Конвенції 108+

Українське законодавство активно адаптується до європейських норм, спираючись на фундамент прав людини.

1. Міжнародний фундамент: Конвенція 108+ Україна є частиною глобальної системи захисту. Ми ратифікували Конвенцію 108+, яка вимагає від держави дотримуватися п'яти принципів:

  • Прозорість (людина знає, що з її даними роблять);

  • Мінімізація (збирати тільки те, що реально треба);

  • Підзвітність (дослідник відповідає за безпеку);

  • Пропорційність та Privacy by design (захист даних має бути частиною архітектури системи ще на етапі розробки).

2. Український пакет законів В Україні приватність захищає цілий набір документів:

  • Конституція (ст. 32): Пряма заборона збирати чи поширювати інформацію про особу без її згоди (крім випадків національної безпеки).

  • Закон «Про захист персональних даних»: Основний робочий інструмент для дослідника. Він визначає, як правильно обробляти дані.

  • Закон «Про доступ до публічної інформації»: Балансує право на приватність із правом громадянина знати, як працює держава.

  • Закон «Про офіційну статистику»: Окремо регулює конфіденційність даних, зібраних для статистичних цілей.

Незалежно від країни, головний тренд — повна прозорість перед суб'єктом даних та сувора деідентифікація перед публікацією результатів.

ЗАКОНИ:

Ці закони мають «екстратериторіальну» дію — якщо ви досліджуєте громадян ЄС, ви зобов'язані їх виконувати:

Для роботи з американськими партнерами зверніть увагу на ці федеральні ресурси:

Міжнародні стандарти та конвенції

NB! Завжди перевіряйте статус «Чинний» (In force) на офіційних сайтах, оскільки закони у сфері цифрових послуг та ШІ у 2026 році змінюються надзвичайно швидко.

Практичне управління: Ліцензування та обмін даними

Через велику кількість зацікавлених сторін, законів і політик, які можуть впливати на право власності на дані, дослідники можуть бути збентежені тим, хто насправді володіє даними, що може змусити їх стримано ділитися даними. Звертайтеся до спеціалістів із інформації та юристів на початку життєвого циклу дослідницьких даних, щоб визначитися, яка політика може вплинути на право власності на дані.

Особа, яка юридично володіє даними, має остаточний контроль над їх поширенням, збереженням та знищенням. Щоб цей процес був законним, використовуються спеціальні інструменти:

  • Інформормована згода: Документ, через який суб'єкт дозволяє досліднику використовувати свої дані.

  • Ліцензування: Дані можуть бути захищені ліцензіями (наприклад, Creative Commons), які дозволяють іншим використовувати їх за умови вказівки авторства або заборони комерційного використання.

  • Вторинне використання: Якщо ви використовуєте чужі дані, ви повинні посилатися на першоджерело. Публікувати чужі дані без дозволу або спеціальної ліцензії (наприклад, відкритої чи платної) заборонено.

Як повторний користувач даних ви можете підтвердити свої опубліковані дослідження, посилаючись на першоджерело даних у всіх статтях, презентаціях і будь-яких заявках на гранти, які базуються на даних. У більшості випадків ви не можете публікувати дані, які ви не збирали чи створювали, оскільки у вас немає на це законного права.

Винятками є дані, які отримали ліцензію власника даних на перерозподіл (наприклад, за ліцензією Creative Commons або іншою відкритою ліцензією) або в ситуаціях, коли ви заплатили власнику прав за дозвіл на перерозподіл частин набору даних (тобто це дозволено на умовах платної ліцензії).

  • Міжнародна співпраця: Закони різних країн щодо конфіденційності відрізняються, що може створювати складнощі в спільних проєктах. Важливо з’ясувати це до початку збору даних. Через складність законодавства (особливо при міжнародній співпраці), дослідникам варто звертатися до юристів або спеціалістів з інформації.

Суб'єкти відносин: Хто є хто в управлінні даними?

Питання власності дещо заплутані через різні зацікавлені сторони, залучені до збору та створення даних, та їхні ролі. 

ЗУ Про захист персональних даних Стаття 4. Суб'єкти відносин, пов'язаних із персональними даними:

  • суб'єкт персональних даних;

  • володілець персональних даних;

  • розпорядник персональних даних;

  • одержувач, у т.ч. третя особа;

  • Уповноважений Верховної Ради України з прав людини (далі - Уповноважений).

суб’єкт персональних даних - фізична особа, персональні дані якої обробляються; Він має право: знати що, де, як і для чого збирають, знати механізм обробки. Дослідникам часто потрібно отримати дозвіл від суб’єкта даних, щоб на законних підставах надавати доступ до оригінальних або похідних даних. Але Суб’єкт має право відкликати згоду та заборонити обробку!

володілець персональних даних - фізична або юридична особа, яка визначає мету обробки персональних даних, встановлює склад цих даних та процедури їх обробки, якщо інше не визначено законом. Йому Потрібен дозвіл на обробку персональних даних відповідно до закону виключно для здійснення його повноважень.

розпорядник персональних даних - фізична чи юридична особа, якій володільцем персональних даних або законом надано право обробляти ці дані від імені володільця;

одержувач - фізична чи юридична особа, якій надаються персональні дані, у тому числі третя особа;

третя особа - будь-яка особа, за винятком суб’єкта персональних даних, володільця чи розпорядника персональних даних та Уповноваженого Верховної Ради України з прав людини, якій володільцем чи розпорядником персональних даних здійснюється передача персональних даних.

Раннє вирішення проблем власності на дані є особливо важливим, оскільки особа, яка володіє даними, остаточно контролює їх поширення, збереження та знищення.


Власність на дані та інтелектуальна власність

Права інтелектуальної власності охоплюють будь-який результат, створений завдяки інтелектуальним зусиллям людини або організації. Проте у світі даних існують певні нюанси:

  • Персональні дані: Кожна фізична особа має невід'ємні та непорушні немайнові права на відомості про себе.

  • Факти проти оформлення: У багатьох країнах (наприклад, США) самі факти не підлягають авторському праву. Проте спосіб їх представлення — діаграми, таблиці чи візуалізації — може бути об’єктом авторського права.

  • Інституційний вплив: Технічно дані часто можуть належати університету або установі, де працює дослідник. Важливо, щоб дослідники зверталися до своєї установи, якщо вони не впевнені щодо своїх прав інтелектуальної власності. Наприклад, у Політиці відкритої науки КПІ імені Ігоря Сікорського ці питання регулюються окремим розділом 8 “Інтелектуальна власність та етика”, відповідно до якого дані є інтелектуальною власністю Університету як службові об'єкти, проте дослідникам наполегливо рекомендується залишати за собою авторські та майнові права у відносинах із третіми сторонами (видавцями).

  • Донори та гранти: Організації, що фінансують дослідження, не претендують на право власності на дані, але часто мають власну політику, яка визначає, як і де дослідник зобов'язаний ділитися отриманими результатами, накладає обмеження на розповсюдження даних.

Ідентифікатори персональних даних

 Персональні дані — це будь-яка інформація, яка дозволяє прямо чи опосередковано ідентифікувати живу людину. У дослідницькій діяльності важливо розрізняти типи ідентифікаторів, щоб не порушити закон та не нашкодити учасникам.

Три типи ідентифікаторів

  1. Прямі ідентифікатори Це дані, які явно вказують на конкретну особу.  Для досліджень це означає, що такі дані підпадатимуть під дію законів про захист даних.

  2. До них належать:

  • Повне ім'я та прізвище.

  • Номери паспорта, ідентифікаційної картки або телефону.

  • Домашня та електронна адреси.

  • Дані про місцезнаходження, IP-адреса, відбитки пальців або записи з камер відеоспостереження.

Важливо розуміти: саме по собі ім'я «Джон Сміт» може не бути персональним даним, якщо людей з таким іменем багато. Але в поєднанні з місцем роботи чи поштою (johnsmith@companyN.com) воно стає прямим ідентифікатором.

  1. Непрямі ідентифікатори Це характеристики, які самі по собі не називають особу, але описують її. Приклади:

  • Стать та етнічна приналежність.

  • Рідкісні захворювання або специфічний досвід.

  • Соціально-економічні дані та параметри тіла.

Важливо пам'ятати, що навіть якщо дослідницькі дані містять непрямі ідентифікатори, людину все одно можна ідентифікувати за допомогою комбінації непрямих ідентифікаторів, і тому закони про захист даних теж будуть застосовуватися.
  1. Географічні ідентифікатори Вони можуть бути як непрямими (поштовий індекс), так і прямими (повна фізична адреса). 


Пастка «тріангуляції»: чому видалення імен не гарантує анонімності

Дослідники часто припускають, що видалення імен та телефонів робить дані безпечними. Проте існує ризик тріангуляції — коли комбінація кількох непрямих ідентифікаторів дозволяє вирахувати людину.

Приклад дослідження науковців США (1991 рік): Розглянемо приклад набору даних, у якому видалено прямі ідентифікатори, з онлайн курсу від Університету Північної Кароліни Чаппел-Гілл (США) та Единбурзького Університету (Велика Британія) Research data management and sharing https://www.coursera.org/learn/data-management.

Набір даних представляє популяцію громадян США, які здобули докторський ступінь у 1991 році.
  1. Початковий набір даних — 25 000 осіб без імен. Змінні включають основну галузь навчання, расу, стать і географічний регіон навчального закладу, у якому було здобуто ступінь. Без прямих ідентифікаторів, таких як ім’я, номер телефону, поштова адреса, номер соціального страхування та іншої інформації, яка безпосередньо пов’язує особу особи, здавалося б, що було б неможливо відрізнити будь-яку особу, представлену в цьому наборі даних, який включає понад 25 000 чоловік.

  2. Звужуємо до галузі (наука і техніка) — 14 000 осіб.

  3. Обираємо лише фізичні науки — 2 119 осіб.

  4. Додаємо стать (чоловіки) та расу (чорношкірі) — залишається 20 осіб.

  5. Обираємо спеціальність (астрономи) — лише 8 осіб.

  6. Додаємо регіон (Нью-Йорк) — особу ідентифіковано.

Це демонструє, що навіть за відсутності імен, сукупність ознак (стать + раса + професія + місто) робить людину впізнаваною.

Як убезпечити дані?

Щоб мінімізувати ризики (як у трагічному випадку з розголошенням даних студента Максима Глєбова), простого видалення прямих ідентифікаторів недостатньо. Необхідно враховувати ризики при об'єднанні різних наборів даних та застосовувати методи глибокої анонімізації.

Типи конфіденційної інформації

Є типи інформації, що потребують особливого захисту.  Це перш за все стосується даних, що  набувають характер конфіденційності: дані, що стосуються людей (персональні дані), видів тварин або рослин, даних, створених або використаних відповідно до обмежувальної угоди про фінансування комерційних досліджень, а також будь-яких даних, які можуть мати значний негативний вплив на громадськість у разі оприлюднення.

Дані про людей-учасників дослідження.

Цей вид конфіденційних даних часто називають «Персональними даними». Персональні дані - це інформація, яка може бути використана для ідентифікації учасника дослідження або суб'єкта з ризиком дискримінації, шкоди чи іншим чином небажаної уваги. Персональні дані включають таку інформацію, як імена та адреси, а також адреси електронної пошти, IP-адреси, інформацію про здоров’я та сексуальність, а також про «фізичну, фізіологічну, генетичну, психічну, культурну чи соціальну ідентичність». Як правило, персональні дані не можуть бути передані в їх початковому вигляді.

Наприклад, якщо ви створюєте  Базу даних, що містить дату народження, поштовий індекс і стать осіб з рідкісним генетичним захворюванням - майте на увазі, що

дата народження та поштовий індекс можуть бути достатньою інформацією для ідентифікації осіб, але особливо в поєднанні з іншою інформацією, яка стосуватиметься лише невеликої кількості осіб. Тобто ці дані потребують особливого захисту та обробки.

Дані, що стосуються видів рослин або тварин. Дані, що включають інформацію про рідкісні чи зникаючі види, або іншу природоохоронну діяльність, часто класифікуються як конфіденційні дані. Визначити, коли ці дані є конфіденційними, може бути складно; наприклад, вид може бути під загрозою в одній географічній зоні, але не в іншій, тому розкриття даних про місцезнаходження може завдати потенційної шкоди. 

Наприклад, якщо ви створюєте Електронну таблицю з фізичними параметрами зразків рідкісних рослин в країні N

НІ, описи фізичних характеристик рідкісного виду навряд чи завдадуть йому шкоди, якщо також не буде розкрито географічне розташування виду або екологічна інформація, яка вказує на певний регіон.

Хоча наразі не існує законодавчого визначення, загальний консенсус полягає в тому, що якщо оприлюднення даних збільшує ймовірність ризику чи шкоди цьому виду чи зусиллям щодо збереження, їх слід класифікувати як чутливі.

Комерційно конфіденційні дані
. Дані, розголошення яких може завдати економічної шкоди вважаються конфіденційними. Це включає таку інформацію, як посилання на поточні переговори, комерційна таємниця або дані, отримані в рамках угоди про комерційне фінансування. Хоча спонсори зараз роблять наголос на обмін даними за замовчуванням, розуміємо, що дані, розголошення яких може поставити під загрозу механізми фінансування та комерціалізацію продуктів, за деяких обставин можуть вважатися конфіденційними.

Дані, що становлять загрозу для інших - інформація, яка, якщо стане доступною, стане загрозою національній безпеці або матиме негативний вплив на громадськість.