2026/01/27

Доступність дослідницьких даних

 Дивіться лекцію Бібліотеки КПІ Доступність дослідницьких даних https://www.youtube.com/watch?v=A_wjyL1VEfg&list=PLotcMLgU7ilaI43GgFyDK9bbOIzBBQ0ig&index=3





Ключові питання:
  • Що таке принципи FAIR і чому доступність — це серце цього підходу.
  • Які характеристики мають бути у ваших даних, щоб їх було легко знайти та використовувати.
  • Як політика журналів щодо даних впливає на процес публікації.
  • Навіщо потрібні шаблони заяв про доступ до даних, як їх правильно складати.
  • Як цитованість даних впливає на вашу наукову кар’єру.

Де ділитися даними?

Традиційно дослідники ділилися своїми даними через особисті вебсайти або електронну пошту. Зараз існують ефективніші засоби, такі як обмін через сховища/репозитарії даних та рецензовані журнали даних. Дані, що поширюються через ці засоби, можуть мати більшу видимість та залучати більше користувачів і цитувань.

2026/01/26

Етика дослідження та захист конфіденційності



Ембарго

Контроль доступу забезпечується заходом безпеки. Іноді вам може знадобитися заборонити на короткий час іншим особам доступ до ваших даних дослідження, перш ніж вони стануть загальнодоступними; це можна зробити, застосувавши ембарго для отримання відповідних патентів та/або інших прав інтелектуальної власності та підготовки наукових публікацій на їх основі. Після його завершення стає можливою публікація даних дослідження. Багато донорів схвалять короткі ембарго, але важливо перевірити політику ваших донорів.

Анонімізація персональних даних

Анонімізація персональних даних – спосіб введення надмірної персональної інформації. Тобто дані обробляються інструментами з відкритим кодом у спосіб, який неможливий для ідентифікації конкретної особи. Немає єдиної методики анонімізації, придатної для всіх типів даних. 

Псевдонімізовані дані (якщо інформаційні поля, які ідентифікують особу, в записі даних замінено одним або кількома штучними ідентифікаторами), можуть бути відновлені до початкового стану з додаванням інформації, яка надалі дозволяє повторну ідентифікацію особи, тоді як анонімні дані ніколи не можуть бути відновлені до початкового стану. Анонімізація – це незворотний процес.

Шаблон плану анонімізації FSD

Ось переклад тексту українською мовою:


Версія 1.0 (12.4.2019) Фінський архів даних із соціальних наук (FSD)

Розробник(и) плану: Особа(и), що здійснюють анонімізацію:

Нижче наведено фактори, що впливають на прийняття рішень щодо анонімізації.

1. Популяція та вибірка:

Хто був цільовою групою дослідження та як здійснювався відбір? Скільки осіб із популяції потрапило до вибірки? Що заздалегідь відомо про популяцію (наприклад, розподіл за статтю та віком)? Чи притаманне особам із цієї популяції якесь рідкісне явище?

2. Зміст даних:

  • а) Які типи прямих та непрямих ідентифікаторів містять дані? Які комбінації відомостей у даних можуть бути використані для ідентифікації особи?

  • б) Чи містить набір даних інформацію про третіх осіб і чи можна ідентифікувати суб'єктів на основі цієї інформації?

  • в) Чи містить набір даних виняткову або унікальну інформацію?

  • г) Чи містить набір даних конфіденційну (чутливу) інформацію?

3. Вік набору даних:

Чи змінилися дані про популяцію в наборі даних з плином часу?

4. Інформація про респондентів, доступна з інших джерел:

Чи можливо зіставити інформацію в даних з інформацією з інших джерел? Чи можливо ідентифікувати осіб на основі інформації, доступної в інших джерелах?

5. Корисність проти анонімності:

Які типи інформації в даних є найбільш значущими з точки зору дослідження, тобто яку інформацію необхідно зберегти під час анонімізації, а яку можна видалити?


Рішення щодо анонімізації: Що саме видаляється, категоризується або узагальнюється? Кількісні набори даних: Як обробляються відкриті відповіді?

Примітка: будь-які документи, що стосуються анонімізації, не можуть містити псевдонімізовану інформацію або інші дані, на основі яких все ще можна ідентифікувати осіб. Наприклад, списки псевдонімів, використаних замість справжніх імен, мають бути знищені, коли вони більше не потрібні.

Обґрунтування анонімізації та оцінка ризику розкриття даних після анонімізації: Надайте обґрунтування рішень та політик щодо анонімізації. Оцініть можливість ідентифікації осіб у даних зараз і в майбутньому. Поміркуйте, коли слід повторно переглянути рівень анонімності даних (оцінка залишкового ризику).

Ви також можете надати додаткову інформацію, наприклад, про процес анонімізації, спосіб маркування анонімізованих даних та можливі помилки, які слід враховувати вторинним користувачам даних.

________________________________________________________________

Інформована згода

Перегляньте поради UK Data Service щодо формування згоди на поширення даних. Як правило, документація згоди включає інформаційний лист і форму згоди, яка підписується учасником.

Інформаційний лист повинен охоплювати такі теми:
  • Мета дослідження;
  • Хто саме бере участь;
  • Переваги та ризики участі;
  • Процедури вилучення;
  • Використання даних під час дослідження, поширення, зберігання, публікації та архівування;
  • Деталі дослідження: джерело фінансування, організація-спонсор, назва проєкту, контактні дані дослідників, як подати скаргу.
Форма згоди має бути написана простою мовою, має кілька пунктів:
  • Учасник прочитав і зрозумів інформацію про проєкт;
  • Учасникам надається можливість поставити запитання;
  • Учасник добровільно погоджується на участь у проєкті;
  • Учасник відмовиться, що може відмовитися в будь-який час без пояснення причин і без штрафних санкцій;
  • Як буде захищена конфіденційність, наприклад, чи будуть використовуватися справжні імена або псевдоніми (з дозволом), як дані будуть анонімізованими тощо.
  • Яка інформація буде використана в публікаціях, наприклад цитати;
  • Окремі умови згоди на передачу даних, які містять інформацію, наприклад текст, аудіозаписи, відео чи зображення;
  • Підписи та дати підпису для учасника та дослідника.
Якщо ви отримали інформовану згоду, ви можете поділитися своїми даними в сховищах із обмеженим доступом.

Конфіденційність і етичні проблеми

Дослідники повинні регулювати протиріччя між вимогами конфіденційності та забезпеченості архівування та публікації даних. Конфіденційною інформацією є: розкриття расового або етнічного походження, політичних поглядів, релігійних чи ідеологічних переконань, членства в профспілці, генетичних чи біометричних даних (користуються для однозначної ідентифікації фізичної особи), дані про здоров’я, сексуальну приналежність чи сексуальну орієнтацію тощо. 


Більшість досліджень конфіденційності даних можна етично поділити за допомогою підключення інформаційної згоди, анонімізації та контролю доступу до даних.