DataSteward@LibraryKPI: шаблон

Показ дописів із міткою шаблон. Показати всі дописи

2026/04/09

Положення про УДД

Управління дослідницькими даними (УДД) є важливою частиною будь-якого дослідницького проєкту та включає збір, обробку та аналіз, збереження, обмін, довгострокове зберігання даних досліджень.

Вперше в Україні — Положення про управління дослідницькими даними в Національному технічному університеті України «Київський політехнічний інститут імені Ігоря Сікорського» (2026).

Положення про УДД включає розділи:

ЗАГАЛЬНІ ПОЛОЖЕННЯ
ТЕРМІНИ ТА ВИЗНАЧЕННЯ
ПЛАНУВАННЯ УПРАВЛІННЯ ДОСЛІДНИЦЬКИМИ ДАНИМИ
ЗАБЕЗПЕЧЕННЯ ДОСТУПУ ДО ДАНИХ ПІД ЧАС ДОСЛІДЖЕННЯ
ОРГАНІЗАЦІЯ ФАЙЛІВ ТА ДОКУМЕНТУВАННЯ ДОСЛІДНИЦЬКИХ ДАНИХ
ДОВГОСТРОКОВЕ ЗБЕРІГАННЯ ТА ПОШИРЕННЯ ДАНИХ
ТЕРМІН ЗБЕРІГАННЯ ДОСЛІДНИЦЬКИХ ДАНИХ
ВІДПОВІДАЛЬНІСТЬ УЧАСНИКІВ ПРОЦЕСУ УДД

Додаток 1. ПЛАН УПРАВЛІННЯ ДОСЛІДНИЦЬКИМИ ДАНИМИ: Шаблон для науково-дослідної роботи

Додаток 2. ПЛАН УПРАВЛІННЯ ДОСЛІДНИЦЬКИМИ ДАНИМИ: Шаблон для дисертаційного дослідження

2026/02/05

Методика розробки угоди про іменування даних

https://libraries.mit.edu/data-management/store/organize/

Створіть просте «коротке керівництво», в якому детально описані угоди про імена та організацію файлів. Включіть цю документацію до файлу readme.txt в основній спільній папці (зразок пунктів на слайді)

Створіть свій інвентар файлів, бажано згадати ВСІ файли, проєкт та підпроєкти.
Колонка A: різні типи даних Ви використовуєте/створюєте? (наприклад, зображення під мікроскопом, польові спостереження в табличній формі, стенограми, інтерв’ю, цифри, протоколи тощо)
Колонка B: які формати файлів? (наприклад, .csv, .jpg)
Колонка C: Які є унікальні характеристики цього файлу даних (наприклад, дата створення, назва проєкту, експериментальні умови)? Чи існують стандартні скорочення для будь-якої з цих характеристик?
Колонка D: Чи будете ви мати кілька версій того самого файлу? Якщо так, чи буде кілька версій у даний день? Скільки?
Стовпець E: схема імені. Напишіть свої імена файлів. Що потрібно включити: унікальні характеристики, які ви визначили в колонці C, можна використати, щоб створити ім'я файлу. Виберіть характеристики, які, на вашу думку, ви будете використовувати для пошуку цих файлів.
Якщо хочете мати декілька версій файлу (вказано у стовпці D), обов’язково додайте версію в назву вашого файлу. Якщо ви очікуєте мати більше однієї версії на день, не можна покладатися лише на дату, і слід додати номер версії до імені файлу. Наприклад, MMDDYYYY_exp001_v01.tft).

2) Переконайтеся, що всі члени команди або співробітники мають доступ до керівництва та навчаються правилам.

3) Крім текстових файлів, ви також можете розглянути можливість проведення короткого внутрішнього навчання, щоб пояснити, чому нову угоду про іменування файлів так важливо використовувати і як вона працює, або створити відео, в якому розглядаються ключові моменти угоди.

2026/02/02

2-й етап життєвого циклу даних : збір даних

Збір даних – це процес збору та імпорту інформації з різних джерел.

Первинні дані — це дані, які збираються дослідником для визначеної цілі (наприклад, для відповіді на певні дослідницькі питання).

Дослідники можуть створювати дані за допомогою власної генерації чи повторного використання:

Первинні дані

(щойно згенеровані)

Вторинні дані

(повторно використані дані)

Тематичні дослідження
Експеримент
Інтерв'ю
Спостереження
Моделювання
Опитування

Репозитарії даних
Література та інші публікації
Усна історія
Статистика та джерела даних

На етапі збору даних дослідницька група використовує найкращі практики керування даними (див. Мітки):

організацію файлів:

шаблон імені файлів,
домовленості про правила іменування,
політику версій файлів,
систему папок і файлів,

стратегії резервного копіювання та зберігання,
засоби контролю доступу,
безпеку даних тощо.

2026/01/26

Анонімізація персональних даних

Анонімізація персональних даних – спосіб введення надмірної персональної інформації. Тобто дані обробляються інструментами з відкритим кодом у спосіб, який неможливий для ідентифікації конкретної особи. Немає єдиної методики анонімізації, придатної для всіх типів даних.

Псевдонімізовані дані (якщо інформаційні поля, які ідентифікують особу, в записі даних замінено одним або кількома штучними ідентифікаторами), можуть бути відновлені до початкового стану з додаванням інформації, яка надалі дозволяє повторну ідентифікацію особи, тоді як анонімні дані ніколи не можуть бути відновлені до початкового стану. Анонімізація – це незворотний процес.

Шаблон плану анонімізації FSD

Ось переклад тексту українською мовою:

Версія 1.0 (12.4.2019) Фінський архів даних із соціальних наук (FSD)

Розробник(и) плану: Особа(и), що здійснюють анонімізацію:

Нижче наведено фактори, що впливають на прийняття рішень щодо анонімізації.

1. Популяція та вибірка:

Хто був цільовою групою дослідження та як здійснювався відбір? Скільки осіб із популяції потрапило до вибірки? Що заздалегідь відомо про популяцію (наприклад, розподіл за статтю та віком)? Чи притаманне особам із цієї популяції якесь рідкісне явище?

2. Зміст даних:

а) Які типи прямих та непрямих ідентифікаторів містять дані? Які комбінації відомостей у даних можуть бути використані для ідентифікації особи?
б) Чи містить набір даних інформацію про третіх осіб і чи можна ідентифікувати суб'єктів на основі цієї інформації?
в) Чи містить набір даних виняткову або унікальну інформацію?
г) Чи містить набір даних конфіденційну (чутливу) інформацію?

3. Вік набору даних:

Чи змінилися дані про популяцію в наборі даних з плином часу?

4. Інформація про респондентів, доступна з інших джерел:

Чи можливо зіставити інформацію в даних з інформацією з інших джерел? Чи можливо ідентифікувати осіб на основі інформації, доступної в інших джерелах?

5. Корисність проти анонімності:

Які типи інформації в даних є найбільш значущими з точки зору дослідження, тобто яку інформацію необхідно зберегти під час анонімізації, а яку можна видалити?

Рішення щодо анонімізації: Що саме видаляється, категоризується або узагальнюється? Кількісні набори даних: Як обробляються відкриті відповіді?

Примітка: будь-які документи, що стосуються анонімізації, не можуть містити псевдонімізовану інформацію або інші дані, на основі яких все ще можна ідентифікувати осіб. Наприклад, списки псевдонімів, використаних замість справжніх імен, мають бути знищені, коли вони більше не потрібні.

Обґрунтування анонімізації та оцінка ризику розкриття даних після анонімізації: Надайте обґрунтування рішень та політик щодо анонімізації. Оцініть можливість ідентифікації осіб у даних зараз і в майбутньому. Поміркуйте, коли слід повторно переглянути рівень анонімності даних (оцінка залишкового ризику).

Ви також можете надати додаткову інформацію, наприклад, про процес анонімізації, спосіб маркування анонімізованих даних та можливі помилки, які слід враховувати вторинним користувачам даних.

________________________________________________________________

2026/01/25

Угода про іменування файлів

File Naming Convention, FNC

«Імена файлів» — це імена, які перераховані в каталозі файлів і присвоєні новим файлам при їх першому збереженні. Угода про іменування файлів (File Naming Convention, FNC) — це система іменування файлів у спосіб, який описує, що вони містять і як вони пов’язані з іншими файлами. File Naming Convention, FNC, включає: принципи для імен файлів, логічну структуру каталогів, правила іменування та шаблони іменування файлів.

Принципи для імен файлів

Машиночитаність
Людиночитаність
Системно сортуються

Приклад правил

Перевірте, чи встановлені правила іменування файлів у вашій дисципліні чи групі. Правила іменування мають бути задокументовані, щоб інші працівники вашої лабораторії чи відділу могли дотримуватися цього стандарту.
Імена файлів мають бути описовими та надавати достатньо контекстної інформації.
Використовуйте заголовні букви для розділення слів, а не пробіли або символи підкреслення
Намагайтеся не робити імена файлів занадто довгими. Операційні системи мають різні обмеження на кількість символів. Як правило, намагайтеся мати ліміт 40-50 символів.
Розмістіть найважливішу інформацію спочатку. Комп’ютер упорядковує файли за назвою, символ за символом. При включенні особистого імені в ім'я файлу спочатку вкажіть прізвище, а потім ініціали.
Якщо ви плануєте знайти файл за датою, спочатку вставте дату. Для дати використовуйте стандарт ISO 8601 (YYYYMMDD). Щоб додати мітку часу до імені файлу, використовуйте формат YYYYMMDDThhmm. Використовуйте 24-годинний час, щоб уникнути будь-якої плутанини щодо ранку/полудня.
Номер версії запису повинен бути вказаний в імені файлу шляхом включення «V», номеру версії і, де це доречно, «Чернетка». Під час використання системи послідовної нумерації, використовуйте початкові нулі, щоб переконатися, що файли сортуються в послідовному порядку, наприклад: 001, 002, ...010, 011 ... 100, 101 ... Позначте фінальну версію.
Використовуйте керування версіями, щоб вказати найновішу версію файлу. Приклад: filename_v2.xxx
Уникайте спеціальних символів, таких як: ~ ! @ # $ % ^ & * ( ) ` ; : < > ? . , [ ] { } ' " |
Не використовуйте пробіли, оскільки деяке програмне забезпечення не розпізнає назви файлів із пробілами. Інші варіанти включають підкреслення, тире, без розділення або регістр (перша літера кожної частини тексту велика).

Приклади шаблонів іменування:

20220104_ProjectA_Ex1Test1_SmithE_v01.xlsx

20220104_ProjectA_MeetingNotes_SmithE_v02.docx

Checklist-File-Names-Form чеклист від Гарварда (див. Контрольний список угоди про імена файлів)

DataSteward@LibraryKPI

Сторінки