Якщо дані конфіденційні, необхідно вжити відповідних заходів, щоб забезпечити їх безпечне зберігання та доступ до них лише авторизованих осіб.
Посібник фахівця з управління дослідницькими даними: відкритий освітній ресурс
2026/02/02
Безпека даних
Якщо дані конфіденційні, необхідно вжити відповідних заходів, щоб забезпечити їх безпечне зберігання та доступ до них лише авторизованих осіб.
Принципи організації файлів
Файли та папки з дослідницькими даними мають бути унікально позначені й упорядковані систематично, щоб їх можна було ідентифікувати та отримати доступ для поточних і майбутніх користувачів. Хороша стратегія іменування файлів і папок допоможе вам швидко знайти потрібні файли, легко зрозуміти, що це за файл даних і що він містить, а також розрізняти різні файли і різні версії одного і того ж файлу.
Слід продумати, як назвати та позначити файли даних досліджень:
По-перше, це логічно організовану файлову структуру, певну систему папок і файлів. Це важливо для майбутнього доступу та пошуку.
По-друге, ви маєте враховувати будь-які обмеження імен файлів, які застосовуються системою, де ви зберігаєте свої дані.
І третє, це контекст. Він включає специфічну для вмісту або описову інформацію, незалежно від того, де зберігаються дані.
Останнє, але не за важливістю – послідовність. Ви повинні вибрати єдину угоду про іменування файлів і застосовувати її послідовно, додаючи ту саму інформацію в тому самому порядку.
2-й етап життєвого циклу даних : збір даних
Первинні дані (щойно згенеровані) | Вторинні дані (повторно використані дані) |
|
|
- організацію файлів:
- шаблон імені файлів,
- домовленості про правила іменування,
- політику версій файлів,
- систему папок і файлів,
- стратегії резервного копіювання та зберігання,
- засоби контролю доступу,
- безпеку даних тощо.
1-й етап життєвого циклу даних : планування
На початковому етапі життєвого циклу дослідження, тобто на етапі відкриття та планування, дослідникам потрібно визначити, який тип і формат даних вони збираються збирати. Це може бути:
- збір нових даних,
- або об’єднання існуючих наборів даних,
- або просто аналіз існуючих даних.
Якщо в проєкті беруть участь люди, дослідники повинні враховувати конфіденційність та інші етичні питання.
Крім того, дослідники повинні розглянути, які типи документації вони створюватимуть, і стандарти метаданих, які вони використовуватимуть для опису своїх даних.
Крім того, дослідникам потрібно буде визначити потенційних вторинних користувачів даних проєкту та відповісти на питання:
- Хто використовуватиме ці дані?
- Для чого вони можуть це використовувати?
- Чи будуть дані, позбавлені будь-якої потенційно ідентифікаційної інформації, корисними для повторного використання?
- Які обмеження доступу будуть накладені на дані?
На всі ці питання дослідники повинні відповісти ще до початку проєкту.
NB! Звернення до спеціалістів на початку життєвого циклу дослідження може допомогти дослідникам відповісти на ці запитання.
Треба визначити відповідне сховище даних для архівування своїх даних. Не всі дані, що створюються під час дослідження, потребують поширення, бо дані можуть бути як відкритого, так і закритого чи обмеженого доступу. На етапі планування це потрібно врахувати заздалегідь.
Нарешті, на цьому етапі дослідникам важливо визначити можливі витрати, пов’язані з керуванням даними. Це включатиме документування даних, їх форматування, зберігання, очищення та анонімізацію та, нарешті, архівування.
5й етап життєвого циклу даних : довготермінове зберігання
- цілісності даних
- захист від втрати даних
- надання доступу до даних.
2026/01/29
Як заповнити метадані DataCite для підвищення цитованості даних?
Правильні метадані — це не просто «технічний опис», а спосіб зробити ваші дані видимими для пошукових систем (Google Dataset Search, OpenAIRE) та зручними для цитування іншими вченими.
1. Обов'язкові поля (Mandatory Properties)
Без них ви не зможете отримати DOI. Заповнюйте їх максимально повно:
Identifier (DOI): Генерується автоматично системою репозитарію.
Creator (Автор): Вказуйте ПІБ повністю. Важливо: обов’язково додавайте свій ORCID (наприклад,
0000-0002-1234-5678). Це гарантує, що цитування автоматично підтягнеться до вашого профілю.Title (Назва): Має бути інформативною. Замість "Дані експерименту", пишіть "Результати вимірювання електропровідності графену при температурах 100-300К".
Publisher (Видавець): Зазвичай це назва репозитарію [Автор(и). (Рік). Назва набору даних [Data set]. Zenodo. DOI: 10.5281/zenodo.XXXXXXX]. КПІ ім. Ігоря Сікорського буде вказаний як установа (Affiliation) автора. Зверніть увагу: навіть якщо дані публікуються як додаток до статті у журналі (наприклад, Elsevier чи Springer), то видавцем самої статті буде журнал, але видавцем набору даних усе одно залишиться Zenodo.
Publication Year (Рік): Рік оприлюднення даних.
Resource Type (Тип ресурсу): Завжди обирайте
Dataset(Набір даних).
2. Поля, що підвищують «видимість» (Recommended Properties)
Саме ці поля відповідають за те, чи знайдуть ваші дані колеги:
2026/01/27
Тип даних
Наукові дані — це фундамент будь-якого дослідження. Залежно від способу отримання та мети використання, їх поділяють на кілька ключових типів.
Ось визначення та приклади для восьми основних категорій:
1. Експериментальні дані
Це дані, отримані в контрольованих умовах, де дослідник активним чином маніпулює змінними, щоб перевірити гіпотезу. Ці дані зазвичай важко або неможливо відтворити ідентично пізніше (наприклад, через витрати або унікальність моменту).
Приклад: Вимірювання швидкості хімічної реакції при зміні температури в лабораторії.
2. Спостережні дані
Дані, зібрані шляхом реєстрації явищ у режимі реального часу в їхньому природному середовищі. На відміну від експерименту, дослідник не втручається в процес. Ці дані є унікальними за часом і місцем (їх неможливо перезняти).
Приклад: Запис міграційних маршрутів птахів або дані датчиків якості повітря за певний рік.
3. Симуляційні дані
Згенеровані за допомогою комп'ютерних моделей (алгоритмів), що імітують реальні процеси. Вони дозволяють вивчати сценарії, які занадто складні, небезпечні або дорогі для реального тестування.
Приклад: Прогнозування змін клімату на 50 років вперед за допомогою математичної моделі атмосфери.
4. Аналітичні дані
Це похідні дані, отримані в результаті обробки або аналізу "сирих" (експериментальних чи спостережних) даних. Вони часто є результатом математичних розрахунків, статистичних методів або інтерпретацій.
Приклад: Середній показник ВВП країни за десятиліття, розрахований на основі щомісячних звітів.
5. Соціальні та гуманітарні дані
Дані про людську діяльність, поведінку, культуру та суспільні структури. Вони можуть бути як кількісними, так і якісними (тексти, інтерв'ю).
Приклад: Результати анонімного опитування громадян щодо їхнього ставлення до впровадження штучного інтелекту.
6. Геномні та біоінформатичні дані
Специфічний тип великих даних, що стосуються біологічних послідовностей (ДНК, РНК) та структури білків. Вимагають потужних обчислювальних ресурсів для зберігання та аналізу.
Приклад: Послідовність нуклеотидів у геномі конкретного штаму вірусу.
7. Візуальні дані
Інформація, представлена у формі зображень, відео, графіків або карт. Вони допомагають виявити закономірності, які важко помітити в таблицях з цифрами.
Приклад: Знімки поверхні Марса, зроблені марсоходом, або МРТ-сканування головного мозку.
8. Метадані
Це "дані про дані". Вони описують контекст, зміст, якість та умови створення основних даних. Без метаданих наукова інформація часто втрачає свою цінність, оскільки стає незрозуміло, як і ким вона була зібрана.
Приклад: Файл, що містить дату зйомки, модель камери, координати GPS та ім'я автора фотографії.