2026/01/29

Як заповнити метадані DataCite для підвищення цитованості даних?

Правильні метадані — це не просто «технічний опис», а спосіб зробити ваші дані видимими для пошукових систем (Google Dataset Search, OpenAIRE) та зручними для цитування іншими вченими.

1. Обов'язкові поля (Mandatory Properties)

Без них ви не зможете отримати DOI. Заповнюйте їх максимально повно:

  • Identifier (DOI): Генерується автоматично системою репозитарію.

  • Creator (Автор): Вказуйте ПІБ повністю. Важливо: обов’язково додавайте свій ORCID (наприклад, 0000-0002-1234-5678). Це гарантує, що цитування автоматично підтягнеться до вашого профілю.

  • Title (Назва): Має бути інформативною. Замість "Дані експерименту", пишіть "Результати вимірювання електропровідності графену при температурах 100-300К".

  • Publisher (Видавець): Зазвичай це назва репозитарію [Автор(и). (Рік). Назва набору даних [Data set]. Zenodo. DOI: 10.5281/zenodo.XXXXXXX]. КПІ ім. Ігоря Сікорського буде вказаний як установа (Affiliation) автора. Зверніть увагу: навіть якщо дані публікуються як додаток до статті у журналі (наприклад, Elsevier чи Springer), то видавцем самої статті буде журнал, але видавцем набору даних усе одно залишиться Zenodo.

  • Publication Year (Рік): Рік оприлюднення даних.

  • Resource Type (Тип ресурсу): Завжди обирайте Dataset (Набір даних).

2. Поля, що підвищують «видимість» (Recommended Properties)

Саме ці поля відповідають за те, чи знайдуть ваші дані колеги:

2026/01/27

Тип даних

 Наукові дані — це фундамент будь-якого дослідження. Залежно від способу отримання та мети використання, їх поділяють на кілька ключових типів.

Ось визначення та приклади для восьми основних категорій:

1. Експериментальні дані

Це дані, отримані в контрольованих умовах, де дослідник активним чином маніпулює змінними, щоб перевірити гіпотезу. Ці дані зазвичай важко або неможливо відтворити ідентично пізніше (наприклад, через витрати або унікальність моменту).

  • Приклад: Вимірювання швидкості хімічної реакції при зміні температури в лабораторії.

2. Спостережні дані

Дані, зібрані шляхом реєстрації явищ у режимі реального часу в їхньому природному середовищі. На відміну від експерименту, дослідник не втручається в процес. Ці дані є унікальними за часом і місцем (їх неможливо перезняти).

  • Приклад: Запис міграційних маршрутів птахів або дані датчиків якості повітря за певний рік.

3. Симуляційні дані

Згенеровані за допомогою комп'ютерних моделей (алгоритмів), що імітують реальні процеси. Вони дозволяють вивчати сценарії, які занадто складні, небезпечні або дорогі для реального тестування.

  • Приклад: Прогнозування змін клімату на 50 років вперед за допомогою математичної моделі атмосфери.

4. Аналітичні дані

Це похідні дані, отримані в результаті обробки або аналізу "сирих" (експериментальних чи спостережних) даних. Вони часто є результатом математичних розрахунків, статистичних методів або інтерпретацій.

  • Приклад: Середній показник ВВП країни за десятиліття, розрахований на основі щомісячних звітів.

5. Соціальні та гуманітарні дані

Дані про людську діяльність, поведінку, культуру та суспільні структури. Вони можуть бути як кількісними, так і якісними (тексти, інтерв'ю).

  • Приклад: Результати анонімного опитування громадян щодо їхнього ставлення до впровадження штучного інтелекту.

6. Геномні та біоінформатичні дані

Специфічний тип великих даних, що стосуються біологічних послідовностей (ДНК, РНК) та структури білків. Вимагають потужних обчислювальних ресурсів для зберігання та аналізу.

  • Приклад: Послідовність нуклеотидів у геномі конкретного штаму вірусу.

7. Візуальні дані

Інформація, представлена у формі зображень, відео, графіків або карт. Вони допомагають виявити закономірності, які важко помітити в таблицях з цифрами.

  • Приклад: Знімки поверхні Марса, зроблені марсоходом, або МРТ-сканування головного мозку.

8. Метадані

Це "дані про дані". Вони описують контекст, зміст, якість та умови створення основних даних. Без метаданих наукова інформація часто втрачає свою цінність, оскільки стає незрозуміло, як і ким вона була зібрана.

  • Приклад: Файл, що містить дату зйомки, модель камери, координати GPS та ім'я автора фотографії.

Доступність дослідницьких даних

 Дивіться лекцію Бібліотеки КПІ Доступність дослідницьких даних https://www.youtube.com/watch?v=A_wjyL1VEfg&list=PLotcMLgU7ilaI43GgFyDK9bbOIzBBQ0ig&index=3





Ключові питання:
  • Що таке принципи FAIR і чому доступність — це серце цього підходу.
  • Які характеристики мають бути у ваших даних, щоб їх було легко знайти та використовувати.
  • Як політика журналів щодо даних впливає на процес публікації.
  • Навіщо потрібні шаблони заяв про доступ до даних, як їх правильно складати.
  • Як цитованість даних впливає на вашу наукову кар’єру.

Де ділитися даними?

Традиційно дослідники ділилися своїми даними через особисті вебсайти або електронну пошту. Зараз існують ефективніші засоби, такі як обмін через сховища/репозитарії даних та рецензовані журнали даних. Дані, що поширюються через ці засоби, можуть мати більшу видимість та залучати більше користувачів і цитувань.

2026/01/26

Етика дослідження та захист конфіденційності



Ембарго

Контроль доступу забезпечується заходом безпеки. Іноді вам може знадобитися заборонити на короткий час іншим особам доступ до ваших даних дослідження, перш ніж вони стануть загальнодоступними; це можна зробити, застосувавши ембарго для отримання відповідних патентів та/або інших прав інтелектуальної власності та підготовки наукових публікацій на їх основі. Після його завершення стає можливою публікація даних дослідження. Багато донорів схвалять короткі ембарго, але важливо перевірити політику ваших донорів.

Анонімізація персональних даних

Анонімізація персональних даних – спосіб введення надмірної персональної інформації. Тобто дані обробляються інструментами з відкритим кодом у спосіб, який неможливий для ідентифікації конкретної особи. Немає єдиної методики анонімізації, придатної для всіх типів даних. 

Псевдонімізовані дані (якщо інформаційні поля, які ідентифікують особу, в записі даних замінено одним або кількома штучними ідентифікаторами), можуть бути відновлені до початкового стану з додаванням інформації, яка надалі дозволяє повторну ідентифікацію особи, тоді як анонімні дані ніколи не можуть бути відновлені до початкового стану. Анонімізація – це незворотний процес.

Шаблон плану анонімізації FSD

Ось переклад тексту українською мовою:


Версія 1.0 (12.4.2019) Фінський архів даних із соціальних наук (FSD)

Розробник(и) плану: Особа(и), що здійснюють анонімізацію:

Нижче наведено фактори, що впливають на прийняття рішень щодо анонімізації.

1. Популяція та вибірка:

Хто був цільовою групою дослідження та як здійснювався відбір? Скільки осіб із популяції потрапило до вибірки? Що заздалегідь відомо про популяцію (наприклад, розподіл за статтю та віком)? Чи притаманне особам із цієї популяції якесь рідкісне явище?

2. Зміст даних:

  • а) Які типи прямих та непрямих ідентифікаторів містять дані? Які комбінації відомостей у даних можуть бути використані для ідентифікації особи?

  • б) Чи містить набір даних інформацію про третіх осіб і чи можна ідентифікувати суб'єктів на основі цієї інформації?

  • в) Чи містить набір даних виняткову або унікальну інформацію?

  • г) Чи містить набір даних конфіденційну (чутливу) інформацію?

3. Вік набору даних:

Чи змінилися дані про популяцію в наборі даних з плином часу?

4. Інформація про респондентів, доступна з інших джерел:

Чи можливо зіставити інформацію в даних з інформацією з інших джерел? Чи можливо ідентифікувати осіб на основі інформації, доступної в інших джерелах?

5. Корисність проти анонімності:

Які типи інформації в даних є найбільш значущими з точки зору дослідження, тобто яку інформацію необхідно зберегти під час анонімізації, а яку можна видалити?


Рішення щодо анонімізації: Що саме видаляється, категоризується або узагальнюється? Кількісні набори даних: Як обробляються відкриті відповіді?

Примітка: будь-які документи, що стосуються анонімізації, не можуть містити псевдонімізовану інформацію або інші дані, на основі яких все ще можна ідентифікувати осіб. Наприклад, списки псевдонімів, використаних замість справжніх імен, мають бути знищені, коли вони більше не потрібні.

Обґрунтування анонімізації та оцінка ризику розкриття даних після анонімізації: Надайте обґрунтування рішень та політик щодо анонімізації. Оцініть можливість ідентифікації осіб у даних зараз і в майбутньому. Поміркуйте, коли слід повторно переглянути рівень анонімності даних (оцінка залишкового ризику).

Ви також можете надати додаткову інформацію, наприклад, про процес анонімізації, спосіб маркування анонімізованих даних та можливі помилки, які слід враховувати вторинним користувачам даних.

________________________________________________________________

Інформована згода

Перегляньте поради UK Data Service щодо формування згоди на поширення даних. Як правило, документація згоди включає інформаційний лист і форму згоди, яка підписується учасником.

Інформаційний лист повинен охоплювати такі теми:
  • Мета дослідження;
  • Хто саме бере участь;
  • Переваги та ризики участі;
  • Процедури вилучення;
  • Використання даних під час дослідження, поширення, зберігання, публікації та архівування;
  • Деталі дослідження: джерело фінансування, організація-спонсор, назва проєкту, контактні дані дослідників, як подати скаргу.
Форма згоди має бути написана простою мовою, має кілька пунктів:
  • Учасник прочитав і зрозумів інформацію про проєкт;
  • Учасникам надається можливість поставити запитання;
  • Учасник добровільно погоджується на участь у проєкті;
  • Учасник відмовиться, що може відмовитися в будь-який час без пояснення причин і без штрафних санкцій;
  • Як буде захищена конфіденційність, наприклад, чи будуть використовуватися справжні імена або псевдоніми (з дозволом), як дані будуть анонімізованими тощо.
  • Яка інформація буде використана в публікаціях, наприклад цитати;
  • Окремі умови згоди на передачу даних, які містять інформацію, наприклад текст, аудіозаписи, відео чи зображення;
  • Підписи та дати підпису для учасника та дослідника.
Якщо ви отримали інформовану згоду, ви можете поділитися своїми даними в сховищах із обмеженим доступом.

Конфіденційність і етичні проблеми

Дослідники повинні регулювати протиріччя між вимогами конфіденційності та забезпеченості архівування та публікації даних. Конфіденційною інформацією є: розкриття расового або етнічного походження, політичних поглядів, релігійних чи ідеологічних переконань, членства в профспілці, генетичних чи біометричних даних (користуються для однозначної ідентифікації фізичної особи), дані про здоров’я, сексуальну приналежність чи сексуальну орієнтацію тощо. 


Більшість досліджень конфіденційності даних можна етично поділити за допомогою підключення інформаційної згоди, анонімізації та контролю доступу до даних.

Як ліцензувати відкриті дані?

Нагадаємо, дані є відкритими, якщо виконуються такі умови:
✓ відкрита ліцензія Creative Commons;
✓ відкритий доступ;
✓ відкритий машиночитний формат.

Застосування відповідної ліцензії до ваших даних має вирішальне значення для того, щоб зробити їх придатними для повторного використання. Видавці заохочують надавати дослідницькі дані за відкритими ліцензіями, які дозволяють вільне повторне використання (наприклад, CC0). Але видавці не накладають жодних ліцензій на дослідницькі дані, якщо дослідницькі дані зберігаються в сторонніх сховищах. Видавець журналу також не претендує на авторські права на дані досліджень. Вибір ліцензії залишається за дослідником.

Деякі з найбільш поширених ліцензій для повторного використання:

CC0 (No Rights Reserved) - права не захищені, суспільне надбання. CC0 може бути особливо важливим для обміну даними та базами даних, оскільки в протилежному випадку може бути неясно, обмежено дані та бази даних, засновані на фактах, авторським правом чи іншими правами. Бази даних можуть містити факти, які самі по собі не захищені законом про авторське право. CC0 рекомендується для табличних даних і баз даних і використовується сотнями організацій. Особливо рекомендується для наукових даних. Хоча CC0 за законом не вимагає від користувачів даних посилань на джерело, це не знімає моральної відповідальності в зазначені авторства, як заведено в наукових дослідженнях.

CC-BY (Attribution) - зазначення авторства. Ця ліцензія дозволяє іншим поширювати, мікшувати, створювати та використовувати вашу роботу (також у комерційних цілях) за умови, що вони вказують вам авторство оригінального твору. Це сама зручна пропонована ліцензія. Рекомендується для максимального поширення та використання ліцензійних матеріалів.

CC BY-SA (Attribution-ShareAlike) - ця ліцензія дозволяє іншим мікширувати, створювати та використовувати вашу роботу навіть у комерційних цілях, за умови, що вони посилаються на вас, і ліцензують свої нові твори на тих же умовах. Цю ліцензію часто зрівнюють з ліцензіями на безплатне та відкрите програмне забезпечення з авторським правом. Усі нові роботи, засновані на вашій, будуть мати ту ж ліцензію, тому будь-які виробничі також дозволяють комерційне використання. Це ліцензія, яка використовується у Вікіпедії, і вона рекомендована для матеріалів, які відтворюються від включення контенту з Вікіпедії та проєктів з аналогічною ліцензією.

CC BY-NC (Attribution-NonCommercial). Ця ліцензія дозволяє іншим мікширувати, створювати та використовувати вашу роботу в некомерційних цілях, і, хоча їх нові роботи також повинні визнавати вас і бути некомерційними, вони не зобов’язані ліцензувати свої продуктивні роботи на таких умовах.

Для отримання додаткової інформації про ліцензування відкрийте Ліцензування.

Чи відкриті дані = даним FAIR?

Хоча дані можна зробити відкритими, вони не завжди можуть бути FAIR.

Відкриті дані дозволяють кожному отримувати доступ, використовувати та поширювати дані без обмежень, що виникають з ліцензій, авторських прав та патентів. Однак нам потрібно зробити більше, якщо ми хочемо, щоб люди могли отримувати вигоду від наших спільних даних. Наприклад, присвоєння нашим даним постійних ідентифікаторів, таких як DOI, надання належних метаданих, представлення даних у стандартизованому вигляді та встановлення умов повторного використання даних.

Щоб максимізувати цінність спільних даних, дані мають бути FAIR. З іншого боку, дані FAIR не означають, що вони мають бути відкритими.

Обмеження можуть бути вжиті, коли це стосується комерційних інтересів, конфіденційності особистої інформації, національної безпеки та суспільних інтересів. У цих випадках метадані даних все ще будуть загальнодоступними разом з інформацією про умови доступу до даних.

Оскільки даними необхідно добре керувати, перш ніж вони стануть FAIR та ефективно поширюватимуться, рекомендується планувати їх на початку вашого дослідницького проєкту, якщо ви бажаєте або зобов’язані поділитися дослідницькими даними.

Ви можете переглянути це 5-хвилинне відео, яке пояснює, чому добре керовані дані необхідні для ефективного обміну даними.

Перешкоди застосуванню принципів FAIR

Забезпеченню принципів FAIR для даних і коду можуть перешкоджати часові обмеження. Щоб мінімізувати витрати ресурсів і часу, ці аспекти варто враховувати на якомога ранішньому етапі планування дослідження. Під час подання заявки на фінансування проєкту доцільно передбачити час і ресурси (можливо, залучення асистента-дослідника) для підтримки практик FAIR.

Ще однією значною перешкодою для дослідників є недостатнє розуміння принципів FAIR та їх застосування до конкретного проєкту. Можуть виникати питання й занепокоєння щодо специфіки даних, наприклад: як діяти з конфіденційними даними або з надзвичайно великими масивами інформації? Що робити з даними, отриманими від третіх сторін?

Переваги застосування FAIR

Підвищення видимості та цитованості публікацій і даних

FAIR-принципи передбачають присвоєння унікальних ідентифікаторів (наприклад, DOI), надання повного метаопису та розміщення даних у відкритих репозиторіях. Це дозволяє:

  • Забезпечити індексацію даних і публікацій у пошукових системах (Google Scholar, DataCite, OpenAIRE).
  • Підвищити відшукуваність для інших дослідників, які шукають пов’язані ресурси.
  • Створити можливості для додаткових цитувань не лише публікацій, а й самих наборів даних, кодів чи моделей.
  • Посилити наукову репутацію автора/інституції через прозоре та відкрито доступне дослідження.

Забезпечення відтворюваності досліджень

FAIR сприяє науковій доброчесності, забезпечуючи:

  • Документування процесів збору, обробки та аналізу даних.
  • Зберігання даних у форматах, які дозволяють іншим дослідникам перевірити та повторити результати.
  • Включення метаданих і пов’язаного коду, що дозволяє повністю реконструювати експеримент або аналіз.
  • Використання відкритих інструментів і середовищ для забезпечення прозорості дослідницького процесу.

Сприяння міжнародній співпраці та обміну даними

FAIR-дані легко інтегруються у глобальні платформи, сприяючи:

  • Спрощенню спільного використання даних між дослідницькими групами, навіть із різних країн та дисциплін.
  • Інтероперабельності — завдяки узгодженим стандартам формату, структури та опису.
  • Можливості для участі у міжнародних проєктах і грантах, які дедалі частіше вимагають відкритого доступу до даних (наприклад, Horizon Europe).
  • Уникненню дублювання зусиль — якщо дані вже є доступними, інші команди можуть їх повторно використовувати замість проведення ідентичного збору.

Полегшення аналізу, інтеграції та інновацій на основі відкритих даних

FAIR робить наукові дані “машиночитаними”, що забезпечує:

  • Автоматизований збір і обробку великої кількості даних за допомогою алгоритмів, ШІ та аналітичних платформ.
  • Об’єднання даних із різних джерел у комплексні масиви — з метою проведення міждисциплінарного аналізу.
  • Появу нових дослідницьких запитань завдяки доступу до великого масиву відкритих, порівнюваних і структурованих даних.
  • Інновації в галузях як-от біоінформатика, соціальна аналітика, аграрні технології, машинне навчання тощо.

Дотримання стандартів відкритої науки, етики та ліцензування

FAIR-принципи тісно пов’язані з етичним та правовим використанням дослідницьких результатів. Вони:

  • Вимагають чіткого вказання умов використання даних (наприклад, через ліцензії Creative Commons).
  • Забезпечують трасованість походження даних, що критично важливо для дотримання авторських прав, конфіденційності та відповідності GDPR.
  • Сприяють інституційному управлінню науковими результатами, зокрема в контексті державної політики у сфері науки.
  • Підтримують відповідальність дослідників за якість і прозорість створених ресурсів.



FAIR і CARE: що спільного?

Принципи CARE — це набір етичних орієнтирів, розроблених для забезпечення справедливого, відповідального та поважного використання даних. CARE-принципи були розроблені Глобальним альянсом з даних про корінні народи (GIDA) у 2019 році та вже активно інтегруються в політики відкритої науки

Назва CARE — це абревіатура, що розшифровується як:

C — Collective Benefit / Колективна вигода

Дані повинні використовуватися так, щоб приносити користь самим спільнотам, з яких вони походять. Це включає розвиток локального потенціалу, економічне зростання, культурну підтримку та інновації, які служать інтересам спільноти.

A — Authority to Control / Право контролю

Цей принцип включає право на інтелектуальну власність.

R — Responsibility / Відповідальність

Дослідники, організації та інституції зобов’язані діяти відповідально, поважно і прозоро, коли працюють із даними, що мають культурне, історичне або соціальне значення для громад. Це також передбачає участь представників спільнот у всіх етапах роботи з даними.

E — Ethics / Етика

Всі дії з даними мають відповідати етичним нормам, враховувати соціальні, культурні та історичні контексти. Це означає уникнення шкоди, дотримання згоди, повагу до традиційних знань і справедливий розподіл вигод.

Хоча FAIR-принципи фокусуються на технічній доступності та повторному використанні даних, CARE-принципи підкреслюють соціальну відповідальність та етичний контекст роботи з даними. Обидва підходи не суперечать, а доповнюють один одного:

  • FAIR — про машини та метадані

  • CARE — про людей і спільноти

Приклади відкритих репозитаріїв, що відповідають FAIR-принципам


Репозитарій

Опис

Особливості FAIR-відповідності

Zenodo

Мультидисциплінарний репозитарій, підтримується CERN

PID (DOI), підтримка ліцензій, API-доступ, повні метадані

PANGAEA

Гео- та кліматичні дані

Стандартизовані формати, міжсистемна сумісність

Dryad (публікація платна)

Біологічні та медичні дослідження

FAIR-оцінка перед публікацією, редакторські перевірки

Figshare

Для науковців усіх галузей

Миттєвий DOI, сумісність з ORCID, відкриті API

Успішні приклади впровадження FAIR-принципів

FAIR-принципи не є лише теоретичною концепцією — тисячі науковців, установ і проєктів уже впровадили їх у щоденну практику. 

  • Успішні кейси в наукових установах

Leiden University, Нідерланди

Університет інтегрував політику FAIR у всі етапи дослідницького процесу — від планування проєктів до зберігання даних. Завдяки ролі “data steward” кожна кафедра має експерта, що допомагає дослідникам впроваджувати FAIR-інструменти, включно з DMP та реєстрацією у репозитаріях.

EMBL-EBI (Європейський інститут біоінформатики)

FAIR використовується як обов’язкова умова при завантаженні біологічних даних у репозитарії. Завдяки цьому дані легко знаходяться через API, метадані стандартизовані, а повторне використання стало основою для машинного аналізу.

Національні дослідницькі установи Іспанії (CSIC)

Усі науковці при поданні проєктів зобов’язані подавати FAIR-сумісний Data Management Plan. Крім того, створено відкриту систему для оцінки FAIR-відповідності публікацій та даних.

  • Досвід міжнародних проєктів

EOSC-Pillar (ЄС)

Проєкт допоміг країнам Центральної Європи розбудувати національні інфраструктури для FAIR-даних. Було розроблено навчальні модулі, стандарти та пілотні репозитарії, де тестується автоматизована перевірка FAIRness.

FAIRsFAIR (2020–2022)

Цей проєкт став ключовим рушієм узгодження політик, розробки індикаторів FAIR та навчальних ініціатив. Сотні університетів та бібліотек пройшли тренінги, з’явилися стандартизовані оцінки FAIR-репозитаріїв.

ENVRI-FAIR

Проєкт у сфері дослідження навколишнього середовища інтегрував FAIR у більше ніж 20 наукових інфраструктур (включно з супутниковими спостереженнями, гідрологією, метеорологією). Створено спільні метаописові моделі та міжсистемні API.


Інструменти оцінювання відповідності FAIR-принципам

Ці інструменти допомагають дослідникам, бібліотекарям та дата-менеджерам оцінити, наскільки дані відповідають FAIR-принципам:

  • F-UJI
    Автоматизований сервіс для оцінки FAIRness наборів даних, розроблений згідно з вимогами EOSC.

  • FAIR Evaluator tool
    Мануал FAIR Evaluator tool
    Онлайн-платформи для перевірки даних або метаданих на відповідність FAIR-критеріям. Працює на основі міжнародних індикаторів.

Інструменти самооцінки 

  • FAIR-Aware DANS FAIRdat tool https://fairaware.dans.knaw.nl/
    Простий у користуванні інструмент для самооцінки дослідника: оцінює обізнаність із FAIR-принципами та дає поради.

  • ARDC Fair Data self-assessment tool (Australian Research Data Commons)
    Допомагає дослідникам оцінити, наскільки їхній набір дослідницьких даних є доступним для пошуку, доступним, сумісним і придатним для повторного використання. Він також містить практичні поради щодо того, як підвищити його FAIRness.

  • 5 Star Data Rating Tool https://csiro-enviro-informatics.github.io/5stardata/ Анкета надає вам інструмент для оцінки відповідності вашого набору даних 5 ★ критеріям даних. Після відповіді на запитання інструмент відображає діаграму, яка підсумовує ваші дані відповідно до схеми.


Вебінар НТБ ім. Г.І. Денисенка КПІ ім. Ігоря Сікорського. (2024). Інструменти оцінювання даних на відповідність принципам FAIR [Відео]. YouTube
https://www.youtube.com/watch?v=qM98JsAEkZ8&list=PLotcMLgU7ilalx3MBYvqamEuDXU-8SB0L&index=8


Універсальні репозитарії

  • Harvard Dataverse https://dataverse.harvard.edu/ – репозитарій для обміну, збереження, цитування, дослідження та аналізу дослідницьких даних
  • Dryad http://datadryad.org/stash/ — кураторська платформа для широкого розмаїття типів даних
  • Figshare http://figshare.com/ – репозитарій, де ви можете зробити всі свої дослідницькі результати доступними у спосіб, у якому їх можна цитувати, поширювати та знаходити
  • Open Science Framework http://osf.io/dashboard це безплатна відкрита платформа для пошуку проєктів, даних, матеріалів та партнерів.
  • Zenodo http://www.zenodo.org/ — репозитарій з відкритим доступом, ініційований OpenAIRE, організацією ЄС, що спеціалізується на відкритій науці, та розміщений у CERN
Рекомендуємо: Завантаження дослідницьких даних у репозитарій ZENODO https://ela.kpi.ua/handle/123456789/76940

Принципи FAIR

Принципи FAIR –  це міжнародно визнані принципи управління науковими даними, створених з метою зробити дані та інші результати доступнішими та більш придатними для повторного використання іншими, вони забезпечують Відшукуваність (Findable), Доступність (Accessible), Інтероперабельність (Interoperable) та Багаторазовість (Reusable). Визначені у 2016 році, принципи FAIR зараз вважаються стандартом у відкритості дослідницьких даних і дедалі частіше вимагаються для дослідницьких проєктів. Варто зазначити, що дані або вихідний код можуть бути FAIR більшою чи меншою мірою, але будь-який рух у напрямку FAIR є позитивним. 

Практичні кроки для впровадження принципів FAIR в управлінні даними

Findability (Відшукуваність)

  • Має унікальний, постійний ідентифікатор, наприклад, DOI.
  • Має багато описових метаданих (даних про дані).
  • Індексується в ресурсі, доступному для пошуку, наприклад, у репозитарії даних.
Щоб зробити дані/код доступними для пошуку:
  • Зберігайте дані в репозиторії, що надає їм DOI.
  • Цитуйте це в публікаціях (використовуючи DOI).
  • Переконайтеся, що це повністю задокументовано — заповніть усі відповідні поля під час депонування та додайте файл README.

Accessibility (Доступність)

  • Можна отримати за допомогою стандартного, безплатного та відкритого протоколу, який дозволяє автентифікацію, де це необхідно.
  • Метадані доступні навіть там, де немає даних.
Щоб зробити дані/ код доступними:
  • Використовуйте відповідний репозиторій для ваших даних/коду
  • Якщо ви не можете поділитися своїми даними/кодом, створіть запис лише з метаданими.

Interoperability (Сумісність)

  • Може бути інтегрований з іншими даними, програмами та робочими процесами.
  • Використання відкритих або загальновживаних форматів файлів.
Щоб зробити дані/ код сумісними:
  • Перевірте, чи використовуються стандартні або відкриті формати файлів
  • Використовуйте стандартну та доступну лексику.

Reusability (Багаторазовість)

  • Опубліковано з ліцензією, яка вказує, як її можна використовувати повторно, наприклад, ліцензія CC.
  • Відповідно до громадських стандартів.
  • Чітко задокументовано.
Щоб зробити дані/ код придатними для повторного використання:

  • Використовуйте ліцензію Creative Commons для даних
  • Для програмного забезпечення з відкритим кодом виберіть відповідну ліцензію тут
  • Надайте якомога більше інформації (метаданих) про дані під час надсилання до репозитарію
  • Додайте файл README для пояснення та контекстуалізації даних.

Інструменти УДД

 Open Science Framework

  • керуйте дослідницькими даними та проєктами, діліться роботою з колегами та реєструйте дослідження на цій хмарній платформі

Protocols.io

  • документуйте та діліться покроковими методами та протоколами

LabArchives

  • надійно записуйте та діліться нотатками та даними з досліджень у електронному блокноті для досліджень

Переваги УДД

Ефективне управління даними відбувається на всіх етапах життєвого циклу дослідження: від планування проєкту до збору ваших даних, до порівняння та аналізу ваших даних, а потім, нарешті, публікації та спільного використання ваших даних у сховищі, яке подбає про їх довгострокове керування та збереження.

Управління даними допомагає дослідникам оптимізувати використання даних під час активної фази дослідницького проєкту та полегшує їм співпрацю з іншими дослідниками. Важливо складати план управління даними та дотримуватися його, тоді час буде витрачено з користю, і у майбутньому це допомагатиме досліднику та полегшуватиме комунікацію з колегами, партнерами, грантодавцями.

Управління даними гарантує, що дані зберігаються для майбутніх досліджень. Дані можна швидко знайти, отримати до них доступ, інтерпретувати, повторно використати. Повторне використання подовжує життя даних до 6 років https://peerj.com/articles/175/

Тобто, управління даними забезпечує цінність даних. Коли дослідницький проєкт завершено, дані можуть використовуватися для отримання відповідей на додаткові запитання, що не розглядалися на початку проєкту. Також науковець може захотіти з часом продовжити дослідження, щоб порівняти результати. Але це буде дуже складно зробити, або навіть неможливо, якщо не було забезпечено ефективне управління даними; дані можуть бути розпорошені чи взагалі втрачені.

Сьогодні дедалі більше організацій, які фінансують дослідницькі проєкти, видавців наукових видань, дослідницьких установ вимагають управління даними. Ці установи вимагають більшої прозорості в дослідницьких проєктах, і керування даними є одним зі способів виконати цю вимогу. Грантодавці хочуть таким чином збільшити рентабельність своїх інвестицій, гарантуючи, що дані, отримані під час проєкту, доступні для вторинного аналізу, реплікації (копіювання) або повторного використання для подальших інновацій.

Отже,  ефективне УДД приносить багато переваг:
  • Заощадження вашого часу і зусиль в довгостроковій перспективі завдяки організації дослідницьких даних з самого початку.
  • Мінімізація ризику втрати даних, людських помилок, несанкціонованого доступу або інших небажаних ризиків. Правильне управління даними допомагає уникнути потенційних загроз втрати даних через, наприклад, крадіжку ноутбука або відсутність супровідної документації.
  • Забезпечення доступності та зрозумілості ваших даних для дослідників, у тому числі вас самих, у майбутньому.
  • Надання точних, повних та достовірних даних для відтворення результатів вашого дослідження за потреби.
  • Надаючи доступ до оригінальних даних, дослідники дозволяють іншим вчитися на їхній практиці та спиратися на їхні результати. 
  • Відкритий обмін даними досліджень також може збільшити видимість і вплив вашої роботи. Доступ до даних дозволяє відтворювати дослідження та зміцнює довіру до результатів.
  • З іншого боку, управління даними допоможе вам передбачити потенційні проблеми, які можуть виникнути в процесі дослідження, і забезпечити відповідність вашого дослідження встановленим вимогам грантодавців, спонсорів досліджень і видавців, тобто убезпечити вашу роботу.

Таким чином, управління даними гарантує, що дані зберігаються для майбутніх досліджень. Дані можна швидко знайти, отримати до них доступ, інтерпретувати, повторно використати. Повторне використання подовжує життя даних до 6 років https://peerj.com/articles/175/Опанування УДД потребує часу та зусиль. Однак, сукупність невеликих рутинних практик може допомогти виробити якісні навички УДД.

Цикл управління дослідницькими даними

Управління дослідницькими даними, УДД (англ. Research Data Management, RDM) – діяльність та практики, які сприяють ефективному збору, організації, збереженню, захисту, використанню та поширенню дослідницьких даних протягом життєвого циклу дослідження.

Тобто, УДД включає різні дії до, під час та після дослідницького проєкту, який генерує дані.На кожному етапі життєвого циклу дослідження створюються чи певним чином видозмінюються дані - це вимагає різноманітних міркувань, обов’язків і дій від дослідника.

Життєвий цикл дослідницьких даних, показаний нижче, визначає ключові етапи в УДД: планування, збір, організація, обробка, документування, збереження, обмін та повторне використання (дивись мітки).

 

Джерело: https://libguides.lb.polyu.edu.hk/rdm/home

Управління дослідницькими даними не завжди є лінійним процесом, і вам може знадобитися переглянути певні етапи та деякі процеси протягом вашого проєкту.


Місія Бібліотеки - допомогти користувачам в організації процесу збору/поширення даних, допомогти знайти та оцінити, використати дані для створення нових знань в процесі аналізу.

Інструменти контролю версій файлів

Контроль версій – це програмні інструменти, які дозволяють користувачам відстежувати зміни, внесені до файлів у каталозі комп'ютера. Хоча системи контролю версій зазвичай використовуються в галузі розробки програмного забезпечення, вони все частіше використовуються для спільної роботи в академічних та дослідницьких контекстах. Ці системи ідеально підходять для простих текстових файлів, таких як комп'ютерний код та документи.

Git — це безплатна розподілена система контролю версій з відкритим кодом, розроблена для ефективного управління проєктами від малих до дуже великих.