Показ дописів із міткою План УДД. Показати всі дописи
Показ дописів із міткою План УДД. Показати всі дописи

2026/05/28

Робота над помилками: Чому Плани УДД в КПІ повертають на доопрацювання?

План управління дослідницькими даними (УДД або DMP) — це вже не просто формальність для галочки, а обов'язкова умова сучасних грантових проєктів, зокрема в рамках Horizon Europe. Проте аналіз свіжих планів, що надходять на перевірку до Науково-технічної бібліотеки КПІ у 2026 році, показує: автори часто сприймають цей документ як анкету, а не як реальний управлінський інструмент.

Результат? Загальні декларації замість конкретики та закономірне повернення документа на доопрацювання.

Ми зібрали та систематизували найпоширеніші помилки дослідників — від критичних пропусків до глибинних системних прорахунків. Перевірте свій план перед подачею!

🔴 Топ-3 критичних помилок (є майже у всіх планах)

  1. Відсутній або «іграшковий» розділ «Забезпечення якості» (QA) Жоден із розглянутих планів не містив повноцінного QA-розділу. Дослідники забувають описати версіонування файлів, перевірку цілісності даних (наприклад, через контрольні суми) та правила збереження незмінної головної копії (master copy) окремо від щоденних робочих матеріалів.

  2. Архівування плутають із поточним зберіганням Поточна робота з файлами в хмарі та довгострокове архівування — це різні процеси. Типова помилка — не вказувати конкретний науковий репозитарій з DOI на початку (як-от Zenodo, що вимагається п.6.3 Положення КПІ).

  3. «Обмін даними» без конкретики У планах катастрофічно бракує деталей: як саме отримуватиметься DOI, які точні терміни публікації даних після завершення ембарго, і чому ліцензія CC BY 4.0 не прив’язана безпосередньо до умов обміну.

🟡 Важливі деталі, про які забувають

  • Пропрієтарні формати без виправдання: Повсюдне використання XLSX та DOCX. Натомість Положення (п.4.2) вимагає відкритих форматів (.csv, .odt, .txt) або чіткого обґрунтування, чому залишено закритий формат, із описом відкритої альтернативи.

  • Де ліцензія? Ліцензія CC BY 4.0 для самих даних і CC0 для метаданих мають фігурувати у розділі про обмін даними. Натомість посилання на них або відсутнє, або з'являється аж наприкінці — в архівуванні.

  • Анонімні ролі: Розподіл обов'язків є, але без конкретних імен, матриці задач за етапами проєкту та без дати першого обов'язкового перегляду плану (а його треба переглядати щопівроку!).

🔵 Системні прогалини (паспортна частина та метадані)

  • Адміністративний вакуум: Дослідники забувають вказати номер теми/договору, версію самого DMP, джерело фінансування та контакти особи, відповідальної за запити щодо даних.

  • Винахід велосипеда: Шаблон вимагає зафіксувати, чи перевіряв автор наявність вже існуючих схожих наборів даних (у Re3data, Zenodo тощо) для їх повторного використання. Цей пункт зазвичай просто ігнорують.

  • Загальний Dublin Core: Стандарти метаданих або не згадуються взагалі, або копіюється загальна фраза «Dublin Core» без жодної прив'язки до конкретних полів.

🧠 4 типи мислення, які псують ваш DMP

Ці помилки виникають не через некомпетентність. Це наслідок неправильного сприйняття документу. Зазвичай автори потрапляють в одну з чотирьох пасток:

Тип 1. Декларативність без механізму

Симптом: Писати що буде зроблено, але не писати як.

  • Приклад: Вказати стандарт EngMeta, але без URI/версії. Згадати DataCite, але не написати, хто, коли і через який інтерфейс заповнює метадані. Згадати Nextcloud, але не уточнити, чиї це сервери.

  • Причина: Сприйняття DMP як форми для відписки, а не як інструкції для команди.

Тип 2. Ігнорування масштабу

Симптом: Технічні параметри проєкту суперечать обраним інструментам.

  • Приклад: Вказати загальний обсяг даних у 500 ГБ – 1 ТБ і обрати основним репозитарієм Zenodo, де безкоштовний ліміт становить 50 ГБ на датасет, і не пояснити, як дані будуть секціонуватися.

  • Причина: DMP заповнюється ізольовано від реального технічного планування та розрахунку бюджету.

Тип 3. Відсутність інституційного контексту

Симптом: Документ пишеться так, наче дослідник перебуває у вакуумі.

  • Приклад: Роль Data Steward прописана як абстрактна «відповідальна особа» без ПІБ та посади. Бібліотека КПІ (яка є офіційним RDM-центром університету - див. Положення про УДД) взагалі не згадується, а її послуги не включені як безпосередній нефінансовий внесок (non-financial contribution) у проєкт.

  • Причина: Брак інформованості про те, що в університеті вже є готова RDM-інфраструктура підтримки.

Тип 4. Плутання «подати DMP» з «вести DMP»

Симптом: Переконання, що план пишеться один раз на початку проєкту.

  • Приклад: Відсутність графіка планових оновлень (наприклад, на місяцях M6, M18, M30 для тривалих проєктів), повне ігнорування спеціалізованих платформ (DMPonline або ARGOS) та відсутність умов для позапланового апдейту (зміна складу партнерів, форс-мажори, нові умови ембарго).

  • Причина: Освітня прогалина щодо концепції Living DMP (живого документа), яка є базовою для Horizon Europe.

💡 Висновок для авторів та експертів: Найслабші місця планів — це точки конкретних зобов'язань: назва репозитарію, чітка ліцензія, терміни, імена. Фрази типу «дані будуть доступні» або «проєкт відповідає принципам FAIR» без операційного підтвердження більше не приймаються.

Як вирішити цю проблему системно?

В університеті розроблено деталізований університетський шаблон (див. додатки до Положення про УДД), рекомендації з інструктивними підказками для кожного поля. Це допоможе авторам проходити валідацію з першого разу.

У разі виникнення питань щодо ліцензування метаданих (CC0), вибору відкритих форматів чи інтеграції інфраструктури бібліотеки у ваш грант — звертайтеся за консультацією до Бібліотеки  КПІ ім. Ігоря Сікорського!

2026/04/09

Положення про УДД

Управління дослідницькими даними (УДД) є важливою частиною будь-якого дослідницького проєкту  та включає збір, обробку та аналіз, збереження, обмін, довгострокове зберігання даних досліджень.

Вперше в Україні — Положення про управління дослідницькими даними в Національному технічному університеті України «Київський політехнічний інститут імені Ігоря Сікорського» (2026).

Положення про УДД включає розділи:

  1. ЗАГАЛЬНІ ПОЛОЖЕННЯ  
  2. ТЕРМІНИ ТА ВИЗНАЧЕННЯ  
  3. ПЛАНУВАННЯ УПРАВЛІННЯ ДОСЛІДНИЦЬКИМИ ДАНИМИ  
  4. ЗАБЕЗПЕЧЕННЯ ДОСТУПУ ДО ДАНИХ ПІД ЧАС ДОСЛІДЖЕННЯ  
  5. ОРГАНІЗАЦІЯ ФАЙЛІВ ТА ДОКУМЕНТУВАННЯ ДОСЛІДНИЦЬКИХ ДАНИХ  
  6. ДОВГОСТРОКОВЕ ЗБЕРІГАННЯ ТА ПОШИРЕННЯ ДАНИХ  
  7. ТЕРМІН ЗБЕРІГАННЯ ДОСЛІДНИЦЬКИХ ДАНИХ  
  8. ВІДПОВІДАЛЬНІСТЬ УЧАСНИКІВ ПРОЦЕСУ УДД


Додаток 1.  ПЛАН УПРАВЛІННЯ ДОСЛІДНИЦЬКИМИ ДАНИМИ: Шаблон для науково-дослідної роботи

Додаток 2. ПЛАН УПРАВЛІННЯ ДОСЛІДНИЦЬКИМИ ДАНИМИ: Шаблон для дисертаційного дослідження

2026/02/09

Втрата даних

Ваші дані є основою вашого дослідження. Якщо ви їх втратите, відновлення може зайняти багато часу, зусиль, нервів, грошей, більше того відновлення може бути неможливим. Тому дуже важливо безпечно зберігати та створювати резервні копії ваших даних.

Корисно спланувати з самого початку об’єм пам’яті, який вам знадобиться для копій. Спланувати місце зберігання даних з точки зору доступу певних користувачів. Включити витрати на зберігання даних у заявках на гранти.

Термін «втрата даних» можна визначити як неможливість отримати доступ до файлів у їх звичайному місцерозташуванні та за допомогою звичайних програмних засобів внаслідок помилок у програмному/апаратному з абезпеченні або необачних дій користувача.

Незважаючи на стрімкий розвиток техніки та програмного забезпечення ніщо не може гарантувати цілковито безперебійної роботи. Помилки, які призводять до втрати даних, можна умовно поділити на дві основні категорії: фізичні (апаратні, коли збоїть техніка) і логічні (програмні). Наведена вище діаграма ілюструє процентне співвідношення найбільш поширених причин втрати даних.

Основі причини втрати даних

https://lostdata.com.sa/en/2021/06/07/the-most-common-reasons-for-data-loss/


2026/02/05

Планування обсягу даних

Планування обсягу даних — це не просто питання «купити флешку чи хмару». Це стратегічне рішення, яке допоможе уникнути ситуації, коли в середині дослідження у вас закінчується місце, а бюджет уже вичерпано.

Якість проти Кількості 

Деякі типи даних «з’їдають» пам’ять миттєво. Наприклад, одне медичне зображення у високій роздільній здатності може важити більше, ніж тисячі сторінок тексту.

  • Стратегія відбору: Ви повинні заздалегідь визначити критерії відсіву.

    • Чи потрібні вам сирі (raw) дані зображень, чи достатньо стиснутих копій?

    • Чи будете ви зберігати невдалі дублі або технічні кадри?

  • Технічна готовність: Ваша архівна установа (або сервер) повинна мати не лише основне сховище, а й подвійний обсяг для резервного копіювання.

Як швидко ваші дані будуть "рости"?

Швидкість накопичення інформації залежить від методу її отримання. Щоб не помилитися, дайте відповідь на ці 4 питання:

А. Ручне чи автоматичне збирання?

  • Ручне (анкети, записи): Дані зростають повільно і прогнозовано. Обсяги зазвичай невеликі.

  • Автоматичне (датчики, телеметрія): Прилади можуть генерувати гігабайти інформації щосекунди. Тут потрібна автоматизована система фільтрації.

Б. Чи є збір даних ітераційним?
  • Ітераційність означає, що ви повертаєтеся до тих самих об'єктів знову і знову. Кожен новий цикл досліджень може подвоювати або потроювати загальний обсяг збереженої інформації через появу нових версій.

В. Який крок накопичення (30 / 90 днів)?

Важливо розділити проєкт на короткі відрізки. Це дозволяє:

  • Вчасно докуповувати місце в хмарі.

  • Переміщувати старі дані в "холодні архіви" (дешевші, але повільніші сховища).

Г. Який фінальний прогноз?

Знаючи швидкість за перші 3 місяці, ви можете екстраполювати (прорахувати наперед) загальний обсяг до кінця проєкту. Це критично для звітності перед донорами або грантодавцями.

Чек-лист для планування обсягів

Тип файлів: Визначити розширення (.jpg, .csv, .tiff) та їхній середній розмір.

Частота: Скільки разів на день/тиждень відбувається запис.

Тривалість: Скільки років триватиме активна фаза.

Коефіцієнт безпеки: Додайте 20-30% до отриманої цифри на випадок непередбачуваних обставин.

Формула розрахунку загального обсягу даних

Для розрахунку ми використовуємо формулу прогнозованого обсягу (S_{total}):
S_{total} = (N \times S_{avg} \times F \times T) \times R

Де змінні означають:

N: Кількість джерел даних (кількість датчиків, учасників опитування або камер).

S_{avg}: Середній розмір одного файлу або одного запису (наприклад, 5 МБ для фото або 10 КБ для анкети).

F: Частота збору (скільки разів на день/тиждень/місяць ви отримуєте дані).

T: Тривалість проєкту (загальний час збору даних у днях/тижнях/місяцях).

R: Коефіцієнт резервування (зазвичай 2.2 або 3). Він враховує створення бекапів (мінімум 2 копії) + 10-20% вільного місця для системних потреб.

2026/02/02

1-й етап життєвого циклу даних : планування

На початковому етапі життєвого циклу дослідження, тобто на етапі відкриття та планування, дослідникам потрібно визначити, який тип і формат даних вони збираються збирати. Це може бути:

  • збір нових даних,
  • або об’єднання існуючих наборів даних,
  • або просто аналіз існуючих даних.

Якщо в проєкті беруть участь люди, дослідники повинні враховувати конфіденційність та інші етичні питання.


Крім того, дослідники повинні розглянути, які типи документації вони створюватимуть, і стандарти метаданих, які вони використовуватимуть для опису своїх даних.


Крім того, дослідникам потрібно буде визначити потенційних вторинних користувачів даних проєкту та відповісти на питання:

  • Хто використовуватиме ці дані?
  • Для чого вони можуть це використовувати?
  • Чи будуть дані, позбавлені будь-якої потенційно ідентифікаційної інформації, корисними для повторного використання?
  • Які обмеження доступу будуть накладені на дані?

На всі ці питання дослідники повинні відповісти ще до початку проєкту.


NB! Звернення до спеціалістів на початку життєвого циклу дослідження може допомогти дослідникам відповісти на ці запитання.


Треба визначити відповідне сховище даних для архівування своїх даних. Не всі дані, що створюються під  час дослідження, потребують поширення, бо дані можуть бути як відкритого, так і закритого чи обмеженого доступу.  На етапі планування це потрібно врахувати заздалегідь.


Нарешті, на цьому етапі дослідникам важливо визначити можливі витрати, пов’язані з керуванням даними. Це включатиме документування даних, їх форматування, зберігання, очищення та анонімізацію та, нарешті, архівування.


2026/01/23

Приклади Планів УДД

Спосіб написання вашого Плану залежить від типів даних, які у вас є, ваших конкретних потреб або інших вимог грантонадавачів, видавців журналів чи інших зовнішніх сторін. Ви можете звернутися до різних контрольних списків та прикладів Плану УДД, щоб дізнатися більше.

DMPonline

DMPonline, розроблений Центром цифрового курування (DCC), є корисним інструментом для написання DMP. DMPonline містить шаблони планів управління даними для всіх основних спонсорів досліджень, а також надає рекомендації та поради щодо того, що включати. ​​DMPonline також має контрольний список DMP DCC та приклади DMP, що ілюструють необхідний зміст та рівень деталізації. 

У рекомендаціях наведено покрокові інструкції щодо роботи з інструментом DMPonline: 

Петруновська С. В. Рекомендації щодо укладання плану управління дослідницькими даними. Інструкція користувача DMPonline [Електронний ресурс] : [препринт] / Світлана Петруновська ; НТБ ім. Г.І. Денисенка НТУУ «Київський політехнічний інститут імені Ігоря Сікорського». – Електронні текстові дані (1 файл: 868,61 Кбайт). – Київ : НТБ КПІ ім. Ігоря Сікорського, 2024. – 29 с. – Назва з екрана. –  URI: https://ela.kpi.ua/handle/123456789/6985


Політики видавців щодо даних та вимоги грантонадавачів

Управління даними забезпечує цінність даних. Коли дослідницький проєкт завершено, дані можуть використовуватися для отримання відповідей на додаткові запитання, що не розглядалися на початку проєкту. Також науковець може захотіти з часом продовжити дослідження, щоб порівняти результати. Але це буде дуже складно зробити, або навіть неможливо, якщо не було забезпечено ефективне управління даними; дані можуть бути розпорошені чи взагалі втрачені.

Сьогодні дедалі більше організацій, які фінансують дослідницькі проєкти, видавців наукових видань, дослідницьких установ вимагають управління даними. Ці установи вимагають більшої прозорості в дослідницьких проєктах, і керування даними є одним зі способів виконати цю вимогу. Грантодавці хочуть таким чином збільшити рентабельність своїх інвестицій, гарантуючи, що дані, отримані під час проєкту, доступні для вторинного аналізу, реплікації (копіювання) або повторного використання для подальших інновацій.

Різні  спонсори  та  видавці можуть мати різні вимоги до DMP.
Ознайомтесь, наприклад, з вимогами Європейської комісії щодо управління дослідницькими даними та зразком плану управління даними: https://ec.europa.eu/research/participants/docs/h2020-funding-guide/cross-cutting-issues/open-access-data-management/data-management_en.htm
Якщо ваш спонсор або видавець вимагає DMP, ви повинні знати їхні вимоги та дотримуватися їх відповідно. 

Видавці

Грантонадавачі

Безплатні онлайн-інструменти DMP також містять покрокові інструкції для створення DMP

відповідно до вимог основних американських та європейських спонсорів.

Рекомендації щодо планування

 Ось правила підготовки Плану УДД:

  • План УДД найкраще готувати на початку вашого дослідницького проєкту, його можна переглядати та вдосконалювати. Однак ніколи не пізно почати його на середині дослідницького процесу — краще пізно, ніж ніколи.
  • План має бути практичним та простим, має відображати ефективні практики керування даними.
  • Можна скористатися онлайн-інструментами для створення Плану.
  • Бажано вказати способи реалізації Політики відкритої науки.
  • Слід регулярно переглядати свій План та оновлювати, вдосконалювати його відповідно до фактичних потреб у міру просування проєкту.
  • Враховуйте обмеження щодо довжини Плану від грантонадавача. Ви можете використовувати шаблон грантонадавача як базовий, розширюючи інші області додатковою інформацією для ознайомлення вашої команди.
  • План УДД можна покращити завдяки співпраці, цінним коментарям від колег чи рецензента.

Що планувати?

На початковому етапі життєвого циклу дослідження, тобто на етапі відкриття та планування, дослідникам потрібно визначити, який тип і формат даних вони збираються збирати. Це може бути збір нових даних, або об’єднання наявних наборів даних або просто аналіз наявних даних.

Якщо в проєкті беруть участь люди, дослідники повинні враховувати конфіденційність та інші етичні питання. Крім того, дослідники повинні розглянути, які типи документації вони створюватимуть, і стандарти метаданих, які вони використовуватимуть для опису своїх даних. Крім того, дослідникам потрібно буде визначити потенційних вторинних користувачів даних проєкту.
  • Хто використовуватиме ці дані?
  • Для чого вони можуть це використовувати?
  • Чи будуть дані, позбавлені будь-якої потенційно ідентифікаційної інформації, корисними для повторного використання?
  • Які обмеження доступу будуть накладені на дані?
На всі ці питання дослідники повинні відповісти ще до початку проєкту.

А також визначення відповідного сховища даних для архівування своїх даних. Не всі дані, що створюються під час дослідження, потребують поширення. Дані можуть бути як відкритого, так і закритого чи обмеженого доступу. На етапі планування це потрібно врахувати заздалегідь.

Нарешті, на цьому етапі дослідникам важливо визначити можливі витрати, пов’язані з керуванням даними. Це включатиме документування даних, їх форматування, зберігання, очищення та анонімізацію та, нарешті, архівування.

Переваги Плану УДД

Хоча План УДД може бути не обов’язковим, він може бути цінним інструментом, який допоможе вам у наступних випадках:

  • План управління дослідницькими даними може слугувати документом, який допоможе вам у плануванні та прийнятті рішень щодо управління дослідницькими даними.

  • План УДД допомагає забезпечити узгоджену практику обробки даних усіма учасниками проєкту.

План УДД дозволяє вам планувати на початкових етапах вашого проєкту формат даних, організацію файлів, зберігання та обмін даними, що полегшує обмін даними з вашими колегами та іншими потенційними користувачами в майбутньому.

План управління дослідницькими даними

Наявність Плану УДД для дослідницького проєкту допомагає підготувати дані до відкритого доступу. План управління дослідницькими даними, (План УДД, англ. Data Management Plan, DMP) – це офіційний письмовий документ,  що описує, як дослідник буде збирати, керувати, описувати, зберігати та поширювати свої дослідницькі дані.  Зазвичай План також повинен описувати будь-які потенційні правові чи етичні проблеми, які потребують вирішення. Він створюється на етапі подання пропозиції  та  оновлюється протягом усього дослідницького проєкту.

Все більша кількість  фінансових установ  вимагає від дослідників підготовки Плану управління дослідницькими даними  для подання разом із дослідницькою пропозицією. Це гарантує, що цінні дані, зібрані в рамках фінансованих проєктів, можуть бути повторно використані іншими дослідницькими групами, таким чином максимізуючи віддачу від інвестицій у фінансовані проєкти. 

Оскільки статті з відповідними даними, що знаходяться у відкритому доступі, зазвичай отримують більше цитувань, багато видавців журналів  вимагають від дослідників розміщувати підтверджувальні  дані статей у відкритому репозитарії, щоб підвищити їхню видимість та вплив. 

Петруновська С. В. Рекомендації щодо укладання плану управління дослідницькими даними. Інструкція користувача DMPonline [Електронний ресурс] : [препринт] / Світлана Петруновська ; НТБ ім. Г.І. Денисенка НТУУ «Київський політехнічний інститут імені Ігоря Сікорського». – Електронні текстові дані (1 файл: 868,61 Кбайт). – Київ : НТБ КПІ ім. Ігоря Сікорського, 2024. – 29 с. – Назва з екрана. -- URI: https://ela.kpi.ua/handle/123456789/69858

Юридичні тонкощі планування роботи з даними

Планування роботи з даними (див. План УДД) залежить насамперед від того, чи будуть згенеровані нові дані під час проєкту, чи будуть використані вторинні дані. 

Наприклад,

1) Дані, отримані з загальнодоступних джерел, наприклад, Державної служби статистики України, – відкриті дані.

2) Дані, отримані з комерційних джерел, доступних за контрактом, потребують розв'язання правових питань, пов’язаних з авторським правом.

3) Якщо зовнішня агенція набирає респондентів і надає результати дослідження, то треба погодити придбання, правила співпраці мають бути сформульовані в договорі з агентством, а результати ви отримуєте в анонімній формі.

4) Якщо команда самостійно проводить інтерв’ю та опитування, необхідно подбати про отримання інформованих згод, анонімізацію та захист даних тощо.