Показ дописів із міткою документація даних. Показати всі дописи
Показ дописів із міткою документація даних. Показати всі дописи

2026/05/28

Робота над помилками: Чому Плани УДД в КПІ повертають на доопрацювання?

План управління дослідницькими даними (УДД або DMP) — це вже не просто формальність для галочки, а обов'язкова умова сучасних грантових проєктів, зокрема в рамках Horizon Europe. Проте аналіз свіжих планів, що надходять на перевірку до Науково-технічної бібліотеки КПІ у 2026 році, показує: автори часто сприймають цей документ як анкету, а не як реальний управлінський інструмент.

Результат? Загальні декларації замість конкретики та закономірне повернення документа на доопрацювання.

Ми зібрали та систематизували найпоширеніші помилки дослідників — від критичних пропусків до глибинних системних прорахунків. Перевірте свій план перед подачею!

🔴 Топ-3 критичних помилок (є майже у всіх планах)

  1. Відсутній або «іграшковий» розділ «Забезпечення якості» (QA) Жоден із розглянутих планів не містив повноцінного QA-розділу. Дослідники забувають описати версіонування файлів, перевірку цілісності даних (наприклад, через контрольні суми) та правила збереження незмінної головної копії (master copy) окремо від щоденних робочих матеріалів.

  2. Архівування плутають із поточним зберіганням Поточна робота з файлами в хмарі та довгострокове архівування — це різні процеси. Типова помилка — не вказувати конкретний науковий репозитарій з DOI на початку (як-от Zenodo, що вимагається п.6.3 Положення КПІ).

  3. «Обмін даними» без конкретики У планах катастрофічно бракує деталей: як саме отримуватиметься DOI, які точні терміни публікації даних після завершення ембарго, і чому ліцензія CC BY 4.0 не прив’язана безпосередньо до умов обміну.

🟡 Важливі деталі, про які забувають

  • Пропрієтарні формати без виправдання: Повсюдне використання XLSX та DOCX. Натомість Положення (п.4.2) вимагає відкритих форматів (.csv, .odt, .txt) або чіткого обґрунтування, чому залишено закритий формат, із описом відкритої альтернативи.

  • Де ліцензія? Ліцензія CC BY 4.0 для самих даних і CC0 для метаданих мають фігурувати у розділі про обмін даними. Натомість посилання на них або відсутнє, або з'являється аж наприкінці — в архівуванні.

  • Анонімні ролі: Розподіл обов'язків є, але без конкретних імен, матриці задач за етапами проєкту та без дати першого обов'язкового перегляду плану (а його треба переглядати щопівроку!).

🔵 Системні прогалини (паспортна частина та метадані)

  • Адміністративний вакуум: Дослідники забувають вказати номер теми/договору, версію самого DMP, джерело фінансування та контакти особи, відповідальної за запити щодо даних.

  • Винахід велосипеда: Шаблон вимагає зафіксувати, чи перевіряв автор наявність вже існуючих схожих наборів даних (у Re3data, Zenodo тощо) для їх повторного використання. Цей пункт зазвичай просто ігнорують.

  • Загальний Dublin Core: Стандарти метаданих або не згадуються взагалі, або копіюється загальна фраза «Dublin Core» без жодної прив'язки до конкретних полів.

🧠 4 типи мислення, які псують ваш DMP

Ці помилки виникають не через некомпетентність. Це наслідок неправильного сприйняття документу. Зазвичай автори потрапляють в одну з чотирьох пасток:

Тип 1. Декларативність без механізму

Симптом: Писати що буде зроблено, але не писати як.

  • Приклад: Вказати стандарт EngMeta, але без URI/версії. Згадати DataCite, але не написати, хто, коли і через який інтерфейс заповнює метадані. Згадати Nextcloud, але не уточнити, чиї це сервери.

  • Причина: Сприйняття DMP як форми для відписки, а не як інструкції для команди.

Тип 2. Ігнорування масштабу

Симптом: Технічні параметри проєкту суперечать обраним інструментам.

  • Приклад: Вказати загальний обсяг даних у 500 ГБ – 1 ТБ і обрати основним репозитарієм Zenodo, де безкоштовний ліміт становить 50 ГБ на датасет, і не пояснити, як дані будуть секціонуватися.

  • Причина: DMP заповнюється ізольовано від реального технічного планування та розрахунку бюджету.

Тип 3. Відсутність інституційного контексту

Симптом: Документ пишеться так, наче дослідник перебуває у вакуумі.

  • Приклад: Роль Data Steward прописана як абстрактна «відповідальна особа» без ПІБ та посади. Бібліотека КПІ (яка є офіційним RDM-центром університету - див. Положення про УДД) взагалі не згадується, а її послуги не включені як безпосередній нефінансовий внесок (non-financial contribution) у проєкт.

  • Причина: Брак інформованості про те, що в університеті вже є готова RDM-інфраструктура підтримки.

Тип 4. Плутання «подати DMP» з «вести DMP»

Симптом: Переконання, що план пишеться один раз на початку проєкту.

  • Приклад: Відсутність графіка планових оновлень (наприклад, на місяцях M6, M18, M30 для тривалих проєктів), повне ігнорування спеціалізованих платформ (DMPonline або ARGOS) та відсутність умов для позапланового апдейту (зміна складу партнерів, форс-мажори, нові умови ембарго).

  • Причина: Освітня прогалина щодо концепції Living DMP (живого документа), яка є базовою для Horizon Europe.

💡 Висновок для авторів та експертів: Найслабші місця планів — це точки конкретних зобов'язань: назва репозитарію, чітка ліцензія, терміни, імена. Фрази типу «дані будуть доступні» або «проєкт відповідає принципам FAIR» без операційного підтвердження більше не приймаються.

Як вирішити цю проблему системно?

В університеті розроблено деталізований університетський шаблон (див. додатки до Положення про УДД), рекомендації з інструктивними підказками для кожного поля. Це допоможе авторам проходити валідацію з першого разу.

У разі виникнення питань щодо ліцензування метаданих (CC0), вибору відкритих форматів чи інтеграції інфраструктури бібліотеки у ваш грант — звертайтеся за консультацією до Бібліотеки  КПІ ім. Ігоря Сікорського!

2026/04/09

Положення про УДД

Управління дослідницькими даними (УДД) є важливою частиною будь-якого дослідницького проєкту  та включає збір, обробку та аналіз, збереження, обмін, довгострокове зберігання даних досліджень.

Вперше в Україні — Положення про управління дослідницькими даними в Національному технічному університеті України «Київський політехнічний інститут імені Ігоря Сікорського» (2026).

Положення про УДД включає розділи:

  1. ЗАГАЛЬНІ ПОЛОЖЕННЯ  
  2. ТЕРМІНИ ТА ВИЗНАЧЕННЯ  
  3. ПЛАНУВАННЯ УПРАВЛІННЯ ДОСЛІДНИЦЬКИМИ ДАНИМИ  
  4. ЗАБЕЗПЕЧЕННЯ ДОСТУПУ ДО ДАНИХ ПІД ЧАС ДОСЛІДЖЕННЯ  
  5. ОРГАНІЗАЦІЯ ФАЙЛІВ ТА ДОКУМЕНТУВАННЯ ДОСЛІДНИЦЬКИХ ДАНИХ  
  6. ДОВГОСТРОКОВЕ ЗБЕРІГАННЯ ТА ПОШИРЕННЯ ДАНИХ  
  7. ТЕРМІН ЗБЕРІГАННЯ ДОСЛІДНИЦЬКИХ ДАНИХ  
  8. ВІДПОВІДАЛЬНІСТЬ УЧАСНИКІВ ПРОЦЕСУ УДД


Додаток 1.  ПЛАН УПРАВЛІННЯ ДОСЛІДНИЦЬКИМИ ДАНИМИ: Шаблон для науково-дослідної роботи

Додаток 2. ПЛАН УПРАВЛІННЯ ДОСЛІДНИЦЬКИМИ ДАНИМИ: Шаблон для дисертаційного дослідження

2026/02/06

Різні схеми для різних папок

 Коли у вас накопичується багато файлів, важливо не просто давати їм імена, а обрати схему (правило), за яким ці імена будуть будуватися. Це як граматика в мові: якщо всі дотримуються одного порядку слів, усі розуміють одне одного.

Ось як це працює простими словами:

1. Оберіть «головного героя» вашої папки

Схема залежить від того, за чим ви зазвичай шукаєте файли. Крім того, враховуйте сортування файлів комп'ютером: він читає назву зліва направо, символ за символом, і розставляє файли в алфавітному або числовому порядку.

Отже, щоб полегшити собі життя, використовуйте просте правило: ставте на перше місце те, за чим ви зазвичай шукаєте цей файл.Ви можете використовувати різні схеми для різних типів робіт:

  • Якщо головне — час: Ставте дату на початок. Так файли автоматично вишикуються в календарик.

    • Приклад: 2026-02-06_Порядок_денний.doc

  • Якщо головне — подія чи тема: Починайте з назви.

    • Приклад: Список_донорів_2026-02-06.pdf

  • Якщо ви працюєте з людьми: Починайте з прізвища.

    • Приклад: Шевченко_Тарас_2026-02-06_Анкета.docx

2. Використовуйте принцип «Конструктора»

Уявіть, що ім’я файлу — це поїзд із вагончиків. Порядок вагончиків має бути завжди однаковим. Наприклад, ви домовляєтеся з командою про схему: [Дата][Проєкт][Місто]_[Подія].

Тоді ваші файли будуть виглядати як близнюки:

  • 20251208_ПроєктА_Мадрид_старт.pdf

  • 20260219_ПроєктБ_Туніс_зустріч.jpg

3. Чітко визначте межі (Угода)

Ви не зобов'язані називати взагалі всі файли на комп'ютері за однією складною схемою. Ви можете встановити правило (угоду) тільки для конкретної групи.

Приклад угоди: «Це правило іменування стосується виключно всіх знімків з мікроскопа: від сирого кадру до обробленого результату».

Чому це зручно?

  1. Порядок за замовчуванням: Файли самі сортуються так, як вам зручно.

  2. Легкий пошук: Ви знаєте, що шукати «Мадрид» треба в середині назви, а дату — на початку.

  3. Ніякої плутанини: Навіть якщо ви передасте папку колезі, він одразу зрозуміє логіку вашого архіву.

2026/02/05

Іменування: приклади

Угода про іменування Единбургського університету - загальний набір правил, що застосовуються до іменування електронних записів Угода про імена файлів включає 13 правил. За посиланням ви знайдете приклади та пояснення до правил.

Массачуссетський  технологічний університет : Організація ваших файлів  https://libraries.mit.edu/data-management/store/organize/

Організація файлів Архів даних Великобританії 

Рекомендації щодо іменування файлів Національний архів США 

Briney, Kristin A. (2020) File Naming Convention Worksheet. 

[Teaching Resource] (Unpublished)

https://resolver.caltech.edu/CaltechAUTHORS:20200601-161923247


Практика університетів:

https://osf.io/dpu45

https://guides.library.illinois.edu/introdata/filenames

https://libguides.brown.edu/DataManagement/naming 

https://www.bu.edu/data/manage/naming-convention/

https://guides.lib.umich.edu/c.php?g=739306&p=5286418

https://guides.lib.purdue.edu/c.php?g=353013&p=2378293

https://libraries.mit.edu/data-management/store/organize/

https://guides.library.cmu.edu/researchdatamanagement/filenaming

https://authors.library.caltech.edu/103626/1/FileNamingConventionWorksheet_Caltech.pdf

https://huridocs.org/resource-library/organising-a-collection-of-human-rights-information/file-naming-conventions/



Вторинні дані

Вторинні дані — це дані, зібрані для однієї цілі, які надаються для використання іншими особами для іншої цілі.

Чому вторинні дані — це круто?

Головна причина — масштаб. Як окремий дослідник або студент, ви навряд чи зможете опитати 50 000 людей у 10 країнах. У вас просто не вистачить грошей та часу. А великі організації (державні служби статистики, міжнародні фонди) мають для цього колосальні ресурси.

  • Вища якість: Дані від великих інституцій часто набагато точніші та професійніші, ніж ті, що ви зберете "на колінці".

  • Швидкість: Ви можете завантажити величезний масив інформації з інтернету за лічені хвилини, замість того, щоб збирати його місяцями.

У чому "пастка"? (Два головні мінуси)

1. "Це майже те, що мені треба"

Оскільки дані збирав хтось інший, вони навряд чи ідеально підходять під ваше запитання.

  • Ризик: Виникає велика спокуса "підтягнути за вуха" чужі цифри до своєї теорії. Ви починаєте вдавати, що ці дані вимірюють саме те, що вам потрібно, хоча насправді це не зовсім так. Ви не контролювали процес збору, тому маєте те, що маємо.

2. Довга "інструкція"

Хоча самі дані ви отримуєте миттєво, підготовка до роботи з ними займає купу часу.

  • Проблема: Ви не можете просто відкрити файл і почати рахувати. Вам потрібно "проковтнути" гігантські обсяги документації.

  • Ви повинні розібратися: як саме обирали людей для опитування? Які були фонові умови? Що означає кожен код у таблиці? Без цього розуміння ваші висновки будуть помилковими.

Отже, вторинні дані — це потужний інструмент, який дає вам доступ до ресурсів рівня цілих міністерств. Але це вимагає від вас чесності (чи дійсно ці дані підходять для моєї теми?) та терпіння (вивчити всі описи та методології, які йдуть у комплекті).

Супровідна інформація

Самі по собі цифри — це "німі" свідки. Щоб вони заговорили і щоб їм можна було вірити, навколо них має бути побудована ціла екосистема супровідної інформації.

Уявіть, що ви знайшли на вулиці флешку з таблицею чисел. Без назв колонок, без дати, без опису — ці дані для вас не мають жодної цінності. Вони стають значущими лише тоді, коли ви знаєте контекст.

Ось як розподіляються ці "супутники" даних за функціями:

1. Інструкція до розуміння (Метадані та документація)

Це продукти, які пояснюють структуру ваших даних. Без них первинні дані — це просто набір символів.
  • Анкети: Пояснюють, які саме запитання ставили людям (адже формулювання питання на 90% визначає відповідь).
  • Книги кодів (Codebooks): Словник, який розшифровує позначення. Наприклад, що в колонці "Стать" цифра 1 — це жіноча, а 2 — чоловіча.
  • Описи методологій: Технічний паспорт дослідження. Хто, де, коли і яким приладом робив заміри.
2. Фонові дані (Contextual/Background Data)

Як зазначають Волліс, Роландо та Боргман, дані переднього плану (те, що ви безпосередньо вивчаєте) не існують у вакуумі.

Чому це важливо: Якщо ви досліджуєте точність роботи лазера, то вологість повітря в лабораторії — це "фонова" інформація. Вона не є предметом дослідження, але вона може пояснити, чому лазер раптом почав "хибити".

Критичність: Без фонових даних ми часто отримуємо хибні висновки, плутаючи випадкову зовнішню перешкоду з науковим відкриттям.

3. Продукти дослідження, вихідні продукти (Output Products)

Це те, у що перетворюються дані після того, як їх "перетравив" мозок науковця. Вони необхідні для вторинного аналізу (коли інші вчені хочуть перевірити ваші висновки) та комунікації.
  • Науковий рівень: Статті, доповіді, офіційні документи (White papers). Це "стисла витяжка" сенсів із тисяч сторінок сирих даних.
  • Публічний рівень: Постери, сайти, блоги. Це спосіб донести складні дані до суспільства зрозумілою мовою.
Це важливо для подолання "кризи відтворюваності", оскільки значну частину досліджень неможливо відтворити саме тому, що вчені публікують лише статтю, але забувають додати:
  • Фонові дані (що відбувалося навколо).
  • Книги кодів (як рахували).
  • Методологію (детальний "рецепт" приготування результату).
Отже, для захисту та зберігання даних ви повинні ставитися до анкети чи опису методології так само дбайливо, як і до самих цифр. Якщо зникне "словник" (кодбук), сама "книга" (дані) стане нечитабельною.

2026/01/26

Інформована згода

Перегляньте поради UK Data Service щодо формування згоди на поширення даних. Як правило, документація згоди включає інформаційний лист і форму згоди, яка підписується учасником.

Інформаційний лист повинен охоплювати такі теми:
  • Мета дослідження;
  • Хто саме бере участь;
  • Переваги та ризики участі;
  • Процедури вилучення;
  • Використання даних під час дослідження, поширення, зберігання, публікації та архівування;
  • Деталі дослідження: джерело фінансування, організація-спонсор, назва проєкту, контактні дані дослідників, як подати скаргу.
Форма згоди має бути написана простою мовою, має кілька пунктів:
  • Учасник прочитав і зрозумів інформацію про проєкт;
  • Учасникам надається можливість поставити запитання;
  • Учасник добровільно погоджується на участь у проєкті;
  • Учасник відмовиться, що може відмовитися в будь-який час без пояснення причин і без штрафних санкцій;
  • Як буде захищена конфіденційність, наприклад, чи будуть використовуватися справжні імена або псевдоніми (з дозволом), як дані будуть анонімізованими тощо.
  • Яка інформація буде використана в публікаціях, наприклад цитати;
  • Окремі умови згоди на передачу даних, які містять інформацію, наприклад текст, аудіозаписи, відео чи зображення;
  • Підписи та дати підпису для учасника та дослідника.
Якщо ви отримали інформовану згоду, ви можете поділитися своїми даними в сховищах із обмеженим доступом.

Інструменти УДД

 Open Science Framework

  • керуйте дослідницькими даними та проєктами, діліться роботою з колегами та реєструйте дослідження на цій хмарній платформі

Protocols.io

  • документуйте та діліться покроковими методами та протоколами

LabArchives

  • надійно записуйте та діліться нотатками та даними з досліджень у електронному блокноті для досліджень

2026/01/25

Угода про іменування файлів

File Naming Convention, FNC

«Імена файлів» — це імена, які перераховані в каталозі файлів і присвоєні новим файлам при їх першому збереженні. Угода про іменування файлів (File Naming Convention, FNC) — це система іменування файлів у спосіб, який описує, що вони містять і як вони пов’язані з іншими файлами. File Naming Convention, FNC, включає: принципи для імен файлів, логічну структуру каталогів, правила іменування та шаблони іменування файлів.

Принципи для імен файлів
  • Машиночитаність
  • Людиночитаність
  • Системно сортуються
Приклад правил
  • Перевірте, чи встановлені правила іменування файлів у вашій дисципліні чи групі. Правила іменування мають бути задокументовані, щоб інші працівники вашої лабораторії чи відділу могли дотримуватися цього стандарту. 

  • Імена файлів мають бути описовими та надавати достатньо контекстної інформації. 

  • Використовуйте заголовні букви для розділення слів, а не пробіли або символи підкреслення

  • Намагайтеся не робити імена файлів занадто довгими. Операційні системи мають різні обмеження на кількість символів. Як правило, намагайтеся мати ліміт 40-50 символів. 

  • Розмістіть найважливішу інформацію спочатку. Комп’ютер упорядковує файли за назвою, символ за символом. При включенні особистого імені в ім'я файлу спочатку вкажіть прізвище, а потім ініціали.

  • Якщо ви плануєте знайти файл за датою, спочатку вставте дату. Для дати використовуйте стандарт ISO 8601 (YYYYMMDD). Щоб додати мітку часу до імені файлу, використовуйте формат YYYYMMDDThhmm. Використовуйте 24-годинний час, щоб уникнути будь-якої плутанини щодо ранку/полудня. 

  • Номер версії запису повинен бути вказаний в імені файлу шляхом включення «V», номеру версії і, де це доречно, «Чернетка». Під час використання системи послідовної нумерації, використовуйте початкові нулі, щоб переконатися, що файли сортуються в послідовному порядку, наприклад: 001, 002, ...010, 011 ... 100, 101 ... Позначте фінальну версію.

  • Використовуйте керування версіями, щоб вказати найновішу версію файлу. Приклад: filename_v2.xxx 

  • Уникайте спеціальних символів, таких як: ~ ! @ # $ % ^ & * ( ) ` ; : < > ? . , [ ] { } ' " | 

  • Не використовуйте пробіли, оскільки деяке програмне забезпечення не розпізнає назви файлів із пробілами. Інші варіанти включають підкреслення, тире, без розділення або регістр (перша літера кожної частини тексту велика).


 Приклади шаблонів іменування:

20220104_ProjectA_Ex1Test1_SmithE_v01.xlsx

20220104_ProjectA_MeetingNotes_SmithE_v02.docx



Checklist-File-Names-Form чеклист від Гарварда (див. Контрольний список угоди про імена файлів)

2026/01/23

Електронний лабораторний зошит

Лабораторний журнал документує вхідні дані, умови, робочі процеси та іншу інформацію під час проведення експерименту. Він фіксує походження даних, і таким чином покращує прозорість дослідницького процесу, а також підвищує правдивість результатів дослідження.

Багато дослідників зараз використовують  електронний лабораторний  зошит (ELN) https://en.wikipedia.org/wiki/List_of_electronic_laboratory_notebook_software_packages для заміни традиційних паперових лабораторних зошитів, оскільки він:

  • Спрощує управління даними: ELN дозволяє зберігати інформацію в централізованому місці, що допомагає оптимізувати процес управління даними.

  • Дозволяє проводити аудиторські випробування та забезпечує контрольований доступ: ELN надає організовану та контрольовану систему, яка сприяє проведенню аудитів та перевірок. Усі процеси редагування будуть реєструватися та мати позначку часу.

  • Дозволяє пошук: ELN оцифровує весь процес дослідження, що полегшує відстеження попередніх експериментів.

  • Забезпечує довгостроковий доступ: резервну копію ELN можна створити на сервері або в хмарі, що гарантує доступність у майбутньому.

  • Покращує співпрацю: Обмін науковими даними, що зберігаються в ELN, між співробітниками набагато простіший порівняно з паперовими блокнотами.

Кодова книга

Кодова книга надає інформацію про дані з інструменту опитування. Вона описує вміст, структуру та макет файлу даних, коди відповідей, що використовуються для запису відповідей на опитування, та іншу інформацію.

Нижче наведено приклад з  Посібника з кодових книг ICPSR http://www.icpsr.umich.edu/files/deposit/Guide-to-Codebooks_v1.pdf

Рекомендуємо вам ознайомитися з посібником ICPSR для отримання додаткової інформації.


Словник даних

Словник даних – це файл, який містить змістовні описи для кожної змінної та значення вашого набору даних. Нижче наведено приклад з Open Science Framework (OSF). Дізнайтеся більше з розділу про те,  як створити словник даних.


Файл Readme

Файл Readme містить інформацію про файл даних. Він допомагає іншим дослідникам та вам самим зрозуміти та повторно використовувати дані в майбутньому. Типовий файл Readme зазвичай зберігається у звичайному текстовому файлі, а не у власних форматах (наприклад, MS Word) для довгострокового доступу.

Нижче наведено деякі загальні аспекти ваших даних, які ви повинні задокументувати, незалежно від вашої дисципліни. 

Загальний огляд

  • Назва: назва набору даних або дослідницького проєкту, який його створив.

  • Творець: назви та адреси організацій або людей, які створили дані; бажаний формат для особистих імен – прізвище спочатку (наприклад Сміт, Джейн).

  • Ідентифікатор: унікальний номер, який використовується для ідентифікації даних, навіть якщо це лише внутрішній номер проєкту.

  • Дата: ключові дати, пов’язані з даними, зокрема: дата початку та завершення проєкту; дата випуску; період часу, охоплений даними; та інші дати, пов’язані зі строком служби даних, такі як цикл обслуговування, графік оновлення; бажаний формат РРРР-ММ-ДД або РРРР.ММ.ДД-РРРР.ММ.ДД для діапазону.

  • Метод: як були згенеровані дані, перелік використовуваного обладнання та програмного забезпечення (включаючи номери моделі та версії), формули, алгоритми, експериментальні протоколи та інша  інформація, яку можна включити в лабораторний блокнот.

  • Обробка: як дані були змінені чи оброблені (наприклад нормалізовані).

  • Джерело: посилання на дані, отримані з інших джерел, у тому числі відомості про те, де зберігаються вихідні дані та як до них здійснюється  доступ.

  • Фінансувальник: організації чи установи, які фінансували дослідження.


Опис вмісту

  • Тема: ключові слова або фрази, що описують тему чи зміст даних.

  • Місце: усі відповідні фізичні місця.

  • Мова: усі мови, які використовуються в наборі даних.

  • Список змінних: усі змінні у файлах даних, де це можливо.

  • Список кодів: пояснення кодів або скорочень, які використовуються або в назвах файлів, або в змінних у файлах даних (наприклад «999 вказує на відсутнє значення в даних»).

Технічний опис

  • Інвентаризація файлів: усі файли, пов’язані з проєктом, включаючи розширення (наприклад NWPalaceTR.WRL, stone.mov).

  • Формати файлів: формати даних, наприклад FITS, SPSS, HTML, JPEG тощо.

  • Структура файлу: організація файлу(ів) даних і розташування змінних, де це можливо.

  • Версія: унікальна позначка дати/часу та ідентифікатор для кожної версії.

  • Контрольна сума: значення, обчислене для кожного файлу, яке можна використовувати для виявлення змін.

  • Необхідне програмне забезпечення: назви будь-яких програмних пакетів спеціального призначення, необхідних для створення, перегляду, аналізу або іншого використання даних.

Доступ

  • Права: будь-які відомі права інтелектуальної власності, законні права, ліцензії або обмеження на використання даних.

  • Інформація про доступ: де та як інші дослідники можуть отримати доступ до ваших даних.

  • Інформація про походження похідних чи оцифрованих даних.


Writing READMEs for Research Data

https://data.research.cornell.edu/data-management/sharing/readme/

AUTHOR_DATASET_ReadmeTemplate.txt https://cornell.app.box.com/v/ReadmeTemplate