Показ дописів із міткою Readme. Показати всі дописи
Показ дописів із міткою Readme. Показати всі дописи

2026/02/05

Методика розробки угоди про іменування даних

  1. Створіть просте «коротке керівництво», в якому детально описані угоди про імена та організацію файлів. Включіть цю документацію до файлу readme.txt в основній спільній папці  (зразок пунктів на слайді)

  • Створіть свій інвентар файлів, бажано згадати ВСІ файли, проєкт та підпроєкти.

  • Колонка A: різні типи даних Ви використовуєте/створюєте? (наприклад, зображення під мікроскопом, польові спостереження в табличній формі, стенограми, інтерв’ю, цифри, протоколи тощо)

  • Колонка B: які формати файлів? (наприклад, .csv, .jpg)

  • Колонка C: Які є унікальні характеристики цього файлу даних (наприклад, дата створення, назва проєкту, експериментальні умови)? Чи існують стандартні скорочення для будь-якої з цих характеристик? 

  • Колонка D: Чи будете ви мати кілька версій того самого файлу? Якщо так, чи буде кілька версій у даний день? Скільки?

  • Стовпець E: схема імені. Напишіть свої імена файлів. Що потрібно включити: унікальні характеристики, які ви визначили в колонці C, можна використати, щоб створити ім'я файлу. Виберіть характеристики, які, на вашу думку, ви будете використовувати для пошуку цих файлів.

  • Якщо хочете мати декілька версій файлу (вказано у стовпці D), обов’язково додайте версію в назву вашого файлу. Якщо ви очікуєте мати більше однієї версії на день, не можна покладатися лише на дату, і слід додати номер версії до імені файлу.  Наприклад, MMDDYYYY_exp001_v01.tft).

2) Переконайтеся, що всі члени команди або співробітники мають доступ до керівництва та навчаються правилам.

3) Крім текстових файлів, ви також можете розглянути можливість проведення короткого внутрішнього навчання, щоб пояснити, чому нову угоду про іменування файлів так важливо використовувати і як вона працює, або створити відео, в якому розглядаються ключові моменти угоди.


2026/01/29

Як заповнити метадані DataCite для підвищення цитованості даних?

Правильні метадані — це не просто «технічний опис», а спосіб зробити ваші дані видимими для пошукових систем (Google Dataset Search, OpenAIRE) та зручними для цитування іншими вченими.

1. Обов'язкові поля (Mandatory Properties)

Без них ви не зможете отримати DOI. Заповнюйте їх максимально повно:

  • Identifier (DOI): Генерується автоматично системою репозитарію.

  • Creator (Автор): Вказуйте ПІБ повністю. Важливо: обов’язково додавайте свій ORCID (наприклад, 0000-0002-1234-5678). Це гарантує, що цитування автоматично підтягнеться до вашого профілю.

  • Title (Назва): Має бути інформативною. Замість "Дані експерименту", пишіть "Результати вимірювання електропровідності графену при температурах 100-300К".

  • Publisher (Видавець): Зазвичай це назва репозитарію [Автор(и). (Рік). Назва набору даних [Data set]. Zenodo. DOI: 10.5281/zenodo.XXXXXXX]. КПІ ім. Ігоря Сікорського буде вказаний як установа (Affiliation) автора. Зверніть увагу: навіть якщо дані публікуються як додаток до статті у журналі (наприклад, Elsevier чи Springer), то видавцем самої статті буде журнал, але видавцем набору даних усе одно залишиться Zenodo.

  • Publication Year (Рік): Рік оприлюднення даних.

  • Resource Type (Тип ресурсу): Завжди обирайте Dataset (Набір даних).

2. Поля, що підвищують «видимість» (Recommended Properties)

Саме ці поля відповідають за те, чи знайдуть ваші дані колеги:

2026/01/23

Файл Readme

Файл Readme містить інформацію про файл даних. Він допомагає іншим дослідникам та вам самим зрозуміти та повторно використовувати дані в майбутньому. Типовий файл Readme зазвичай зберігається у звичайному текстовому файлі, а не у власних форматах (наприклад, MS Word) для довгострокового доступу.

Нижче наведено деякі загальні аспекти ваших даних, які ви повинні задокументувати, незалежно від вашої дисципліни. 

Загальний огляд

  • Назва: назва набору даних або дослідницького проєкту, який його створив.

  • Творець: назви та адреси організацій або людей, які створили дані; бажаний формат для особистих імен – прізвище спочатку (наприклад Сміт, Джейн).

  • Ідентифікатор: унікальний номер, який використовується для ідентифікації даних, навіть якщо це лише внутрішній номер проєкту.

  • Дата: ключові дати, пов’язані з даними, зокрема: дата початку та завершення проєкту; дата випуску; період часу, охоплений даними; та інші дати, пов’язані зі строком служби даних, такі як цикл обслуговування, графік оновлення; бажаний формат РРРР-ММ-ДД або РРРР.ММ.ДД-РРРР.ММ.ДД для діапазону.

  • Метод: як були згенеровані дані, перелік використовуваного обладнання та програмного забезпечення (включаючи номери моделі та версії), формули, алгоритми, експериментальні протоколи та інша  інформація, яку можна включити в лабораторний блокнот.

  • Обробка: як дані були змінені чи оброблені (наприклад нормалізовані).

  • Джерело: посилання на дані, отримані з інших джерел, у тому числі відомості про те, де зберігаються вихідні дані та як до них здійснюється  доступ.

  • Фінансувальник: організації чи установи, які фінансували дослідження.


Опис вмісту

  • Тема: ключові слова або фрази, що описують тему чи зміст даних.

  • Місце: усі відповідні фізичні місця.

  • Мова: усі мови, які використовуються в наборі даних.

  • Список змінних: усі змінні у файлах даних, де це можливо.

  • Список кодів: пояснення кодів або скорочень, які використовуються або в назвах файлів, або в змінних у файлах даних (наприклад «999 вказує на відсутнє значення в даних»).

Технічний опис

  • Інвентаризація файлів: усі файли, пов’язані з проєктом, включаючи розширення (наприклад NWPalaceTR.WRL, stone.mov).

  • Формати файлів: формати даних, наприклад FITS, SPSS, HTML, JPEG тощо.

  • Структура файлу: організація файлу(ів) даних і розташування змінних, де це можливо.

  • Версія: унікальна позначка дати/часу та ідентифікатор для кожної версії.

  • Контрольна сума: значення, обчислене для кожного файлу, яке можна використовувати для виявлення змін.

  • Необхідне програмне забезпечення: назви будь-яких програмних пакетів спеціального призначення, необхідних для створення, перегляду, аналізу або іншого використання даних.

Доступ

  • Права: будь-які відомі права інтелектуальної власності, законні права, ліцензії або обмеження на використання даних.

  • Інформація про доступ: де та як інші дослідники можуть отримати доступ до ваших даних.

  • Інформація про походження похідних чи оцифрованих даних.


Writing READMEs for Research Data

https://data.research.cornell.edu/data-management/sharing/readme/

AUTHOR_DATASET_ReadmeTemplate.txt https://cornell.app.box.com/v/ReadmeTemplate