2026/01/26

Правила керуванням версіями

Надання правильних версій вашим дослідницьким даним і файлам дозволить вам легко отримати певну версію. Це корисно, коли ви хочете переробити або отримати дані з певного етапу вашого проєкту.

Використовуйте послідовну систему нумерації

Додайте порядковий номер (v01, v02, v03) до назви файлу або до правила двокомпонентної нумерації (v1.00, v1.01, v2.00), щоб позначити основні та другорядні зміни за допомогою порядкового та десяткового номерів відповідно. Уникайте використання неоднозначних термінів, таких як редакція, остаточний, остаточний2. Причину дивіться тут http://phdcomics.com/comics/archive.php?comicid=1531.

Зберігайте лише версії етапів

Хоча ми не рекомендуємо видаляти будь-які версії під час вашого дослідження, ми рекомендуємо зберігати лише основні версії для довгострокового зберігання через вартість та час, необхідні для управління вашими файлами в довгостроковій перспективі.

Зберігайте оригінальні файли як доступні лише для читання

Зберігання версії необроблених даних лише для читання може запобігти будь-якій випадковій зміні ваших цінних даних.

Документуйте свої версії

Записуйте у таблицю контролю версій всі зміни, внесені щоразу, коли створюється нова версія. Це дозволить вам та вашим співробітникам виявляти відмінності між різними версіями, що дозволить знайти правильну версію в майбутньому.



Інструменти пакетного перейменування

https://drive.google.com/file/d/1T7FGXUA5FxGsvO9n9JkYcfAglt48i1nF/view?usp=drive_link


Щоб перейменувати файли, імпортовані з іншої системи, програмного забезпечення або пристрою, відповідно до ваших правил іменування файлів використовуйте:

Windows:

Mac:


Іменування файлів

https://xkcd.com/1459/


«Імена файлів» — це імена, які перераховані в каталозі файлів і які користувачі присвоюють новим файлам при їх першому збереженні.

Угода про іменування файлів (File Naming Convention, FNC) — це система іменування ваших файлів у спосіб, який описує, що вони містять і як вони пов’язані з іншими файлами.

Важливо створити FNC перед початком збору даних, щоб запобігти накопиченню невпорядкованих файлів, які можуть призвести до втрати даних.

Файли без угоди про імена:

Тестові дані 2016.xlsx

Замітки про зустріч 17 січня.doc

Примітка Петро.txt

Остаточний ФІНАЛ остання версія.docx

 

Файли з угодою про імена:

20160104_ProjectA_Ex1Test1_SmithE_v1.xlsx

20160104_ProjectA_MeetingNotes_SmithE_v2.docx

Відповідна назва файлу допоможе вам зрозуміти, яка інформація міститься в ньому. Це також скоротить час, витрачений на пошук файлу в майбутньому. Нижче ви можете знайти кілька корисних порад щодо найменування файлів.

Призначте описові назви

Назви файлів повинні відображати вміст файлів, включаючи такі елементи, як назва проєкту, дослідник, дата, місце знаходження, тип даних, версія, у послідовному порядку. Це допомагає переглядати вміст та логічно впорядковувати файли.

Використовуйте короткі, але змістовні назви

Більшість систем, програмного забезпечення та репозиторіїв мають обмеження на довжину імені файлу. Ви можете використовувати скорочення або кодувати елемент (наприклад, дослідник, тип даних тощо), щоб назви файлів були короткими, але інформативними.

Уникайте проміжків 

Деяке програмне забезпечення може не розпізнавати пробіли в іменах файлів. Ви можете використовувати альтернативні способи, такі як підкреслення (research_data), тире (research-data), без розділення (researchdata) або використання регістру літер (ResearchData).

Переконайтеся, що файли розташовані в хронологічному порядку

Використовуйте формат РРРРММДД (наприклад, 20260423 замість 23042026 або 04232026) для імен файлів, що містять елементи дати, та двозначні числа (наприклад, 01, 02, 03 замість 1, 2, 3) для імен файлів з послідовними номерами. Ці методи гарантують правильне сортування файлів.

Уникайте використання небуквенно-цифрових символів

Не використовуйте спеціальні символи, такі як @ ~ \ / < > | ? ! [ ] " * : ; = + & $ % в іменах файлів. Це може збільшити ймовірність помилки під час відкриття файлів в іншій програмі або операційній системі.

Задокументуйте правила іменування файлів 

Зберігання файлу з поясненням формату імені файлу, використаних скорочень та елементів коду допомагає всім, включаючи вас, запам'ятати та зрозуміти назви файлів у майбутньому.


https://guides.library.harvard.edu/c.php?g=1033502&p=7496710




Структура папок з даними

Планування структури папок на ранніх етапах дослідницького процесу дозволяє побудувати логічну  структуру. Якісна структура папок дозволяє легко знаходити потрібні файли.  Ось кілька корисних практик, які слід враховувати під час проєктування структури папок:

  • Ієрархічна структура папок – це систематичний спосіб упорядкування файлів. Зазвичай ми починаємо з папок із широкими темами, а потім у наступній ієрархії йдуть підпапки з більш специфічними темами. Рекомендується не мати понад 4 рівнів, оскільки це може створити труднощі з пошуком файлів. Також рекомендується не мати надмірної кількості елементів у кожній папці. 

  • Задокументуйте структуру ваших папок - це допоможе і вам, і вашій команді, а також іншим дослідникам, з якими ви ділитеся своїми даними, зрозуміти, як організовані матеріали. Це також допомагає всім членам дослідницької групи відшукувати потрібні файли та послідовно виконувати процес архівування.

  • Розмістіть старі версії документів в окремій папці, щоб ви бачили лише найновішу версію в робочій папці. Це допоможе уникнути випадкової роботи із застарілою версією.

  • У верхній папці має бути файл «README.txt» з описом структури папки та файлів, які містяться в папках. Цей файл також має містити пояснення правил іменування файлів.

Організація файлів

Ретельно спланована структура папок зі зрозумілими назвами та інтуїтивно зрозумілим дизайном є основою для якісної організації даних. Структуроване та послідовне впорядкування файлів і дослідницьких даних може заощадити час на їх пошук у майбутньому.  

У цьому розділі ви можете знайти деякі корисні практики, пов’язані зі структурою папок, іменуванням файлів та керуванням версіями.

Який формат файлу обрати для довготермінового зберігання?

Формат файлу – це важливе питання, яке слід враховувати, якщо ви хочете забезпечити

довгостроковий доступ до своїх дослідницьких даних. Нагадаємо, що вибір формату файлу залежить від фази вашого дослідження. Варіанти короткострокової обробки даних можуть відрізнятися від варіантів довгострокового зберігання даних.

Теоретично, ідеальний формат файлу, придатний для довгострокового доступу, має бути:
  • непатентований (наприклад, з відкритим вихідним кодом)
  • з відкритою документацією
  • широко прийнятий дослідницькою спільнотою
  • сумісний з багатьма програмами
  • без стиснення або стиснення без втрат (зменшення розміру файлу без втрати якості)
  • без вбудованих скриптів або файлів
Не завжди можливо знайти формат файлу, який відповідає всім вищезазначеним критеріям. З міркувань обачності ви можете розглянути можливість збереження даних у кількох форматах, наведених нижче:

Електронні таблиці 

  • CSV (.csv)

  • Tab-delimited File(.tab)

Статистичні дані

  • SPSS (.sav)

  • STATA (.dta)

  • SAS (.sas7dat)

  • DDI (.xml)

Бази даних

  • SQL (.sql)

  • SIARD (.siard)

  • CSV (.csv)

  • XML (.xml)

Текст

  • PDF/A (.pdf)

  • ODT (.odt)

  • Unicode text (.txt)

  • Rich Text File (.rtf)

Зображення

  • TIFF (.tif, .tiff)

Аудіо

  • FLAC  (.flac)

Відео

  • MPEG-4 (.mp4)

Актуальна інформація та додаткові відомості про рекомендовані формати - у вказівках Архіву даних Великобританії щодо рекомендованих форматів.


Носії інформації

Не існує ідеального носія інформації, який би забезпечував зручний доступ, але ніколи не страждав від пошкоджень, втрат чи старіння. Гарною практикою є зберігання дослідницьких даних щонайменше на двох різних типах носіїв. Це допомагає диверсифікувати ризики в місці зберігання, як для короткострокового, так і для довгострокового зберігання. 

Для тимчасового зберігання рекомендується використовувати настільний ПК, ноутбук чи флешку, для зберігання головних копій - мережевий диск університету, задля співпраці з членами різних установ - хмарні сервіси.

Також рекомендується періодично перевіряти доступність даних.