Дані можна фіксувати або змінювати протягом проєкту (і, можливо, після його завершення).
- Фіксовані набори даних: ніколи не змінюються після збору чи створення.
- Зростання наборів даних: можна додавати нові дані, але старі дані ніколи не змінюються та не видаляються.
- Набори даних, які можна переглядати: можна додавати нові дані, а старі дані можна змінювати або видаляти.
1. Фіксовані набори даних (Fixed Data Sets)
Це дані, які "застигли в часі". Щойно вони зібрані або згенеровані — процес завершено. Жодна цифра в них більше не змінить свого значення.
Як це працює: Це як фотографія. Ви зробили знімок, і він залишається незмінним.
Чому це важливо для захисту: Це найпростіший тип для зберігання. Ви робите одну ідеальну копію, фіксуєте її "контрольну суму" (цифровий відбиток), щоб ніхто нічого не підправив, і кладете в архів.
Приклад: Результати перепису населення за 2001 рік; дані завершеного лабораторного експерименту.
2. Зростальні набори даних (Growing Data Sets)
Тут дані тільки додаються. Це "історія", яка постійно пишеться, але минуле в ній залишається недоторканним.
Як це працює: Це як щоденник або стрічка новин. Ви дописуєте новий день, але не вириваєте сторінки за минулий місяць і не виправляєте там помилки.
Чому це важливо для захисту: Тут потрібна система, яка вміє "дозаписувати" нове, не пошкоджуючи старе. Це ідеально для доведення чесності дослідження — можна простежити, як накопичувалися дані день за днем.
Приклад: Показники метеостанції (щогодини додається новий запис); лог-файли сервера.
3. Набори даних, які можна переглядати (Revisable Data Sets)
Це "живий" організм. Тут можна все: додавати нове, виправляти знайдені помилки в старих записах або видаляти зайве.
Як це працює: Це як стаття у Вікіпедії. Вона постійно оновлюється, і вчорашня інформація сьогодні може виглядати інакше.
Чому це важливо для захисту: Це найскладніший тип. Тут критично важливо мати версійність. Якщо ви змінили дані сьогодні, ви повинні мати можливість "відкотитися" до того стану, який був тиждень тому, щоб зрозуміти, чому змінилися ваші висновки.
Приклад: База даних пацієнтів у лікарні (адреса або прізвище можуть змінитися); список літератури до статті, який ви постійно редагуєте.
Як це впливає на вибір стратегії:
| Тип динаміки | Основний ризик | Що робити? |
| Фіксовані | Випадкове видалення | Один раз зробити надійний архів ("Read Only"). |
| Зростаючі | Втрата останніх сегментів | Налаштувати регулярне автоматичне додавання копій. |
| Для перегляду | Непомітна зміна даних | Використовувати системи контролю версій, щоб бачити хто, коли і що змінив. |
Цікаво, що для вирішення кризи відтворюваності науковці зараз намагаються перетворити "дані для перегляду" на "фіксовані". Тобто, на момент публікації статті ви "заморожуєте" версію даних, щоб інші могли перевірити саме той набір, на основі якого ви зробили висновки.