2026/01/23

Документація даних: рівні

Завжди легше створити документацію даних на початку дослідницького проєкту та оновлювати її протягом усього процесу дослідження. Гарна документація даних зазвичай пояснює:

  • Рівень проєкту:

    • передумови та дизайн дослідження, наприклад, хто дослідники, спонсори, які цілі дослідження, гіпотези тощо

    • метод збору даних

    • структура файлів даних

    • процедура очищення даних та інші прийняті заходи забезпечення якості

    • версія набору даних та внесені зміни

    • джерело використаних вторинних даних, якщо такі є

    • ліцензія  на повторне використання

    • пов'язані публікації та інші результати досліджень

  • Змінний рівень:

    • визначення параметрів

    • одиниця вимірювання

    • формат даних, часу та інших параметрів

    • значення коду, наприклад, 1=жінка; 2=чоловік тощо

    • код для відсутніх значень

    • відповідний номер питання

Залежно від характеру дослідження та методу збору даних, документація даних може бути записана в різних формах, таких як файл Readme,  словник даних,  книга кодів, лабораторний зошит тощо. Усі вони мають однакову мету – забезпечити розуміння даних вашого дослідження поточними та майбутніми дослідниками (у тому числі вами), які хотіли б використовувати ці дані знову.


Немає коментарів:

Дописати коментар