DataSteward@LibraryKPI: повторне використання

Показ дописів із міткою повторне використання. Показати всі дописи

2026/02/05

Вторинні дані

Вторинні дані — це дані, зібрані для однієї цілі, які надаються для використання іншими особами для іншої цілі.

Чому вторинні дані — це круто?

Головна причина — масштаб. Як окремий дослідник або студент, ви навряд чи зможете опитати 50 000 людей у 10 країнах. У вас просто не вистачить грошей та часу. А великі організації (державні служби статистики, міжнародні фонди) мають для цього колосальні ресурси.

Вища якість: Дані від великих інституцій часто набагато точніші та професійніші, ніж ті, що ви зберете "на колінці".
Швидкість: Ви можете завантажити величезний масив інформації з інтернету за лічені хвилини, замість того, щоб збирати його місяцями.

У чому "пастка"? (Два головні мінуси)

1. "Це майже те, що мені треба"

Оскільки дані збирав хтось інший, вони навряд чи ідеально підходять під ваше запитання.

Ризик: Виникає велика спокуса "підтягнути за вуха" чужі цифри до своєї теорії. Ви починаєте вдавати, що ці дані вимірюють саме те, що вам потрібно, хоча насправді це не зовсім так. Ви не контролювали процес збору, тому маєте те, що маємо.

2. Довга "інструкція"

Хоча самі дані ви отримуєте миттєво, підготовка до роботи з ними займає купу часу.

Проблема: Ви не можете просто відкрити файл і почати рахувати. Вам потрібно "проковтнути" гігантські обсяги документації.
Ви повинні розібратися: як саме обирали людей для опитування? Які були фонові умови? Що означає кожен код у таблиці? Без цього розуміння ваші висновки будуть помилковими.

Отже, вторинні дані — це потужний інструмент, який дає вам доступ до ресурсів рівня цілих міністерств. Але це вимагає від вас чесності (чи дійсно ці дані підходять для моєї теми?) та терпіння (вивчити всі описи та методології, які йдуть у комплекті).

2026/01/26

Як ліцензувати відкриті дані?

Нагадаємо, дані є відкритими, якщо виконуються такі умови:
✓ відкрита ліцензія Creative Commons;
✓ відкритий доступ;

✓ відкритий машиночитний формат.

Застосування відповідної ліцензії до ваших даних має вирішальне значення для того, щоб зробити їх придатними для повторного використання. Видавці заохочують надавати дослідницькі дані за відкритими ліцензіями, які дозволяють вільне повторне використання (наприклад, CC0). Але видавці не накладають жодних ліцензій на дослідницькі дані, якщо дослідницькі дані зберігаються в сторонніх сховищах. Видавець журналу також не претендує на авторські права на дані досліджень. Вибір ліцензії залишається за дослідником.

Деякі з найбільш поширених ліцензій для повторного використання:

CC0 (No Rights Reserved) - права не захищені, суспільне надбання. CC0 може бути особливо важливим для обміну даними та базами даних, оскільки в протилежному випадку може бути неясно, обмежено дані та бази даних, засновані на фактах, авторським правом чи іншими правами. Бази даних можуть містити факти, які самі по собі не захищені законом про авторське право. CC0 рекомендується для табличних даних і баз даних і використовується сотнями організацій. Особливо рекомендується для наукових даних. Хоча CC0 за законом не вимагає від користувачів даних посилань на джерело, це не знімає моральної відповідальності в зазначені авторства, як заведено в наукових дослідженнях.

CC-BY (Attribution) - зазначення авторства. Ця ліцензія дозволяє іншим поширювати, мікшувати, створювати та використовувати вашу роботу (також у комерційних цілях) за умови, що вони вказують вам авторство оригінального твору. Це сама зручна пропонована ліцензія. Рекомендується для максимального поширення та використання ліцензійних матеріалів.

CC BY-SA (Attribution-ShareAlike) - ця ліцензія дозволяє іншим мікширувати, створювати та використовувати вашу роботу навіть у комерційних цілях, за умови, що вони посилаються на вас, і ліцензують свої нові твори на тих же умовах. Цю ліцензію часто зрівнюють з ліцензіями на безплатне та відкрите програмне забезпечення з авторським правом. Усі нові роботи, засновані на вашій, будуть мати ту ж ліцензію, тому будь-які виробничі також дозволяють комерційне використання. Це ліцензія, яка використовується у Вікіпедії, і вона рекомендована для матеріалів, які відтворюються від включення контенту з Вікіпедії та проєктів з аналогічною ліцензією.

CC BY-NC (Attribution-NonCommercial). Ця ліцензія дозволяє іншим мікширувати, створювати та використовувати вашу роботу в некомерційних цілях, і, хоча їх нові роботи також повинні визнавати вас і бути некомерційними, вони не зобов’язані ліцензувати свої продуктивні роботи на таких умовах.

Для отримання додаткової інформації про ліцензування відкрийте Ліцензування.

2026/01/25

Повторне використання даних

Повторне використання даних — це процес застосування наявних наборів даних, створених для однієї мети, для нових досліджень, аналізу або розробки нових продуктів. Це підвищує ефективність, зменшує витрати часу та ресурсів, дозволяючи створювати нові знання без необхідності знову збирати ті ж самі дані методичні рекомендації МОН України.

Щоб зробити дані або код повторно використовуваними:

Використовуйте ліцензію Creative Commons для даних
Для програмного забезпечення з відкритим кодом виберіть відповідну ліцензію тут: https://choosealicense.com
Надайте якомога більше інформації (метаданих) про дані під час надсилання до репозитарію
Додайте файл README для пояснення та контекстуалізації даних

Основні аспекти повторного використання даних включають:

Дослідницькі дані: Використання результатів наукових досліджень іншими вченими для перевірки або нових аналізів (див. Науково-технічна бiблiотека ім. Г. І. Денисенка).
Відкриті дані: Використання публічної інформації (наприклад, урядової) для створення комерційних або соціальних сервісів.
Управління даними: Процес включає зберігання, документування (метадані) та забезпечення доступу для можливості повторного застосування (див.методичні рекомендації МОН України).

DataSteward@LibraryKPI

Сторінки