2026/02/02

Цифрове старіння

Під час проєкту ваше дослідження може генерувати різні типи даних дослідження в різних форматах цифрових файлів. Формат файлу, який ви обираєте для своїх даних, є основним чинником, який дозволить іншим отримати до них доступ у майбутньому. Уважно подумайте, який формат файлу буде найкращим для керування, спільного використання та збереження ваших даних. Технології постійно змінюються, і можна очікувати, що всі сучасні апаратні та програмні засоби застаріють. Подумайте, як ваші дані будуть читатися, якщо програмне забезпечення, яке використовується для їх створення, стане недоступним. Хоча будь-який формат файлу, який ви виберете сьогодні, може стати нечитабельним у майбутньому, деякі формати, швидше за все, будуть читабельними, ніж інші.

Видавці надають перевагу тому, щоб дані досліджень поширювалися у відкритих форматах файлів, для доступу до яких не потрібне пропрієтарне програмне забезпечення, де це можливо. Наприклад, табличні дані мають надаватися як файли CSV, а не як файли XLS.

Щоб вирішити, у яких саме форматах краще зберігати дані, треба розібратися, які формати бувають.

Файли у пропрієтарних форматах зазвичай потрібно відкривати за допомогою спеціального програмного забезпечення, у якому вони були створені. Отже, це означає, що хтось без ліцензії на це програмне забезпечення не завжди може відкрити ці файли.

Навпаки, відкриті формати – це формати, у яких компанія-виробник програмного забезпечення або колектив, який створив це програмне забезпечення, зробив його відкрито доступним. І зазвичай це означає, що було розроблено низку програм, які можуть відкривати такі типи файлів. Існує безліч відкритих форматів файлів, включаючи jpeg, png, flac, mp3, csv, html, json, gzip та zip. PDF є хорошим прикладом відкритого формату, бо його можна відкрити кількома програмами, а не лише продуктами Adobe.

Бінарні файли можна відкрити лише за допомогою програмного забезпечення, призначеного для читання та обробки відповідного формату файлів. Текстові файли зручні для людини, сумісні з усіма операційними системами і можуть бути легко прочитані в різних програмних пакетах. Тому дані, збережені у форматах текстових файлів, з найменшою ймовірністю застаріють з часом і є ідеальним форматом для спільного використання та довгострокового зберігання. Деякі розширення файлів, що часто використовуються, для збереження простого тексту це: .txt, .csv, .html, .json, .xml.

Більшість програмних пакетів дозволяють експортувати та обмінюватися форматами, Наприклад, у Microsoft Excel ви можете зберегти свою електронну таблицю як файл .csv. Формати файлів, які є відкритими, незапатентованими та широко поширеними, мають найкращі шанси бути читабельними в майбутньому.

Приклади бажаних варіантів формату:
  • Зображення: JPEG, JPG-2000, PNG, TIFF
  • Текст: звичайний текст (TXT), HTML, XML, PDF/A
  • Аудіо: AIFF, WAVE
  • Контейнери: TAR, GZIP, ZIP
  • Бази даних: віддайте перевагу XML або CSV 
Навпаки, пропрієтарні формати, особливо ті, які є нестандартними, які потребують певних програмних програм або певних версій цього програмного забезпечення, ймовірно, створять проблеми для майбутнього використання. Швидкі зміни технологій на ринку означають, що формати файлів можуть дуже швидко застаріти. Це, очевидно, погано для тривалого зберігання та повторного використання.

Немає коментарів:

Дописати коментар