2026/02/09

Що ми розуміємо під безпекою даних?

Безпека даних - забезпечення безпеки ваших дослідницьких даних від пошкодження та належний контроль доступу. 
Важливо подбати про безпеку ваших даних, щоб запобігти випадковому чи зловмисному пошкодженню чи модифікації, крадіжці, порушенню конфіденційності та передчасному оприлюдненню даних. Подумайте, кому потрібен доступ до даних, а також коли і як ви будете застосовувати будь-які необхідні дозволи чи обмеження. Ви також повинні мати чітку політику та вказівки щодо того, хто може робити копії даних і чи можна їх зберігати на такому пристрої, як ноутбуки, смартфони або USB-накопичувачі. Це особливо важливо, якщо ви створюєте конфіденційні дані. 

Забезпечення безпеки даних є частиною безпеки інформаційних технологій. На офісному та домашньому комп’ютерах завжди має бути встановлено найновіше антивірусне програмне забезпечення. Якщо у вас є конфіденційні дані, краще зберігати їх на комп’ютері, не під’єднаному до жодної мережі. Якщо це неможливо, слід зашифрувати дані. Тому що не підключений до мережі комп’ютер усе ще вразливий до крадіжки або зловмисного пошкодження чи зміни даних. Конфіденційні дані слід зберігати в закритій кімнаті або в сейфі, коли вони не використовуються.


Хто відповідає за управління та контроль даних?

  • Хто контролює дані (наприклад, PI, студент, ваша лабораторія, ваш університет, ваш спонсор)? Перш ніж витратити багато часу на те, як зберігати дані, ділитися ними, називати їх тощо, переконайтеся, що у вас є на це повноваження.

Для чого або кого призначені дані?

  • Хто є цільовою аудиторією даних? Як, на вашу думку, вони використовуватимуть дані? Як довго слід зберігати дані?

  • Чи є якісь вимоги щодо збереження даних? Якщо так, то як довго? 3-5 років, 10-20 років, постійно? Не всі дані потрібно зберігати, а деякі дані, які потрібно зберігати, не потрібно зберігати нескінченно довго. Добре розумійте свої зобов’язання щодо збереження даних.


Основні причини втрати даних

 

1. Збої у роботі апаратного забезпечення

Понад 40% займають випадки виходу з ладу компонентів комп’ютерної системи (див. Слайд):

  • Жорсткий диск (HDD)/твердотільний накопичувач (SSD);

  • Оперативна пам’ять комп’ютера (RAM);

  • Материнська плата;

  • Процесор (CPU);

  • Джерело живлення (PSU).

Поломка накопичувача, який фізично зберігає дані, найчастіше призводить до втрати даних. Якщо ви виявили пошкодження жорсткого диску/твердотільного накопичувача, ні в якому разі не намагайтесь його власноруч полагодити, якщо ви не володієте фаховими знаннями з відновлення даних.

2. Помилки користувачів

Помилки, які допускають користувачі через брак досвіду або звичайну неуважність, займають друге місце (біля 30% випадків). Про що йдеться?

2.1.Ненавмисне видалення важливих файлів

При роботі з файлами користувачі іноді випадково видаляють важливі дані. Операційна система пропонує два альтернативних способи проведення процедури видалення: файли можна видалити за допомогою Кошика в два кроки – спочатку видаляєте файл (натискаєте клавішу Delete на клавіатурі або обираєте контекстне меню), а потім очищуєте Кошик. Другий спосіб видалити файл – одночасно натиснути клавіші Shift та Delete, і файл буде видалений одразу, оминаючи Кошик. Операційна система зазвичай попереджає користувача про можливі наслідки - звертайте увагу, не поспішайте.

2.2.Необачне форматування сховища або логічного розділу без резервної копії

Треба завжди робити копію всіх важливих файлів перед форматуванням диска, це всі розуміють, але… А ще під час перевстановлення операційної системи користувач може випадково вибрати не той розділ і виявити помилку, коли процес встановлення вже розпочато.

2.3.Перезапис вмісту файлу

Будь-який редактор файлів чи то документів, відео, аудіо або фотографій, дозволяє користувачеві змінювати вміст файлу. Після натискання кнопки «Зберегти» і закриття файлу новий вміст файлу записується поверх попереднього. На жаль, якщо з якоїсь причини Вам знадобиться попередня версія файлу, то це часто неможливо. Єдине, що Ви можете зробити – це заново створити цей файл з нуля.

2.4.Некоректні спроби відновити втрачену інформацію

Зрозумівши, що файли втрачено, важливо утримуватися від будь-яких поспішних дій, які можуть призвести до незворотної втрати даних. В жодному разі не використовуйте інструменти для виправлення помилок у файловій системі, такі як, наприклад, CHKDSK. Ці утиліти, як правило, ставлять під загрозу втрачені дані, адже намагаються заповнити відсутню інформацію на диску, таким чином здійснюючи перезапис даних. CHKDSK може також неправильно інтерпретувати помилку, яка виникла у файловій системі, і внести хибне виправлення.

3.Помилки у програмному забезпеченні

Збої у програмному забезпеченні займають третє місце в списку основних причин втрати даних, з частотою виникнення 13%. На думку експертів з відновлення даних «SysDev Laboratories», цей тип помилок найчастіше трапляється через:

  • Програмне забезпечення для резервного копіювання. Помилка може статися під час процесу резервного копіювання файлів, коли старі файли вже видалені, а нову копію з якоїсь причини не було створено. 

  • Файлові редактори. Помилка, що виникла у файловому редакторі, може спричинити пошкодження файлу. Іншою поширеною причиною є збій під час процедури збереження одночасно кількох файлів, коли деякі файли оновлюються до останньої модифікації, а решта зазнає ушкодження.

  • Антивірусне програмне забезпечення. Антивірус може переплутати потрібні файли зі шкідливими програмами та видалити їх.

  • Конвертери. Помилка може виникнути в процесі зміни формату файлу.

4.Комп’ютерні віруси

Так само, як звичайний вірус проникає в живий організм, комп’ютерний вірус проникає до системи з метою змінити спосіб її функціонування. Важливо знати, що комп’ютерні віруси

  • по-перше, можуть пошкодити або знищити будь-які дані, що зберігаються на диску, без відома користувача, і, 

  • по-друге, здатні поширюватися та заражати інші пристрої. 

Хоча комп’ютерні віруси стають причиною втрати даних лише в 7% випадків, вони можуть спричинити серйозні неприємності. Комп’ютерні віруси – це невеликі комп’ютерні програми. Однак, на відміну від звичайних програм, вони не піддаються контролю, а їх дії спрямовані проти користувача. 

Фактори, які сприяють зараженню вірусамиі:

  • завантаження зламаного та піратського програмного забезпечення;

  • відкриття додатків до електронних листів з незнайомих адрес;

  • відвідування підозрілих вебсайтів;

  • нехтування антивірусними програмами.

Загалом нараховують більш ніж 20 різних типів шкідливих програм, з них віруси-шифрувальники найбільш руйнівні та проблемні. Вони шифрують файли на комп’ютері за допомогою шифру RSA з відкритим ключем, в той час як секретний ключ зберігається на серверах, які контролюють шкідливу програму. Після цього хакери вимагають сплати викупу від своїх жертв для отримання ключа шифрування. Інакше файли просто будуть видалені. На сьогодні не існує способів зламати такий вірус, якщо він вже встиг зашифрувати дані на вашому пристрої. Найбільш слушним рішенням є своєчасне і систематичне резервне копіювання.

5.Викрадення

Невелика кількість випадків втрати даних, а саме 5%, пов’язані з їх крадіжкою. Вкрасти можуть або гаджет, або тільки дані. Зловмисники отримують конфіденційну інформацію користувача. Як правило, їх цікавлять бази даних клієнтів приватних компаній і медичних установ, паролі, таємна банківська, особиста або корпоративна інформація.

Спеціалісти з відновлення даних можуть здійснити експертну перевірку комп’ютера і виявити факти несанкціонованого доступу та логічного викрадення даних.

На жаль, впоратися з його наслідками неможливо, легше попередити. Широко відомі засоби захисту – антивірусні програми, шифрування, встановлення паролів та використання замків на ноутбуках, таких як Kensington key. Кенсінгтонський замо́к — невеликий отвір у корпусі деяких ноутбуків, РК-моніторів та інших пристроїв, призначений для сполучення зі спеціальним замком з сталевим тросом, що охоплює будь-який нерухомий, великогабаритний або важкий предмет. Застосування такої конструкції дозволяє знизити ризик крадіжки пристрою.

6.Інші чинники

Решта 3% включають в себе наслідки стихійного лиха, а саме: землетрусів, ураганів, повені та пожежі. На жаль, природа – річ досить непередбачувана, не говорячи вже про воєнні дії. Катастрофи найчастіше завдають комп’ютерам фізичної шкоди. Втім, іноді трапляється так, що ушкодження зазнають якісь компоненти комп’ютерної системи, а сам носій інформації може залишатися неушкодженим. Це гарна новина. Проте, якщо ви виявили пошкодження накопичувача, ніколи не намагайтеся розібрати його, якщо тільки ви не спеціаліст у цій області.

Найбільш доречним для попередження таких випадків є своєчасне створення резервних копій і зберігання їх у віддаленому місці. Слід також розглянути можливість застосування хмарних технологій. 

https://www.r-explorer.com/uk/blog/general-issues/data-loss-reasons/


Втрата даних

Ваші дані є основою вашого дослідження. Якщо ви їх втратите, відновлення може зайняти багато часу, зусиль, нервів, грошей, більше того відновлення може бути неможливим. Тому дуже важливо безпечно зберігати та створювати резервні копії ваших даних.

Корисно спланувати з самого початку об’єм пам’яті, який вам знадобиться для копій. Спланувати місце зберігання даних з точки зору доступу певних користувачів. Включити витрати на зберігання даних у заявках на гранти.

Термін «втрата даних» можна визначити як неможливість отримати доступ до файлів у їх звичайному місцерозташуванні та за допомогою звичайних програмних засобів внаслідок помилок у програмному/апаратному з абезпеченні або необачних дій користувача.

Незважаючи на стрімкий розвиток техніки та програмного забезпечення ніщо не може гарантувати цілковито безперебійної роботи. Помилки, які призводять до втрати даних, можна умовно поділити на дві основні категорії: фізичні (апаратні, коли збоїть техніка) і логічні (програмні). Наведена вище діаграма ілюструє процентне співвідношення найбільш поширених причин втрати даних.

Основі причини втрати даних

https://lostdata.com.sa/en/2021/06/07/the-most-common-reasons-for-data-loss/


Перевірка цілісності перенесених файлів

https://mantra.ed.ac.uk/preparingyourdataforarchiving/

При перенесенні даних між форматами, у тому числі якщо раніше стискали архів файлу, дуже важливо, щоб ви якомога ретельніше перевіряли цілісність перетворених файлів відразу після перенесення. Перевірте, чи розмір файлу відповідає очікуваному, чи файл має правильну кількість рядків і стовпців, проведіть тестування функціональності, а також просто "на око" перевірте дані, щоб переконатися, що вони виглядають так, як повинні.

Коли ви дійдете в процесі дослідження до моменту відправлення ваших даних до архіву, репозитарій матиме свої власні критерії та процедури для перевірки якості надісланих даних. Наприклад, інструменти алгоритму контрольної суми зазвичай використовуються для перевірки того, що цифровий файл не був пошкоджений при копіюванні з одного місця до іншого (наприклад, при завантаженні копії файлу даних на ваш комп’ютер зі сховища). Інструмент алгоритму контрольної суми можна використовувати для порівняння бітів файлу, коли його було переміщено з одного носія на інший.

Отже, контрольні суми зазвичай запускаються репозитаріями для перевірки цілісності даних. Однак вони не працюватимуть, якщо формат файлу змінився або якщо ви порівнюєте файли на різних обчислювальних платформах.

Перетворення даних

На відміну від переміщення файлів з одного формату в інший, перетворення даних передбачає зміну фактичних даних. 

Є кілька причин, чому ви можете захотіти перетворити свої дані під час проєкту або після нього.
Наприклад, у даних опитування, зібраних з анкет, відповіді з множинним вибором та інші типи відповідей зазвичай кодуються цифрами, а не рядками символів. Перевага цього простого типу перетворення полягає в тому, що він полегшує введення даних, якщо ви вводите відповіді на папері, а також дозволяє уникнути невідповідностей, таких як друкарські помилки в значеннях даних. Такі якісні дані, як стенограми інтерв’ю, можна перетворити на кількісні дані шляхом застосування методів текстового кодування та категоризації. 

Іншою причиною для перетворення даних може бути більш ефективна візуалізація даних. Простим прикладом є перетворення даних, із співвідношень (чисельник і знаменник) у відсотки, щоб ви могли відобразити їх на гістограмі чи секторній діаграмі. 

Для перетворення конфіденційних даних, щоб ними можна було ділитися з іншими дослідниками, можна використовувати ряд методів. До них належать агрегація та анонімізація. Нагадаю, агрегація — процес укрупнення показників. Анонімізація - процес видалення даних (з документів, баз даних тощо) з метою приховування джерела інформації, дійової особи тощо. Типові приклади класичної анонімізації, які ми бачимо на слайді, - це узагальнення, придушення атрибутів, стирання, перестановка даних, маскування символів.

https://www.syntho.ai/uk/classic-anonymization/


Стиснення даних

https://mantra.ed.ac.uk/preparingyourdataforarchiving/

Стиснення відоме як зменшення бітрейту. Це передбачає кодування інформації меншою кількістю бітів, ніж оригінальне представлення. Не стиснуті дані буде легше читати в майбутньому, але вам може знадобитися стиснути файли, щоб заощадити місце на диску, для розміщення їх на певному пристрої зберігання або для передачі чи транспортування. Використовуйте стандартний інструмент стиснення (наприклад, ZIP, GZIP, TAR).

Стиснення без втрат

Zip — це тип стиснення без втрат, що означає, що файл має бути ідентичним оригіналу, коли ви його розархівуєте. Zip — це фактично стандартний формат стиснення, який використовується на платформах Windows, Mac, Linux і Unix.

https://mantra.ed.ac.uk/preparingyourdataforarchiving/

Стиснення з втратами

Існують також типи стиснення з втратами, пов’язані з деякими форматами мультимедійних файлів. Це може призвести до певного спотворення або втрати якості під час відтворення. Втрата може бути одним із компромісів із стисненням.

Іншим недоліком є кількість часу обробки, необхідного для стиснення та розпакування файлів до або під час використання. Обсяг необхідних обчислювальних ресурсів також може бути проблемою, особливо у випадку дуже великих файлів або спільних серверів.

Міграція даних

Міграція даних — це процес перетворення файлів з одного формату в інший. Це схоже на переклад книги з однієї мови на іншу: суть залишається та сама, але деякі нюанси можуть бути втрачені або змінені.

Чому виникає потреба в міграції?

Дослідникам доводиться конвертувати файли у трьох основних випадках:

  1. Оновлення техніки: Ви купили новий комп'ютер, і старі програми на ньому більше не запускаються.

  2. Співпраця: Ваш колега працює в іншій програмі, яка «не розуміє» ваші робочі файли.

  3. Довгострокове зберігання: Ви хочете, щоб через 20 років ваші дані відкрилися. Для цього їх переводять у відкриті стандарти (наприклад, з .docx у .pdf/A або з .xlsx у .csv), оскільки вони майже не застарівають.

Чому це складніше, ніж здається?

Багато хто вважає, що міграція — це просто натиснути «Зберегти як...». Проте статистика свідчить про інше: понад 80% проєктів міграції виходять за межі бюджету та часу (За даними The Bloor Group, понад 80% проєктів з міграції даних виконуються з додатковими витратами часу і понад ліміт бюджету. Перевитрати фінансів в середньому становлять приблизно 30%, перевитрати часу - 41%. Згідно з дослідженнями Gartner, 83% проєктів міграції даних зазнають невдачі або перевищують свої бюджети та графіки. https://www.trujay.com/blog/4-types-of-data-migration). 

Головні ризики при зміні формату:

  • Втрата даних: Деякі складні елементи (формули в таблицях, форматування тексту, метадані фотографій) можуть просто зникнути.

  • Пошкодження структури: Файл може перестати відкриватися або відображати дані з помилками.

  • Зміна розміру: Файл може несподівано "роздутися" і зайняти в кілька разів більше місця на диску.

📄 Текстові документи (Word)

При переході, наприклад, з .docx у .pdf або .txt, найбільше страждає структура та оформлення:

  • Стилі: шрифти можуть замінитися на стандартні, зникне форматування (жирний, курсив).

  • Навігація: часто "ламаються" посилання на інші документи, зникають виноски, заголовки та нижні колонтитули.

🔢 Числові дані (Excel, CSV)

Тут ризики стають критичними для розрахунків, оскільки може постраждати цілісність рядків:

  • Обрізання: якщо новий формат має обмеження за довжиною рядка або кількістю рядків, останні дані просто зникнуть.

  • Символи: спеціальні знаки (табуляція, переноси) можуть спотворити таблицю.

  • Порожнечі: пробіли, які ви використовували як код для "відсутніх даних", можуть зникнути, змістивши всі інші значення.

🗄️ Бази даних

Міграція баз даних — одна з найскладніших, бо під загрозою зв'язки:

  • Втрата відносин: може зникнути логічний зв'язок між різними таблицями (наприклад, клієнт більше не буде "прив'язаний" до свого замовлення).

  • Дані: так само як і в числах, можлива втрата останніх рядів або символів у рядках.

🖼️ Зображення

Головний ризик тут — перетворення картинки на менш якісну або "пласку":

  • Шари: при збереженні з .psd у .jpg ви назавжди втрачаєте можливість редагувати окремі елементи.

  • Якість: може знизитися роздільна здатність або погіршитися точність передачі кольорів.

🎬 Мультимедіа (Відео та Аудіо)

Перекодування відео майже завжди означає компроміс із якістю:

  • Технічні параметри: зміна частоти кадрів (FPS) може зробити відео "сіпаним", а невідповідний кодек — погіршити звук.

  • Контейнери: іноді сама "обгортка" файлу не підтримує певні доріжки субтитрів або аудіоканалів.

Поради для безпечної міграції:

  • Завжди зберігайте оригінал: Ніколи не видаляйте вихідний файл, поки не переконаєтеся, що нова версія працює ідеально.

  • Перевіряйте результат: Після конвертації обов'язково відкрийте файл і перевірте, чи всі цифри, символи та зображення залишилися на своїх місцях.

  • Обирайте відкриті формати: Якщо є вибір, мігруйте в ті формати, які підтримуються багатьма програмами одночасно (наприклад, .txt, .csv, .png).

Резюме: Міграція — це необхідний, але ризикований крок. Розуміння того, як саме ваш тип даних може постраждати при зміні формату, допоможе зберегти результати вашої праці.