ICE ECC на страже ваших данных

И снова здравствуйте! Сегодня погорим о защите данных от повреждения. Так случается (нечасто), что данные, годами хранящиеся на диске, оказываются повреждены. Это могут быть данные на CD или DVD диске, флеш-накопителе или жестком диске.


Скачать программу можно с сайта разработчика.


Предотвратить потерю поможет программа ICE ECC. Это инструмент для проверки и восстановления поврежденных файлов. Программа использует коды Рида-Соломона. Программа может использовать многопоточность и очень требовательна к ресурсам процессора. Распределенный механизм хранения информации восстановления позволяет работать даже с поврежденным ECC файлом.


Для защиты файлов или каталогов от повреждения следует выбрать их в окне и нажать кнопку создать. Основные опции я описал на снимке:

ICE ECC на страже ваших данных Ice ECC, Crc, Восстановление данных, Отказоустойчивость, Длиннопост

На главном экране программы мы видим кнопки


- Create — создает ecc файл.

- Verify — проверка данных с последующим восстановлением.

- Verify only — проверка данных без восстановления.

- Fast Test — проверка CRC ecc файла и тест заголовка.

- Full Test — полная проверка целостности ecc файлов. Проверяется возможность восстановления для кодов, хранящихся в ecc файле. Она очень медленная.

ICE ECC на страже ваших данных Ice ECC, Crc, Восстановление данных, Отказоустойчивость, Длиннопост

Создание ECC


Выделив файлы, нажмем создать. Созданный ECC в начале списка. У нас получился файл, размером 65,7 мб. Это означает, что примерно такой объем данных мы можем восстановить.

ICE ECC на страже ваших данных Ice ECC, Crc, Восстановление данных, Отказоустойчивость, Длиннопост

Восстановление файлов


Удалим несколько файлов, в пределах объема восстановления.

ICE ECC на страже ваших данных Ice ECC, Crc, Восстановление данных, Отказоустойчивость, Длиннопост

Нажимаем кнопку Verify и через 15 секунд, получаем файлы назад.

ICE ECC на страже ваших данных Ice ECC, Crc, Восстановление данных, Отказоустойчивость, Длиннопост

Кому интересно, можете ознакомиться с полным логом восстановления.

Невосстановимый случай


А теперь удалим данных больше, чем программа способна восстановить. Собственно, об этом программа нам и рапортует.

ICE ECC на страже ваших данных Ice ECC, Crc, Восстановление данных, Отказоустойчивость, Длиннопост

Тяжелый случай


В самом начале я писал, что программа работает даже с поврежденными ecc файлами. Я специально повредил файл и программа это обнаружила.

ICE ECC на страже ваших данных Ice ECC, Crc, Восстановление данных, Отказоустойчивость, Длиннопост

Но при попытке восстановить файлы, сделала это успешно.

ICE ECC на страже ваших данных Ice ECC, Crc, Восстановление данных, Отказоустойчивость, Длиннопост

Полный лог восстановления так-же привожу..

Я использую эту программу для защиты редко изменяемых данных и архивов (не бекапов), например дистрибутивов.

ICE ECC на страже ваших данных Ice ECC, Crc, Восстановление данных, Отказоустойчивость, Длиннопост

Лига Сисадминов

1.5K постов17.6K подписчиков

Добавить пост

Правила сообщества

Мы здесь рады любым постам связанным с рабочими буднями специалистов нашей сферы деятельности.

1
Автор поста оценил этот комментарий

Если на пальцах имеем два файла с данными. Создаем третий файл хранящий сумму данных файл3=файл1+файл2. В случае утери файла 1, нам надо из файла3 вычесть файл2. Школьная арифметика. В реалиях для уменьшения объема используют файл_суммы=файл1+файл2+файл3+...+файлN

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

Программа оперирует не файлами. Можно создать ECC файл для единственного файла с данными. В этом случае можно будет восстановить поврежденный файл, а в случае избыточности более 100 процентов, файл целиком. В среднем, размер ЕСС файла равен количеству информации, которую можно восстановить.

Хорошо про код Рида-Соломона рассказано на хабре:

https://habr.com/post/191418/

показать ответы
4
Автор поста оценил этот комментарий
Ни хрена не понял... Эта утилита создает файл с ссылками на файл и потом в случае ошибки диска можно восстановить данные? Или как?
раскрыть ветку (1)
3
Автор поста оценил этот комментарий

Эта утилита создает файл с информацией для восстановления. Чем больше файл, тем больше данных он сможет восстановить.

Поясню: У нас есть гигабайт фотографий по 10 мегабайт. То есть 100 штук.

Мы создает ECC файл для восстановления с избыточностью 25%.

То есть, имея файл ECC размером 250 Мб, мы можем восстановить ЛЮБЫЕ 25 фотографий в случае их повреждения или удаления.

Автор поста оценил этот комментарий
А что не так с пятым рейдом? Мы только его и используем.
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Прочитайте, очень познавательно.

https://habr.com/post/78311/

речь идет о чистом RAID5, не о его разновидностях.

Использую RAID6.

показать ответы
Автор поста оценил этот комментарий

И.... А по мне так и "Виктория" хорошо с этим справляется.

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

С чем справляется?

Автор поста оценил этот комментарий

Щас бы качать отдельную мокрую письку, когда добавлять в архив данные для восстановления умеет любой архиватор.

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Любой - это какой? Напомните кроме WinRAR?

Вы понимаете разницу между архивом и файлом в несжатом виде?.

Вот например, у меня есть папка с дистрибутивами. К ней есть ЕCC файл для восстановления. Я могу восстановить в случае чего до 10 % программ.

И я могу использовать это всё без распаковки. Мои файлы готовы к использованию прямо сейчас.

Второй пример: у меня есть папка с шаблонами виртуальных машин. Там тоже есть ЕСС файл. При этом мне не нужно ничего распаковывать - я могу просто импортировать виртуальную машину и начать работать. Вы представьте, сколько будет сживаться и распаковываться эта папка?

Папка с дистрибутивами игр опять-же большая.

Зачем мне архиватор?

Иллюстрация к комментарию
Иллюстрация к комментарию
1
Автор поста оценил этот комментарий

Тем, что он делает другое - добавляет избыточность к файлам.


Чтение дисков с битыми секторами (Non-Stop Copy, ddrescue) - это одно.


Добавление информации для восстановления битых файлов, недостающих файлов, недостающих частей архива (ICE ECC, PAR2, dvdisaster, recovery record в WinRAR и FreeArc, recovery volume в RAR) - это другое. На накопителях (SSD/HDD/DVD) похожая избыточность уже имеется, а тут она дополнительно добавляется на уровне файлов.


Зачем эта избыточность, если диск может отказать целиком и если она не отменяет необходимость бэкапов? Ну... для параноиков. Ещё на оптические диски и ленту не так плохо она ложится, там RAID-массив (или SnapRAID) не соберёшь.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Зачем эта избыточность, если диск может отказать целиком...

Я сталкивался с ситуацией, когда из большого числа файлов некоторые становились размером 0 байт. Архив конечно есть, но в другом месте и быстрее восстановить на месте.

Автор поста оценил этот комментарий

Чем этот софт выделяется на фоне остального?

раскрыть ветку (1)
Автор поста оценил этот комментарий

На фоне какого например?

показать ответы
Автор поста оценил этот комментарий

рид саломон, древность то какая =)

раскрыть ветку (1)
Автор поста оценил этот комментарий

Однако, эти коды очень распространены и прекрасно делают свою работу.

Автор поста оценил этот комментарий

Я вам не говорю что их нет. Я вам говорю что контроль целостности происходит на другом уровне и контролировать(добавлять) избыточность руками совершенно бессмысленно. Вы же не проверяете руками пакеты TCP\IP (а вдруг данные с вашей фотографии исказились при передаче? Или скан паспорта не такой! Или при заказе авиабилетов 1 бит в вашей фамилией изменится!)


Реплицируя\архивируя данные в территориально-удаленное хранилище вы сразу перекрываете туеву кучу векторов потери этих самых данных. Так зачем страдать фигней, может сразу защититься от всего?

раскрыть ветку (1)
Автор поста оценил этот комментарий

Согласен.

Я в принципа тек и делаю с особо ценными данными.

Но некоторые вещи совсем не хочется реплицировать, ибо много - папка с играми например.

Для того использую прогу.

Автор поста оценил этот комментарий

статья основана на факте "Как правило, диски Desktop-class имеют указанную производителем величину BER равную 10^14 степени," Вот только десктопные диски в рейды суют только идиоты. А у серверных дисков надёжность выше, как минимум потому, что их прошивка предназначена для нахождения в рейде и они не вылетают из массива по пустякам.

далее, статья написана 9 лет назад, с тех пор наверное многое поменялось.

могу воспринять её как рекомендацию, но не как обязательную к исполнению. в больших компаниях не работал, для маленького офиса хватит и рейд-5 с бекапами.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Был у меня случай:

Файловый сервер на RAID5 Adaptec.

Windows Server 2003.

7 дисков Western Digital RE4 (если мне не изменяет память) по 500 гб.

1 диск в горячем резерве.

Вышел из строя диск и автоматически начался ребилд. Через часов шесть выходи ещё один.

Занавес.

Теперь использую RAID5 в виде Storage Spaces Volume: Parity.

Храню на нем фильмы, дистрибутивы, образы.

Автор поста оценил этот комментарий

Пытается считать данные, не равно потерянные данные. Первое, на диске разные сектора читаются с разной скоростью, второе если доступ к сектору ниже порогового то сектор просто помечается как bad и происходит ремап. Чуете разницу между не читается и читается медленно? Плюс смарт в простое эпизодически сам проверяет винт(но это не точно, не преведу пруфов потому что не помню откуда эта информация в моей голове). Ваша ОС как минимум в фоне эпизодически дефрагментирует диск. Попробуйте найти старый работающий хард (3-5 лет) с бэдами, и о чудо вся инфа копируется без каких либо проблем, медленно да, с хрустом но копируется.


Чисто теоретически: записали данные на диск положили на полку. Прошло 10 лет. Так как диск не использовался, СМАРТ не читал данные, не проводил ремап. За десять лет часть слоя посыпалась - единственный вариант имеет смысл добавлять избыточночть. Но чтобы такое творить надо быть совсем ... эмм не далеким.


Я видел когда у серверов при остановке на ТО в хардах залипали головы. Я видел когда сгорал контроллер. Видел винты с кучей бэдов и хрустящие как свежевыпавший снег. Я даже попадал в ситуацию когда не сходился crc при передачи по фтп в сети из 3 пк.

Но ни разу за все мои 20 лет не было ситуации когда данные с 1 харда можно было бы спасти избыточность. Я себе даже ситуации такой представить не могу. Нет, возможно на каком-ндь стенде, в лаборатории можно воспроизвести ситуацию - отключить смарт, отключить контроль записи со стороны фс(ну или испльзовать тот же фат), отключить дефрагментацию и трясти работающий винт (предварительно отключив мех. защиту) и естественно не проверить винт на брак, то тогдааа...


Вообще весь этот разговор напоминает свидетелей Raid5 все о нем знают, но в нормвльном продакшене никто не видел.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Raid 5 я в работе видел. Даже видел RAID 3.

в одном из моиъ предыдущих постов @armene, упоминала протухание данных. Может не так выразилась, но с ней Я согласен.

#comment_122734331

Если - бы записанное оставалось истинным навсегда, то зачем внедрять контроль целостности?

ошибки постоянно происходят и странно их отрицать.

Вот например вырезка из журнала за сегодня.

StorageSpaces 2-Way Mirror Volume файловая система REFS, контроль целостности данных включен.

Иллюстрация к комментарию
Иллюстрация к комментарию
показать ответы
Автор поста оценил этот комментарий

"Но это не гарантирует, что данные не повредятся в процессе хранения..."

...дальше можно не читать. Предлагаю задуматься над тем откуда берется параметр Reallocated Sector в SMART и как вообще этот смарт работает. Для ssd гуглите про trim и как читается sys health.

раскрыть ветку (1)
Автор поста оценил этот комментарий

То есть, Вы считаете, что данные, записанные на диск, на нем и останутся без изменения?

При процедуре remap, контроллер пытается считать данные, но нет гарантий их целостности. Потом сектор помечается как сбойный, а новому присваивается  адрес LBA сбойного сектора.

Вы не замечали, что при появлении сбойного сектора, RAID контроллер иногда начинает проверку массива?

TRIM тут причем? Мы про SSD не говорим.

показать ответы
Автор поста оценил этот комментарий

пора перестать в 2018 году использовать fat  и будет вам счастье.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Серьезно?

Вы полагаете, я использую FAT? Даже в смартфоне у меня exFat. А не, вспомнил, в фотоаппарате FAT на карте памяти.

Так вот, я к чему: Вы полагаете вопрос в журналировании?

Да нет, это не спасет отца русской демократии.

Журналирование в файловых системах ведется для метаданных, что гарантирует  согласованность файловой системы в случае сбоя записи, но не согласованность данных. При проверке данные скорее всего будут усечены.

EXT с включенным полным журналированием гарантирует, что запись произведена полностью. Но это не гарантирует, что данные не повредятся в процессе хранения.

ZFS со сквозным контролем целостности данных работает в случае обеспечения избыточности. То же можно сказать и про BTRFS.

Для Windows есть REFS, но включать потоки целостности REFS имеет смысл только при использовании StorageSpaces - как и в случае с ZFS, для восстановления данных, нужна избыточность.

Но никто и ничто не поможет от повреждения данных вирусами, программами и прочим.

Программа имеет место для жизни. Я приводил скриншот папки с играми - это терабайт данных и он лежит на StorageSpaces 2-Way Mirror Volume. Эту папку я не копирую в процессе резервного копирования: долго и незачем.

Но эта программа позволит мне в случае сбоя восстановить 15 Гб любых данных из каталога. Невысокая цена. Один раз сделал файл и забыл.

В папке с образами операционных систем и шаблонов виртуальных машин позволяет контролировать валидность этих самых образов. Как-то файл образа m0nkrus превратился в тыкву: 0 байт. Я был удивлен.

показать ответы
Автор поста оценил этот комментарий

это не для наших мозгов

раскрыть ветку (1)
Автор поста оценил этот комментарий

Жаль, что OpenSolaris закрыли. До сих пор образ храню.

2
Автор поста оценил этот комментарий

gen8/E3 и gen10/3216  фря/zfs  8/16 ecc rz2 10/16 тб

Соответственно gen8  серебристый а 10 черненький

раскрыть ветку (1)
Автор поста оценил этот комментарий

Моё почтение, весьма недурно!

Вот только жаль, что ZFS всё чаще пользуют под FreeBSD и Linux. Истинных ценителей под Solaris не так и много.

Предпросмотр
показать ответы
Автор поста оценил этот комментарий

Так чтов ас конкретно интересуетраз цвет вам не интересен?

Не пытайтесь уходить в рторику, не ваше это.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Название железки, софт и примерная конфигурация.

показать ответы
Автор поста оценил этот комментарий
раскрыть ветку (1)
Автор поста оценил этот комментарий

0Зачем Вы комментируете посты?

Почему-бы не поговорить нормально?

показать ответы
1
Автор поста оценил этот комментарий

Поскольку mfc166 автор постов для домохозяек и я сама можно сказать домохозяйка!

Даи подача материала у вас вот для домохозяек.

На примере данного поста:

  есть проблема потери данных

решение автора

  вот вам домохозяйки программа!

Все точка.


Проблема не раскрыта, решения не раскрыты, тема сисек не раскрыта.

Так что все по нашему, по домохозяйски! Что не так?

раскрыть ветку (1)
Автор поста оценил этот комментарий

Не все мои посты для домохозяек.

Про СХД расскажете?

показать ответы
Автор поста оценил этот комментарий

Что интересует то?

А то по нашему, по домохозяйскому, одна черненькая вторая серебристая.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Да что привязались к домохозяйскому?

показать ответы
Автор поста оценил этот комментарий

СХД имели в виду?

Да есть.


Если что это утилита не для дома  или малого бизнесса. Это утилита для хранения неизменяемого набора данных в условиях полной финансовой недостаточности.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Расскажете о ней?

Правда интересно.

показать ответы
Автор поста оценил этот комментарий

Синолоджи на 2 диска 10-15к.

itx+2/3/4 диска+коробка из под обуви можно взять за 5-7 тонн.

Да блин, я на распберри пай + usb-hdd и то надежнее будет.


Репликация данных в территориально удаленное место - бесценно.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Категорически согласен. Сам так делаю - разместил комп у родителей для этих целей.

Но программа все равно заняла свою нишу на компе.

Автор поста оценил этот комментарий

Я по простому, по домохозяйски.

Текущий объем данных и текущие технологии оперативного хранения в неспециализированной системе будут гарантированно повреждены.

Или вы используете систему заточеную под хранение или огребаете.

ICE ECC паллиатив для систем не расчитанных на хранение. Его применение по большому счету малополезно.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Вы издеваетесь?

Это специализированная утилита для дома и малого бизнеса.

Дома у Вас хсд?

показать ответы
Автор поста оценил этот комментарий

Как домохзяйка домохозяйке.

Так случается (нечасто), что данные, годами хранящиеся на диске, оказываются повреждены

Это случакется не то что часто, а непрерывно и регулярно. На сайте разработчика должен быть обзор с циферками и математическим ожиданием.


Может таки стоит положить болт на винду как систему хранения?

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Согласитесь, данные могут повредиться независимо от операционной системы.

И даже от файловой системы.

показать ответы
1
Автор поста оценил этот комментарий

Мне кажется, что тут что-то перепутано

Иллюстрация к комментарию
раскрыть ветку (1)
Автор поста оценил этот комментарий

исправил, спасибо!

1
Автор поста оценил этот комментарий

Если вы не используете Cd/dvd, то в современном мире данные или уничтожаются полностью(умышленно или не очень) или ломается накопитель.


Для первого и второго давно давно уже придуманы более удобные инструмены чем избыточность.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Повреждения файловой системы никто не отменял.

показать ответы