- Lektsia - бесплатные рефераты, доклады, курсовые работы, контрольные и дипломы для студентов - https://lektsia.info -

Диагностика работы накопителей на жестких магнитных дисках



Технологии обеспечения надежности хранения данных на жестких магнитных дисках

Архивация и восстановление данных

Защита данных по своей сути сводится к созданию идентичной копии, которую можно использовать для восстановления потерянных или испорченных файлов и дисковых разделов. При построении инфраструктур используют весь спектр доступных на рынке технологий копирования данных. Классификация технологий может быть произведена по различным критериям, основной из которых - это носитель данных.

 

Оборудование для резервного копирования данных

Можно выделить две основные группы носителей:

1. Жесткие диски (Hard Disk Drive - НЖМД). Применяются для хранения резервных копий данных, готовых для мгновенного восстановления.

2. Сменные носители (Removable Media) - для долгосрочного надежного хранения.

С точки зрения пути копирования можно выделить два основных метода:

1. Локальные снимки и клоны данных на одном сервере или системе хранения. Применяется для создания наборов данных, готовых для последующего быстрого отката системы на определенный момент времени в прошлом.

2. Удаленные реплики данных - на различных серверах или системах хранения

С точки зрения режима копирования можно выделить:

1. Синхронное копирование и зеркалирование. В таком режиме запись не считается выполненной до тех пор, пока не получено подтверждение от всех подключенных устройств хранения.

2. Асинхронное копирование. В таком режиме подтверждения об успешной записи от всех вторичных устройств не требуется.

Наличие корректной копии данных будет бесполезным, если не функционирует соответствующий ИТ-сервис. Поэтому помимо защиты данных важнейшей задачей является так же защита приложений. Существует обширный набор методов защиты приложений, которые специалисты используют при построении вычислительных комплексов.

Основными методами являются:

1. Автоматизация процесса развертывания системного и прикладного программного обеспечения.

2. Кластеризация сервисов.

. Построение отказоустойчивых (fault-tolerant) решений.

В любой организации, как правило, имеются разные приложения, для которых характерны различные требования к надежности, поэтому эффективнее оказывается применение комбинации нескольких технологий защиты приложений. Решение по защите данных и приложений в большинстве случаев подразумевает построение программно-аппаратного комплекса.

Как правило, такой комплекс содержит:

1. системы хранения различных типов и инфраструктура доступа к ним:

2. дисковые SAN/NAS массивы;

. ленточные приводы или библиотеки;

. магнитооптические приводы и библиотеки.

. программное обеспечение, реализующее процедуры и процессы:

. автоматизации;

. кластеризации;

. управления хранением и защиты;

. мониторинга и управления оборудованием.

 

Технология S.M.A.R.T.

С течением времени изнашиваются головки, подшипники, стареют фильтры, магнитная поверхность дисков и электронные компоненты. И хотя инженеры, разрабатывающие накопители делают все возможное для того, чтобы их изделие служило многие годы но может случиться, что НЖМД выдут из строя. Хорошо, если на диске были только программы и игрушки, которые можно легко восстановить с дистрибутивов. Но чаще всего бывает так, что поломка накопителя застает пользователя врасплох, после чего выясняется, что там было что-нибудь важное и уникальное. Именно так и было несколько лет назад, когда пользователь мог только догадываться о том, что ждет его НЖМД в недалеком будущем, ориентируясь на возраст накопителя, появление новых плохих секторов и собственную интуицию. Этот способ был весьма неточным, так как возраст накопителя лишь косвенно характеризует его износ, гораздо большее значение имеют такие факторы, как количество включений, высокая рабочая температура, механические удары и табачный дым в воздухе.

Поэтому ведущими производителями жестких дисков была разработана технология, позволяющая объективно оценить состояние всех систем накопителя на жестких магнитных дисках и достаточно точно спрогнозировать время его выхода из строя. Эта технология получила название S.M.A.R.T. (Self Monitoring Analysis and Reporting Technology) и присутствует во всех современных НЖМД. Несмотря на кажущуюся сложность названия, принцип ее действия довольно прост.

Когда работает накопитель, его микропроцессор ведет подсчет циклов включения-выключения, количество отработанных часов, фиксируется время раскрутки двигателя до номинальной скорости, число ошибок чтения, число вновь появившихся сбойных секторов и многое другое. Кроме того, с помощью специальных датчиков определяется температура устройства, количество полученных ударов и т. д. Все данные автоматически, без участия пользователя, заносятся в специальную таблицу на диске и периодически обновляются. Еще они постоянно сравниваются с предельно допустимыми значениями, превышение (или наоборот) которых указывает на серьезные неполадки накопителя.

Эта таблица называется таблицей SMART-параметров и может быть просмотрена пользователем в любое время, для чего существует специальная утилита. Например, НЖМД Speed или SMARTUDM Эти программы бесплатны и имеют описание на русском языке. Запускать их следует из MS-DOS, воспользовавшись системной дискетой, загрузочным CD-ROM или нажав F5 при загрузке Windows 98. Следует обратить особое внимание на то, что некоторые значения приведены в шестнадцатеричной системе и, чтобы определить, например число включений, нужно перевести их в десятичную (это можно сделать калькулятором Windows). Существуют подобные программы и для Windows, например S.M.A.R.T. Vision, однако многие из них работают неправильно с некоторыми накопителями и внешними контроллерами, поэтому всерьез воспринимать их не стоит.

 

Технология Dual Wave

Технология разработана фирмой Maxtor и широко применяется в ее линейке жестких дисков. В контроллере диска впервые применено два процессора. Цифровой сигнальный процессор (DSP) управляет приводами, отвечает за операции чтения-записи и коррекции ошибок. RISC-процессор собственной разработки Maxtor оптимизирован для операций ввода-вывода и обработки команд интерфейса ATA. Оба процессора имеют свободный доступ к буферу данных и шине обмена данными между собой. Технология DualWave позволяет существенно повысить эффективность работы с файлами большого объема (видео, трехмерные игры, базы данных). Например, жесткий диск DiamondMax 6800 со скоростью вращения 5400 об./мин., оснащенный блоком DualWave, на многих тестах уверенно опережает обычные диски со скоростью вращения 7200 об./мин. К тому же диски Maxtor с контроллером DualWave оказались одними из самых бесшумных.

 

Технология Data Lifeguard

Одним из самых ранних SMART-расширений и улучшений является технология Data Lifeguard разработанная и используемая компанией Western Digital в своих накопителях. Ее суть заключается в создании системы для увеличения надежности хранения информации, т.е. того, чего SMART, работающая в направлении общей диагностики состояния привода, не обещала. Обычными причинами потери информации в функционирующем накопителе становятся ошибки записи, делающие не возможной последующее чтение и восстановление данных, постепенный износ поверхности, снижение ее магнитных свойств.

Это и составляет сущность технологии Data Lifeguard. На холостом ходу накопителя производится поиск и переназначение сбойных секторов, восстановление, если представляется возможным, из них информации и запись ее в новое место. Тесты запускаются после того, как накопитель наработал со времени проведения последнего теста 8 часов и при отсутствии к нему обращений в течение 15 секунд. Функционирует система следующим образом: при чтении какого-либо сектора возможно возникновение ошибки, которая может быть обусловлена плохой читаемостью сектора (нестабильный сектор), ошибкой при записи данных в сектор, другими случайными внешними условиями или может быть отмечен слабый уровень сигнала. В последнем случае, будет предпринята попытка оживления данных - данные будут по новой записаны в этот же сектор, с последующим их контрольным чтением.

Если уровень сигнала по прежнему низкий - то, очевидно, имеется износ/дефект магнитного слоя, и данные из него будут перемещены в новое место, а данный будет помечен как дефектный. Аналогичные действия будут предприняты и в остальных названных случаях, но при повторном обращении, случайная ошибка не повториться и с сектором ничего не произойдет, а обусловленная первыми двумя с большой долей вероятности проявиться снова, и тогда будет предпринята попытка их восстановления по имеющимся корректирующим кодам (ECC, Error Correction Code). В случае удачи данные будут записаны в новое место, а устаревшие помечается как дефектные. Ну а в случае неудачи, увы, пользователь останется без данных. При работе Data Lifeguard использует функции SMART, но в отличие от нее, функционирует всегда, даже тогда когда SMART выключена. В случае, если накопитель окажется занят Data Lifeguard тестами, когда поступит внешняя команда, тест будет приостановлен и восстановлен по истечении 15 работы после 15 секунд не активности.

Время необходимое на тест поверхности варьируется от модели к модели и в среднем составляет менее 1-ой минуты на гигабайт. Счетчик времени от теста до теста не обнуляется при отключении питания. Возникающие ошибки протоколируются. В общем, нужно сказать, что это действительно шаг вперед. Пользователь избавляется от необходимости самостоятельно проводить тест поверхности диска, который к тому же многие часто не делали и даже не подозревают что это такое (после появления SMART III, уж тем более Data Lifeguard это оправдано). Значительно снижается вероятность потери данных, кроме того, возможно даже какое-то повышение производительности благодаря тому, что из использования на ранних стадиях исключаются неуверенно читающиеся сектора, и не возникает необходимости повторного чтения. Одна тонкость технологии состоит в том, что она, похоже, проверяет только использующиеся сектора, неиспользуемая поверхность остается без проверки.