Надежность. Система SMART для жестких дисков.
Надежность - это свойство компьютера сохранять работоспособность в течении заданного промежутка времени. Отказы оборудования являются случайными событиями. Интенсивность отказов равна количеству отказов в единицу времени. Если отказы различных элементов независимы, то интенсивность отказов l для всех элементов, составляющих устройство, определится как сумма по всем типам элементов: l = S l i * Ci, где Сi- количество элементов i-го типа, входящих в устройство, l i - интенсивность отказов элементов i - го типа. Вероятность исправной работы устройства в течении времени t определится по формуле P(t) = e- l t Любая вычислительная система характеризуется временем наработки на отказ (средним временем безотказной работы системы) или MTBF (Mean Time before Failure). Система средней надежности имеет значение MTBF порядка 300000 часов, высоконадежные системы (High-end) до 800000часов. В зависимости от количества операционных ресурсов задействованных в вычислительной системе изменяется время наработки на отказ, естественно, что чем больше занято ресурсов, тем меньше MTBF. Среднее время наработки на отказ можно определить как Tср. = 1 / l Время восстановления работоспособности устройства складывается из времени поиска неисправности и времени замены вышедшего из строя элемента. Tвосст = Tпоиска + Tзамены Время восстановления (Tвосст) случайная величина со средним значением для устройств определенного типа и одного поколения. Среднее время восстановления зависит от количества оборудования и от техники поиска и устранения неисправностей. Вероятность восстановления работоспособности устройства Р(t) за время t определится Р(t) = 1- ЕХР (- t / T восст.) Отношение общего времени исправной работы к сумме общего времени исправной работы и восстановления, взятых за весь период эксплуатации называется коэффициентом готовности - К гот. К гот.= Т / (Т + Твосст.), где Т- общее время исправной работы устройства. Коэффициент готовности определяет вероятность безотказной работы устройства в текущий момент времени. Использование резервирования позволяет строить системы с высоким показателем надежности, но при этом возрастает стоимость системы и величина эксплуатационных расходов. Широкое распространение получили RAID - системы (Redundant Arrays of Inexpensive Disks - матрицы недорогих дисковых накопителей с избыточностью). Основным в этой технологии является использование группы недорогих дисков для создания большого дискового пространства. RAID - системы повышают надежность хранения данных за счет резервного копирования или распределения данных на несколько дисков что позволяет восстановить испорченные данные по биту четности и произвести горячую (без выключения системы) замену испорченного диска. Для повышения надежности современные вычислительные системы снабжают системой самодиагностики- POST (Power-ON Self Testing, самодиагностика при включении) и системой самодиагностики, анализа и оповещения - SMART (Self-Monitoring Analysing and Reporting Technology) позволяющей любому компоненту сообщить о своем состоянии надежности.
|