Глава 9 Средства самодиагностики и восстановления
Диагностические компоненты в ОС управляющей ЭВМ значительно отличаются от соответствующих компонентов ОС для обработки данных или научных задач объясняется различием в их назначении. Главная цель диагностики ЭВМ для обработки данных или решения научных задач - повышение эксплуатационной надежности - означает увеличение скорости обнаружения отказа, сводящее к минимуму время простоя машины и (или) устранения неисправности. Между тем главная цель диагностики управляющей ЭВМ - поддерживать готовность системы, т. е. обеспечивать управление объектом и прочие услуги в некоторой минимальной степени, пусть даже с возросшим временем обслуживания. Например, при обработке данных можно пойти на срыв выполнения текущих заданий и передачу всех ресурсов системы в распоряжение диагностических программ. При оперативном управлении система должна сохранять управление важными технологическими величинами. Методы и средства для предотвращения, обнаружения ошибок, восстановления работоспособности программ разделяют на четыре основных группы: 1. Предотвращение ошибок: структурные методы проектирования и реализации программ; 2.Доказательство корректности модулей; тестирование. 3. Обнаружение ошибок: · обследование состояния системы для обнаружения неверного состояния или последовательности таких состояний; · обследование данных и структур данных; · обследование характеристик производительности; использование механизмов защиты программного обеспечения и аппаратуры. Диагностика ошибок: · быстрая регистрация доступной информации об ошибке и ее экспресс-анализ; · детальный анализ последствий ошибки для определения области ее действия и нахождения вероятной причины возникновения; · использование словаря обслуживания, содержащего набор симптоматические причин возникновения ошибок и соответствующих способов исправления. 4. Коррекция и восстановление: · игнорирование ошибки и продолжение выполнения программы; · повторение неверно выполненной операции и продолжение вычислений, если это повторение оказалось успешным; · возврат к точке возникновения ошибки и перезапуск с этой точки; восстановление данных и структур данных, возобновление вычислений так, как это указано в одном из предыдущих пунктов; · начальный перезапуск. Контроль обращения к программе. Для обнаружения неправильных переходов в процессе реализации подпрограммы перед ее выполнением в определенные ячейки (точки контроля неправильных переходов) записываются команды Отсутствие операций. После выполнения подпрограммы в точки контроля записываются команды перехода к программе обнаружения нарушений работоспособности. В случае неправильного перехода при достижении контрольной точки управление будет передано программе контроля (рис.8.1):
Рисунок 7.1 – Алгоритм контроля обращения к программе (подпрограмме) Программу контроля переходов оформляют в виде низкоприоритетной программы, осуществляющей предварительную засылку в неиспользуемые ячейки кодов команд с операцией Переход на подпрограмму и адресом программы идентификации нарушений. Засылка выполняется программой начального пуска системы, а также после реализации высокоприоритетных программ. Рисунок 7.2 – Алгоритм контроля обращений к подпрограммам
|