1.1.2. Обеспечение надежности программ с помощью введения избыточности Отсутствие физического разрушения компонент функционирующего комплекса программ позволяет добиваться высокой автоматизации программного восстановления. Главной задачей становится восстановление за время, не превышающее порогового значения между сбоем и отказом. В результате можно преобразовать отказы в сбои и тем самым улучшить показатели надежности функционирования системы. Для решения этой задачи в программной системе должны быть средства, позволяющие: ■ проводить систематический контроль и обнаруживать аномалии процесса функционирования или состояния программ и данных; ■ диагностировать обнаруженные искажения; выбирать методы и средства оперативного восстановления (рестарта); ■ реализовывать оперативное восстановление нормальной работоспособности; * регистрировать каждый происшедший сбой или отказ и обобщать с данными предыдущих искажений для выявления систематических случаев, требующих доработки программ или аппаратуры. Реализация средств с такими функциями осуществляется за счет введения избыточности в программы, данные и процесс функционирования программного комплекса: * программной, включающей все программные компоненты, предназначенные для контроля, обнаружения, диагностики и восстановления работоспособности; ■ информационной, заключающейся в дублированном хранении данных и средств кодовой помехозащиты информации; ■ временной, состоящей в выделении необходимых резервов процессорного времени ЭВМ на исполнение программ, 19 |
появление на входе программы реальных данных, попадающих в непроверенные при тестировании и испытаниях области П1 или IV, -вероятности Рщ и Piv; проявление ошибки при обработке этих данных, достаточной для вызова отказовой ситуации, вероятность Ро, ~ длительность восстановления после возникновения отказовой ситуации превысила пороговое значение между отказом и сбоем вероятность Р* В некоторой области изменения исходных данных (область IV) правильность и надежность программы оказываются взаимосвязанными. Это соответствует данным, определенным техническим заданием и не проверенным при тестировании. Отсутствие физического разрушения компонент функционирующего КП позволяет добиваться высокой автоматизации программного восстановления. Главной задачей становится восстановление за время, не превышающее порогового значения между сбоем и отказом. В результате можно преобразовать откаш в сбои и тем самым улучшить показатели надежности функционирования системы. Для решения этой задачи в КП должны быть средства, позволяющие: проводить систематический контроль и обнаруживать аномалии процесса функционирования или состояния программ и данных; диагностировать обнаруженные искажения; выбирать методы и средства оперативного восстановления (рестарта); реализовывать оперативное восстановление нормальной работоспособности; регистрировать каждый происшедший сбой или отказ и обобщать с данными предыдущих искажений для выявления систематических случаев, требующих доработки программ или аппаратуры. Реализация средств с такими функциями осуществляется за счет 37 введения избыточности в программы, данные и процесс функционирования КП: программной, включающей все программные компоненты, предназначенные для контроля, обнаружения, диагностики и восстановления работоспособности КП; информационной, заключающейся в дублированном хранении данных и средств кодовой помехозащиты информации; временной, состоящей в выделении необходимых резервов процессорного времени ЭВМ на исполнение программ, обеспечивающих оперативный контроль и восстановление (рестарт) функционирования КП. Перечисленные виды избыточности используются совместно и требуют некоторых ресурсов ЭВМ по объему оперативной памяти, памяти команд и производительности. Доля этих ресурсов обычно находится в пределах 5...10 % от максимального значения, однако при таких даже относительно небольших затратах надежность функционирования (наработка на отказ) программ возрастает на один-два порядка. Критерии, используемые в теории надежности, являются статистическими и в том или ином виде учитывают временные показатели. В зависимости от целевого назначения систем для анализа показателей надежности их целесообразно разделить на два класса: невосстанавливаемые и восстанавливаемые. Для оценки надежности восстанавливаемых систем (программ) необходимо знать характеристики многократных отказов и восстановлений в процессе их функционирования. Процесс восстановления достаточно полно описывается показателями: вероятностью восстановления за некоторое время, плотностью распределения времени восстановления и средним временем восстановления. Объединение характеристик отказов и восстановлений производится в следующих критериях: наработка на отказ и коэффициент готовности. 38 |