узла не приводит к прекращению работы всей системы. Как правило, поддержка катастрофоустойчивой конфигурации не ограничивается развертыванием только аппаратно-программных решений (организация кластера, установка программных компонентов управления производительностью, ресурсами, инфраструктурой и др.), а должна включать специальные виды услуг, предоставляемые производителем, третьей компанией или выполняемые самим заказчиком (мониторинг работоспособности, резервное копирование и т.д.). Например, ряд решений, направленные на обеспечение катастрофоустойчивости и основанные на использовании технологий компании Hewlett-Packard, рассмотрен в работе [ 68]. Клиентские соединения Рис. 3.2.1 Катастрофоустойчивая архитектура 3.2.2. Типы кластеров В данной работе рассматривается проблема управления развитием информационно-технической инфраструктуры АСУ ССС, успешное решение которой обеспечит оптимальный план развития информационного пространства [61, 65] системы в целом. Развивая подход, описанный в предыдущем разделе, будем считать, что управление развитием заключается в определении моментов ввода типов кластеров, определении структуры серверной сети в каждый период планирования и определении потоков |
который позволял бы менять внутренние элементы, не вынимая весь сервер из монтажной стойки. Немаловажным элементом надежных систем является диагностика компонентов: перегрева процессора, памяти, системной платы, а также контроль возникновения ошибок. Диагностика позволяет предупредить аварию и вовремя заменить блок, который пока еще работает корректно, но уже «дышит на ладан». Если в системе предусмотрена горячая замена данного компонента, то это позволяет исправить поломку еще до ее возникновения. Далее основное внимание уделяется кластеризации. Имеется две реализации кластеров, обеспечивающих совместную работу нескольких компьютеров: аппаратная и программная [17]. Аппаратный кластер предусматривает специальные компоненты для поддержки целостности кластера и обрабатываемых им данных. Программный позволяет реализовать кластер из универсальных серверов и сетевых технологий, но требует поддержки со стороны операционной системы: баланса загрузки, контроля работоспособности узлов, перераспределения ресурсов и решения других задач. Собственно аппаратные кластеры выпускаются уже давно, а сегодня начали появляться и программные кластеры. В работе рассматривается решение проблемы увеличения аппаратной надёжности путем кластеризации. Причём кластеры будут рассматриваться на качественно более высоком уровне с точки зрения катастрофоустойчивости. В [27] катастрофоустойчивость определяется как способность к восстановлению работы приложений и данных за минимально короткий период времени после катастрофы. Под катастрофами понимаются не только пожар, наводнение или землетрясение, но также возможные непредвиденные сбои в работе служб, разрушение данных или повреждение всего центра обработки (например, в результате аварий в ходе ремонтных работ, умышленной диверсии или саботажа). Развитие катастрофоустойчивой архитектуры (рис. 2.2.1) предполагает обеспечение защиты от незапланированных простоев во время, и после катастрофы в географически распределенных узлах кластера, при которой отказ одного узла не приводит к прекращению работы всей системы. Как правило, поддержка катастрофоустойчивой конфигурации не ограничивается развертыванием только аппаратно-программных решений (организация кластера, установка программных компонентов управления производительностью, ресурсами, инфраструктурой и др.), а должна включать специальные виды услуг, предоставляемые производителем, третьей компанией или выполняемые самим заказчиком (мониторинг работоспособности, резервное копирование и т.д.)Например, ряд решений, направленные на обеспечение 73 катастрофоустойчивости и основанные на использовании технологий компании Hewlett-Packard, рассмотрен в работе [68]. Клиентские соединения Рис. 2.2.1 Катастрофоустойчивая архитектура 2.2.2. Типы кластеров В данной работе рассматривается проблема управления развитием информационно-технической инфраструктуры корпорации, успешное решение которой обеспечит оптимальный план развития информационного пространства [61, 65]. Управление развитием заключается в определении моментов ввода типов кластеров, структуру серверной сети в каждый период планирования и потоки мощностей между кластерами различных уровней иерархии (согласно выбранным степеням катастрофоустойчивости) с учетом динамики изменения потребностей абонентов каждого структурного компонента (сервера) в информационнотехнологических работах и капитальных затрат на ее развитие [38,42-44]. Аппаратно-программные решения для корпоративных структур, обеспечивающие катастрофоустойчивость, соответствуют следующим типам кластеров. Для защиты от катастроф узлы кластера необходимо разнести на достаточное расстояние. Узлы размещаются в разных помещениях, на разных этажах здания, в разных районах города или даже в разных городах или странах. Расстояние между узлами определяется исходя из конкретной ситуации и в соответствии с используемой технологией репликации данных. 74 |