Проверяемый текст
Савин, Сергей Владимирович. Оптимизация формирования и управления развитием кластерных структур катастрофоустойчивых систем обработки информации (Диссертация 2004)
[стр. 83]

Немаловажным элементом надежных систем является диагностика компонентов: перегрева процессора, памяти, системной платы, а также S контроль возникновения ошибок.
Диагностика позволяет предупредить аварию и вовремя заменить блок, который пока еще работает корректно, но уже «дышит на ладан».
Если в системе предусмотрена горячая замена данного компонента, то это позволяет исправить поломку еще до ее возникновения.

Далее основное внимание уделяется кластеризации.
Имеется две реализации кластеров, обеспечивающих совместную работу нескольких компьютеров: аппаратная и программная
[17].
Аппаратный кластер предусматривает специальные компоненты для поддержки целостности кластера и обрабатываемых им данных.
Программный позволяет реализовать кластер из универсальных серверов и сетевых технологий, но требует поддержки со стороны операционной системы: баланса загрузки, контроля работоспособности узлов, перераспределения ресурсов и решения других задач.
Собственно аппаратные кластеры выпускаются уже давно, а сегодня начали появляться и программные кластеры.

В работе рассматривается решение проблемы увеличения аппаратной * надёжности путем кластеризации.
Причём кластеры будут рассматриваться на качественно более высоком уровне с точки зрения катастрофоустойчивости.
В [27] катастрофоустойчивость определяется как способность к восстановлению работы приложений и данных за минимально короткий период времени после катастрофы.
Под катастрофами понимаются не только пожар, наводнение или землетрясение, но также возможные непредвиденные сбои в работе служб, разрушение данных или повреждение всего центра обработки (например, в результате аварий в ходе ремонтных работ, умышленной диверсии или саботажа).
Развитие катастрофоустойчивой архитектуры (рис.

3.2.1) предполагает обеспечение защиты от незапланированных простоев во время, и после катастрофы в географически распределенных узлах кластера, при которой отказ одного 83
[стр. 31]

жестких дисков, поскольку для этого нужно реализовать динамическую перестройку операционной системы.
Кроме того, необходимо правильно спроектировать корпус сервера, который позволял бы менять внутренние элементы, не вынимая весь сервер из монтажной стойки.
Диагностика.
Немаловажным элементом надежных систем является диагностика компонентов: перегрев процессора, памяти, системной платы, а также
контроль возникновения ошибок.
Диагностика позволяет предупредить аварию и вовремя заменить блок, который пока еще работает корректно, но уже «дышит на ладан».
Если в системе предусмотрена горячая замена данного компонента, то это позволяет исправить поломку еще до ее возникновения.

Правильная диагностика важна для тех серверов, доступ к которым получить не очень просто, например, если они располагаются на технической площадке провайдера.
Кластеризация.
Имеется две реализации кластеров, обеспечивающих совместную работу нескольких компьютеров: аппаратная и программная.

Аппаратный кластер предусматривает специальные компоненты для поддержки целостности кластера и обрабатываемых им данных.
Программный позволяет реализовать кластер из универсальных серверов и сетевых технологий, но требует поддержки со стороны операционной системы: баланса загрузки, контроля работоспособности узлов, перераспределения ресурсов и решения других задач.
Собственно аппаратные кластеры выпускаются уже давно, а сегодня начали появляться и программные кластеры.

Различные производители серверных платформ используют комбинации этих механизмов, стремясь реализовать их с меньшими затратами, а на некоторые компоненты надежных систем есть уже и промышленные стандарты это, прежде всего, касается подсистем хранения с RAID-массивами и микросхем памяти с коррекцией ошибок.
Таким способом даже в простых системах можно уменьшить вероятность потери данных, однако, их доступность при этом не увеличивается.
Для повышения доступности данных и приложений нужно обеспечить постоянную работу процессоров и сетевых соединений.
Собственно, для увеличения надежности сетевых соединений, как и для блоков питания, достаточно их дублировать и обеспечить горячую замену, хотя придется предусмотреть механизмы перераспределения загрузки и контроля работоспособности.
Именно этим путем идут сегодня вес производители серверного оборудования [25].
Более сложной проблемой является обеспечение непрерывной работы процессоров, что возможно в многопроцессорных серверах, где процессор располагается на отдельном модуле с возможностью горячей замены.
Однако нужно еще обеспечить программную поддержку смены процессорных модулей в 31

[стр.,73]

который позволял бы менять внутренние элементы, не вынимая весь сервер из монтажной стойки.
Немаловажным элементом надежных систем является диагностика компонентов: перегрева процессора, памяти, системной платы, а также
контроль возникновения ошибок.
Диагностика позволяет предупредить аварию и вовремя заменить блок, который пока еще работает корректно, но уже «дышит на ладан».
Если в системе предусмотрена горячая замена данного компонента, то это позволяет исправить поломку еще до ее возникновения.
Далее основное внимание уделяется кластеризации.
Имеется две реализации кластеров, обеспечивающих совместную работу нескольких компьютеров: аппаратная и программная [17].
Аппаратный кластер предусматривает специальные компоненты для поддержки целостности кластера и обрабатываемых им данных.
Программный позволяет реализовать кластер из универсальных серверов и сетевых технологий, но требует поддержки со стороны операционной системы: баланса загрузки, контроля работоспособности узлов, перераспределения ресурсов и решения других задач.
Собственно аппаратные кластеры выпускаются уже давно, а сегодня начали появляться и программные кластеры.
В работе рассматривается решение проблемы увеличения аппаратной надёжности путем кластеризации.
Причём кластеры будут рассматриваться на качественно более высоком уровне с точки зрения катастрофоустойчивости.
В [27] катастрофоустойчивость определяется как способность к восстановлению работы приложений и данных за минимально короткий период времени после катастрофы.
Под катастрофами понимаются не только пожар, наводнение или землетрясение, но также возможные непредвиденные сбои в работе служб, разрушение данных или повреждение всего центра обработки (например, в результате аварий в ходе ремонтных работ, умышленной диверсии или саботажа).
Развитие катастрофоустойчивой архитектуры (рис.

2.2.1) предполагает обеспечение защиты от незапланированных простоев во время, и после катастрофы в географически распределенных узлах кластера, при которой отказ одного узла не приводит к прекращению работы всей системы.
Как правило, поддержка катастрофоустойчивой конфигурации не ограничивается развертыванием только аппаратно-программных решений (организация кластера, установка программных компонентов управления производительностью, ресурсами, инфраструктурой и др.), а должна включать специальные виды услуг, предоставляемые производителем, третьей компанией или выполняемые самим заказчиком (мониторинг работоспособности, резервное копирование и т.д.)Например, ряд решений, направленные на обеспечение 73

[Back]