Интегрированность означает, что, например данные об объектах (клиентах, подразделениях, результатах их деятельности и т.п.), полученные из различных источников, хранятся согласованно и централизованно. Например, применительно к банковской сфере полная информация об объекте клиенте может включать данные, поступившие как из основной автоматизированной банковской системы, так и из фронт-офисного или иного приложения. Хранилище содержит данные в исторической ретроспективе. Иными словами, если в оперативных источниках представлены самые последние значения (например, текущее наименование клиента или его физический адрес), то хранилище данных будет содержать в себе всю их предысторию с указанием периода, когда тс или иные данные были актуальны. Хранилище данных предназначено для поддержки принятия решений, и его пользователи — это высший и средний руководящий состав, аналитики, представители подразделений финансового анализа и маркетинга. Информационные задачи, решаемые с использованием ОЬАР-средств в основном сводятся к оперативной предварительной обработке и отображению данных [81]. Такими задачами являются: обеспечение полноты и достоверности хранимых данных «очистка» введенных данных, включая проверку на непротиворечивость; обеспечения доступа к сложным многомерным данным в любом заданном разрезе (формирование сложных запросов); обеспечение отображения сложных многомерныхданных в удобном для восприятия виде. При этом особым требованием выступает предоставление пользователю результатов анализа за приемлемое время (обычно не более 5 секунд), пусть даже ценой менее детального анализа. Процедуры очистки данных, которые являются ключевыми с точки зрения обеспечения работоспособности сложных СППР, обеспечивают выявление и удаление ошибок и несоответствий в данных с целью 20 |
нацелена на содержательный анализ информации, а не просто на автоматизацию процессов обработки данных. Это свойство определяет архитектуру построения хранилища и принципы проектирования модели данных, отличные от тех, что применяются в оперативных СОД. Интегрированность означает, что, например данные об объектах (клиентах, подразделениях, результатах их деятельности и т.п.), полученные из различных источников, хранятся согласованно и централизованно. Например, применительно к банковской сфере полная информация об объекте клиенте может включать данные, поступившие как из основной автоматизированной банковской системы, так и из фронт-офисного или иного приложения. Хранилище содержит данные в исторической ретроспективе. Иными словами, если в оперативных источниках представлены самые последние значения (например, текущее наименование клиента или его физический адрес), то хранилище данных будет содержать в себе всю их предысторию с указанием периода, когда те или иные данные были актуальны. Хранилище данных предназначено для поддержки принятия решений, и его пользователи — это высший и средний руководящий состав, аналитики, представители подразделений финансового анализа и маркетинх-а. Информационные задачи, решаемые с использованием ОЬАР-средств в основном сводятся к оперативной предварительной обработке и отображению данных [81]. Такими задачами являются: обеспечение полноты и достоверности хранимых данных «очистка» введенных данных, включая проверку на непротиворечивость; обеспечения доступа к сложным многомерным данным в любом заданном разрезе (формирование сложных запросов); обеспечение отображения сложных многомерных данных в удобном для восприятия виде. При этом особым требованием выступает предоставление пользователю результатов анализа за приемлемое время (обычно не более 5 с), пусть даже ценой менее детального анализа. 18 Процедуры очистки данных, которые являются ключевыми с точки зрения обеспечения работоспособности сложных СППР, обеспечивают выявление и удаление ошибок и несоответствий в данных с целью улучшения их качества. Проблемы с качеством встречаются в отдельных наборах данных таких, как файлы и базы данных например, как результат ошибок при вводе, утери информации и других искажений данных. Когда интеграции подлежат данные множества источников данных, например в хранилищах, интегрированных системах баз данных необходимость в очистке данных существенно возрастает. Причиной этого является множественность источников, от которых зачастую поступают неполные разрозненные данные об объектах описания, отражающие различные их стороны. Для обеспечения доступа к точным и согласованным данным необходима консолидация гг. различных представлений данных и исключение дублирующейся информации Основные задачи в области очистки данных, подлежащие решению при их обработке .и преобразовании, тесно связаны и поэтому должны решаться в комплексе. Преобразование данных требуется для поддержки любых изменений в структуре, представлении или содержании данных. Эти преобразования становятся необходимы в разных ситуациях, например при изменении структуры данных, переходе на новую информационную систему или в случае, когда нужно интегрировать множественные источники данных. Как показано на рис. 1.3, задачи очистки можно разделить на две группы очистка данных отдельного и множества источников. В каждой из этих групп содержание задач очистки определяется качеством используемой в БД схемы представления данных и собственно содержанием самого элемента данных. Проблемы уровня схемы, разумеется, отражаются и в элементах данных; они решаются с помощью ее улучшения, трансляции и интеграции схемы данных. С другой стороны, проблемы уровня элемента данных связаны с ошибками и несоответствиями в содержимом текущих данных, незаметных на уровне схемы. Они-то и являются основной целью очистки. 19 |