Проверяемый текст
Птицын, Сергей Вячеславович; Моделирование процессов принятия решений в автоматизированной системе управления региональным газораспределительным предприятием (Диссертация 2007)
[стр. 37]

источник был выбран основным, и каким образом производились согласование и очистка данных.
4.
Информация о периодичности обновлений данных.
Желательно знать не только то, какому моменту времени соответствуют интересующие его данные, но и когда они в следующий раз будут обновлены.
5.
Информация о владельцах данных.
Пользователю OLAP-системы может оказаться полезной информация о наличии в системе данных, к которым он не имеет доступа, о владельцах этих данных и о действиях, которые он должен предпринять, чтобы получить доступ к данным.
6.
Статистические оценки времени выполнения запросов.
До выполнения запроса
нолезно иметь хотя бы приблизительную оценку времени, которое потребуется для получения ответа, и объема этого ответа.
Уже сейчас известны примеры хранилищ данных, содержащих терабайты информации.
По данным консалтинговой компании
Mela Group, около половины корпораций, использующих или планирующих использовать хранилища данных, предполагает довести их объем до сотен гигабайт.
Проблемой таких больших хранилищ является то, что накладные расходы на внешнюю память возрастают нелинейно при возрастании объема хранилища.
Исследования, проведенные на основе тестового набора TPC-D, показали, что
для баз данных объемом в 100 гигабайт потребуется внешняя память объемом в 4.87 раза большая, чем нужно собственно для полезных данных.
При дальнейшем росте баз данных этот коэффициент увеличивается.
Варианты реализации хранилищ данных • Виртуальное хранилище данных • Витрины данных • Глобальное хранилище данных • Многоуровневая архитектура хранилища данных В основе Виртуального хранилища данных репозиторий метаданных, которые описывают источники информации (БД транзакционных систем, внешние файлы и др.), SQL-запросы для их считывания и процедуры обра
[стр. 46]

реализации.
Например, прежде, чем менеджер корпорации задаст системе свой вопрос, он должен понять, какая информация имеется, насколько она актуальна, можно ли ей доверять, сколько времени может занять формирование ответа и т.д.
Для пользователя OLAP-системы требуются метаданные, по крайней мере, следующих типов: 1.
Описания структур данных, их взаимосвязей.
2.
Информация о хранимых на хранилище данных и поддерживаемых им агрегатах данных.
3.
Информация об источниках данных и о степени их достоверности.
Одна и та же информация могла попасть в хранилище данных из разных источников.
Пользователь должен иметь возможность узнать, какой источник был выбран основным, и каким образом производились согласование и очистка данных.
4.
Информация о периодичности обновлений данных.
Желательно знать не только то, какому моменту времени соответствуют интересующие его данные, но и когда они в следующий раз будут обновлены.
5.
Информация о владельцах данных.
Пользователю OLAP-системы может оказаться полезной информация о наличии в системе данных, к которым он не имеет доступа, о владельцах этих данных и о действиях, которые он должен предпринять, чтобы получить доступ к данным.
6.
Статистические оценки времени выполнения запросов.
До выполнения запроса
полезно иметь хотя бы приблизительную оценку времени, которое потребуется для получения ответа, и объема этого ответа.
Уже сейчас известны примеры хранилищ данных, содержащих терабайты информации.
По данным консалтинговой компании
Meta Group, около половины корпораций, использующих или планирующих использовать хранилища данных, предполагает довести их объем до сотен гигабайт.
Проблемой таких больших хранилищ является то, что накладные расходы на внешнюю память возрастают нелинейно при возрастании объема хранилища.
Исследования, проведенные на основе тестового набора TPC-D, показали, что
46

[стр.,47]

для баз данных объемом в 100 гигабайт потребуется внешняя память объемом в 4.87 раза большая, чем нужно собственно для полезных данных.
При дальнейшем росте баз данных этот коэффициент увеличивается.
Варианты реализации хранилищ данных • Виртуальное хранилище данных • Витрины данных • Глобальное хранилище данных • Многоуровневая архитектура хранилища данных В основе Виртуального хранилища данных репозиторий метаданных, которые описывают источники информации (БД транзакционных систем, внешние файлы и др.), SQL-запросы для их считывания и процедуры обработки
и предоставления информации.
Непосредственный доступ к последним обеспечивает ПО промежуточного слоя.
В этом случае избыточность данных нулевая.
Конечные пользователи фактически работают с транзакционными системами напрямую со всеми вытекающими отсюда плюсами (доступ к "живым" данным в реальном времени) и минусами (интенсивный сетевой трафик, снижение производительности OLTP-систем и реальная угроза их работоспособности вследствие неудачных действий пользователейаналитиков).
Витрина данных (Data Mart) по своему исходному определению это набор тематически связанных баз данных, которые содержат информацию, относящуюся к отдельным аспектам деятельности корпорации.
По сути дела, витрина данных это облегченный вариант хранилища данных, содержащий только тематически объединенные данные.
Целевая база данных максимально приближена к конечному пользователю и может содержать тематически ориентированные агрегатные данные.
Витрина данных, естественно, существенно меньше по объему, чем корпоративное хранилище данных, и для его реализации не требуется особо мощная вычислительная техника.
В последнее время все более популярной становится идея совместить концепции хранилища и витрины данных в одной реализации и использовать 47

[Back]