100 ей ключа в таблицу фактов не требуют концептуальной перестройки всего логического представления данных в ХД; • уменьшаются аппаратные требования к клиентским рабочим станциям, поскольку ХД организуется, как правило, с применением архитектуры клиент-сервер, в которой запросы выполняются на серверной стороне, разгружая тем самым рабочие станции; • в реляционных СУБД более развиты средства защиты данных и разграничения доступа, что особенно актуально в случае наличия в ХД конфиденциальной информации и многопользовательского доступа к ней; • реляционные СУБД поддерживают работу с данными очень большого объема вплоть до нескольких терабайт. Таким образом, организация ХД на базе реляционной СУБД является оптимальным выбором в случае относительно часто изменяющейся структуры ХД, необходимости разграничения доступа к сверхбольшим объемам данных при умеренных требованиях к скорости выполнения запросов. Альтернативой реляционной модели данных для реализации многомерного представления данных в ХД является подход, в котором логическое представление данных также является многомерным. В этом случае гиперкубы ХД представляется с помощью упорядоченных многомерных массивов. Благодаря этой выборка данных из ХД осуществляется значительно быстрее, а также становится возможным выполнение многих сложных запросов, которые в реляционных СУБД трудно реализовать. К недостаткам многомерных СУБД можно отнести невозможность работать с данными, объем которых превышает несколько десятков гигабайт, а также отсутствие единых стандартов описания, манипулирования многомерными данными и интерфейс с подобными системами. Следовательно, областью применения многомерных СУБД можно считать ХД небольшого объема со стабильным набором измерений в гиперкубах и высокими требованиями к скорости выполнения нерегламентированных запросов. |
Использование реляционной модели данных для OLAP-анализа имеет следующие преимущества: облегчается добавление новых измерений в виртуальный гиперкуб, поскольку добавление одной таблицы измерения и соответствующего ей ключа в таблицу фактов не требуют концептуальной перестройки всего логического представления данных в ХД; уменьшаются аппаратные требования к клиентским рабочим 38 станциям, поскольку ХД организуется, как правило, с применением архитектуры клиент-сервер, в которой запросы выполняются на серверной стороне, разгружая тем самым рабочие станции; в реляционных СУБД более развиты средства защиты данных и разграничения доступа, что особенно актуально в случае наличия в ХД конфиденциальной информации и многопользовательского доступа к ней; реляционные СУБД поддерживают работу с данными очень большого объема вплоть до нескольких терабайт. Таким образом, организация ХД на базе реляционной СУБД является оптимальным выбором в случае относительно часто изменяющейся структуры ХД, необходимости разграничения доступа к сверхбольшим объемам данных при умеренных требованиях к скорости выполнения запросов. Альтернативой реляционной модели данных для реализации многомерного представления данных в ХД является подход, в котором логическое представление данных также является многомерным. В этом случае гиперкубы ХД представляется с помощью упорядоченных многомерных массивов. Благодаря этой выборка данных из ХД осуществляется значительно быстрее, а также становится возможным выполнение многих сложных запросов, которые в реляционных СУБД трудно реализовать. К недостаткам многомерных СУБД можно отнести невозможность работать с данными, объем которых превышает несколько десятков гигабайт, а также отсутствие единых стандартов описания, манипулирования многомерными данными и интерфейс с подобными системами. Следовательно, областью применения многомерных СУБД можно считать ХД небольшого объема со стабильным набором измерений в гиперкубах и высокими требованиями к скорости выполнения нерегламентированных запросов. Анализ методами ИАД. ИАД, в отличие от OLAP-анализа, направлен, в первую очередь, на выявление новой, ранее недоступной информации на основании анализа больших объемов накопленных данных. В [11, 81] ИАД определен как процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). Большинство методов ИАД были разработаны в рамках теории искусственного интеллекта в 70-80х годах , однако более широкое применения нашли гораздо позже, когда во многих крупных организациях и предприятиях стала актуальной проблема получения дополнительной выгоды от имеющихся огромных объемов корпоративной информации [80]. Задачи, решаемые в рамках ИАД, как правило, классифицируются по типам производимой информации. В [80, 50] выделяются следующие пять видов: 1. Классификация. При решении этой задачи происходит соотнесение рассматриваемых объектов на основе имеющихся признаков с теми или иными классами предопределенной иерархии. При решении данной задачи используются алгоритмы типа Lazy-Leaming [87], байесовские сети [68], индукция деревьев решений [50, 16, 2], индукция символьных правил [64, 57], а также нейронные сети [43]. 39 |