Проверяемый текст

Матвейкин В.Г., Дмитриевский Б.С., Ляпин Н.Р. Информационные системы интеллектуального анализа. – М.: Машиностроение, 2008.

[стр. 85]
Основным достоинством ассоциативных правил является их легкое восприятие человеком и простая интерпретация языками программирования.
Однако они не всегда полезны.
Выделяют три вида правил: полезные правила — содержат действительную информацию, которая ранее была неизвестна, но имеет логичное объяснение.
Такие правила могут быть использованы для принятия решений, приносящих выгоду; тривиальные правила — содержат действительную и легко объяснимую информацию, которая уже известна.
Такие правила, хотя и объяснимы, но не могут принести какой-либо пользы, т.
к.
отражают или известные законы в исследуемой области, или результаты прошлой деятельности.
Иногда такие правила могут использоваться для проверки выполнения решений, принятых на основании предыдущего анализа; непонятные правила — содержат информацию, которая не может быть объяснена.
Такие правила могут быть получены или на основе аномальных значений, или глубоко скрытых знаний.
Напрямую такие правила нельзя использовать для принятия решений, т.
к.
их необъяснимость может привести к непредсказуемым результатам.
Для лучшего понимания требуется дополнительный анализ.
Ассоциативные правила строятся на основе частых наборов.
Так, правила, построенные на основании многоверсионного набора F,(m.e.X uY = f), являются всеми возможными комбинациями объектов, входящих в него.
Например, для набора (term3, term4, term6) могут быть построены следующие правила: если (term3) то (term.4); если (term4) то (term3, term6); если (term3) то (term6); если (term3, term6) то (term4); если (term3) то (term4, term6); если (terra6) то (term4); если (term4, term6) то (term3); если (term6) to (term3); если (term4) то (term3); если (term6) to (term4, term3); 85

[стр. 11]
− Нахождение частых наборов объектов.
− Генерация ассоциативных правил, найденных частых наборов объектов.
Ассоциативные правила имеют следующий вид: Если (условие) то (результат), где условие – обычно не логическое выражение (как в классификационных правилах), а набор объектов из множества I , с которыми связаны (ассоциированы) объекты, включенные в результат данного правила.
Как уже отмечалось, в ассоциативных правилах условие и результат являются объектами множества I : Если X то Y , где ϕ=∪∈∈ YXIYIX ,, .
Ассоциативное правило можно представить как импликацию над множеством: YX ⇒ , где ϕ=∪∈∈ YXIYIX ,, .
Основным достоинством ассоциативных правил является их легкое восприятие человеком и простая интерпретация языками программирования.
Однако они не всегда полезны.
Выделяют три вида правил.
− Полезные правила содержат действительную информацию, которая ранее была неизвестна, но имеет логичное объяснение.
Такие правила могут быть использованы для принятия решений, приносящих выгоду.
− Тривиальные правила содержат действительную и легко объяснимую информацию, которая уже известна.
Такие правила, хотя и объяснимы, но не могут принести какой-либо пользы, так как отражают или известные законы в исследуемой области, или результаты прошлой деятельности.
Иногда такие правила могут использоваться для проверки выполнения решений, принятых на основании предыдущего анализа.
− Непонятные правила содержат информацию, которая не может быть объяснена.
Такие правила могут быть получены или на основе аномальных значений, или глубоко скрытых знаний.
Напрямую такие правила нельзя использовать для принятия решений, так как их необъяснимость может привести к непредсказуемым результатам.
Для лучшего понимания требуется дополнительный анализ.
Ассоциативные правила строятся на основе частых наборов.
Так, правила, построенные на основании набора F (т.е.
FYX =∪ ), являются всеми возможными комбинациями объектов, входящих в него.
Таким образом, количество ассоциативных правил может быть очень большим и тяжело воспринимаемым для человека.
К тому же, не все из построенных правил несут в себе полезную информацию.
Для оценки их полезности вводятся следующие величины.
Поддержка 0 показывает, какой процент транзакций поддерживает данное правило.
Так как правило строится на основании набора, то, значит, правило YX ⇒ имеет поддержку, равную поддержке набора F , который составляют X и Y : D D SuppSupp YXF FYX ∪= ⇒ == .
Очевидно, что правила, построенные на основании одного и того же набора, имеют одинаковую поддержку.
Достоверность показывает вероятность того, что из наличия в транзакции набора X следует наличие в ней набора Y .
Достоверностью правила YX ⇒ является отношение числа транзакций, содержащих наборы X и Y , к числу транзакций, содержащих набор X : X YX X YXF YX Supp Supp D D Conf ∪∪= ⇒ == .
Очевидно, что чем больше достоверность, тем правило лучше, причем у правил, построенных на основании одного и того же набора, достоверность будет разная.
К сожалению, достоверность не позволяет оценить полезность правила.
Если процент наличия в транзакциях набора Y при условии наличия в них набора X меньше, чем процент безусловного наличия набора Y : y X YX YX Supp Supp Supp Conf <= ∪ ⇒ , это значит, что вероятность случайно угадать наличие в транзакции набора Y больше, чем предсказать это с помощью правила YX ⇒ .
Для исправления такой ситуации вводится мера – улучшение.
Улучшение показывает, полезнее ли правило случайного угадывания.
Улучшение правила – это отношение числа транзакций, содержащих наборы X и Y , к произведению количества транзакций, содержащих набор X , и количества транзакций, содержащих набор Y : YX YX YX YXF YX SuppSupp Supp DD D impr * ∪∪= ⇒ == .
Если улучшение больше единицы, то это значит, что с помощью правила предсказать наличие набора Y вероятнее, чем случайное угадывание, если меньше единицы, то наоборот.
В последнем случае можно использовать отрицающее правило, т.е.
правило, которое предсказывает отсутствие набора Y : YX ¬⇒ .
У такого правила улучшение будет больше единицы, так как YY SuppSupp −=¬ 1 .
Таким образом, можно получить правило, которое предсказывает результат лучше, чем случайным образом.
Правда, на практике такие правила мало применимы.
Данные оценки используются при генерации правил.
Аналитик при поиске ассоциативных правил задает минимальные значения перечисленных величин.
В результате те правила, которые не удовлетворяют этим условиям, отбрасываются и не

[Back]