Выводы второй главы 1 .Существующие подходы к разработке новых информационных технологий для использования в интересах ППР предполагают использование методов и критериев эффективности, построенных на основе вероятностных зависимостей. В качестве методов обработки многомерных данных применяются: корреляционный анализ; регрессионный анализ; кластерный анализ; факторный анализ; метод главных компонент; многомерное шкалирование; статистические методы снятия неопределенности. 2.0сновными недостатками вероятностного подхода к анализу сложных систем являются: нахождение "вероятностей простых событий" путем необоснованного допущения о соответствии процессов в сложных системах аксиоматике теории вероятностей (не подвергается сомнению возможность построения алгебры событий, элементом которой является "простое событие"); определение законов распределения случайных величин параметров моделей на основе допущения о справедливости предельных теорем теории вероятностей. ' 3.Требованиями к методу построения обобщенных оценок являются: их гарантированность; возможность использования исходных данных без их нормировки; наглядность оценки; его реализуемость в виде простых, вычислительных алгоритмов, позволяющих их использование в приложениях интеллектуального анализа данных. Использование метода максимума энтропии для снятия неопределенности при обработке многомерных данных позволяет выполнить указанные выше требования, а также устраняет формальные и вычислительные сложности в решении задач кластеризации и получении гарантированных оценок вследствие метрических свойств ее максимального значения и относительной простоты получения ее значения. Одновременно благодаря метрическим свойствам она может использоваться как интегральный критерий, что снимает проблему обоснования критерия в 73 |
характеристик объектов, однако результаты, полученные при применении этих методов, не всегда дают гарантированные оценки. Для решения обозначенных выше задач необходимо провести анализ применяемых в настоящее время методов. 2.2. Методы снятия неопределенности при обработке многомерных данных в задачах поддержки принятия решений. . Существующие подходы к разработке новых информационных технологий для использования в интересах ППР зачастую предполагают использование методов и критериев эффективности, построенных на основе вероятностных зависимостей. В качестве методов обработки многомерных данных применяются: корреляционный анализ; регрессионный анализ; кластерный анализ; факторный анализ; метод главных компонент; многомерное шкалирование; статистические методы снятия неопределенности. Для получения зависимостей, оценки эффективности функционирования систем при обслуживании заявок, содержание которого соответствует функциональному их назначению, оценки уровня качества объектов и т.п. используются следующие показатели: процент заявителей, обслуженных системой с определенным уровнем качества (страховой компанией, системой автоматизированного обучения); вероятность соответствия системы предъявляемым требованиям; вклады отдельных элементов системы и ее подсистем в эффективность системы в целом. время (цикл) обслуживания заявителей, связанный с обработкой информации в системе с различными уровнями качества; затраты на обслуживание заявок (клиентов); полезный эффект (в стоимостном или натуральном выражении), полученный с применением системы. 50 Кроме того, в отличие от теоретико-вероятностного подхода в этих методах независимость признаков не является обязательной [11,37,38,39,40]. Таким образом, методы обработки многомерных разнородных данных, разрабатываемые в интересах создания качественно новых информационных технологий поддержки принятия решения в условиях ограниченных исходных данных, их разнотипности (количественные, качественные, интервальные) и разнородности, а также неопределенности (интервальное представление информации, наличие пропусков, экспертные оценки), должны базироваться на использовании фундаментального принципа максимума энтропии и учитывать специфику данных конкретной предметной области. Программы для ЭВМ должны быть методически и информационно связаны между собой и реализованы на основе общих вычислительных методов и алгоритмов. 2.5 Выводы 1. Существующие подходы к разработке новых информационных технологий для использования в интересах ППР предполагают использование методов и критериев эффективности, построенных на основе вероятностных зависимостей. В качестве методов обработки многомерных данных применяются: корреляционный анализ; регрессионный анализ; кластерный анализ; факторный анализ; метод главных компонент; многомерное шкалирование; статистические методы снятия неопределенности. 2. Основными недостатками вероятностного подхода к анализу сложных систем являются: нахождение “вероятностей простых событий” путем необоснованного допущения о соответствии процессов в сложных системах аксиоматике теории вероятностей (не подвергается сомнению возможность построения алгебры событий, элементом которой является “простое событие”); определение законов распределения случайных величин параметров моделей на основе допущения о справедливости предельных теорем теории вероятностей. 69 3. Требованиями к методу построения обобщенных оценок являются: их гарантированность; возможность использования исходных данных без их нормировки; наглядность оценки; его реализуемость в виде простых, вычислительных алгоритмов, позволяющих их использование в приложениях интеллектуального анализа данных. Использование метода максимума энтропии для снятия неопределенности при обработке многомерных данных позволяет выполнить указанные выше требования, а также устраняет формальные и вычислительные сложности в решении задач кластеризации и получении гарантированных оценок вследствие метрических свойств ее максимального значения и относительной простоты получения сс значения. Одновременно благодаря метрическим свойствам она может использоваться как интегральный критерий, что снимает проблему обоснования критерия в условиях неполноты и многомерности данных. 4. В задачах, в которых состояния систем характеризуются значительно отличающимися распределениями вероятностей, в качестве меры неопределенности часто используется информационная энтропия или энтропия Шеннона. Однако эти меры не всегда пригодны для решения определенных задач, в частности, распознавания ситуаций, в силу того, что эти меры не учитывают порядок следования значений плотности распределения параметров системы, а только сами значения. Предложенный к использованию вид энтропийного функционала позволяет учитывать также и порядок следования элементов системы в задачах, где информация о структуре анализируемых данных является ключевой с точки зрения информационной поддержки принятия решений. 4 70 |