Проверяемый текст
Ананьев Николай Сергеевич. Методы и средства анализа данных в системах поддержки принятия решений (Диссертация 2005)
[стр. 34]

Одной из основных проблем в задачах распознавания является формирование обучающих выборок.
В настоящее время используются, в основном, эвристические методы их формирования, несвободные от субъективных оценок и
не поддающиеся строгой математической формализации.
Разработка формальных методов решения этой проблемы должна быть направлена на создание адаптивных алгоритмов распознавания объектов и ситуаций в хранилищах данных.

Отсутствуют также корректные формальные процедуры оценки эффективности алгоритмов распознавания, в то время как данный вопрос приобретает все большую актуальность в развитии информационных технологий, в т.
ч.
и в интересах поддержки принятия решения.
В настоящее время задача разработки критериев эффективности алгоритмов распознавания* далека от своего решения.
Распространенным критерием является вероятность правильного распознавания объекта, которая вычисляется как сумма диагональных элементов «матриц перепутывания» [13,55].
Однако применение такого подхода на классе задач* для которых сумма диагональных элементов матриц мало отличается друг от друга, оказывается неэффективным.
Критерий эффективности алгоритмов распознавания можно построить с использованием различных мер близости, позволяющих получить оценки степени приближения, «матриц перепутывания» к единичной матрице (которая есть «матрица перепутывания» для идеального алгоритма) [10,13].
В этом случае объектом исследований становится матрица, у которой строки — различные алгоритмы, столбцы меры близости к единичной матрице, а элементы— значения мер близости.
Поскольку различные меры близости по-разному реагируют на отклонение от единичной матрицы, то их свертка (обобщенная характеристика строк) позволяет более адекватно оценить качество алгоритмов распознавания [10].
Такой подход к оценке алгоритмов распознавания должен позволить выбрать наиболее эффективный из них.
В данном случае проблемной задачей является разработка методов
34
[стр. 31]

1.4.2.
Распознавание объектов и ситуаций и обработка информации Устойчивая тенденция роста объемов данных, поступающих на анализ, сокращение времени на подготовку информации к использованию для принятия решения приводит к ужесточению требований к обработке информационных массивов данных.
Одной из ключевых проблем в этих условиях является проблема повышения эффективности распознавания объектов и ситуаций (поиск ассоциаций) [23].
Существующие способы обработки данных при распознавании заданных объектов и ситуаций часто оказываются неудовлетворительными из-за низкой информативности их характеристик (признаков распознавания).
Хотя совершенно очевидно, что именно от выбора признаков и зависит эффективность алгоритмов распознавания.
Решение задачи посгроения эффективных алгоритмов распознавания предполагает проведение оценки информативности признаков на количественной основе.
Существующие методы пригодны только выборок большого объема, поскольку используют статистические методы, требующие корректного учета соответствующих законов распределения признаков как случайных величин [10,36].
При обработке данных получение больших выборок для уникальных объектов практически невозможно из-за временных и стоимостных ограничений.
По этой причине необходим новый подход к понятиям информативности, не использующий вероятностную меру.
Одной из основных проблем в задачах распознавания является формирование обучающих выборок.
В настоящее время используются, в основном, эвристические методы их формирования, несвободные от субъективных оценок и
нс поддающиеся строгой математической формализации.
Разработка формальных методов решения этой проблемы должна быть направлена на создание адаптивных алгоритмов распознавания объектов и ситуаций в хранилищах данных.

31

[стр.,32]

Отсутствуют также корректные формальные процедуры оценки эффективности алгоритмов распознавания, в то время как данный вопрос приобретает все большую актуальность в развитии информационных технологий, в т.
ч.
и в интересах поддержки принятия решения.
В настоящее время задача разработки критериев эффективности алгоритмов распознавания далека от своего решения.
Распространенным критерием является вероятность правильного распознавания объекта, которая вычисляется как сумма диагональных элементов «матриц перепутывания» [13,55].
Однако применение такого подхода на классе задач, для которых сумма диагональных элементов матриц мало отличается друг от друга, оказывается неэффективным.
Критерий эффективности алгоритмов распознавания можно построить с использованием различных мер близости, позволяющих получить оценки степени приближения «матриц перепутывания» к единичной матрице (которая есть «матрица перепутывания» для идеального алгоритма) [10,13].
В этом случае объектом исследований становится матрица, у которой строки различные алгоритмы, столбцы меры близости к единичной матрице, а элементы значения мер близости.
Поскольку различные меры близости поразному реагируют на отклонение от единичной матрицы, то их свертка (обобщенная характеристика строк) позволяет более адекватно оценить качество алгоритмов распознавания [10].
Такой подход к оценке алгоритмов распознавания должен позволить выбрать наиболее эффективный из них.
В данном случае проблемной задачей является разработка методов
агрегирования многомерных данных.
% 32

[Back]