Проверяемый текст
Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)
[стр. 39]

* полученные при решении задачи оптимизации с применением статистического метода.
В п.

1.2 были выделены основные этапы процесса статистического распознавания.
Рассмотрим подробнее эти этапы, а также формирование задачи оптимизации на основе ее общей постановки
[6, 79, 80].
Формирование признакового пространства.
Первоначальный набор признаков
Yl}Y2,...,Y q формируется из числа доступных измерению характеристик распознаваемых объектов таким образом, чтобы полно и всесторонне отразить все наиболее существенные для распознавания свойства.
Однако
увелиi чение размерности признакового пространства повышает вычислительную сложность распознающей процедуры и общие затраты на измерение характериа стик объектов, т.
е.
на получение необходимого числа наблюдений.
Поскольку время обучения и в особенности принятия решения, как правило, ограничено, повышение размерности признакового пространства может оказаться единственным способом увеличения достоверности до требуемого уровня.
Следовательно, требования к размерности признакового пространства с точки зрения повышения достоверности распознавания и минимизации затрат на получение наблюдений (измерений) являются, как уже подчеркивалось, противоречивыми.

9 Отсюда вытекает большая важность проблемы формирования признакового пространства оптимальных размеров.
Традиционные способы формирования новых признаков Хи Х2, ...,
X из первоначального набора признаков Y,,Y2,...,Y q (p < q ) в условиях полного априорного знания основаны на максимизации некоторой функции J(Y,, Y2,..., Y ), называемой критерием и обычно понимаемой как некоторое "расстояние" между классами в признаковом пространстве с координатами Y,, Y2,..., Y .
В других случаях критерий J(Y,, Y2,..., Yq) выражает "диаметр" или "объем" области Qm (см.
рис.

1.3), занимаемой классом в признаковом пространстве, и новые признаки X,, Х2, ..., Хр формируются путем минимизации критерия [64, 78, 87].
Оба варианта критериев по своей сути равнозначны.
Конкретно в качестве критерия J(Y,, Y2, ..., Yq) выбирают
среднеквадратиче39
[стр. 31]

31 1.5.2.
Формирование признакового пространства, т.е.
определение набора признаков X,, Х2, ..., X , пространства является неотъемлемой составной частью процесса распознавания [41].
При этом условия, в которых выполняется это формирование являются весьма противоречивыми.
С одной стороны, выбранная совокупность признаков должна в наибольшей степени отражать все те свойства объектов, которые важны для их распознавания, т.е.
набор признаков Xj, Х2, ..., X должен быть наиболее полным.
С другой стороны, с увеличением размерности р признакового пространства очень быстро возрастают вычислительная сложность процедур обучения и принятия решения, материальные и трудовые затраты на измерение необходимых характеристик объектов, т.е.
на получение наблюдений на этапе обучения и принятия решений.
Сокращение количества признаков уменьшает затраты на проведение измерений и вычислений, но может привести к снижению достоверности распознавания D, которая является основным показателем качества распознавания [74, 85, 87].
Если время на обучение и принятие решения жестко ограничено, то повышение размерности признакового пространства может оказаться единственным средством увеличения достоверности.
Таким образом, одновременное достижение минимума общей размерности признакового пространства и максимума достоверности распознавания оказывается, как правило, невозможным, и, следовательно, одной из основных задач синтеза распознающих систем является выбор из заданного множества признаков Yt,Y2, ..., Yq оптимального набора Xj, Х2, ..., X из р признаков, обеспечивающего требуемый по условиям решаемой задачи уровень достоверности распознавания и минимизирующего затраты на проведение измерений и вычислений [82].
1.5.3.
Другой важной составной частью распознающего процесса является обучение, целью которого является восполнение недостатка априорных знаний о распознаваемых классах путем использования информации о них, содержащейся в обучающих наблюдениях: / Хтт к Х11 Х12 Х1тк Х21 Х22 ”• Х2тк \ (1.5) ЧХ р1 Х р2 **• Х р т к ) где т к количество обучающих наблюдений, k = 1,2,..., К.
Хотя методы и подходы, используемые при обучении, отличаются большим разнообразием (статистические [14, 85], структурные [86], перцептронные, с использованием потенциальных функций [80], логические [28, 29] и др.), конечный результат их использования, как правило, неизменен это эталонные описания Sj, s2, ..., §к, представляющие собой описания характеристик признаков Xt,X 2,...,X для всех распознаваемых классов Sj, s2, ..., sK.
Увеличение продолжительности обучения Тоб, которая во многих случаях вычисляется по формуле [82]

[стр.,35]

35 трольных выборок и размерность признакового пространства [82].
Для определения времени обучения и принятия решения в системах статистического распознавания могут быть использованы полученные в [82] выражения вероятностей ошибок распознавания через объемы обучающих и контрольных выборок и межклассовое расстояние d2 (расстояние Махаланобиса), а также могут быть привлечены известные из теории статистических решений [54, 55] оценки вероятностей ошибок классификации через объемы контрольных выборок.
Однако далеко не всегда удается воспользоваться перечисленными возможностями, так как их применение во всех случаях ограничено теми или иными условиями, связанными с функционированием разрабатываемых систем в реальных обстоятельствах.
Эти ограничения будут рассмотрены позднее.
Тем не менее представляется целесообразным рассмотреть основные результаты, полученные при решении задачи оптимизации (1.7) с применением статистического метода.
В п.

1.5 были выделены основные этапы процесса статистического распознавания.
Рассмотрим подробнее эти этапы, а также формирование задачи оптимизации на основе ее общей постановки
(1.7).
1.6.2.
Формирование признакового пространства.
Первоначальный набо признаков
Yj, Y2,..., Yq формируется из числа доступных измерению характеристик распознаваемых объектов таким образом, чтобы полно и всесторонне отразить все наиболее существенные для распознавания свойства.
Однако
увеличение размерности признакового пространства повышает вычислительную сложность распознающей процедуры и общие затраты на измерение характеристик объектов, т.
е.
на получение необходимого числа наблюдений.
Поскольку время обучения и в особенности принятия решения, как правило, ограничено, повышение размерности признакового пространства может оказаться единственным способом увеличения достоверности до требуемого уровня.
Следовательно, требования к размерности признакового пространства с точки зрения повышения достоверности распознавания и минимизации затрат на получение наблюдений (измерений) являются, как уже подчеркивалось, противоречивыми.

Отсюда вытекает большая важность проблемы формирования признакового пространства оптимальных размеров.
Традиционные способы формирования новых признаков Х ,,Х
2,...,Х из первоначального набора признаков Yj,Y2,..., Y (р < q) в условиях полного априорного знания основаны на максимизации некоторой функции J(Yt, Y2,..., Y ), называемой критерием и обычно понимаемой как некоторое "расстояние" между классами в признаковом пространстве с координатами Yj,Y2,...,Y .
В других случаях критерий J(Y,, У2, Yq) выражает "диаметр" или "объем" области Qm (см.
рис.

1.7), занимаемой классом в признаковом пространстве, и новые признаки X j,X 2,...,X p формируются путем минимизации критерия [65, 80, 87].
Оба варианта критериев по своей сути равнозначны.
Конкретно в качестве критерия J(Y,, Y2,..., Yq) выбирают
среднеквадратическую ошибку аппроксимации при

[стр.,52]

гается при фиксированном значении р , когда т и п , увеличиваясь, оказываются равными своим предельным значениям m = М и n = N .
Если при этом достигнутое значение вероятности ошибки а (М, N, р) остается больше заданного по ус$ ловиям задачи значения а , то единственным путем ее дальнейшего уменьшения остается увеличение размерности признакового пространства р.
Вычисляется значение вероятности ошибки распознавания a(M,N,p) при р = 1,2, ...,р0, до тех пор, пока не окажется, что a(M ,N,p0) < a \ (1.41) Зафиксировав найденное значение р = р0, необходимо решить задачу оптимизации (1.40).
Для ее решения в [82, с.
192] используется итерационная процедура.
Зависимость a (М, N, р) от размерности признакового пространства при 8 = 0,1 приведена в [82, рис.
5.2].
Значения ропт, попт, т опт при 8 = 0,1, 1-а* = 0,9 и различных значениях N и М приведены в [82, табл.
5.1].
Анализ представленных результатов расчетов показывает, что с уменьшением предельных значений объемов обучающих М и контрольной N выборок оптимальное значение размерности признакового пространства ропт, обеспечивающее заданный уровень достоверности распознавания 1 -a = 1р увеличивается.
Аналогичный характер носит взаимосвязь оптимальной размерности признакового пространства ропт с оптимальными объемами обучающих т опт и контрольной попт выборок: увеличение последних приводит к уменьшению ропт и наоборот.
Таким образом, в тех случаях, когда по условиям функционирования системы распознавания увеличение с целью обеспечения требуемой достоверности значения какого-либо из ее параметров (например времени обучения или/и распознавания) оказывается невозможным, заданный уровень может быть достигнут увеличением другого параметра (например, размерности признакового пространства).
52

[Back]