Проверяемый текст
Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)
[стр. 38]

исследовании шумоподобных сигналов), а также количественно описать указанные процессы с использованием хорошо развитых методов математической статистики.
Ф В некоторых случаях это может создавать основу для количественного выражения основных параметров распознающего процесса: размерности признакового пространства р, времени обучения и принятия решения через главный показатель качества системы достоверность распознавания.
Это, в свою
г очередь, позволяет реализовать в системах статистического распознавания об-4 щую постановку задачи оптимизации.
В [82] рассматриваются следующие возможности постановки задачи оптимизации.
Для определения размерности р признакового пространства в системах статистического распознавания можно использовать: верхнюю границу Чернова ошибки классификации [87]; общее выражение вероятности ошибки классификации через размерность признакового пространства р, объем контрольной выборки п и межклассовые расстояния (например расстояние
МахаV ланобиса [80]); обобщенную асимптотику Колмогорова, позволяющую выра* зить вероятности ошибок распознавания через асимптотически возрастающиеобъемы обучающих и контрольных выборок и размерность признакового пространства [82].
Для определения времени обучения и принятия решения в системах статистического распознавания могут быть использованы полученные в
I [82] выражения вероятностей ошибок распознавания через объемы обучающихФ и контрольных выборок и межклассовое расстояние а (расстояние Махаланобиса), а также могут быть привлечены известные из теории статистических решений [54, 77, 18, 81] оценки вероятностей ошибок классификации через объемы контрольных выборок.
Однако далеко не всегда удается воспользоваться перечисленными
возф можностями, так как их применение во всех случаях ограничено теми или иными условиями, связанными с функционированием разрабатываемых систем в реальных обстоятельствах.
Эти ограничения будут рассмотрены позднее.
Тем не менее представляется целесообразным рассмотреть основные результаты,
38
[стр. 34]

34 ты, достоверность распознавания, объемы выборок и размерность признакового пространства являются внешними условиями, задаваемыми потребителями.
Внутренние зависимости между параметрами распознающей системы определяются, во-первых, тем, что, как было отмечено выше, размерность признакового пространства р и объемы выборок (обучающих Ш;, i = 1, К и контрольной п) непосредственно влияют на достоверность распознавания, а, во-вторых, тем, что, очевидно, достоверность распознавания определяется также степенью отличия характеристик признаков X,, Х2, ..., Хр у классов s,, s2, ..., sK, проявляющейся в обобщенном виде в межклассовых расстояниях d€r, £, г = 1, К [см.
(1.4)].
Таким образом, центральное место в задаче оптимизации распознающих систем наряду с определением критерия оптимальности занимает получение в удобной для практического использования форме зависимости достоверности распознавания от других параметров распознающей системы и межклассовых расстояний.
1.6.
Статистические методы распознавания 1.6.1.
В [85, 82] произведен подробный анализ различных методов распо знавания с позиций оптимизации.
Рассмотрены детерминистские методы распознавания, основанные на использовании потенциальных функций и перцептронных алгоритмов [80], методы синтаксического (структурного, лингвистического) распознавания [74, 80, 86], логические распознающие системы [28, 29] и алгоритмы логического распознавания, основанные на вычислении оценок [40, 74], алгебраические методы [40].
При этом сделан вывод о том, что статистические методы распознавания [14, 35, 65, 85, 87] позволяют в полной мере отразить тонкую структуру и все особенности проявления распознаваемых объектов через описывающие их признаки как при обучении, так и при принятии решений с учетом всех дестабилизирующих факторов (что особенно важно при исследовании шумоподобных сигналов), а также количественно описать указанные процессы с использованием хорошо развитых методов математической статистики.
В некоторых случаях это может создавать основу для количественного выражения основных параметров распознающего процесса: размерности признакового пространства р, времени обучения и принятия решения через главный показатель качества системы достоверность распознавания.
Это, в свою
очередь, позволяет реализовать в системах статистического распознавания общую постановку задачи оптимизации (1.7).
В [82] рассматриваются следующие возможности постановки задачи оптимизации.
Для определения размерности р признакового пространства в системах статистического распознавания можно использовать: верхнюю границу Чернова ошибки классификации [87]; общее выражение вероятности ошибки классификации через размерность признакового пространства р, объем контрольной выборки п и межклассовые расстояния (например расстояние
Махаланобиса [85]); обобщенную асимптотику Колмогорова, позволяющую выразить вероятности ошибок распознавания через асимптотически возрастающие объемы обучающих и кон

[стр.,35]

35 трольных выборок и размерность признакового пространства [82].
Для определения времени обучения и принятия решения в системах статистического распознавания могут быть использованы полученные в
[82] выражения вероятностей ошибок распознавания через объемы обучающих и контрольных выборок и межклассовое расстояние d2 (расстояние Махаланобиса), а также могут быть привлечены известные из теории статистических решений [54, 55] оценки вероятностей ошибок классификации через объемы контрольных выборок.
Однако далеко не всегда удается воспользоваться перечисленными
возможностями, так как их применение во всех случаях ограничено теми или иными условиями, связанными с функционированием разрабатываемых систем в реальных обстоятельствах.
Эти ограничения будут рассмотрены позднее.
Тем не менее представляется целесообразным рассмотреть основные результаты,
полученные при решении задачи оптимизации (1.7) с применением статистического метода.
В п.
1.5 были выделены основные этапы процесса статистического распознавания.
Рассмотрим подробнее эти этапы, а также формирование задачи оптимизации на основе ее общей постановки (1.7).
1.6.2.
Формирование признакового пространства.
Первоначальный набо признаков Yj, Y2,..., Yq формируется из числа доступных измерению характеристик распознаваемых объектов таким образом, чтобы полно и всесторонне отразить все наиболее существенные для распознавания свойства.
Однако увеличение размерности признакового пространства повышает вычислительную сложность распознающей процедуры и общие затраты на измерение характеристик объектов, т.
е.
на получение необходимого числа наблюдений.
Поскольку время обучения и в особенности принятия решения, как правило, ограничено, повышение размерности признакового пространства может оказаться единственным способом увеличения достоверности до требуемого уровня.
Следовательно, требования к размерности признакового пространства с точки зрения повышения достоверности распознавания и минимизации затрат на получение наблюдений (измерений) являются, как уже подчеркивалось, противоречивыми.
Отсюда вытекает большая важность проблемы формирования признакового пространства оптимальных размеров.
Традиционные способы формирования новых признаков Х ,,Х 2,...,Х из первоначального набора признаков Yj,Y2,..., Y (р < q) в условиях полного априорного знания основаны на максимизации некоторой функции J(Yt, Y2,..., Y ), называемой критерием и обычно понимаемой как некоторое "расстояние" между классами в признаковом пространстве с координатами Yj,Y2,...,Y .
В других случаях критерий J(Y,, У2, Yq) выражает "диаметр" или "объем" области Qm (см.
рис.
1.7), занимаемой классом в признаковом пространстве, и новые признаки X j,X 2,...,X p формируются путем минимизации критерия [65, 80, 87].
Оба варианта критериев по своей сути равнозначны.
Конкретно в качестве критерия J(Y,, Y2,..., Yq) выбирают среднеквадратическую ошибку аппроксимации при

[Back]