Проверяемый текст
Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)
[стр. 44]

44 достоверностью распознавания являются определяющими факторами при построении распознающей системы.
При фиксированном значении р с увеличением объема обучающих
m и контрольной п выборок вероятность ошибки распознавания а
= Р уменьшается.
Следовательно, с учетом ограничений ее минимально возможное значение достигается
при фиксированном значении р, когда т и п , увеличиваясь, оказываются равными своим предельным значениям m = М и n = N .
Если при этом достигнутое значение вероятности ошибки а (М, N, р) остается больше заданного по условиям задачи значения а*, то единственным путем ее дальнейшего уменьшения остается увеличение размерности признакового пространства р .
Вычисляется значение вероятности ошибки распознавания
а (М, N, р) при р = 1,2,..., р0, до тех пор, пока не окажется, что a (M,N,p0)
(1.41) Зафиксировав найденное значение р = р0, необходимо решить задачу оптимизации (1.40).
Для ее решения в [147, с.
192] используется итерационная процедура.
Зависимость a (М, N, р) от размерности признакового пространства при 8 = 0,1 приведена в
[147, рис.
5.2].
Значения р01ГГ, попт, moirr при 8 = 0,1, 1 -а =0,9 и различных значениях N и М приведены в [147, табл.
5.1].
Анализ представленных результатов расчетов показывает, что с уменьшением предельных значений объемов обучающих М и контрольной N выборок оптимальное значение размерности признакового пространства ропт, обеспечивающее заданный уровень достоверности распознавания 1-a* = 1Р* увеличивается.
Аналогичный характер носит взаимосвязь оптимальной размерности признакового пространства ропт с оптимальными объемами обучающих
шопт и контрольной попт выборок: увеличение последних приводит к уменьшению рош.
и наоборот.
Таким образом, в тех случаях, когда по условиям функционирования системы распознавания увеличение с целью обеспечения требуемой достоверности значения какого-либо из ее параметров (например времени обучения или/и распознавания) оказывается невозможным, заданный уровень может быть достигнут увеличением другого параметра (например, размерности признакового пространства).
[стр. 51]

51 а = J3= (б(р)ехр{Smp / 4} / £л/2я(р 3)!ijj х оо я/2 х Jtp 1•cosp2ф•ехр(1 / 2)(t2^/28mp t sincpj x (1.36) 0—тс/2 xF(^ sinф / -\/2/m + 4 / n j dt бф = a(m, n, p).
Таким образом, задача оптимизации признакового пространства (включающая в себя и оптимизацию суммарного объема обучающих и контрольных наблюдений) записывается следующим образом [82]: ш+ п)р -» min, a (m, n, p) < a*.
(1.37) При заданном 5, учитывая инвариантность решения задачи (1.37) относительно умножения критерия на положительное число, задача переписывается в следующем виде: 5(2ш + п)р -» min, a(m, n, p)(1.38) Если сделать замену переменных х = 25тр; у = бпр, тогда также, как и в одномерном случае (см.
п.
1.7.2), в силу свойств функции (1.36) с достаточной для практических приложений точностью в качестве решения [m*,n*,p*) задачи (1.38) можно принять следующий набор из трех целых чисел: т* = [х 0/(28ро)] + 1, п*=[у0/(5р0)]+ 1, р*=р0, (1.39) где х0,у0,р0 (р0 целое число) являются решениями следующей экстремальной задачи [82]: х + у —»min; a = Р = 0(р)ехр(х / 8)/ л/27г(р 3)!ijj х оо к/2 х J Jtp 1-cosp 2ф-ехр-(1/2)^2л /х ^ я т ф Ц х (1-40) О-я/2 х Ffвтф / (2л/1Т Ж Т Ш )]А Д р = a * В реальных системах распознавания максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m < М, n < N ), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые во многих случаях наряду с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы.
При фиксированном значении р с увеличением объема обучающих m и контрольной п выборок вероятность ошибки распознавания
a = (3 уменьшается.
Следовательно, с учетом ограничений ее минимально возможное значение дости


[стр.,52]

гается при фиксированном значении р , когда т и п , увеличиваясь, оказываются равными своим предельным значениям m = М и n = N .
Если при этом достигнутое значение вероятности ошибки а (М, N, р) остается больше заданного по ус$ ловиям задачи значения а , то единственным путем ее дальнейшего уменьшения остается увеличение размерности признакового пространства р.
Вычисляется значение вероятности ошибки распознавания
a(M,N,p) при р = 1,2, ...,р0, до тех пор, пока не окажется, что a(M ,N,p0) < a \ (1.41) Зафиксировав найденное значение р = р0, необходимо решить задачу оптимизации (1.40).
Для ее решения в
[82, с.
192] используется итерационная процедура.
Зависимость a (М, N, р) от размерности признакового пространства при 8 = 0,1 приведена в
[82, рис.
5.2].
Значения ропт, попт, т опт при 8 = 0,1, 1-а* = 0,9 и различных значениях N и М приведены в [82, табл.
5.1].
Анализ представленных результатов расчетов показывает, что с уменьшением предельных значений объемов обучающих М и контрольной N выборок оптимальное значение размерности признакового пространства ропт, обеспечивающее заданный уровень достоверности распознавания 1 -a = 1р увеличивается.
Аналогичный характер носит взаимосвязь оптимальной размерности признакового пространства ропт с оптимальными объемами обучающих
т опт и контрольной попт выборок: увеличение последних приводит к уменьшению ропт и наоборот.
Таким образом, в тех случаях, когда по условиям функционирования системы распознавания увеличение с целью обеспечения требуемой достоверности значения какого-либо из ее параметров (например времени обучения или/и распознавания) оказывается невозможным, заданный уровень может быть достигнут увеличением другого параметра (например, размерности признакового пространства).

52

[стр.,103]

для того, чтобы избежать генерирования "лишних" опорных сигналов, можно применять методы разведочного анализа данных (РАД) [2], позволяющие быстро оценить вид и основные параметры распределения исследуемых входных процессов (в данном случае низкая точность оценок при использовании РАД не играет роли).
Это позволит генерировать только опорные процессы, максимальноi перекрывающиеся своими распределениями с входными сигналами; для увеличения достоверности распознавания необходимо генерировать коррелированные опорные процессы.
При этом пространство признаков формируется с использованием опорных процессов, значения интервалов корреляции (ИК) которых равномерно распределены в некоторой области.
Граничные значения интервалов корреляции в этой области должны соответствовать слабо коррелированному СП и случайному процессу с ИК, близким по значению к оценке интервала корреляции исследуемого процесса.
Другими словами, в набор опорных процессов должны входить процессы от высокочастотных до процессов с граничной частотой, близкой к граничной частоте исследуемого сигнала.
Возвращаясь к вопросу о количестве используемых признаков, то есть о размерности признакового пространства, можно сказать следующее.
Задача оптимизации размерности признакового пространства должна, очевидно, включать в себя как составную часть рассмотренную вп.
1.6 задачу оптимизации суммарного объема р = (2т + п) (при количестве классов, равном 2) обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам p = p(2m + n), обеспечивающего достоверность распознавания не хуже заданного значения а* = а ^ , р* = Ограниченные возможности реальных распознающих систем по обработке результатов измерений по каждому из р признаков позволяют всегда считать число признаков р ограниченным некоторой величиной Р (р < Р).
Кроме того, максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m < М, n < N), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые часто с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы.
При фиксированном значении р с увеличением объема обучающих
ш и контрольной п выборок вероятность ошибки распознавания а , (3, очевидно, уменьшается.
Следовательно, с учетом ограничений ее минимально возможное• ' значение достигается при фиксированном значении р , когда т и п , увеличиваясь, оказываются равными своим предельным значениям m = М и
п = N.
Если 103

[Back]