Проверяемый текст
Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)
[стр. 118]

обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам p=p(2m+n) , обеспечивающего достоверность распознавания не хуже заданного значения а =атах, Р*=РтахОграниченные возможности реальных распознающих систем по обработке результатов измерений по каждому из р признаков позволяют всегда счи-* тать число признаков р ограниченным некоторой величиной Р (р<Р) .
Кроме того, максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m n часто с требуемой достоверностью распознавания являются определяющими факторамищ при построении распознающей системы.
При фиксированном значении р с увеличением объема обучающих
m и контрольной п выборок вероятность ошибки распознавания а,
Р, очевидно, уменьшается.
Следовательно, с учетом ограничений ее минимально возможное значение достигается
при фиксированном значении р, когда т и п , увеличиваясь, оказываются равными своим предельным значениям
ш=М и n=N.
Если при этом достигнутое значение вероятности ошибки a (M,N,p) остается больше заi * данного по условиям задачи значения а тах,.то единственным путем ее дальнейшего уменьшения остается увеличение размерности признакового пространства р.
Находим оценку вероятности ошибки распознавания a*(M,N,p) при р=1,2 ,..., ро, до тех пор, пока не окажется, что I a*(M,N,p) < a max (3.43) 118 I
[стр. 50]

Ц 50 равмых признаков, их количеством.
Каждое обучающее и контрольное наблюдение требует, очевидно, проведения р актов измерения значений признаков.
Поэтому задача формирования признакового пространства является составной частью проблемы минимизации общей размерности задачи распознавания [82], а в общей формулировке задачи оптимизации распознающей системы (1.13) минимизации подлежит общее количество измерений [82, (5.3)] где mk объем обучающей выборки для определения характеристик класса sk, п объем контрольной выборки, b общее количество актов принятия решений в процессе распознавания, q число первоначальных признаков.
Рассмотрим решение задачи оптимизации размерности признакового пространства при произвольных объемах обучающих и контрольной выборок, которое представлено в [82].
Задача оптимизации размерности признакового пространства при К = 2, m, = т 2 = т , b = 1 должна включать в себя как составную часть рассмотренную в п.
1.7.3.
задачу оптимизации суммарного объема р = (2 т + п) обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам требуемого для достижения заданного уровня достоверности распознавания ближении положить общую ковариационную матрицу М распознаваемых совокупностей s1и s2 диагональной с дисперсиями на диагонали [82, 41].
В этом случае расстояние Махаланобиса [82, (5.4)] Ограниченные возможности реальных распознающих систем по обработке результатов измерении по каждому из р признаков позволяют всегда считать число признаков р ограниченным некоторой величиной Р (р < Р), откуда следует, что существует некоторое общее значение 5>0, что 54>8 для всех 1= 1,..., р.
В качестве 8 , в частности, можно выбрать точность измерения признаков в реальных системах.
Для получения приближенного решения, обеспечивающего достоверность распознавания не хуже заданного значения а , можно заменить в (1.36) все 5j на 5 и использовать вместо расстояния Махаланобиса жение для вероятности ошибки распознавания, получающееся из (1.27) [82, (3.8)] (1.34) а* = Р*.
Во многих практических задачах оказывается возможным в первом при(1.35) * О о его оценку снизу ан= ор [82], которую и следует подставить вместо d в выра

[стр.,51]

51 а = J3= (б(р)ехр{Smp / 4} / £л/2я(р 3)!ijj х оо я/2 х Jtp 1•cosp2ф•ехр(1 / 2)(t2^/28mp t sincpj x (1.36) 0—тс/2 xF(^ sinф / -\/2/m + 4 / n j dt бф = a(m, n, p).
Таким образом, задача оптимизации признакового пространства (включающая в себя и оптимизацию суммарного объема обучающих и контрольных наблюдений) записывается следующим образом [82]: ш+ п)р -» min, a (m, n, p) < a*.
(1.37) При заданном 5, учитывая инвариантность решения задачи (1.37) относительно умножения критерия на положительное число, задача переписывается в следующем виде: 5(2ш + п)р -» min, a(m, n, p)(1.38) Если сделать замену переменных х = 25тр; у = бпр, тогда также, как и в одномерном случае (см.
п.
1.7.2), в силу свойств функции (1.36) с достаточной для практических приложений точностью в качестве решения [m*,n*,p*) задачи (1.38) можно принять следующий набор из трех целых чисел: т* = [х 0/(28ро)] + 1, п*=[у0/(5р0)]+ 1, р*=р0, (1.39) где х0,у0,р0 (р0 целое число) являются решениями следующей экстремальной задачи [82]: х + у —»min; a = Р = 0(р)ехр(х / 8)/ л/27г(р 3)!ijj х оо к/2 х J Jtp 1-cosp 2ф-ехр-(1/2)^2л /х ^ я т ф Ц х (1-40) О-я/2 х Ffвтф / (2л/1Т Ж Т Ш )]А Д р = a * В реальных системах распознавания максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m < М, n < N ), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые во многих случаях наряду с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы.
При фиксированном значении р с увеличением объема обучающих m и контрольной п выборок вероятность ошибки распознавания
a = (3 уменьшается.
Следовательно, с учетом ограничений ее минимально возможное значение дости


[стр.,103]

для того, чтобы избежать генерирования "лишних" опорных сигналов, можно применять методы разведочного анализа данных (РАД) [2], позволяющие быстро оценить вид и основные параметры распределения исследуемых входных процессов (в данном случае низкая точность оценок при использовании РАД не играет роли).
Это позволит генерировать только опорные процессы, максимальноi перекрывающиеся своими распределениями с входными сигналами; для увеличения достоверности распознавания необходимо генерировать коррелированные опорные процессы.
При этом пространство признаков формируется с использованием опорных процессов, значения интервалов корреляции (ИК) которых равномерно распределены в некоторой области.
Граничные значения интервалов корреляции в этой области должны соответствовать слабо коррелированному СП и случайному процессу с ИК, близким по значению к оценке интервала корреляции исследуемого процесса.
Другими словами, в набор опорных процессов должны входить процессы от высокочастотных до процессов с граничной частотой, близкой к граничной частоте исследуемого сигнала.
Возвращаясь к вопросу о количестве используемых признаков, то есть о размерности признакового пространства, можно сказать следующее.
Задача оптимизации размерности признакового пространства должна, очевидно, включать в себя как составную часть рассмотренную вп.
1.6 задачу оптимизации суммарного объема р = (2т + п) (при количестве классов, равном 2) обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам p = p(2m + n), обеспечивающего достоверность распознавания не хуже заданного значения а* = а ^ , р* = Ограниченные возможности реальных распознающих систем по обработке результатов измерений по каждому из р признаков позволяют всегда считать число признаков р ограниченным некоторой величиной Р (р < Р).
Кроме того, максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m <
М, n < N), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые часто с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы.
При фиксированном значении р с увеличением объема обучающих
ш и контрольной п выборок вероятность ошибки распознавания а , (3, очевидно, уменьшается.
Следовательно, с учетом ограничений ее минимально возможное• ' значение достигается при фиксированном значении р , когда т и п , увеличиваясь, оказываются равными своим предельным значениям
m = М и п = N.
Если 103

[Back]