Проверяемый текст
Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)
[стр. 43]

43 реальных системах.
Для получения приближенного решения, обеспечивающего достоверность распознавания не хуже заданного значения а*, можно заменить в (1.36) все 8; на 5 и использовать вместо расстояния Махаланобиса его оценку А снизу d„ =8р [147], которую и следует подставить вместо d в выражение для вероятности ошибки распознавания, получающееся из (1.27) [147, (3.8)] а = Р = 0(р)ехр{8 т р / 4 / ^л/2ти(р —3)!ijj х « т с / 2 ___________________________________________________________ х J Jtp_1 •cosp'2ф •exp j (l / 2)(t2 «J2Smp t sincpjj x (1.36) -Jsp sin(p / "s/2/m+ 4/nj dt dcp = a(m, n, p).
Таким образом, задача оптимизации признакового пространства (включающая в себя и оптимизацию суммарного объема обучающих и контрольных наблюдений) записывается следующим образом
[147]: m + n)p-»min, a(m, n, p)(1.37) При заданном 8, учитывая инвариантность решения задачи (1.37) относительно умножения критерия на положительное число, задача переписывается в следующем виде: S(2m + п)р —» min, a(m, n, p ) < a \ (1.38) Если сделать замену переменных х = 28тр; у = Snp, тогда также, как и в одномерном случае (см.
п.

1.3.2), в силу свойств функции (1.36) с достаточной для практических приложений точностью в качестве решения fm*,n*,p j задачи (1.38) можно принять следующий набор из трех целых чисел: т *= [х0/ (28р0)] +1, п* =[у0/(8р0)] + 1, р*=р0, (1.39) где х0, у0, р0 (р0 целое число) являются решениями следующей экстремальной задачи [147]: х + у -> min; a = Р = (е(р) ехр(х /8 )/[л/2л(р3)!ijj х оо п/2 х J Jtp 1-cosp 2ф e x p ( l/2 ) t 2 Vx^t БтфН х (1-40) О -л/2 х f [ sintp / ( 2 V l / m + 1/njldt dcp = a В реальных системах распознавания максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N< М, n < N ), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые во многих случаях наряду с требуемой
[стр. 46]

46 со скаляром, целесообразно выбирать точность измерения этого расстояния в реальных системах.
Найденное в [85, (3.32)] выражение вероятности ошибок распознавания че-ч рез объемы контрольной и обучающих выборок и расстояние Махаланобиса d между классами составляет основу для оптимизации характеристик распознающей системы, заключающейся в отыскании вектора параметров системы V, минимизирующего некоторый критерий H(V) и удовлетворяющего ограничениям hi(V, а, Р) > bj, i = 1, Q на допустимые значения параметров и вероятности ошибок.
Как и в рассмотренном одномерном случае, в качестве критерия оптимальности рассматриваемой системы распознавания целесообразно использовать минимальный суммарный объем р = р •(2т + п) обучающих и контрольных наблюдений (р = const), получающийся из (1.12) при К = 2, ггц = т2 = m, b = 1 [85]: р = р(2т + n) -> min; я/2 ос= [3= [0(р)/ (р —3)!!] jD p-fsHKp/ л/2 / т -я/2 (1.27) xF(sin(p /727 т + 4 / nVcosp2ф Эф< а*.
При заданном dg, учитывая инвариантность решения задачи (1.27) относительно умножения критерия на положительное число, задача переписывается в следующем виде [84] р = d2(2m + n) -» min; я/2 a = (3= [0(p) / (p —3)!!] j*Dp-fsin(p/V2/ m -я/2 (1.28) xF(sin9 /72 /m +4/nj-cosp2ф d9 < a*.
В [85] показано, что в силу свойств функции (1.27) с достаточной для практических приложений точностью в качестве решения (m*, n j задачи (1.28) целесообразно принять * m [x0/(2d2)]+ l, n =[x0/d 2]+ l, (1.29) где [t] целая часть t, а х0 и у0 решение следующей задачи оптимизации в классе непрерывных функций, выполненное стандартными численными методами: х + у —>mm; я/2 ф(х,у) = [е(р)/(р-3)!!] jDp-(7х-8тф/2)х -п/2 (1.30) xF(Бтф / 2«Jl / х +1 / уj •cosp 2ф 6ф ^ а*.
Для решения задачи (1.30) используется итерационная процедура, описанная в [85].
Анализ результатов расчетов значений оптимальных объемов обучаю

[стр.,51]

51 а = J3= (б(р)ехр{Smp / 4} / £л/2я(р 3)!ijj х оо я/2 х Jtp 1•cosp2ф•ехр(1 / 2)(t2^/28mp t sincpj x (1.36) 0—тс/2 xF(^ sinф / -\/2/m + 4 / n j dt бф = a(m, n, p).
Таким образом, задача оптимизации признакового пространства (включающая в себя и оптимизацию суммарного объема обучающих и контрольных наблюдений) записывается следующим образом
[82]: ш+ п)р -» min, a (m, n, p) < a*.
(1.37) При заданном 5, учитывая инвариантность решения задачи (1.37) относительно умножения критерия на положительное число, задача переписывается в следующем виде: 5(2ш + п)р -» min, a(m, n, p)(1.38) Если сделать замену переменных х = 25тр; у = бпр, тогда также, как и в одномерном случае (см.
п.

1.7.2), в силу свойств функции (1.36) с достаточной для практических приложений точностью в качестве решения [m*,n*,p*) задачи (1.38) можно принять следующий набор из трех целых чисел: т* = [х 0/(28ро)] + 1, п*=[у0/(5р0)]+ 1, р*=р0, (1.39) где х0,у0,р0 (р0 целое число) являются решениями следующей экстремальной задачи [82]: х + у —»min; a = Р = 0(р)ехр(х / 8)/ л/27г(р 3)!ijj х оо к/2 х J Jtp 1-cosp 2ф-ехр-(1/2)^2л /х ^ я т ф Ц х (1-40) О-я/2 х Ffвтф / (2л/1Т Ж Т Ш )]А Д р = a * В реальных системах распознавания максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m < М, n < N ), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые во многих случаях наряду с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы.
При фиксированном значении р с увеличением объема обучающих m и контрольной п выборок вероятность ошибки распознавания a = (3 уменьшается.
Следовательно, с учетом ограничений ее минимально возможное значение дости

[стр.,103]

для того, чтобы избежать генерирования "лишних" опорных сигналов, можно применять методы разведочного анализа данных (РАД) [2], позволяющие быстро оценить вид и основные параметры распределения исследуемых входных процессов (в данном случае низкая точность оценок при использовании РАД не играет роли).
Это позволит генерировать только опорные процессы, максимальноi перекрывающиеся своими распределениями с входными сигналами; для увеличения достоверности распознавания необходимо генерировать коррелированные опорные процессы.
При этом пространство признаков формируется с использованием опорных процессов, значения интервалов корреляции (ИК) которых равномерно распределены в некоторой области.
Граничные значения интервалов корреляции в этой области должны соответствовать слабо коррелированному СП и случайному процессу с ИК, близким по значению к оценке интервала корреляции исследуемого процесса.
Другими словами, в набор опорных процессов должны входить процессы от высокочастотных до процессов с граничной частотой, близкой к граничной частоте исследуемого сигнала.
Возвращаясь к вопросу о количестве используемых признаков, то есть о размерности признакового пространства, можно сказать следующее.
Задача оптимизации размерности признакового пространства должна, очевидно, включать в себя как составную часть рассмотренную вп.
1.6 задачу оптимизации суммарного объема р = (2т + п) (при количестве классов, равном 2) обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам p = p(2m + n), обеспечивающего достоверность распознавания не хуже заданного значения а* = а ^ , р* = Ограниченные возможности реальных распознающих систем по обработке результатов измерений по каждому из р признаков позволяют всегда считать число признаков р ограниченным некоторой величиной Р (р < Р).
Кроме того, максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m < М, n < N), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые часто с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы.
При фиксированном значении р с увеличением объема обучающих ш и контрольной п выборок вероятность ошибки распознавания а , (3, очевидно, уменьшается.
Следовательно, с учетом ограничений ее минимально возможное• ' значение достигается при фиксированном значении р , когда т и п , увеличиваясь, оказываются равными своим предельным значениям m = М и п = N.
Если 103

[Back]