Проверяемый текст
Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)
[стр. 38]

38 ковариационной матрицей М выражается также скалярной величиной расстоянием Махаланобиса [145] d2 = (а2а 1)ТМ-1(а2-a j).
(1.26) Задача оптимизации временных характеристик системы может быть сформулирована как задача минимизации суммарного объема р = р •(2т + п) обучающих и контрольной выборок, необходимых для достижения заданного уровня достоверности при заданном ограничении, заключающемся в том, что расстояние между совокупностями s, и s2 должно быть не меньше некоторого минимального значения d
>0, в качестве которого, как и в одномерном случае, где мы имеем дело со скаляром, целесообразно выбирать точность измерения этого расстояния в реальных системах.
Найденное в
[150, (3.32)] выражение вероятности ошибок распознавания через объемы контрольной и обучающих выборок и расстояние Махаланобиса d между классами составляет основу для оптимизации характеристик распознающей системы, заключающейся в отыскании вектора параметров системы V, минимизирующего некоторый критерий H(V) и удовлетворяющего ограничениям hj(V, а, (5) > bj, i = l,Q на допустимые значения параметров и вероятности ошибок.
Как и в рассмотренном одномерном случае, в качестве критерия оптимальности рассматриваемой системы распознавания целесообразно использовать минимальный суммарный объем р = р •(2т + п) обучающих и контрольных наблюдений (р = const), получающийся из (1.12) при К = 2,
m, = т 2 = т , b = 1 [150]: р = р(2т + п) —>min; 7г / 2 а = Р = [е(р) / (р —3)!! 1 1Ър-(sin(p / л/2 / т ) х -я/2 (1.27) х F(sincp / л/2 / т + 4 / nj •cosp 2ф дц>< а .
При заданном dE, учитывая инвариантность решения задачи (1.27) относительно умножения критерия на положительное число, задача переписывается в следующем виде [149] р = d2(2m + n) min; я/2 a = p= [e(p)/(p-3)!!l fD P -тс/2 x F(-sincp/ л /2 / m + 4/nVcosp 2cpdtp (1.28) < a .
В [150] показано, что в силу свойств функции (1.27) с достаточной для практических приложений точностью в качестве решения (m*,n*j задачи (1.28) целесообразно принять * m хо/(2с1в)] + 1> n* =[x0/d 2]+ l, (1.29)
[стр. 45]

45 личающихся средними и дисперсиями, в [82] на основе полученных выражений для ошибок распознавания [82, (2.36) (2.42)] и при использовании критерия максимального правдоподобия приведены результаты расчетов объема обучающих и контрольной выборок для заданных достоверностей распознавания 1 -а * 0,9; 0,95; 0,99 при изменении параметров, характеризующих межклассовое расстояние, dои го d а2 а 2 С и г 2 2 а 1 а 2 1 (1.25) При этом отмечен незначительный рост оптимальных объемов выборок ш , пГ* при значениях г0, близких к 1, и существенное их убывание в широком диапазоне остальных значений г0 и всех значений d0, что является подтверждением возможности использования приведенных в [82] таблиц для выбора оптимальных sje объемов выборок ш и п , требуемых для достижения заданной достоверности ♦ Л 1 -а ориентируясь на наихудший случай а d го* 1.7.3.
Оптимизация временных характеристик системы распознавания многомерных нормальных совокупностей При распознавании многомерных нормальных совокупностей к основным характеристикам расстоянию между классами d, объемам обучающих m и контрольной п выборок добавляется и пространственная характеристика числоV признаков р.
Рассмотрим оптимизацию временных характеристик систем распознавания многомерных совокупностей с неизвестными векторами средних а, и и общей ковариационной матрицей М при фиксированном числе признаков р.
Важным моментом при проведении оптимизации является определение расстояния между классами d и задание его минимального значения dE> 0, используемого при решении задачи оптимизации [85].
При рассмотрении одномерного случая в качестве расстояния d между классами использовалась скалярная величина нормированная разность а2 а1 / а между средними значениями.
В многомерном случае расстояние между двумя многомерными нормальными совокупностями s, и s2 с векторами средних а, и а, и общей ковариационной матрицей М выражается также скалярной величиной расстоянием Махаланобиса [80] d а а,)тм-(а2 а (1.26) Задача оптимизации временных характеристик системы может быть сформулирована как задача минимизации суммарного объема р = р •(2т + п) обучающих и контрольной выборок, необходимых для достижения заданного уровня достоверности при заданном ограничении, заключающемся в том, что расстояние между совокупностями Sj и s2 должно быть не меньше некоторого минимального значения dE> 0, в качестве которого, как и в одномерном случае, где мы имеем дело

[стр.,46]

46 со скаляром, целесообразно выбирать точность измерения этого расстояния в реальных системах.
Найденное в
[85, (3.32)] выражение вероятности ошибок распознавания че-ч рез объемы контрольной и обучающих выборок и расстояние Махаланобиса d между классами составляет основу для оптимизации характеристик распознающей системы, заключающейся в отыскании вектора параметров системы V, минимизирующего некоторый критерий H(V) и удовлетворяющего ограничениям hi(V, а, Р) > bj, i = 1, Q на допустимые значения параметров и вероятности ошибок.
Как и в рассмотренном одномерном случае, в качестве критерия оптимальности рассматриваемой системы распознавания целесообразно использовать минимальный суммарный объем р = р •(2т + п) обучающих и контрольных наблюдений (р = const), получающийся из (1.12) при К = 2,
ггц = т2 = m, b = 1 [85]: р = р(2т + n) -> min; я/2 ос= [3= [0(р)/ (р —3)!!] jD p-fsHKp/ л/2 / т -я/2 (1.27) xF(sin(p /727 т + 4 / nVcosp2ф Эф< а*.
При заданном dg, учитывая инвариантность решения задачи (1.27) относительно умножения критерия на положительное число, задача переписывается в следующем виде [84] р = d2(2m + n) -» min; я/2 a = (3= [0(p) / (p —3)!!] j*Dp-fsin(p/V2/ m -я/2 (1.28) xF(sin9 /72 /m +4/nj-cosp2ф d9 < a*.
В [85] показано, что в силу свойств функции (1.27) с достаточной для практических приложений точностью в качестве решения (m*, n j задачи (1.28) целесообразно принять * m [x0/(2d2)]+ l, n =[x0/d 2]+ l, (1.29) где [t] целая часть t, а х0 и у0 решение следующей задачи оптимизации в классе непрерывных функций, выполненное стандартными численными методами: х + у —>mm; я/2 ф(х,у) = [е(р)/(р-3)!!] jDp-(7х-8тф/2)х -п/2 (1.30) xF(Бтф / 2«Jl / х +1 / уj •cosp 2ф 6ф ^ а*.
Для решения задачи (1.30) используется итерационная процедура, описанная в [85].
Анализ результатов расчетов значений оптимальных объемов обучаю

[стр.,51]

51 а = J3= (б(р)ехр{Smp / 4} / £л/2я(р 3)!ijj х оо я/2 х Jtp 1•cosp2ф•ехр(1 / 2)(t2^/28mp t sincpj x (1.36) 0—тс/2 xF(^ sinф / -\/2/m + 4 / n j dt бф = a(m, n, p).
Таким образом, задача оптимизации признакового пространства (включающая в себя и оптимизацию суммарного объема обучающих и контрольных наблюдений) записывается следующим образом [82]: ш+ п)р -» min, a (m, n, p) < a*.
(1.37) При заданном 5, учитывая инвариантность решения задачи (1.37) относительно умножения критерия на положительное число, задача переписывается в следующем виде: 5(2ш + п)р -» min, a(m, n, p)(1.38) Если сделать замену переменных х = 25тр; у = бпр, тогда также, как и в одномерном случае (см.
п.
1.7.2), в силу свойств функции (1.36) с достаточной для практических приложений точностью в качестве решения [m*,n*,p*) задачи (1.38) можно принять следующий набор из трех целых чисел: т* = [х 0/(28ро)] + 1, п*=[у0/(5р0)]+ 1, р*=р0, (1.39) где х0,у0,р0 (р0 целое число) являются решениями следующей экстремальной задачи [82]: х + у —»min; a = Р = 0(р)ехр(х / 8)/ л/27г(р 3)!ijj х оо к/2 х J Jtp 1-cosp 2ф-ехр-(1/2)^2л /х ^ я т ф Ц х (1-40) О-я/2 х Ffвтф / (2л/1Т Ж Т Ш )]А Д р = a * В реальных системах распознавания максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m < М, n < N ), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые во многих случаях наряду с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы.
При фиксированном значении р с увеличением объема обучающих m и контрольной п выборок вероятность ошибки распознавания a = (3 уменьшается.
Следовательно, с учетом ограничений ее минимально возможное значение дости

[Back]