Проверяемый текст
Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)
[стр. 37]

37 неизвестной дисперсии а 2 записать выражение вероятностей ошибок через параметр аЕ и объемы обучающих m и контрольной п выборок по типу (1.17) оказывается затруднительным, вследствие чего для нахождения требуемых значений ш* и п* наряду со строгими целесообразно использовать приближенные методы, основанные на том, что при переходе от неизвестной дисперсии к известной вероятности ошибок распознавания изменяются незначительно [150].
Если вместо априорно известной дисперсии а 2 в процессе решения задачи оптимизации (1.18) (1.24) использовать ее оценку, формируемую в процессе обучения, то в результате получаются значения объемов выборок
mj и п,, которые являются приближениями к истинным значениям ш* и п \ Для случая оптимизации систем распознавания одномерных образов, различающихся средними и дисперсиями, в [147] на основе полученных выражений для ошибок распознавания [147, (2.36) (2.42)] и при использовании критерия максимального правдоподобия приведены результаты расчетов объема обучающих и контрольной выборок для заданных достоверностей распознавания 1-а* =0,9; 0,95; 0,99 при изменении параметров, характеризующих межклассовое расстояние, d0 и г,о 2 2 (а2 а ] У ст2 d = и г = — а, о? (1.25) При этом отмечен незначительный рост оптимальных объемов выборок т* , п* при значениях г0, близких к 1, и существенное их убывание в широком диапазоне остальных значений г0 и всех значений d0, что является подтверждением возможности использования приведенных в [147] таблиц для выбора ф ф оптимальных объемов выборок m и п , требуемых для достижения заданной ф Л достоверности 1а ориентируясь на наихудший случай d = d0, г = г0.
1.5.3.
Оптимизация временных характеристик системы распознавания многомерных нормальных совокупностей.
При распознавании многомерных нормальных совокупностей к основным характеристикам расстоянию между классами d, объемам обучающих m и контрольной п выборок добавляется и пространственная характеристика число признаков р.
Рассмотрим оптимизацию временных характеристик систем распознавания многомерных совокупностей с неизвестными векторами средних а, и
а, и общей ковариационной матрицей М при фиксированном числе признаков р.
Важным моментом при проведении оптимизации является определение расстояния между классами d и задание его минимального значения
dЕ> 0, используемого при решении задачи оптимизации [150].
При рассмотрении одномерного случая в качестве расстояния d между классами использовалась скалярная величина нормированная разность а2-а,/ст
между средними значениями.
В многомерном случае расстояние между двумя многомерными нормальными совокупностями s, и s2 с векторами средних ах и а, и общей
[стр. 44]

I 44 Анализ результатов расчетов, приведенных в [85, табл.
5.1, рис.
5.1] показывает, что при сравнительно невысоких требованиях к точности измерения разности средних ае (а£= 0,1) совокупностей (и, следовательно, при минимально допустимом расстоянии между указанными средними, равном 0,1а ) и при необходимости обеспечения удовлетворительного уровня достоверности распознавания 0,9 оптимальные значения объемов указанных выборок составляют m = 886 и n = 1302.
Повышение уровня требуемой достоверности распознавания до значений 0,99; 0,999; 0,9999 при том же значении ае достигается путем достаточно умеренного увеличения оптимальных объемов обучающих т* =2334; 4050 и 5868 и контрольных п =4140; 7860 и 11734 выборок.
Однако, дальнейшее повышение требований к точности измерения разности средних вплоть до 0,01 (и, следовательно, сокращение минимально допустимого расстояния между средними значениями совокупностей до 0,01от) при необходимости обеспечения высокой достоверности распознавания 1 -а = 1Р = 0,99; 0,999; 0,9999 приводит к значительному увеличению объемов обучающих и контрольной выборок вплоть до т* = 586800 и n* = 1173400 при 1а* = 0,9999 и аЕ= 0,01.
Это вполне согласуется с физическими представлениями, поскольку распознавание со столь высокой достоверностью нормальных совокупностей, средние значения которых могут быть так близко расположены друг от друга, требует достаточно большого времени обучения для составления хороших эталонных описаний совокупностей, то есть получения возможно более качественных оценок средних и а2, и достаточно большого времени для принятия решения для обеспечения его высокой достоверности.
Данная процедура оптимизации может быть обобщена на случай распознавания одномерных нормальных совокупностей, у которых неизвестны не только л средние а,, а2, но и общая дисперсия о [85].
При этом также минимизируется суммарный объем обучающих и контрольной выборок, необходимых для достижения заданного уровня достоверности, при том же ограничении: нормированная разность между средними значениями совокупностей (а2а1/ а) должна быть не меньше а8> 0.
Однако, при неизвестной дисперсии а 2 записать выражение вероятностей ошибок через параметр а8и объемы обучающих m и контрольной п выборок по типу (1.17) оказывается затруднительным, вследствие чего для нахождения требуемых значений т и п наряду со строгими целесообразно использовать приближенные методы, основанные на том, что при переходе от неизвестной дисперсии к известной вероятности ошибок распознавания изменяются незначительно [85].
Если вместо априорно известной дисперсии а 2 в процессе решения задачи оптимизации (1.18) (1.24) использовать ее оценку, формируемую в процессе обучения, то в результате получаются значения объемов выборок
и nj, * * которые являются приближениями к истинным значениям ш и п Для случая оптимизации систем распознавания одномерных образов, раз

[стр.,45]

45 личающихся средними и дисперсиями, в [82] на основе полученных выражений для ошибок распознавания [82, (2.36) (2.42)] и при использовании критерия максимального правдоподобия приведены результаты расчетов объема обучающих и контрольной выборок для заданных достоверностей распознавания 1 -а * 0,9; 0,95; 0,99 при изменении параметров, характеризующих межклассовое расстояние, dои го d а2 а 2 С и г 2 2 а 1 а 2 1 (1.25) При этом отмечен незначительный рост оптимальных объемов выборок ш , пГ* при значениях г0, близких к 1, и существенное их убывание в широком диапазоне остальных значений г0 и всех значений d0, что является подтверждением возможности использования приведенных в [82] таблиц для выбора оптимальных sje объемов выборок ш и п , требуемых для достижения заданной достоверности ♦ Л 1 -а ориентируясь на наихудший случай а d го* 1.7.3.
Оптимизация временных характеристик системы распознавания многомерных нормальных совокупностей При распознавании многомерных нормальных совокупностей к основным характеристикам расстоянию между классами d, объемам обучающих m и контрольной п выборок добавляется и пространственная характеристика числоV признаков р.
Рассмотрим оптимизацию временных характеристик систем распознавания многомерных совокупностей с неизвестными векторами средних а, и
и общей ковариационной матрицей М при фиксированном числе признаков р.
Важным моментом при проведении оптимизации является определение расстояния между классами d и задание его минимального значения
dE> 0, используемого при решении задачи оптимизации [85].
При рассмотрении одномерного случая в качестве расстояния d между классами использовалась скалярная величина нормированная разность а2
а1 / а между средними значениями.
В многомерном случае расстояние между двумя многомерными нормальными совокупностями s, и s2 с векторами средних а, и а, и общей
ковариационной матрицей М выражается также скалярной величиной расстоянием Махаланобиса [80] d а а,)тм-(а2 а (1.26) Задача оптимизации временных характеристик системы может быть сформулирована как задача минимизации суммарного объема р = р •(2т + п) обучающих и контрольной выборок, необходимых для достижения заданного уровня достоверности при заданном ограничении, заключающемся в том, что расстояние между совокупностями Sj и s2 должно быть не меньше некоторого минимального значения dE> 0, в качестве которого, как и в одномерном случае, где мы имеем дело

[стр.,47]

щих и контрольной выборок, приведенных в [85, табл.
5.2] показывает, что при сравнительно невысоких требованиях к точности измерения расстояния между классами d2 = 0,01 и размерности признакового пространства р = 10 удовлетво-+ ригельный уровень достоверности распознавания 0,9 достигается при значениях т* =1917 и п* =2300.
Повышение уровня требуемой достоверности распознавания до значений 0,99; 0,999; 0,9999 при тех же значениях d2 и р достигается путем достаточно умеренного увеличения оптимальных объемов обучающих и контрольной выборок.
Наблюдается эффект возрастания значений объемов т* и ф ф ф п , требуемых для обеспечения заданной достоверности 1 -а = 1р при неизменном значении расстояния d2 и при увеличении размерности признакового пространства р .
Физически он объясняется возрастанием с ростом р числа оцениваемых параметров, что увеличивает общую дисперсию их оценок и, следовательно, уменьшает результирующую достоверность распознавания [85].
Для доведения последней до требуемого по условиям задачи уровня 1-а* = 1Р* необходимо несколько увеличить значения оптимальных объемов выборок т* и п* [85, табл.
5.2].
Данная процедура оптимизации может быть обобщена и на случай распознавания многомерных нормальных совокупностей с неизвестными векторами средних а15а2 и с неизвестной общей ковариационной матрицей М [82].
При этом также минимизируется суммарный объем р = р •(2т + п) обучающих и контрольных наблюдений, необходимых для достижения заданного уровня достоверности при том же ограничении: расстояние Махаланобиса d2 между совокупностями s, и s2, определяемое формулой (1.26), должно быть не меньше некоторого минимального значения d2> 0, в качестве которого целесообразно выбирать точность измерения этого расстояния (являющегося скаляром) в реальных системах.
Однако в случае неизвестной ковариационной матрицы М выражение вероятностей ошибок а и Р через параметр de и объемы обучающих m и контрольной п выборок по типу (1.27) оказывается затруднительным [82], вследствие чего целесообразно использовать приближенные методы, основанные на использовании вместо неизвестных значений вероятностей ошибок а и (3 их асимптотических значений а 0 и Р0 [82, (3.15), (3.16)] а 0 = F (2 1 n c /( n T )a )/a , Р0 = F f(21nc/(nT )-a)/cl, (1*31) где а = d2/ (т р -1); т = 2 т 2; т р м х т р 2d4

[Back]