Проверяемый текст
Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)
[стр. 97]

96 а m x H m x < * х (3.53) В соответствии с (3.22) математическое ожидание м ы 1 л ~ т Х,1 _ -k t S Z 0 ^ o ) ’ а из (3.50) D[z] = D[X] + D[5] * mx( lт х) 1 N S z(iT0) N tT V °' (3.54) Таким образом, дисперсия случайной величины z может быть определена на основе выражения (3.54).
Дисперсия оценки (3.22) может быть определена [104, с.77] D[M[z]] = ~D [z] А ш m N N i=l (3.55) Оценим теперь погрешности, вносимые стохастическим кодированием, для случая равномерного распределения опорного сигнала r(t).
Оценка т х по стохастическому отображению
z(iTo) представляет собой оценку вероятности Р события z(iTo)=l, (i=l,2,...,N) по его частоте Р 1 N в N независимых опытах.
А Дисперсия оценки Р равна G 2 m m )/N с 2.
/ N.
8m Тогда с вероятностью Р можно утверждать, что величина погрешности определения т хпо стохастическому отображению z(iTo) определяетсяР -Р выражением А = t m m а Р N (3.56) Суммарная погрешность вычисления математического ожидания случайной функции по его стохастическому отображению равна [32] Д2 =А + АСТ tР •n/N m x ( l m x ) ^х (3.57) где N количество некоррелированных выборок из функции z(iTo); tР Ф-1 1+ р функция, обратная нормальной функции распределения [41].
Таким образом, можно заключить, что при использовании метода стохастического кодирования возрастает дисперсия оценок измеряемых
[стр. 11]

и зультата преобразования, что позволит реализовать в дальнейшем оптимальное решающее правило в пространстве отображений исходных сигналов.
В третьем разделе выбран метод формирования классификационных признаков (метод стохастического кодирования сигналов), основанный на использовании функционала нелинейного преобразования первичных признаковых пространств, выбранного во втором разделе.
Данный метод строится на принципах измерения корреляционных моментов с помощью функций знаковой корреляции.
Установлено, что в случае распознавания случайных процессов с одинаковыми одномерными плотностями распределения вероятностей и различными корреляционными функциями, высокой эффективностью обладают признаки, сформированные на основе корреляционных моментов знаковых функций, получаемых при сравнении входных процессов с опорными.
При использовании метода стохастического кодирования возрастает дисперсия оценок измеряемых
моментов, однако при этом достигаются следующие положительные результаты: сокращается избыточность описания исходных процессов, подлежащих распознаванию; упрощается реализация алгоритма распознавания в микропроцессорных системах за счет применения одноразрядного квантования, дающего на выходе только знаки отсчетов.
Показана целесообразность, с точки зрения минимизации показателей сложности алгоритмов распознавания, использования в качестве разделяющих поверхностей огибающих элементарных фигур, охватывающих собственные области классов процессов.
Выбран критерий оптимальности при построении решающего правила, минимизирующий собственные области классов при заданной вероятности распознавания.
Разработаны два алгоритма непараметрической классификации случайных процессов, использующие в качестве признаков корреляционные моменты знаковых последовательностей, сформированных на основе метода стохастического кодирования.
Методами цифрового моделирования найдены зависимости математических ожиданий и среднеквадратических отклонений признаков от вида и количества опорных распределений и от времени обучения и классификации.
На основе полученных зависимостей получены оценки достаточных объемов обучающих и контрольных выборок и видов опорных распределения для достижения заданных показателей качества алгоритмов классификации.
В четвертом разделе рассмотрены вопросы моделирования алгоритмов непараметрической классификации на ЭВМ.
В результате моделирования работы классификаторов при классификации случайных процессов с одинаковыми одномерными плотностями распределения вероятностей и различными корреляционными функциями определены значения суммарных вероятностей ошибки клас-г сификации при различных объемах обучающих и контрольных выборок и различных размерах признакового пространства.
Полученные при моделировании зависимости позволяют обоснованно с точки зрения аппаратурных и временных затрат подходить к выбору опорных распределений, количества отсчетов сигнала для формирования одного признака

[стр.,87]

87 Среднеквадратическое отклонение ошибки 5 будет (3.45) В соответствии с (3.36) математическое ожидание Mfz] а из (3.44) D[z] = D[X] +D[8] « mx(lmx) 1 N YzfiTo) (3.46) Таким образом, дисперсия случайной величины z может быть определена на основе выражения (3.46).
Дисперсия оценки (3.36) может быть определена [58, с.77] D tM N ] = ш А m N 1 N z(iT„) 1 N (3.47) Оценим теперь погрешности, вносимые стохастическим кодированием, для случая равномерного распределения опорного сигнала r(t).
Оценка т х по стохастическому отображению
z(iT0Y представляет собой оценку вероятности Р события z(iT0) = l, (i = 1, 2,..., по его частоте 1 N 2]z(iT0) в N независимых опытах.
N i=i I А Дисперсия оценки Р равна а m m )/N ct2/N.X Тогда с вероятностью Р утверждать, что величина погрешности 5ш Р -Р определения шх по стохастическому отображению z(iT0) определяется выражением А= t mX m с 2 Р N (3.48) Суммарная погрешность вычисления математического ожидания случайной функции по его стохастическому отображению равна [25] As А+ Аст tр Vn J m x(1 m x) (3.49) где N количество некоррелированных выборок из функции z(iT0);

[стр.,88]

88 tp = Ф -1 функция, обратная нормальной функции распределения [25].
Таким образом, можно заключить, что при использовании метода стохастического кодирования возрастает дисперсия оценок измеряемых
моментов, однако к положительным свойствам можно отнести сокращение избыточности описания исходного процесса X(t)B а = k / S раз [25], ' * где к разрядность представления X(t) двоичным кодом; S порядок определяемой моментной функции процесса z(t).
Например, если к = 12 16, S = 2, то а = 6 8.
Кроме того, при математической обработке процессов z(t), полученных в результате применения метода стохастического кодирования, операции сложения и умножения сводятся к простейшим операциям конъюнкции и счету импульсов.
Это позволяет строить относительно простые вероятностные процессоры для статистической обработки данных с целью выделения эффективных признаков.
3.2.
Оптимизация разделяющих поверхностей и принятие решений В [19, 90] уже обсуждался вопрос выбора критерия оптимизации, и был предложен следующий подход к рассмотрению задачи построения разделяющей поверхности.
Как уже отмечалось в п.1.3 в теории распознавания сигналов в отношении процессов (сигналов), принадлежащих одному классу, высказывается гипотеза компактности, т.е.
включение всех объектов каждого класса в одно подмножество, состоящее из конечного числа связанных областей.
Другими словами, гипотеза компактности предполагает адекватность понятий "сходства" процессов одного класса и их геометрической "близости", проявляющейся в объединении их в одно связанное подмножество в пространстве признаков.
Поскольку распознаваемый класс сигналов является случайным процессом, N -мерный вектор его признаков у заключен в некоторой области G, причем эта область может быть бесконечной.
Так для нормального процесса вероятность попадания его значений в любую произвольную область отлична от нуля.
Однако практически удается выделить такую ограниченную область признакового пространства, вероятность попадания в которую признаков данного класса весьма высока, в то же время для других ничтожно мала._ t , Разделяющая поверхность в нашем случае задается выражением Q(y) = 0; (3.50) она охватывает замкнутую область фиксированного объема, вероятность попадания в которую признаков данного класса максимальна.
Необходимо найти эту поверхность.
При этом, если собственную область G пространства признаков определенного класса (например класса А) задавать исходя из условия максимума

[Back]