Проверяемый текст
Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)
[стр. 120]

на основе 100 отсчетов входного сигнала каждое, то эту же область можно поI лучить используя 10 значений признака с 1ОООотсчетами.
Однако необходимо знание объема выборки из исходного сигнала,
тре■ буемого для формирования одного признака, обладающего минимальной дисперсией, с целью дальнейшего изучения влияния размеров выборки признаков на достоверность распознавания.
С целью нахождения объемов статистик для заданных классов, обеспечивающих минимизацию дисперсий оценок признаков, было проведено статистическое моделирование по программе, представленной в приложении
А.
Листинг программы содержит графики для mp(i) и cp(i) зависимостей математическоI го ожидания и среднеквадратического отклонения признаков от количества отсчетов сигналов, используемых для их формирования, а также зависимости * Rad(i) для радиусов собственных областей заданных классов сигналов, получаемых при обучении классификатора.
Структурная схема числового эксперимента может быть представлена в виде рисунок
3.14.
На рисунках 3.15 3.22 показаны виды опорных распределений, входных процессов и зависимости изменения mp(i), ap(i) и Rad(i) от количества отсчетов входного процесса (от интервала времени обученияТ = Ati).
Рассматриваются входные сигналы, подлежащие распознаванию, одного
I вида.
Они соответствуют I виду сигналов в предыдущем пункте, то есть нормальные процессы с одинаковыми одномерными плотностями распределений % (рисунок 3.15) и различными корреляционными функциями.
Вид КФ экспоненциальный.
Оценочные значения КФ сгенерированных входных процессова представлены на графиках на рисунке
3.16.
Множество входных процессов разбито на 4 класса, соответствующие корреляционным функциям на рисунке
3.16.
По сгенерированным входным процессам были сформированы наборы признаков для каждого из четырех классов.
При этом
использовался набор опорных сигналов из шести опорных процессов с некоррелированными отсче-1 тами и различными плотностями распределения вероятностей, вид которых представлен на рисунке 3.17, а выборочная КФ для одного из процессов —на рисунке 3.18.
120 t
[стр. 97]

На рис.
3.7 ЗЛО показаны три вида входных сигналов, подлежащих распознаванию.
I Первый вид аддитивная смесь двухуровневого сигнала (меандр) с нормальным шумом.
Четыре класса входных сигналов данного вида представлены различными отношениями сигнал/шум 0j =0, 3, 5, 10 дБ (j = 1,2,3,4.).
На рис.
3.7 показаны временные диаграммы дискретного сигнала и нормального процесса, а на рис.
3.8 пример временной диаграммы смеси для значения 0 = 3 дБ.
Второй вид входных сигналов нормальные процессы с одинаковыми одномерными плотностями распределения вероятностей и различными корреляционными функциями (КФ).
Здесь под различными КФ понимаются функции, имеющие одинаковый, вид но различные интервалы корреляции процессов.
На рис.
3.9 представлены примеры временных диаграмм процессов с различнымиI t функциями корреляции, оценочные значения которых представлены на рис.
3.11.
Вид корреляционных функций экспоненциальный (R(r) = е~р'т').
Входные процессы сгенерированы в соответствии с алгоритмом, изложенным в [12], основанным на обработке с помощью рекуррентных процедур отсчетов нормального некоррелированного процесса.
Физической моделью данных рекуррентных процедур является пропускание широкополосного нормального шума через фильтр___ ■ низких частот (ФНЧ), при этом коэффициент Р функции корреляции определяет-I ся значением граничной частоты ФНЧ fB.
В данном случае четыре класса случайI ных процессов были сгенерированы для значений fB, равных f0 = 100 Гц, fl =200 Гц, f2 =400 Гц, f3 =600 Гц.
Третий вид входных сигналов нормальные процессы с одинаковыми одномерными плотностями распределения вероятностей и различными корреляционными функциями.
Различия КФ понимаются в том же смысле, что и для второго вида входных сигналов.
На рис.
3.10 представлены примеры временных диаграмм процессов с различными функциями корреляции, оценочные значения которых представлены на рис.
3.12.
Однако в отличие от предыдущего случая вид корреляционных функций экспоненциально-косинусный (R(t) = е~рт coscd0t ).
физической моделью рекуррентных процедур, использованных в этом случае, является пропускание широкополосного нормального шума через контур с центральной частотой f0.
В данном случае четыре класса случайных процессов былиt сгенерированы для значений f0, равных f0=20 Гц, fl = 80 Гц, f2 =200 Гц, f3=400 Гц.
По сгенерированным входным процессам были сформированы наборы признаков для каждого из четырех классов.
При этом
использовались два набора опорных сигналов.
В первом наборе шесть опорных процессов с некоррелированными отсчетами и различными плотностями распределения вероятностей, вид которых представлен на рис.
3.13, а выборочная КФ для одного из процессов на рис.• I 3.14.
Во втором наборе шесть опорных процессов с одинаковыми (нормальными) распределениями (рис.
3.18) и различными функциями корреляции.
Выборочные КФ сгенерированных шести опорных процессов представлены на рис.
3.19.
97 Г

[стр.,104]

при этом достигнутое значение вероятности ошибки a*(M,N,p) остается больше заданного по условиям задачи значения а тах, то единственным путем ее дальнейшего уменьшения остается увеличение размерности признакового пространства р.
Находим оценку вероятности ошибки распознавания a*(M,N,p) при р = 1 , 2 , р0, до тех пор, пока не окажется, что a ^ M .N .p J s c w (3.66) Зафиксировав найденное значение р = р0, необходимо решить задачу оптимизации (2m + n)—»min, a* < а тах , то есть найти такие значения количества обучающих ш и контрольной п выборок, при которых достигался бы заданный предел ошибки распознавания а юах.
• I 3.5.
Исследование влияния времени обучения и распознавания на эффе тивность классификатора / Под временем обучения и распознавания принято понимать объемы обучающих m и контрольной п выборок [85].
Задача минимизации общего числа выборок уже рассматривалась в предыдущих пунктах и основные ее аспекты уже сформулированы.
Необходимо только добавить, что, как уже указывалось, аналитическая зависимость между достоверностью распознавания (основным параметром эффективности системы) и объемами обучающих и контрольных выборок для данного непараметрического случая до сих пор не найдены.
Поэтому в качестве параметра, влияющего на достоверность распознавания, будем использовать дисперсии оценок признаков, определяющие значения радиусов собственных областей классов в признаковом пространстве.
Прежде чем рассматривать вопрос о том, какие объемы обучающих и контрольных выборок обеспечивают заданную достоверность распознавания, необходимо определить достаточные размеры статистик для формирования одного отсчета признаков или одного элемента в признаковом пространстве для заданного класса исследуемых сигналов.
Можно показать [94], что количество отсчетов входного сигнала, необходимое для формирования одного признака и объем выборки, по которой формируется собственная область класса, связаны напрямую.
То есть, например, если для формирования собственной области Gi класса со, с минимальным радиусом Rjmin необходима выборка'из 100 значений признака, сформированного на основе 100 отсчетов входного сигнала каждое, то эту же область можно получить используя 10 значений признака с 1000 отсчетами.
Однако необходимо знание объема выборки из исходного сигнала,
требуемого для формирования одного признака, обладающего минимальной дисперсией, с целью дальнейшего изучения влияния размеров выборки признаков на достоверность распознавания.
104 I

[стр.,105]

С целью нахождения объемов статистик для заданных классов, обеспечивающих минимизацию дисперсий оценок признаков, было проведено статистическое моделирование по программе, представленной в приложении 2.
Листинг программы содержит графики для mp(i) и ар (i) зависимостей математического I ожидания и среднеквадратического отклонения признаков от количества отсчетов сигналов, используемых для их формирования, а также зависимости Rad(i) I для радиусов собственных областей заданных классов сигналов, получаемых при обучении классификатора.
Структурная схема числового эксперимента может быть представлена в виде рис.

3.23.
В прил.
2 представлены все результаты расчетов, а на рис.
3.24 3.37 показаны виды опорных распределений, входных процессов и зависимости изменения mp(i),ap(i) и Rad(i) от количества отсчетов входного процесса (от интервала времени обучения Т = Ati).
• s ■ Р* ' Рассматриваются входные сигналы, подлежащие распознаванию, одного вида.
Они соответствуют П виду сигналов в предыдущем пункте, то есть нормальные процессы с одинаковыми одномерными плотностями распределений (рис.
3.24) и различными корреляционными функциями.
Вид КФ экспоненциальный.
Оценочные значения КФ сгенерированных входных процессов представлены на графиках на рис.

3.25.
Множество входных процессов разбито на 4 класса, соответствующие корреляционным функциям на рисунке.

По сгенерированным входным процессам были сформированы наборы признаков для каждого из четырех классов.
При этом
использовались два набора* , опорных сигналов.
В первом наборе шесть опорных процессов с некоррелированными отсчетами и различными плотностями распределения вероятностей, вид которых представлен на рис.
3.26, а выборочная КФ для одного из процессов на рис.
3.27.
Во втором наборе шесть опорных процессов с одинаковыми • ' * (нормальными) распределениями (рис.
3.32) и различными функциями корреляции.
Выборочные КФ сгенерированных шести опорных процессов представлены на рис.
3.33.
105

[Back]