Проверяемый текст
Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)
[стр. 97]

Однако найти аналитическую зависимость между достоверностью и количеством опорных распределений, а также их параметрами, не представляется возможным.
Но, если рассмотреть критерий (3.60), то можно видеть, что параметром, влияющим на достоверность распознавания, является радиус собственной области распознаваемых классов процессов, который, в свою очередь, напрямую зависит от дисперсий оценок признаков классов.
Поэтому можно сказать, что минимизация дисперсий оценок признаков (минимизация радиусов собственных областей классов) ведет к максимизации достоверности распознавания.
С целью нахождения видов опорных распределений, минимизирующих дисперсии оценок признаков, было проведено статистическое моделирование по программе, представленной в прил.
1 с использованием пакета программ для математического моделирования Mathcad
200 li фирмы MathSoft Inc.
[100].
Листинг программы содержит графики для
mp(k) и ар (к) зависимостей математического ожидания (МО) и среднеквадратического отклонения (СКО) признаков от использованных опорных распределений различных видов [91].
Структурная схема числового эксперимента может быть представлена в виде рис.

3.2.
В прил.1
представлены все результаты расчетов, а на рис.3.3 3.22 показаны виды опорных распределений, входных сигналов и зависимости изменения mp(k) и ар (к) от номера опорного распределения для значения интервала наблюдения Т = 103 At, где At интервал дискретизации исследуемых сигналов.
На рис.
3.3 3.6 показаны три вида входных сигналов, подлежащих распознаванию.
Первый вид аддитивная смесь двухуровневого сигнала (меандр) с нормальным шумом.
Четыре класса входных сигналов данного вида представлены различными отношениями сигнал/шум 0^ =0, 3, 5, 10 дБ (j = 1,2,3,4.).
На рис.

3.3 показаны временные диаграммы дискретного сигнала и нормального процесса, а на рис.
3.4 пример временной диаграммы смеси для значения 0 = 3 дБ.
Второй вид входных сигналов нормальные процессы с одинаковыми одномерными плотностями распределения вероятностей и различными
97
[стр. 95]

I I 95 t .
i • ' увеличение количества признаков ведет к необоснованному усложнению аппаратуры распознавания и, в конечном счете, потере рентабельности разрабатываемого оборудования.
Поэтому остается открытым вопрос, какое количество и, самое главное, какие признаки должны использоваться при классификации процессов, то есть стоит задача оптимизации размерности признакового пространства.
Рассмотренные в п.
1.7.4 методы оптимизации количества используемых признаков применимы только в случаях, когда известны хотя бы оценочные зависимости ошибок первого и второго рода (1.40) от времени обучения и распознавания.
Однако для случая использования признаков, сформированных с применением метода стохастического кодирования, такие зависимости не получены.
Так как методика получения признаков для распознавания уже определена, то, говоря о виде признаков, имеем в виду вид плотности распределения вероятности опорного процесса.
Решение задачи выбора опорного распределения (или опорных распределений) в данном случае не может быть формализовано.
Здесь многое зависит от опыта и интуиции разработчика.
Говоря об эффективных признаках, имеют в виду признаки, использование которых максимизирует некоторый заданный критерий.
В нашем случае таким критерием является, как уже указывалось, достоверность распознавания.
Однако найти аналитическую зависимость между достоверностью и количеством опорных распределений, а также их параметрами, не представляется возможным.
Но, если рассмотреть критерий (3.60), то можно видеть, что параметром, влияющим на достоверность распознавания, является радиус собственной области распознаваемых классов процессов, который, в свою очередь, напрямую зависит от дисперсий оценок признаков классов.
Поэтому можно сказать, что минимизация дисперсий оценок признаков (минимизация радиусов собственных областей классов) ведет к максимизации достоверности распознавания.
С целью нахождения видов опорных распределений, минимизирующих дисперсии оценок признаков, было проведено статистическое моделирование по программе, представленной в прил.
1 с использованием пакета программ для математического моделирования Mathcad
6.0 Plus фирмы MathSoft Inc.
[100].
Листинг программы содержит графики для
тр (к) и ар (к) зависимостей математического ожидания (МО) и среднеквадратического отклонения (СКО) признаков от использованных опорных распределений различных видов [91].
Структурная схема числового эксперимента может быть представлена в виде рис.

3.6, а определение погрешности результатов моделирования проведено в п.
3.6.
В прил.1• J представлены все результаты расчетов, а на рис.3.7 3.22 показаны виды опорных распределений, входных сигналов и зависимости изменения mp(k) и ар (к) от номера опорного распределения для значения интервала наблюдения Т= 103At, где At интервал дискретизации исследуемых сигналов.
Г

[стр.,97]

На рис.
3.7 ЗЛО показаны три вида входных сигналов, подлежащих распознаванию.
I Первый вид аддитивная смесь двухуровневого сигнала (меандр) с нормальным шумом.
Четыре класса входных сигналов данного вида представлены различными отношениями сигнал/шум 0j =0, 3, 5, 10 дБ (j = 1,2,3,4.).
На рис.

3.7 показаны временные диаграммы дискретного сигнала и нормального процесса, а на рис.
3.8 пример временной диаграммы смеси для значения 0 = 3 дБ.
Второй вид входных сигналов нормальные процессы с одинаковыми одномерными плотностями распределения вероятностей и различными
корреляционными функциями (КФ).
Здесь под различными КФ понимаются функции, имеющие одинаковый, вид но различные интервалы корреляции процессов.
На рис.
3.9 представлены примеры временных диаграмм процессов с различнымиI t функциями корреляции, оценочные значения которых представлены на рис.
3.11.
Вид корреляционных функций экспоненциальный (R(r) = е~р'т').
Входные процессы сгенерированы в соответствии с алгоритмом, изложенным в [12], основанным на обработке с помощью рекуррентных процедур отсчетов нормального некоррелированного процесса.
Физической моделью данных рекуррентных процедур является пропускание широкополосного нормального шума через фильтр___ ■ низких частот (ФНЧ), при этом коэффициент Р функции корреляции определяет-I ся значением граничной частоты ФНЧ fB.
В данном случае четыре класса случайI ных процессов были сгенерированы для значений fB, равных f0 = 100 Гц, fl =200 Гц, f2 =400 Гц, f3 =600 Гц.
Третий вид входных сигналов нормальные процессы с одинаковыми одномерными плотностями распределения вероятностей и различными корреляционными функциями.
Различия КФ понимаются в том же смысле, что и для второго вида входных сигналов.
На рис.
3.10 представлены примеры временных диаграмм процессов с различными функциями корреляции, оценочные значения которых представлены на рис.
3.12.
Однако в отличие от предыдущего случая вид корреляционных функций экспоненциально-косинусный (R(t) = е~рт coscd0t ).
физической моделью рекуррентных процедур, использованных в этом случае, является пропускание широкополосного нормального шума через контур с центральной частотой f0.
В данном случае четыре класса случайных процессов былиt сгенерированы для значений f0, равных f0=20 Гц, fl = 80 Гц, f2 =200 Гц, f3=400 Гц.
По сгенерированным входным процессам были сформированы наборы признаков для каждого из четырех классов.
При этом использовались два набора опорных сигналов.
В первом наборе шесть опорных процессов с некоррелированными отсчетами и различными плотностями распределения вероятностей, вид которых представлен на рис.
3.13, а выборочная КФ для одного из процессов на рис.• I 3.14.
Во втором наборе шесть опорных процессов с одинаковыми (нормальными) распределениями (рис.
3.18) и различными функциями корреляции.
Выборочные КФ сгенерированных шести опорных процессов представлены на рис.
3.19.
97 Г

[стр.,105]

С целью нахождения объемов статистик для заданных классов, обеспечивающих минимизацию дисперсий оценок признаков, было проведено статистическое моделирование по программе, представленной в приложении 2.
Листинг программы содержит графики для mp(i) и ар (i) зависимостей математического I ожидания и среднеквадратического отклонения признаков от количества отсчетов сигналов, используемых для их формирования, а также зависимости Rad(i) I для радиусов собственных областей заданных классов сигналов, получаемых при обучении классификатора.
Структурная схема числового эксперимента может быть представлена в виде рис.
3.23.
В прил.

2 представлены все результаты расчетов, а на рис.
3.24 3.37 показаны виды опорных распределений, входных процессов и зависимости изменения mp(i),ap(i) и Rad(i) от количества отсчетов входного процесса (от интервала времени обучения Т = Ati).
• s ■ Р* ' Рассматриваются входные сигналы, подлежащие распознаванию, одного вида.
Они соответствуют П виду сигналов в предыдущем пункте, то есть нормальные процессы с одинаковыми одномерными плотностями распределений (рис.
3.24) и различными корреляционными функциями.
Вид КФ экспоненциальный.
Оценочные значения КФ сгенерированных входных процессов представлены на графиках на рис.
3.25.
Множество входных процессов разбито на 4 класса, соответствующие корреляционным функциям на рисунке.
По сгенерированным входным процессам были сформированы наборы признаков для каждого из четырех классов.
При этом использовались два набора* , опорных сигналов.
В первом наборе шесть опорных процессов с некоррелированными отсчетами и различными плотностями распределения вероятностей, вид которых представлен на рис.
3.26, а выборочная КФ для одного из процессов на рис.
3.27.
Во втором наборе шесть опорных процессов с одинаковыми • ' * (нормальными) распределениями (рис.
3.32) и различными функциями корреляции.
Выборочные КФ сгенерированных шести опорных процессов представлены на рис.
3.33.
105

[Back]