Проверяемый текст

Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)

[стр. 119]
1191 Зафиксировав найденное значение р=ро »необходимо решить задачу оптимизации (2m+n)-»min , а < а тах , то есть найти такие значения количества ■ обучающих m и контрольной п выборок, при которых достигался бы заданный предел ошибки распознавания а тах.
3.5 Исследование влияния времени обучения и распознавания на * эффективность классификатора Под временем обучения и распознавания принято понимать объемы обучающих m и контрольной п выборок [80].
Задача минимизации общего числа выборок уже рассматривалась в предыдущих пунктах и основные ее аспекты уже сформулированы.
Необходимо только добавить, что, как уже указывалось, аналитическая зависимость между достоверностью распознавания (основным параметром эффективности системы) и объемами обучающих и контрольных выборок для данного непараметрического случая до сих пор не найдены.
Поэтому в качестве параметра, влияющего на достоверность распознавания, будем использовать дисперсии оценок признаков, определяющие значения радиусов собственных областей классов в признаковом пространстве.
Прежде чем рассматривать вопрос о том, какие объемы обучающих и контрольных выборок обеспечивают заданную достоверность распознавания, необходимо определить достаточные размеры статистик для формирования одного отсчета признаков или одного элемента в признаковом пространстве для заданного класса исследуемых сигналов.
Можно показать [22], что количество отсчетов входного сигнала, необхо■ димое для формирования одного признака и объем выборки, по которой формируется собственная область класса, связаны напрямую.
То есть, например,* если для формирования собственной области Gj класса C0j с минимальным радиусом Rjmin необходима выборка из 100 значений признака, сформированного

[стр. 104]
при этом достигнутое значение вероятности ошибки a*(M,N,p) остается больше заданного по условиям задачи значения а тах, то единственным путем ее дальнейшего уменьшения остается увеличение размерности признакового пространства р.
Находим оценку вероятности ошибки распознавания a*(M,N,p) при р = 1 , 2 , р0, до тех пор, пока не окажется, что a ^ M .N .p J s c w (3.66) Зафиксировав найденное значение р = р0, необходимо решить задачу оптимизации (2m + n)—»min, a* < а тах , то есть найти такие значения количества обучающих ш и контрольной п выборок, при которых достигался бы заданный предел ошибки распознавания а юах.
• I 3.5.
Исследование влияния времени обучения и распознавания на эффе тивность классификатора / Под временем обучения и распознавания принято понимать объемы обучающих m и контрольной п выборок [85].
Задача минимизации общего числа выборок уже рассматривалась в предыдущих пунктах и основные ее аспекты уже сформулированы.
Необходимо только добавить, что, как уже указывалось, аналитическая зависимость между достоверностью распознавания (основным параметром эффективности системы) и объемами обучающих и контрольных выборок для данного непараметрического случая до сих пор не найдены.
Поэтому в качестве параметра, влияющего на достоверность распознавания, будем использовать дисперсии оценок признаков, определяющие значения радиусов собственных областей классов в признаковом пространстве.
Прежде чем рассматривать вопрос о том, какие объемы обучающих и контрольных выборок обеспечивают заданную достоверность распознавания, необходимо определить достаточные размеры статистик для формирования одного отсчета признаков или одного элемента в признаковом пространстве для заданного класса исследуемых сигналов.
Можно показать [94], что количество отсчетов входного сигнала, необходимое для формирования одного признака и объем выборки, по которой формируется собственная область класса, связаны напрямую.
То есть, например, если для формирования собственной области Gi класса со, с минимальным радиусом Rjmin необходима выборка'из 100 значений признака, сформированного на основе 100 отсчетов входного сигнала каждое, то эту же область можно получить используя 10 значений признака с 1000 отсчетами.
Однако необходимо знание объема выборки из исходного сигнала, требуемого для формирования одного признака, обладающего минимальной дисперсией, с целью дальнейшего изучения влияния размеров выборки признаков на достоверность распознавания.
104 I

[Back]