1191 Зафиксировав найденное значение р=ро »необходимо решить задачу оптимизации (2m+n)-»min , а < а тах , то есть найти такие значения количества ■ обучающих m и контрольной п выборок, при которых достигался бы заданный предел ошибки распознавания а тах. 3.5 Исследование влияния времени обучения и распознавания на * эффективность классификатора Под временем обучения и распознавания принято понимать объемы обучающих m и контрольной п выборок [80]. Задача минимизации общего числа выборок уже рассматривалась в предыдущих пунктах и основные ее аспекты уже сформулированы. Необходимо только добавить, что, как уже указывалось, аналитическая зависимость между достоверностью распознавания (основным параметром эффективности системы) и объемами обучающих и контрольных выборок для данного непараметрического случая до сих пор не найдены. Поэтому в качестве параметра, влияющего на достоверность распознавания, будем использовать дисперсии оценок признаков, определяющие значения радиусов собственных областей классов в признаковом пространстве. Прежде чем рассматривать вопрос о том, какие объемы обучающих и контрольных выборок обеспечивают заданную достоверность распознавания, необходимо определить достаточные размеры статистик для формирования одного отсчета признаков или одного элемента в признаковом пространстве для заданного класса исследуемых сигналов. Можно показать [22], что количество отсчетов входного сигнала, необхо■ димое для формирования одного признака и объем выборки, по которой формируется собственная область класса, связаны напрямую. То есть, например,* если для формирования собственной области Gj класса C0j с минимальным радиусом Rjmin необходима выборка из 100 значений признака, сформированного |
при этом достигнутое значение вероятности ошибки a*(M,N,p) остается больше заданного по условиям задачи значения а тах, то единственным путем ее дальнейшего уменьшения остается увеличение размерности признакового пространства р. Находим оценку вероятности ошибки распознавания a*(M,N,p) при р = 1 , 2 , р0, до тех пор, пока не окажется, что a ^ M .N .p J s c w (3.66) Зафиксировав найденное значение р = р0, необходимо решить задачу оптимизации (2m + n)—»min, a* < а тах , то есть найти такие значения количества обучающих ш и контрольной п выборок, при которых достигался бы заданный предел ошибки распознавания а юах. • I 3.5. Исследование влияния времени обучения и распознавания на эффе тивность классификатора / Под временем обучения и распознавания принято понимать объемы обучающих m и контрольной п выборок [85]. Задача минимизации общего числа выборок уже рассматривалась в предыдущих пунктах и основные ее аспекты уже сформулированы. Необходимо только добавить, что, как уже указывалось, аналитическая зависимость между достоверностью распознавания (основным параметром эффективности системы) и объемами обучающих и контрольных выборок для данного непараметрического случая до сих пор не найдены. Поэтому в качестве параметра, влияющего на достоверность распознавания, будем использовать дисперсии оценок признаков, определяющие значения радиусов собственных областей классов в признаковом пространстве. Прежде чем рассматривать вопрос о том, какие объемы обучающих и контрольных выборок обеспечивают заданную достоверность распознавания, необходимо определить достаточные размеры статистик для формирования одного отсчета признаков или одного элемента в признаковом пространстве для заданного класса исследуемых сигналов. Можно показать [94], что количество отсчетов входного сигнала, необходимое для формирования одного признака и объем выборки, по которой формируется собственная область класса, связаны напрямую. То есть, например, если для формирования собственной области Gi класса со, с минимальным радиусом Rjmin необходима выборка'из 100 значений признака, сформированного на основе 100 отсчетов входного сигнала каждое, то эту же область можно получить используя 10 значений признака с 1000 отсчетами. Однако необходимо знание объема выборки из исходного сигнала, требуемого для формирования одного признака, обладающего минимальной дисперсией, с целью дальнейшего изучения влияния размеров выборки признаков на достоверность распознавания. 104 I |