обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам p=p(2m+n) , обеспечивающего достоверность распознавания не хуже заданного значения а =атах, Р*=Ртах • Ограниченные возможности реальных распознающих систем по обработке результатов измерений по каждому из р признаков позволяют всегда счи-* тать число признаков р ограниченным некоторой величиной Р (р<Р) . Кроме того, максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m При фиксированном значении р с увеличением объема обучающих m и контрольной п выборок вероятность ошибки распознавания а, Следовательно, с учетом ограничений ее минимально возможное значение достигается при фиксированном значении р, когда т и п , увеличиваясь, оказываются равными своим предельным значениям ш=М и n=N. Если при этом достигнутое значение вероятности ошибки a (M,N,p) остается больше заi * данного по условиям задачи значения а тах,.то единственным путем ее дальнейшего уменьшения остается увеличение размерности признакового пространства р. Находим оценку вероятности ошибки распознавания a*(M,N,p) при р=1,2 ,..., ро, до тех пор, пока не окажется, что I a*(M,N,p) < a max (3.43) 118 I |
Ц 50 равмых признаков, их количеством. Каждое обучающее и контрольное наблюдение требует, очевидно, проведения р актов измерения значений признаков. Поэтому задача формирования признакового пространства является составной частью проблемы минимизации общей размерности задачи распознавания [82], а в общей формулировке задачи оптимизации распознающей системы (1.13) минимизации подлежит общее количество измерений [82, (5.3)] где mk объем обучающей выборки для определения характеристик класса sk, п объем контрольной выборки, b общее количество актов принятия решений в процессе распознавания, q число первоначальных признаков. Рассмотрим решение задачи оптимизации размерности признакового пространства при произвольных объемах обучающих и контрольной выборок, которое представлено в [82]. Задача оптимизации размерности признакового пространства при К = 2, m, = т 2 = т , b = 1 должна включать в себя как составную часть рассмотренную в п. 1.7.3. задачу оптимизации суммарного объема р = (2 т + п) обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам требуемого для достижения заданного уровня достоверности распознавания ближении положить общую ковариационную матрицу М распознаваемых совокупностей s1и s2 диагональной с дисперсиями на диагонали [82, 41]. В этом случае расстояние Махаланобиса [82, (5.4)] Ограниченные возможности реальных распознающих систем по обработке результатов измерении по каждому из р признаков позволяют всегда считать число признаков р ограниченным некоторой величиной Р (р < Р), откуда следует, что существует некоторое общее значение 5>0, что 54>8 для всех 1= 1,..., р. В качестве 8 , в частности, можно выбрать точность измерения признаков в реальных системах. Для получения приближенного решения, обеспечивающего достоверность распознавания не хуже заданного значения а , можно заменить в (1.36) все 5j на 5 и использовать вместо расстояния Махаланобиса жение для вероятности ошибки распознавания, получающееся из (1.27) [82, (3.8)] (1.34) а* = Р*. Во многих практических задачах оказывается возможным в первом при(1.35) * О о его оценку снизу ан= ор [82], которую и следует подставить вместо d в выра 51 а = J3= (б(р)ехр{Smp / 4} / £л/2я(р 3)!ijj х оо я/2 х Jtp 1•cosp2ф•ехр(1 / 2)(t2^/28mp t sincpj x (1.36) 0—тс/2 xF(^ sinф / -\/2/m + 4 / n j dt бф = a(m, n, p). Таким образом, задача оптимизации признакового пространства (включающая в себя и оптимизацию суммарного объема обучающих и контрольных наблюдений) записывается следующим образом [82]: ш+ п)р -» min, a (m, n, p) < a*. (1.37) При заданном 5, учитывая инвариантность решения задачи (1.37) относительно умножения критерия на положительное число, задача переписывается в следующем виде: 5(2ш + п)р -» min, a(m, n, p)(1.38) Если сделать замену переменных х = 25тр; у = бпр, тогда также, как и в одномерном случае (см. п. 1.7.2), в силу свойств функции (1.36) с достаточной для практических приложений точностью в качестве решения [m*,n*,p*) задачи (1.38) можно принять следующий набор из трех целых чисел: т* = [х 0/(28ро)] + 1, п*=[у0/(5р0)]+ 1, р*=р0, (1.39) где х0,у0,р0 (р0 целое число) являются решениями следующей экстремальной задачи [82]: х + у —»min; a = Р = 0(р)ехр(х / 8)/ л/27г(р 3)!ijj х оо к/2 х J Jtp 1-cosp 2ф-ехр-(1/2)^2л /х ^ я т ф Ц х (1-40) О-я/2 х Ffвтф / (2л/1Т Ж Т Ш )]А Д р = a * В реальных системах распознавания максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m < М, n < N ), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые во многих случаях наряду с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы. При фиксированном значении р с увеличением объема обучающих m и контрольной п выборок вероятность ошибки распознавания a = (3 уменьшается. Следовательно, с учетом ограничений ее минимально возможное значение дости для того, чтобы избежать генерирования "лишних" опорных сигналов, можно применять методы разведочного анализа данных (РАД) [2], позволяющие быстро оценить вид и основные параметры распределения исследуемых входных процессов (в данном случае низкая точность оценок при использовании РАД не играет роли). Это позволит генерировать только опорные процессы, максимальноi перекрывающиеся своими распределениями с входными сигналами; для увеличения достоверности распознавания необходимо генерировать коррелированные опорные процессы. При этом пространство признаков формируется с использованием опорных процессов, значения интервалов корреляции (ИК) которых равномерно распределены в некоторой области. Граничные значения интервалов корреляции в этой области должны соответствовать слабо коррелированному СП и случайному процессу с ИК, близким по значению к оценке интервала корреляции исследуемого процесса. Другими словами, в набор опорных процессов должны входить процессы от высокочастотных до процессов с граничной частотой, близкой к граничной частоте исследуемого сигнала. Возвращаясь к вопросу о количестве используемых признаков, то есть о размерности признакового пространства, можно сказать следующее. Задача оптимизации размерности признакового пространства должна, очевидно, включать в себя как составную часть рассмотренную вп. 1.6 задачу оптимизации суммарного объема р = (2т + п) (при количестве классов, равном 2) обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам p = p(2m + n), обеспечивающего достоверность распознавания не хуже заданного значения а* = а ^ , р* = Ограниченные возможности реальных распознающих систем по обработке результатов измерений по каждому из р признаков позволяют всегда считать число признаков р ограниченным некоторой величиной Р (р < Р). Кроме того, максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m < М, n < N), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые часто с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы. При фиксированном значении р с увеличением объема обучающих ш и контрольной п выборок вероятность ошибки распознавания а , (3, очевидно, уменьшается. Следовательно, с учетом ограничений ее минимально возможное• ' значение достигается при фиксированном значении р , когда т и п , увеличиваясь, оказываются равными своим предельным значениям m = М и п = N. Если 103 |