Задача оптимизации размерности признакового пространства при К = 2, m1=m2=m, Ь = 1 должна включать в себя как составную часть задачу оптимизации суммарного объема р = (2т + п) обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам р = p-(2m + n), требуемого для достижения заданного уровня достоверности распознавания а* =(3*. Во многих практических задачах оказывается возможным в первом приближении положить общую ковариационную матрицу М распознаваемых совокупностей s, и s2 диагональной с дисперсиями на диагонали [82, 41]. В этом случае расстояние Махаланобиса [82, (5.4)] •d2=Z[(ai2“aii)/ci] = Z5i> i=l i=l (2.19) где Ограниченные возможности реальных распознающих систем по обработке результатов измерений по каждому из р признаков позволяют всегда считать число признаков р ограниченным некоторой величиной Р(р<Р), откуда следует, что существует некоторое общее значение 5 > О, что 8( >5 для всех i = 1,..., р. В качестве 8, в частности, можно выбрать точность измерения признаков в реальных системах. Для получения приближенного решения, обеспечивающего достоверность распознавания не хуже заданного значения а*, можно заменить в (2.20) все 8; на 8 и использовать вместо расстояния Махаланобиса его оценку снизу d2 = 8р [82], которую и следует подставить вместо d2 в выражение для вероятности ошибки распознавания [82, (3.8)] а = 3 = б(р)ехр{-5тр/4} /[а/2тт(р 3)! ijj х х х f(-JSp sin ф / д/2 / т + 4 / n) dt d(p = а(т, n, р). (2.20) 54 |
Ц 50 равмых признаков, их количеством. Каждое обучающее и контрольное наблюдение требует, очевидно, проведения р актов измерения значений признаков. Поэтому задача формирования признакового пространства является составной частью проблемы минимизации общей размерности задачи распознавания [82], а в общей формулировке задачи оптимизации распознающей системы (1.13) минимизации подлежит общее количество измерений [82, (5.3)] где mk объем обучающей выборки для определения характеристик класса sk, п объем контрольной выборки, b общее количество актов принятия решений в процессе распознавания, q число первоначальных признаков. Рассмотрим решение задачи оптимизации размерности признакового пространства при произвольных объемах обучающих и контрольной выборок, которое представлено в [82]. Задача оптимизации размерности признакового пространства при К = 2, m, = т 2 = т , b = 1 должна включать в себя как составную часть рассмотренную в п. 1.7.3. задачу оптимизации суммарного объема р = (2 т + п) обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам требуемого для достижения заданного уровня достоверности распознавания ближении положить общую ковариационную матрицу М распознаваемых совокупностей s1и s2 диагональной с дисперсиями на диагонали [82, 41]. В этом случае расстояние Махаланобиса [82, (5.4)] Ограниченные возможности реальных распознающих систем по обработке результатов измерении по каждому из р признаков позволяют всегда считать число признаков р ограниченным некоторой величиной Р (р < Р), откуда следует, что существует некоторое общее значение 5>0, что 54>8 для всех 1= 1,..., р. В качестве 8 , в частности, можно выбрать точность измерения признаков в реальных системах. Для получения приближенного решения, обеспечивающего достоверность распознавания не хуже заданного значения а , можно заменить в (1.36) все 5j на 5 и использовать вместо расстояния Махаланобиса жение для вероятности ошибки распознавания, получающееся из (1.27) [82, (3.8)] (1.34) а* = Р*. Во многих практических задачах оказывается возможным в первом при(1.35) * О о его оценку снизу ан= ор [82], которую и следует подставить вместо d в выра для того, чтобы избежать генерирования "лишних" опорных сигналов, можно применять методы разведочного анализа данных (РАД) [2], позволяющие быстро оценить вид и основные параметры распределения исследуемых входных процессов (в данном случае низкая точность оценок при использовании РАД не играет роли). Это позволит генерировать только опорные процессы, максимальноi перекрывающиеся своими распределениями с входными сигналами; для увеличения достоверности распознавания необходимо генерировать коррелированные опорные процессы. При этом пространство признаков формируется с использованием опорных процессов, значения интервалов корреляции (ИК) которых равномерно распределены в некоторой области. Граничные значения интервалов корреляции в этой области должны соответствовать слабо коррелированному СП и случайному процессу с ИК, близким по значению к оценке интервала корреляции исследуемого процесса. Другими словами, в набор опорных процессов должны входить процессы от высокочастотных до процессов с граничной частотой, близкой к граничной частоте исследуемого сигнала. Возвращаясь к вопросу о количестве используемых признаков, то есть о размерности признакового пространства, можно сказать следующее. Задача оптимизации размерности признакового пространства должна, очевидно, включать в себя как составную часть рассмотренную вп. 1.6 задачу оптимизации суммарного объема р = (2т + п) (при количестве классов, равном 2) обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам p = p(2m + n), обеспечивающего достоверность распознавания не хуже заданного значения а* = а ^ , р* = Ограниченные возможности реальных распознающих систем по обработке результатов измерений по каждому из р признаков позволяют всегда считать число признаков р ограниченным некоторой величиной Р (р < Р). Кроме того, максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m < М, n < N), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые часто с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы. При фиксированном значении р с увеличением объема обучающих ш и контрольной п выборок вероятность ошибки распознавания а , (3, очевидно, уменьшается. Следовательно, с учетом ограничений ее минимально возможное• ' значение достигается при фиксированном значении р , когда т и п , увеличиваясь, оказываются равными своим предельным значениям m = М и п = N. Если 103 |