[стр. 44]
44 достоверностью распознавания являются определяющими факторами при построении распознающей системы. При фиксированном значении р с увеличением объема обучающих m и контрольной п выборок вероятность ошибки распознавания а = Р уменьшается. Следовательно, с учетом ограничений ее минимально возможное значение достигается при фиксированном значении р, когда т и п , увеличиваясь, оказываются равными своим предельным значениям m = М и n = N . Если при этом достигнутое значение вероятности ошибки а (М, N, р) остается больше заданного по условиям задачи значения а*, то единственным путем ее дальнейшего уменьшения остается увеличение размерности признакового пространства р . Вычисляется значение вероятности ошибки распознавания а (М, N, р) при р = 1,2,..., р0, до тех пор, пока не окажется, что a (M,N,p0) (1.41) Зафиксировав найденное значение р = р0, необходимо решить задачу оптимизации (1.40). Для ее решения в [147, с. 192] используется итерационная процедура. Зависимость a (М, N, р) от размерности признакового пространства при 8 = 0,1 приведена в [147, рис. 5.2]. Значения р01ГГ, попт, moirr при 8 = 0,1, 1 -а =0,9 и различных значениях N и М приведены в [147, табл. 5.1]. Анализ представленных результатов расчетов показывает, что с уменьшением предельных значений объемов обучающих М и контрольной N выборок оптимальное значение размерности признакового пространства ропт, обеспечивающее заданный уровень достоверности распознавания 1-a* = 1Р* увеличивается. Аналогичный характер носит взаимосвязь оптимальной размерности признакового пространства ропт с оптимальными объемами обучающих шопт и контрольной попт выборок: увеличение последних приводит к уменьшению рош. и наоборот. Таким образом, в тех случаях, когда по условиям функционирования системы распознавания увеличение с целью обеспечения требуемой достоверности значения какого-либо из ее параметров (например времени обучения или/и распознавания) оказывается невозможным, заданный уровень может быть достигнут увеличением другого параметра (например, размерности признакового пространства).
|
[стр. 51]
51 а = J3= (б(р)ехр{Smp / 4} / £л/2я(р 3)!ijj х оо я/2 х Jtp 1•cosp2ф•ехр(1 / 2)(t2^/28mp t sincpj x (1.36) 0—тс/2 xF(^ sinф / -\/2/m + 4 / n j dt бф = a(m, n, p). Таким образом, задача оптимизации признакового пространства (включающая в себя и оптимизацию суммарного объема обучающих и контрольных наблюдений) записывается следующим образом [82]: ш+ п)р -» min, a (m, n, p) < a*. (1.37) При заданном 5, учитывая инвариантность решения задачи (1.37) относительно умножения критерия на положительное число, задача переписывается в следующем виде: 5(2ш + п)р -» min, a(m, n, p)(1.38) Если сделать замену переменных х = 25тр; у = бпр, тогда также, как и в одномерном случае (см. п. 1.7.2), в силу свойств функции (1.36) с достаточной для практических приложений точностью в качестве решения [m*,n*,p*) задачи (1.38) можно принять следующий набор из трех целых чисел: т* = [х 0/(28ро)] + 1, п*=[у0/(5р0)]+ 1, р*=р0, (1.39) где х0,у0,р0 (р0 целое число) являются решениями следующей экстремальной задачи [82]: х + у —»min; a = Р = 0(р)ехр(х / 8)/ л/27г(р 3)!ijj х оо к/2 х J Jtp 1-cosp 2ф-ехр-(1/2)^2л /х ^ я т ф Ц х (1-40) О-я/2 х Ffвтф / (2л/1Т Ж Т Ш )]А Д р = a * В реальных системах распознавания максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m < М, n < N ), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые во многих случаях наряду с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы. При фиксированном значении р с увеличением объема обучающих m и контрольной п выборок вероятность ошибки распознавания a = (3 уменьшается. Следовательно, с учетом ограничений ее минимально возможное значение дости
[стр.,52] гается при фиксированном значении р , когда т и п , увеличиваясь, оказываются равными своим предельным значениям m = М и n = N . Если при этом достигнутое значение вероятности ошибки а (М, N, р) остается больше заданного по ус$ ловиям задачи значения а , то единственным путем ее дальнейшего уменьшения остается увеличение размерности признакового пространства р. Вычисляется значение вероятности ошибки распознавания a(M,N,p) при р = 1,2, ...,р0, до тех пор, пока не окажется, что a(M ,N,p0) < a \ (1.41) Зафиксировав найденное значение р = р0, необходимо решить задачу оптимизации (1.40). Для ее решения в [82, с. 192] используется итерационная процедура. Зависимость a (М, N, р) от размерности признакового пространства при 8 = 0,1 приведена в [82, рис. 5.2]. Значения ропт, попт, т опт при 8 = 0,1, 1-а* = 0,9 и различных значениях N и М приведены в [82, табл. 5.1]. Анализ представленных результатов расчетов показывает, что с уменьшением предельных значений объемов обучающих М и контрольной N выборок оптимальное значение размерности признакового пространства ропт, обеспечивающее заданный уровень достоверности распознавания 1 -a = 1р увеличивается. Аналогичный характер носит взаимосвязь оптимальной размерности признакового пространства ропт с оптимальными объемами обучающих т опт и контрольной попт выборок: увеличение последних приводит к уменьшению ропт и наоборот. Таким образом, в тех случаях, когда по условиям функционирования системы распознавания увеличение с целью обеспечения требуемой достоверности значения какого-либо из ее параметров (например времени обучения или/и распознавания) оказывается невозможным, заданный уровень может быть достигнут увеличением другого параметра (например, размерности признакового пространства). 52
[стр.,103] для того, чтобы избежать генерирования "лишних" опорных сигналов, можно применять методы разведочного анализа данных (РАД) [2], позволяющие быстро оценить вид и основные параметры распределения исследуемых входных процессов (в данном случае низкая точность оценок при использовании РАД не играет роли). Это позволит генерировать только опорные процессы, максимальноi перекрывающиеся своими распределениями с входными сигналами; для увеличения достоверности распознавания необходимо генерировать коррелированные опорные процессы. При этом пространство признаков формируется с использованием опорных процессов, значения интервалов корреляции (ИК) которых равномерно распределены в некоторой области. Граничные значения интервалов корреляции в этой области должны соответствовать слабо коррелированному СП и случайному процессу с ИК, близким по значению к оценке интервала корреляции исследуемого процесса. Другими словами, в набор опорных процессов должны входить процессы от высокочастотных до процессов с граничной частотой, близкой к граничной частоте исследуемого сигнала. Возвращаясь к вопросу о количестве используемых признаков, то есть о размерности признакового пространства, можно сказать следующее. Задача оптимизации размерности признакового пространства должна, очевидно, включать в себя как составную часть рассмотренную вп. 1.6 задачу оптимизации суммарного объема р = (2т + п) (при количестве классов, равном 2) обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем р признакам p = p(2m + n), обеспечивающего достоверность распознавания не хуже заданного значения а* = а ^ , р* = Ограниченные возможности реальных распознающих систем по обработке результатов измерений по каждому из р признаков позволяют всегда считать число признаков р ограниченным некоторой величиной Р (р < Р). Кроме того, максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N (m < М, n < N), причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые часто с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы. При фиксированном значении р с увеличением объема обучающих ш и контрольной п выборок вероятность ошибки распознавания а , (3, очевидно, уменьшается. Следовательно, с учетом ограничений ее минимально возможное• ' значение достигается при фиксированном значении р , когда т и п , увеличиваясь, оказываются равными своим предельным значениям m = М и п = N. Если 103
|