31 1.4.5. Bn. 1.3 была сформулирована общая постановка задачи оптимизации распознающей системы. Сформулируем задачу оптимизации временных и пространственных параметров системы распознавания применительно к параметрическому случаю. Как уже отмечалось, процесс распознавания содержит в себе формирование признакового пространства размерностью р, обучение распознающей системы с использованием обучающих выборок объемом mk, и принятие решений о принадлежности контрольной выборки объемом nk к одному из классов sk. При этом возможны ошибки распознавания, возникающие с определенной вероятностью, зависящей от большого количества факторов. Указанные вероятности определяются следующим образом [150]. Обозначим через а к вероятность отнесения выборки из п контрольных наблюдений к какому-нибудь из классов s,, s2, ..., sk_1}sk+1,..., sK, отличному от класса sk, когда на самом деле выборка относится именно к этому классу, а через Рк вероятность отнесения выборки контрольных наблюдений к классу sk, когда в действительности она ему не принадлежит. При двух классах, К = 2, выполняются очевидные равенства а, =Р2 и а 2=Р,, и вероятности а, и Р2 совпадают с вероятностями ошибок 1-го и 2-го рода. Вероятности ошибок распознавания а к, Рк, г = 1, К определяют достоверность D, являющуюся одним из параметров задачи оптимизации (1.3), и получение для них аналитических формул, позволяющих вычислять а к и Рк, к = 1, К при любых конкретных значениях mk, п, р, К, d,r, £, г = 1, К , £ф г, дает возможность конкретизировать общую постановку задачи оптимизации в случае параметрической априорной неопределенности. Как уже мыло отмечено ранее, возможны различные подходы к выбору критерия оптимальности H(V) и ограничений h;(V) < у;, i = 1, Q, С=(V) = 0:, j = 1, J в (1.7). Однако, как правило, при синтезе распознающих систем основным является требование обеспечения гарантированного уровня достоверности принимаемых решении, состоящее в том, что вероятности ошибок распознавания а к и Рк, к = 1,К не должны превышать ф ф некоторых заданных значений а и р ни для одного из имеющихся классов s,,...,sK. При этом в качестве критерия оптимальности системы распознавания естественно принимать затраты на обеспечение заданного уровня достоверности (стоимостные, временные и т.д.). Так, если С: стоимость измерения j-ro признака, как правило, одинаковая для всех классов, а b количество актов распознавания, которые необходимо произвести за заданный промежуток времени, то стоимость распознавания [147] При b = 1 и С: = Сдля всех j = 1, р , опуская постоянный множитель в критерии (1.12), задачу оптимизации распознающей системы (1.3) можно записать в виде: (1.12) |
39 альтернативные критерии максимума апостериорной вероятности и максимального правдоподобия. Кроме того, правило (1.10) обладает одним существенным недостатком. Оно не всегда позволяет выбрать наиболее правдоподобный класс, иначе говоря, возможны ситуации, когда для данной контрольной выборки, заведомо принадлежащей к одному из альтернативных классов, оно вообще не дает никакого решения. Это происходит вследствие нарушения условия транзитивности правила принятия решений. В [82] рассмотрены возможные случаи нарушения данного условия. Для того, чтобы избежать подобных ситуаций необходимо накладывать некоторые ограничения на соотношения значений порогов с(и. В частности для трехальтернативного случая достаточным условием транзитивности решающего правила (1.10), обеспечивающим существование решения для любой выборки Хп не приводящей к вырождению функции шk(Xn), k = 1, К , является условие [82, (1.46)] Ckik2Ck2k3^k3kl 1 (1.11) для любых классов sk , sk , sks из множества {sK}. Можно убедиться, что доста* ч точному условию удовлетворяют критерии максимума апостериорной вероятности и максимального правдоподобия. 1.6.5. В п. 1.5. была сформулирована общая постановка задачи оптимизац распознающей системы. Сформулируем задачу оптимизации временных и пространственных параметров системы распознавания применительно к параметрическому случаю. Как уже отмечалось, процесс распознавания содержит в себе формирование признакового пространства размерностью р, обучение распознающей системы с использованием обучающих выборок объемом mk, и принятие решений о принадлежности контрольной выборки объемом nk к одному из классов sk. При этом возможны ошибки распознавания, возникающие с определенной вероятностью, зависящей от большого количества факторов. Указанные вероятности определяются следующим образом [85]. Обозначим через а к вероятность отнесения выборки из п контрольных наблюдений к какому-нибудь из классов Sj, s2,..., sk_j, sk+1,..., sK, отличному от класса sk, когда на самом деле выборка относится именно к этому классу, а через Рк вероятность отнесения выборки контрольных наблюдений к классу sk, когда в действительности она ему не принадлежит. При двух классах, К = 2, выполняются очевидные равенства а! = Р2 и а 2= РР и вероятности а, и Р2 совпадают с вероятностями ошибок 1-го и 2-го рода. Вероятности ошибок распознавания а к, (Зк, г = 1,К определяют достоверность D, являющуюся одним Из параметров задачи оптимизации (1.7), и получение для них аналитических формул, позволяющих вычислять а к и (Зк, к = 1, К при любых конкретных значениях mk, п, р, К, d^, I , г = 1,К, £ * г, дает возможность конкретизировать общую постановку задачи оптимизации (1.7) в слу чае параметрической априорной неопределенности. Как уже мыло отмечено ранее, возможны различные подходы к выбору критерия оптимальности НСV) и ограничений hj(V) Однако, как правило, при синтезе распознающих систем основным является требование обеспечения гарантированного уровня достоверности принимаемых решений, состоящее в том, что вероятности ошибок распознавания а к и {Зк, к = 1, К не должны пре40 вышать некоторых заданных значений а и Р ни для одного из имеющихся классов s,,..., sK. При этом в качестве критерия оптимальности системы распознавания естественно принимать затраты на обеспечение заданного уровня достоверности (стоимостные, временные и т.д.). Так, если С, стоимость измерения j-ro признака, как правило, одинаковая для всех классов, а b количество актов распознавания, которые необходимо произвести за заданный промежуток времени, то стоимость распознавания [82] к н Т с . Т Х + Ьп (1.12) j=l чк=1 При Ъ= 1 и Cj = Сдля всех j = 1, р , опуская постоянный множитель в критерии (1.12), задачу оптимизации распознающей системы (1.7) можно записать в виде: к р Y m k + п _ > m i n ; k=l a k < а ,p k (1.13) Фактически (1.13) означает минимизацию числа измерений признаков, необходимых для того, чтобы обеспечить непревышение вероятностями ошибок распознавания a k и Зк заданных значений а* и р* соответственно ни для одного из распознаваемых классов. |