150 проверить, дает ли данный классификатор правильные решения для этих объектов. Такие объекты называют случайной выборкой. Пусть т —число объектов, неправильно классифицированных в результате этого эксперимента. Величина т является дискретной случайной величиной. « Обозначим истинную вероятность ошибки через 8. Вследствие дискретности т при фиксированном е рассмотрим вероятность Рг{т = т/е}, которая задается * биномиальным распределением: Рг{т т/е} X 8 / N -x (4.19) максимального дующего уравнения правдоподобия: дInРг{т = тIP M rfP /е} т N x де е=£ 1 8 (4.20) е~€ Следовательно, £= — N (4.21) Другими словами, оценка максимального правдоподобия равна отношению » числа неправильно классифицированных объектов к общему числу объектов. Свойства биномиального распределения хорошо известны. Характеристическая функция, математическое ожидание и дисперсия определяются следующим образом: I <р(е)= {eexp(jco)+ (l e)}N, (4.22) |
• 4.5. Оценка статистической погрешности результатов моделирования 129 • i ' Показателем качества алгоритмов НКСП является суммарная вероятность ошибки классификации одного объекта исследования Рош. Так как имеется случайная погрешность в определении Рош, под ошибкой моделирования будем понимать эту случайную погрешность. Оценка ошибок статистического моделирования в общем виде затруднительна ввиду отсутствия общих аналитических выражений для ошибок моделирования систем случайных величин с произвольными законами распределения' I [67]. Воспользуемся методикой оценивания вероятности ошибки для заданного классификатора, приведенной в [87]. Когда неизвестны априорные вероятности i = 1,2, то можно случайно извлечь N объектов и проверить, даетклассов со ли данный классификатор правильные решения для этих объектов. Такие объекты называют случайной выборкой. Пусть т число объектов, неправильно классифицированных в результате этого эксперимента. Величина т является дискретной случайной величиной. Обозначим истинную вероятность ошибки через е. Вследствие дискретности т при фиксированном е рассмотрим вероятность Ргт = т / e l, которая задается биномиальным распределением: Рг{т t / s s 4 ls ) N\ (4.19) Оценка максимального правдоподобия s величины е есть решение следующего уравнения правдоподобия: dlnPrfт = т/е дв т N -т Е=Е 8 1-8 0. (4.20) 6=8 Следовательно, 8 т N (4.21) Другими словами, оценка максимального правдоподобия равна отношению числа неправильно классифицированных объектов к общему числу объектов. Свойства биномиального распределения хорошо известны. Характеристическая функция, математическое ожидание и дисперсия определяются следующим образом: (4.22)ф(е) 8exp(jo) + (l 8)Г > M(t) = N s , D(r) = Ne 8 (4.23) (4.24) Поэтому М(е) = M(t)/N е, D(e) = D(t)/N 8 8)/N . (4.25) (4.26) Таким образом, оценка 8 является несмещенной. |