вероятности ошибки для заданного классификатора, приведенной в [87]. Когда неизвестны априорные вероятности классов Р(м J, i = 1,2, то можно случайно извлечь N объектов и проверить, дает ли данный классификатор правильные решения для этих объектов. Такие объекты называют случайной выборкой. Пусть т число объектов, неправильно классифицированных в результате этого эксперимента. Величина т является дискретной случайной величиной. Обозначим истинную вероятность ошибки через б. Вследствие дискретности т при фиксированном б рассмотрим вероятность Рг {т = т / б} , которая задается биномиальным распределением: Рг{т = т/б} = ^Nje T(l-s)N~T. (4.19) = 0. (4.20) Е = Оценка максимального правдоподобия б величины s есть решение следующего уравнения правдоподобия: Э1пРг{т = т/е} f т N-t^ 5б . \б 1-б/е=е Следовательно, N (4.21) Другими словами, оценка максимального правдоподобия равна отношению числа неправильно классифицированных объектов к общему числу объектов. Свойства биномиального распределения хорошо известны. Характеристическая функция, математическое ожидание и дисперсия определяются следующим образом: (р(е) = {eexp(jco) + (l —s)}N, (4.22) M(t) = Ne, (4.23) D(t) = Ne(1-6). (4.24) Поэтому M(s) = M(t)/N = e, (4.25) D(e) = D(t)/N2 =s(l-6)/N. (4.26) Таким образом, оценка б является несмещенной. 130 |
• 4.5. Оценка статистической погрешности результатов моделирования 129 • i ' Показателем качества алгоритмов НКСП является суммарная вероятность ошибки классификации одного объекта исследования Рош. Так как имеется случайная погрешность в определении Рош, под ошибкой моделирования будем понимать эту случайную погрешность. Оценка ошибок статистического моделирования в общем виде затруднительна ввиду отсутствия общих аналитических выражений для ошибок моделирования систем случайных величин с произвольными законами распределения' I [67]. Воспользуемся методикой оценивания вероятности ошибки для заданного классификатора, приведенной в [87]. Когда неизвестны априорные вероятности i = 1,2, то можно случайно извлечь N объектов и проверить, даетклассов со ли данный классификатор правильные решения для этих объектов. Такие объекты называют случайной выборкой. Пусть т число объектов, неправильно классифицированных в результате этого эксперимента. Величина т является дискретной случайной величиной. Обозначим истинную вероятность ошибки через е. Вследствие дискретности т при фиксированном е рассмотрим вероятность Ргт = т / e l, которая задается биномиальным распределением: Рг{т t / s s 4 ls ) N\ (4.19) Оценка максимального правдоподобия s величины е есть решение следующего уравнения правдоподобия: dlnPrfт = т/е дв т N -т Е=Е 8 1-8 0. (4.20) 6=8 Следовательно, 8 т N (4.21) Другими словами, оценка максимального правдоподобия равна отношению числа неправильно классифицированных объектов к общему числу объектов. Свойства биномиального распределения хорошо известны. Характеристическая функция, математическое ожидание и дисперсия определяются следующим образом: (4.22)ф(е) 8exp(jo) + (l 8)Г > M(t) = N s , D(r) = Ne 8 (4.23) (4.24) Поэтому М(е) = M(t)/N е, D(e) = D(t)/N 8 8)/N . (4.25) (4.26) Таким образом, оценка 8 является несмещенной. |