243 2. Какое пороговое значение с выбрать для разделения «зачет», «незачет»? В общем случае эта задача является двухкритериальной оптимизационной. Ищется значение, которое максимизирует разность математических ожиданий и одновременно минимизирует дисперсию разности. В качестве свертки критериев используется расстояние Махалонобиса: g Jmx-m2) Dz (4-17) На основании введенного критерия, двухкритериальная задача переходит в обычную задачу оптимизации, т.е. выбора значений минимизирующих значение функции А2. Решение этой задачи оптимизации является решением системы линейных уравнений: оца!, + a2a12 +... + apclp = тх j zw21 ala21 + a2CT22 + ••• + apCT2p = ™21 m22 aiapj + a2ap2 +... + ctpapp = mpX mp2 (4-18) После определения a,i наблюдаемому вектору X ставится в соответствие значение дискриминантной функции z. Константа с выбирается из соображений минимизации вероятности ошибочной классификации. Сумма вероятностей ошибочных классификаций Р(2 1)+Р(112) минимальна при выборе константы с: Mzx + Mz2 2 (4-19) Таким образом, найденные из соотношений (4.17) и (4.19) значения а, и с полностью решают задачу классификации. В качестве оценки влияния коррелированности ответов рассмотрим пример для четырех уровней сложности. Пусть разность математических |
89 Процедура классификации заключается в подборе константы с и отнесении Х к W\, если z>c; и к W2 , если z В связи с этим возникают следуюшие вопросы: 1. Какие веса взять для лучшей классификации? 2. Какое пороговое значение с выбрать для разделения «зачет», «незачет»? В общем случае эта задача является двухкритериальной оптимизационной. Ищется значение, которое максимизирует разность математических ожиданий и одновременно минимизирует дисперсию разности. В качестве свертки критериев используется расстояние Махалонобиса: Dz (2.43) На основании введенного критерия, двухкритериальная задача переходит в обычную задачу оптимизации, т.е. выбора значений а/, минимизирующих значение функции Д^. Решение этой задачи оптимизации является решением системы линейных уравнений; сс,а„ + а 2 а , 2 + ...+ ара,^, = Ш 1 , -т^х a ia 2 +а2С722 + ... + c t„a ,„ = —т (2.44) а,Ор1+ а2<7^,2 + ... + а р р р = гПр^ После определения а, наблюдаемому вектору X ставится в соответствие значение дискриминантной функции г. Константа с выбирается из соображений минимизации вероятности ошибочной классификации. Сумма вероятностей ошибочных классификаций Р(21)+ Д 1[2) минимальна при выборе константы с: 90 c = Mz^ + MZ2 (2.45) Таким образом, найденные из соотношений (2.43) и (2.45) значения а( и с полностью решают задачу классификации. В качестве оценки влияния коррелированности ответов рассмотрим пример для четырех уровней сложности. Пусть разность математических ожиданий баллов тестируемых для двух групп по каждому уровню сложности равна: Д М =(1,1,1,1). (2-46) И корреляции между ответами на задания любых уровней сложности также отсутствует, тогда для весов заданий справедливо: Л=(1, 1, 1, 1), (2.47) т.е. все веса равны. Это объясняется равенством разностей математических ожиданий в данномгипотетическом случае. Если же сделать предположение о наличии даже небольших корреляций, то тогда: 1 0 0 0 О 1 0.2 О О 0.2 1 О 0 0 0 1 (2.48) Т.е. в данном случае только между ответами на задания второго и третьего уровня сложности имеется корреляция 0,2. В этом сл)^ае решение уравнений для весов будет: Л=(1, 0,83, 0,83, 1). (2-49) В данном случае видно существенное снижение весов для коррелированных заданий. Однако в реальной ситуации необходимы более точные разности математических ожиданий правильных ответов на задания различных уровней сложности. |