Проверяемый текст
Ананьев Николай Сергеевич. Методы и средства анализа данных в системах поддержки принятия решений (Диссертация 2005)
[стр. 121]

Такую классификацию было предложено осуществлять с учетом следующих соображений.
Характер изменения кривых, представленных на рис.
4,1 б) и 4.2 б), позволяет говорить об определенной симметрии распределения уровня страховых рисков страхователей в обоих массивах относительно некоторой точки, примерно на середине этих кривых.
Эта симметрия похожа на симметрию функций типа
у=а+к(х-Ъ)ъ при к«1.
Это означает, что к нервом приближении выборка страхователей может быть разбита на два класса относительно средней точки.
В соответствии с этим в качестве критерия разбиения страхователей испытательных выборок было
<■ принято среднее арифметическое значение страхового риска страхователей в выборке.
Результаты расчетов по проверке непротиворечивости модели страхового риска и определению варианта набора характеристик, которые лучше других соответствовали модели страхового риска, представлены в таблице
4.7.
Критерием качества вариантов набора характеристик был процент страхователей с низким уровнем риска, которые действительно не имели ДТП.
Этот процент определялся по совпадающим индексам элементов испытательной (содержащей оценки рисков) и контрольной (содержащей данные о не имеющих ДТП страхователях) частных выборок.
Таблица
4.7 — Процент страхователей в испытательной выборке, не имеющих ДТП ^варианта данных о Массивы исходных данных страхователях ИД1 ИД2 1 79,3 76,8 2 74,5 77,3 3 80,0 79,8 Из анализа таблицы 4.7 следует, что вариант данных №3, включающий характеристики «Возраст автомобиля», «Стаж вождения», «Возраст 121
[стр. 130]

11о оси ординат число ДТП, по оси абсцисс число элементов массива а) По оси ординат оценка страхового риска, по оси абсцисс число элементов массива б) Рис.
4.2.
Данные о числе ДТП (а) и оценки страхового риска (б) в массиве ИД2 (мужчины) после сортировки.
Как видно из этих рисунков характер изменения кривой уровня страхового риска в правой части графиков 4.1 б) и 4.2 б) хорошо соответствует характеру изменения графика с числом ДТП 4.1 а) и 4.2 а), что косвенно говорит о непротиворечивости модели страхового риска, в соответствии с которой осуществлялось построение его оценок.
Одновременно анализ представленных данных, иллюстрируемых этими графиками, позволил сделать заключение о возможности разбиения страхователей на два класса класс высокого риска страхового случая, т.е.
ДТП, и класс низкого риска.
Такую классификацию было предложено осуществлять с учетом следующих соображений.
Характер изменения кривых, представленных на рис.
4.1 б) и 4.2 б), позволяет говорить об определенной симметрии распределения уровня страховых рисков страхователей в обоих массивах относительно некоторой точки, примерно на середине этих кривых.
Эта симметрия похожа на симметрию функций типа
у=а+к-(х-Ь)' при к « 1.
Это означает, что в первом 130

[стр.,131]

приближении выборка страхователей может быть разбита на два класса относительно средней точки.
В соответствии с этим в качестве критерия разбиения страхователей испытательных выборок было
принято среднее арифметическое значение страхового риска страхователей в выборке.
Результаты расчетов по проверке непротиворечивости модели страхового риска и определению варианта набора характеристик, которые лучше других соответствовали модели страхового риска, представлены в таблице
4.9.
Критерием качества вариантов набора характеристик был процент страхователей с низким уровнем риска, которые действительно не имели ДТП.
Этот процент определялся по совпадающим индексам элементов испытательной (содержащей оценки рисков) и контрольной (содержащей данные о не имеющих ДТП страхователях) частных выборок.
Таблица
4.9 Процент страхователей в испытательной выборке, не имеющих ДТП № варианта данных о страхователях Массивы исходных данных ИД1 ИД2 1 79.3 76.8 2 74.5 77.3 3 80.0 79.8 Из анализа таблицы 4.9 следует, что вариант данных №3, включающий характеристики «Возраст автомобиля», «Стаж вождения», «Возраст водителя» и составную характеристику «Стаж вождения/Возраст водителя» лучше соответствует содержанию страхового риска, чем остальные варианты.
Все последующие расчеты по построению оценок страхового риска, оцениванию качества критерия классификации страхователей и устойчивости оценок проводились с использованием этого варианта характеристик страхователей.
При оценке качества классификации контролировался также 131

[Back]