Такую классификацию было предложено осуществлять с учетом следующих соображений. Характер изменения кривых, представленных на рис. 4,1 б) и 4.2 б), позволяет говорить об определенной симметрии распределения уровня страховых рисков страхователей в обоих массивах относительно некоторой точки, примерно на середине этих кривых. Эта симметрия похожа на симметрию функций типа у=а+к(х-Ъ)ъ при к«1. Это означает, что к нервом приближении выборка страхователей может быть разбита на два класса относительно средней точки. В соответствии с этим в качестве критерия разбиения страхователей испытательных выборок было <■ принято среднее арифметическое значение страхового риска страхователей в выборке. Результаты расчетов по проверке непротиворечивости модели страхового риска и определению варианта набора характеристик, которые лучше других соответствовали модели страхового риска, представлены в таблице 4.7. Критерием качества вариантов набора характеристик был процент страхователей с низким уровнем риска, которые действительно не имели ДТП. Этот процент определялся по совпадающим индексам элементов испытательной (содержащей оценки рисков) и контрольной (содержащей данные о не имеющих ДТП страхователях) частных выборок. Таблица 4.7 — Процент страхователей в испытательной выборке, не имеющих ДТП ^варианта данных о Массивы исходных данных страхователях ИД1 ИД2 1 79,3 76,8 2 74,5 77,3 3 80,0 79,8 Из анализа таблицы 4.7 следует, что вариант данных №3, включающий характеристики «Возраст автомобиля», «Стаж вождения», «Возраст 121 |
11о оси ординат число ДТП, по оси абсцисс число элементов массива а) По оси ординат оценка страхового риска, по оси абсцисс число элементов массива б) Рис. 4.2. Данные о числе ДТП (а) и оценки страхового риска (б) в массиве ИД2 (мужчины) после сортировки. Как видно из этих рисунков характер изменения кривой уровня страхового риска в правой части графиков 4.1 б) и 4.2 б) хорошо соответствует характеру изменения графика с числом ДТП 4.1 а) и 4.2 а), что косвенно говорит о непротиворечивости модели страхового риска, в соответствии с которой осуществлялось построение его оценок. Одновременно анализ представленных данных, иллюстрируемых этими графиками, позволил сделать заключение о возможности разбиения страхователей на два класса класс высокого риска страхового случая, т.е. ДТП, и класс низкого риска. Такую классификацию было предложено осуществлять с учетом следующих соображений. Характер изменения кривых, представленных на рис. 4.1 б) и 4.2 б), позволяет говорить об определенной симметрии распределения уровня страховых рисков страхователей в обоих массивах относительно некоторой точки, примерно на середине этих кривых. Эта симметрия похожа на симметрию функций типа у=а+к-(х-Ь)' при к « 1. Это означает, что в первом 130 приближении выборка страхователей может быть разбита на два класса относительно средней точки. В соответствии с этим в качестве критерия разбиения страхователей испытательных выборок было принято среднее арифметическое значение страхового риска страхователей в выборке. Результаты расчетов по проверке непротиворечивости модели страхового риска и определению варианта набора характеристик, которые лучше других соответствовали модели страхового риска, представлены в таблице 4.9. Критерием качества вариантов набора характеристик был процент страхователей с низким уровнем риска, которые действительно не имели ДТП. Этот процент определялся по совпадающим индексам элементов испытательной (содержащей оценки рисков) и контрольной (содержащей данные о не имеющих ДТП страхователях) частных выборок. Таблица 4.9 Процент страхователей в испытательной выборке, не имеющих ДТП № варианта данных о страхователях Массивы исходных данных ИД1 ИД2 1 79.3 76.8 2 74.5 77.3 3 80.0 79.8 Из анализа таблицы 4.9 следует, что вариант данных №3, включающий характеристики «Возраст автомобиля», «Стаж вождения», «Возраст водителя» и составную характеристику «Стаж вождения/Возраст водителя» лучше соответствует содержанию страхового риска, чем остальные варианты. Все последующие расчеты по построению оценок страхового риска, оцениванию качества критерия классификации страхователей и устойчивости оценок проводились с использованием этого варианта характеристик страхователей. При оценке качества классификации контролировался также 131 |