45 Проблема измерения близости объектов возникает при любых трактовках кластеров и различных методов классификации [66]. Основные трудности, возникающие при этом: неоднозначность выбора способа нормировки и определения расстояния между объектами (метрика). В табл. 2.1 приведены некоторые употребительные расстояния и меры близости, используемые для количественных шкал. Таблица 2.1 Показатели Формулы Линейное расстояние Евклидово расстояние Квадратное Евклидово расстояние Расстояние Чебышева Обобщенное степенное расстояние Минковского dwz k ~х‘\ i=\ i=i т < ^ = Z (* /k )2 /-1 daj = maxjxf -x ' Ы где х' значение 1-ого признака у i'-ого объекта; х\ вектор-столбец значения всех признаков на /-ом объекте; рv общее число совпадающих значений свойств (нулевых и единичных, где 1наличие свойства, 0 отсутствие). В настоящее время существует огромное количество алгоритмов кластерного анализа. Наиболее естественный путь нахождения классов заключается в том, что дается точное определение класса и отыскивается скопление точек, обладающих соответствующими свойствами. Например, кластер можно определить как такое скопление точек, в котором среднее межточечное расстояние меньше среднего расстояния от данных точек до остальных [29]. В диссертационной работе кластерный анализ применялся для классификации районов Воронежской области по нозологическим формам, а также для оценки общей медико-экологической ситуации. В качестве меры близости использовалось расстояние Евклида. Обработка проводилась при помощи |
49 сти, возникающие при этом: неоднозначность выбора способа нормировки и определения расстояния между объектами (метрика). В табл.2.5 приведены некоторые употребительные расстояния и меры близости, используемые для количественных шкал. Таблица 2.5 Показатели Формулы Линейное расстояние Евклидово расстояние Квадратное Евклидово расстояние Расстояние Чебышева Обобщенное степенное расстояние Минковского d "j = Ё К д э /=i т 1 ы т Л е ц = £ ( ^ ^ ) 2 /=1 dCj = тах\х‘ х ' i ( 2 > ; * ; ) ' ) ' /=1 где х' значение 1-ого признака у /-ого объекта; х, вектор-столбец значения всех признаков на /-ом объекте; р ц общее число совпадающих значений свойств (нулевых и единичных, где 1 наличие свойства, 0 отсутствие). В настоящее время существует огромное количество алгоритмов кластерного анализа. Наиболее естественный путь нахождения классов заключается в том, что дается точное определение класса и отыскивается скопление точек, обладающих соответствующими свойствами. Например, кластер можно определить как такое скопление точек, в котором среднее межточечное расстояние меньше среднего расстояния от данных точек до остальных [38]. В диссертационной работе кластерный анализ применялся для классификации районов Воронежской области по нозологическим формам, а так же для оценки общей медико-экологической ситуации. В качестве меры близости использовалось расстояние Евклида. Обработка проводилась при помощи пакета Statistica 5.0. Результат кластерного анализа районов Воронежской |