Проверяемый текст
[стр. 45]

45 Проблема измерения близости объектов возникает при любых трактовках кластеров и различных методов классификации [66].
Основные трудности, возникающие при этом: неоднозначность выбора способа нормировки и определения расстояния между объектами (метрика).
В табл.

2.1 приведены некоторые употребительные расстояния и меры близости, используемые для количественных шкал.
Таблица
2.1 Показатели Формулы Линейное расстояние Евклидово расстояние Квадратное Евклидово расстояние Расстояние Чебышева Обобщенное степенное расстояние Минковского dwz k ~х‘\ i=\ i=i т < ^ = Z (* /k )2 /-1 daj = maxjxf -x ' Ы где х' значение 1-ого признака у i'-ого объекта; х\ вектор-столбец значения всех признаков на /-ом объекте; рv общее число совпадающих значений свойств (нулевых и единичных, где 1наличие свойства, 0 отсутствие).
В настоящее время существует огромное количество алгоритмов кластерного анализа.
Наиболее естественный путь нахождения классов заключается в том, что дается точное определение класса и отыскивается скопление точек, обладающих соответствующими свойствами.
Например, кластер можно определить как такое скопление точек, в котором среднее межточечное расстояние меньше среднего расстояния от данных точек до остальных
[29].
В диссертационной работе кластерный анализ применялся для классификации районов Воронежской области по нозологическим формам, а также для оценки общей медико-экологической ситуации.
В качестве меры близости использовалось расстояние Евклида.
Обработка проводилась при помощи
[стр. 49]

49 сти, возникающие при этом: неоднозначность выбора способа нормировки и определения расстояния между объектами (метрика).
В табл.2.5
приведены некоторые употребительные расстояния и меры близости, используемые для количественных шкал.
Таблица
2.5 Показатели Формулы Линейное расстояние Евклидово расстояние Квадратное Евклидово расстояние Расстояние Чебышева Обобщенное степенное расстояние Минковского d "j = Ё К д э /=i т 1 ы т Л е ц = £ ( ^ ^ ) 2 /=1 dCj = тах\х‘ х ' i ( 2 > ; * ; ) ' ) ' /=1 где х' значение 1-ого признака у /-ого объекта; х, вектор-столбец значения всех признаков на /-ом объекте; р ц общее число совпадающих значений свойств (нулевых и единичных, где 1 наличие свойства, 0 отсутствие).
В настоящее время существует огромное количество алгоритмов кластерного анализа.
Наиболее естественный путь нахождения классов заключается в том, что дается точное определение класса и отыскивается скопление точек, обладающих соответствующими свойствами.
Например, кластер можно определить как такое скопление точек, в котором среднее межточечное расстояние меньше среднего расстояния от данных точек до остальных
[38].
В диссертационной работе кластерный анализ применялся для классификации районов Воронежской области по нозологическим формам, а так же для оценки общей медико-экологической ситуации.
В качестве меры близости использовалось расстояние Евклида.
Обработка проводилась при помощи
пакета Statistica 5.0.
Результат кластерного анализа районов Воронежской

[Back]