подвергнуты кластеризации несколькими методами, в качестве расстояния между объектами также использовалось несколько метрик. В частности, использовались методы одиночной связи (Single Linkage), методы полной связи (Complete Linkage), метод Уорда (Ward’s metod). Выбор расстояния между объектами неодназначен и в этом состоит основная сложность. Наиболее популярной метрикой является евклидова. Эта метрика отвечает интуитивным представлениям близости43. рс(ЛЛу)= Е(Л,-^)2 (24) где XirXj исследуемые предприятия, р число факторов конкурентной позиции предприятия, Xkl, Xkj — значение fc-ro признака предприятий ХЬХ. На основании графического представления результатов кластерного анализа был сделан вывод о том, что предпочтительным является разбиение предприятий на три кластера, что и было сделано с использованием метода К-средних. Результаты представлены в виде графика распределения центров кластеров (рисунок 12) и в виде таблицы с номерами объектов, входящих в каждый кластер с указанием расстояния до центра каждого кластера. ■° Вуколов, Э.А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов Statistics и Excel / Э.А. Вуколов. М.: ИНФРА-М, 2004. С. 284. 98 |
,, te Таблица 19 Обозначения предприятий Обозначение Предприятия . С 1 Аннинский хлебокомбинат С 2 Бобровхлеб С 3 Бутурлиновкахлеб С 4 Давыдовский хлебокомбинат С 5 Калачхлеб С 6 Каменский хлебокомбинат районного потребобщества С 7 Липецкхлебмакаронпром С 8 Лиски-хлеб С 9 Мамонхлеб, потребительское общество С 10 Нововоронежхлеб ’ С 11 Семилукихлеб С 12 Тобус С 13 Хлебозавод №1 С 14 Хлебозавод №2 С 15 Хлебозавод №5 С 16 Хлебозавод №6 С 17 Хлебозавод №7 С 18 Хэлла Поскольку большинство известных алгоритмов кластеризации основано на использовании эвристических методов и рекомендбвать использование конкретного метода можно только в общих чертах, то основной критерий выбора метода практическая полезность результата. Предприятия были подвергнуты кластеризации несколькими методами, в качестве расстояния между объектами также использовалось несколько метрик. В частности, использовались методы одиночной связи (Single Linkage), методы полной связи (Complete Linkage), метод Уорда (Ward’s metod). Выбор расстояния между объектами неодназначен и в этом состоит основная сложность. Наиболее популярной метрикой является евклидова. Эта метрика отвечает интуитивным представлениям близости33. 33 Вуколов, Э.А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов Statistics и Excel [Текст] / Э.А. Вуколов. М.: ИНФРА-М, 2004. С. 284. 102 Pe (X „ X j) = S № r A ) , А=/ (О где Xi,Xj—исследуемые предприятия хлебопекарной промышленности, р число факторов конкурентной позиции предприятия, Xи >Xkj значение к-то признака предприятий XitX . Л Примеры результатов кластеризации приведены на рисунках 22 и 23. о 200 150 100 50 Tree Diagram for 18 Cases Ward's method Squared Euclidean distances • I 1 l I 11I1 C_18 C J 3 C_15 C_12 C_8 C_6 C_2 Q_5 C_9 C J4 C_17 C J 6 C J1 C_10 C_4 C _ 7 ‘ C_3 C_1 t Рисунок 22 Дендрограмма при методе ^орда, расстояние между объектами квадрат евклидовой метрики На основании графического представления результатов кластерного анализа был сделан вывод о том, что предпочтительным является разбивка предприятий на три кластера, что и было сделано с использованием метода Ксредних. 103 ч Tree Diagram for 18 Cases Ward's method Chebychev distance metric C J 8 C_13 C J 2 C_16 C_8 C_4 C_7 C_9 C_3 C J 4 C_15 C_17 C_11 С _10 C_2 C_5 C_6 C_1 Рисунок 23 Дендрограмма при методе Уорда, расстояние между объектами супренум-норма (расстояние Чебышева) 1 Результаты представлены в виде графика распределения центров кластеров (рисунок 24) и в виде таблицы с номерами объектов, входящих в каждый кластер с указанием расстояния до центра каждого кластера (таблица 20). 2-1>*ж у О 1£ 11U53 Я £ age якластер 1 -о кластер 2 кластер 3 Рисунок 24 Графики координат кластеров 104 |