Проверяемый текст
Силкин, Александр Юрьевич; Кластеризация контрагентов как инструмент формализации управленческих решений в области ценообразования (Диссертация 2003)
[стр. 75]

75 Дополнительную сложность, при отборе информативных признаков очень часто привносит наличие зависимости между признаками, так называемая мультиколлинеарность, часто присутствующая в экономических данных.
Далее, рассмотрим возможность использования методов нейронных сетей, в частности сети Кохонена (самоорганизующиеся карты Кохонена)
[46], которые представляют собой тип сетей относимых к категории «обучение без учителя».
Таким образом, данный метод свободен от привносимых исследователем
субъективных суждений и основывается на использовании закономерностей изначально содержащихся в самих исходных данных.
Сети Кохонена выбраны среди других моделей нейронных сетей, вследствие их большей адекватности специфике решаемой нами задачи и наличии удобных средств визуализации полученного результата.

Сеть Кохонена классифицирует входные векторы в группы схожих, при этом количество групп задается изначально исследователем.
Это достигается с помощью такой подстройки весов слоя Кохонена, что близкие входные векторы активируют один и тот же нейрон данного слоя.
Алгоритм расчета может быть представлен в следующем виде.
На начальном этапе анализа задается количество нейронов в сети, которым присваиваются соответствующие весовые коэффициенты.
Величины коэффициентов приравниваются либо случайным образом малым величинам, либо в качестве начальных значений задаются случайно выбранные значения из обучающих примеров.
Обучение представляет собой итеративную процедуру корректировки весовых значений нейронов w, в зависимости от найденного нейрона победителя, определяемого на основе близости, в смысле определенной
в данном пространстве метрики, к произвольному входному вектору: К “ 4 ~ т И К ~*).
(0-13) где х входной вектор; с индекс нейрона победителя, * метрика в данном пространстве.
[стр. 75]

л гда указания «учителя» неточны, иными словами классификация производится при нечетко заданных условиях.
Подробный анализ существующих алгоритмов кластеризации приведен в работах [56, 99, 136, 147].
В силу необходимости снижения субъективности в процессе осуществления кластеризации, на наш взгляд, представляется рациональным в качестве основы использовать один из существующих методов «классификации без учителя», использующий закономерности, содержащиеся в самих исходных данных.
Естественно, применение данного метода обосновано только'при наличии достатснного объема данных, в противном случае, необходимо использование либо эвристических процедур корректировки результата кластеризации, так называемый метод «неидеального учителя», или использовать процедуры искусственного дополнения имеющихся данных «идеальными объектами».
Необходимо отметить, что в ряде случаев, как указывает Г.С.Лбов [89], для наилучшего описания групп объектов требуется свое подмножество признаков для каждой группы.
Этот подход позволяет минимизировать затраты на получение необходимой для осуществления кластеризации информации, в то же время всвникает проблема выбора методики отбора признаков, на основании которых осуществляется кластеризация для каждого конкретного класса.
Дополнительную сложность, при отборе информативных признаков очень часто привносит наличие зависимости между признаками, так называемая мультиколлинеарность, часто присутствующая в экономических данных.
Далее, рассмотрим возможность использования методов нейронных сетей, в частности сети Кохонена (самоорганизующиеся карты Кохонена)
[55], которые представляют собой тип сетей относимых к категории «обучение без учителя».
Таким образом, данный метод свободен от привносимых исследователем
субъектгаА ных суждений и основывается на использовании закономерностей изначально содержащихся в самих исходных данных.
Сети Кохонена выбраны среди других моделей нейронных сетей, вследствие их большей адекватности специфике решаемой нами задачи и наличии удобных средств визуализации полученного результата.

75

[стр.,76]

Сеть Кохонена классифицирует входные векторы в группы схожих, при этом количество групп задается изначально исследователем.
Это достигается с помощью такой подстройки весов слоя Кохонена, что близкие входные векторы активируют один и тот же нейрон данного слоя.
Алгоритм расчета может быть представлен в следующем виде.
На начальном этапе анализа задается количество нейронов в сети, которым присваиваются соответствующие весовые коэффициенты.
Величины коэффициентов приравниваются либо случайным образом малым величинам, либо в качестве начальных значений задаются случайно выбранные значения из обучающих примеров.
Обучение представляет собой итеративную процедуру корректировки весовых значений нейронов wt в зависимости от найденного нейрона победителя, определяемого на основе близости, в смысле определенной
Жданном пространстве метрики, к произвольному входному вектору: К * = т т { Щ х } , (2.13) где х входной вектор; с индекс нейрона победителя, * метрика в данном пространстве.
После нахождения нейрона победителя производится корректировка весовых коэффициентов его и соседей.
Для модификации коэффициентов используется слгдующая формула: W,(/ + 1) = W((0 + M 0 * [* (0 -W (/)], А(2.14) где /-номер эпохи (стадии расчета),? = [!,.,«]; А(0"фунция соседства нейронов; х(г)-входной вектор; w(r)-BecoBbie коэффициенты нейрона нашаге t.
Функция соседства нейронов соответственно представима в виде: h(t) = h(d,t)*a{t), (2.15) где А(й?,/)-функция расстояния; dрасстояние между нейроном победителем и соседними нейронами; о(0-функция скорости обучения.
* 76

[Back]