параметров наиболее значимы. Например, при проведении маркетинга можно оценить, какие качества некоторого товара являются "подсознательно” определяющими для принятия решения о его покупке различными категориями потребителей. Классификация (распознавание) данных и ситуаций Это одна из типовых задач анализа многомерных данных, которая носит название «распознавание с учителем» и решается методами дискриминантного анализа [7]. В таких задачах рассматривается конечное число типов (классов) объектов распознавания, которыми могут быть субъекты и объекты страхования, события, ситуации или процессы. Объекты при этом должны быть описаны значениями числовых признаков (симптомов, показателей, параметров). Информация о каждом классе задана с помощью набора объектов (наблюдений, прецедентов), про которые их принадлежность этому классу известна заранее. Нужно найти критерии, по которым можно было бы относить объект к той или иной классификационной категории. Поиск критериев делается на основе изучения характеристик уже расклассифицированных объектов и вывода правил классификации. Алгоритмы распознавания могут применяться в любой области, где объеюы и процессы описываются массивом многомерных данных, например, в медицинской и технической диагностике, при прогнозировании месторождений полезных ископаемых по данным геологической разведки и урожайности сельскохозяйственных культур по существующему состоянию растений; в распознавании скрытых социальных ситуаций по данным осуществляемых опросов и во многих других ситуациях. В страховом деле, управлении обучением, в области социальной защиты могут решаться задачи распознавания субъектов, относящихся к некоторым выбранным классам или группам по определенной совокупности значений представляющих их характеристик. Кластеризация данных 25 |
какие качества некоторого товара являются "подсознательно" определяющими для принятия решения о его покупке различными категориями потребителей. Классификация (распознавание) данных и ситуаций Это одна из типовых задач анализа многомерных данных, которая носит название «распознавание с учителем» и решается методами дискриминантного анализа [7]. В таких задачах рассматривается конечное число типов (классов) объектов распознавания, которыми могут быть субъекты и объекты страхования, события, ситуации или процессы. Объекты при этом должны быть описаны значениями числовых признаков (симптомов, показателей, параметров). Информация о каждом классе задана с помощью набора объектов (наблюдений, прецедентов), про которые их принадлежность этому классу известна заранее. Нужно найти критерии, по которым можно было бы относить объект к той или иной классификационной категории. Поиск критериев делается на основе изучения характеристик уже расклассифицированных объектов и вывода правил классификации. Алгоритмы распознавания могут применяться в любой области, где объекты и процессы описываются массивом многомерных данных, например, в медицинской и технической диагностике, при прогнозировании месторождений полезных ископаемых по данным геологической разведки и урожайности сельскохозяйственных культур по существующему состоянию растений; в распознавании скрытых социальных ситуаций по данным осуществляемых опросов и во многих других ситуациях. В страховом деле, управлении обучением, в области социальной защиты могут решаться задачи распознавания субъектов, относящихся к некоторым выбранным классам или группам по определенной совокупности значений представляющих их характеристик. Кластеризация данных Кластеризация также является задачей классификации, которая отличается от вышеописанной тем, что кластеризация осуществляется в 23 |