Кластеризация также является задачей классификации, которая отличается от вышеописанной тем, что кластеризация осуществляется в результате анализа близости структур значений характеристик (признаков) описания объектов (процессов), т.е., в условиях, когда критерии классификации не заданы. Кластеризация при исследовании данных позволяет обнаруживать данные так, что объекты одной группы "похожи" друг на друга, а объекты различных групп "не похожи". Это могут быть, например, родственные по какому-нибудь признак)' номера счетов. Алгоритмы кластеризации как инструмент первичного анализа незаменимы при обработке наборов многомерных данных, возникающих в новых областях, постановках и исследованиях. Составление прогнозов событий и ситуаций Все вышеописанные задачи имеют дело с предсказаниями событий типа "будет ли конкретный клиент возобновлять договор?". Здесь, однако, речь идет о прогнозировании развития каких-либо показателей, типа объемов продаж, на основе обнаруженных закономерностей. Из истории развития банка или предприятия, заданной векторными описаниями их положения в различные моменты времени, можно определить их обобщенные показатели на некоторое время вперед. Для решения задачи необходимы аналогичные наборы данных о деятельности других банков (предприятий), для которых заранее уже имеются эти обобщенные показатели. К средствам сложного анализа данных следует также отнести системы визуализации, преобразующие сложные данные в изображения различных типов, начиная от простых диаграмм и до трехмерных сред. Большая часть этих задач относится к так называемому разведочному анализу (РАД) [54]. Теоретической базой методов РАД являются математические методы анализа многомерных разнородных данных и методы интеллектуальных систем. В таблице 1.1 представлены типовые задачи анализа многомерных данных и методы, применяемые для решения 26 |
результате анализа близости структур значений характеристик (признаков) описания объектов (процессов), т.е., в условиях, когда критерии классификации не заданы. Кластеризация при исследовании данных позволяет обнаруживать данные так, что объекты одной группы "похожи" друг на друга, а объекты различных групп "не похожи". Это могут быть, например, родственные по какому-нибудь признаку номера счетов. Алгоритмы кластеризации как инструмент первичного анализа незаменимы при обработке наборов многомерных данных, возникающих в новых областях, постановках и исследованиях. Составление прогнозов событий и ситуаций Все вышеописанные задачи имеют дело с предсказаниями событий типа "будет ли конкретный подписчик возобновлять подписку?". Здесь, однако, речь идет о прогнозировании развития каких-либо показателей, типа объемов продаж, на основе обнаруженных закономерностей. Из истории развития банка или предприятия, заданной векторными описаниями их положения в различные моменты времени, можно определить их обобщенные показатели на некоторое время вперед. Для решения задачи необходимы аналогичные наборы данных о деятельности других банков (предприятий), для которых заранее уже имеются эти обобщенные показатели. К средствам сложного анализа данных следует также отнести системы визуализации, преобразующие сложные данные в изображения различных типов, начиная от простых диаграмм и до трехмерных сред. Большая часть этих задач относится к так называемому разведочному анализу (РАД) [54]. Теоретической базой методов РАД являются математические методы анализа многомерных разнородных данных и методы интеллектуальных систем. В таблице 1.1 представлены типовые задачи анализа многомерных данных и методы, применяемые для решения этих задач. Обзор упомянуты в таблице методов приводится в п.п. 1.4 и 2.3 24 |