52 адекватность оценки и выбора соответствующих информационных инноваций (систем интеллектуального анализа данных) в условиях России. Компьютерные системы поддержки принятия управленческих решений, как правило, основываются на двух основных подходах. Первый, наиболее традиционный, состоит в том, что в системе фиксируется опыт и мнение эксперта на основании которого и вырабатывается оптимального в данной ситуации решения. Системы, реализующие второй подход выработку решения на основании изучения исторических данных описывают поведение анализируемого объекта, принятые в прошлом решения и их результаты. Эти данные часто включают, например, результаты финансово-хозяйственной деятельности предприятия за период, временные ряды цен или статистику продаж той или иной продукции. Тем самым синтезируют в себе количественный и качественный анализ. При оценке и выборе такого рода информационных инноваций необходимо опираться на определенную систему критериев, отражающую специфические черты и условия принятия решения в российской экономике переходного периода, как на макроуровне, так и на уровне отдельных предприятий [14]. Критерий 1. Статистическая значимость. Очевидно, для того чтобы применение этих систем на практике было оправданным, необходимо репрезентативное множество данных, иначе принятые на их основе решения будут необоснованными. С этим условием связана основная трудность использования технологии data mining в нашей стране, так как отличительной чертой большинства отечественных предприятий является сравнительно небольшой срок их существования. Объем накопленных ими баз данных обычно составляет 2-4 года. Опасность здесь заключается не столько в трудности выявления значимых взаимосвязей в W немногочисленных данных и построения на их основе моделей, сколько в получении 4 статистически незначимых моделей и принятии на их основе ошибочных решений. Когда данных мало, а описывающая их модель сложна и включает много степеней свободы, то часто нетрудно подогнать эту модель под них, даже если они являются случайными числами. Тот факт, что методика отлично работает когда нужно объяснить то, что было в прошлом, но совершенно непригодна для принятия перспективных решений, вызывает сомнения в способности подобных систем решать реальные задачи в сфере бизнеса и финансов. |
28 технологии KDD, а также типов задач, где их применение дает значительный экономический эффект. Элементы автоматической обработки и анализа данных становятся неотъемлемой частью концепции электронных хранилищ данных и часто именуются в этом контексте data mining (добыча знаний из данных) [49]. Можно выделить следующие восемь классов систем интеллектуального анализа данных, применяемых в бизнесе и финансах 1.Предметно-ориентированные аналитические системы 2.Статистические пакеты 3.f !ейронные сети 4,Системы рассуждений на основе аналогичных случаев 5.Деревья реш ений (decision trees) б.Генетические алгоритмы 7.Нелииейные регрессионные методы -.8.Эволюционное программирование Па российском рынке эти подходы и информационные продукты выступают фактически как инновационные технологии. При их выборе и оценке должно быть учтено действие некоторых специфичных для России факторов и условий, влияющих на эффективность применения технологии data mining как в целом, так и в конкретной хозяйственной организации. Рассмотрим действие этих факторов, которые, по нашему мнению, оказываю! непосредственное влияние на выбор того или иного инновационного продукта из данного класса систем (информационных технологий) и которые следует рассматривать в качестве критериев факторов, определяющих адекватность оценки и выбора соответствующих информационных инноваций (систем интеллектуального анализа данных) в условиях России. Компьютерные системы поддержки принятия решений, в принципе, могут основываться на двух подходах. Первый, более традиционный, заключается в том, что в системе фиксируется опыт эксперта, который и используется для выработки оптимального в данной ситуации решения. Системы, реализующие 29 второй подход выработку решения на основе анализа исторических данных описывают поведение изучаемого объекта, принятые в прошлом решения, их результаты и т. д. Эти данные могут включать, например, временные ряды цен, результаты финансово-хозяйственной деятельности предприятия или статистику продаж той или иной продукции. При оценке и выборе такого рода инновационных технологий необходимо опираться на следующую систему критериев, отражающих специфические черты и условия принятия решения в российской экономике переходного периода, как на макроуровне, так и на уровне отдельных предприятий. Критерий 1. Статистическая значимость. Очевидно, для того чтобы применение этих систем в практике оказалось оправданным, необходимо репрезентативное множество этих данных иначе принятые на их основе решения будут необоснованными. С этим обстоятельством связана главная трудность продвижения технологии data mining в России: отличительная черта большинства отечественных предприятий сравнительно небольшой срок существования. Характерный ’’возраст” накопленных ими баз данных составляет 2-4 года. Опасность тут состоит не столько в невозможности обнаружения интересующих взаимосвязей в малочисленных данных и построения моделей на их основе, сколько в получении статистически незначимых моделей и принятии на их основе неверных решений. Если данных маю, а описывающая их модель сложна и включает много степеней свободы, то всегда можно подогнать эту модель под данные, даже если это целиком случайные числа. Тог факт, что метод отлично работает, когда нужно объяснить то, что было в прошлом, но совершенно непригоден для принятия решений миа будущее", рождает сомнения в способности систем data mining решать реальные задачи из сферы бизнеса и финансов. Таким образом, главная проблема применения систем добычи знаний для России это немногочисленноегь анализируемых данных, а одно из главных |