38 2. статистические пакеты; 3. нейронные сети; 4. системы рассуждений на основе аналогичных случаев; 5. деревья решений (decision trees); 6. генетические алгоритмы; 7. нелинейные регрессионные методы; 8. эволюционное программирование. На российском рынке эти подходы и информационные продукты выступают фактически как инновационные технологии. При их выборе и оценке должно быть учтено действие некоторых специфичных для России факторов и условий, влияющих на-эффективность применения технологии data mining, как в целом, так и в конкретной хозяйственной организации. Рассмотрим действие этих факторов, которые, по нашему мнению, оказывают непосредственное влияние на выбор того или иного инновационного продукта из данного класса систем (информационных технологий) и которые следует рассматривать в качестве критериев факторов, определяющих адекватность оценки и выбора соответствующих информационных инноваций (систем интеллектуального анализа данных) в условиях России. Компьютерные системы поддержки принятия решений, в принципе, могут основываться на двух подходах. Первый, более традиционный, заключается в том, что в системе фиксируется опыт эксперта, который и используется для выработки оптимального в данной ситуации решения. Системы, реализующие второй подход выработку решения на основе анализа исторических данных описывают поведение изучаемого объекта, принятые в-прошлом решения, их результаты и т. д. Эти данные могут включать, например, временные ряды цен, результаты финансово-хозяйственной деятельности предприятия или статистику продаж той или иной продукции. При оценке и выборе такого рода инновационных технологий необходимо опираться на следующую систему критериев, отражающих специфические черты и уело |
28 технологии KDD, а также типов задач, где их применение дает значительный экономический эффект. Элементы автоматической обработки и анализа данных становятся неотъемлемой частью концепции электронных хранилищ данных и часто именуются в этом контексте data mining (добыча знаний из данных) [49]. Можно выделить следующие восемь классов систем интеллектуального анализа данных, применяемых в бизнесе и финансах 1.Предметно-ориентированные аналитические системы 2.Статистические пакеты 3.f !ейронные сети 4,Системы рассуждений на основе аналогичных случаев 5.Деревья реш ений (decision trees) б.Генетические алгоритмы 7.Нелииейные регрессионные методы -.8.Эволюционное программирование Па российском рынке эти подходы и информационные продукты выступают фактически как инновационные технологии. При их выборе и оценке должно быть учтено действие некоторых специфичных для России факторов и условий, влияющих на эффективность применения технологии data mining как в целом, так и в конкретной хозяйственной организации. Рассмотрим действие этих факторов, которые, по нашему мнению, оказываю! непосредственное влияние на выбор того или иного инновационного продукта из данного класса систем (информационных технологий) и которые следует рассматривать в качестве критериев факторов, определяющих адекватность оценки и выбора соответствующих информационных инноваций (систем интеллектуального анализа данных) в условиях России. Компьютерные системы поддержки принятия решений, в принципе, могут основываться на двух подходах. Первый, более традиционный, заключается в том, что в системе фиксируется опыт эксперта, который и используется для выработки оптимального в данной ситуации решения. Системы, реализующие 29 второй подход выработку решения на основе анализа исторических данных описывают поведение изучаемого объекта, принятые в прошлом решения, их результаты и т. д. Эти данные могут включать, например, временные ряды цен, результаты финансово-хозяйственной деятельности предприятия или статистику продаж той или иной продукции. При оценке и выборе такого рода инновационных технологий необходимо опираться на следующую систему критериев, отражающих специфические черты и условия принятия решения в российской экономике переходного периода, как на макроуровне, так и на уровне отдельных предприятий. Критерий 1. Статистическая значимость. Очевидно, для того чтобы применение этих систем в практике оказалось оправданным, необходимо репрезентативное множество этих данных иначе принятые на их основе решения будут необоснованными. С этим обстоятельством связана главная трудность продвижения технологии data mining в России: отличительная черта большинства отечественных предприятий сравнительно небольшой срок существования. Характерный ’’возраст” накопленных ими баз данных составляет 2-4 года. Опасность тут состоит не столько в невозможности обнаружения интересующих взаимосвязей в малочисленных данных и построения моделей на их основе, сколько в получении статистически незначимых моделей и принятии на их основе неверных решений. Если данных маю, а описывающая их модель сложна и включает много степеней свободы, то всегда можно подогнать эту модель под данные, даже если это целиком случайные числа. Тог факт, что метод отлично работает, когда нужно объяснить то, что было в прошлом, но совершенно непригоден для принятия решений миа будущее", рождает сомнения в способности систем data mining решать реальные задачи из сферы бизнеса и финансов. Таким образом, главная проблема применения систем добычи знаний для России это немногочисленноегь анализируемых данных, а одно из главных |