56 b В наши дни генетические алгоритмы (например, система GeneHunter фирмы * Ward Systems Group) следует рассматривать как инструмент научного исследования, а не как средство анализа данных для практического применения в сфере экономики. 7. Нелинейные регрессионные методы. В данном случае поиск зависимости целевых переменных от остальных производится в виде функций определенного вида. Например, в одном из наиболее применяемых алгоритмов этого типа методе группового учета атрибутов 4 зависимость между переменными ищется в форме полиномов. Это делает подобный метод широко используемым для анализа российских финансовых и корпоративных данных. В качестве примера можно привести систему NeuroShell компании Ward Systems Group. 8. Эволюционное программирование. Суть метода заключается в том, что гипотезы о виде зависимости целевой переменной от других формулируются системой в виде алгоритмов на некоем внутреннем языке программирования. Если это универсальный язык, то теоретически на нем можно выразить зависимость любого вида. Процесс построения этих программ строится как эволюция в программном мире (этим метод немного похож на генетические алгоритмы). Если система находит алгоритм, достаточно точно выражающий искомую зависимость, она начинает вносить в него небольшие модификации и отбирает среди построенных таким способом дочерних программ те, Которые увеличивают общую точность. Следовательно, система «выращивает» несколько различных генетических линии программ, которые конкурируют между собой в точности выражения искомой зависимости. Сегодня это один из наиболее перспективных инновационных продуктов data mining, реализованных, в частности, в системе For/Analyst, который показывает при анализе российских финансовых рынков достаточно высокие показатели. * Щ. Собственный транслирующий модуль системы For/Analyst переводит найденные зависимости с внутреннего языка системы на понятный пользователю язык (математические формулы, таблицы и пр.), делая их легко интерпретируемыми. В таблице 1.3 отражена оценка приведенных методов и систем по трем рассмотренным выше предложенным автором критериям оценки и выбора * |
34 7. Нелинейные регрессионные методы Поиск зависимости целевых переменных от остальных ведется в форме функций какого-то определенного вида. Например, в одном из наиболее удачных алгоритмов этого типа методе группового учета атрибутов (МГУА) зависимость ищут в форме полиномов. Это делает данный метод достаточно перспективным для анализа российских финансовых и корпоративных данных. МГУА реализована, например, в системе NeuroShell компании Ward Systems Group. 8. Эволюционное программирование Суть метода в том, что гипотезы о виде зависимости целевой переменной от других переменных формулируются системой в виде программ на некотором внутреннем языке программирования. Если это универсальный язык, то теоретически на нем можно выразить зависимость любого вида. Процесс построения этих программ строится как эволюция в мире программ (этим метод немного похож на генетические алгоритмы). Когда система находит программу, достаточно точно выражающую искомую зависимость, она начинает вносить в нее небольшие модификации и отбирает среди построенных таким образом дочерних программ те, которые повышают точность. Таким образом, система "выращивает" несколько генетических линий программ, которые конкурируют между собой в точности выражения искомой зависимости. Сегодня это один из наиболее перспективных инновационных продуктов data mining, реализованных, в частности, в системе PolyAnaiyst, который показывает в задачах анализа российских финансовых рынков весьма высокие показатели. Специальный транслирующий модуль системы PolyAnaiyst переводит найденные зависимости с внутреннего языка системы на понятный пользователю язык (математические формулы, таблицы и пр.), делая их легкодоступными. |