Проверяемый текст
Ананьев Николай Сергеевич. Методы и средства анализа данных в системах поддержки принятия решений (Диссертация 2005)
[стр. 60]

величина скалярный агрегированный показатель (обобщенный показатель) у с некоторой точностью восстанавливается но значениям частных показателей эффективности X, где Х = {х$)}9 / = 1,л*,у = \,тк.
Здесь п число признаков (характеристик) объекта, т число объектов.
В базовой модели метода
статистического исследования зависимостей между обобщенным показателем у и Х={х)} постулируется статистическая связь типа [7] у = /(Х;@) + е, (2.1) где е остаточная случайная компонента, которая обуславливает погрешность в определении у по известным значениям Х~{хи}; .
функция из некоторого известного параметрического семейства^
= {^(АГ;0)},0 е А у у которой, в общем случае, численное значение входящего в ее уравнение параметра 0 неизвестно.
В качестве параметрических семейств
р={/(Аг;0)}) привлекаемых при статистическом анализе данных в задачах данного типа, чаще всего используются линейные функции /(X; 0) = <90 + 0хх,, + д2хп +...
+ 0тхпт (2.2) и степенные /(*;©) = $,(*„)« •(*,*)*•-.(О*" (2.3) Необходимо отметить, что при О0-0 (2.3) преобразуется в критерий Байеса.
Если же пользуются коэффициентами
О0 = 0, 0] = \(т, у = 1,т, то приходят к получению обычной средней арифметической оценки (2.4) В (2.3) 0Л = 1 дает среднюю геометрическую оценку я=(П;=1 60 (2.5)
[стр. 56]

[11,37,38].
Именно благодаря этому свойству энтропию совершенно естественно использовать как интегральный критерий при решении задач кластеризации, проведения сравнения .объектов.
Тем самым, в условиях неполноты данных снимается проблема обоснования критериев [29, 61].
Во-вторых, полученные формальные представления энтропии позволяют разработать достаточно простые и очень эффективные вычислительные алгоритмы оценки обобщенных характеристик объектов.
Таким образом, разработка методов обработки многомерных данных, обеспечивающих учет неопределенности, в интересах поддержки принятия решений в информационных системах сводится к следующему.
1.
Разработка модели представления объектов.
2.
Обоснование достаточного перечня характеристик (признаков) объектов, позволяющих представить их в виде двумерных массивов (матриц “объект признак”) данных.
Строками таких матриц служат объекты, а столбцами (признаками) значения их частных характеристик.
3.
Разработка метода кластеризации совокупности объектов на основе энтропийного подхода с целью декомпозиции совокупности и ранжирования объектов.
4.
Проведение оценки эффективности принятия решения на основе информации по результатам ранжирования объектов.
2.3.
Анализ существующих методов получения обобщенных показателей.
Метод статистического исследования зависимостей В терминах рассматриваемого методического подхода оцениваемая величина скалярный агрегированный показатель (обобщенный показатель) .у с некоторой точностью восстанавливается по значениям частных показателей эффективности X, где Х-{х^}у \%тк .
Здесь п число признаков (характеристик) объекта, т число объектов.
В базовой модели метода


[стр.,57]

статистического исследования зависимостей между обобщенным показателем .у и Х=Ц,} постулируется статистическая связь типа [7] у=/(Х;®)+е, (2.1) где е остаточная случайная компонента, которая обуславливает погрешность в определении у по известным значениям Х={дгу}; /(Х;0) функция из некоторого известного параметрического семейства Р={/(Х;0)},0еЛ, у которой, в общем случае, численное значение входящего в ее уравнение параметра 0 неизвестно.
В качестве параметрических семейств
Р={/(Х;0)}, привлекаемых при статистическом анализе данных в задачах данного типа, чаще всего используются линейные функции ДХ;0)=0о +0, х„ +0, ха ...
в.
х„.
(2.2) и степенные ДХ;©)=0о(*„)‘' .(х,,)"' ...
(2.3) Необходимо отметить, что при #0=0 (2.3) преобразуется в критерий Байеса.
Если же пользуются коэффициентами
0о=О, и Э} = II т> у=1,т , то приходят к получению обычной средней арифметической оценки *=-!>,, (2.4) т п В (2.3) в] 1 дает среднюю геометрическую оценку «=(П *у)"" (2.5) ^-1 В статистическом анализе для определения центра группирования наиболее широкоиспользуется среднее арифметическое значение.
Известно, что средняя арифметическая оценка соответствует истинному (фактическому) значению измеряемой величины (т.е.
ее можно считать гарантированной) только в том случае, если она является несмещенной, состоятельной и эффективной [7].
Однако в условиях, когда необходимо получать оценку на 57

[Back]