величина скалярный агрегированный показатель (обобщенный показатель) у с некоторой точностью восстанавливается но значениям частных показателей эффективности X, где Х = {х$)}9 / = 1,л*,у = \,тк. Здесь п число признаков (характеристик) объекта, т число объектов. В базовой модели метода статистического исследования зависимостей между обобщенным показателем у и Х={х)} постулируется статистическая связь типа [7] у = /(Х;@) + е, (2.1) где е остаточная случайная компонента, которая обуславливает погрешность в определении у по известным значениям Х~{хи}; . функция из некоторого известного параметрического семейства^ = {^(АГ;0)},0 е А у у которой, в общем случае, численное значение входящего в ее уравнение параметра 0 неизвестно. В качестве параметрических семейств р={/(Аг;0)}) привлекаемых при статистическом анализе данных в задачах данного типа, чаще всего используются линейные функции /(X; 0) = <90 + 0хх,, + д2хп +... + 0тхпт (2.2) и степенные /(*;©) = $,(*„)« •(*,*)*•-.(О*" (2.3) Необходимо отметить, что при О0-0 (2.3) преобразуется в критерий Байеса. Если же пользуются коэффициентами О0 = 0, 0] = \(т, у = 1,т, то приходят к получению обычной средней арифметической оценки (2.4) В (2.3) 0Л = 1 дает среднюю геометрическую оценку я=(П;=1 60 (2.5) |
[11,37,38]. Именно благодаря этому свойству энтропию совершенно естественно использовать как интегральный критерий при решении задач кластеризации, проведения сравнения .объектов. Тем самым, в условиях неполноты данных снимается проблема обоснования критериев [29, 61]. Во-вторых, полученные формальные представления энтропии позволяют разработать достаточно простые и очень эффективные вычислительные алгоритмы оценки обобщенных характеристик объектов. Таким образом, разработка методов обработки многомерных данных, обеспечивающих учет неопределенности, в интересах поддержки принятия решений в информационных системах сводится к следующему. 1. Разработка модели представления объектов. 2. Обоснование достаточного перечня характеристик (признаков) объектов, позволяющих представить их в виде двумерных массивов (матриц “объект признак”) данных. Строками таких матриц служат объекты, а столбцами (признаками) значения их частных характеристик. 3. Разработка метода кластеризации совокупности объектов на основе энтропийного подхода с целью декомпозиции совокупности и ранжирования объектов. 4. Проведение оценки эффективности принятия решения на основе информации по результатам ранжирования объектов. 2.3. Анализ существующих методов получения обобщенных показателей. Метод статистического исследования зависимостей В терминах рассматриваемого методического подхода оцениваемая величина скалярный агрегированный показатель (обобщенный показатель) .у с некоторой точностью восстанавливается по значениям частных показателей эффективности X, где Х-{х^}у \%тк . Здесь п число признаков (характеристик) объекта, т число объектов. В базовой модели метода статистического исследования зависимостей между обобщенным показателем .у и Х=Ц,} постулируется статистическая связь типа [7] у=/(Х;®)+е, (2.1) где е остаточная случайная компонента, которая обуславливает погрешность в определении у по известным значениям Х={дгу}; /(Х;0) функция из некоторого известного параметрического семейства Р={/(Х;0)},0еЛ, у которой, в общем случае, численное значение входящего в ее уравнение параметра 0 неизвестно. В качестве параметрических семейств Р={/(Х;0)}, привлекаемых при статистическом анализе данных в задачах данного типа, чаще всего используются линейные функции ДХ;0)=0о +0, х„ +0, ха ... в. х„. (2.2) и степенные ДХ;©)=0о(*„)‘' .(х,,)"' ... (2.3) Необходимо отметить, что при #0=0 (2.3) преобразуется в критерий Байеса. Если же пользуются коэффициентами 0о=О, и Э} = II т> у=1,т , то приходят к получению обычной средней арифметической оценки *=-!>,, (2.4) т п В (2.3) в] 1 дает среднюю геометрическую оценку «=(П *у)"" (2.5) ^-1 В статистическом анализе для определения центра группирования наиболее широкоиспользуется среднее арифметическое значение. Известно, что средняя арифметическая оценка соответствует истинному (фактическому) значению измеряемой величины (т.е. ее можно считать гарантированной) только в том случае, если она является несмещенной, состоятельной и эффективной [7]. Однако в условиях, когда необходимо получать оценку на 57 |