39 (2.1) где объем исходной выборки. Каждый пациент характеризуется набором физических, анамнестических, клинических и лабораторных показателей: где / = 1,1 исх индекс показателя, п = 1,ДГМС1Спорядковый номер пациента. Фильтрация информации осуществляется в два этапа. На первом этапе фильтрации информации для каждого показателя р ' (/ = 1,1 исх) устанавливаются нижняя и верхняя допустимые границы />^п И Р т а х » (/ = выход за которые возможен только из-за ошибок измерения или записи показателя. Затем осуществляется отсеивание сообщений, которые не могут быть достоверными из-за выхода значения какого-либо отдельного параметра (или группы параметров) за допустимые границы. В результате формируется множество в которое входят только измерения, удовлетворяющие следующему условию: Решение задачи второго, основного этапа информационной фильтрации заключается в отборе из исходного множества информационных сообщений с оценкой достоверности ууп { п 1,ДГ,р) выше некоторой значимой величины щ [97]. Информация, содержащая фиксированные смысловые (лингвистические) значения сообщений должна быть на основе экспертных оценок преобразована в численную. Преобразование осуществляется следующим образом. Gгf={Jgn, (2.3) (2.4) |
медицинскую карту. Для минимизации вероятности использования искаженной и недостоверной информации при анализе ситуации и построении моделей заболеваний необходимы ее предварительный отбор или фильтрация. Основным эвристическим правилом при информационной фильтрации является отбор информационных сообщений с наиболее вероятным, т.е. наиболее типичным для данной ситуации набором сведений [3]. Всю исходную информацию можно представить в виде множества пациентов где N ю объем исходной выборки. Каждый пациент характеризуется набором физических, анамнестических, клинических и лабораторных показателей: где / = 1, / исх индекс показателя, п = 1,]\1исх порядковый номер пациента. Фильтрация информации осуществляется в два этапа. На первом этапе фильтрации информации для каждого показателя р 1 (г'= !,/„„) устанавливаются нижняя и верхняя допустимые границы р ^ т исх), выход за которые возможен только из-за ошибок измерения или записи показателя. Затем осуществляется отсеивание сообщений, которые не могут быть достоверными из-за выхода значения какого-либо отдельного параметра (или группы параметров) за допустимые границы. В результате формируется множество (2.1) 51 в которое входят только измерения, удовлетворяющие следующему условию: V«, V/ : р :ш< р : < р ^ , (2.4) Решение задачи второго, основного этапа информационной фильтрации заключается в отборе из исходного множества информационных сообщений с оценкой достоверности ц>п (п = 1,]Угр) выше некоторой значимой величины [174]. Информация, содержащая фиксированные смысловые (лингвистические) значения сообщений должна быть на основе экспертных оценок преобразована в численную. Преобразование осуществляется следующим образом. Сообщения, имеющие два возможных варианта (типа “Да”, “Нет”), преобразуются соответственно в 1 и 0. Точность моделей заболеваний, построенных на основе классификационных методов в значительной мере зависит от количества учитываемых параметров. Одновременно с увеличением числа параметров значительно возрастают затраты вычислительных ресурсов. Поэтому оптимальный выбор признакового пространства в значительной мере обеспечивает эффективность и качество функционирования алгоритмических схем. Критерием оптимальности является минимизация числа измеряемых параметров при условии обеспечения достаточной информативности выбранной параметрической системы. Степень оптимальности и корректности процедур минимизации определяют надежность и достоверность построенных моделей. Так как при построении многофакторных корреляционных моделей одной из предпосылок обоснованности конечных результатов является требование отсутствия мультиколлинеарности включенных в модель признаков-факторов, предварительно следует произвести оптимизацию признакового пространства. |