45 и, = Y jnxn — число всех больных, у которых данный симптом имеет значение к х; n =Y jnk ~ Y jn* — общее число больных. к х 2. Для оценки информативности лабораторных показателей как показано в [21], целесообразно пользоваться их непрерывными распределениями. В этом случае формула (2.10) дает относительное количество информации 10 которое можно получить для оценки тяжести от значения данного лабораторного показателя х. При этом выражение для энтропии Нк сохраняется, а энтропии Нхи определяются следующим образом: Нх =-J/(jc)log/(x)ik (2.12) х — энтропия распределения данного лабораторного показателя; . Hx'r = ~Y,Pk \f{xlk)\og{xlk)dx средняя энтропия распределения * х лабораторного показателя при известной группе тяжести; f(x\k) — условная плотность распределения данного лабораторного показателя среди больных к-ой группы тяжести; f(x) = ^ p kf(xlk) -безусловная плотность к распределения данного лабораторного показателя. Для приближенной оценки информативности (под оценкой информативности показателей в дальнейшем понимается определение величины 10для каждого клинического или лабораторного показателя) будем считать, что лабораторные показатели (или соответственно выбранные их монотонные функции) распределены нормально с примерно одинаковыми дисперсиями 5 у каждой группы больных. Тогда для относительной информативности лабораторного показателя из (2.10) можно получить следующую приближенную формулу: і , . М * £ ! ? 1 , (2.13) 2 £ р * 1о^Л U ) |
56 симптома при известной группе тяжести; Я* = -]Г ркlogрк энтропия к распределения больных по группам тяжести; при этом Я* >НХНх,к, так что 1< <0. Используемые в формулах вероятности могут быть практически оценены через следующие отношения: Мх!к Яж Як /л, ря,к * — 1-Рхж— > С2-1!)пк п п где nxtk— число больных в к~й группе тяжести, у которых данный симптом имеет значение л;(£,л: = {і,2,з}),я* = ^ п х/к числе больных в к-й группе; X пх = ^ п х/к— число всех больных, у которых данный симптом имеет значение к х; n =Y ,nk г=2 п* — общее число больных. к х 2. Для оценки информативности лабораторных показателей как показано в [21], целесообразно пользоваться их непрерывными распределениями. В этом случае формула (2.10) дает относительное количество информации 10 которое можно получить для оценки тяжести от значения данного лабораторного показателя х. При этом выражение для энтропии Нк сохраняется, а энтропии Нхи Hvk определяются следующим образом: Нх =-\f{x)\ogf(x)dx (2.12) л: — энтропия распределения данного лабораторного показателя; Н*'" \f{xlk)\og{x!k)dx средняя энтропия распределения к х лабораторного показателя при известной группе тяжести; f(x\k) — условная плотность распределения данного лабораторного показателя среди больных к-ой группы тяжести; fix) = ^ р к/(х/к ) -безусловная плотность к распределения данного лабораторного показателя. 57 Для приближенной оценки информативности (под оценкой информативности показателей в дальнейшем понимается определение величины 10для каждого клинического или лабораторного показателя) будем считать, что лабораторные показатели (или соответственно выбранные их монотонные функции) распределены нормально с примерно одинаковыми дисперсиями б2 у каждой группы больных. Тогда для относительной информативности лабораторного показателя из (2.10) можно получить следующую приближенную формулу: математическое ожидание и условное среднее квадратическое отклонение лабораторного показателя (или его функции) в к-и группе больных (величина принята одинаковой для всех групп). Согласно (2.13) информативность показателя тем выше, чем больше отличаются друг от друга условные математические ожидания ак (к = 0, 1,2, Л 3) и чем меньше дисперсия в группе б". Точность приближенной формулы (2.13) тем выше, чем меньше отношение Д18. При М 8< 1 ошибка в оценке величины 10 обычно не превышает 10%. При л/8> 1 формула (2.13) дает существенно завышенные результаты. Такие случаи в клинической практике встречаются сравнительно редко. Они соответствуют ситуации, когда значение какого-то лабораторного показателя практически однозначно определяет группу тяжести заболевания. Естественно, что в подобных случаях практически не возникает потребности в количественной оценке информативности показателей. Однако рассмотренные алгоритмы оценки информативности показателей справедливы только для числовых данных, тогда как основную ^ 1с^(1 + А2 /¿>2) (2.13) 2 Ч* // где Л2= £ рк(ака)2 а = £ ркак;ак,8 соответственно условное к к |