20 случайных величин, функция б(хи,х 12,...,х ^ ,...,х рп становится случайной функцией, в результате номер к класса также оказывается случайной величиной. Отсюда видно, что разработка алгоритмов классификации МБС неизбежно связана с использованием статистических методов. Анализируя работы, опубликованные за последние несколько десятков лет [22, 46, 47, 55, 63, 76, 94, 113, 142, 150, 152], можно сказать, что достигнуты значительные теоретические результаты в области как параметрического, так и непараметрического распознавания. Однако многие из методов распознавания образов, несмотря на хорошее теоретическое обоснование, дают неприемлемые результаты при решении практических задач. Причиной этого являются те ограничения и допущения, которые выдвигаются исследователями при разработке методов классификации. Так, зачастую, априорно принимается гипотеза о принадлежности функции плотности вероятности какому-либо параметрическому семейству [152]. Многие из оптимальных теоретических методов предполагают кроме того еще и статистическую независимость выбранной системы признаков [94]. Не смотря на то, что вопросы параметрического распознавания разработаны очень хорошо (разработаны процедуры обучения, принятия решения и понижения размерности признакового пространства), оценки вероятностей ошибок, получающихся при параметрическом распознавании, являются асимптотическими, т.е. справедливыми лишь в редко встречающихся случаях неограниченного возрастания обучающих выборок [55, 76]. Непараметрические методы, например k-ближайших соседей, гистограммный, полигональный, Парзеновского ядра и др. также являются асимптотическими, т.е. обеспечивают достаточную точность оценивания только лишь при неограниченном увеличении объема обучающих выборок [55,113]. Из-за отсутствия оценок вероятностей ошибок или их асимптотического характера в существующей литературе оказалась не исследованной важная проблема построения систем статистического распознавания оптимизация временных и пространственных параметров, базирующаяся на количественной увязке достоверности распознавания с требуемыми для ее достижения временем обучения и принятия решения и размерностью признакового пространства. Последнее обстоятельство явилось, по всей вероятности, основной причиной малого обращения внимания авторами вопросам практических приложений статистического распознавания. Только в некоторых работах эти вопросы были рассмотрены в постановочном плане [46,47, 76] и более подробно [147,150]. В задачах применения теории распознавания образов в медицинской диагностики оптимизация временных и пространственных параметров диагностических систем имеет особенно важное значение, в следствие того, что эти параметры (вместе с заданной достоверностью распознавания) оказывают непосредственное и наибольшее влияние на качество и своевременность установления диагноза. Настоящая работа ставит своей основной целью дополнение существующих исследований в направлении решения проблем непараметрического обучения и распознавания при малых объемах обучающих выборок, характерных для медицинских диагностических исследований, и оптимизации временных и пространственных параметров для медицинских диагностических систем. |
29 алгоритмов классификации МБС неизбежно связана с использованием статистических методов. Анализируя работы, опубликованные за последние несколько десятков лет [14, 28, 29, 35, 41, 50, 54, 65, 80, 85, 87], можно сказать, что достигнуты значительные теоретические результаты в области как параметрического, так и непараметрического распознавания. Однако многие из методов распознавания образов, несмотря на хорошее теоретическое обоснование, дают неприемлемые результаты при решении практических задач. Причиной этого являются те ограничения и допущения, которые выдвигаются исследователями при разработке методов классификации. Так, зачастую, априорно принимается гипотеза о принадлежности функции плотности вероятности какому-либо параметрическому семейству [87]. Многие из оптимальных теоретических методов предполагают кроме того еще и статистическую независимость выбранной системы признаков [54]. Не смотря на то, что вопросы параметрического распознавания разработаны очень хорошо (разработаны процедуры обучения, принятия решения и понижения размерности признакового пространства), оценки вероятностей ошибок, получающихся при параметрическом распознавании, являются асимптотическими, т.е. справедливыми лишь в редко встречающихся случаях неограниченного возрастания обучающих выборок [35,54,50]. Непараметрические методы, например k-ближайших соседей, гистограммный, полигональный, Парзеновского ядра и др. также являются асимптотическими, т.е. обеспечивают достаточную точность оценивания только лишь при неограниченном увеличении объема обучающих выборок [35,65,96]. Из-за отсутствия оценок вероятностей ошибок или их асимптотического+ характера в существующей литературе оказалась не исследованной важная проблема построения систем статистического распознавания оптимизация временных и пространственных параметров, базирующаяся на количественной увязке достоверности распознавания с требуемыми для ее достижения временем обучения и принятия решения и размерностью признакового пространства. Последнее обстоятельство явилось, по всей вероятности, основной причиной малого уделения внимания авторами вопросам практических приложений статистического распознавания. Только в некоторых работах эти вопросы были рассмотрены в постановочном плане [28,29, 50] и более подробно [85, 82]. В задачах применения теории распознавания образов в медицинской диагностики оптимизация временных и пространственных параметров диагностических систем имеет особенно важное значение, в следствие того, что эти параметры (вместе с заданной достоверностью распознавания) оказывают непосредственное и наибольшее влияние на качество и своевременность установления диагноза. Настоящая работа ставит своей основной целью дополнение существующих исследований в направлении решения проблем непараметрического обучения и распознавания при малых объемах обучающих выборок, характерных для медицинских диагностических исследований, и оптимизации временных и пространственных параметров для медицинских диагностических систем. |