Проверяемый текст
Цымбал, Владимир Георгиевич; Разработка и исследование методов формирования признаковых пространств в медицинских диагностических системах (Диссертация 1999)
[стр. 22]

22 1.3.2.Формирование признакового пространства, т.е.
определение набора признаков Xj, Х2, ..., X , пространства является неотъемлемой составной частью процесса распознавания
[63].
При этом условия, в которых выполняется это формирование являются весьма противоречивыми.
С одной стороны, выбранная совокупность признаков должна в наибольшей степени отражать все те свойства объектов, которые важны для их распознавания, т.е.
набор признаков X,, Х2, ..., X должен быть наиболее полным.
С другой стороны, с увеличением размерности р признакового пространства очень быстро возрастают вычислительная сложность процедур обучения и принятия решения, материальные и трудовые затраты на измерение необходимых характеристик объектов, т.е.
на получение наблюдений на этапе обучения и принятия решений.
Сокращение количества признаков уменьшает затраты на проведение измерений и вычислений, но может привести к снижению достоверности распознавания D, которая является основным показателем качества распознавания
[123, 150, 152].
Если время на обучение и принятие решения жестко ограничено, то повышение размерности признакового пространства может оказаться единственным средством увеличения достоверности.
Таким образом, одновременное достижение минимума общей размерности признакового пространства и максимума достоверности распознавания оказывается, как правило, невозможным, и, следовательно, одной из основных задач синтеза распознающих систем является выбор из заданного множества признаков
Y,,Y2,...,Y оптимального набора X j,X 2,...,X p из р признаков, обеспечивающего требуемый по условиям решаемой задачи уровень достоверности распознавания и минимизирующего затраты на проведение измерений и вычислений [147].
1.3.3.
Другой важной составной частью распознающего процесса является обучение, целью которого является восполнение недостатка априорных знаний о распознаваемых классах путем использования информации о них, содержащейся в обучающих наблюдениях: Хттк
Г*п х12 ...
х1тк> Х21 х22 ••• (1.5) Ч *р1 ^ р 2 *** ^ р ш и У где т к количество обучающих наблюдений, k = 1, 2,..., К.
Хотя методы и подходы, используемые при обучении, отличаются большим разнообразием (статистические
[22, 150], структурные [151], перцептронные, с использованием потенциальных функций [142], логические [46, 47] и др.), конечный результат их использования, как правило, неизменен это эталонные описания s,, s2, ..., sK, представляющие собой описания характеристик признаков Х ,,Х 2,...,Х для всех распознаваемых классов s15s2, ..., sK.
Увеличение продолжительности обучения Тоб, которая во многих случаях вычисляется по формуле
[147]
[стр. 8]

боров УЗИ с топографическим картированием ("Эхотомоскоп") особого конструкторского бюро "Ритм" (г.
Таганрог).
Научные и практические результаты были использованы при разработке аппаратуры измерения статистических характеристик морского волнения в рамках темы "Волна" отделом 24 НКБ "Миус"(г.
Таганрог) по договору 324006.
Результаты исследований были использованы при постановке курса специализации "Автоматизированная обработка данных и аппаратура медицинских диагностических систем" на кафедре РПрУ и ТВ Таганрогского государственного радиотехнического университета.
Достоверность изложенного подтверждается результатами экспериментальных исследований характеристик предлагаемых алгоритмов при классификации электроэнцефалограмм и случайных процессов с заданными статистическими характеристиками, апробацией на научных семинарах, конференциях, симпозиумах, актами внедрения.
Методы исследования основаны на использовании методов теории вероятности и математической статистики, статистической теории распознавания образов, функционального анализа.
Основные положения, выносимые на защиту, следующие: математические и цифровые модели МБС и критерии эффективности признаков, сформированных на основе нелинейного преобразования сигналов; алгоритм формирования признаков по методу стохастического кодирования МБС с некоррелированными опорными процессами; алгоритм формирования признаков по методу стохастического кодирования МБС с коррелированными опорными процессами; зависимости дисперсий оценок признаков и ошибки распознавания от времени обучения, вида опорных распределений, размерности признакового пространства; результаты анализа показателей качества и сложности предлагаемых алгоритмов формирования признаков; результаты экспериментальных исследований предложенных алгоритмов в компьютерных системах диагностики МБС.
Апробация работы.
Основные положения диссертационной работы обсуждались и докладывались: на научно-технической конференции VII Всероссийские Туполевские чтения (Казань, 1996); LII Научной сессии НТО РЭС им.
А.С.
Попова, посвященной дню радио в 1997 г., в г.
Москва; Всероссийской научной конференции студентов и аспирантов "Радиотехника, микроэлектроника, системы связи и управления" (Таганрог, 1997); Всероссийской научной конференции студентов и аспирантов "Техническая кибернетика, радиоэлектроника и системы управления" (Таганрог,1998); I Всероссийской научной конференции молодых ученых и аспирантов "Новые информационные технологии, разработка и аспекты применения"

[стр.,31]

31 1.5.2.
Формирование признакового пространства, т.е.
определение набора признаков X,, Х2, ..., X , пространства является неотъемлемой составной частью процесса распознавания
[41].
При этом условия, в которых выполняется это формирование являются весьма противоречивыми.
С одной стороны, выбранная совокупность признаков должна в наибольшей степени отражать все те свойства объектов, которые важны для их распознавания, т.е.
набор признаков Xj, Х2, ..., X должен быть наиболее полным.
С другой стороны, с увеличением размерности р признакового пространства очень быстро возрастают вычислительная сложность процедур обучения и принятия решения, материальные и трудовые затраты на измерение необходимых характеристик объектов, т.е.
на получение наблюдений на этапе обучения и принятия решений.
Сокращение количества признаков уменьшает затраты на проведение измерений и вычислений, но может привести к снижению достоверности распознавания D, которая является основным показателем качества распознавания
[74, 85, 87].
Если время на обучение и принятие решения жестко ограничено, то повышение размерности признакового пространства может оказаться единственным средством увеличения достоверности.
Таким образом, одновременное достижение минимума общей размерности признакового пространства и максимума достоверности распознавания оказывается, как правило, невозможным, и, следовательно, одной из основных задач синтеза распознающих систем является выбор из заданного множества признаков
Yt,Y2, ..., Yq оптимального набора Xj, Х2, ..., X из р признаков, обеспечивающего требуемый по условиям решаемой задачи уровень достоверности распознавания и минимизирующего затраты на проведение измерений и вычислений [82].
1.5.3.
Другой важной составной частью распознающего процесса является обучение, целью которого является восполнение недостатка априорных знаний о распознаваемых классах путем использования информации о них, содержащейся в обучающих наблюдениях: / Хтт к
Х11 Х12 Х1тк Х21 Х22 ”• Х2тк \ (1.5) ЧХ р1 Х р2 **• Х р т к ) где т к количество обучающих наблюдений, k = 1,2,..., К.
Хотя методы и подходы, используемые при обучении, отличаются большим разнообразием (статистические
[14, 85], структурные [86], перцептронные, с использованием потенциальных функций [80], логические [28, 29] и др.), конечный результат их использования, как правило, неизменен это эталонные описания Sj, s2, ..., §к, представляющие собой описания характеристик признаков Xt,X 2,...,X для всех распознаваемых классов Sj, s2, ..., sK.
Увеличение продолжительности обучения Тоб, которая во многих случаях вычисляется по формуле
[82]

[стр.,36]

36 знаков Y,,Y2,...,Y с пом ощ ью н о вы х признаков X,,Х2, Х р, среднее межклассовое расстояние, внутриклассовый разброс наблюдений, энтропию одного класса относительно другого и т.д.
Традиционные критерии, основанные на геометрических понятиях расстояния между классами, исходят из того, что значение указанного расстояния пропорционально достоверности расстояния.
Считают, что чем больше расстояние между классами в признаковом пространстве, тем больше различие между классами, тем легче его обнаружить и, следовательно, тем выше будет достоверность различения классов.
Максимизация расстояния между классами повышает "разделяющую силу признаков" [74], которая, как ожидается, обеспечит требуемую достоверность различения, особенно если само правило различения основано на том же самом критерии, что и выбор признаков.
1.6.3.
Рассмотрим процедуру обучения диагностической системы.
Источн ком информации о распознаваемых образах является совокупность результатов независимых наблюдений (выборочных значений), составляющих обучающую знавания (одномерной или многомерной) xs может быть либо одномерной, либо р-мерной случайной величиной.
Основной целью обучения являются преодоление априорной неопределенности о распознаваемых классах путем использования информации о них, содержащейся в обучающих выборках, и построение эталонных описаний классов, вид которых определяется способом их использования в решающих правилах [85].
Решающее значение для выбора метода распознавания имеет вид априорной неопределенности, для преодоления которой используется.
Если в результате предварительного анализа наблюдаемой совокупности выборочных значений (или на основе имеющейся априорной информации) оказывается возможным хотя бы с некоторым приближением установить вид закона их распределения, то априорная неопределенность относится лишь к параметрам этого распределения, так что целью обучения в этом случае становится получение оценок этих параметров.
Подобная априорная неопределенность носит название параметрической [54], а методы распознавания, применяемые в этих условиях, именуются параметрическими.
При этом многими авторами, в том числе и в [85,82], отмечается, что хотя с формальной точки зрения закон распределения выборочных значений может быть любым, на практике в параметрическом распознавании почти всегда используется нормальный закон.
Дело в том, что при распознавании многомерных совокупностей каждая компонента выборочных значений (т.е.
наблюдаемые значения каждого признака) может иметь свой отличный от других компонент закон распределения.
Но тогда многомерное совместное распределение совокупности выборочных значений должно описываться некоторым многомерным законом, включающим в себя компоненты с различными законами распределения.
Однако (обучающие) si)j = (x,,x2,...,x mkj и контрольную (экзаменационную) ,хп) выборки, причем в зависимости от характера задачи распо

[Back]