76 латентных классов. По ходу дела можно заметить, что уравнения (1.38), которые являются системой уравнений рекрутирования, линейны по своей природе, в то время как исходные уравнения факторного анализа линейны просто потому, что их такими выбрали. Различие между наблюдаемыми и латентными характеристиками, которые так выпукло обнаруживаются в теории латентной структуры, являются, конечно, центральным и в факторном анализе. Тесты и их взаимные корреляции являются эмпирическими, а факторы и их нагрузки латентными величинами. То же отличие имеет место и в модели латентного профиля. Естественно требовать, чтобы каждый латентный класс был однородным относительно любых исследуемых (латентных) величин, могущих влиять на наблюдаемые соотношения. Полная однородность не обязательна, если отклонения от среднего в классе случайны. Кластерный анализ, также как и латентно-структурный не строит модели отношения тестируемого к заданию определенной сложности. Основная задача разбиение на группы. Однако в этом случае для реализации механизма группировки вводятся меры различия и меры сходства. Целью является, при заданном количестве групп, заранее определенных исследователем, собрать в каждую наиболее близкие по введенной мере сходства, а в различных группах должны находиться тестируемые имеющие наибольшие меры различия. Реализация метода осуществляется итерационной процедурой, поэтому ей присущи все проблемы поисковых и итерационных алгоритмов. Задача кластерного анализа заключается в разбиении множества объектов I на m кластеров (подмножеств) 1Ь 12, ... , Im так, чтобы каждый объект принадлежал одному и только одному подмножеству разбиения. Цель разбиения объединить сходные объекты в одном кластере и разнести в разные кластеры различающиеся объекты. Решением задачи кластерного анализа является разбиение, удовлетворяющее некоторому критерию оптимальности. Этот критерий |
положительные ответы на вопросы j и к, и т. д. Уравнения (1.10) просто показывают, каким образом эл!пирнческне данные рекрутируются из латентных классов. По ходу дела можно заметить, что уравнения (1.10), которые являются системой уравнений рекрутирования, линейны по своей природе, в то время как исходные уравнения факторного анализа линейны просто потому, что их такими выбрали. Различие между наблюдаемыми и латентными характеристиками, которые так выпукло обнаруживаются в теории латентной структуры, являются, конечно, центральным и в факторном анализе. Тесты и их взаимные корреляции являются эмпирическими, а факторы и их нагрузки латентными величинами. То же отличие имеет место и в модели латентного профиля. Естественно требовать, чтобы каждый латентный класс был однородным относительно любых исследуемых (латентных) величин, могущих влиять на наблюдаемые соотношения. Полная однородность не обязательна, если отклонения от среднего в классе случайны. Кластерный анализ, также как и латентно-структурный не строит модели отношения тестируемого к заданию определенной сложности. Основная задача разбиение на группы. Однако в этом случае для реализации механизма группировки вводятся меры различия и меры сходства. Целью является, при заданном количестве групп, заранее определенных исследователем, собрать в каждую наиболее близкие по введеной мере сходства, а в различных группах должны находиться: тестируемые имеющие наибольшие меры различия. Реализация метода осуществляется итерационной процедурой, поэтому ей присущи все проблемы поисковых и итерационных алгоритмов. Задача кластерного анализа заключается в разбиении множества объектов I иа m кластеров (подмножеств) 1ь L , ... , Im так, чтобы каждый объект принадлежал одному и только одному подмножеству разбиения. Цель разбиения объединить сходные объекты в одном кластере и разнести в разные кластеры различающиеся объекты. 48 4 ( x , y ) = ) Y . Z d " ( x „ y j ) . ( 1.11) Решением задачи ьсластерного анализа является разбиение, удовлетворяющее некоторому критерию оптимальности. Этот критерий может представлять собой некоторый функционал, выражающий уровни желательности разбиений и группировок. В отличие от латентно-структурного анализа в кластерном анализе вводится численная мера различия (через расстояние). Расстояние d(X,Y) между множествами X и Y определяется величиной: Пг. ”v Для оценки плотности расположения точек внутри множества используется мера близости. Общая идея, лежащая в основе подхода, использующего понятие близости, состоит в преобразовании пространства описаний D в пространство D *, в котором все точки одного множества расположены близко друг к другу, а точки различных множеств удалены друг от друга на некоторое расстояние. Для решения задачи кластерного анализа необходимо количественно определить понятие сходства и различия. Решением задачи является разбиение, в котором расстояние между X i и X j в одном кластере достаточно мало, а расстояние между X j и Xj в разных кластерах достаточно велико. Основные усилия в развитии методов кластеризации и классификации были направлены на построение методов, основанных на минимизации внутригрупповых сумм квадратов отклонений. Они могут быть выражены в терминах евклидовых расстояний и называются методами минимальной дисперсии. 1.5. Информационные технологии в системе подготовки и переподготовки Оценка потребностей российского общества в области образования показывает, что в последние годы наметилась четкая тенденция в увеличении спроса населения на получение непрерывного образования и 49 |