Проверяемый текст
Саркисова, Ирина Олеговна. Разработка методов и моделей адаптивного тестового контроля в системе подготовки и аттестации персонала транспортных предприятий (Диссертация 2004)
[стр. 57]

57 Wj число неправильных ответов N число испытуемых В теории тестов и в практике тестирования традиционно рассматриваются два основных критерия, по которым оценивается качество теста.
Первый это надежность тестов, ассоциируемая обычно с идеей точности измерения.
Второй критерий это валидность теста, определяемая
обычно как способность теста измерять то, что он призван, по замыслу авторов, измерить.
При измерении надежности предполагается линейная модель, в которой дисперсия балла равна сумме истинного и ошибочного.
Формула Kuder-Rishardson (KR-20) определяет коэффициент надежности при однократном тестировании: К
К-\ (1-19) где сумма дисперсий заданий теста; S2^ дисперсия тестовых баллов испытуемых; К число заданий в тесте.
Формула D.Armor определяет коэффициент надежности теста как:
*4 М (1-20) Xi наибольшее значение корня характеристического уравнения R-Xi=0.
Эффективным называется тест, который лучше других измеряет знания интересующего уровня подготовленности меньшим числом заданий, качественнее, быстрее, дешевле, и все это, по возможности, одновременно; эффективный тест представляет собой не одну какую-либо фиксированную систему заданий, а множество систем заданий, каждая из которых является оптимальной для измерения знаний на требуемом уровне подготовленности.

1.7.1.
Формальные модели IRT-теории тестового контроля В отличие от классической теории тестов для IRT характерно стремление к фундаментальному теоретическому подходу, и вместе с тем к
[стр. 42]

42 1.4.1.
Основные принципы классической теории тестового контроля Классическая теория основана на обработке статистических данных по результатам тестовых результатов.
В качестве модели применяет простейшая аддитивная модель, в которой на истинный бал накладывается ошибка.
В классической теории тестов зарубежные и российские авторы исходили из идеи параллельного измерения интересующего свойства с помощью двух и большего числа тестов, имеющих общее предметное содержание и сходные статистические характеристики [78].
В рамках этой теории приняты следующие постулаты: Эмпирически получаемый результат измерения (X ) представляет собой сумму истинного компонента измерения (Т), обычно неизвестного, и ошибочного (Е), также неизвестного: Х=Т+Е.
(1.1) Истинный компонент измерения можно выразить как математическое ожидание Е(Х).
Ошибочный компонент измерения представляет собой результат влияния случайных ошибок.
Среднее арифметическое этих ошибок принимается равным нулю.
Дисперсии ошибочных компонентов параллельных тестов равны.
Корреляция истинных и ошибочных компонентов по множеству испытуемых равна нулю.
Трудность задания определяется эмпирически и в последнее время она соответствует доле неправильных ответов: N ( 1.2) Wj число неправильных ответов N число испытуемых В теории тестов и в практике тестирования традиционно рассматриваются два основных критерия, по которым оценивается качество теста.
Первый — это надежность тестов, ассоциируемая обычно с идеей точности измерения.
Второй критерий это валидность теста, определяемая


[стр.,43]

обычно как способность теста измерять то, что он призван, по замыслу авторов, измерить.
При измерении надежности предполагается линейная модель, в которой дисперсия балла равна сумме истинного и ошибочного.
Формула Kuder-Rishardson (KR-20) определяет коэффициент надежности при однократном тестировании: К
L Y p n i ' 43 г = К \ S i (1.3) где Y jP N i сумма дисперсий заданий теста; дисперсия тестовых баллов испытуемых; К —число заданий в тесте.
Формула D.Armor определяет коэффициент надежности теста как:
е = .
К 1 (1.4) X] наибольшее значение корня характеристического уравнения 1R-X)=0 Эффективным называется тест, который лучше других измеряет знания интересующего уровня подготовленности меньшим числом заданий, качественнее, быстрее, дешевле, и все это, по возможности, одновременно; эффективный тест представляет собой не одну какую-либо фиксированную систему заданий, а множество систем заданий, каждая из которых является оптимальной для измерения знаний на требуемом уровне подготовленности.
1.4.2.
Формальные модели IRT-теории тестового контроля Более формальной является Item Response Theory (IRT) [63], в которой предполагается существование аналитических выражений (в общем случае нелинейных) для задания вероятностей правильных ответов тестируемых определенного уровня за задачи определенного уровня сложности.
Такой подход при описании модели тестируемого позволяет использовать эту модель во множестве аспектов: для модели регрессионного анализа, где численными методами оценивается неизвестный латентный параметр; для

[Back]