Таким образом, в банк тестовых заданий тестирующей программы • закладываются тестовые задания, удовлетворяющие требованиям трудности, технологичности, вариативности, дифференцирующей способности и определенного уровня трудности. Тестовые задания не соответствующие требованиям выбраковываются и вместо них разрабатываются дополнительно новые задания. Формирование теста для каждого испытуемого происходит автоматически после указания номера темы, количества заданий и уровня трудности включаемых заданий. Трудность теста определяется суммарной трудностью заданий, его • образующих [1]. Чтобы уровень диагностирования был засчитан как пройденный, преподаватель определяет процент правильного выполнения заданий от общего количества, как правило, это 70%. Для оценки качества педагогического теста определялись его валидность и надежность. Валидность по содержанию означает, что задания теста полностью охватывают и при том в нужной пропорции все основные аспекты той области знания, подготовленность в которой этот тест оценивает. После составления тестов оценка валидности по содержанию проводилась на заседаниях предметно-методической комиссии, состоящей из опытных педагогов вуза. * Валидность по уровню (критерию) является показателем того, что уровень подготовки обучаемых сопоставим с уровнем трудности теста. Оценка валидности по уровню производилась сравниванием результатов тестирования экспериментальных групп и результатов оценивания этой же группы стандартными методами. Три экспериментальные группы студентов (по 25 человек) сначала проходили диагностирование уровня достижения целей обучения по отдельным учебным модулям с помощью традиционных способов * (устный опрос, письменный опрос, контрольная работа). Затем диагностирование проводилось с помощью тестов. Получение адекватных результатов служило признаком правильности формирования тестов и 127 |
• хорошо подготовленных обучаемых > 0,85; 2) вероятность достижения 2-го уровня усвоения: • у очень слабо подготовленных обучаемых < 0,2; • у слабо подготовленных обучаемых 0,20,5; • средне подготовленных обучаемых 0,5 0,75; • хорошо подготовленных обучаемых 0,75 0,9; 3) вероятность достижения 3-го уровня усвоения; • у очень слабо подготовленных обучаемых <0,1; • у слабо подготовленных обучаемых 0,1 0,3; • средне подготовленных обучаемых 0,3 0,5; • хорошо подготовленных обучаемых 0,5 0,85. Таким образом, в банк тестовых заданий тестирующей программы закладываются тестовые задания, удовлетворяющие требованиям трудности, технологичности, вариативности, дифференцирующей способности и определенного уровня трудности. Тестовые задания не соответствующие требованиям выбраковываются и вместо них разрабатываются дополнительно новые задания. Формирование теста для каждого испытуемого происходит автоматически после указания номера темы, количества заданий и уровня трудности включаемых заданий. Трудность теста определяется суммарной трудностью заданий, его образующих [1]. Чтобы уровень диагностирования был засчитан как пройденный, преподаватель определяет процент правильного выполнения заданий от общего количества, как правило, это 70%. Или, учитывая, что за правильный ответ насчитывается 10 баллов и что в тесте каждого уровня 10 заданий, 70 баллов. Для оценки качества педагогического теста определялись его валидность и надежность. Валидность по содержанию означает, что задания теста полностью охватывают и при том в нужной пропорции все основные аспекты той области знания, подготовленность в которой этот тест оценивает. После со-110 ставления тестов оценка валидности по содержанию проводилась на заседаниях ПМК (предметно-методической комиссии), состоящей из опытных педагогов предметников института. Валидность по уровню (критерию) является показателем того, что уровень подготовки обучаемых сопоставим с уровнем трудности теста. Оценка валидности по уровню производилась сравниванием результатов тестирования экспериментальных групп и результатов оценивания этой же группы стандартными методами. Три экспериментальные группы курсантов (по 15 человек) сначала проходили диагностирование уровня достижения целей обучения по * отдельным учебным модулям с помощью традиционных способов (устный опрос, летучка, контрольная работа). Затем диагностирование проводилось с помощью тестов. Получение адекватных результатов служило признаком правильности формирования тестов и выполнения организационно-педагогических и дидактических условий. В целом, по разработанным экспериментальным материалам подавляющее число курсантов (89-92% и выше от всех обучаемых экспериментальных групп) показали идентичные результаты, что позволило судить о валидности тестовых заданий по критерию. В таблице 3.5 и на рисунке 3.3 представлены результаты диагностирования учебного модуля 11 традиционным способом и тестированием. • Надежность теоретически отражает идею точности измерения заданиями теста, представляющими только часть из генеральной совокупности всех возможных заданий. В практическом смысле надежность часто понимается как мера одинаковости, повторяемости или связанности двух измерений одного и того же качества, одним и тем же тестом, или его параллельными вариантами. В исследовании надежность определялась расчетом коэффициента надежности теста по формуле [101]: r= k*(l-Lpjqj/ sv 2)/(k-l), * где г коэффициент надежности теста; к число заданий в тесте; -ill |