Еще одним показателем, который можно использовать в описательной статистике опросов-тестов является величина разброса. Чаще всего для оценки разброса определяют отклонение каждого из полученных значений от средней, обозначаемое буквой d, а затем вычисляют среднюю арифметическую всех этих отклонений. Чем она больше, тем больше разброс данных и тем более разнородна выборка. Напротив, если эта средняя невелика» то данные больше сконцентрированы относительно их среднего значения и выборка более однородна. Первый показатель, используемый для оценки разброса, — это среднее отклонение о. Его вычисляют следующим образом. Собрав все данные и расположив их в ряд находят среднюю арифметическую для выборки. Затем вычисляют отклонения каждого значения от средней и суммируют их: Поскольку стандартное отклонение всегда соответствует одному и тому же проценту результатов, укладывающихся в его пределах вокруг средней, можно утверждать, что при любой форме кривой нормального распределения та доля ее площади, которая ограничена (с обеих сторон) стандартным отклонением, всегда одинакова и соответствует одной и той же доле всей популяции. Описательная статистика позволяет продемонстрировать как можно представить графически и оценить количественно степень разброса данных в том или ином распределении. Тем самым можно понять, чем различаются в распределения для контрольной группы до и после воздействия. Однако можно ли о чем-то судить по этой разнице — отражает ли она действительность или же это просто артефакт, связанный со слишком малым объемом выборки? Тот же вопрос встает и в отношении экспериментальной группы, подвергнутой воздействию независимой переменной. В этой группе стандартное отклонение для фона и после воздействия тоже различается примерно. Разница между средними показывает достоверность в данных, (6) 95 |
определенное влияние: у одних показатели улучшились, у других ухудшились1 . Однако для количественной оценки разброса результатов ' Здесь мог проявиться зффект п.шцебо, связанный с тем. что запах дыма травы вызвал у испытуемых уверенность в том, что они находятся под воздействием наркотика. Для проверки этого предположения следовало бы повторить эксперимент со второй контрольной группой, в которой испытуемым будуг 1;вать только обычную сигарету. 289 относительно средней в том или ином распределении существуют более точные методы, чем измерение диапазона. Чаще всего для оценки разброса определяют отклонение каждого из полученных значений от средней (М-М), обозначаемое буквой d, а затем вычисляют среднюю арифметическую всех этих отклонений. Чем она больше, тем больше разброс данных и тем более разнородна выборка. Напротив, если эта средняя невелика, то данные больше сконцентрированы относительно их среднего значения и выборка более однородна. Итак, первый показатель, используемый для оценки разброса,-это среднее отклонение. Его вычисляют следующим образом (пример, который мы здесь приведем, не имеет ничего общего с нашим гипотетическим экспериментом). Собрав все данные и расположив их в ряд 356911 14, находят среднюю арифметическую для выборки: 3+5+6+9+11+14 48 __————^———————=^=8. Затем вычисляют отклонения каждого значения от средней и суммируют их: -5 -3 -2 +1 +3 +6 (3 8) + (5 8) + (6 8) + (9 8) + (11 8) + (14 8). Однако при таком сложении отрицательные и положительные отклонения будут уничтожать друг друга, иногда даже полностью, так что результат (как в данном примере) может оказаться равным нулю. Из этого ясно, что нужно находить сумму абсолютных значений индивидуальных отклонений и уже эту сумму делить на их общее число. При этом получится следующий результат: среднее отклонение равно 53213 38+5-8[+6-8+9-8+11 -8+ 14 ^8 ! 20 ззз 6 б 33 '3 Общая формула: 2^ п Среднее отклонение = где Т. (сигма) означает сумму; d\ абсолютное значение каждого индивидуального отклонения от средней; и-число 12,73 15,8 18,87 -la +lo Фон 294 Приложение Б -1о +1о После воздействия Поскольку стандартное отклонение всегда соответствует одному и тому же проценту результатов, укладывающихся в его пределах вокруг средней, можно утверждать, что при любой форме кривой нормального распределения та доля ее площади, которая ограничена (с обеих сторон) стандартным отклонением, всегда одинакова и соответствует одной и той же доле всей популяции. Это можно проверить на тех наших выборках, для которых распределение близко к нормальному,на данных о фоне для контрольной и опытной групп. Итак, ознакомившись с описательной статистикой, мы узнали, как можно представить графически и оценить количественно степень разброса данных в том или ином распределении. Тем самым мы смогли понять, чем различаются в нашем опыте распределения для контрольной группы до и после воздействия. Однако можно ли о чем-то судить по этой разнице отражает ли она действительность или же это просто артефакт, связанный со слишком малым объемом выборки? Тот же вопрос (только еще острее) встает и в отношении экспериментальной группы, подвергнутой воздействию независимой переменной. В этой группе стандартное отклонение для фона и после воздействия тоже различается примерно на 1 (3,14 и 4,04 соответственно). Однако здесь особенно велика разница между средними-15,2 и 11,3. На основании чего можно было бы утверждать, что эта разность средних действительно достоверна, т.е.-достаточно велика, чтобы можно было с уверенностью объяснить ее влиянием независимой переменной, а не простой случайностью? В какой степени можно опираться на эти результаты и распространять их на всю популяцию, из которой взята выборка, i. е. утверждать, что потребление марихуаны и в самом деле обычно ведет к нарушению глазодвигатель-ной координации? На все эти вопросы и пытается дать ответ индуктивная |