Нормальное распределение, его распространенность в социологии
Многочисленные методы, с помощью которых обрабатываются переменные, относящиеся к интервальной шкале, исходят из гипотезы, что их значения подчиняются нормальному распределению. При таком распределении большая часть значений группируется около некоторого среднего значения, по обе стороны от которого частота наблюдений равномерно снижается. На диаграмме нанесена кривая нормального распределения (Колокол Гаусса). Реальное распределение в большей или меньшей степени отклоняется от этой идеальной кривой. Выборки, строго подчиняющиеся нормальному распределению, на практике, как правило, не встречаются. Поэтому почти всегда необходимо выяснить, можно ли реальное распределение считать нормальным и насколько значительно заданное распределение отличается от нормального. Перед применением любого метода, который предполагает существование нормального распределения, наличие последнего нужно проверять в первую очередь. Классическим примером статистического теста, который исходит из гипотезы о нормальном распределении, можно назвать t-тест Стьюдента, с помощью которого сравнивают две независимые выборки. Если же данные не подчиняются нормальному распределению, следует использовать соответствующий непараметрический тест, в случае двух независимых выборок — U-тест Манна и Уитни. Если визуальное сравнение реальной гистограммы с кривой нормального распределения кажется недостаточным, можно применить тест Колмогорова-Смирнова, который находится в меню Analyze (анализ данных) в наборе непараметрических тестов. Третий способ проверки «правило трех сигм» Правило трёх сигм Правило 3-х s(трех “сигм”). Пусть имеется нормально распределённая случайная величина xс математическим ожиданием, равным а и дисперсией s2. Определим вероятность попадания xв интервал (а – 3s; а + 3s), то есть вероятность того, что xпринимает значения, отличающиеся от математического ожидания не более, чем на три среднеквадратических отклонения. P (а – 3s< x < а + 3s)= Ф (3) – Ф (–3)=2 Ф (3) По таблице находим Ф (3)=0,49865, откуда следует, что 2 Ф (3) практически равняется единице. Таким образом, можно сделать важный вывод: нормальная случайная величина принимает значения, отклоняющиеся от ее математического ожидания не более чем на 3s. (Выбор числа 3 здесь условен и никак не обосновывается: можно было выбрать 2,8, 2,9 или 3,2 и получить тот же вероятностный результат. Учитывая, что Ф (2)=0,477, можно было бы говорить и о правиле 2–х “сигм”.)
|