Нормальное распределение (Лапласа-Гаусса)
Нормальное распределение (Лапласа-Гаусса) – это распределение, при котором переменная величина изменяется непрерывно, причем крайние значения величины (наибольшие и наимень-шие) появляются редко, но чем ближе значения признака к центру (к средней арифметической), тем оно чаще встречается. Нормальное распределение (Лапласа-Гаусса) – это один из предельных случаев биноми-нального распределения, имеющий место при неограниченном увеличении числа испытаний. Рост мужчин или женщин, ошибки измерений и многие другие совокупности моделируются посред-ством нормального распределения. Нормальный закон распределения во всех естественных науках имеет фундаментальное значение. 3акон Лапласа-Гаусса (по имени ученых, независимо открывших и исследовавших его) из-за широкого распространения в природе первоначально принимался за норму распределения любой случайной величины, чем и обусловлено название “нормальный закон”. Нормальным распределением его называют вследствие широкой распространенности случайных величин с таким распределением вероятностей. В психологических дисциплинах его значение трудно переоценить. Достаточно сказать, что все психологические шкалы основываются на этом законе, поскольку ему следуют распределения большинства человеческих способностей и свойств. Исходя из теории ошибок Гаусса (из центральной предельной теоремы), распределение может считаться нормальным при условии достаточно большого числа независимых случайных величин, ни одна из которых не доминирует над другой ни по вероятности, ни по силе воздействия на общую сумму случайных величин. Именно эта сумма подчиняется тогда нормальному закону распределения, а вероятности и воздействия всех составляющих факторов есть величины бесконечно малые. Нормальное распределение есть некоторая идеальная (колоколообразная) форма симметри-ческого распределения (рис. 9). Рис. 9. Нормальное распределение случайной величины x
Случайную величину x называют нормально распределенной, если она принимает множество значений xi на интервале l с вероятностями: Нормальное распределение также описано двумя параметрами: средним значением (матема-тическим ожиданием) М и средним квадратическим отклонением. Когда при обработке экспериментального статистического материала встает задача установле-ния формы полученного распределения, т.е. сведения его к одной из теоретических форм, то чаще всего предполагается, что измеренные показатели подчинены закону Гаусса. Нормальное распре-деление является наиболее изученным теоретически, имеет ряд чисто математических удобств, к нему отнесены многие мощные приемы и методы анализа. Разработаны даже специальные средства для преобразования эмпирических данных в нормальное распределение (подбор задач и условий эксперимента, смена аргумента, нормализация выборки по составу). Математические преимущества закона Гаусса бесспорны, однако не только они должны приниматься во внимание при анализе результатов измерения. Предположение нормальности эмпирического распределения необходимо обосновывать качественно, осознавая все те допу-щения, о которых говорилось выше и которые сопутствуют теоретическому нормальному закону. Ведь удобнее было предполагать, например, некоторое точечное постоянство исследуемого в эксперименте показателя, т.е. исходить из полного отсутствия статистического распределения вообще. Так что весь вопрос выбора методики обработки заключается не просто в уровне математических удобств, а в степени соответствия той или иной математической модели теории реального процесса. Известно, что абсолютного соответствия здесь быть не может, поэтому речь идет всегда о “весе” тех неизбежных потерь сведений об изучаемом процессе, которые происте-кают от математического (в данном случае статистического, вероятностного) его моделирования. Злоупотребления же безосновательными предположениями нормального закона распределения характерны отнюдь не только для психологии и подвергаются обоснованной критике. Самой общей характеристикой нормального распределения является простое наблюдение того закономерного факта, что очень большие центральные отклонения (хi – М) встречаются крайне редко, а маленькие – часто, при этом одинаковые по модулю отклонения одинаково вероятны. Такая закономерность может иметь место в условиях, когда на случайную величину Х действует большое число разнообразных факторов, и доля воздействия каждого из них одинаково мала по сравнению с их числом. Значения вероятности определяются не только значениями аргумента хi, но и значениями М, s и λ, которые, естественно, различны у конкретных случайных величин. В этой связи целесообразно использовать функцию плотности вероятности, центрированную и нормированную стандартным отклонением. Отметим некоторые свойства нормального распределения на примере его стандартной плотности (рис. 10). По оси абсцисс отложены значения случайной величины в единицах стандартного отклонения (s), по оси ординат – плотности и вероятности соответственно.
Рис. 10. Плотность (а) и функция распределения (б)
1. При всех значениях хi переменной Х плотность f(x) положительна. 2. Плотность f(x) симметрична относительно математического ожидания, которое в этой связи нередко называют центром рассеивания (для симметричных распределений). Коэффициент асимметрии равен нулю. 3. При увеличении модуля аргумента (| хi | → ) функция f(x) сколь угодно близко (асимпто-тически) приближается к оси абсцисс, не достигая ее. 4. Максимальную плотность нормальное распределение имеет при хi = М. Таким образом, в случае нормального распределения численные значения среднего арифметического, моды и медианы совпадают. 5. Из рис. 10 можно видеть, что плотность нормального распределения быстро убывает по мере увеличения значений центрированной случайной величины, выраженных в единицах стандартного отклонения. В этой связи стандартное (среднее квадратическое) отклонение определяют как половину величины интервала, симметричного относительно центра рассеивания, для которого вероятность появления на нем значения случайной величины Х равна 0,683. 6. Заметим (рис. 10), что при значениях –s и s на кривой стандартной плотности имеются точки смены кривизны (перегиба): вниз и вверх. 7. Чтобы эксцесс нормального распределения численно равнялся нулю и служил “началом” отсчета, для измерения степени крутости любых функций распределения в уравнение для коэффициента эксцесса введено слагаемое (–3). Несмотря на то что теоретически нормальный закон распределения предполагает существо-вание бесконечно малых и бесконечно больших значений любой следующей ему случайной величины, на практике, тем более в психологии, случайные переменные имеют конечные области существования. В этой связи на практике используются функции нормального распределения, ограниченные слева и справа основными отклонениями: –3 < х < 3, М = 0, s = 1. Чтобы установить, является ли эмпирическое распределение изучаемой случайной величины нормальным, необходимо сопоставить сведения о свойствах этой величины и условиях ее изучения, известные исследователю, со свойствами функций нормального распределения, рассмот-ренными выше. Это сопоставление вначале является качественным, а затем осуществляется специальными количественными методами (см. задания 5 и 6 тренинга умений). Основой качественного сопоставления служит “физическое” условие появления нормального распределения, а именно – влияние на изучаемую случайную величину большого числа факторов, тоже случайных, воздействия которых преимущественно независимы и примерно одинаковы. Если такое условие, по мнению исследователя, имеет место, то можно ожидать, что изучаемая случайная величина распределена нормально. Так, на формирование способностей человека действует множество различных случайных факторов (биологических, физиологических, психи-ческих и социальных). В этой связи можно ожидать, что в массе людей степень выраженности той или иной способности распределена нормально. И это во многом подтверждается практикой тестирования способностей. Количественное сопоставление включает в себя два последовательных этапа. Первый – сравнение отдельных свойств эмпирического распределения со свойствами нормального закона. Это касается прежде всего симметричности (мода, медиана и среднее арифметическое примерно или точно одинаковы) и эксцесса (коэффициент эксцесса близок к нулю). Весьма информативным является факт наличия точек смены кривизны на сглаженном полигоне распределения при значениях случайной величины Х i = – σ и Х i = σ. Если имеется соответствие между некоторымииз перечисленных свойств эмпирического и нормального распределения, то можно перейти к следующему этапу. Второй этап состоит в вычислении теоретической функции распределения по эмпирическому ряду в предположении, что он подчиняется нормальному закону. Именно это предположение и обосновывается при качественном и количественном (на первом этапе) сопоставлении свойств. В общем случае вычисление теоретических значений вероятностей, соответствующих эмпирическим частостям, осуществляется либо по таблицам функций распределения, либо через логарифмы, либо с использованием таблиц специальных функций. Нередки комбинации двух последних способов. Сопоставление заканчивается сравнением фактических (полученных в опыте) частостей и теоретических (вычисленных) вероятностей. Если различия малы или отсутствуют, то можно считать, что изучаемая случайная величина распределена нормально. Лишенная субъективных предпочтений оценка того, “малы” или “велики” получившиеся различия, осуществляется с помощью специальных критериев согласия. Если согласие теоретического распределения с эмпи-рическим рядом приемлемое, то посредством теоретических функций распределения можно решать важные для практических приложений задачи: – определять вероятности Рх i; – определять квантили; – определять среднее арифметическое значение.
|