Студопедия — Работа с нормальным распределением
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Работа с нормальным распределением






При использовании нормального распределения часто требуется найти долю площади под кривой распределения в данной точке на кривой. На математичес­ком языке это называется интегралом функции, задающей кривую. Таким же об­разом функция, которая задает кривую, является производной площади под кри­вой. Если у нас есть функция N(X), которая представляет процент площади под кривой в точке X, мы можем говорить, что производная этой функции N'(X) явля­ется функцией самой кривой в точке X.

Мы начнем с формулы самой кривой N' (X). Данная функция выглядит следу­ющим образом:

где U = среднее значение данных;

S =стандартное отклонение данных;

Х = наблюдаемая точка данных;

ЕХР () = экспоненциальная функция.

Эта формула даст нам значение для оси Y, или высоту кривой, при любом данном значении X.

Часто мы будем говорить о точке на кривой, ссылаясь на ее координату X, и бу­дем смотреть, на сколько стандартных отклонений она удалена от среднего. Таким образом, точка данных, которая удалена на одно стандартное отклонение от средне­го, считается смещенной на одну стандартную единицу (standard units) от среднего.

Рисунок 3- 7 Функция плотности нормального распределения вероятности

Более того, часто имеет смысл из всех точек данных вычесть среднее. При этом центр распределения сместится в начало координат. В этом случае точка данных, которая смещена на одно стандартное отклонение вправо от среднего, имеет зна­чение 1 на оси X.

Если мы вычтем среднее из точек данных, а затем разделим полученные значе­ния на стандартное отклонение точек данных, то преобразуем распределение в нормированное нормальное (standardized normal). Это нормальное распределение со средним, равным 0, и дисперсией, равной 1. Теперь N'(Z) даст нам значение на оси Y (высота кривой) для любого значения Z:

U = среднее значение данных;

S = стандартное отклонение данных;

Х = наблюдаемая точка данных;

ЕХР() = экспоненциальная функция.

Уравнение (3.16) дает нам число стандартных единиц, которым соответствует точ­ка данных; другими словами, число стандартных отклонений, на которое точка данных смещена от среднего. Когда уравнение (3.16) равно 1, оно называется стандартным нормальным отклонением (standard normal deviate) от среднего значе­ния. Стандартное отклонение, или стандартная единица, иногда называется сиг­мой (sigma). Таким образом, когда говорят о событии, которое было «событием пяти сигма», то речь идет о событии, вероятность которого находится за предела­ми пяти стандартных отклонений.

Рисунок 3-7 показывает нормальную кривую, заданную предедущим уравне­нием. Отметьте, что высота стандартной нормальной кривой составляет 0,39894, поскольку из уравнения (3.15а) мы получаем:

Отметьте, что кривая непрерывна (в ней нет «разрывов»), когда она переходит из отрицательной области слева в положительную область справа. Отметьте также, что кривая симметрична: сторона справа от пика является зеркальным отражени­ем стороны слева. Предположим, у нас есть группа данных, где среднее равно 11, а стандартное отклонение равно 20. Чтобы увидеть, где точка данных будет отображена на кри­вой, рассчитаем ее в стандартных единицах. Предположим, что рассматриваемая точка данных имеет значение -9. Чтобы рассчитать число стандартных единиц, мы сначала должны вычесть среднее из этой точки данных: -9- 11 =-20

Затем надо разделить полученный результат на стандартное отклонение:

-20/20=-1

Теперь мы можем сказать, что, когда точка данных равна -9, среднее равно 11, а стандартное отклонение составляет 20, число стандартных единиц равно -1. Други­ми словами, мы находимся на одно стандартное отклонение от пика кривой, и, так как это значение отрицательно, оно находится слева от пика. Чтобы увидеть, где это будет на самой кривой (то есть насколько высока кривая при одном стандартном отклонении слева от центра, или чему равно значение кривой на оси Y для значе­ния -1 на оси X), надо подставить полученное значение в уравнение (3.15а):

Таким образом, высота кривой при Х=-1 составляет 0,2419705705. Функция N'(Z) также часто выражается как:

и ATN() = функция арктангенса;

U = среднее значение данных;

S = стандартное отклонение данных;

Х = наблюдаемая точка данных;

ЕХР() = экспоненциальная функция.

Не искушенные в статистике люди часто находят концепцию стандартного отклоне­ния (или квадрата ее величины, дисперсии) трудной для представления. Среднее абсо­лютное отклонение (mean absolute deviation), которое можно преобразовать в стандар­тное отклонение, гораздо проще для понимания. Среднее абсолютное отклонение полностью отвечает своему названию: среднее данных вычитается из каждой точки данных, затем абсолютные значения каждой из этих разностей суммируются, и дан­ная сумма делится на число точек данных. В результате у вас получается среднее рас­стояние каждой точки данных до среднего значения. Преобразование среднего аб­солютного отклонения в стандартное отклонение, и наоборот, представлены далее:

где М = среднее абсолютное отклонение;

S = стандартное отклонение.

Можно сказать, что при нормальном распределении среднее абсолютное откло­нение равно стандартному отклонению, умноженному на 0,7979.

(3.18) S = М * 1 / 0,7978845609

=М* 1,253314137, где S = стандартное отклонение;

М = среднее абсолютное отклонение.

Мы можем также сказать, что при нормальном распределении стандартное отклонение равно среднему абсолютному отклонению, умноженному на 1,2533. Так как дисперсия всегда является стандартным отклонением в квад­рате (а стандартное отклонение является квадратным корнем дисперсии), мы можем задать преобразование между дисперсией и средним абсолютным от­клонением.

(3.19) М = V ^ (1/2) * ((2 / 3,1415926536)^ (1/2))

= V ^ (1/2)* 0,7978845609,

где М = среднее абсолютное отклонение;

V = дисперсия.

(3.20) V = (М * 1,253314137)^ 2,

где V =дисперсия;

М = среднее абсолютное отклонение.

Так как стандартное отклонение в стандартной нормальной кривой равно 1, мы можем сказать, что среднее абсолютное отклонение в стандартной нормальной кривой равно 0,7979. Более того, в колоколообразной кривой, подобной нормальной, семи-интер-квартильная широта равна приблизительно 2/3 стандартного отклонения, и поэто­му стандартное отклонение примерно в 1,5 раза больше семи-интерквартильной широты. Это справедливо для большинства колоколообразных распределений, а не только для нормальных, как и в случае с преобразованием среднего абсолютного отклонения в стандартное отклонение.







Дата добавления: 2015-10-12; просмотров: 437. Нарушение авторских прав; Мы поможем в написании вашей работы!



Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Плейотропное действие генов. Примеры. Плейотропное действие генов - это зависимость нескольких признаков от одного гена, то есть множественное действие одного гена...

Методика обучения письму и письменной речи на иностранном языке в средней школе. Различают письмо и письменную речь. Письмо – объект овладения графической и орфографической системами иностранного языка для фиксации языкового и речевого материала...

Классификация холодных блюд и закусок. Урок №2 Тема: Холодные блюда и закуски. Значение холодных блюд и закусок. Классификация холодных блюд и закусок. Кулинарная обработка продуктов...

Потенциометрия. Потенциометрическое определение рН растворов Потенциометрия - это электрохимический метод иссле­дования и анализа веществ, основанный на зависимости равновесного электродного потенциала Е от активности (концентрации) определяемого вещества в исследуемом рас­творе...

Гальванического элемента При контакте двух любых фаз на границе их раздела возникает двойной электрический слой (ДЭС), состоящий из равных по величине, но противоположных по знаку электрических зарядов...

Сущность, виды и функции маркетинга персонала Перснал-маркетинг является новым понятием. В мировой практике маркетинга и управления персоналом он выделился в отдельное направление лишь в начале 90-х гг.XX века...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия