Студопедия — Моменты распределения
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Моменты распределения






Центральное значение, или расположение распределения, — первое, что надо знать о группе данных. Следующая величина, которая представляет интерес, — это изменчивость данных, или «ширина» относительно центрального значения. Мы назовем значение центральной тенденции первым моментом распределения. Изменчивость точек данных относительно центральной тенденции называется вторым моментом распределения. Следовательно, второй момент измеряет раз­брос распределения относительно первого момента.

Как и в случае с центральной тенденцией, существует много способов измере­ния разброса. Далее мы рассмотрим семь из них, начиная с наименее распростра­ненных вариантов и заканчивая самыми распространенными.

Широта (range) распределения — это просто разность между самым высоким и самым низким значением распределения. Таким же образом широта перцентиля 10-90 является разностью между 90-й и 10-й точками. Эти первые две величины измеряют разброс по крайним точкам. Остальные пять измеряют отклонение от центральной тенденции (т.е. измеряют половину разброса).

Семи-интерквартильная широта (sem-interquartile range), или квартальное от­клонение (quartile deviation), равна половине расстояния между первым и третьим квартилями (25-й и 75-й перцентили). В отличие от широты перцентиля 10-90, здесь широта делится на два.

Полуширина (half-width) является наиболее распространенным способом изме­рения разброса. Сначала надо найти высоту распределения в его пике (моде), за­тем найти точку в середине высоты и провести через нее горизонтальную линию перпендикулярно вертикальной линии. Горизонтальная линия пересечет кривую распределения в одной точке слева и в одной точке справа. Расстояние между эти­ми двумя точками называется полушириной.

Среднее абсолютное отклонение (mean absolute deviation), или просто среднее отклонение, является средним арифметическим абсолютных значений разности значения каждой точки и среднего арифметического значений всех точек. Други­ми словами (что и следует из названия), это среднее расстояние, на которое значе­ние точки данных удалено от среднего. В математических терминах:

где М = среднее абсолютное отклонение;

N = общее число точек данных;

X. = значение, соответствующее точке i;

А = среднее арифметическое значений точек данных;

ABS() = функция абсолютного значения.

Уравнение (3.06) дает нам совокупное среднее абсолютное отклонение. Вам сле­дует знать, что можно рассчитать среднее абсолютное отклонение по выборке. Для расчета среднего абсолютного отклонения выборки замените 1 / N в уравне­нии (3.06) на 1 / (N - 1). Используйте эту версию, когда расчеты ведутся не по всей совокупности данных, а по некоторой выборке.

Самыми распространенными величинами для измерения разброса являются дисперсия и стандартное отклонение. Как и в случае со средним абсолютным от­клонением, их можно рассчитать для всей совокупности и для выборки. Далее показана версия для всей совокупности данных, которую можно легко переделать в выборочную версию, заменив l/NHal/(N-l). Дисперсия (variance) чем-то напоминает среднее абсолютное отклонение, но при расчете дисперсии каждая разность значения точки данных и среднего значе­ния возводится в квадрат. В результате, нам не надо брать абсолютное значение каждой разности, так как мы автоматически получаем положительный результат, независимо от того, была эта разность отрицательной или положительной. Кроме того, так как в квадрат возводится каждая из этих величин, крайние выпадающие значения оказывают большее влияние на дисперсию, а не на среднее абсолютное отклонение. В математических терминах:

где V = дисперсия;

N = общее число точек данных;

X. = значение, соответствующее точке i;

А = среднее арифметическое значений точек данных.

Стандартное отклонение (standard deviation) тесно связано с дисперсией (и, следо­вательно, со средним абсолютным отклонением). Стандартное отклонение явля­ется квадратным корнем дисперсии.

Третий момент распределения называется асимметрией (skewness), и он опи­сывает асимметричность распределения относительно среднего значения (рису­нок 3-2). В то время как первые два момента распределения имеют размерные ве­личины (то есть те же единицы измерения, что и измеряемые параметры), асим­метрия определяется таким способом, что получается безразмерной. Это просто число, которое описывает форму распределения.

Положительное значение асимметрии означает, что хвосты больше с положи­тельной стороны распределения, и наоборот. Совершенно симметричное распре­деление имеет нулевую асимметрию.

Рисунок 3-2 Асимметрия

Рисунок 3-3 Асимметричное распределение

В симметричном распределении среднее, медиана и мода имеют одинаковое значе­ние. Однако когда распределение имеет ненулевое значение асимметрии, оно может принять вид, показанный на рисунке 3-3. Для асимметричного распределения (лю­бого распределения с ненулевой асимметрией) верно равенство:

(3.08) Среднее - Мода = 3 * (Среднее - Медиана)

Есть много способов для расчета асимметрии, и они часто дают различные отве­ты. Ниже мы рассмотрим несколько вариантов:

(3.09) S == (Среднее - Мода) / Стандартное отклонение

(3.10) S = (3 * (Среднее - Медиана)) / Стандартное отклонение

Уравнения (3.09) и (3.10) дают нам первый и второй коэффициенты асимметрии Пирсона. Асимметрия также часто определяется следующим образом:

где S = асимметрия;

N = общее число точек данных;

Х = значение, соответствующее точке i;

А = среднее арифметическое значений точек данных;

D = стандартное отклонение значений точек данных.

И наконец, четвертый момент распределения, эксцесс (kurtosis) (см. рисунок 3-4), измеряет, насколько у распределения плоская или острая форма (по сравнению с нормальным распределением). Как и асимметрия, это безразмерная величина. Кривая, менее остроконечная, чем нормальная, имеет эксцесс отрицательный, а кривая, более остроконечная, чем нормальная, имеет эксцесс положительный. Когда пик кривой такой же, как и у кривой нормального распределения, эксцесс равен нулю, и мы будем говорить, что это распределение с нормальным эксцессом.

Как и предыдущие моменты, эксцесс имеет несколько способов расчета. Наи­более распространенными являются:

где К = эксцесс;

Q == семи-интерквартильная широта;

Р = широта перцентиля 10-90.

 

(3.13) К = (1 / N (∑ (((X - Аi) / D)^ 4))) - 3,

где К = эксцесс;

N = общее число точек данных;

Х = значение, соответствующее точке i;

А = среднее арифметическое значений точек данных;

D = стандартное отклонение значений точек данных.

Рисунок 3-4 Эксцесс

Наконец, необходимо отметить, что «теория», связанная с моментами распределе­ния, намного серьезнее, чем то, что представлено здесь. Для более глубокого пони­мания вам следует просмотреть книги по статистике, упомянутые в списке реко­мендованной литературы. Для наших задач изложенного выше вполне достаточно.

До настоящего момента рассматривалось распределение данных в общем виде. Теперь мы изучим нормальное распределение.







Дата добавления: 2015-10-12; просмотров: 481. Нарушение авторских прав; Мы поможем в написании вашей работы!



Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Методика обучения письму и письменной речи на иностранном языке в средней школе. Различают письмо и письменную речь. Письмо – объект овладения графической и орфографической системами иностранного языка для фиксации языкового и речевого материала...

Классификация холодных блюд и закусок. Урок №2 Тема: Холодные блюда и закуски. Значение холодных блюд и закусок. Классификация холодных блюд и закусок. Кулинарная обработка продуктов...

ТЕРМОДИНАМИКА БИОЛОГИЧЕСКИХ СИСТЕМ. 1. Особенности термодинамического метода изучения биологических систем. Основные понятия термодинамики. Термодинамикой называется раздел физики...

Тема 5. Анализ количественного и качественного состава персонала Персонал является одним из важнейших факторов в организации. Его состояние и эффективное использование прямо влияет на конечные результаты хозяйственной деятельности организации.

Билет №7 (1 вопрос) Язык как средство общения и форма существования национальной культуры. Русский литературный язык как нормированная и обработанная форма общенародного языка Важнейшая функция языка - коммуникативная функция, т.е. функция общения Язык представлен в двух своих разновидностях...

Патристика и схоластика как этап в средневековой философии Основной задачей теологии является толкование Священного писания, доказательство существования Бога и формулировка догматов Церкви...

Studopedia.info - Студопедия - 2014-2024 год . (0.012 сек.) русская версия | украинская версия