Студопедия — Характеристики формы распределения.
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Характеристики формы распределения.






Используются для отражения близости формы распределения к нормальному виду.

§ Эксцесс (kurtosis) – мера «сглаженности» («остро» и «плосковершинности») распределения. Если значение эксцесса близко к 0, это означает, что форма распределения близка к нормальному виду. Положительный эксцесс указывает на «плосковершинное» распределение, у которого максимум вероятности выражен не столь ярко, как у нормального. Значения эксцесса, превышающие 5,0, говорят о том, что по краям распределения находится больше значений, чем вокруг среднего. Отрицательный эксцесс характеризует «островершинное» распределение, график которого более вытянут по вертикальной оси, чем график нормального распределения. Считается, что распределение с эксцессом от – 1 до +1 примерно соответствует нормальному виду.

§ Асимметрия (skewness) показывает, в какую сторону относительно среднего сдвинуто большинство значений распределения. Нулевое значение асимметрии означает симметричность распределения относительно среднего значения, положительная асимметрия указывает на сдвиг распределения в сторону меньших значений, а отрицательная – в сторону больших значений. В большинстве случаев за нормальное распределение принимается распределение с асимметрией в пределах – 1 до +1.

Стандартная ошибка (standard error) – характеристика точности, или стабильности, величины, для которой она вычисляется. Чем меньше значение стандартной ошибки, тем выше стабильность величины, для которой она вычисляется.

 

Для вычисления описательных статистик в меню Analyze нужно выбрать команду Descriptive Statistics – Descriptives. В диалоговом окне необходимо задать переменные, для которых будут вычислены описательные статистики, перенести их в целевой список. По умолчанию в программе можно получить данные, включающие среднее значение (mean), стандартное отклонение (standard deviation), максимум (maximum), минимум (minimum). Для этого в окне Descriptives при заданном целевом списке нужно щелкнуть на кнопке ОК.

Чтобы вычислить дополнительные характеристики – размах (range), сумму (sum), дисперсию (variance), эксцесс (kurtosis), асимметрию (skewness) нужно перед щелчком на кнопке ОК щелкнуть на кнопке Options (Параметры). Откроется диалоговое окно Descriptives: Options, в котором с помощью флажков можно задать дополнительные характеристики, за исключением двоих: медианы (median) и моды (mode).

В зависимости от того, какие уровни измерения используются для статистического анализа, применяются разные методы вычисления описательных статистик для переменных.

Выделяется три основных уровня измерения переменных: номинальный, порядковый, интервальный.

Наиболее полную информацию дают интервальные измерения. Они позволяют численно выражать и сравнивать различия между объектами измерения. Например, переменная «возраст» может быть измерена с помощью интервальной шкалы, иногда бывает достаточно трех значений: молодежь в возрасте 18 до 35 лет, средний возраст – 36-55 лет, старший возраст – более 55 лет. Или может быть измерена в натуральных числах – годах с момента рождения человека. Объяснение свойства интервальных измерений численно выражать различия между объектами заложено в их названии: измерение осуществляется с помощью неизменного интервала, который выступает эталоном меры. Такими эталонами являются, например, градус, метр, килограмм, минута, процент или рубль. На интервальном уровне измерения осуществимы все операции с натуральными числами. Это имеет большое практическое значение, так как позволяет применять к интервальным переменным статистические методы любой сложности. Методику перевода переменной с натуральными числами в новую с интервальной шкалой мы приводили в разделе «Перекодировка в новую переменную».

На порядковом уровне измерения присутствует упорядочивание категорий с точки зрения возрастания/убывания интенсивности признака. С помощью порядковых (ранговых) шкал измеряют интенсивность оценок каких-то свойств, суждений, событий, степени согласия или несогласия с предложенными утверждениями.

Построение порядковой шкалы можно проиллюстрировать на примере переменной «политическое участие гражданина»[6], использованием измерения, позволяющего ранжировать граждан по классам, различающимся количеством данного свойства, а именно:

1) отсутствие политического участия;

2) эпизодическое или регулярное участие в выборах в качестве избирателя;

3) регулярное участие в выборах, членство в политической партии;

4) регулярное участие в различных политических компаниях, акциях и т.д.

5) участие в выборах в качестве кандидата;

6) повседневное участие в принятии политических решений.

 

В приведенном примере интенсивность политического участия возрастает от первого класса к шестому. Можно утверждать, что в классе 2 (участие в выборах в качестве избирателя) признак «политическое участие» выражен больше, чем в классе 1 (отсутствие участия), но меньше, чем в классе 5 (участие в выборах в качестве кандидата). Относя изучаемых нами граждан к определенным классам политического участия, мы тем самым ранжируем их по данному признаку. Но такое ранжирование по классам не дает точных показателей, как фиксированный интервал, «эталон меры» политического участия. Поэтому по сравнению с интервальными шкалами возможности математических операций со значениями порядковых переменных ограничены.

Порядковые измерения имеют широкое применение в социологических исследованиях. Например, такие распространенные характеристики, как социальный статус или уровень образования измеряются по порядковой шкале. Порядковыми по своей природе являются такие переменные, как «политическая активность», «интерес к политике», «степень доверия к правительству», «отношение к той или иной политической партии».

Наименее полную информацию дают номинальные измерения (шкала наименований). Номинальная шкала устанавливает отношения равенства между явлениями, которые включены в один класс. Каждый элемент шкалы существует как бы сам по себе, и в целом шкала не упорядочена. Единственное условие состоит в том, что все элементы должны иметь единое основание для выделения. Номинальные переменные отражают сугубо качественные признаки, такие как «политическая ориентация», «членство в партии», «тип политического режима». При помощи номинальных переменных также измеряются преимущественно объективные признаки респондентов (пол, возраст, партийность, семейное положение, род занятий и др.). Соответственно, числовые значения на номинальном уровне не отражают каких-либо свойств объектов, а служат своего рода «ярлыками», «опознавательными кодами» классов.

Для номинальный и порядковых переменных с небольшим количеством категорий существует общее название: категориальные, или неметрические. Соответственно, интервальные и порядковые переменные с большим количеством категорий называют метрическими.

 

Для номинальных переменных наиболее важными вычислениями являются частотные распределения, процентные соотношения, мода и стандартное отклонение.

 

Пример описательных статистик номинальной переменной - «За какую партию вы проголосовали бы, если бы выборы состоялись в ближайшее воскресенье?».

 

Число респондентов – 316 человек (пропущенные значения не учитываются). Стандартное отклонение – 1,924. Ассиметрия положительная +007, нормальная - в пределах +1, стабильная – стандартная ошибка 0,137. Эксцесс отрицательный -0,628, график «островершинный», соответствует нормальному виду – в пределах -1, величина стабильная – стандартная ошибка – 0,273.

Вычисление моды и медианы возможно через команду Frequencies (Частоты). В диалоговом окне щелкнуть на кнопке Statistics (статистические показатели), с помощью флажков задать моду (mode) и медиану (median), а также здесь можно задать все остальные описательные характеристики.

В примере с вопросом «За какую партию вы проголосовали бы, если бы выборы состоялись в ближайшее воскресенье?» это будет выглядеть следующим образом. Самое часто встречающееся значение – мода – 5, медиана – 6,01.

 

Мода – 5, соответствует варианту «Единая Россия», следовательно, в опрошенной группе наиболее распространены приверженцы партии «Единая Россия». Необходимо выяснить, насколько эта средняя (мода) в действительности отражает характер распределения, то есть насколько предпочтения партии «Единая Россия» типичны (репрезентативны) для группы в целом. Стандартное отклонение (Std. Deviation) показывает насколько существенен разброс значений вокруг средней. Стандартное отклонение – 1,924.

 

Для порядковых переменных основной средней величиной для порядковых переменных является медиана (median). Медиана представляет собой середину ранжирования числового ряда. В случае, когда число элементов является четным и возникают как бы две середины числового ряда, медиана – их среднее арифметическое.

Распространенный способ измерить разброс значений вокруг средней на порядковом уровне является вычисление квартилей - четвертей ранжированного ряда. Квартиль является естественным развитием медианы, с той разницей, что квартильное разбиение делит всех респондентов не на 2, а на 4 части. Первый квартиль – это такая точка на шкале, значения меньше (либо равные) которой отметили 25% опрошенных. Второй квартиль – точка, меньше которой отметили 50% опрошенных (следовательно, второй квартиль совпадает с медианой). Наконец, третий квартиль – точка, градации меньше которой отметили 75% опрошенных.

Квартильное отклонение – это разница между третьим и первым квартилями.

 

Вычисление квартилей, как и моды (и)или медианы возможно через команду Frequencies (Частоты). В диалоговом окне щелкнуть на кнопке Statistics (статистические показатели), в окне Percentile Values с помощью флажка задать квартили (Quaritles). При этом можно снять флажок Display Frequencies tables и не показывать на экране таблицы с частотными распределениями.

 

Например, для порядковой переменной «удовлетворенность своим образованием» медианой является 2 значение, однако по процентному соотношению нельзя сказать, насколько точно модель средней тенденции (медиана) отражает поведение переменной. Из таблицы видно, что достаточно большое количество респондентов имеют значение переменной – 3.

 

И только по квартильному разбиению можно сказать, что значение переменной 2 - «в основном удовлетворен» является важной средней характеристикой для всей выборочной совокупности.

Квантильное разбиение для переменной «удовлетворенность уровнем образования» будет выглядеть следующим образом:

Первый квартиль – это градация «2» переменной, поскольку градации «1» и «2» отметили 25% опрошенных. Второй квартиль (медиана) – так же равен «2». Третий квартиль – градация «3». Квартильное отклонение незначительно, составляет равно 1. Следовательно, центральная тенденция – значение переменной «в основном удовлетворен образованием».

 

Полезным и нередко используемым показателем при анализе количественных переменных является децильное отношение.

В этом случае в окне Frequencies Statistics в Percentile Values с помощью флажка нужно отметить C u t points for equal group. При этом по умолчанию (в окошке появится цифра 10) все респонденты делятся не на 4 части (квартили), а на 10 равных частей.

Например, с помощью децильного разбиения можно изучить насколько высока неоднородность доходов, получаемых респондентами в месяц.

Децильное разбиение для переменной «доход» выглядит следующим образом:

Данные таблицы говорят о том, что доход до 5000 рублей в месяц получают 10% респондентов (граница первого дециля), а также о том, что для 10% опрошенных доход в месяц составляет 25000 руб. и выше (граница десятого дециля). Децильное отношение – это отношение деятого дециля к первому. Этот показатель демонстрирует, во сколько раз больше получают 10% наиболее высокооплачиваемых респондентов по сравнению с 10% наименее оплачиваемых. В нашем примере децильное отношение составляет 5,00, что показывает степень неоднородности доходов респондентов.

На интервальном уровне измерения, предполагающим не только упорядочение категорий по признаку «больше - меньше», но и установление фиксированного интервала измерения. Поэтому можно осуществлять все операции с натуральными числами.

Наиболее распространенной средней величиной для интервальных вычислений является среднее арифметическое (mean). Характерной особенностью среднего арифметического является высокая чувствительность к кренам в распределении, связанным с наличием в совокупности одного или нескольких предельных значений.

Традиционной мерой разброса значений вокруг средней на интервальном уровне выступает стандартное отклонение.

По методике вычисления описательных статистик проведем одномерный анализ интервальной переменной «доход в месяц». Ход вычислений: Analyze – Descriptive Statistics - Frequencies – Statistics – флажки на Mean, Median, Mode, Std. Deviation, Variance, Range, Minimum, Maximum.

Среднее арифметическое для переменной «доход в месяц» составляет 13,737 (средний доход в месяц составляет 13 тыс. руб.), стандартное отклонение – 12,2770 достаточно большое значение, показывающее на разброс значений, минимальное значение – 1000 руб. в месяц, максимальное – 150 тыс. в месяц, размах составляет 149 тыс. руб.

Задание:1. Определить какие шкалы необходимы для измерения переменных «Какие городские проблемы вызывают у Вас сейчас наибольшую тревогу?», «Как Вы оцениваете эффективность работы городской администрации в решении существующих в городе проблем?», «Как часто вы смотрите передачи на политические темы по телевидению?». Сформулировать значения переменных (варианты ответов).

2. (по массиву данных файла opros.sav). На основании вычисления описательных статистик (моды, стандартного отклонения, ассиметрии и эксцесса), а так же частоты и процентных соотношений определить характер распределения респондентов по категориям отношения к политической деятельности – переменная «интерес к политической жизни» (var11). Выяснить какая категория (значение переменной) типична для выборочной группы. Построить столбиковую диаграмму.

3. Создать описательные статистики, выбранных двух-трех переменных собственного исследования.

 







Дата добавления: 2015-08-30; просмотров: 786. Нарушение авторских прав; Мы поможем в написании вашей работы!



Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

САНИТАРНО-МИКРОБИОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ ВОДЫ, ВОЗДУХА И ПОЧВЫ Цель занятия.Ознакомить студентов с основными методами и показателями...

Меры безопасности при обращении с оружием и боеприпасами 64. Получение (сдача) оружия и боеприпасов для проведения стрельб осуществляется в установленном порядке[1]. 65. Безопасность при проведении стрельб обеспечивается...

Весы настольные циферблатные Весы настольные циферблатные РН-10Ц13 (рис.3.1) выпускаются с наибольшими пределами взвешивания 2...

ТРАНСПОРТНАЯ ИММОБИЛИЗАЦИЯ   Под транспортной иммобилизацией понимают мероприятия, направленные на обеспечение покоя в поврежденном участке тела и близлежащих к нему суставах на период перевозки пострадавшего в лечебное учреждение...

Кишечный шов (Ламбера, Альберта, Шмидена, Матешука) Кишечный шов– это способ соединения кишечной стенки. В основе кишечного шва лежит принцип футлярного строения кишечной стенки...

Принципы резекции желудка по типу Бильрот 1, Бильрот 2; операция Гофмейстера-Финстерера. Гастрэктомия Резекция желудка – удаление части желудка: а) дистальная – удаляют 2/3 желудка б) проксимальная – удаляют 95% желудка. Показания...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия