Вывод статистических характеристик
Следующим этапом частотного анализа данных является получение описательной статистики. Для вычисления статистических характеристик случайной величины необходимо выполнить следующее: в диалоге Частоты щелкнуть на кнопке Статистики. Откроется диалоговое окно Частоты: Статистики (рис.2.5). В группе Значения процентилей можно выбрать следующие варианты: · Квартили. Будут показаны первый, второй и третий квартили. · Процентили для (Точки раздела): Будут вычислены значения процентилей, разделяющие выборку на группы наблюдений, которые имеют одинаковую ширину, то есть включают одно и то же количество измеренных значений. По умолчанию предлагается количество групп 10. Если задать, например, 4, то будут показаны квартили, то есть квартили соответствуют процентилям 25, 50 и 75. видно, что число показываемых процентилей на единицу меньше заданного числа групп. · Процентили. Здесь имеются в виду значения процентилей, определяемые пользователем.
Рис.2.5. Диалоговое окно «Частоты: Статистики»
Введите значение процентиля в пределах от 0 до 100 и щелкните на кнопке Добавить. Повторите эти действия для всех желаемых значений процентилей. В группе Разброс можно выбрать меры разброса: · Стандартное отклонение. Оно равно квадратному корню из дисперсии. В интервале шириной, равной удвоенному стандартному отклонению, который отложен по обе стороны от среднего значения, располагается примерно 67% всех значений выборки, подчиняющейся нормальному распределению. · Дисперсия. Она определяется как сумма квадратов отклонений всех измеренных значений от их среднеарифметического значения, деленная на количество измерений минус 1. (В SPSS встроена функция исправленной дисперсии, поэтому в знаменателе присутствует «минус 1»). · Размах – разница между наибольшим значением (максимумом) и наименьшим значением (минимумом). · Минимум. · Максимум. · Стандартная ошибка среднего значения. В интервале шириной, равной удвоенной стандартной ошибке, отложенному вокруг среднего значения, располагается среднее значение генеральной совокупности с вероятностью примерно 67%. Стандартная ошибка определяется как стандартное отклонение, деленное на квадратный корень из объема выборки. В группе Расположение можно выбрать следующие характеристики: · Среднее значение. Это арифметическое среднее измеренных значений; оно определяется как сумма значений, деленная на их количество. · Медиана – это точка на шкале измеренных значений, выше и ниже которой лежит по половине всех измеренных значений. · Мода – это значение, которое наиболее часто встречается в выборке. Если распределение имеет несколько мод, то говорят, оно мультимодально или многомодально (имеет два и более «пика»). · Сумма всех значений. В группе Распределение можно выбрать следующие меры несимметричности распределения: · Ассиметрия (коэффициент ассиметрии) – это мера отклонения распределения частоты от симметричного распределения, то есть такого, у которого на одинаковом удалении от среднего значения по обе стороны выборки данных располагается одинаковое количество значений. Если наблюдения подчиняются нормальному распределению, то асимметрия равна нулю. Для проверки на нормальное распределение можно применять следующее правило: если асимметрия значительно отличается от нуля, то гипотезу о том, что данные взяты из нормально распределенной генеральной совокупности, следует отвергнуть. Если вершина асимметричного распределения сдвинута к меньшим значениям, то говорят о положительной асимметрии, в противоположном случае – об отрицательной. · Эксцесс (Коэффициент вариации) – указывает, является ли распределение пологим (при большом значении коэффициента) или крутым. Эксцесс равен нулю, если наблюдения подчиняются нормальному распределению. Поэтому для проверки на нормальное распределение можно применять ещё одно правило: если коэффициент вариации значительно отличается от нуля, то гипотезу о том, что данные взяты из нормально распределенной генеральной совокупности, следует отвергнуть.
|