Студопедия — Порядок выполнения лабораторной работы в пакете Statistica
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Порядок выполнения лабораторной работы в пакете Statistica






 

Порядок выполнения лабораторной работы рассмотрен на примере, в котором целью исследования является выявление взаимосвязей между показателями, характеризующими социально-демографическое положение муниципальных образований Оренбургской области.

Объектом исследования выступают города и районы Оренбургской области, предметом исследования – социально-демографическое положение региона, характеризующееся следующими показателями:

– общий коэффициент рождаемости (‰);

– общий коэффициент брачности (‰);

– удельный вес казахского населения (%);

– удельный вес населения, проживающего в коммунальных квартирах (%);

– удельный вес женщин с одним ребенком (в % к общему числу женщин с детьми).

Фрагмент таблицы с исходными данными в пакете Statistica 7.0 представлен на рисунке 3.1.

 

Рисунок 3.1 – Фрагмент исходных данных для анализа в пакете Statistica

 

Точечное оценивание параметров многомерного нормально распределенного вектора признаков сводится к оценке вектора математических ожиданий и ковариационной матрицы в виде вектора средних значений и выборочной ковариационной матрицы.

Так, воспользовавшись пунктом меню «Statistics», подпунктами «Basic Statistics/Tables», «Descriptive statistics», получим таблицу, представленную на рисунке 3.2, в которой содержатся значения выборочных средних, дисперсий и средних квадратических отклонений для каждого признака.

 

Рисунок 3.2 – Результаты расчета средних значений признаков

 

Для получения выборочной ковариационной матрицы воспользуемся пакетом Excel, надстройкой «Пакет анализа». Необходимо ввести исходные данные в первые пять столбцов таблицы, затем выбрать пункт основного меню «Данные», подпункты «Анализ данных», «Ковариация». Вид экрана представлен на рисунке 3.3.

 

Рисунок 3.3 – Выбор пунктов меню в пакете Excel для получения оценки ковариационной матрицы

 

Далее необходимо заполнить появившуюся на экране форму «Ковариация». В поле «Входной интервал» указываются ячейки с исходными данными, в поле «Интервал вывода» указывается ячейка, с которой начнется вывод результатов. «Метки в первой строке» – флажок, который указывает, содержит ли первая строка названия столбцов или нет. Вид заполненной формы представлен на рисунке 3.4.

 

Рисунок 3.4 – Образец заполнения формы «Ковариация» в пакете Excel

 

После нажатия кнопки «ОК»на листе с исходными данными появятся результаты, представленные на рисунке 3.5.

 

Рисунок 3.5 – Результаты расчета выборочной ковариационной матрицы

в пакете Excel

 

Таким образом, получены точечные оценки параметров многомерного нормально распределенного вектора признаков:

 

– вектор средних значений признаков;

– оценка ковариационной матрицы.

 

Анализируя вектор средних значений признаков, можно сделать следующие выводы:

- общий коэффициент рождаемости в среднем по Оренбургской области составил 16,42‰;

- среднее значение коэффициента брачности равно 9,29‰;

- в среднем на территории Оренбургской области проживает 9,26% казахского населения;

- средний по региону удельный вес населения, проживающего в коммунальных квартирах, составил 0,51%;

- удельный вес женщин с одним ребенком в среднем по Оренбургской области равен 20,37% к общему числу женщин с детьми.

Выборочные значения ковариаций позволяют сформулировать предположения о направлении связи между показателями, так, например, есть основания предполагать, что:

- прямая зависимость существует между общим коэффициентом рождаемости () и общим коэффициентом брачности (), из чего следует, что увеличение уровня брачности влечет за собой рост общего коэффициента рождаемости;

- обратная зависимость наблюдается, например, между общим коэффициентом рождаемости () и удельным весом населения, проживающего в коммунальных квартирах (), т.е. рост удельного веса населения, проживающего в коммунальных квартирах способствует сокращению уровня рождаемости.

Для расчета выборочных значений коэффициентов корреляции для каждой пары признаков необходимо выбрать пункты меню «Statistics», «Basic Statistics/Tables» (рисунок 3.6). В появившейся на экране форме (рисунок 3.7) необходимо выбрать пункт «Correlation matrices» и нажать кнопку «ОК». Далее на форме, представленной на рисунке 3.8, нажать кнопку «One variable list» с целью отбора признаков для анализа.

 

Рисунок 3.6 – Пункты меню для расчета выборочных значений коэффициентов корреляции

 

Рисунок 3.7 – Форма «Basic Statistics/Tables»

 

Рисунок 3.8 – Форма расчета коэффициентов корреляции

 

Для расчета коэффициентов корреляции между каждой парой признаков в окне, представленном на рисунке 3.9, необходимо выбрать все признаки (x1–x5) и нажать кнопку «ОК».

 

Рисунок 3.9 – Окно выбора признаков для оценивания коэффициентов корреляции

 

Затем в форме, представленной на рисунке 3.8, нажать кнопку «Summary: Correlations». Результаты расчета представлены на рисунке 3.10, где по каждой переменной выводится ее среднее значение, стандартное отклонение, а также коэффициенты корреляции, при этом красным выделяются те, гипотеза о незначимости которых отвергается.

 

Рисунок 3.10 – Результаты расчета корреляционной матрицы

 

После выбора переменных для анализа можно уточнить, в какой форме пользователь желает получить информацию. Имеются три варианта вывода информации, которые выбираются нажатием кнопки «Options» в форме, представленной на рисунке 3.8.

Выбор «Display simple matrix (highlight p′s)» в форме, представленной на рисунке 3.11, позволит получить наиболее кратную информацию, в которой приводятся только значения коэффициентов корреляции (рисунок 3.12).

 

Рисунок 3.11 – Выбор различных вариантов вывода информации о коэффициентах корреляции

 

Рисунок 3.12 – Значения коэффициентов корреляции

 

С помощью «Display r, p-levels, and N′s» (рисунок 3.11) можно получить информацию об оценках коэффициентов корреляции, аналогичную предыдущей, но кроме этого приводятся вероятности принятия гипотезы о незначимости коэффициентов (рисунок 3.13).

 

Рисунок 3.13 – Оценки коэффициентов корреляции и вероятности принятия гипотезы о незначимости коэффициентов

 

Выбор «Display detailed table of results» (рисунок 3.11) позволит получитьнаиболее подробную информацию: для каждой переменной выводится ее среднее значение (Mean), стандартное отклонение (Std.Dv), объем выборочной совокупности (N), переменные сгруппированы в пары, для каждой из которых выводится коэффициент корреляции (r(X,Y)), его квадрат (r?), наблюдаемое значение t -статистики (t), предназначенное для проверки гипотезы о незначимости коэффициента, вероятность принятия этой гипотезы (p), а также коэффициенты для линейного уравнения регрессии (рисунок 3.14).

 

Рисунок 3.14 – Значения основных описательных характеристик, коэффициентов корреляции и результаты проверки гипотезы об их незначимости

 

Таким образом, в результате расчетов получена оценка корреляционной матрицы вида:

 

.

 

Анализируя выборочные значения коэффициентов корреляции, есть основания предполагать наличие:

- прямой тесной зависимости между такими парами показателей, как общий коэффициент рождаемости и общий коэффициент брачности (); общий коэффициент рождаемости и удельный вес казахского населения (), а также общий коэффициент брачности и удельный вес казахского населения ();

- прямой заметной связи между удельным весом населения, проживающего в коммунальных квартирах и удельным весом женщин с одним ребенком ();

- обратной заметной зависимости между общим коэффициентом рождаемости и удельным весом женщин с одним ребенком (), а также обратной умеренной связи между общим коэффициентом брачности и удельным весом женщин с одним ребенком ().

Между остальными показателями предположительно наблюдается слабая зависимость.

Поскольку коэффициенты корреляции отражают взаимосвязь между двумя признаками под воздействием всех остальных, то следующим этапом исследования будет оценка связи между парой признаков, очищенной от влияния всех остальных признаков.

Для расчета оценок частных и множественных коэффициентов корреляции необходимо выбрать пункт меню «Statistics», подпункт «Multiple Regression» (рисунок 3.15).

В появившейся форме нажать кнопку «Variables», слева выбрать один признак (например, x1), справа все остальные (например, x2–x5) и нажать кнопку «ОК» (рисунок 3.16).

 

Рисунок 3.15 – Выпор пунктов меню для расчета частных и множественных коэффициентов корреляции

 

Рисунок 3.16 – Выбор исходных признаков для расчета частных и множественных коэффициентов корреляции

 

В появившейся форме, представленной на рисунке 3.17, содержится информация о значении множественного коэффициента корреляции , коэффициента детерминации , а также значение F -статистики, предназначенной для проверки гипотезы о незначимости коэффициента детерминации () и вероятности принятия данной гипотезы ().

 

Рисунок 3.17 – Результаты оценивания множественного коэффициента корреляции и коэффициента детерминации

 

Для расчета оценок частных коэффициентов корреляции на текущей форме (рисунок 3.17) необходимо нажать кнопку «Partial correlations», после чего на экране появится форма с выборочными значениями частных коэффициентов корреляции (, , , ), содержащихся во втором столбце таблицы, представленной на рисунке 3.18.

 

Рисунок 3.18 – Результаты оценивания частных коэффициентов корреляции

, , ,

 

Аналогичным образом рассчитываются оценки остальных частных коэффициентов корреляции (рисунки 3.19-3.21) и множественных коэффициентов корреляции (рисунки 3.22-3.25).

 

Рисунок 3.19 – Результаты оценивания частных коэффициентов корреляции

, ,

 

Рисунок 3.20 – Результаты оценивания частных коэффициентов корреляции

,

 

Рисунок 3.21 – Результаты оценивания частного коэффициента корреляции

 

Таким образом, оценки частных коэффициентов корреляции составили:

 

 

Сравнивая по абсолютной величине оценки коэффициентов корреляции и соответствующих частных коэффициентов корреляции, можно сделать следующие выводы: например, поскольку > , следовательно, такие показатели, как удельный вес казахского населения (), удельный вес населения, проживающего в коммунальных квартирах () и удельный вес женщин с одним ребенком () усиливают взаимосвязь между общим коэффициентом рождаемости () и общим коэффициентом брачности (). Следует отметить, что в данном примере для всех пар признаков оценки коэффициентов корреляции (по абсолютной величине) больше, чем оценки соответствующих частных коэффициентов корреляции.

 

Рисунок 3.22 – Результаты оценивания множественного коэффициента корреляции и коэффициента детерминации

 

Рисунок 3.23 – Результаты оценивания множественного коэффициента корреляции и коэффициента детерминации

 

Рисунок 3.24 – Результаты оценивания множественного коэффициента корреляции и коэффициента детерминации

 

Рисунок 3.25 – Результаты оценивания множественного коэффициента корреляции и коэффициента детерминации

 

Таким образом, оценки множественных коэффициентов корреляции и коэффициентов детерминации составили:

 

 

Следующей задачей корреляционного анализа является проверка значимости характеристик связи (коэффициентов корреляции, частных коэффициентов корреляции и коэффициентов детерминации) на уровне значимости , которая может быть осуществлена двумя способами. Первый способ основан на сравнении наблюдаемого значения статистики с критическим значением, при этом если (для коэффициентов корреляции и частных коэффициентов корреляции), (для коэффициентов детерминации), тос вероятность ошибки 0,05 нулевая гипотеза о незначимости соответствующих характеристик связи отклоняется. Второй способ предполагает сравнение значения вероятности принятия нулевой гипотезы о незначимости характеристики связи (наблюдаемого уровня значимости p) с заранее заданным уровнем значимости , при этом, если , то на 5%-ом уровне значимости нулевая гипотеза отклоняется и делается вывод о статистической значимости соответствующих характеристик связи.

Для проверки значимости коэффициентов корреляции воспользуемся результатами, полученными ранее в формах на рисунках 3.13-3.14. Критическое значение определим с помощью функции Excel СТЬЮДЕНТ.ОБР.2Х (Вероятность;Степени_свободы) (рисунок 3.26).

 

Рисунок 3.26 – Нахождение критического значения для проверки значимости коэффициента корреляции в пакете Excel

 

Учитывая заданный уровень значимости и число степеней свободы , критическая точка принимает следующее значение .

Результаты проверки гипотез о незначимости коэффициентов корреляции представлены в таблице 3.1.

Аналогичным образом на основе информации, представленной на рисунках 3.18-3.21, проверим значимость частных коэффициентов корреляции. При и числе степеней свободы , критическая точка принимает следующее значение (рисунок 3.27). Результаты проверки сведены в таблицу 3.2.

 

Рисунок 3.27 – Нахождение критического значения для проверки значимости частного коэффициента корреляции в пакете Excel

 

Таблица 3.1 – Результаты проверки гипотез о незначимости коэффициентов корреляции

Коэффи-циент корреля-ции Оценка коэффи-циента корреляции Вероятность принятия нулевой гипотезы p Уровень значимости Вывод
0,833 10,098 2,014 0,000 0,05 значим
0,780 8,348 2,014 0,000 0,05 значим
-0,385 2,798 2,014 0,008 0,05 значим
-0,634 5,503 2,014 0,000 0,05 значим
0,721 6,971 2,014 0,000 0,05 значим
-0,299 2,105 2,014 0,041 0,05 значим
-0,493 3,796 2,014 0,000 0,05 значим
-0,154 1,047 2,014 0,301 0,05 незначим
-0,327 2,320 2,014 0,025 0,05 значим
0,613 5,198 2,014 0,000 0,05 значим

 

Таблица 3.2 – Результаты проверки гипотез о незначимости частных коэффициентов корреляции

Частный коэффи-циент коре-ляции Оценка частного коэффи-циента корреляции Вероятность принятия нулевой гипотезы p Уровень значимости Вывод
0,527 4,018 2,018 0,000238 0,05 значим
0,554 4,316 2,018 0,000095 0,05 значим
-0,048 0,310 2,018 0,757760 0,05 незначим
-0,463 3,381 2,018 0,001569 0,05 значим
0,681 6,105 2,018 0,000000 0,05 значим
-0,053 0,347 2,018 0,730438 0,05 незначим
-0,295 2,027 2,018 0,048938 0,05 значим
0,062 0,410 2,018 0,683963 0,05 незначим
-0,298 2,068 2,018 0,044526 0,05 значим
0,612 5,198 2,018 0,000005 0,05 значим

 

Воспользовавшись результатами, полученными на рисунках 3.17, 3.22-3.25, проверим значимость коэффициентов детерминации (таблица 3.3). Критическое значение определим с помощью функции F.ОБР.ПХ(Вероятность;Степени_свободы1;Степени_свободы2) пакета Excel (рисунок 3.28).

 

Рисунок 3.28 – Нахождение критического значения для проверки значимости коэффициента детерминации в пакете Excel

 

Учитывая заданный уровень значимости и число степеней свободы , , критическая точка принимает следующее значение .

 

Таблица 3.3 – Результаты проверки гипотез о незначимости коэффициентов детерминации

Коэффи-циент детерми-нации Оценка коэффициента детерминации Вероятность принятия нулевой гипотезы p Уровень значимости Вывод
0,834 52,670 2,594 0,000000 0,05 значим
0,707 25,326 2,594 0,000000 0,05 значим
0,670 21,303 2,594 0,000000 0,05 значим
0,381 6,454 2,594 0,000384 0,05 значим
0,591 15,197 2,594 0,000000 0,05 значим

 

Следующим этапом корреляционного анализа является построение с вероятностью доверительных интервалов для значимых коэффициентов корреляции и частных коэффициентов корреляции с помощью z -преобразования Фишера.

Рассмотрим пример построения доверительного интервала для статистически значимого коэффициента корреляции , оценка которого составляет .

Осуществим над z -преобразование Фишера , для этого воспользуемся функцией ФИШЕР(X) пакета Excel (рисунок 3.29).

 

Рисунок 3.29 – Осуществление z -преобразования Фишера в пакете Excel

 

Получим . Далее строится доверительный интервал для :

 

,

 

где – квантиль уровня стандартного нормального закона распределения.

Учитывая, что , определим квантиль уровня стандартного нормального закона распределения, воспользовавшись функцией НОРМ.СТ.ОБР(вероятность) пакета Excel (рисунок 3.30).

 

Рисунок 3.30 – Определение квантили стандартного нормального закона распределения в пакете Excel

 

Получили , после чего определим границы доверительного интервала для :

 

или .

 

Для получения доверительного интервала для над левой и правой границами доверительного интервала для осуществим преобразование, обратное z -преобразованию Фишера, для чего воспользуемся функцией ФИШЕРОБР(Y) пакета Excel (рисунки 3.31-3.32).

 

Рисунок 3.31 – Осуществление обратного z -преобразования Фишера для левой границы доверительного интервала в пакете Excel

 

Получили, что нижняя граница доверительного интервала для равна 0,717.

 

Рисунок 3.32 – Осуществление обратного z -преобразования Фишера для правой границы доверительного интервала в пакете Excel

 

Верхняя граница доверительного интервала для равна 0,904. Таким образом, доверительный интервал для имеет вид:

 

.

 

Аналогичным образом строятся доверительные интервалы для остальных статистически значимых коэффициентов корреляции (таблица 3.4) и частных коэффициентов корреляции (таблица 3.5).

 

Таблица 3.4 – Результаты построения доверительных интервалов для значимых коэффициентов корреляции

Нижняя граница доверительного интервала Коэффициент корреляции Верхняя граница доверительного интервала
0,717 0,904
0,635 0,872
-0,605 -0,110
-0,779 -0,424
0,547 0,835
-0,540 -0,013
-0,683 -0,240
-0,562 -0,044
0,394 0,765

 

Таблица 3.5 – Результаты построения доверительных интервалов для значимых частных коэффициентов корреляции

Нижняя граница доверительного интервала Частный коэффициент корреляции Верхняя граница доверительного интервала
0,273 0,712
0,308 0,731
-0,668 -0,193
0,481 0,813
-0,544 0,002
-0,547 -0,001
0,385 0,769

 

Заключительным этапом корреляционного анализа является оценка уравнения регрессии. Исходя из экономических соображений, выберем в качестве результативного признака показатель – общий коэффициент рождаемости. Кроме экономической целесообразности данному показателю соответствует наибольшее выборочное значение коэффициента детерминации (). Остальные признаки:

– общий коэффициент брачности;

– удельный вес казахского населения;

– удельный вес населения, проживающего в коммунальных квартирах;

– удельный вес женщин с одним ребенком;

будут выступать в качестве факторов, оказывающих влияние на общий коэффициент рождаемости.

Для оценки уравнения регрессии на , , , вида

 

 

воспользуемся пунктом меню «Statistics», подпунктом «Multiple Regression» (рисунок 3.15). В появившейся форме, представленной на рисунке 3.16, после нажатия кнопки «Variables», слева выбираем признак x1, справа все остальные x2–x5 и нажимаем кнопку «ОК». Для получения оценки уравнения регрессии на форме, представленной на рисунке 3.17, необходимо нажать кнопку «Summary: Regression results». Вид формы с результатами оценки уравнения регрессии представлен на рисунке 3.33.

 

Рисунок 3.33 – Результаты оценки уравнения регрессии на , , ,

 

Таким образом, оценка уравнения регрессии имеет вид:

 

Уравнение регрессии для признака адекватно выборочным данным (значимо), поскольку значим коэффициент детерминации (таблица 3.3). О значимости коэффициентов уравнения регрессии судят по результатам проверки значимости частных коэффициентов корреляции. Таким образом, среди коэффициентов уравнения регрессии значимыми оказались , , , поскольку значимы соответствующие частные коэффициенты корреляции , , (таблица 3.2).

Таким образом, корреляционно-регрессионный анализ показателей социально-демографического положения региона позволил сделать следующие выводы.

1) В среднем по Оренбургской области общий коэффициент рождаемости составил 16,42‰; общий коэффициент брачности – 9,29‰; в среднем на территории Оренбургской области проживает 9,26% казахского населения; средний по региону удельный вес населения, проживающего в коммунальных квартирах, составил 0,51%; удельный вес женщин с одним ребенком – 20,37% к общему числу женщин с детьми.

2) Анализ коэффициентов корреляции показал, что на 5%-ом уровне значимости статистически значимая тесная прямая зависимость наблюдается между следующими парами признаков: общий коэффициент рождаемости и общий коэффициент брачности (, при этом с вероятностью 0,95 не меньше 0,717 и не больше 0,904), общий коэффициент рождаемости и удельный вес казахского населения (, с вероятностью 0,95 не меньше 0,635 и не больше), а также общий коэффициент брачности и удельный вес казахского населения (, с вероятностью 0,95 не меньше 0,547 и не больше 0,835). Прямая связь заметной силы существует между удельным весом населения, проживающего в коммунальных квартирах, и удельным весом женщин с одним ребенком (, с вероятностью 0,95 не меньше 0,394 и не больше 0,765); обратная зависимость заметной силы – между общим коэффициентом рождаемости и удельным весом женщин с одним ребенком (, с вероятностью 0,95 не меньше -0,779 и не больше -0,424), обратная зависимость умеренной силы – между общим коэффициентом брачности и удельным весом женщин с одним ребенком (, с вероятностью 0,95 не меньше -0,683 и не больше -0,240). Между остальными показателями наблюдается статистически значимая, но сравнительно слабая зависимость; статистически незначимая связь с точки зрения коэффициентов корреляции оказалась между удельным весом казахского населения и удельным весом населения, проживающего в коммунальных квартирах.

3) Сравнивая по абсолютной величине оценки коэффициентов корреляции и соответствующих частных коэффициентов корреляции, можно сделать вывод, что во всех случаях показатели, влияние которых устраняет







Дата добавления: 2015-12-04; просмотров: 232. Нарушение авторских прав; Мы поможем в написании вашей работы!



Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Методы анализа финансово-хозяйственной деятельности предприятия   Содержанием анализа финансово-хозяйственной деятельности предприятия является глубокое и всестороннее изучение экономической информации о функционировании анализируемого субъекта хозяйствования с целью принятия оптимальных управленческих...

Образование соседних чисел Фрагмент: Программная задача: показать образование числа 4 и числа 3 друг из друга...

Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Выработка навыка зеркального письма (динамический стереотип) Цель работы: Проследить особенности образования любого навыка (динамического стереотипа) на примере выработки навыка зеркального письма...

Словарная работа в детском саду Словарная работа в детском саду — это планомерное расширение активного словаря детей за счет незнакомых или трудных слов, которое идет одновременно с ознакомлением с окружающей действительностью, воспитанием правильного отношения к окружающему...

Правила наложения мягкой бинтовой повязки 1. Во время наложения повязки больному (раненому) следует придать удобное положение: он должен удобно сидеть или лежать...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия