Задание 1. 1. Построить вариационный ряд с равными интервалами для «Показателя 1».
1. Построить вариационный ряд с равными интервалами для «Показателя 1». 2. Рассчитать показатели, характеризующие центр группирования вариационного ряда (среднее арифметическое, моду, медиану). 3. Рассчитать показатели вариации (размах, среднее квадратическое отклонение, дисперсию, коэффициент вариации). 4. Рассчитать показатели, характеризующие вид вариационного ряда (асимметричность и эксцесс). 5. Оценить соответствие вариационного ряда нормальному распределению. 6. Для каждой группы определить долю районов в общей численности и доля «Показателя 1» в его суммарном объеме. 7. Построить кривую Лоренца, рассчитать показатели концентрации (коэффициенты Джини, Лоренца, Герфиндаля). 8. Преобразовать полученный вариационный ряд с равными интервалами в равнонаполненный вариационный ряд, содержащий четыре группы. 9. Сделать выводы.
1.1. Построение вариационного ряда с равными интервалами для показателя «Площадь лесного фонда»
Оптимальное количество групп находим по формуле Стерджесса: Построим интервальный ряд распределения районов по площади лесного фонда, образовав 6 групп с равными интервалами. Ширина интервала составит: Получим следующие границы интервалов группировки: Таблица 3 Границы интервалов группировки
Подсчитываем количество районов, попадающих в каждую группу, и строим вариационный ряд распределения. Таблица 4
1.2. Расчет показателей, характеризующих центр группирования вариационного ряда
Определим среднюю площадь лесного фонда, для каждой группы как середину соответствующего интервала. Вычислим накопленные частоты по числу районов: Таблица 5
Среднюю площадь лесного фонда, определим по формуле средней арифметической взвешенной: тыс. га. Моду определим по формуле: где хмо – нижняя граница модального интервала; hмо – величина модального интервала; fмо,fмо-1,fмо+1 – частоты в модальном, предыдущем и следующим за модальным интервалах (соответственно). Модальным интервалом построенного ряда является интервал 1,1-222,6, т.к. он имеет наибольшую частоту (f 1=25). тыс. га. Наиболее часто встречаются районы с площадью лесного фонда, 111,85 тыс. га. Медиана: где хме – нижняя граница медианного интервала; iме – величина медианного интервала; – половина от общей численности частот; Sме -1– накопленная частота до начала медианного интервала; Медианным интервалом является интервал 1,1-222,6, т.к. именно в этом интервале накопленная частота Sj =25 впервые превышает полусумму всех частот . тыс. га. В половине районов с площадью лесного фонда района, менее 142,86 чел., а другая половина – более 142,86 тыс. га.
1.3. Расчет показателей вариации
Дисперсия: где Таблица 6
Средняя величина из квадратов средней площади лесного фонда: Дисперсия будет равна: Среднее квадратическое отклонение: тыс. га. Коэффициент вариации:
1.4. Расчет показателей, характеризующих вид вариационного ряда
Для определения асимметричности AS и эксцесса (крутости) EX вариационного ряда предварительно определим центральные моменты третьего и четвертого порядка: Таблица 7
Центральный момент третьего порядка равен:
Центральный момент четвертого порядка: Показатель асимметрии равен: По полученному значению показателя асимметрии (положительное и незначительно больше нуля), можно утверждать, что данный вариационный ряд обладает высокой правосторонней асимметрией (вытянут вправо).
Показатель эксцесса: Поскольку показатель эксцесса значительно отличается от нуля можно сделать вывод, что данное распределение в значительной степени соответствует нормальному. Положительный знак эксцесса свидетельствует о некотором превышении высоты вершины над нормальным распределением.
1.5. Проверка вариационного ряда на соответствие нормальному распределению
Критерий c2-Пирсона определим по формуле: где fi – эмпирические частоты; – теоретические частоты. Теоретические частоты определим по формуле: где – число наблюдений; – величина интервала в группе; – среднее квадратическое отклонение; – нормированное отклонение вариант от средней арифметической.
Таблица 8
Получили расчетное значение критерия Пирсона: Табличное значение критерия Пирсона при уровне значимости и числе степеней свободы равно: Поскольку существенно больше, чем , то в соответствии с правилом применения критерия Пирсонаследует заключить, что есть отклонения фактического распределения от нормального. Другими словами наблюдаемый вариационный ряд соответствует нормальному распределению с высокой степенью вероятности.
1.6. Определение удельных показателей по группам
Для определения удельных показателей воспользуемся данными о площади лесного фонда по отдельным группам (табл. 5). Результаты вычислений представлены в таблице 9. Таблица 9
Анализ полученных результатов (табл. 9) показывает, что преобладающей по числу входящих в нее районов является первая группа. А преобладающей площади лесного фонда, является также первая группа.
1.7. Построение кривой Лоренца, расчет показателей концентрации
Для построения кривой Лоренца, характеризующей неравномерность распределения, требуется вычислить как кумулятивные итоги (накопленные частоты) по удельному весу по числу районов , так и кумулятивные итоги по удельному весу площади Таблица 10
!!!!!!!!!!!!!!!!! Рис.2. Кривая Лоренца
Коэффициент Джини: Таблица 11
Коэффициент Лоренца: Коэффициент Герфиндаля: Таблица 12
В соответствии с правилами интерпретации значений используемых коэффициентов концентрации все они свидетельствуют о незначительной неравномерности распределения.
1.8. Преобразование ряда с равными интервалами в равнонаполненный
Для образования четырех равнонаполненных групп необходимо разделить всю статистическую совокупность на группы, содержащие 25% от общего количества наблюдений. Такое деление можно произвести после расчета первого Q 1и третьего Q 3квартилей (второй квартиль Q 2равен медиане Me, рассчитанной в п.1.2). С учетом значения второго квартиля чел. получаем равнонаполненный вариационный ряд, приведенный в таблице 13. Таблица 13
Из представленных в табл. 13 данных следует, что наименьший размер интервала, и, следовательно, наибольшая концентрация наблюдений (районов) приходится на первую группу. А наибольший размер интервала, и, следовательно, наименьшая концентрация наблюдений (районов) приходится на четвертую группу.
1.9. Выводы Полученный в результате группировки интервальный вариационный ряд обладает незначительной правосторонней асимметрией и у него практически отсутствует эксцесс. Неравномерность распределения площади лесного фонда по отдельным районам незначительная.
|