Студопедия — ББК 60.6я73
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

ББК 60.6я73






 

Скобелина В.П.

С44. Статистика: Учеб. пособие для самостоятельной работы студентов / В.П.Скобелина, Ю.В.Любек, Е.Г.Катышева. Санкт-Петербургский государственный горный институт (технический университет). СПб, 2005. 73 с.

ISBN 5-94211-154-5

 

УДК 311(075.80)

ББК 60.6я73

 

 

ISBN 5-94211-154-5 Ó Санкт-Петербургский горный институт им. Г.В.Плеханова, 2005 г.

 

 

ВВЕДЕНИЕ

 

Статистика – общественная наука, но от других общественных наук ее отличает то, что любое общественно значимое явление оценивается количественно.

В связи с этим статистика как наука должна отвечать следующим требованиям:

1. Изучение общественных явлений в статистике должно быть нацелено не только на познание качественной сущности, но и на исследование количественной стороны, т.е. изучение количественной стороны явлений должно выполняться в неразрывной связи с его качественной характеристикой. В начале выявляется общая сущность явлений, а затем дается количественная оценка этой сущности. Такое изучение общественных явлений многостадийно и циклично, при этом важно выделить стадию и конец цикла, когда изменения количественной стороны явления приводят к измененению его качественных сторон. В процессе статистического исследования новое качество регистрируется как в пределах изучаемого объекта (статистической совокупности), так и в среде, формирующей условия функционирования (существования) объекта как элемента общественного производства.

2. Статистика должна изучать общественное явление в их взаимосвязи и с учетом воздействия природной среды.

3. Количественную сторону общественных явлений статистика должна изучать в конкретных пространственных и временных границах. Показатель привязан либо к периоду, либо к территории и т.д.

Таким образом, результатом статистического изучения явлений должны быть обобщающие статистические показатели (ОБС) – количественные характеристики одного из свойств или сторон общественных явлений, взятых в определенных границах пространства и времени. Формирование этих показателей возможно при соблюдении следующих принципов:

1) изучаемое явление должно иметь массовый характер;

2) для расчета ОБС должны быть выбраны существенные признаки, а их число должно быть ограничено по соображениям целесообразности;

3) показатели должны отражать тенденции изменения изучаемого явления;

4) показатели должны быть универсальны (применимы в разных спектрах, областях и т.д.).

Итак, статистика изучает массовое общественное явление в определенных временных и пространственных границах на основе формирования и использования статистических обобщающих показателей.

 

 

1. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ.

Классификация признаков явлений

 

Статистическое наблюдение – это первая и важнейшая стадия статистического исследования, во время которой производится научно организованный и систематический отбор массового материала, характеризующего явления и процессы общественной жизни, с целью получения необходимых данных для расчета статистических обобщающих показателей. С учетом изложенного статистическое наблюдение должно удовлетворять ряду условий:

1. Собранные сведения должны быть полными, а не случайными и отрывочными. Полноту данных можно обеспечить полнотой пространственного охвата (полный охват единиц изучаемой совокупности), полнотой охвата сторон явления (полный охват всех существенных признаков изучаемых явлений) и полным охватом во времени. Однако на практике реализация подобных требований или затруднительна, или невозможна. Поэтому проведение статистического наблюдения допускает ряд ограничений, которые, однако, не снижают качества статистических наблюдений:

· для полноты охвата в пространстве достаточно учесть генеральную часть совокупности, которая характеризуется либо представительностью числа единиц в совокупности, либо их долей в объеме качества по изучаемому признаку;

· для полноты охвата сторон явления можно ограничиться небольшим числом (от шести до восьми) наиболее существенных признаков;

· для полноты охвата во времени период наблюдения должен быть кратным числу циклов изменений исследуемого явления, при этом он должен учитывать экстремальные (минимальные и максимальные) значения изучаемого признака.

2. Собранная в процессе статистического наблюдения информация должна быть достоверной и точной. Точность зависит от масштаба учета явлений и от размерности цифровых показателей.

3. Статистический материал, собранный в разное время, должен быть приведен к единообразной и сопоставимой форме, т.е. содержать одни и те же элементы.

4. Статистическая информация должна поступать к пользователю своевременно.

С точки зрения характеристики состояния исследуемых явлений признаки подразделяются на атрибутивные, различие которых у отдельных единиц совокупности нельзя выразить численно, и количественные, которые у отдельных единиц объекта различаются по величине.

Количественные признаки могут быть прерывными (дискретными) и непрерывными. Прерывные признаки принимают определенные целочисленные значения, а непрерывныемогут быть охарактеризованы любым числом. Кроме того, различают прямые и косвенные количественные признаки. Прямые признаки оценивают состояние и изменение явлений непосредственно. Признаки, которые сказываются на состоянии (или изменении) явления посредством других признаков, опосредовано, называют косвенными. Их воздействие может быть немедленным или отдаленным во времени, ослабленным.

Признаки делятся на функциональные и факториальные. Функциональные это признаки, изменение которых зависит от других признаков, действие которых может быть зафиксировано аналитической формулой. Каждый из признаков, влияющих на функциональный, является факториальным.

В зависимости от целей анализа одни и те же признаки могут выступать в качестве и функциональных, и факториальных.

Кроме того, среди признаков выделяют существенные и наиболее существенные, а также несущественные. Следует помнить, что атрибутивные признаки всегда существенные; из количественных признаков к существенным относятся признаки производственно-логических связей и в меньшей степени производственно-технологических связей.

 

 

2. СВОДКА И ГРУППИРОВКА

 

Сводка. В результате статистического наблюдения получают сведения о единице наблюдения. Чтобы перейти от частных значений признаков к значениям по их совокупности, необходимо обобщить единичные данные, превратив их в статистические данные, т.е. выполнить сводку. Техническая сторона процесса сводки – подведение итогов по частям совокупности и в целом по ней. Вместе с тем грамотно выполненная сводка представляет собой теоретическое обобщение статистических данных, начальный этап образования статистических показателей.

В основе процесса сводки лежит анализ и синтез.

Статистический анализ – это изучение явления посредством выделения его сторон, существенных или зависимых. Анализ нацелен на изучение основных признаков, но при этом сфера исследования обобщающих признаков выходит за рамки изменения совокупности. Чтобы перейти от колебаний отдельных признаков к характеристике изменчивости всей совокупности, нужен синтез, т.е. рассмотрение общего качества. При этом анализ будет качественным, если сводка будет выполнена так, чтобы итоги были подведены по нужным для анализа уровням.

Перед проведением сводки оценивается полнота, достоверность и сопоставимость подлежащего обработке исходного материала.

С организационной точки зрения сводка может быть централизованной и децентрализованной. Первая необходима для подведения итогов крупных специальных обследований. В этом случае весь материал концентрируется в организации, проводящей обследование. Децентрализованная сводка выполняется в два этапа: на первом материалы обобщаются в пределах компании (объединения), на втором этапе агрегированные характеристики обрабатываются и конкретизируются заказавшей обследование организацией.

Группировка. Сведение статистического материала в группы, качественно однородные по одному или нескольким признакам, называется группировкой. Содержательная сторона группировки зависит от задачи, которая решается с ее помощью. Соответственно в основе классификации группировки лежат три задачи.

· Расчленение множества однородных явлений на социально-экономические типы, классы, однокачественные группы или статистические совокупности. Решение этой задачи сопряжено с разделением более крупных категорий на их составные элементы. Обратное решение этой задачи позволяет переходить от отдельных элементов к категориям.

· Выявление внутреннего строения или структуры типа, класса, однокачественной группы.

· Установление связей и зависимостей между явлениями и их признаками внутри изучаемой совокупности, а также выявление факторов развития явлений. Решение данной задачи возможно как при заранее известном характере связи между наблюдаемыми признаками, так и при неопределенности связи.

Группировка выполняется в несколько стадий. На первой важно отобрать группировочный признак. Им должен быть существенный признак из числа заданных. Если в числе заданных есть атрибутивный признак, то именно он становится группировочным признаком. Если группировочных признаков несколько (если признаки атрибутивные, их должно быть не меньше двух), группировка выполняется в несколько стадий.

Группировку по первому признаку называют первичной, а группировку по всем другим признакам – вторичной.

Группировка проводится или по одному или по нескольким взаимосвязанным признакам. Во втором случае выполняется процедура расчета функционального признака по заданным факториальным. Этот функциональный признак будет играть роль группировочного. Группировка должна осуществляться после выполнения сводки, которая, и это следует помнить, возможна только по количественным объемным признакам. Качественные признаки не подлежат сводке (качественный признак всегда есть результат деления объемного или количественного признака на другой объемный признак или на собственную базу).

Результат сводки – вертикальный столбец цифр, записанных беспорядочно. Он замкнут границами уровня выполнения сводки. Для выполнения группировки этот материал должен быть упорядочен (записан в нарастающем или убывающем порядке). Нарастание или убывание определяется тенденцией изменения данного признака (например, себестоимость снижается, производительность труда увеличивается). Такой ряд чисел называется вариационным. Его элементы – числа (уровни ряда). Ряды бывают дискретными(уровень задан одним числом) и интервальными. Дискретные ряды являются исходным материалом выполнения группировки, а интервальные – ее результатом.

 

 

3. Ряды распределения

 

Группировка, содержащая всего два элемента: перечень групп и число единиц, входящих в каждую группу, – называется рядом распределения. Соответственно ряды распределения чаще всего являются результатом группировки.

Ряды распределения бывают первичными и вторичными. К первичнымотносятся упорядоченные (или вариационные) ряды по данным статистического наблюдения. Эти ряды характеризуются дискретной записью уровней и небольшими частотами (часто они равны единице). Вторичныеряды обязательно являются результатом группировки по количественному признаку. Эти ряды могут быть интервальными и смешанными. У интервальных рядов уровень ряда – интервал, у смешанных – интервалы чередуются с дискретным значением уровня. Частоты таких рядов распределяются по уровням неравномерно. Характер распределения частот определяет качество группировки, ее надежность.

Для вторичных рядов кроме частот определяются частости, т.е. частоты, выраженные в долях или процентах к объему ряда (сумме единиц ряда). Интервальные вторичные ряды могут иметь равные или неравные интервалы.

Интервальные ряды распределения – это непосредственный результат группировки, так как каждый интервал цифр в нем – это объем признака, характеризующий определенный объем качества.

Интервальный ряд распределения характеризуют следующие элементы:

· уровни ряда (варианты) – интервальные значения признака;

· частота – число единиц совокупности, соответствующее данному уровню;

· частость – частота в относительном измерении, т.е. частота, отнесенная к объему ряда, где объем ряда – число единиц изучаемой совокупности. Сумма всех частостей равна соответственно единице или 100 %. Равномерность распределения признака в исследуемой совокупности определяется значениями частот или частостей;

· плотность распределения признака – удельная частота в пределах интервала; отношение частоты (частости) к величине интервала. Необходимость в расчете этого показателя возникает в рядах с неравными интервалами, так как колебания объемов признака по уровням качества как правило не характеризуется пропорциональной зависимостью.

Формирование равных интервалов предполагает достаточно однородную совокупность по изучаемому признаку с медленным нарастанием или убыванием последнего. Во всех остальных случаях формируются неравные интервалы.

Независимо от величины интервала группировку начинают с выделения равных интервалов, а затем переходят к неравным.

Построение ряда с равными интервалами предполагает наличие вариационного ряда по группировочному признаку. Построение искомого ряда включает следующие операции:

· определение размаха ряда – разности между крайними значениями ряда Х maxX min;

· обоснование числа групп вторичного ряда распределения n, которое зависит от объема выборки. Эта зависимость имеет опытно-статистический характер, применяется в зависимости от сферы изучаемого явления и декларируется специальными статистическими таблицами;

· определение величины интервала

;

· построение интервалов прибавлением к минимальному значению признака : X min + D i = X 1. Таким образом, последовательно получаем интервалы [ X minX 1], [ X 1X 2] = [ X 1 – (X 1 + D i)] и т.д., пока не придем к максимальному значению признака.

Параметры ряда i и n взаимосвязаны: чем больше длина интервала, тем меньше интервалов. Число интервалов зависит от объема выборки, размаха и некоторых других характеристик ряда. В зависимости от объема выборки N можно принимать следующее число интервалов n:

 

N До 10 До 10-30 30-100 100-500 500-3000 Более 3000
n   3-4 4-8 8-9 9-13 13-18
 

Построение интервального ряда завершается распределением единиц совокупности по выделенным интервалам.

После того, как найдены частоты интервального ряда, строится их график, причем по оси абсцисс откладывают интервальные значения признака, а по оси ординат – частоты. Если полученный график близок к прямой или параболе, группировку можно заканчивать, она качественна. Для рядов с неравными интервалами данный график будет точнее, если вместо частот использовать плотность распределения.

Построению рядов с неравными интервалами предшествует анализ динамики признака по совокупности и регистрация моментов накопления объема признака. Совмещение этих двух направлений анализа сопровождается обычно вторичной группировкой. При первичной группировке этот процесс возможен только путем построения интервального ряда с равными интервалами.

Таким образом, процедура первичной группировки выглядит следующим образом:

1. Формируется ряд (с равными интервалами) на базе ряда распределения.

2. Выполняется графическая проверка полученного результата. График строится следующим образом: по оси абсцисс откладывают интервалы ряда с регистрацией их средних, по оси ординат – частоты (частости). Точки графика получают на пересечении срединных значений уровней ряда и соответствующих ординат.

3. Проводится анализ полученного графика посредством построения линии тренда. Если линия тренда представляет собой прямую линию или параболическую кривую (второго порядка), то полученные результаты являются достаточно надежными (качественными) и группировку можно закончить. Если линия тренда представлена гиперболической или синусоидальной кривой, то результаты группировки нельзя признать надежными и процедуру следует продолжить. Как правило, последующие стадии группировки заканчиваются построением рядов с неравными интервалами.

4. Осуществляется процедура проверки рядов с неравными интервалами:

1) по исходным данным определяется плотность распределения признака в пределах интервала по единицам совокупности;

2) строится график, в котором по оси абсцисс откладывают интервалы ряда с регистрацией середины; по оси ординат – плотность распределения;

3) проводится анализ полученного результата.

Кроме того, результатами группировки могут быть смешанные ряды, когда одни уровни представлены интервальными значениями, а другие – дискретными (геостатистика, гидрометеорологические исследования).

 

 

4. Графическое изображение

рядов распределения

 

Любой ряд распределения может быть представлен в виде статистического графика. При этом по оси ординат показываются частоты (частости, плотности распределения), по оси абсцисс – значения признаков.

Построение статистических графиков отличается от построения математических рядом особенностей:

1. Для большей наглядности допускаются разные масштабы по осям координат.

2. Статистические графики могут быть уровневыми и интегральными. Уровневые замыкаются числом или пределами частот, что позволяет комплектовать уровневые статистические графики взаимосвязанных показателей на одном листе.

3. Статистические графики могут строиться как в абсолютном, так и в относительном измерении (по признаку). Последние предпочтительнее для функциональных признаков.

4. Интегральные статистические графики предполагают суммирование не только значений признака, но и частот. При этом возможно полное суммирование последних или их суммирование в ограниченных пределах (интервалах).

5. Статистические графики в зависимости от цели исследований читаются слева направо (прямой порядок) и справа налево (обратный порядок).

6. Статистический график всегда ломаная линия или диаграмма.

 

 

4.1. Уровневые графики

(гистограмма, полигон распределения)

Для таких графиков важно соблюдать два правила их построения:

1. Количественное значение группы должно следовать за изменением количественной характеристики признака (распространение признака по оси абсцисс первично).

2. При равных интервалах признака по оси ординат откладываются частоты, при неравных – плотность распределения.

Характерными представителями уровневых графиков являются гистограмма (рис.1) и полигон распределения.

Для общего вида гистограммы характерно следующее:

· предельная высота ограничена максимальной частотой, максимальной частостью или плотностью распределения;

· гистограмма характеризует не только интервалы распределения признака (основания прямоугольников), но и распределение объема признака для тех или иных интервалов (площадь прямоугольника);

· вид линии, ограничивающей гистограмму сверху, определяет ресурсы по объему признака;

· вся площадь прямоугольника S по максимальной высоте гистограммы для всего распределения признака характеризует матрицу объема признака.

Гистограмма наглядно иллюстрирует распределение признака, причем двояко:

· долей площади каждого прямоугольника

;

· матрицей , где S – площадь матрицы.

Гистограмма показывает как изменяется объем признака. Для оценки изменений площади соседних прямоугольников суммируются (возможно нарастающим итогом) и эта сумма относится к общему объему признака (сумме площадей всех прямоугольников).

Правильно построенная гистограмма (в пределах установленных масштабов) позволяет выделить генеральную совокупность по объему признака прямым или обратным порядком. Прямой порядок выделения генеральной совокупности сопряжен с нарастающей динамикой объема признака (S 1 + S 2 + S 3 + S 4), обратный (S 4 + S 3 + + S 2 + S 1) – с убывающей.

Построить гистограмму можно только для интервального ряда распределения, и в этом состоит специфичность гистограммы.

Более универсальным является второй вид уровневого графика – полигон распределения. В дискретных рядах каждому определенному значению признака соответствует своя частота (частость), что отражается на оси абсцисс точками, а не интервалами, а по оси ординат – целыми значениями частоты или дробными частости. В этом случае полигон распределения будет представлен ломаной линией.

Для интервального ряда получение полигона распределения предполагает соединение середин верхней линии гистограммы.

Для смешанного ряда построение полигона распределения предполагает соединение середин верхних линий гистограмм с высотой дискретного значения признака.

Если есть возможность закодировать цифрами стандартную номенклатуру по атрибутивному признаку, то эти цифры могут быть зарегистрированы на оси абсцисс, и это позволит построить полигон распределения (так называемый кодовый полигон распределения).

Универсальность этих графиков снижает их потенциальные возможности по сравнению с гистограммами. Полигон также характеризует распределение признака, но не так конкретно, как гистограмма (затруднен процесс расчета всех площадей). Изменение объема признака регистрируется в целом и нарастающим итогом, поэтому полигон распределения не позволяет выделить генеральную совокупность.

Тем не менее, полигон распределения регистрирует точку или момент перехода количества в качество в процессе нарастания объема признака.

 

 

4.2. Интегральные графики

 

Интегральные графики в экономике представлены главным образом кумулятами. Общей особенностью построения кумулят является накопление не только признака, но и частот по абсциссе и ординате. Различают следующие виды кумулят: полная и неполная; восходящая (прямая) и убывающая (обратная).

Кумуляты аналогичны по виду полигона распределения, а поэтому применимы для всех вариантов рядов распределения.

Полные кумуляты строятся для всех рядов с полным нарастанием частот (без ограничений). Неполные кумуляты строятся и для интервальных рядов, и для смешанных. Первые формируются либо в пределах всего ряда, либо учитываются только характерные группы интервалов (выделенные по минимальному, серединному или максимальному значению интервала), вторые – в пределах всего ряда, но учитываются не все частоты, а только те, которые выше установленного регламента.

Пример. По геологически однородному участку золотой россыпи получены следующие результаты опробования (447 проб):

 

Содержание, г/т   0-0, 1 0, 1-1 1-2 2-3 3-5 5-10 10-20  
Число проб                  
                   
Содержание, г/т 18, 7 18, 8 19, 4 19, 9   29, 5 47, 1   193, 4
Число проб                  
 

Определить критическое содержание* золота в пробе, полностью учитываемое при подсчете запасов по этому участку (избыточное содержание будет отнесено к запасам всего месторождения). Установить кондиции для балансовых и забалансовых запасов. Оценить достоверность графиков для подсчета категории запасов.

Решение. Все эти задачи можно решить графически путем построения двух полных кумулят: прямой и обратной. Построение кумулят требует проведения предварительной очистки данных от ложных («грязных») проб, а также обоснования критического содержания по отношению к среднему. Примем, что критическое содержание выше среднего в 10 раз. Кроме того, необходимо выделить ураганные пробы, в которых содержание выше критического.

Необходимую информацию и результаты расчетов сведем в таблицу, где столбцы 1 и 3 содержат исходную информацию, а остальные – расчетную (полужирным шрифтом выделены искомые значения).

 







Дата добавления: 2014-11-12; просмотров: 587. Нарушение авторских прав; Мы поможем в написании вашей работы!



Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

Типология суицида. Феномен суицида (самоубийство или попытка самоубийства) чаще всего связывается с представлением о психологическом кризисе личности...

ОСНОВНЫЕ ТИПЫ МОЗГА ПОЗВОНОЧНЫХ Ихтиопсидный тип мозга характерен для низших позвоночных - рыб и амфибий...

Принципы, критерии и методы оценки и аттестации персонала   Аттестация персонала является одной их важнейших функций управления персоналом...

Лечебно-охранительный режим, его элементы и значение.   Терапевтическое воздействие на пациента подразумевает не только использование всех видов лечения, но и применение лечебно-охранительного режима – соблюдение условий поведения, способствующих выздоровлению...

Тема: Кинематика поступательного и вращательного движения. 1. Твердое тело начинает вращаться вокруг оси Z с угловой скоростью, проекция которой изменяется со временем 1. Твердое тело начинает вращаться вокруг оси Z с угловой скоростью...

Условия приобретения статуса индивидуального предпринимателя. В соответствии с п. 1 ст. 23 ГК РФ гражданин вправе заниматься предпринимательской деятельностью без образования юридического лица с момента государственной регистрации в качестве индивидуального предпринимателя. Каковы же условия такой регистрации и...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия