Студопедия — Основы группировки данных
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Основы группировки данных






 

Программа разработки предусматривает реализуемые на втором этапе статистического исследования сводку и группировку статистических данных. Эти операции, осуществляемые на основе статистических таблиц, позволяют систематизировать полученные в ходе наблюдения данные, провести обработку и подсчет групповых итогов, расчеты простейших производных величин (статистических коэффициентов, средних величин). На этом же этапе, для повышения наглядности данных, предусматривается использование графических изображений. Иногда (в официальной статистике — почти всегда) на этом заканчивается весь процесс обработки собранных данных.

Группировка — основа статистической разработки (систематизации) первичного материала. Группировка, правильно спланированная на этапе подготовки исследования, позволяет облегчить регистрацию или повысить точность измерений на этапе сбора исходных данных без снижения результативности исследования в целом. Группировка собранной исходной информации определяет весь ход статистического анализа.

В ходе статистической разработки исследователю приходится сталкиваться со следующими вариантами группировок, каждый из которых имеет свои методические особенности:

разделение анализируемой статистической совокупности на группы по тем или иным признакам. С такого рода группировкой приходится сталкиваться уже при подготовке программы сбора и в ходе реализации программы разработки любого исследования;

объединение мелких однородных групп в более крупные. Этот вариант группировки применяется, как правило, уже в процессе статистической обработки данных, если выясняется несостоятельность мелких групп (малое число наблюдений, нечетко выраженный характер распределений и т.п.). Возможность такой группировки целесообразно предусмотреть уже на этапе подготовки программы сбора данных, т.е. обеспечить возможность укрупнения групп в соответствии с общепринятыми границами групп;

комплексная группировка обеспечивает формирование комплексных оценок на основе многих учетных признаков, даже если они разнородны. Такая группировка часто делается на основе специально разрабатываемых алгоритмов или экспертных оценок (по аналогии — постановка диагноза на основе многих симптомов и результатов лабораторных обследований). Такая группировка представляет весьма сложную задачу и нередко сама по себе является самостоятельной целью исследования.

Выделяют следующие основные виды группировки в зависимости от конкретной цели статистического исследования (табл. 1).

Таблица 1

Классификация статистических группировок

Аналитические Структурные Типологические Специальные (балансовые, матричные и т.д.)
Характеризуют взаимосвязи между признаками, проявляют основные тенденции Выявляют состав, структуру обследованных групп Характеризуют основные группы (типы групп признаков) Используются при составлении балансов предприятий и учреждений, отраслей промышленности и т.п.

 

Аналитическая группировка выявляет взаимосвязи между явлениями (признаками их характеризующими). При этом они подразделяются на факторные и результативные. Взаимосвязь проявляется в систематическом изменении результативного признака в связи с изменением факторного. Например: температура тела влияет на частоту пульса, в зависимости от величины роста изменяется вес и т.п.

Структурная группировка выявляет состав, строение однородной в качественном отношении статистической совокупности. Например: состав больных по полу, возрасту, диагнозу и т.п. Сопоставление данных структурной группировки во времени дает представление о структурных сдвигах.

Группировка типологическая — с ее помощью в статистической совокупности выделяются качественно однородные в существенном отношении группы. Например: группы больных с одинаковым диагнозом, с одинаковым исходом заболеваний и т.п.

При статистической разработке материала любого исследования необходимо учитывать существующие правила и стандарты определения группировочных признаков и границ групп (возрастно-половые группировки, группировки по категориям тяжести труда и т.п.). Несоблюдение правил формирования этих группировок ведет к потере ценности данных.

В национальной статистике выделяют следующие возрастно-половые группы (в границах точного возраста):

1) Дети до 3 лет. Эта группа находится под наблюдением детских консультаций и обслуживается детскими яслями. Из них часто выделяются дети в возрасте 1 и 2 года жизни;

2) Дошкольники — дети от 3 до 7 лет. Обслуживаются детскими садами;

3) Дети и подростки школьного возраста от 7 до 13 лет и 13—16 лет;

4) Подростки от 16 до 18 лет;

5) Трудоспособный контингент — мужчины 16—60 лет, женщины 16—55 лет;

6) Лица пенсионного возраста — мужчины 60 лет и старше, женщины 55 лет и старше;

7) Женщины репродуктивного возраста — обычно от 15 до 45 лет.

Иногда для группировки по возрасту используют одногодичные или (для взрослых) пятилетние, реже десятилетние интервалы. Группировка с пятилетним интервалом выглядит следующим образом: до 20 лет, 20—24, 25—29, 30—35 и т.д. С десятилетним интервалом: до 20 лет, 20—29, 30—39 и т.д. При изучении заболеваемости в связи с производственными факторами обычно используются аналогичные 5- и 10-летние интервалы группировок по стажу работы: 1—4 года, 5—9 лет, 10—14 лет и т.д. При этом, к группе 1—4 года относятся лица со стажем от 1 года до 4 лет 11 мес. 29 дней. Аналогично, к группе со стажем от 5 до 10 лет относятся лица, отработавшие от 5 лет до 9 лет 11 мес. и 29 дней.

В ряде случаев целесообразно расчленять отдельные крупные группы на более мелкие. Например: до 20 лет, 20—29, 30—39, 40—44, 45—49, 50—59, 60 и старше.

Группировка данных по своей сути представляет собой принцип классификации, т.е. установление принадлежности явлений и объектов к определенным классам. В государственной статистике для этого используются классификаторы — специальные справочники, инструкции и указатели в виде алфавитных и систематических словарей, дополняемых стандартным перечнем объектов и их групп. Использование классификаторов в официальной статистике является обязательным и имеет силу государственного стандарта. Основные классификаторы рассчитаны на длительное использование. Однако, с течением времени они пересматриваются, дополняются, в них вносятся необходимые коррективы. Так, с 1983 до 1999 года в СССР, а затем в России общепринятой считалась Международная статистическая классификация болезней, травм и причин смерти 9-го пересмотра. С 1999 года была введена классификация 10-го пересмотра (с 01.01.99 г. по Приказу Минздрава России № 3 от 12.01.98 г.).

В медико-биологических научных исследованиях использование государственных и международных классификаторов болезней и причин смерти не является строго обязательным. Однако, только их прямое применение или возможность путем вторичной группировки привести данные исследований в рамки, определяемые общепринятыми классификаторами, гарантирует сопоставимость статистических материалов о заболеваемости, причинах смерти разных категорий населения на различных территориях страны и за рубежом.

 

 

1. Вопросы по теме занятия:

1. Основные этапы научного исследования.

2. Цели, задачи и план исследования.

3. Способы получения исходных данных для исследования.

4. Понятия текущего и единовременного наблюдения.

5. Сплошное и не сплошное исследование. Методы.

6. Виды выборок.

7. Понятия повторной и бесповторной выборки.

8. Оценка численности выборки для доли в случае повторного отбора.

9. Оценка численности выборки для доли в случае бесповторного отбора.

10. Оценка численности выборки для среднего в случае повторного отбора.

11. Оценка численности выборки для среднего в случае бесповторного отбора.

12. Группировка собранной исходной информации.

2. Тестовые задания по теме с эталонами ответов:

1. ПЕРВЫЙ ЭТАП СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ВКЛЮЧАЕТ В СЕБЯ

1) анализ результатов

2) вычисление первичных итогов

3) определение целей и задач, составление плана исследо­вания

4) углубленную математико-статистическую обработку данных

 

2. ПО ОХВАТУ СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ ИССЛЕДОВА­НИЕ МОЖЕТ БЫТЬ

1) сплошное или единичное

2) сплошное или не сплошное

3) не сплошное или выборочное

4) первичное или вторичное

 

3. КО ВТОРОМУ ЭТАПУ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ОТ­НОСИТСЯ

1) анализ полученных результатов, выводы

2) наблюдение, сводка и группировка полученных статис­тических материалов

3) определение целей и задач

4) углубленная математико-статистическая обработка данных

 

4. ПРИЗНАКИ, ПОДЛЕЖАЩИЕ РЕГИСТРАЦИИ В ХОДЕ СТАТИСТИЧЕС­КОГО ИССЛЕДОВАНИЯ, НАЗЫВАЮТСЯ

1) количественные

2) учетные

3) качественные

4) случайные

 

5. УЧЕТНЫЕ ПРИЗНАКИ ПО ВИДУ МОГУТ БЫТЬ

1) качественные или количественные

2) первичные или факторные

3) результативные или вторичные

4) вероятные или достоверные

 

6. ПО РОЛИ В СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ УЧЕТНЫЕ ПРИЗ­НАКИ МОЖНО ПОДРАЗДЕЛИТЬ НА

1) достоверные и невозможные

2) первичные и вторичные

3) качественные и вероятные

4) факторные и результативные

 

7. СБОР ДАННЫХ ПРИ ПЕРЕПИСЯХ НАСЕЛЕНИЯ ОТНОСИТСЯ К НАБЛЮДЕНИЮ

1) текущему

2) единовременному

3) случайному

4) математическому

 

8. ИССЛЕДОВАНИЕ, ПРЕДПОЛАГАЮЩЕЕ РЕГИСТРАЦИЮ ВСЕХ СЛУ­ЧАЕВ, СОСТАВЛЯЮЩИХ ГЕНЕРАЛЬНУЮ СОВОКУПНОСТЬ, НАЗЫ­ВАЕТСЯ

1) первичным

2) случайным

3) выборочным

4) сплошным

 

9. СОВОКУПНОСТЬ, СОСТОЯЩАЯ ИЗ ОТНОСИТЕЛЬНО ОДНОРОДНЫХ ЭЛЕМЕНТОВ, ОБЪЕДИНЕННЫХ НАСТУПЛЕНИЕМ ОПРЕДЕЛЕН­НОГО ПРИЗНАКА, НАЗЫВАЕТСЯ

1) группой

2) когортой

3) классом

4) выборкой

 

10. ОШИБКИ, СВЯЗАННЫЕ С НЕПРАВИЛЬНЫМ ВЫБОРОМ ОБЪЕКТА ИССЛЕДОВАНИЯ, ИСПОЛЬЗОВАНИЕМ НЕПРАВИЛЬНЫХ ГРУППИ­РОВОК, НАЗЫВАЮТСЯ

1) методические

2) логические

3) математические

4) статистические

 

11. ОШИБКИ, ЗАКЛЮЧАЮЩИЕСЯ В НЕОБОСНОВАННОМ ИСПОЛЬЗО­ВАНИИ РАЗЛИЧНЫХ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ И ПРИВО­ДЯЩИЕ К ИСКАЖЕНИЮ СУЩНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДО­ВАНИЯ, НАЗЫВАЮТСЯ

1) логические

2) статистические

3) математические

4) методические

 

12. ЧЕТВЕРТЫЙ ЭТАП СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ВКЛЮ­ЧАЕТ В СЕБЯ

1) анализ полученных результатов, выводы

2) определение целей и задач

3) вычисление первичных итогов

4) углубленная математико-статистическая обработка данных

 

13. ВЫБОР ОБЪЕКТА И ЕДИНИЦЫ НАБЛЮДЕНИЯ, А ТАКЖЕ УЧЕТ­НЫХ ПРИЗНАКОВ, ПОДЛЕЖАЩИХ РЕГИСТРАЦИИ В ХОДЕ ИС­СЛЕДОВАНИЯ, ВКЛЮЧАЕТ В СЕБЯ

1) план исследования

2) схему исследования

3) шаблон исследования

4) программу исследования

 

14. ДИАГНОЗ ЗАБОЛЕВАНИЯ – ЭТО ПРИЗНАК

1) статистический

2) случайный

3) количественный

4) качественный

 

15. ПРИЗНАК, ИЗМЕНЯЮЩИЙ СВОЕ ЗНАЧЕНИЕ ПОД ВЛИЯНИЕМ ДРУГОГО, СВЯЗАННОГО С НИМ, НАЗЫВАЕТСЯ

1) первичный

2) факторный

3) результативный

4) вторичный

 

16. РЕПРЕЗЕНТАТИВНОСТЬ, ОПРЕДЕЛЯЕМАЯ ЧИСЛОМ НАБЛЮДЕ­НИЙ, ГАРАНТИРУЮЩИМ ПОЛУЧЕНИЕ СТАТИСТИЧЕСКИ ДОСТО­ВЕРНЫХ ДАННЫХ, НАЗЫВАЕТСЯ

1) количественная

2) качественная

3) математическая

4) статистическая

 

17. СТРУКТУРНОЕ СООТВЕТСТВИЕ ВЫБОРОЧНОЙ И ГЕНЕРАЛЬНОЙ СОВОКУПНОСТЕЙ – ЭТО РЕПРЕЗЕНТАТИВНОСТЬ

1) статистическая

2) количественная

3) качественная

4) математическая

 

18. ВЫБОРКА, В КОТОРУЮ КАЖДЫЙ ЭЛЕМЕНТ ГЕНЕРАЛЬНОЙ СО­ВОКУПНОСТИ ИМЕЕТ ИЗВЕСТНУЮ И РАВНУЮ ВЕРОЯТНОСТЬ ОТБОРА, НАЗЫВАЕТСЯ

1) стратифицированной

2) простой случайной

3) систематической

4) кластерная

 

19. В СЛУЧАЕ, КОГДА СОВОКУПНОСТЬ ДЕЛИТСЯ НА ПОДГРУППЫ, А ЗАТЕМ ИЗ КАЖДОЙ ПОДГРУППЫ СЛУЧАЙНЫМ ОБРАЗОМ ВЫБИ­РАЮТСЯ ЭЛЕМЕНТЫ, ТО ТАКАЯ ВЫБОРКА НАЗЫВАЕТСЯ

1) систематическая

2) простая случайная

3) стратифицированная

4) кластерная

Эталоны ответов к тестовым заданиям:

вопрос                    
ответ                    
вопрос                    
ответ                    

 







Дата добавления: 2014-10-22; просмотров: 701. Нарушение авторских прав; Мы поможем в написании вашей работы!



Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Особенности массовой коммуникации Развитие средств связи и информации привело к возникновению явления массовой коммуникации...

Тема: Изучение приспособленности организмов к среде обитания Цель:выяснить механизм образования приспособлений к среде обитания и их относительный характер, сделать вывод о том, что приспособленность – результат действия естественного отбора...

Тема: Изучение фенотипов местных сортов растений Цель: расширить знания о задачах современной селекции. Оборудование:пакетики семян различных сортов томатов...

Типология суицида. Феномен суицида (самоубийство или попытка самоубийства) чаще всего связывается с представлением о психологическом кризисе личности...

ОСНОВНЫЕ ТИПЫ МОЗГА ПОЗВОНОЧНЫХ Ихтиопсидный тип мозга характерен для низших позвоночных - рыб и амфибий...

Принципы, критерии и методы оценки и аттестации персонала   Аттестация персонала является одной их важнейших функций управления персоналом...

Studopedia.info - Студопедия - 2014-2024 год . (0.013 сек.) русская версия | украинская версия