Студопедия — Предварительная математическая обработка статистических данных
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Предварительная математическая обработка статистических данных






После получения результатов эксперимента для дальнейшего их анализа проводится упорядочение данных, их графическое представление и расчет основных числовых характеристик.

Наблюдаемые значения исследуемого признака Х называют вариантами и обозначают , числа их наблюдений называют частотами и обозначают Общее число наблюдений называют объёмом выборки и обозначают n,

Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом. К характеристикам вариационного ряда относятся:

1) Размах варьирования R — это разность между наибольшим и наименьшим значениями, ;

2) Мода Мо — это варианта, имеющая наибольшую частоту;

3) Медиана Ме — это варианта, делящая вариационный ряд пополам по числу вариант.

Статистическим распределением выборки называют множество вариант и соответствующих им частот. Обычно статистическое распреде-ление выборки представляют в виде таблицы:

 

Эмпирической функцией распределения называется числовая функция , определяющая относительную частоту события Она вычисляется по формуле:

(1)

где — сумма частот вариант, значения которых меньше х, n — объём выборки.

является неубывающей функцией, значения которой принадлежат отрезку . служит оценкой теоретической функции распределения , определяющей вероятность события

Основными графическими формами представления данных наблюдений являются полигон частот и гистограмма.

Полигоном частот называется ломаная линия, звенья которой соединяют точки с координатами , , …, .

Гистограммой называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат интервалы одинаковой длины h, а высотами — плотности интервальных частот .

Основными характеристиками выборки являются:

1) Выборочная средняя , вычисляется по формуле:

. (2)

2) Выборочная дисперсия , вычисляется по формуле:

. (3)

3) Исправленная дисперсия , вычисляется по формуле:

(4)

4) Выборочное среднее квадратическое отклонение , вычисляется по формуле:

(5)

5) Исправленное среднее квадратическое отклонение s, вычисляется по формуле:

(6)

6) Коэффициент вариации V, вычисляется по формуле:

. (7)

Перечисленные характеристики относятся к точечным оценкам, при малых объёмах выборки предпочтительнее пользоваться интервальными оценками.

Доверительным интервалом для параметра , точечной оценкой которого является , называют интервал , содержащий с заданной вероятностью значение параметра , называют надежностью оценки.

Например, в случае нормально распределённой случайной величины доверительный интервал для среднего значения при неизвестном параметре определяется формулой:

(8)

где t — критическая точка распределения Стьюдента с степенями свободы для двусторонней области на уровне значимости определяется по таблицам, например в .

Пример. Статистическая обработка результатов измерений (вычисления выполнять с точностью до двух знаков после запятой)

Даны результаты измерений значений случайной величины Х. Составить статистическое распределение выборки и найти:

а) характеристики вариационного ряда: размах варьирования, моду, медиану;

б) эмпирическую функцию распределения и построить ее график;

в) построить полигон частот и гистограмму;

г) выборочную среднюю;

д) выборочную и исправленную дисперсии;

е) выборочное и исправленное средние квадратические отклонения

(стандарт);

ж) коэффициент вариации (%);

з) доверительный интервал для среднего значения признака Х с надежностью =0,95;

12; 9; 16; 17; 10; 9; 15; 12; 15;16; 20; 18; 17; 9; 15; 9; 16; 9; 18; 16

Составим статистическое распределение выборки. Для этого расположим варианты в порядке возрастания:

9; 9; 9; 9; 9; 10; 12; 12; 15; 15; 15; 16; 16; 16; 16; 17; 17; 18; 18; 20

и подсчитаем числа наблюдений каждой варианты — частоты. Получим:

               
               

а) Размах варьирования мода Мо =9; объём выборки n =20, поэтому середина вариационного ряда находится между 10-й и 11-й вариантами в упорядоченном вариационном ряду, и медиана вычисляется как их среднее арифметическое, Ме = (15+15)/2=15.

б) Эмпирическую функцию распределения найдём по формуле (1):

;

;

;

;

;

;

;

;

Построим график (рис. 1)

Рис. 1

в) Построим полигон частот (рис. 2). Для этого по оси отложим наблюдаемые значения , а по оси частоты . Отметим точки с координатами и соединим их последовательно отрезками прямых.

Рис. 2

Для построения гистограммы разобьём интервал изменения x (9,20) на два интервала одинаковой длины h =5,5, подсчитаем интервальные частоты и плотности интервальных частот. Результаты внесём в таблицу 1.

Таблица 1

интервалы Интервальные частоты Плотности интервальных частот
  16/11
  24/11

Построим гистограмму (рис. 3).

Рис. 3

г) Вычислим выборочную среднюю по формуле (2):

.

д) Вычислим выборочную дисперсию формуле (3):

.

Исправленную дисперсию найдём по формуле (4):

е) Выборочное и исправленное средние квадратические отклонения найдём по формулам (5) и (6):

ж) Коэффициент вариации вычислим по формуле (7):

з) Доверительный интервал для среднего значения признака Х найдём по формуле (8). Сначала по таблице [1] найдём критическую точку распределения Стьюдента с числом степеней свободы и уровнем значимости Получим t = 2,09 и подставим в формулу (8):

. После вычисления получим доверительный интервал для среднего значения







Дата добавления: 2015-09-15; просмотров: 1647. Нарушение авторских прав; Мы поможем в написании вашей работы!



Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

Внешняя политика России 1894- 1917 гг. Внешнюю политику Николая II и первый период его царствования определяли, по меньшей мере три важных фактора...

Оценка качества Анализ документации. Имеющийся рецепт, паспорт письменного контроля и номер лекарственной формы соответствуют друг другу. Ингредиенты совместимы, расчеты сделаны верно, паспорт письменного контроля выписан верно. Правильность упаковки и оформления....

БИОХИМИЯ ТКАНЕЙ ЗУБА В составе зуба выделяют минерализованные и неминерализованные ткани...

Именные части речи, их общие и отличительные признаки Именные части речи в русском языке — это имя существительное, имя прилагательное, имя числительное, местоимение...

Интуитивное мышление Мышление — это пси­хический процесс, обеспечивающий познание сущности предме­тов и явлений и самого субъекта...

Объект, субъект, предмет, цели и задачи управления персоналом Социальная система организации делится на две основные подсистемы: управляющую и управляемую...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия