Статистические данные и их обработка
С помощью выборочного метода на основании изучения некоторого признака у определенной части элементов можно сделать вывод о характере распределения этого признака по всему объему статистической совокупности. Результаты наблюдений выборки объема n записываются в виде: i = 1, 2, …, n - номера наблюдений или измерений; х = х1, х2, …, хn – численные значения наблюдаемой величины. Расположим значения хi, называемые вариантами, в порядке возрастания и обозначим а = min xi, b = max xi. Величина R = b – a называется размахом статистической совокупности. Число ni , показывающее, сколько раз при наблюдении встречается варианта (значение) хi, называется частотой, а число pi = - относительной частотой (частостью) варианты хi , при этом n = и = 1. Последовательность хi , записанная в порядке возрастания с указанием частот или относительных частот, называется вариационным статистическим рядом, который может быть представлен в виде таблицы:
Геометрическим изображением дискретного статистического ряда является эмпирический полигон распределения, являющийся аналогом плотности распределения случайной величины Х, представляющей собой ломаную линию с вершинами (хi ; ni), при этом варианты хi откладываются на оси абсцисс, а соответствующие частоты - на оси ординат. Вариационный ряд обозрим при небольших количествах элементов. В противном случае первоначальную статистическую совокупность подвергают интервальной обработке, устанавливая частоты или частости для каждого последовательного интервала по возрастанию переменной х. Геометрическим изображением интервальной обработки служит гистограмма частот (площадь которой равна объему выборки), представляющая собой ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины а высоты равны отношению , при этом площадь фигуры равна объему выборки. Важным понятием в теории выборки является эмпирическая функция распределения F(x), определяющая для каждого х относительную частоту события, F*(x)=nx/n, где nx - число вариантов хiменьших чем х., (Х < x).
В качестве примера обработки статистического материала по результатам обследования прибыли п предприятий (n = 100) приведем следующие табличные данные:
Согласно приведенной выше табличной статистике эмпирическая функция распределения имеет вид:
воспользовавшись статистическими данными, можем получить следующие значения выборочных параметров: = 15, 75; D=25, 42; = 5, 04; М0* = 3; Ме* = 15.
|