Построение дискретных вариационных рядов
Задача №1. Источник статистической информации – ведомственная статистика, - отдел кадров одного из предприятий города предоставил исследователю следующие данные о тарифных разрядах (ТР) 50-ти рабочих одного из цехов завода (тот же результат можно получить и в результате собственных наблюдений, путем опроса, например). Обозначим полученную (или созданную нами) исходную статистическую совокупность, которую назовем Y = {yj}, j=1,N, где N = │Y│= 50 – т.е. всего 50 штук разрядов. В данном случае для нас не представляет интерес другие свойства рабочих (их образование, возраст, семейное положение, реальный уровень квалификации, степень социальной активности, состояние здоровья, интересы и др.) – только их разряды. То есть статсовокупность построена нами лишь по одному количественному признаку с именем признака «разряд» и представлена в произвольном виде в табл. 1.
Таблица 1 Исходная статистическая совокупность по дискретному признаку (разрядам рабочих одного цеха)
3 5 6 3 2 4 3 5 5 6 4 3 2 3 4 5 4 2 4 6 5 3 4 5 4 3 3 6 2 3 4 6 3 4 4 5 4 5 3 4 2 6 3 4 5 3 4 4 5 4
Чтобы показать распределение рабочих по ТР, построим ВР (дискретный, коли исходные данные носят здесь дискретный характер), то есть новую, более компактную статсовокупность с новым именем X = {xi}, i=1,n (n < N). Иными словами, мы хотим отобразить известное нам множество Y на более компактное и неизвестное нам пока множество с именем Х, что принято записывать следующим образом:
τ: Y → Х. (1)
Для этого необходимо и достаточно сделать следующее. 1) Найти максимальное и минимальное значение среди элементов исходной статистической совокупности: ymax = 6 р., ymin = 2 р. Можно оценить и размах выборки R = ymax - ymin = 6 – 2 = 4 (разряда), то есть установить, что в пределах размаха выборки помещаются все разряды от 2-го до 6-го (2, 3, 4, 5, 6). Однако непосредственного применения в данном случае размах выборки не находит и выступает не как этап формализации, но как сопутствующая информация. Здесь важно то, что в качестве элементов новой статистической совокупности Х будут выступать разряды от минимального до максимального: Х = {xi}, i=1,n. Сосчитаем их, чтобы определить мощность множества │Х│= n. Тогда х1= 2 р.; х2= 3 р.; х3= 4 р.; х4= 5 р.; х5= 6 р. Всего насчитали пять вариантов, следовательно n = 5. При этом n < N действительно выполняется: 5 < 50. 2) Упорядочить разряды по возрастанию или убыванию (операция упорядочения или рандомизации, что и сделано в предыдущем шаге) и принять их в качестве элементов будущего, создаваемого нами более компактного по отношению к исходной информации множества с именем Х. Вот эти разряды и будем именовать «вариантами» создаваемого нами вариационного ряда (см. табл. 2). 3) Сосчитать, сколько элементов исходной СС принадлежит тому или иному варианту ВР (разряду) по следующему алгоритму. Продвигаясь по табл. 1 по строкам или столбцам (как кому покажется удобнее) при прохождении каждого очередного разряда делаем отметку в виде «слежа» (косой черточки) до тех пор, пока не достигнем конца табл. 1 (сумма всех косых черточек в сумме в табл. 2 должно быть равна 50-ти; это понятно). После этого подсчитаем, сколько раз тот или иной вариант (разряд) зафиксирован нами как случайное событие и запишем информацию в количественной шкале (графа fi) в виде цифры. Это и будет частота появления варианта в новом множестве с именем Х: отображение вида (1) нами построено. Заодно подсчитаем и накопленные частоты qi путем прибавления следующей частоты к предыдущей. Табл. 2 как выражение дискретного вариационного ряда заполнена.
Таблица 2 Дискретный вариационный ряд. Результаты отображения вида (1)
∑ fi = 50
В итоге дискретный вариационный ряд (табл. 2) из исходной СС (табл. 1) построен. Хотя и по размерам страницы табл. 1 и 2 вполне соизмеримы, табл. 2 – более информативнашению к табл. 1, поскольку она (табл. 2) демонстрирует структуру исходной СС. Мы видим, что средних разрядов (3-х и 4-х) – побольше, самых низких (2-е) и самых высоких (5-е и 6-е) – поменьше, и в чем-то напоминает в графе табл. 2 «счет» гауссовский закон нормального распределения случайной величины С целью визуализации полученных результатов нашего отображения вида (1) – другими словами, - вариационного ряда, полученного из исходной статистической совокупности, - достаточно поставить в соответствие номера вариантов на оси абцисс и значения частот на оси ординат (получим т.н. «полигон распределения» - ломаная кривая), а также номера вариантов и значения накопленных частот – соответственно (получим т.н. «кумуляту» - плавная кривая, что подробнее рассмотрим на примере интервальных ВР). Однако в построении подобных графиков настоятельной необходимости нет, поскольку распределение разрядов среди 50-ти рабочих как случайной величины и так достаточно наглядно характеризует картинка со «слежами» в графе «счет» табл. 2. Однако попутно обратим внимание на другое, присущее в равной мере как дискретным, так и интервальным ВР – особенность нахождения среднего значения ВР.
|