Графическое представление экспериментальных данных
Для наглядности результатов эксперимента используется их графическое представление: гистограмма, полигон частот и полигон накопленных частот. Гистограмма – это примыкающие друг к другупрямоугольники. Основание каждого прямоугольника есть ширина группировки h i. а высота - n i. если все h i одинаковые. На графике гистограммы основания прямоугольников откладываются по оси Ох, а высоты по оси Оy. n i
24,9 25,7 26,5 27,3 28,1 28,9 29,7 30,5 x Рис. 1. Гистограмма с равными интервалами Если h i не одинаковые, то по оси Оу откладывается P i, где P i = , т.е. высоты прямоугольников должны быть пропорциональны величинам P i. P i
24,9 25,7 26,5 27,3 28,1 29,7 30,5 x Рис. 2. Гистограмма с объединенными интервалами На рисунке 1 гистограмма построена по данным таблицы 3 с равными интервалами. На рисунке 2 интервалы взяты не одинаковые (два объединили), поэтому по оси Оу откладывали P i. Полигон частот – это ломаная линия, соединяющая точки, соответствующие срединным значениям интервалов группировки. n i
2
0 25,3 26,1 26,9 27,7 28,5 29,3 30,1 х сi Рис. 3. Полигон частот На оси Ох отложены срединные значения, по оси Оу – частоты. Из сравнения двух способов следует, что для получения полигона частот из построенной гистограммы нужно соединить середины сторон отрезками. На рис 1 график полигона частот построен пунктиром. Полигон накопленных частот получается при соединении отрезком прямых точек. координаты которых соответствуют верхним границам интервалов группировки и накопленным частотам. По оси ОХ границы интервалов, по оси ОУ - накопленные частоты. n хi
0 24,9 25,7 26,5 27,3 28,1 28,9 29,7 30,5 x Рис.4. Полигон накопленных частот Получили более плавную линию по сравнению с полигоном частот. Числовые характеристики выборки дают количественные представления об эмпирических данных и позволяют сравнивать их между собой. Остановимся на некоторых из них подробнее. К характеристикам положения относятся: среднее арифметическое, медиана, мода. Они определяют положение центра эмпирического распределения. Среднее арифметическое – одна из основных характеристик выборки и представляет собой такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю. Геометрически среднее арифметическое можно определить как точку на оси Ох, которая является абсциссой центра масс гистограммы и обозначается . Для несгруппированных данных среднее арифметическое определяется по формуле: , (3.1), где n – объём выборки, х i – варианты выборки. Пример. Для оценки уровня физической подготовленности студентов 1-го курса педагогического вуза были выбраны прыжки в длину с места. Результаты контрольной группы студентов в количестве 15 человек оказались следующими (в см): 213, 224, 225, 210, 226, 230, 201, 224, 230, 227, 228, 252, 238, 232, 246. Определить средний результат. Для сгруппированных данных среднее арифметическое определяется по следующей формуле: , (3.2), где n – объём выборки, n i – частоты интервалов, х i – срединные значения интервалов. Пример: Вычислить среднее арифметическое результатов в беге на 5 км (лыжи), сгруппированных в таблице. Для наглядности промежуточные результаты расчетов занесем в таблицу. Медианой называется такое значение признака X, когда одна половина значений экспериментальных данных меньше её, а вторая половина больше. Если объем выборки невелик, то для вычисления медианы выборку ранжируют, т. е. располагают в порядке возрастание или убывания и вычисляют порядковый номер R (ранг) медианы по формуле: . Пусть, например, имеется ранжированная выборка n =11: 13, 15, 16. 19, 19, 22, 23, 25, 27, 27, 29. Тогда ; Ме = 22 (6-ой член ряда). При n = 8: 12, 15, 16, 18, 22, 24, 25, 27; . Медианой в этом случае может быть любое число между 18 и 22 (четвертым и пятым членами ряда). Ме = . Для сгруппированных данных вначале находят медианный интервал, т.е. интервал, в котором находится медиана. Медианным будет тот интервал. в котором накопленная частота окажется больше (n – объем выборки) или накопленная частость больше . Внутри медианного интервала медиана ищется по формуле: , где Хмен - нижняя граница медианного интервала; 0,05 n – 1/2 объема выборки; h – ширина интервала группировки; nхмв - 1 - накопленная частота интервала, предшествующего медианному; n ме- частота медианного интервала. Найдем медиану, в предыдущем примере. Медиана содержится в интервале (27,3; 28,0), которому соответствует накопленная частота 32, а =25. Me = 27,3 + 0,8 = 27,6; Ме = 27,6 (мин) Медиана несколько отличается от среднего арифметического, так как имеет место несимметрическая форма эмпирического распределения. Как было сказано выше, мода представляет собой значение признака, встречающееся в выборке наиболее часто. Интервал группировки с наибольшей частотой называется модальным. Мода ищется по формуле: где Хмон - нижняя граница модального интервала; h - ширина интервала группировки; n мо- частота модального интервала: n мо – 1 - частота интервала, предшествующего модальному. n мо + 1 - частота интервала, следующего за модальным. Для предыдущего примера имеем Мо = 26,5+0,8 27,2. Тогда Мо = 27,2 (мин).
|