СТАТИСТИЧЕСКИЙ РЯД, ГИСТОГРАММА И ПОРЯДОК ЕЕ ПОСТРОЕНИЯ
Предположим, что в результате измерений параметров исследуемых объектов имеется статистическая совокупность, представляющая собой множество значений СВ Х, полученное в результате измерений(наблюдений). Построение гистограммы осуществляется в следующем порядке. 1. Весь диапазон измерений СВ () делится на интервалы и подсчитывается количество значений , приходящееся на каждый -й интервал. Это число делится на общее количество измерений (изделий) и определяется частота, соответствующая данному интервалу. . Сумма частот всех разрядов очевидно должна быть равна единице. 2. Строится таблица 1.1, в которой приведены интервалы в порядке их расположения вдоль оси абсцисс и соответствующие частоты. Эта таблица называется статистическим рядом. Таблица 1.1 Статистический ряд значений СВ
Здесь -обозначение i-го интервала; - его границы; k- число интервалов. При группировке наблюденных значений СВ по интервалам может возникнуть ситуация, при которой значение попадает на границу интервала. В этом случае встает вопрос о том, к какому разряду отнести это значение. Рекомендуется считать данное значение принадлежащим в равной мере обоим интервалам и прибавлять к числам того и другого интервала по 0, 5. 3. Определение числа интервалов. Число интервалов, на которые следует группировать статистический ряд, не должно быть слишком большим, поскольку в этом случае ряд распределения становится невыразительным, и частоты в нем обнаруживают незакономерные колебания. С другой стороны оно не должно быть слишком малым, так как при малом числе интервалов свойства распределения описываются статистическим рядом слишком грубо. Практика показывает, что в большинстве случаев рационально выбирать число интервалов в пределах 10¸ 20. Чем больше и однороднее статистический материал, тем большее количество интервалов можно выбирать при составлении статистического ряда. Для определения количества интервалов можно также использовать эмпирические формулы, предлагаемые различными авторами. В работе [3] в качестве таких формул предлагается использовать следующие выражения и , Эти выражения получены для наиболее часто встречающихся на практике распределений с эксцессом, находящимся в пределах от 1, 8 до 6, то есть от равномерного до распределения Лапласа. Длины интервалов могут быть как одинаковыми, так и различными. Очевидно, что проще их брать одинаковыми. Однако, при оформлении данных о СВ, распределенных слишком неравномерно, иногда бывает удобно выбирать в области наибольшей плотности распределения интервалы более узкие, чем в области малой плотности. 4. Оформление гистограммы графически. Статистический ряд оформляется графически в виде так называемой гистограммы (рис.1.1). Она строится следующим образом. По оси абсцисс откладываются интервалы, а на каждом из интервалов как основании строится прямоугольник, площадь которого равна частоте данного интервала. Для построения гистограммы нужно частоту каждого интервала разделить на его длину и полученное число взять в качестве высоты прямоугольника. В случае равных по длине интервалов высоты прямоугольников пропорциональны соответствующим частотам. Из способа построения гистограммы следует, что полная площадь ее равна единице.
Очевидно, что при увеличении числа опытов можно выбирать все более мелкие интервалы, и при этом верх гистограммы будет все более приближаться к кривой, ограничивающей площадь, равную единице. Эта кривая представляет собой график функции плотности распределения вероятности f(x) (дифференциальная функция распределения для непрерывных СВ ). 5. Статистическая функция распределения. Пользуясь данными статистического ряда, можно построить и статистическую(эмпирическую) функцию распределения СВ Х. Для этого из ряда берутся точки xi границ интервалов и соответствующие им суммы частот pi, приходящиеся на прямоугольники гистограммы, лежащие левее этих точек. Эти частоты и их суммы обозначают как F(xi). Тогда получим систему выражений, определяющих точки статистической функции распределения. Соединяя их ломаной линией или плавной кривой, получим приближенный график статистической функции распределения (интегральной функции распределения для непрерывных СВ ) F(x) (рис.1.2).
|