Студопедия — Нормальное распределение. Нормальное распределение – наиболее часто встречающийся вид распределения
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Нормальное распределение. Нормальное распределение – наиболее часто встречающийся вид распределения






Нормальное распределение – наиболее часто встречающийся вид распределения. С ним приходится встречаться при анализе погрешностей измерений, контроле технологических процессов и режимов, а также при анализе и прогнозировании различных явлений в биологии, медицине и других областях знаний.

Термин «нормальное распределение» применяется в условном смысле как общепринятый в литературе, хотя и не совсем удачный. Так, утверждение, что какой-то признак подчиняется нормальному закону распределения, вовсе не означает наличие каких-либо незыблемых норм, якобы лежащих в основе явления, отражением которого является рассматриваемый признак, а подчинение другим законам распределения не означает какую-то анормальность данного явления.

Главная особенность нормального распределения состоит в том, что оно является предельным, к которому приближаются другие распределения. Нормальное распределение впервые открыто Муавром в 1733 году. Нормальному закону подчиняются только непрерывные случайные величины. Плотность нормального закона распределения имеет вид .

Математическое ожидание для нормального закона распределения равно . Дисперсия равна .

Основные свойства нормального распределения.

1. Функция плотности распределения определена на всей числовой оси Ох, то есть каждому значению х соответствует вполне определённое значение функции.

2. При всех значениях х (как положительных, так и отрицательных) функция плотности принимает положительные значения, то есть нормальная кривая расположена над осью Ох.

3. Предел функции плотности при неограниченном возрастании х равен нулю, .

4. Функция плотности нормального распределения в точке имеет максимум .

5. График функции плотности симметричен относительно прямой .

6. Кривая распределения имеет две точки перегиба с координатами и .

7. Мода и медиана нормального распределения совпадают с математическим ожиданием а.

8. Форма нормальной кривой не изменяется при изменении параметра а.

9. Коэффициенты асимметрии и эксцесса нормального распределения равны нулю.

Очевидна важность вычисления этих коэффициентов для эмпирических рядов распределения, так как они характеризуют скошеннность и крутость данного ряда по сравнению с нормальным.

Вероятность попадания в интервал находится по формуле , где нечётная табулированная функция.

Определим вероятность того, что нормально распределённая случайная величина отклоняется от своего математического ожидания на величину, меньшую , то есть найдём вероятность осуществления неравенства , или вероятность двойного неравенства . Подставляя в формулу, получим

Выразив отклонение случайной величины Х в долях среднего квадратического отклонения, то есть положив в последнем равенстве, получим .

Тогда при получим ,

при получим ,

при получим .

Из последнего неравенства следует, что практически рассеяние нормально распределённой случайной величины заключено на участке . Вероятность того, что случайная величина не попадёт на этот участок, очень мала, а именно равна 0,0027, то есть это событие может произойти лишь в трёх случаях из 1000. Такие события можно считать практически невозможными. На приведённых рассуждениях основано правило трёх сигм, которое формулируется следующим образом: если случайная величина имеет нормальное распределение, то отклонение этой величины от математического ожидания по абсолютной величине не превосходит утроенного среднего квадратического отклонения.

Пример 28. Деталь, изготовленная автоматом, считается годной, если отклонение её контролируемого размера от проектного не превышает 10 мм. Случайные отклонения контролируемого размера от проектного подчинены нормальному закону распределения со средним квадратическим отклонением мм и математическим ожиданием . Сколько процентов годных деталей изготавливает автомат?

Решение. Рассмотрим случайную величину Х - отклонение размера от проектного. Деталь будет признана годной, если случайная величина принадлежит интервалу . Вероятность изготовления годной детали найдём по формуле . Следовательно, процент годных деталей, изготавливаемых автоматом, равен 95,44%.

 

22. Биномиальное распределение

Биномиальным является распределение вероятностей появления m числа событий в п независимых испытаниях, в каждом из которых вероятность появления события постоянна и равна р. Вероятность возможного числа появлений события вычисляется по формуле Бернулли: ,

где . Постоянные п и р, входящие в это выражение, параметры биномиального закона. Биномиальным распределением описывается распределение вероятностей дискретной случайной величины.

Основные числовые характеристики биномиального распределения. Математическое ожидание равно . Дисперсия равна . Коэффициенты асимметрии и эксцесса равны и . При неограниченном возрастании числа испытаний А и Е стремятся к нулю, следовательно, можно предположить, что биномиальное распределение сходится к нормальному с возрастанием числа испытаний.

Пример 29. Производятся независимые испытания с одинаковой вероятностью появления события А в каждом испытании. Найти вероятность появления события А в одном испытании, если дисперсия числа появлений в трёх испытаниях равна 0,63.

Решение. Для биномиального распределения . Подставим значения, получим отсюда или тогда и .

 

23.Распределение Пуассона

Закон распределения редких явлений

Распределение Пуассона описывает число событий m, происходящих за одинаковые промежутки времени при условии, что события происходят независимо друг от друга с постоянной средней интенсивностью. При этом число испытаний п велико, а вероятность появления события в каждом испытании р мала. Поэтому распределение Пуассона называют законом редких явлений или простейшим потоком. Параметром распределения Пуассона является величина , характеризующая интенсивность появления событий в п испытаниях. Формула распределения Пуассона .

Пуассоновским распределением хорошо описываются число требований на выплату страховых сумм за год, число вызовов, поступивших на телефонную станцию за определённое время, число отказов элементов при испытании на надёжность, число бракованных изделий и так далее.

Основные числовые характеристики для распределения Пуассона. Математическое ожидание равно дисперсии и равно а. То есть . Это является отличительной особенностью этого распределения. Коэффициенты асимметрии и эксцесса соответственно равны .

Пример 30. Среднее число выплат страховых сумм в день равно двум. Найти вероятность того, что за пять дней придётся выплатить: 1) 6 страховых сумм; 2) менее шести сумм; 3) не менее шести.

Решение. Среднее число выплат за пять дней .

1) тогда вероятность того, что придётся выплачивать шесть сумм: ;

2) обозначим за событие А - выплачено менее шести сумм. Тогда по теореме сложения несовместных событий или

3) Событие - выплачено не менее шести сумм является противоположным для события А, следовательно:

.

 

24. Показательное распределение

Непрерывную случайную величину, плотность вероятности которой определяется выражением:

называют величиной, имеющей показательное или экспоненциальное распределение.

Это распределение часто наблюдается при изучении сроков службы различных устройств, времени безотказной работы отдельных элементов, частей системы и системы в целом, при рассмотрении случайных промежутков времени между появлениями двух последовательных редких событий.

Плотность показательного распределения определяется параметром , который называют интенсивностью отказов. Этот термин связан с конкретной областью приложения – теорией надёжности.

Выражение интегральной функции показательного распределения можно найти, используя свойства дифференциальной функции:

Математическое ожидание показательного распределения , дисперсия , среднее квадратическое отклонение . Таким образом, для этого распределения характерно, что среднее квадратическое отклонение численно равно математическому ожиданию. При любом значении параметра коэффициенты асимметрии и эксцесса – постоянные величины .

Пример 31. Среднее время работы телевизора до первого отказа равно 500 часов. Найти вероятность того, что наудачу взятый телевизор проработает без поломок более 1000 часов.

Решение. Так как среднее время работы до первого отказа равно 500, то . Искомую вероятность найдём по формуле .

 

Закон больших чисел

25. Лемма Маркова

Т. 1. Для любой положительной случайной величины Х вероятность того, что она примет значение, не превосходящее некоторого положительного числа , больше разности между единицей и отношением математического ожидания этой случайной величины к данному числу : .

Доказательство. Проведём доказательство для дискретной случайной величины способом, получившим название метода урезания. Пусть - упорядочная совокупность всех значений, принимаемых положительной случайной величиной Х с соответствующими вероятностями причём . Не нарушая общности доказательства, можно допустить, что значения случайной величины Х расположены в порядке убывания. Выберем некоторое произвольное число и предположим, что первые r значений совокупности больше . Так как по условию случайная величина Х принимает только положительные значения, то можно записать неравенство

. По определению математического ожидания , следовательно . Заменяя в левой части неравенства значения переменных числом , получаем следующее усиленное неравенство или . Левая часть этого неравенства выражает вероятность того, что случайная величина принимает значения, большие , то есть .

Вероятность противоположного события, а именно вероятность того, что случайная величина примет значения не больше , определяется следующим неравенством: .

Лемма Маркова справедлива для любого распределения положительной случайной величины.

Пример 32. Среднее число студентов в группе, получивших на экзамене неудовлетворительные оценки, равно пяти. Оценить вероятность того, что в наудачу взятой группе будет более восьми двоек.

Решение. Используем неравенство Маркова. По условию задачи имеем . Тогда искомая вероятность равна или .

 

26. Неравенство Чебышева

Т. Если случайная величина Х имеет конечные математическое ожидание и дисперсию, то для любого положительного числа справедливо неравенство , то есть вероятность того, что отклонение случайной величины Х от своего математического ожидания по абсолютной величине не превзойдёт , больше разности между единицей и отношением дисперсии этой случайной величины к квадрату .

Доказательство. Воспользуемся леммой Маркова. Рассмотрим случайную величину , для некоторых значений которой выполняется неравенство . Так как случайная величина Z положительна, то неравенства и равносильны. Применив лемму Маркова к случайной величине , получим

. Числитель дроби в правой части неравенства по определению есть дисперсия случайной величины Х, следовательно, неравенство можно записать в виде . Так как в силу равносильности соответствующих неравенств вероятности и равны, то .

Неравенство Чебышева, как и неравенство Маркова, справедливо для любого распределения случайной величины Х, однако неравенство Чебышева применимо как к положительным, так и к отрицательным случайным величинам.

Полагая , запишем неравенство в виде

или .

Задаваясь различными значениями t, вычислим верхние границы вероятностей того, что отклонение случайной величины выйдет за пределы : при ;

; . Вероятности рассматриваемых событий не могут превысить этих числовых значений ни при каком распределении случайной величины.

 

27. Теорема Чебышева

Т. При достаточно большом числе попарно независимых случайных величин с математическими ожиданиями и дисперсиями с вероятностью, близкой к единице, можно утверждать, что разность между средней арифметической наблюдавшихся значений случайных величин и средней арифметической их математических ожиданий по абсолютной величине окажется меньше сколь угодно малого числа при условии, что дисперсия всех этих величин не превосходит одного и того же постоянного числа В, то есть

,

где - положительное число, близкое к нулю.

Доказательство. Пусть - п попарно независимых случайных величин. Средняя арифметическая этих величин является, в свою очередь, тоже случайной величиной. Обозначим её : . Определим математическое ожидание и дисперсию :

,

.

Применяя к случайной величине неравенство Чебышева, получаем

,

или .

Заменяя в правой части последнего неравенства дисперсии случайных величин величиной В, которую по условию теоремы не превосходит ни одна из дисперсий, получаем усиленное неравенство

.

Для любого сколь угодно малого числа можно найти такое число п,при котором выполняется неравенство . Таким образом получаем неравенство, которое требовалось доказать:

.

Переходя в фигурных скобках к противоположному событию, можно записать .

Теорема Чебышева показывает, средняя арифметическая попарно независимых случайных величин обладает свойством устойчивости и при определённых условиях мало отличается от средней арифметической математических ожиданий этих величин.

 

 

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

28. Основные понятия математической статистики

Математическая статистика - это раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений с целью выявления существующих закономерностей. Выводы о закономерностях, которым подчиняются явления, изучаемые методами математической статистики, всегда основываются на ограниченном, выборочном числе наблюдений. Поэтому естественно предположить, что эти выводы при большом числе наблюдений могут оказаться иными. Чтобы быть в состоянии высказать более определённое суждение об изучаемом явлении, математическая статистика опирается на теорию вероятностей.

Оценив неизвестные величины или зависимости между ними по данным наблюдений, исследователь выдвигает ряд гипотез, предположений о том, что рассматриваемое явление можно описать той или иной вероятностной теоретической моделью. Далее, используя математико-статистические методы, можно дать ответ на вопрос, какую из гипотез или моделей следует принять. Именно эта модель и есть закономерность изучаемого явления.

Основные задачи математической статистики состоят в разработке методов:

1) организации и планирования статистических наблюдений;

2) сбора статистических данных;

3) «свертка информации», то есть методов группировки и сокращения статистических данных с целью сведения большого числа таких данных к небольшому числу параметров, которые в сжатом виде характеризуют всю исследуемую совокупность;

4) анализа статистических данных;

5) принятия решений, рекомендаций и выводов на основе анализа статистических данных;

6) прогнозирования случайных явлений.

Одним из основных методов статистического наблюдения является выборочный метод. Рассмотрим основные понятия этого метода.

 

29. Вариационные ряды

О. 1. Генеральной совокупностью называется совокупность всех мыслимых наблюдений, которые могли бы быть сделаны при данном реальном комплексе условий измерений. Число членов, образующих генеральную совокупность, называется объёмом генеральной совокупности.

О. 2. Выборочной совокупностью или просто выборкой объёмом п называется совокупность п объектов, отобранных из исследуемой генеральной совокупности.

О. 3. Вариантами называются различные значения признака, а варьированием – изменение значений признака.

О. 4. Расположение наблюдаемых значений в порядке возрастания или убывания называется ранжированием выборки.

О. 5. Если признак по своей сущности таков, что различные значения не могут отличаться друг от друга меньше чем на некоторую конечную величину, то говорят, что это дискретно варьирующийся признак.

О. 6. Число, показывающее, сколько раз встречается вариант х в ряде наблюдений, называется частотой варианта mx.

Вместо частоты варианта х можно рассматривать её отношение к общему числу наблюдений п, которое называется частостью варианта х и обозначается . Так как общее число наблюдений равно сумме частот всех вариантов , то справедлива следующая цепочка равенств: .

О. 7. Таблица, позволяющая судить о распределении частот (или частостей) между вариантами, называется дискретным вариационным рядом.

Наряду с понятием частоты используется понятие накопленной частоты, которую обозначают . Накопленная частота показывает, во скольких наблюдениях признак принял значения, меньшие заданного значения х. Отношение накопленной частоты к общему числу наблюдений называют накопленной частостью и обозначают . Очевидно, что .

О. 8. Признак называется непрерывно варьирующим, если он может принять любое значение в некотором числовом интервале.

По полученным данным такого признака трудно выявить характерные черты варьирования значений признака. Построение дискретного вариационного ряда также не даст желаемых результатов (слишком велико число вариантов). Для получения ясной картины нужно объединить полученные значения в несколько интервалов.

О. 9. Таблицу, позволяющую судить о распределении частот (или частостей) между интервалами варьирования значений признака, называют интервальным вариационным рядом.

Интервальный вариационный ряд строят по данным наблюдений за непрерывно варьирующим признаком, а также за дискретно варьирующим, если велико число наблюдавшихся вариантов. Дискретный вариационный ряд строят только для дискретно варьирующего признака.

Для построения интервального вариационного ряда необходимо определить величину интервала, установить полную шкалу интервалов, в соответствии с ней сгруппировать результаты наблюдений. Для определения оптимального интервала h, то есть такого, при котором построенный интервальный ряд не был бы слишком громоздким и в то же время позволял выявить характерные черты рассматриваемого явления, можно использовать формулу Стэрджеса , где и - соответственно максимальный и минимальный варианты. Величина характеризует число интервалов m, но так как количество интервалов целое число, то её округляют до целого значения. При этом желательно, чтобы было минимальным для возможных значений m. Длина интервала имеет ту же точность, что и варианты.

Пример 33. Найти оптимальную длину интервала по следующим данным, , причём значения вариантов целые числа.

Решение. Вычислим . Возможные количество интервалов 7 или 6. Соответствующие им длины интервалов равны . Тогда и . Так как , то для уменьшения погрешностей желательно взять шесть интервалов, имеющих длину 10.

 

30. Графическое изображение вариационного ряда.

Графическое изображение вариационного ряда позволяет представить в наглядной форме закономерности варьирования значений признака. Наиболее широко используются следующие виды графического изображения вариационных рядов: полигон, гистограмма, кумулятивная кривая.

Полигон, как правило, служит для изображения дискретного вариационного ряда. Для его построения в прямоугольной системе координат наносят точки с координатами , где -вариант, -соответствующая ему частота. Иногда вместо точек строят точки . Затем эти точки последовательно соединяют отрезками в порядке возрастания . Полученная линия носит название полигон частот или полигон относительных частот. Иногда интервальный ряд изображают с помощью полигона. В этом случае интервалы заменяют их серединными значениями и к ним относят интервальные частоты. Для полученного дискретного ряда строят полигон.

Гистограмма служит для изображения только интервального вариационного ряда. Для её построения в прямоугольной системе координат по оси абсцисс откладывают отрезки, изображающие интервалы варьирования, и на них строят прямоугольники с высотами, равными частотам (или частостям) соответствующего интервала. В результате получают ступенчатую фигуру, состоящую из прямоугольников, которую называют гистограммой.

Кумулятивная кривая (кривая накопленных частот или накопленных частостей) строится следующим образом. Если вариационный ряд дискретный, то в прямоугольной системе координат строят точки с координатами , где xi - вариант, - соответствующая накопленная частота. Иногда вместо точек строят точки . Полученные точки соединяют отрезками.

Если вариационный ряд интервальный, то по оси абсцисс откладывают интервалы. Верхним границам интервалов соответствуют накопленные частоты (или накопленные частости); нижней границе первого интервала – накопленная частота, равная нулю. Построив кумулятивную кривую, можно приблизительно установить число наблюдений (или их долю в общем количестве наблюдений), в которых признак принял значения, меньшие заданного. Иногда кумулятивную кривую называют кумулятой.

Пример 34. Построить полигон частот, гистограмму, кумуляту для интервального вариационного ряда.

Интервалы 4 - 8 8 - 12 12 -16 16 - 20 20 –24 24 -28
Частоты            

Решение. Построим полигон частот. Вынесем на координатную плоскость точки , где - середины соответствующих интервалов, то есть точки . Соединив их ломаной кривой, получим полигон частот.

Для построения гистограммы отложим на оси абсцисс интервалы варьирования и на них как на основаниях построим прямоугольники высотами, равными соответствующим частотам.

Для построения кумулятивной кривой отложим на координатной плоскости точки (4;0), (8;4), (12;10), (16;22), (20;36), (24;44), (28;45) и соединим их ломаной линией, получим кумуляту.

 

31. Эмпирическая функция распределения

Эмпирической функцией распределения случайной величины Х называют функцию , определяющую для каждого значения х частость события : , где пх – число вариантов хi, меньших х; п – объём выборки.

Эмпирическая функция распределения обладает всеми свойствами интегральной функции распределения. Действительно, из определения эмпирической функции распределения следует, что:

1) значения эмпирической функции распределения принадлежат отрезку ;

2) - неубывающая функция;

3) если х1 - наименьшее, а хп – наибольшее наблюденное значение, то при и при .

Основное значение эмпирической функции распределения состоит в том, что она используется в качестве оценки функции распределения .

Пример 35. Построить эмпирическую функцию распределения для вариационного ряда

Варианты        
Частота        

Решение. Согласно определению эмпирическая функция распределения имеет вид

И её график имеет вид

32. Средние величины

Средние величины являются как бы «представителями» всего ряда наблюдений, поскольку вокруг них концентрируются наблюдавшиеся значения признака. Заметим, что только для качественно однородных наблюдений имеет смысл вычислять средние величины.

Различают несколько видов средних величин: средняя арифметическая, средняя геометрическая, средняя гармоническая, средняя квадратическая, средняя кубическая и так далее. При выборе вида средней величины необходимо ответить на вопрос: какое свойство ряда мы хотим представить средней величиной или, иначе говоря, какая цель преследуется при вычислении средней? Это свойство, получившее название определяющего, и определяет вид средней. Понятие определяющего свойства впервые введено советским статистиком А. Я. Боярским.

Наиболее распространенной средней величиной является средняя арифметическая. Пусть - данные наблюдений; - средняя арифметическая. Свойство, определяющее среднюю арифметическую, формулируется следующим образом: сумма результатов наблюдений должна остаться неизменной, если каждое из них заменить средней арифметической, то есть . Так как , то . Отсюда получаем следующую формулу для вычисления средней арифметической по данным наблюдений: . Если по наблюдениям построен вариационный ряд, то средняя арифметическая , где - вариант, если ряд дискретный, и середина интервала, если ряд интервальный; - соответствующая частота.

Очевидно, что если по данным наблюдений построен дискретный вариационный ряд, то обе формулы дают одинаковые значения средней арифметической. Если же по наблюдениям построен интервальный ряд, то средние арифметические, вычисленные по этим формулам могут не совпадать, так как во второй формуле значения признака внутри каждого интервала принимаются равными центрам интервалов. Ошибка, возникающая в результате такой замены, вообще говоря, очень мала, если наблюдения распределены равномерно вдоль каждого интервала, а не скапливаются к одноимённым границам интервалов.

Основные свойства средней арифметической.

1. Сумма отклонений результатов наблюдений от средней арифметической равна нулю, или сумма произведений отклонений вариантов от средней арифметической на соответствующие частоты равна нулю.

2. Если все результаты наблюдений уменьшить (увеличить) на одно и то же число, то средняя арифметическая уменьшится (увеличится) на это же число.

3. Если все результаты наблюдений уменьшить (увеличить) в одно и то же число раз, то средняя арифметическая уменьшится (увеличится) во столько же раз.

4. Средняя арифметическая алгебраической суммы соответствующих значений признака нескольких рядов наблюдений с одинаковым числом наблюдений равна алгебраической сумме средних арифметических этих рядов.

О.1. Среднюю арифметическую вычисленную по данным выборки называют выборочной средней.

Пример 36. Найти выборочную среднюю для выборки, представленной интервальным вариационным рядом

Интервалы 3 - 7 7 - 11 11 - 15 15 - 19 19 - 23 23 – 27
Частоты            

Решение. Середины интервалов равны: 5; 9; 13; 17; 21; 25. Сумма частот равна . Тогда выборочная средняя равна

.

 







Дата добавления: 2015-08-12; просмотров: 2979. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Методы прогнозирования национальной экономики, их особенности, классификация В настоящее время по оценке специалистов насчитывается свыше 150 различных методов прогнозирования, но на практике, в качестве основных используется около 20 методов...

Методы анализа финансово-хозяйственной деятельности предприятия   Содержанием анализа финансово-хозяйственной деятельности предприятия является глубокое и всестороннее изучение экономической информации о функционировании анализируемого субъекта хозяйствования с целью принятия оптимальных управленческих...

Образование соседних чисел Фрагмент: Программная задача: показать образование числа 4 и числа 3 друг из друга...

Функциональные обязанности медсестры отделения реанимации · Медсестра отделения реанимации обязана осуществлять лечебно-профилактический и гигиенический уход за пациентами...

Определение трудоемкости работ и затрат машинного времени На основании ведомости объемов работ по объекту и норм времени ГЭСН составляется ведомость подсчёта трудоёмкости, затрат машинного времени, потребности в конструкциях, изделиях и материалах (табл...

Гидравлический расчёт трубопроводов Пример 3.4. Вентиляционная труба d=0,1м (100 мм) имеет длину l=100 м. Определить давление, которое должен развивать вентилятор, если расход воздуха, подаваемый по трубе, . Давление на выходе . Местных сопротивлений по пути не имеется. Температура...

Studopedia.info - Студопедия - 2014-2024 год . (0.009 сек.) русская версия | украинская версия