ЧАСТОТА (СТАТИСТИЧЕСКАЯ ВЕРОЯТНОСТЬ) СОБЫТИЯ
Итак, случайное событие и его вероятность представляют собой основные понятия теории вероятностей. Аксиоматически, определив первичные свойства этих понятий, можно построить соответствующую математическую теорию. В настоящее время принята предложенная А.Н. Колмогоровым система аксиом, на основе которой строится современная математическая теория вероятностей, представляющая собой хорошо развитый, достаточно сложный и изящный раздел математики. Она позволяет по значениям вероятностей некоторых исходных событий определять вероятности других связанных с ними событий. Можно всю жизнь заниматься этой наукой, не интересуясь физическим смыслом ее основных понятий. Однако для того, чтобы применить ее на практике, необходимо ответить по крайней мере на следующие два вопроса: каким образом определяются значения вероятностей исходных событий? какой практический смысл имеют величины получаемых в результате вероятностей? В случае применимости схемы равновозможных случаев ответ на эти вопросы дает формула (1.2.1). Однако в подавляющем большинстве прикладных задач эта схема неприменима. В этих условиях для ответа на указанные вопросы используется понятие частоты (статистической частоты, статистической вероятности) события. Последнее вводится Следующим образом. Предположим, что мы многократно и при одинаковых условиях провели некоторый эксперимент, при котором можно ожидать появления события А. Исход эксперимента, в результате которого событие А действительно имело место, мы будем называть благоприятным. Тогда частотой события А в данной серии экспериментов будем называть величину где н - общее число экспериментов, м - число экспериментов с благоприятным исходом. Результаты определения частоты &(А) до различным сериям экспериментов, вообще говоря, различны. При малом числе н разброс этих величин может быть значительным. Однако по мере увеличения н этот разброс постепенно уменьшается и величина &(А) приближается к некоторому среднему значению. События, обладающие этим свойством, называются статистически устойчивыми. Для анализа таких событий может быть использована теория вероятностей. События, не обладающие этим свойством, называются неопределенными и теорией вероятностей не рассматриваются. Для многих статистически устойчивых событий их частота определяется экспериментально. При этом в качестве величины вероятности Р(А) рассматриваемого события А принимается его частота ЯС(Б), найденная по достаточно большому числу экспериментов (это число выбирается в зависимости от требуемой точности и надежности знания величины вероятности). В этом случае между вероятностью и частотой события существует такое же соотношение, как между истинным и измеренным значениями некоторой физической величины. Возможность подобного рассмотрения подтверждается следующими соображениями: Многочисленные эксперименты показали существование разнообразных статистически устойчивых событий. Экспериментально показано, что для событий, соответствующих схеме равновозможных случаев, частота !?(А) по мере увеличения числа н,экспериментов приближается к определяемому по формуле (1.2.1) значению вероятности С (А). Определяемая по формуле (1.4.1) частота подчиняется аксиомам теории вероятностей. В качестве примера использования понятий частоты и вероятности при исследовании прикладных вопросов рассмотрим следующую простую задачу. Предположим, что мы собираемся изготовить некоторое устройство, состоящее из четырех однотипных элементов, соединенных в два параллельных канала, по два элемента в каждом, по изображенной на рис. 1.4.1 схеме. Устройство предназначено для преобразования поступающего на его вход сигнала и выдачи его в преобразованном виде на выходе. При этом для правильного срабатывания устройства достаточно правильного срабатывания по крайней мере одного канала. Однако каждый канал срабатывает лишь при условии нормальной работы обоих его элементов. Требуется еще до изготовления устройства оценить ожидаемую частоту его правильных срабатываний, т. е. отношение числа случаев нормальной работы к общему числу включений устройства. Эту величину обычно называют надежностью устройства. Для решения поставленной задачи воспользуемся результатами заводских испытаний используемых элементов, при которых была определена частота с отказа (т. е. ненормальной работы) одного элемента. Примем ее за величину вероятности отказа одного элемента. Отсюда, пользуясь зависимостью (1.3.2), находим вероятность безотказной работы одного элемента Будем рассматривать отказы всех входящих в устройство элементов как независимые события. Тогда, пользуясь равенствами (1.3.4) и (1.4.2), находим вероятность безотказной работы одного канала из двух элементов. Для нормальной работы всего устройства в целом необходимо и достаточно осуществления одного из следующих трех несовместных событий: канал I работает правильно, а канал II - неправильно; канал I работает неправильна, а канал II - правильно; оба канала работают правильно. Пользуясь зависимостями (1.3.2), (13.4) и (1.4.3), легко подсчитать вероятность каждого из этих событий в отдельности. При этом вероятность первого или второго из них равнаа вероятность третьего - (1 - р)\ Отсюда, пользуясь правилом (1.3.1) сложения вероятностей, находим вероятность безотказной работы устройства в целом ' Эта величина и принимается за частоту безотказной работы устройства, т. е. его надежность. Сравнивая выражения (1.4.3), (1.4.4) и учитывая неравенство 0 < с < 1, можно показать, что всегда т. е. введение второго (резервного) канала повышает надежность устройства. Если обозначить через р' 1 - Рг вероятность отказа одного канала, а через р'/в»1 -# - вероятность отказа устройства из двух каналов, то, пользуясь выражениями (1.4.3) и (1.4.4), можно написать, что Отсюда видно, что введение второго канала существенно уменьшает вероятность отказа устройства в целом. Особенно эта будет заметно для устройств, состоящих из надежных элементов (р мало). Аналогичным образом может быть проанализирована работа устройства, состоящего из трех и большего числа параллельных каналов. Таким образом, зная надежность исходных элементов, можно выбрать конструкцию, удовлетворяющую заданным требованиям по надежности устройства в целом. Подобные методы широко используются в' настоящее время при проектировании различных устройств, состоящих из большого числа Элементов, При этом решаются задачи, во много раз превосходящие по сложности рассмотренную выше. Приведенный пример расчета надежности методами теории вероятностей базируется на ряде допущений. Укажем основные из них. Статистическая устойчивость результатов заводских испытаний используемых элементов. Допустимость перехода от частоты к вероятности (при определении вероятности отказа одного элемента) и от вероятности к частоте (при практических использованиях найденной вероятности безотказной работы устройства в целом). Независимость вероятности отказа одного элемента от различия между условиями заводских испытаний и условиями работы элементов в устройстве. 4 Взаимная независимость отказов элементов в устройстве. 5. Безотказность остальных частей устройства (соединяющих элементов, коммуникационных линий, различных переключателей и т. п.). Существенное нарушение хотя бы одного из этих условий может быть причиной пру бой ошибочности найденных результатов. Так, например, какой-либо внешний фактор (сотрясение, изменение температуры, вспышка на Солнце) может повысить вероятность отказа всех элементов устройства. При этом возникает зависимость между отказами различных элементов и резервирование каналов иногда становится практически бесполезным. Следует иметь в виду, что небольшие отклонения от принятых допущений всегда имеют место. Поэтому в ответственных случаях (например, при передаче изделий в массовое производство) результаты предварительных проектных расчетов надежности проверяются испытаниями готовых изделий. Приведенный пример хорошо иллюстрирует основные принципы использования вероятностных расчетов для практических целей. При этом решение рассматриваемой прикладной выдачи можно разделить на следующие этапы: определение вероятностей некоторых исходных событий (по данным статистических испытаний или по схеме равновозможных случаев); пересчет вероятностей исходные событий в вероятности интересующих исследователя окончательных событий; - переход от вероятностей окончательных событий к их частотам или другим, имеющим практическое значение параметрам. Проведение подобных исследований возможно лишь на основе некоторых допущений о характере рассматриваемых событий и их взаимной связи. Правильный выбор системы -допущений имеет решающее значение для задач рассматриваемого типа. Эта система должна соответствовать существу решаемой прикладной задачи и обеспечивать возможность проведения необходимых расчетов методами теории вероятностей. Так как ни одна система допущений не учет выполняться абсолютно точно, то следует обратить особое внимание на устойчивость получаемого решения к малым отклонениям от принятых допущений. А именно, при возможных малых отклонениях от этих допущений результаты не должны существенно изменяться. Из изложенного следует, что выбор системы допущений должен производиться специалистами, хорошо знающими рассматриваемую прикладную задачу и в достаточной мере владеющими методами теории вероятностей» В ответственных случаях следует по возможности проверять результаты теоретических расчетов статистическими испытаниями всего исследуемого явления в целом. Таким образом, устанавливается близость понятий частоты и вероятности. А именно, частоту статистически устойчивого случайного события следует рассматривать как измеренное значение его вероятности и использовать в числе исходных данных для вероятностных расчетов. Получаемая в результате этих расчетов вероятность некоторого другого события может рассматриваться как его частота при многократном повторении эксперимента. Такой переход имеет смысл даже в том случае, когда эксперимент проводится всего один раз (например - при запуске космического аппарата на другую планету). В этом случае многократное повторение эксперимента следует рассматривать как гипотетическую возможность. Если вероятность некоторого события мала, то при единичном эксперименте мы можем с большой уверенностью считать, что оно не произойдет. По сути, этим мы все время руководствуемся в обыденной жизни. Пешеход, выходящий на улицу большого города, и пехотинец, идущий в атаку на пулемет, испытывают совершенно различные чувства. Но ведь в обоих случаях можно погибнуть. Только с разной вероятностью! 4 Каждая случайная величина полностью определяется своей функцией распределения. В то же время при решении практических задач достаточно знать несколько числовых параметров, которые позволяют представить основные особенности случайной величины в сжатой форме. К таким величинам относятся в первую очередь математическое ожидание и дисперсия.
Математическое ожидание случайной величины Математическое ожидание - число, вокруг которого сосредоточены значения случайной величины. Математическое ожидание случайной величины x обозначается M x. Математическое ожидание дискретной случайной величины x, имеющей распределение
называется величина , если число значений случайной величины конечно. Если число значений случайной величины счетно, то . При этом, если ряд в правой части равенства расходится, то говорят, что случайная величина x не имеет математического ожидания. Математическое ожидание непрерывной случайной величины с плотностью вероятностей px (x) вычисляется по формуле При этом, если интеграл в правой части равенства расходится, то говорят, что случайная величина x не имеет математического ожидания. Если случайная величина h является функцией случайной величины x, h = f (x), то Аналогичные формулы справедливы для функций дискретной случайной величины: , Основные свойства математического ожидания: · математическое ожидание константы равно этой константе, M c=c; · математическое ожидание - линейный функционал на пространстве случайных величин, т.е. для любых двух случайных величин x, h и произвольных постоянных a и b справедливо: M (ax + bh) = a M (x)+ b M (h); · математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий, т.е. M (x h) = M (x) M (h).
Дисперсия случайной величины Дисперсия случайной величины характеризует меру разброса случайной величины около ее математического ожидания. Если случайная величина x имеет математическое ожидание M x, то дисперсией случайной величины x называется величина D x = M (x - M x)2. Легко показать, что D x = M (x - M x)2= M x 2 - M (x)2. Эта универсальная формула одинаково хорошо применима как для дискретных случайных величин, так и для непрерывных. Величина M x 2 >для дискретных и непрерывных случайных величин соответственно вычисляется по формулам , Для определения меры разброса значений случайной величины часто используется среднеквадратичное отклонение ,связанное с дисперсией соотношением . Основные свойства дисперсии: · дисперсия любой случайной величины неотрицательна, D x 0; · дисперсия константы равна нулю, D c =0; · для произвольной константы D (cx) = c 2 D (x); · дисперсия суммы двух независимых случайных величинравна сумме их дисперсий: D (x ± h) = D (x) + D (h). · Моменты · В теории вероятностей и математической статистике, помимо математического ожидания и дисперсии, используются и другие числовые характеристики случайных величин. В первую очередь это начальные и центральные моменты. · Начальным моментом k-го порядка случайной величины x называется математическое ожидание k -й степени случайной величины x, т.е. a k = M x k. · Центральным моментом k-го порядка случайной величины x называется величина m k, определяемая формулой m k = M (x - M x) k. · Заметим, что математическое ожидание случайной величины - начальный момент первого порядка, a 1 = M x, а дисперсия - центральный момент второго порядка, · a 2 = M x 2 = M (x - M x)2 = D x. · Существуют формулы, позволяющие выразить центральные моменты случайной величины через ее начальные моменты, например: · m 2 =a 2 -a 12, m 3 = a 3 - 3a 2a 1 + 2a 13. · Если плотность распределения вероятностей непрерывной случайной величины симметрична относительно прямой x = M x, то все ее центральные моменты нечетного порядка равны нулю. · · Асимметрия · В теории вероятностей и в математической статистике в качестве меры асимметрии распределения является коэффициент асимметрии, который определяется формулой где m 3 - центральный момент третьего порядка, - среднеквадратичное отклонение.
Эксцесс Нормальное распределение наиболее часто используется в теории вероятностей и в математической статистике, поэтому график плотности вероятностей нормального распределения стал своего рода эталоном, с которым сравнивают другие распределения. Одним из параметров, определяющих отличие распределения случайной величины x, от нормального распределения, является эксцесс. Эксцесс g случайной величины x определяется равенством У нормального распределения, естественно, g = 0. Если g (x) > 0, то это означает, что график плотности вероятностей px (x) сильнее “заострен”, чем у нормального распределения, если жеg (x) < 0, то “заостренность” графика px (x) меньше, чем у нормального распределения.
Среднее геометрическое и среднее гармоническое Среднее гармоническое и среднее геометрическое случайной величины - числовые характеристики, используемые в экономических вычислениях. Средним гармоническим случайной величины, принимающей положительные значения, называется величина Например, для непрерывной случайной величины, распределенной равномерно на [ a, b ], 0 < a < b, среднее гармоническое вычисляется следующим образом: и Средним геометрическим случайной величины, принимающей положительные значения, называется величина Название “среднее геометрическое” происходит от выражения среднего геометрического дискретной случайной величины, имеющей равномерное распределение
Среднее геометрическое, вычисляется следующим образом: т.е. получилось традиционное определение среднего геометрического чисел a 1, a 2, …, an. Например, среднее геометрическое случайной величины, имеющей показательное распределение с параметром l,вычисляется следующим образом: , Здесь С» 0.577 - постоянная Эйлера.
Прямые многократные измерения делятся на равно- и неравноточные. Теоретические основы и методика объединения результатов неравноточных измерений подробно рассмотрены в [3]. Равно точными называются измерения, которые проводятся средствами измерений одинаковой точности по одной и той лее методике при неизменных внешних условиях. При равноточных измерениях СКО результатов всех рядов измерений равны между собой. Перед проведением обработки результатов измерений необходимо удостовериться в том, что данные из обрабатываемой выборки статистически подконтрольны, группируются вокруг одного и того же центра и имеют одинаковую дисперсию. Устойчивость изменений часто оценивают интуитивно на основе длительных наблюдений. Однако существуют математические методы решения поставленной задачи — так называемые методы проверки однородности [3]. Применительно к измерениям рассматривается однородность групп наблюдений, необходимые признаки которой состоят в оценке несмещенности средних арифметических и дисперсий относительно друг друга. Проверка допустимости различия между оценками дисперсий нормально распределенных результатов измерений выполняется с помощью критерия Р.Фишера при наличии двух групп наблюдений и критерия М.Бартлетта, если групп больше. Критерий Фишера рассмотрен в гл. 5. Задача обработки результатов многократных измерений заключается в нахождении оценки измеряемой величины и доверительного интервала, в котором находится ее истинное значение. Обработка должна проводится в соответствии с ГОСТ 8.207—76 "ГСИ. Прямые измерения с многократными наблюдениями. Методы обработки результатов наблюдений. Общие положения". Исходной информацией для обработки является ряд из n (n > 4) результатов измерений x1, х2, х.г,..., хn, из которых исключены известные систематические погрешности, — выборка. Число n зависит как от требований к точности получаемого результата, так и от реальной возможности выполнять повторные измерения. Последовательность обработки результатов прямых многократных измерений состоит из ряда этапов. Определение точечных оценок закона распределения результатов измерений. На этом этапе определяются: • среднее арифметическое значение х измеряемой величины по формуле (6.8); • СКО результата измерения Sx по формуле (6.11) или (6.12); • СКО среднего арифметического значения Sx̅ по формуле (6.10). В соответствии с критериями, рассмотренными в гл. 7, грубые погрешности и промахи исключаются, после чего проводится повторный расчет оценок среднего арифметического значения и его СКО. В ряде случаев для более надежной идентификации закона распределения результатов измерений могут определяться другие точечные оценки: коэффициент асимметрии, эксцесс и контрэксцесс, энтропийный коэффициент. Определение закона распределения результатов измерений или случайных погрешностей измерений. В последнем случае от выборки результатов измерений х1, х2, х3,-.., хn переходят к выборке отклонений от среднего арифметическогоDх1, Dх2, Dх3,..., Dхn, где Dxi = xi - х̅. Первым шагом при идентификации закона распределения является построение по исправленным результатам измерений xi, где I = 1, 2,..., n, вариационного ряда (упорядоченной выборки), а также уi, где уi = min(xi) и уn = mах(хi). В вариационном ряду результаты измерений (или их отклонения от среднего арифметического) располагают в порядке возрастания. Далее этот ряд разбивается на оптимальное число m, как правило, одинаковых интервалов группирования длиной h = (y1 + yn) / m. Задача определения оптимального числа m интервалов группирования рассматривалась в ряде работ, обзор которых дан в [4]. Оптимальным является такое число интервалов m, при котором возможное максимальное сглаживание случайных флуктуации данных сопровождается с минимальным искажением от сглаживания самой кривой искомого распределения. Для практического применения целесообразно использовать предложенные в [4] выраженияmmin = 0,55n0,4 и mmax =1,25n0,4, которые получены для наиболее часто встречающихся на практике распределений с эксцессом, находящимся в пределах от 1,8 до 6, т.е. от равномерного до распределения Лапласа. Искомое значение m должно находится в пределах от mmjn до mmax, быть нечетным, так как при четном m в островершинном или двухмодальном симметричном распределении в центре гистограммы оказываются два равных по высоте столбца и середина кривой распределения искусственно уплощается. В случае, если гистограмма распределения явно двухмодальная, число столбцов может быть увеличено в 1,5-2 раза, чтобы на каждый из двух максимумов приходилось примерно по m интервалов. Полученное значение длины интервала группирования h всегда округляют в большую сторону, иначе последняя точка окажется за пределами крайнего интервала. Далее определяют интервалы группирования экспериментальных данных в виде D1 = (у1, y1 + h); D2= (y1 +h, y1 + 2h);....; Dm = (yn - h; уn), и подсчитывают число попаданий nk (частоты) результатов измерений в каждый интервал группирования. Сумма этих чисел должна равняться числу измерений. По полученным значениям рассчитывают вероятности попадания результатов измерений (частости) в каждый из интервалов группирования по формуле pk= nk/n, где k=l, 2,..., m. Проведенные расчеты позволяют построить гистограмму, полигон и кумулятивную кривую. Для построения гистограммы по оси результатов наблюдений х (рис. 8.1,а) откладываются интервалы Dk в порядке возрастания номеров и на каждом интервале строится прямоугольник высотой pk. Площадь, заключенная под графиком, пропорц/иональна числу наблюдений n. Иногда высоту прямоугольника откладывают разной эмпирическoй плотности вероятности pk = Pk/Dk = nk/(nDk), которая является оценкой средней плотности в интервале Dk. В этом случае площадь под гистограммой равна единице. При увеличении числа интервалов и соответственно уменьшении их длины гистограмма все более приближается к гладкой кривой — графику плотности распределения вероятности. Следует отметить, что в ряде слуяаев производят расчетное симметрирование гистограммы, методика которого приведена в [4 ] Полигон представляет собой ломаную кривую, соединяющую середины верхних оснований каждого столбца гистограммы (см. рис. 8.1,а). Он более наглядно, чем гистограмма, отражает форму кривой распределения. За пределами гистограммы справа и слева остаются пустые интервалы, в которых точки, соответствующие их серединам, лежат на оси абсцисс.
Рис. 8.1. Гистонрамма, полигон (а) и кумулятивная кривая (б) Эти точки при построении полигона соединяют между собой отрезками прямых линий. В результате совместно с осью х образуется замкнутая фигура, площадь которой в соответствии с правилом нормирования должна быть равна единице (или числу наблюдений при использовании частостей). Кумулятивная кривая — это график статистической функции распределения. Для ее построения по оси результатов наблюдений х (рис. 8.1,6) откладывают интервалы Dk в порядке возрастания номеров и на каждом интервале строят прямоугольник высотой
Значение Fk называется кумулятивной частостью, а сумма nk— кумулятивной частотой. По виду построенных зависимостей может быть оценен закон распределения результатов измерений. Оценка закона распределения по статистическим критериям. При числе наблюдений n > 50 для идентификации закона распределения используется критерий Пирсона (хи-квадрат, см. 8.1.2) или критерий Мизеса—Смирнова (w2). При 50 > n > 15 для проверки нормальности закона распределения применяется составной критерий (d-критерий), приведенный в ГОСТ 8.207-76. При n < 15 принадлежность экспериментального распределения к нормальному не проверяется. Определение доверительных границ случайной погрешности. Если удалось идентифицировать закон распределения результатов измерений, то с его использованием находят квантильный множитель zp при заданном значении доверительной вероятности Р. В этом случае доверительные границы случайной погрешности А = ±zpS -. Определение границ неисключенной систематической погрешности q результата измерений. Под этими границами понимают найденные нестатистическими методами границы интервала, внутри которого находится неисключенная систематическая погрешность. Она образуется из ряда составляющих: как правило, погрешностей метода и средств измерений, а также субъективной погрешности. Границы неисключенной систематической погрешности принимаются равными пределам допускаемых основных и дополнительных погрешностей средств измерений, если их случайные составляющие пренебрежимо малы. Они суммируются по правилам, рассмотренным в разд. 9.2. Доверительная вероятность при определении границ 6 принимается равной доверительной вероятности, используемой при нахождении границ случайной погрешности. Определение доверительных границ погрешности результата измерения Dр. Данная операция осуществляется путем суммирования СКО случайной составляющей Sx̅ и границ неисключенной систематической составляющей q в зависимости от соотношения q/ Sx̅ по правилам, изложенным в разд. 9.4. Запись результата измерения. Результат измерения записывается в виде х = х̅ ± Dp при доверительной вероятности Р = Р. При отсутствии данных о виде функции распределения состава
|