Занятие №5. Тема: «Методы сравнительной статистики»
Тема: «Методы сравнительной статистики» Наиболее часто встречающейся и достаточно сложной математико-статистической задачей является сравнение данных, полученных в процессе наблюденийили экспериментов, в выборочных совокупностях. Исследователь старается описать результаты наблюдения количественными методами и «на выходе» получает числовой массив тех или иных доступных ему измерений – вариационный ряд. Однако, как правило, содержащаяся в результатах измерений содержательная информация, имеет гораздо большую ценность при сравнении ее с аналогичной информацией, но полученной некоторым иным образом. Например, это может быть ситуация сравнения опытных данных (когда мы как-то повлияли на изучаемый объект или явление) с контрольной группой, в которой никакого воздействия на объект наблюдения не было. Возможно и сравнение двух вариантов опытов. Возможно сравнение двух серий наблюдений, разделенных в пространстве и времени и т.п. Допустим, что удается заметить какие-либо численные различия в характеристиках сравниваемых рядов. Первым делом возникает вопрос: какова вероятность, что эти различия неслучайны и будут систематически повторяться в дальнейшем при воспроизведении условий эксперимента или наблюдения, т.е. выявленные различия являются статистически значимыми.
Выбор подходящего метода сравнения выборочных совокупностей определяется несколькими факторами: характером сравниваемых признаков (качественные или количественные), числом сопоставляемых групп, зависимостью или независимостью выборок, а также видом распределения признака. Выборки являются независимыми, если набор объектов исследования в каждую из групп осуществлялся независимо от того, какие объекты исследования включены в другую группу. Так, в частности, происходит при рандомизации, когда распределение объектов происходит случайным образом. Примером сравнения независимых выборок может служить сопоставление данных анализа крови в группе пациентов с аналогичными показателями в группе здоровых. Группы являются зависимыми (связанными) в динамических исследованиях, когда изучаются одни и те же объекты в разные моменты времени. Например, показатели анализа крови у одних и тех же пациентов до и после лечения. От вида распределения и типа исследуемого признака зависит выбор подходящего математико-статистического критерия. Критерии делятся на два типа – параметрические и непараметрические. Параметрические критерии – критерии, основанные на оценке параметров распределения, к которым относятся среднее арифметическое, среднеквадратическое отклонение, дисперсия. Они применимы только в том случае, если численные данные подчиняются нормальному распределению. Если распределение отличается от нормального, то следует пользоваться так называемыми непараметрическими критериями. Непараметрические критерии не основаны на оценке параметров распределения и вообще не требуют, чтобы данные подчинялись какому-то определенному типу распределения. Непараметрические критерии дают более грубые оценки, чем параметрические, но являются более универсальными. А параметрические методы более точны, но лишь в случае, если правильно определено распределение совокупности.
Перед тем как перейти к рассмотрению статистических критериев, введем понятия нулевой и альтернативной гипотез, которые нам потребуются в дальнейшем. На каждом шаге процесса анализа данных выдвигаются две гипотезы. Первая обозначается Нулевая гипотеза не может быть отвергнута, если ее вероятность окажется выше некого наперед заданного уровня α, достаточно близкого к 0, т.е. Альтернативная гипотеза Поскольку Например, в процессе исследования ставится задача доказать наличие статистически значимых различий между результатами наблюдений в опытной и контрольной группах. Это значит, что данные, полученные при применении того или иного статистического критерия, должны позволить отвергнуть нулевую гипотезу об отсутствии указанных различий.
|