Репрезентативность при изучении качественных признаков
Качественные признаки обычно не могут иметь градаций проявления: они или имеются, или не имеются у каждой из особей, например пол, комолость, наличие или отсутствие каких-нибудь особенностей, уродств, выдающихся качеств, хромосомных перестроек, точечных мутаций, заболеваний, исходов болезней и т. д. Принципиальной разницы между количественными и качественными признаками нет. Степень проявлений большинства качественных признаков при более тщательном исследовании может быть измерена, и тогда качественный признак становится количественным. И, наоборот, любой количественный признак может быть выражен в альтернативной форме (например, больше средней и меньше средней) и тогда он для исследователя превратится в качественный признак. При изучении групповых свойств по качественным признакам характеристика группы заключается в указании числа плюсовых и минусовых объектов, т. е. объектов, имеющих и не имеющих признак. Основные сводные показатели: средняя величина и стандартное отклонение качественных признаков имеют, конечно, свои специфические особенности и по технике их расчета и по способам использования в биологических работах. Средняя величина качественного признака в группе – это доля плюсовых объектов, определяемая по формуле: ; (10.21) где р – выборочная доля плюсовых объектов (имеющих изучаемый качественный признак); а – количество плюсовых объектов в группе; n – объем группы. Если группа состоит из 200 особей, из которых 120 самок, то доля самок в группе: . Если долю умножить на 100, то получится характеристика, выраженная в процентах. В генеральной совокупности доля плюсовых объектов выражается такой формулой: , (10.22) где Р – доля плюсовых объектов в генеральной совокупности; А – количество плюсовых объектов; N – объем генеральной совокупности. Сумма квадратов центральных отклонений или дисперсия качественных признаков определяется по формулам: В выборках – C = npq; (10.23) В генеральных совокупностях – ; (10.24) где q = 1 – p; Q = 1 – P – доля минусовых объектов в выборке и в генеральной совокупности. При n = 200, а = 120, p = 0, 6, q = 0, 4 С = 200 × 0, 6 × 0, 4 = 48. Стандартное отклонение качественных признаков определяется по формулам: ; (10.25) . (10.26) Стандартное отклонение качественных признаков имеет принципиальное отличие от сигмы количественных признаков. Произведение pq = p (1 – р) не может быть больше одной четверти: max [pq] = 0, 25 (10.27) Эта максимальная величина произведения доли на свое дополнение до единицы получается при р = 0, 5 и равна 0, 5 × 0, 5 = 0, 25. Всякое другое произведение дает уже меньшую величину, например при р = 0, 4; рq = 0, 4× 0, 6 = 0, 24. Поэтому и стандартное отклонение качественных признаков не может быть больше определенного предела: в выборках: . (10.28) В генеральных совокупностях: (10.29) Наличие верхнего предела сигмы значительно упрощает планирование достаточной численности выборки при изучении качественных признаков. Ошибка репрезентативности доли аналогична ошибке средней и определяется по формуле: , (10.30) Например: при n = 200, а = 120, p = 0, 6, q = 0, 4 . Максимально возможное значение ошибки: . Если в выборке получены крайние значения доли (или 0 или 1, т. е. когда в выборке нет ни одного плюсового объекта или, наоборот, вся выборка состоит из одних плюсовых объектов), то ошибка таких долей определяется по формуле: , (10.31) Если в выборке из 9 объектов не оказалось ни одного плюсового, то р = 0, а sр = 1/10 = 0, 1. В некоторых биологических исследованиях генеральные доли известны или предполагаются известными и все же требуется определить ошибку выборочной доли для выборок разного объема. В таких случаях ошибка доли определяется по точной формуле: , (10.32) где в числителе подкоренного выражения стоит произведение генеральной доли на ее дополнение до единицы, а в знаменателе – полный объем выборки (а не число степеней свободы). Оценка генеральной доли, или определение ее доверительных границ, производится так же, как и оценка генеральной средней: Р = р ± D; D = t × sp (10.33) где Р, р – генеральная и выборочная доли; D = tst × sp – возможная максимальная погрешность при прогнозе генерального параметра; tst – критерий надежности для трех порогов вероятности безошибочных прогнозов (b1 =0, 95, b2 =0, 99, b3 =0, 999) устанавливается так же как и при оценке генеральной средней; или по таблице стандартных значений критерия Стьюдента или по приближенным формулам; sр – ошибка репрезентативности выборочной доли (показатель точности). Пример При исследовании 200 особей одного вида у 60 из них сказалась повышенная способность выдерживать сильное понижение температуры среды обитания. Как часто такие особи могут встретиться среди всей популяции? Для решения этого вопроса достаточно определить доверительные границы генеральной доли; при сходных данных p = 0, 3 ± 0, 066 [не более 0.3 + 0, 066 = 0, 366 ~ 37%; не менее
|