Студопедия — Представление статистических данных в научных публикациях
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Представление статистических данных в научных публикациях






Обоснование объема выборки. Описание участников проведенного исследования должно сопровождаться обоснованием численности выборки, которое является обязательным этапом разработки дизайна проекта. Дело в том, что недостаточный объем выборки увеличивает ошибку выборочных характеристик и может не позволить выявить эффекты там, где они действительно есть, и соответственно, привести к неправильным выводам. С другой стороны слишком большие численности участников приводят к неоправданным финансовым и другим затратам на исследование. Мы уже указывали, что объем выборки зависит от минимального «клинического» эффекта, дисперсии изучаемой величины, мощности используемого критерия и уровня значимости α. Примерная формулировка может звучать таким образом: «Потребовалось 54 пациента в каждой группе, чтобы иметь 85% шанс обнаружить разницу в средних значениях пульса в 10 уд/мин (s=18 уд/мин) при 5% уровне значимости, применяя непараметрический критерий Мана-Уитни».

Если анализируется несколько признаков (пульс, давление, гемоглобин…) и для каждого из них определяется свой объем выборки, то исследователь может в качестве окончательного выбрать наибольшую из всех рассчитанных численностей, или же задать объем выборки, рассчитанный для главного признака - исходя из основной гипотезы.

Оценка закона распределения. Далее желательно указать закон распределения величин, поскольку от этого зависит обоснованность критериев, применяемых для проверки гипотез. Если объем выборки более 30, то можно проверить гипотезу о нормальности распределения одним из известных вам способов, причем проверку необходимо осуществить в каждой группе. Например, «нормальность распределения проверялась по критическим значениям коэффициентов ассиметрии и эксцесса, результаты, приведенные в таблице, позволяют принять нулевую гипотезу о нормальном распределении».

 

п =50 125,04 As =0,424 Ex =-0,655 α;=0,05 As крит=0,533 Ex крит=0,848 P>0,05

 

Или: «Нормальность распределения проверялась по критерию хи-квадрат, по результатам нулевая гипотеза о нормальности была отвергнута (p=0,03)».

Проверку на нормальность должна пройти каждая из анализируемых признаков.

Если объем выборки мал и не позволяет провести такую проверку, то нужно помнить, что в дальнейшем для сравнительного анализа можно использовать только непараметрические критерии.

Описательная статистика. Как правило, для описания количественных данных используются такие статистические характеристики как средняя, мода, медиана, дисперсия и т.д. При нормальном распределении совокупности применяются среднее значение и среднеквадратичное отклонение (стандартное отклонение) s. Стандартное отклонение дает нам представление, в каких пределах лежат данные генеральной совокупности, так 95,44% всех значений лежит в интервале . Необходимо также указать доверительный интервал для среднего - по нему можно оценить, насколько точно оно определено. Для этого предварительно рассчитывается стандартная ошибка среднего m. Если доверительный интервал широкий, то средняя оценена неточно и это может быть связано с недостаточным объемом выборки, или же с большим разбросом данных (дисперсией). Полезно рассчитать коэффициент вариации - при V%>33% совокупность считается неоднородной, тогда необходимо проверить, насколько репрезентативна выборка и нет ли аномальных выбросов. Результаты расчетов наглядно могут быть представлены в следующей таблице.

 

  n (мкмоль/л) s (мкмоль/л) -95%ДИ (мкмоль/л) +95%ДИ (мкмоль/л)
1 группа   21,3   21,0 21,6
2 группа   28,5   26,9 30,1

 

Если распределение случайной величины не соответствует нормальному закону, то в качестве характеристики положения используется медиана, в качестве характеристики разброса – межквартильный размах, а также указываются минимальное и максимальное значения, чтобы определить наличие выбросов. Из приведенной ниже таблицы видно, что в первой группе в середине ранжированного ряда находится величина 4,0 ммоль/л, 50% данных лежит в пределе от 3,3 до 6,0 ммоль/л, максимальное значение 10,5 ммоль/л является явно аномальной. Во второй группе в целом разброс данных больше (∆Q= 5,3)и величину 10,5 уже нельзя считать выбросом.

 

  n Ме (ммоль/л) Мin (ммоль/л) Max (ммоль/л) Q25 (ммоль/л) Q75 (ммоль/л) ∆Q (ммоль/л)
1 гр.   4,0 1,2 10,5 3,3 6,0 2,7
2 гр.   5,2 2,6 10,5 4,0 9,3 5,3

 

Описание качественных признаков. При анализе качественных номинальных признаков, как правило, подсчитывается доля (частота встречаемости) объектов с заданными свойствами. Доля представляется в виде относительных величин или процентов. Наряду с долей необходимо указывать и абсолютные значения, а для самой доли определить доверительный интервал

 

 

всего опрошено женщин доля курящих -95% ДИ +95% ДИ  
  10% (102/1020) 8,2% 11,8%  
 

 

Иногда, при малых выборках, меньше 10, получается нулевой или 100% эффекты, которые маловероятны. Например, из девяти опрошенных женщин никто не курит – доля равна нулю, ошибка доли также равна нулю. Отсюда можно сделать неправильный вывод, что все женщины некурящие. В этом случае необходимо воспользоваться поправкой на нулевой эффект.

Итоги проверки гипотез. Важное место в любом исследовании занимает процесс сравнения различных совокупностей. Если признаки имеют нормальное распределение, то такое сравнение можно осуществить на основе средних значений с использованием параметрических критериев. Наиболее известным из них является критерий Стъюдента. Нельзя забывать, что его применение требует также и равенства генеральных дисперсий, которое можно проверить по критерию Фишера. При соблюдении всех условий результаты расчетов можно представить в следующем виде

 

  n s -95% ДИ +95% ДИ t-Стъюдента р-уровень
1 гр.   119,1 13,9 -3,4 -6,7 -0,1 -2,67 <0,05
2 гр.   122,5 16,3

 

Из таблицы видно, насколько различаются средние значения, по р- уровню можно оценить статистическую значимость этого различия (при использовании статистических программ лучше указывать конкретное значение достигнутого уровня значимости, например р =0,002). Доверительный интервал показывает, в каких пределах лежит истинная, генеральная разница, а верхний и нижний его пределы позволяют дать «клиническую» оценку этой разнице.

Надо отметить, что в медицинских исследованиях в силу ряда ограничений обычно доступны небольшие выборки, а среди совокупности «больных» нормальное распределение встречается редко. Поэтому приоритет необходимо отдавать непараметрической статистике. При использовании непараметрических критериев результаты описываются на основе медиан и квартилей, например

 

  n Ме (мг) ∆Ме (мг) Q25 (мг) Q75 (мг) U-критерий Мана-Уитни р-уровень
1 гр.   4,0 -1,2 3,3 6,0   0,023
2 гр.   5,2 4,0 9,3

 

Различия между группами хорошо воспринимаются при графическом представлении данных. Различные возможные варианты показаны на рисунке. Не забывайте поместить на графике «легенду» (условные обозначения), так как графики могут нести различную информацию. Если на первом графике представлены средняя, стандартное отклонение, минимальное и максимальное значения, на втором – среднее и доверительный интервал, то на третьем – медиана и квартили.


Итоговая информация по результатам сравнения долей должна содержать данные по абсолютным и относительным показателям, а также доверительный интервал для разницы долей.

 

регион всего больных доля инфекц. заболеваний разность долей -95% ДИ +95% ДИ t-Стъюдента р-уровень
    20% (104/520) -17% -22,8% -11,2% -3,25 0,012
    37% (148/400)

 

Доли сравниваются как по критерию Стъюдента, так и по критерию хи-квадрат. В случае таблицы 2×2 необходимо учитывать поправку Йетса и упомянуть об этом в тексте. Если таблица содержит ячейку с менее чем 5 случаями, используйте точный критерий Фишера. Силу связи между номинальными признаками оценивают коэффициенты Юла и фи-квадрат. Результаты расчетов можно свести в следующую таблицу

 

  Столбец 1 Столбец 2 Всего
Частоты, строка 1      
% случаев 5,7 % 6,6 % 12,3 %
Частоты, строка 2      
% случаев 15,7 % 72 % 87,76 %
Всего      
% всего 21,4 % 78,6 %  
Хи-квадрат (f=1) 107,99 p=0,0000  
Поправка Йетса 106,32 p=0,0000  
Фи-квадрат ,05113    
Точный критерий Фишера, одностор.   ----  
Точный критерий Фишера, двустор.   ----  
Хи-квадрат Макнемара 1193,42 p=0,0000  

 

Множественные сравнения. Довольно часто возникает задача сравнения не двух групп, а нескольких – так называемая задача множественных сравнений. Например, различных возрастных, профессиональных, социальных слоев населения, или влияния различных доз препарата, методов диагностики и т.д. В этом случае рекомендуется на начальном этапе провести факторный дисперсионный анализ, который позволяет ответить на вопрос, есть ли хотя бы одно отличие между сравниваемыми группами. Нулевая гипотеза о равенстве всех средних (медиан) проверяется по параметрическому критерию Фишера или непараметрическому аналогу – критерию Крускала-Уолиса

 

  D f F-Фишера р-уровень
Межгрупповая дисперсия 4600,5   38,7 0,004
Внутригрупповая дисперсия 118,8  

 

Пакеты прикладных программ по статанализу содержат процедуру Тьюки - это процедура множественных попарных сравнений, применяемая в тех случаях, когда дисперсионный анализ указывает на статистически значимую разность между группами. Таким образом, можно выяснить конкретно какие группы отличаются друг от друга.

Как пример, результаты попарных сравнений 6 групп сведены в таблицу, в которой указаны средние по группам и значения р -уровня.

 

группа {1} {2} {3} {4} {5} {6}
  =93,2 =80,7 =70,4 =77,3 =80,6 =82,7
{1}   0,000 0,000 0,000 0,000 0,010
{2} 0,000   0,000 0,305 1,000 0,988
{3} 0,000 0,000   0,000 0,000 0,001
{4} 0,000 0,305 0,000   0,151 0,529
{5} 0,000 1,000 0,000 0,151   0,985
{6} 0,010 0,988 0,001 0,529 0,985  

 

Корреляционный анализ. Подсчет коэффициента корреляции также достаточно распространенный метод анализа биомедицинских данных. При его использовании необходимо придерживаться следующих положений:

- предварительно следует построить диаграмму рассеяния, чтобы оценить характер взаимосвязи (линейный или нелинейный)

- коэффициент корреляции Пирсона показывает линейную взаимосвязь между количественными признаками, имеющими нормальное распределение

- если распределение не соответствует нормальному, или признаки ординальные, то применимы коэффициенты Спирмена и Кендалла, оценивающие линейные связи

- для таблиц сопряженности также существуют коэффициенты взаимосвязи (например, коэффициент Юла, фи-квадрат)

- следует проверять статистическую значимость коэффициента корреляции и обозначать ее в тексте или таблице

- коэффициент корреляции величина формальная (математическая) и не объясняет причинно-следственную связь, интерпретация его – дело специалиста в предметной области

В таблице ниже приведены попарные коэффициенты корреляции и значения р -уровня. Если принять уровень значимости α=0,05, то r =-0,01 и 0,15 статистически незначимы.

 

  HF% LF% VLF% ULF%
HF%   -0,46 p=0,000 -0,65 p=0,000 -0,56 p=0,000
LF% -0,46 p=0,000   -0,01 p=0,909 -0,26 p= 0,001
VLF% -0,65 p=0,000 -0,01 p=0,909   0,15 p= 0,052
ULF% -0,56 p=0,000 -0,26 p=0,001 0,15 p=0,052  

 

Регрессионный анализ. Прежде чем приступать к нахождению уравнения регрессии убедитесь, что связь между величинами линейна, для этого подходящим является диаграмма рассеяния. Вычислите коэффициент корреляции, если он меньше 0,7, то нет смысла строить математическую модель, ведь даже при таком значении r она объясняет лишь 50% вариаций. Если уравнение регрессии получено, представьте его графически вместе с наблюдаемыми величинами. Обязательным является оценка статистической значимости коэффициентов уравнения и самой модели, например, такая таблица является показательной

 

r = 0,93 R2 =0,87 F (1,8)=54,028 p =0,000
  значение коэффициента станд. ошибка коэффициента t-Стъюдента p-уровень
b0 87,5 1,31 66,8 0,000
b1 -0,05 0,007 -7,3 0,000

 

В случае незначимости коэффициента b1 (что аналогично незначимости самой регрессии) полученное уравнение не может быть использовано в качестве модели взаимосвязи двух величин.

При прогнозировании по уравнению регрессии рекомендуется проводить прогноз в пределах наблюдаемых значений независимой величины. Если прогноз выходит за эти пределы, вы должны быть уверены, что основная тенденция сохранится в будущем, и при этом прогноз не должен превышать 1-3 временных интервала.


 

Приложение 1. Критические значения коэффициента асимметрии As

 

Объем выборки п Уровень значимости α Объем выборки п Уровень значимости α
  0,05 0,01   0,05 0,01
  0,711 1,061   0,251 0,360
  0,661 0,982   0,230 0,329
  0,621 0,921   0,213 0,305
  0,587 0,869   0,200 0,285
  0,558 0,825   0,188 0,269
  0,533 0,787   0,179 0,255
  0,492 0,723   0,171 0,243
  0,459 0,673   0,163 0,233
  0,432 0,631   0,157 0,224
  0,409 0,596   0,151 0,215
  0,389 0,567   0,146 0,208
  0,350 0,508   0,142 0,202
  0,321 0,464   0,138 0,196
  0,298 0,430   0,134 0,190
  0,280 0,403   0,130 0,185

 

Критические значения коэффициента эксцесса Ех

 

Объем выборки п Уровень значимости α
0,10 0,05 0,01
  0,890 0,907 0,936
  0,873 0,888 0,914
  0,863 0,877 0,900
  0,857 0,869 0,890
  0,851 0,863 0,883
  0,847 0,858 0,877
  0,844 0,854 0,872
  0,841 0,851 0,868
  0,839 0,848 0,865
  0,835 0,843 0,859
  0,832 0,840 0,855
  0,830 0,838 0,852
  0,828 0,835 0,848
  0,826 0,834 0,846
  0,818 0,823 0,832
  0,814 0,818 0,826
  0,812 0,816 0,822
  0,810 0,814 0,820

 

Приложение 2. Критические точки двустороннего t-критерия Стьюдента

 

 

 

Число степеней свободы f α Число степеней свободы f α
0,05 0,01 0,005 0,05 0,01 0,005
  12,71 63,66 64,60   2,10 2,88 3,92
  4,30 9,92 31,60   2,09 2,86 3,88
  3,18 5,84 12,92   2,09 2,85 3,85
  2,78 4,60 8,61   2,08 2,83 3,82
  2,57 4,03 6,87   2,07 2,82 3,79
  2,45 3,71 5,96   2,07 2,81 3,77
  2,37 3,50 5,41   2,06 2,80 3,75
  2,31 3,36 5,04   2,06 2,79 3,73
  2,26 3,25 4,78   2,06 2,78 3,71
  2,23 3,17 4,59   2,05 2,77 3,69
  2,20 3,11 4,44   2,05 2,76 3,67
  2,18 3,05 4,32   2,05 2,76 3,66
  2,16 3,01 4,22   2,04 2,75 3,65
  2,14 2,98 4,14   2,02 2,70 3,55
  2,13 2,95 4,07   2,00 2,66 3,46
  2,12 2,92 4,02   1,98 2,62 3,37
  2,11 2,90 3,97 оо 1,96 2,58 3,29

 








Дата добавления: 2015-06-15; просмотров: 799. Нарушение авторских прав; Мы поможем в написании вашей работы!



Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

Интуитивное мышление Мышление — это пси­хический процесс, обеспечивающий познание сущности предме­тов и явлений и самого субъекта...

Объект, субъект, предмет, цели и задачи управления персоналом Социальная система организации делится на две основные подсистемы: управляющую и управляемую...

Законы Генри, Дальтона, Сеченова. Применение этих законов при лечении кессонной болезни, лечении в барокамере и исследовании электролитного состава крови Закон Генри: Количество газа, растворенного при данной температуре в определенном объеме жидкости, при равновесии прямо пропорциональны давлению газа...

Виды сухожильных швов После выделения культи сухожилия и эвакуации гематомы приступают к восстановлению целостности сухожилия...

КОНСТРУКЦИЯ КОЛЕСНОЙ ПАРЫ ВАГОНА Тип колёсной пары определяется типом оси и диаметром колес. Согласно ГОСТ 4835-2006* устанавливаются типы колесных пар для грузовых вагонов с осями РУ1Ш и РВ2Ш и колесами диаметром по кругу катания 957 мм. Номинальный диаметр колеса – 950 мм...

Философские школы эпохи эллинизма (неоплатонизм, эпикуреизм, стоицизм, скептицизм). Эпоха эллинизма со времени походов Александра Македонского, в результате которых была образована гигантская империя от Индии на востоке до Греции и Македонии на западе...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия