Февраля
Джентльменский набор для статей, курсовых и дипломных и ты Словесное описание данных На уровне описательной статистики средних разбросов Статистический анализ Обсуждения (интерпретации) результатов
Среднее, мода, медиана - это общее описание нашей выборки А дальше это описание мы обосновываваем статистически
Это называется дискриптивный описательный анализ.
Как изменяется одна или несколько зависимых переменных (подытоженные в спсс). Анализ - отчеты - OLAP кубы. Подытоженные переменные - ЗП. Группирующие переменные - независимые (которые группирирует по какому-либо критерию). В виде каких описательных статистик (статистические показатели - среднее, модуль, медиана, дисперсия)? Так показывается, что мы подобрались хорошую группу, адекватную нашему исследованию. В хороших журналах требуют еще и ошибку среднего. Мощное средство группировки данных по НП.
Анализ- описательные статистик - Частоты - Строит графики и диаграммы. Когда нужно быстро охарактерезовать выборку по возрасту или любому другому признаку. Здесь можно и описательные статистики (медиана, среднее, мода) - Важно при описании внешней валидности.
Мера среднего - медиана. Должен использоваться для оценки средних в не количественных данных (в порядковых). Середина ранжированного ряда. Что было в середине.
Мода - когда данные измерены по наминальной шкале. Самое частотное событие для этих данных.
Среднее арифметическое - что среднее
В нормальном распределении мода, медиана и среднее одно и тоже.
Анализ - описательные статистики - описательные (тоже самое, но в виде длинной таблице) Анализ - описательные статистики - разведочный анализ. Посчитать групповых среднее. Разбить выборку. Хочу по уровню НП рассчитать и разбить ЗП. Разбить выборку на несколько групп и посчитать межгрупповые средние (маргинальные- группы, разбитых по уровню какой-либо НП). Разбив по несколько основаниям по группам, мы произвели эксплураторный анализ.
Н0 - различий нет Н1 - различия есть
Парные выборки (связанные) - выборки данных, полученные на одной и той же группы испытуемых. Одни и ту же испытуемые и до того, и после. Например сравнить эффект от тренинга: сначала до тренинга, после, через 5 лет - все равно люди одни и те же. Непарные выборки - полученные на разных выборках, например мужчины и женщины.
Два дизайна - мужгрупповой и внутригрупповой
Важные вопросы перед планированием и обработкой данных? 1. Первый вопрос - какой уровень измерения (номинальный, порядковый...) -> параметрические или не параметрический метод 2. Какой подход -мужгрупповой и внутригрупповой
Анализ - сравнение средних - Т-критерий для независимых выборок (работает только с количественными данными, нет порядковых и номинальных; работает по шкале интервалов). Ограничения - работает с распределения ми, похожими на нормальные. Два распределения - Т-критерий смотрит далеко ли средние друг от друга, сравнивает разницу между средними, деленную на общую дисперсию и кол-во испытуемых. А если распределение сложное (два горба и более)? Т-критерий работает, когда выражено одно среднее. Ярко выражена одна вершина - мономодальное, ровное, без перекосов (эксцессов). Чтобы решить, можно ли использовать Т-критерий, надо нарисовать распределение и посмотреть. Должно быть равно мерное распределение, симметричное относительно своей моды (верхушки). В другом случае используем не параметрический критерий - но они имеют меньшую мощность(способность статистического критерия найти различие, Т-критерий более чувствителен к нахождению различий). На небольших выборках преимущественно используют не параметрические. Выборка > 30 уже большая.
!!!важно посмотреть график распределения своих данных! Сразу видны выбросы недочеты.
Анализ - сравнение средних - одновыборочный Т-критерий. Сравниваем свою выборку со средней литературной. В случае когда повторяем исследование кого-нибудь. Исследование тоже самое, но возраст ваших испытуемых отличается. Вот и проверяем ужасно ли это, сильно ли отличие от выборки изначального автора. 48 лет у русских отличается от среднего возраста по выборке американцев, которые мы нашли в литературе. проверяемое значение - которое теоретически мы нашли где-то в литературе, с которым сравниваемым. Сравнение возраста нашего с литературным источником.
Критерий Ливиня показывает насколько разный разброс. И соответственно показывает, насколько вариативна выборка и насколько возможно использовать Т-критерий. Значимость < 0,05 значит значимо различаются! Т-критерий > 0,05 достоверных значимых различий нет. Конвинциональный уровень значимости <0,05. Квазизначимая или тенденция 0,05-1 "очевидно тенденция есть/ ярко выражена тенденция, но достоверной значимости обнаружено не было"
Анализ - сравнение средних - одновыборочный Т-критерий. Проверка гипотез по сравнению парных выборок. Три повторных измерения на одних и тех же испытуемых. Зависимая выборка, так как это одна и та же группа испытуемых = Т-критерий для парных выборок. Раз они парные, то они конечно скоррелированы. т-критерий (0,6) при значимости (0,6) не достоверно. Нет значимости (Т=0,5; 15(кол-во респондентов); 0,5 (значимость))
Отличается одна из групп от остальных 5?
Уровень значимости - ошибка первого рода - вероятность, что есть ошибка, а ее на самом деле нет. Вероятность ошибки статистического вывода: сказали ДА, а на самом деле НЕТ. Но при таких множетых сравнений (1 со 2, 1 с 3...) уровень ошибки накапливается. Дисперсионный анализ решает задачу множественного сравнения средних. Непараметрический критерий нужен, когда не работает Т-критерий или когда используем низкий уровень измерения - шкала порядка + ранжирование. Одновыборочные критерии - хи-квадрат и критерий Колмогорова -Смирнова (оценивает распределение на нормальность). Уровень распределения > 0.05 нет оснований говорить, что они отличаются от нормальной - Н0 отличия нет. Две независимые выборки - U Манна - Уитни(самый мощный) Критерии для двух связанных выборок - критерий Уилкоксона самый сильный; Знаков работает с ответами "да"/ "нет".
Анализ - непараметрический критерий для сравнения двух выборок (средние они не сравнивают, работают с медианой)
Все критерии различия. Ребят группировки данных!!! Важно запланировать параметры группировки!
Дисперсионный анализ жестко параметрическая процедура!!
21 февраля
Непараметрический метод сравнения двух выборок
Книги наследова base-statistic + отдельные элементы advance (на русском нет) Анализ - непараметрические критерии - для двух независимых выборок - К сравнивать различие между двумя выборками. Надо показать, что в эмпирических данных две выборки отличаются. Надо показать, что переменная медленная отличается от переменной быстро. В спсс первый критерий с галочкой самый сильный. Манна-Уитни похож на Т критерий - сравнение двух не связанных выборок, которою имеют шкалу порядку, но дифференцированную. Оценка по 9.7 батонов шкале - признак оценен градуально, можно Манна-Уитни. Колмогоров-Смирнов - взяты ли два распределения из одной генеральной совокупности? Они похожи друг на друга? Не сравнение средних (Т-критерий), а сравнение сдвига, гипотез. Берется 1 и 2 выборки и объединяться, ранжиру имя - ранги в 1 выборки сильно отличаются от 2, отсюда видим их различие - взяты из разных генеральный совокупностей. Первая выборка отличается от второй на основании (смотрим статистические критерии). Чувствительны еще к формам распределения. Более специфическая. Не только гипотеза о сдвиге, но и различия форм выборок. Менее мощный. Мозес: сравниваем экспериментальную и контрольную группу. Но там и там есть крайние высокие и низкие значения. Это критерий убирает эти экстремальные выбросы и показывает разницу между группами. Эти критерии работают не только с кол-ми данными (интервалы и отношение), но и с порядка, иногда наминальной. Манго-Уитни с номинальной не работает, только с порядковой.
Анализ - не параметрические критерии - Для двух связанных выборок. Уилкоксон как и Манна Уитни работает с дифференцированной шкалой порядка (если предложили шкалу из 5 баллов, то реально будет использовать 2 балла, уменьшать эффект центрации, побуждая еще в инструкции давать и крайние ответы). Два повторных измерения (связанные выборки - до и после тренинга); ранжиру есть; смотрится разница между рангами одного испытуемого до и после тренинга. Есть ли превышение суммы баллов до и после воздействия. Знаков - работает с бинарными данными (да/нет; 0/1), с номинальной шкалой. Сравнивает до тестирования не было, после - было (-), наоборот ((+). Сравнивает плюсы и минусы. МакНемара с мультинаминальная шкала. До тестирования испытуемый делал быстро, но не точно. После тренинга быстро и точно. Отличный или не отличный.
Метрические - интервалов и именований Неметрические - порядка и наминальной
АНОВА (дисперсионный анализ) 1. Сравнить несколько выборок. Т - критерий не делает поправку на уровень значимости при множественном сравнении. 2. Часто психолога интересует не влияние одного фактора (возраст), а совокупного фактора (пола и возраста). Комплексное влияние межфакторного взаимодействия. Влияет ли композиция личностных черт? Надо вычленить это влияния из общего кол- ва данных и посмотреть. Разлагаем общую дисперсию на компоненты (факторы отдельные и на меж факторные взаимодействия)
Требует выделение ЗП и НП. Фактор - НП (пол, возраст, соц. положение, личностные диспозиции). Надо выделять группы испытуемых и назначать их факторами, то есть уровнями НП (1 уровень -экстраверт; 1 - интроверт). Однофакторной - сравнить несколько групп по одному фактору (экстравертов, интровертов с разными группами возрастов) Многофакторный- насколько на ЗП влияет комбинация факторов. Эффект одного фактора - главный эффект (main effect) Эффект совокупного влияния - эффект межфактороного взаимодействия
Линейная модель дисперсионного анализа У=кх+б (одно фактурная модель) У=кх1+кх2 + б(дув факторные модель) Значение У (НП) прогнозирует по значению Х (ЗП)
Показать роль личностный факторов на решение сложных, средних и легких задач.
Анализ - сравнены средних - однофакторняй дисперсионный анализ (аналог Т-критерия при двух группах). Выбираем переменную, которую хотим оценить. И фактор, по которому хотим оценить. Разбивает выборку по выбранному фактору и сравнивает средние. (Тоже самое сделали бы и с Т-криерием). Описательную статистику в приложение. Здесь f критерий не отличии от Т, так как сравниваем две выборки.
|