Тема 3. Анализ биномиальной совокупности.
Дисперсия биномиальной совокупности: интервал колебания значений дисперсии, зависимость дисперсии от величины пропорции параметра, а также размеров выборочной и генеральной совокупностей. Формальный статистический вывод на примере решения биномиальных задач. Понятия нулевой и альтернативной гипотез. Понятие и уровни значимости данных гипотез. Понятие кумулятивной (интегральной), двусторонней и односторонней гипотезы. Биномиальный тест: преимущества, ограничения и особенности применения.
Тема 4. Методы сравнения средних. Понятие стандартной ошибки (стандартное отклонение оценки параметра). Понятие и особенности дискретного и нормального распределения. График нормального распределения. Стандартизация нормального распределения. Z-тест в выборках из нормальной совокупности. Нормальная аппроксимация биномиального распределения. Т-распределения Стьюдента. Сравнение средних. Понятие степеней свободы. Виды t-тестов: для одной и К-независимых выборок, для парных выборок. Понятие, возможности и особенности построения доверительных интервалов. Тема 5. Одномерный дисперсионный анализ. Понятие и особенности одномерного дисперсионного анализа (ANOVA) по методу F-Фишера, его применение в регрессионном анализе. Коэффициенты детерминации и корреляции. Доверительные интервалы для отдельных значений Y. Возможности прогноза новых значений Y при помощи дисперсионного анализа. Мультипликативные и аддитивные эффекты. Диагностика отклонений. Графики зависимости ошибки регрессии от X или от Y^. Проблема нелинейности. Систематический (неслучайный) характер распределения ошибки. Тема 6. Непараметрические методы статистического анализа. Понятие непараметрических методов анализа. Понятие рангов и ранговых методов. Знаковый тест, тест Уилкоксона, U-тест Манни-Уитни, Z-тест Колмогорова-Смирнова, Н-тест Краскала-Уоллиса: преимущества, ограничения и особенности применения.
Тема 7. Двумерный анализ. Статистические критерии для таблиц сопряженности. Сравнение пропорций. Понятие таблиц сопряженности, особенности построения и анализа данных таблиц. Понятие маргинального распределения. Модели независимости и равной вероятности биномиальных переменных. Насыщенная модель. Метод анализа таблиц сопряженности – хи-кадрат (c2): виды, особенности применения, возможности метода. Тема 8. Многомерный анализ. Иерархический логлинейный анализ. Особенности и возможности применения метода. Логлинейные модели условной независимости, насыщенные модели. Понятие мультипликативных членов логлинейных моделей. Понятие хи-квадрата, основанного на отношении правдоподобия (G2). Информационный критерий Байеса (BIC). Автоматизированный поиск «наилучшей» логлинейной модели в SPSS.
Тема 9. Методы регрессионного анализа. Понятие и особенности ковариации и линейной зависимости. Понятие центрированной, зависимой и независимой переменной. Графическое изображение дисперсии и ковариации. Модель простой линейной регрессии. Понятие о методе наименьших квадратов, ошибке регрессии, регрессионном коэффициенте. Понятие остаточной (необъясненной) дисперсии. Т-тест и доверительные интервалы в регрессионном анализе. Правило Мостеллера-Тьюки о выпрямлении кривых. Множественная регрессия и множественные коэффициенты. Номинальные переменные в регрессионной модели. Дополнительная сумма квадратов и частные коэффициенты. Стандартизованная регрессионная модель. Понятие полной и редуцированной моделей множественной зависимости, понятие F-отношения. Коллинеарность. Автоматизированный поиск «наилучшей» регрессионной модели в SPSS. Множественная логистическая регрессия. Понятие логитов и логистической функции. Преобразование вероятностей в логиты. Понятие гомо- и гетероскедастичности. Метод взвешенных наименьших квадратов. Автоматический поиск «наилучшей» логистической модели пошаговым методом. Метод Вальда для включения переменной в модель.
|