Определение параметров выборочного уравнения прямой линии регрессии по сгруппированным данным
Для определения параметров уравнения используем систему как и для несгруппированных данных: Для применения этой системы воспользуемся тождеством: (следствие из ) (следствие из ) (следствие из ) (учтено, что когда пара чисел (x, y) наблюдалась раз). С учетом тождеств систему можно переписать: Решив систему, получим уравнение регрессии: , где . ; => . Выборочный коэффициент корреляции определяют из выражения: . Выборочный коэффициент корреляции является оценкой коэффициента корреляции r генеральной совокупности и поэтому служит для измерения линейной связи. На практике приняты следующие пределы качественной характеристики тесноты связи: - связь между X и Y отсутствует или не является линейной даже приближенно; - связь слабая; - связь умеренная; - связь заметная; - связь очень высокая; - связь между X и Y можно считать функциональной. Пример 2.15. По данным корреляционной таблицы:
1. Вычислить коэффициент корреляции. 2. Найти уравнение регрессии . 3. Вычислить групповые средние и для контроля вычислить значение (по уравнению регрессии в тех же точках), результаты запишем в таблицу:
4. По данным таблицы построить график линейной регрессии и нанести экспериментальные точки. Решение: 1 Вычисляем величины , а также и по формулам: а) ; ; ; ; . б) 4; ; ; ; ;. в) г) коэффициент корреляции: ; . Так как , то между величинами X и Y имеется очень высокая линейная корреляционная связь. 2. Вычислим коэффициент регрессии ; . Искомое уравнение регрессии имеет вид: ;
3. Вычисляем групповые средние признака при фиксированном значении по формулам
Для контроля вычисляем значения по уравнению регрессии в тех же точках:
. Результаты запишем в таблицу
4. Строим график линейной регрессии и наносим экспериментальные точки .
Задания для самостоятельной работы: 1. Найти по уравнению регрессии на по данным:
2. Найти уравнение регрессии на по данным:
3. Найти уравнение регрессии на по данным:
2.5.3. Однофакторный дисперсионный анализ Дисперсионным анализом называется статистический метод анализа результатов испытаний, цель которого – оценить влияние одного или нескольких качественных факторов на рассматриваемую величину . Схему однофакторного дисперсионного анализа можно рассмотреть на примере исследования влияния различных факторов рекламы на прибыль предприятия. Если разделить виды рекламы на несколько групп (уровни фактора) и через одинаковые интервалы времени измерять прибыль, то результаты можно представить в виде таблицы:
Число измерений на каждом уровне считаем одинаковым и равным . В последней строке помещены групповые средние для каждого уровня фактора. Общую среднюю можно получить как среднее арифметическое групповых средних: . На разброс прибыли относительно общей средней влияют как изменение уровня рассматриваемого фактора, так и случайные факторы. Для того чтобы учесть влияние данного фактора, общая выборочная дисперсия разбивается на две части, одна из которых называется факторной , а вторая - остаточной . Для учёта этих составляющих вначале рассчитывается общая сумма квадратов отклонений вариант от общей средней: И факторная сумма квадратов отклонений групповых средних от общей средней, которая и характеризует влияние данного фактора: Последнее выражение получено путём замены каждой варианты в выражении - групповой средней для данного фактора. Остаточная сумма квадратов отклонений получается как разность: Для определения общей выборочной дисперсии необходимо разделить на число измерений : а для получения несмещённой общей выборочной дисперсии это выражение нужно умножить на : где - число отклонений свободы несмещённой факторной выборочной дисперсии. Для несмещённой остаточной выборочной дисперсии число степеней свободы будет равно разности: , и выражение дисперсии примет вид: . С целью оценки влияния фактора на изменения рассматриваемого параметра рассчитывается величина: Так как отклонение двух выборочных дисперсий и распределено по закону Фишера-Снедекора, то полученное значение сравнивают со значением функции распределения в критической точке , соответствующей выбранному уровню значимости . Если то фактор оказывает существенные воздействия и его следует учитывать, в противном случае он оказывает незначительное влияние, которым можно пренебречь. Для расчёта и могут быть использованы также формулы:
|