корреляционной таблицы.
(В таблице через и обозначены середины соответствующих интервалов, а и - соответственно их частоты).
Изобразим полученную зав-ть графически точками координатной плоскости. Такое изображение статистической зав-ти наз-ся полем корреляции.
Для каждого значения (i = 1,2,...,l), т.е. для каждой строки корреляционной таблицы вычислим групповые средние
где - частоты пар ( , ) и ; m - число интервалов по переменной Y.
Вычисленные групповые средние графически в виде ломаной, называемой эмпирической линией регрессии У по Х.
Аналогично для каждого значения (j = 1,2,...,m):
.
где ; l- число интервалов по переменной Х.
По виду ломаной можно предположить наличие линейной корреляционной зав-ти У по Х между двумя рассматриваемыми переменными, которая графически выражается тем точнее, чем больше объем выборки n:
Поэтому уравнение регрессии будем искать в виде:
.
Применим метод наименьших квадратов, согласно которому неизвестные параметры и выбираются таким образом, чтобы сумма квадратов отклонений эмпирических групповых средних , от значений , найденных по уравнению регрессии, был минимальной:
Система нормальных уравнений для определения параметров линейной регрессии:
Или
.
где соответствующие средние определяются по формулам:
, , .
.
Подставляя значение из первого уравнения системы в уравнение регрессии, получим:
, или .
Коэффициент в уравнении регрессии, называемый выборочным коэффициентом регрессии (или просто коэффициентом регрессии) Y по Х, будем обозначать символом . Теперь
Do'stlaringiz bilan baham: |