Использование графического метода
Download 30.19 Kb.
|
Корреляция и регрессия
- Bu sahifa navigatsiya:
- Бета – коэффициент
- 1.4. Ошибка аппроксимации.
- 1.6. Коэффициент детерминации.
- 2. Оценка параметров уравнения регрессии. 2.1. Значимость коэффициента корреляции.
- 2.3. Анализ точности определения оценок коэффициентов регрессии.
- 2.4. Доверительные интервалы для зависимой переменной.
- Индивидуальные доверительные интервалы для Y при данном значении X.
- 2.5. Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
- Доверительный интервал для коэффициентов уравнения регрессии.
1.3. Коэффициент эластичности.
Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х. Для этих целей вычисляются коэффициенты эластичности и бета - коэффициенты. Коэффициент эластичности находится по формуле: Он показывает, на сколько процентов в среднем изменяется результативный признак у при изменении факторного признака х на 1%. Он не учитывает степень колеблемости факторов. В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х на 1%, Y изменится более чем на 1%. Другими словами - Х существенно влияет на Y. Бета – коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных: Т.е. увеличение x на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего Y на 0.9796 среднеквадратичного отклонения этого показателя. 1.4. Ошибка аппроксимации. Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Поскольку ошибка больше 15%, то данное уравнение не желательно использовать в качестве регрессии. 1.6. Коэффициент детерминации. Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака. Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах. R2= 0.982 = 0.9596 т.е. в 95.96 % случаев изменения x приводят к изменению у. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 4.04 % изменения Y объясняются факторами, не учтенными в модели.
2. Оценка параметров уравнения регрессии. 2.1. Значимость коэффициента корреляции. По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=7 находим tкрит: tкрит = (7;0.05) = 1.895 где m = 1 - количество объясняющих переменных. Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается). Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим В парной линейной регрессии t2r = t2b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии. 2.3. Анализ точности определения оценок коэффициентов регрессии. Несмещенной оценкой дисперсии возмущений является величина: S2y = 94.6484 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии). Sy = 9.7287 - стандартная ошибка оценки (стандартная ошибка регрессии). S a - стандартное отклонение случайной величины a. Sb - стандартное отклонение случайной величины b. 2.4. Доверительные интервалы для зависимой переменной. Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов. Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя. (a + bxp ± ε) где Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X p= 1 (-11.17 + 68.16*1 ± 6.4554) (50.53;63.44) С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов. Индивидуальные доверительные интервалы для Y при данном значении X. (a + bx i ± ε) где
С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов. 2.5. Проверка гипотез относительно коэффициентов линейного уравнения регрессии. 1) t-статистика. Критерий Стьюдента. Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05. tкрит = (7;0.05) = 1.895 Поскольку 12.8866 > 1.895, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента). Поскольку 2.0914 > 1.895, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента). Доверительный интервал для коэффициентов уравнения регрессии. Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими: (b - tкрит Sb; b + tкрит Sb) (68.1618 - 1.895 • 5.2894; 68.1618 + 1.895 • 5.2894) (58.1385;78.1852) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. (a - ta) (-11.1744 - 1.895 • 5.3429; -11.1744 + 1.895 • 5.3429) (-21.2992;-1.0496) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. 2) F-статистики. Критерий Фишера. Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели. Если расчетное значение с lang=EN-US>n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой. где m – число факторов в модели. Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму: 1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α. 2. Далее определяют фактическое значение F-критерия: где m=1 для парной регрессии. 3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2. 4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу. В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом. Табличное значение критерия со степенями свободы k1=1 и k2=7, Fkp = 5.59 Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим (Найденная оценка уравнения регрессии статистически надежна). Download 30.19 Kb. Do'stlaringiz bilan baham: |
ma'muriyatiga murojaat qiling