Многофакторный регрессионный анализ
Download 203.39 Kb.
|
1 2
Bog'liqМногофакторный регрессионный анализ
Уравнение регрессии (8.20) называется уравнением в стандартизованном масштабе (или стандартизированным уравнением регрессии). Оно не имеет свободного члена, поскольку все переменные выражены через отклонения от средних величин, а, как известно, а = у-Ь{хх -Ь2х2, или при k объясняющих переменных
В отличие от коэффициентов регрессии в натуральном масштабе Ьр которые нельзя сравнивать, стандартизированные коэффициенты регрессии Р; можно сравнивать, делая вывод, влияние какого фактора на у более значительно. Стандартизированные коэффициенты регрессии находятся также с помощью МНК: Приравняем первые частные производные нулю получим систему нормальных уравнений Поскольку систему можно записать иначе: Отсюда находим p-коэффициенты и сравниваем их. Если Р,>Р2, то фактор Xj сильнее влияет на результат, чем фактор х2. От стандартизированной регрессии можно перейти к уравнению регрессии в натуральном масштабе, т.е. получить регрессию Коэффициенты регрессии в натуральном масштабе находятся на основе ^-коэффициентов: где После этого вычисляется совокупный коэффициент детерминации: который показывает долю вариации результативного признака под воздействием изучаемых факторных признаков. Важно знать вклад каждой объясняющей переменной. Он измеряется коэффициентом раздельной детерминации: Влияние отдельных факторов в уравнении множественной регрессии может быть охарактеризовано с помощью частных коэффициентов эластичности. В случае двухфакторной линейной регрессии коэффициенты эластичности рассчитываются по формулам и измеряются в процентах: Мы разобрали технику построения уравнения множественной регрессии. Очевидно, что оценки параметров уравнения регрессии можно получить, используя только микрокалькулятор. В современных условиях построение регрессии и расчет показателей корреляции производят с помощью ПК и пакетов прикладных программ, таких как Excel либо более специализированных: Statgraphics или Statistica и др. Чтобы выполнить построения уравнения множественной регрессии с помощью Microsoft Office Excel, надо воспользоваться инструментом анализа данных Регрессия. Выполняются действия, аналогичные расчету параметров парной линейной регрессии, рассмотренные выше, только в отличие от парной регрессии при заполнении параметра входной интервал X в диалоговом окне следует указать все столбцы, содержащие значения факторных признаков. Рассмотрим построение множественного уравнения регрессии при двух объясняющих переменных (двухфакторная модель). Продолжая пример, введем второй фактор время, затраченное студентом в течение недели с целью получения заработка, в часах. Данные представлены в табл. 8.5. Расчетная таблица Таблица 8.5
Таблица 8.6 Регрессионный анализ, выполненный для двухфакторной модели с помощью Microsoft Office Excel
1. Введем исходные данные в таблицу Excel, как было описано в параграфе 8.3. 2. Воспользуемся инструментом анализа данных Регрессия. Полученные результаты представлены в табл. 8.6. Как следует из итоговой табл. 8.6, уравнение регрессии имеет следующий вид: F= 25; значимость F= 0,002, т.е. вероятность ошибки незначительна. Согласно регрессии оценка на экзамене в среднем повысится на 0,058 балла при увеличении накопленных за семестр баллов на один балл при закреплении второй объясняющей переменной на среднем уровне; экзаменационная оценка снизится в среднем на 0,026 балла при увеличении времени, затраченного на заработок, на один час при закреплении фактора Х на среднем уровне. 3. Перейдем к уравнению в стандартизированном масштабе. Для этого определим 0-коэффициенты; Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. Для этого: 1) выберем Данные —> Анализ данных —> Корреляция; 2) заполним диалоговое окно ввода данных и параметров вывода. Результаты вычислений показаны в табл. 8.7. Таблица 8.7 Матрица коэффициентов парной корреляции
Тогда Получили стандартизированное уравнение регрессии Так как |Р,|>|Р21» т0 фактор xi (сумма накопленных баллов за семестр) сильнее влияет на результат (экзаменационная оценка), чем фактор х2 (время, затраченное студентом в течение недели с целью получения заработка). Заметим, что связь между результатом у и фактором х2 обратная: чем больше времени студент тратит для получения заработка, тем ниже экзаменационная оценка. 4. Совокупный коэффициент детерминации определяется из Регрессионной статистики (табл. 8.6): R2 = 0,911, т.е. вариация возможной оценки на экзамене на 91,1% зависит от вариации накопленных за семестр текущих баллов и вариации времени, которое студент тратит в течение недели на заработок. 5. Найдем коэффициенты раздельной детерминации: Таким образом, за счет вариации накопленных за семестр текущих баллов объясняется 72,3% вариации оценки на экзамене, а за счет времени, затраченного в течение недели на заработок, — 18,8%. Сумма коэффициентов раздельной детерминации равна R2. 6. Рассчитаем частные линейные коэффициенты эластичности: Это означает, что при увеличении накопленных за семестр баллов на 1% их среднего уровня оценка за экзамен увеличивается на 10,97% своего среднего уровня, при увеличении времени на заработок на 1% его среднего значения результат снижается на 0,07%. Очевидно, что сила влияния фактора хх сильнее, чем фактора х2. Аналогичные выводы о силе связи мы получили, сравнивая Р-коэффициенты. 7. Расчитаем ожидаемую оценку, которую получит студент на экзамене, если сумма накопленных в течение семестра баллов (л,) равна 85, а время, затраченное студентом в течение недели для заработка (х2), составляет 5 ч. Воспользуемся полученным уравнением регрессии в натуральном масштабе: или Следовательно, ожидаемая экзаменационная оценка составляет четыре балла. Download 203.39 Kb. Do'stlaringiz bilan baham: |
1 2
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling