Многофакторный регрессионный анализ


Download 203.39 Kb.
bet2/2
Sana22.06.2023
Hajmi203.39 Kb.
#1647774
1   2
Bog'liq
Многофакторный регрессионный анализ

Уравнение регрессии (8.20) называется уравнением в стандартизованном масштабе (или стандартизированным уравнением регрессии). Оно не имеет свободного члена, поскольку все переменные выражены через отклонения от средних величин, а, как известно, а = у-Ь{хх -Ь2х2, или при объясняющих переменных

В отличие от коэффициентов регрессии в натуральном масштабе Ьр которые нельзя сравнивать, стандартизированные коэффициенты регрессии Р; можно сравнивать, делая вывод, влияние какого фактора на у более значительно.
Стандартизированные коэффициенты регрессии находятся также с помощью МНК:


Приравняем первые частные производные нулю получим систему нормальных уравнений

Поскольку

систему можно записать иначе:

Отсюда находим p-коэффициенты и сравниваем их. Если Р,>Р2, то фактор Xj сильнее влияет на результат, чем фактор х2.
От стандартизированной регрессии можно перейти к уравнению регрессии в натуральном масштабе, т.е. получить регрессию 
Коэффициенты регрессии в натуральном масштабе находятся на основе ^-коэффициентов: 

где 
После этого вычисляется совокупный коэффициент детерминации:

который показывает долю вариации результативного признака под воздействием изучаемых факторных признаков. Важно знать вклад каждой объясняющей переменной. Он измеряется коэффициентом раздельной детерминации: 
Влияние отдельных факторов в уравнении множественной регрессии может быть охарактеризовано с помощью частных коэффициентов эластичности. В случае двухфакторной линейной регрессии коэффициенты эластичности рассчитываются по формулам и измеряются в процентах:

Мы разобрали технику построения уравнения множественной регрессии. Очевидно, что оценки параметров уравнения регрессии можно получить, используя только микрокалькулятор. В современных условиях построение регрессии и расчет показателей корреляции производят с помощью ПК и пакетов прикладных программ, таких как Excel либо более специализированных: Statgraphics или Statistica и др.
Чтобы выполнить построения уравнения множественной регрессии с помощью Microsoft Office Excel, надо воспользоваться инструментом анализа данных Регрессия. Выполняются действия, аналогичные расчету параметров парной линейной регрессии, рассмотренные выше, только в отличие от парной регрессии при заполнении параметра входной интервал X в диалоговом окне следует указать все столбцы, содержащие значения факторных признаков.
Рассмотрим построение множественного уравнения регрессии при двух объясняющих переменных (двухфакторная модель). Продолжая пример, введем второй фактор время, затраченное студентом в течение недели с целью получения заработка, в часах. Данные представлены в табл. 8.5.
Расчетная таблица
Таблица 8.5

Номер студента

У

*1

х2

Ух

х2

(у -у)2

У

(я - у)2

1

2

58

30

116

3364

3,0625

2,172

0,030

2

3

64

0

192

4096

0,5625

2,586

0,171

3

3

80

20

240

6400

0,5625

3,690

0,476

4

4

79

14

316

6241

0,0625

3,621

0,144

5

4

86

0

344

7396

0,0625

4,104

0,011

6

4

90

12

360

8100

0,0625

4,380

0,144

7

5

95

0

475

9025

1,5625

4,725

0,076

8

5

96

6

480

9216

1,5625

4,794

0,042

I

30

648

82

2523

53 838

7,5

30,072

1,094

Таблица 8.6
Регрессионный анализ, выполненный для двухфакторной модели с помощью Microsoft Office Excel

ВЫВОД итогов
















Регрессионная статистика
















Множественный R

0,954676
















Я-квадрат

0,911406
















Нормированный Я-квадрат

0,875968
















Стандартная ошибка

0,364542
















Наблюдения

8
















Дисперсионный анализ



















df

SS

MS

F

Значимость F




Регрессия

2

6,835545

3,417772

25,71861

0,002336




Остаток

5

0,664455

0,132891










Итого

7

7,5





































Коэффициент ы

Стандартная
ошибка

t-статистика

Р-значение

Нижние 95%

Верхние 95%

У-пересечение

-0,70781

1,025995

-0,68988

0,520976

-3,34522

1,929592

*1

0,058364

0,011522

5,065398

0,003882

0,028746

0,087983

*2

-0,02631

0,014646

-1,79647

0,132358

-0,06396

0,011338

  • 1. Введем исходные данные в таблицу Excel, как было описано в параграфе 8.3.

  • 2. Воспользуемся инструментом анализа данных Регрессия.

Полученные результаты представлены в табл. 8.6.
Как следует из итоговой табл. 8.6, уравнение регрессии имеет следующий вид:

F= 25; значимость F= 0,002, т.е. вероятность ошибки незначительна.
Согласно регрессии оценка на экзамене в среднем повысится на 0,058 балла при увеличении накопленных за семестр баллов на один балл при закреплении второй объясняющей переменной на среднем уровне; экзаменационная оценка снизится в среднем на 0,026 балла при увеличении времени, затраченного на заработок, на один час при закреплении фактора Х на среднем уровне.
3. Перейдем к уравнению в стандартизированном масштабе. Для этого определим 0-коэффициенты;

Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. Для этого:

  • 1) выберем Данные —> Анализ данных —> Корреляция;

  • 2) заполним диалоговое окно ввода данных и параметров вывода.

Результаты вычислений показаны в табл. 8.7.
Таблица 8.7
Матрица коэффициентов парной корреляции




У

*1

х2

У

1







Х

0,924241

1




х2

-0,67585

-0,50846

1

Тогда

Получили стандартизированное уравнение регрессии 
Так как |Р,|>|Р21» т0 фактор xi (сумма накопленных баллов за семестр) сильнее влияет на результат (экзаменационная оценка), чем фактор х(время, затраченное студентом в течение недели с целью получения заработка). Заметим, что связь между результатом у и фактором х2 обратная: чем больше времени студент тратит для получения заработка, тем ниже экзаменационная оценка.

  • 4. Совокупный коэффициент детерминации определяется из Регрессионной статистики (табл. 8.6): R2 = 0,911, т.е. вариация возможной оценки на экзамене на 91,1% зависит от вариации накопленных за семестр текущих баллов и вариации времени, которое студент тратит в течение недели на заработок.

  • 5. Найдем коэффициенты раздельной детерминации:


Таким образом, за счет вариации накопленных за семестр текущих баллов объясняется 72,3% вариации оценки на экзамене, а за счет времени, затраченного в течение недели на заработок, — 18,8%. Сумма коэффициентов раздельной детерминации равна R2.
6. Рассчитаем частные линейные коэффициенты эластичности:

Это означает, что при увеличении накопленных за семестр баллов на 1% их среднего уровня оценка за экзамен увеличивается на 10,97% своего среднего уровня, при увеличении времени на заработок на 1% его среднего значения результат снижается на 0,07%. Очевидно, что сила влияния фактора хх сильнее, чем фактора х2. Аналогичные выводы о силе связи мы получили, сравнивая Р-коэффициенты.
7. Расчитаем ожидаемую оценку, которую получит студент на экзамене, если сумма накопленных в течение семестра баллов (л,) равна 85, а время, затраченное студентом в течение недели для заработка 2), составляет 5 ч. Воспользуемся полученным уравнением регрессии в натуральном масштабе:
или 

Следовательно, ожидаемая экзаменационная оценка составляет четыре балла.
Download 203.39 Kb.

Do'stlaringiz bilan baham:
1   2




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling