Отчет №1 по дисциплине «Эконометрика» по теме «Парная линейная регрессия»


Download 3.57 Mb.
Sana15.10.2023
Hajmi3.57 Mb.
#1704356
TuriОтчет
Bog'liq
Отчет 1


ОТЧЕТ №1
по дисциплине «Эконометрика»


по теме «Парная линейная регрессия»
Вариант №3

Выполнил студент


3 курса группы № 271902
А. А. Вялов

Томск-2021


СОДЕРЖАНИЕ

1 Анализ учебных данных 3


1. Построение модели парной линейной регрессии 3
2. Оценка качества регрессионной модели 8
3. Прогнозирование 13
2 Анализ реальных данных 16
1. Построение модели парной линейной регрессии 16
2. Оценка качества регрессионной модели 18
3. Прогнозирование 24
1 Анализ учебных данных
1.1 Построение модели парной линейной регрессии
1.1.1 Представление и визуализация данных

Для того чтобы приступить к построению модели, необходимо провести предварительный анализ имеющихся данных и установить форму зависимости между наблюдаемыми величинами (переменными модели). В качестве примера исследуем зависимость счета текущих операций РФ от объема экспорта услуг. Исходные данные приведены в таблице 1.


Таблица 1- Зависимость счета текущих операций РФ от объема экспорта услуг






Экспорт услуг (млн. долл. США)

Счет текущих операций РФ (млн. долл. США)

I квартал 2002 г.

-0,836

6,421

II квартал 2002 г.

-1,187

7,674

III квартал 2002 г.

-2,977

7,183

IV квартал 2002 г.

-1,583

7,838

I квартал 2003 г.

-1,488

7,537

III квартал 2003 г.

-3,178

8,192

III квартал 2003 г.

-4,349

9,396

IV квартал 2003 г.

-4,156

8,72

Исходя из данных таблицы 1, мы можем предположить, что между экспортом услуг и счетом текущих операций имеется некоторая зависимость. Интуитивно понятно, что чем больше экспорт, тем больше должен быть счет операций. Попробуем приближенно построить модель, описывающую зависимость счета текущих операций от величины экспорта услуг.


Обозначим через – экспорт услуг, через – счет текущих операций РФ и создадим таблицу с исходными данными в Microsoft Excel (рис. 1).

Рис. 1. Таблица с исходными данными в MS Excel
Вывод о предполагаемой зависимости между переменными и можно сделать, построив диаграмму рассеяния, на которой отображаются точки с координатами , , соответствующие наблюдаемым значениям переменных.
Чтобы построить диаграмму рассеяния, по оси X отложим значения показателей экспорта услуг, по оси Y- величину счета текущих операций РФ за каждый из рассматриваемых кварталов (рис.2).

Рис. 2. Диаграмма рассеяния

Из диаграммы рассеяния можно предположить, что между переменными и существует приближенная линейная зависимость, которая описывается классической моделью парной линейной регрессии.


1.1.2 Уравнение парной линейной регрессии


На основе имеющихся статистических данных и диаграммы рассеяния мы установили приближенную линейную зависимость между двумя наблюдаемыми величинами: независимой переменной и зависимой переменной . В математической форме эта зависимость описывается уравнением парной линейной регрессии:


, (1)
где – неизвестные параметры, определяющие прямую линию, – случайная составляющая модели. Чтобы завершить построение модели, требуется оценить неизвестные параметры и .

1.1.3 Оценка параметров линейной регрессии


Для оценки параметров линейной регрессии используется метод наименьших квадратов (МНК). Запишем уравнение регрессии для конкретных наблюдений:


,
где , - номер наблюдения, - общее число наблюдений. Обозначим оценки неизвестных параметров и символами и . Тогда
, (2)
где - ошибки (остатки) модели. Чем точнее оценки и , тем меньше остатки модели и тем лучше данная модель описывает наблюдаемую выборку. В методе наименьших квадратов оценки параметров модели строятся так, чтобы сумма квадратов остатков модели по всем наблюдениям (остаточная дисперсия) была минимальной.
Критерий наименьших квадратов имеет вид:
. (3)
Таким образом, необходимо минимизировать квадратичную функцию двух переменных по всем возможным значениям и при заданных значениях . Из условия равенства нулю частных производных функции по и после несложных преобразований получаем систему двух уравнений с двумя неизвестными:

(4)

Система уравнений (4) называется системой нормальных уравнений. Ее решение существует и единственно, если выполнено условие идентифицируемости модели наблюдений:

Это условие практически всегда выполняется, иначе все точки будут лежать на одной вертикальной прямой . Решив систему нормальных уравнений (4), мы получим выражения для оценок параметров регрессии, оптимальных по критерию наименьших квадратов:


где - выборочные средние наблюдений.
Оценки (5), (6) называют оценками наименьших квадратов или МНК-оценками. Эти оценки являются случайными величинами и выборочными эмпирическими оценками неизвестных параметров линейной регрессии.
Из диаграммы рассеяния (рис. 2) видно, что в наблюдаемых значениях цен нет резких выбросов, поэтому для оценки параметров модели могут быть использованы все 8 наблюдений.
Для расчета оценок и по формулам (5), (6), вычислим выборочные средние значения переменных и (табл. 2).
Таблица 2- выборочные средние значения и и оценки параметров и

Выборочное среднее значение x

-2,46925

Выборочное среднее значение y

7,870

Оценка параметра a

6,5316

Оценка параметра b

-0,5420

1.1.4 Построение линии регрессии


После получения оценок a и b, мы можем записать эмпирическую (выборочную) функцию регрессии:



Полученное уравнение можно интерпретировать следующим образом: при увеличении экспорта на 1 млн $, счет текущих операций снижается в среднем на 0,54 млн $.
Используя формулу (7), вычислим прогнозные значения зависимой переменной для наблюдаемых значений независимой переменной (рис. 3).

Рис. 3- Вычисление оценок параметров и прогнозного счета

Добавим теперь прогнозные значения на диаграмму рассеяния (рис. 4) и, сравнивая полученные прогнозные значения цен с исходными наблюдаемыми значениями, попытаемся дать визуальную оценку качества построенной модели (7).



Рис. 4- Диаграмма рассеяния с построенной линией регрессии

Из рис. 4 видно, что модель (7) довольно хорошо описывает исходные данные. Для оценки адекватности модели воспользуемся статистическими методами.


1.2 Оценка качества регрессионной модели


1.2.1 Исследование остатков модели

Остатки модели - разность между наблюдаемыми и прогнозными значениями зависимой переменной . В общем виде остатки модели можно записать формулой:



Расчет остатков модели для наших данных можно увидеть на рисунке 5.

Рис. 5- Расчет остатков модели

Анализ остатков позволяет сделать заключение о качестве прогнозной модели. Если модель подобрана правильно, то остатки должны быть похожи на независимые нормальные величины с нулевым средним и постоянной дисперсией.


Построим график остатков для нашего примера в зависимости от экспорта услуг (рис.6).

Рис. 6- График остатков в зависимости от экспорта услуг

На полученном графике остатков в зависимости от экспорта услуг видно, что остатки хаотично разбросаны, в чередовании знаков нет закономерности, нет резких выбросов. Остатки принимают равное количество положительных и отрицательных значений.


Вычислим выборочное среднее остатков, выборочную дисперсию и оценку стандартного отклонения (табл. 3).
Таблица 3 - Расчет выборочного среднего остатков, выборочной дисперсии и выборочного стандартного отклонения

Выборочное среднее остатков

0,00000

Выборочная дисперсия

0,33307

Выборочное стандартное отклонение

0,57712

Анализируя полученные результаты, можно сделать вывод о том, что модель подобрана правильно, так как оценка математического ожидания остатков (выборочное среднее остатков) равна 0, оценка дисперсии остатков (выборочная дисперсия) постоянна.


Проверим теперь предположение о нормальном распределении остатков, используя графический метод.
Составим таблицу для анализа остатков модели. Для этого упорядочим остатки в порядке возрастания и найдем значения функции для 𝑗=1…𝑛, и .

Рис. 7- Анализ остатков

На основании данных рисунка 7 построим график остатков (рис. 8).



Рис. 8- График остатков

На полученном графике остатков мы наблюдаем, что остатки недостаточно хорошо ложатся на прямую, поэтому будем считать, что предположение о нормальном распределении остатков выполняется не полностью.


1.2.2 Коэффициент детерминации


Коэффициент детерминации является мерой степени линейной связи между переменными и показывает долю общей вариации зависимой переменной, объясненную линейной регрессией. Вычислим его по формуле:




Рис. 9 - Вычисление коэффициента детерминации

Получаем = 0.66. Это достаточно хороший результат: коэффициент детерминации близок к единице, что указывает на хорошее качество аппроксимации наблюдаемых данных построенной моделью. Регрессия объясняет 66% разброса значений счета текущих операций РФ относительно среднего значения.


1.2.3 Оценки дисперсий МНК-оценок


Вычислим оценки дисперсий оценок a и b (10) и оценки стандартных отклонений a и b (11) по формулам:





Рис. 10- Оценки дисперсий МНК-оценок

1.2.4 Построение доверительных интервалов для параметров регрессии


Чтобы установить, насколько близки полученные оценки к истинным значениям параметров, необходимо построить доверительные интервалы, в пределах которых с заданной вероятностью могут находиться α и β. Верхние и нижние границы доверительных интервалов определяются по формулам




где – табличное значение t-критерия, соответствующее уровню значимости γ и числу степеней свободы n–2. Число степеней свободы определяется как разность количества наблюдений и количества оцениваемых параметров.

Рис. 11- Расчет интервальных оценок параметров при  = 0.01
Получаем границы 99%-ых доверительных интервалов для параметров регрессии: α[4,8924, 8,1709], β[-1,1310, 0,0469]. Можно утверждать, что истинные значения параметров с вероятностью 99% находятся в пределах указанных границ.

1.2.5 Проверка значимости параметров регрессии


Вывод о значимости параметров регрессии можно сделать по их интервальным оценкам или, используя t-тест.


По результатам проверки по доверительному интервалу параметр α является значимыми, а параметр β, наоборот, не является значимым, т.к. при 99%-ых доверительных интервалах граница интервала параметра α больше 0, а в границы интервала параметра β попадает нуль.
Далее проведем Т-тест. Рассмотрим нулевую гипотезу для каждого из параметров

против альтернативной гипотезы


Рис. 12-Проверка гипотезы о значимости параметров регрессии

Т.к. модуль t-статистики для параметра α больше табличного значения t-критерия, то в данном случае гипотеза отвергается. С параметром β все наоборот: гипотеза принимается. Параметр модели α является значимыми на уровне значимости γ = 0.01.


1.2.6 Проверка значимости коэффициента детерминации. F-тест


Для того чтобы определить, является ли наблюдаемая взаимосвязь между переменными случайной, проверим гипотезу



против альтернативной гипотезы

Таблица 4- Проверка значимости регрессии (F-тест)

F-статистика

Уровень значимости

F (γ, 1, n-2)

Решение

11,64420786

0,01

13,74502253

регрессия не значима

Т.к. значение F-статистики меньше табличного значения F-критерия, мы принимаем нулевую гипотезу на уровне значимости γ = 0.01. Отсюда вывод: коэффициент регрессии не является значимым и полученное регрессионное уравнение малополезно для предсказания изменений счета текущих операций РФ


1.3 Прогнозирование


Доверительный интервал для прогноза среднего значения


При прогнозе среднего значения переменной y мы получаем ошибку

Оценка дисперсии ошибки определяется по формуле:

Доверительный интервал (интервальный прогноз) среднего значения переменной y имеет вид:

где – оценка стандартной ошибки (среднеквадратичного отклонения) прогноза, – табличное значение t-критерия, соответствующее уровню значимости γ и числу степеней свободы n–2.
Доверительный интервал для прогноза индивидуального значения
При прогнозе индивидуального значения переменной у мы получаем ошибку:

Оценка дисперсии ошибки определяется по формуле:

Доверительный интервал индивидуального значения переменной у имеет вид:

где – оценка стандартного отклонения прогноза, – табличное значение t-критерия, соответствующее уровню значимости и числу степеней свободы n-2.
Применяя имеющиеся формулы к исследуемым данным, получим следующие результаты:

Таблица 5- Доверительные интервалы для прогноза среднего и индивидуального значений



Оценка дисперсии ошибки прогноза

Доверительный интервал для среднего значения

Доверительный интервал для индивидуального значения







Среднего

Индивидуального

Нижняя граница

Верхняя граница

Нижняя граница

Верхняя граница




0,1089

0,4420

5,7611

8,2085

4,5199

9,4496




0,0831

0,4162

6,1062

8,2440

4,7833

9,5668




0,0481

0,3812

7,3319

8,9588

5,8563

10,4344




0,0615

0,3945

6,4706

8,3088

5,0610

9,7184




0,0659

0,3990

6,3863

8,2902

4,9964

9,6801




0,0543

0,3874

7,3903

9,1183

5,9468

10,5618




0,1308

0,4639

7,5482

10,2299

6,3640

11,4141




0,1134

0,4465

7,5358

10,0331

6,3071

11,2618




Полученные доверительные интервалы добавим на диаграмму рассеяния (рис. 13).


Из построенной диаграммы видно, что ширина доверительных интервалов меняется для разных значений экспорта услуг. Это объясняется тем, что мы строим прогноз только на основе имеющихся наблюдений. Поэтому для значений, которые лежат внутри исследуемого диапазона, прогноз получается точнее (доверительные интервал уже), а для прогноза счета текущих операций РФ, экспорт услуг для которого лежит за пределами наблюдаемого диапазона, прогноз будет менее точным.
Найдем прогнозное значение счета текущих операций при -3 -миллионном экспорте услуг (x = -3) и построим доверительный интервал прогноза. Для этого создадим расчетную таблицу (рис. 14).
Прогнозное значение счета текущих операций РФ при -3-миллионном экспорте услуг составляет . Доверительный интервал для прогноза среднего значения равен [7,3393; 8,9763], для прогноза индивидуального значения – [5,8670; 10,4487]. Надежность выполненного прогноза 99%, прогноз среднего значения счета текущих операций намного точнее прогноза индивидуального значения, т.к. ширина доверительного интервала для среднего значения меньше, чем для индивидуального.

Рис. 13- Диаграмма рассеяния с построенной линией регрессии и доверительными интервалами для прогноза среднего и индивидуального значений

Рис. 14- Прогнозирование

2 Анализ реальных данных


Все расчеты в главе 2 выполнены аналогично главе 1, поэтому некоторые теоретические аспекты будут опускаться. Нумерация рисунков и таблиц сквозная.
2.1 Построение модели парной линейной регрессии
2.1.1 Представление и визуализация данных

Для того чтобы приступить к построению модели, необходимо провести предварительный анализ имеющихся данных и установить форму зависимости между наблюдаемыми величинами (переменными модели). В качестве примера исследуем зависимость стоимости 100 паев «ВТБ — Фонд Нефтегазового сектора» от цены на нефть марки Brent за баррель. Исходные данные приведены в таблице 6.


Таблица 6 - Зависимость счета текущих операций РФ от объема экспорта услуг




Цены на нефть марки Brent Стоимость за баррель, руб.(Х)

«ВТБ — Фонд Нефтегазового сектора» Стоимость 100 паев, руб.(Y)

IV квартал 2020 г.

3705,92

2 440,00

III квартал 2020 г.

3170,72

2 295,00

II квартал 2020 г.

2969,07

2 443,00

I квартал 2020 г.

2141,88

2 063,00

IV квартал 2019 г.

4059,56

2 951,00

III квартал 2019 г.

4094,82

2 733,00

II квартал 2019 г.

4132,10

2 575,00

I квартал 2019 г.

4222,89

2 300,00

IV квартал 2018 г.

3600,06

2 202,00

III квартал 2018 г.

5273,39

2 204,00

II квартал 2018 г.

4759,65

1 919,00

I квартал 2018 г.

3858,96

1 805,00

IV квартал 2017 г.

3784,50

1 615,00

III квартал 2017 г.

3241,02

1 530,00

II квартал 2017 г.

2713,20

1 411,00

I квартал 2017 г.

2886,48

1 487,00

IV квартал 2016 г.

3358,05

1 633,00

III квартал 2016 г.

3001,95

1 425,00

II квартал 2016 г.

3142,44

1 385,00

I квартал 2016 г.

2799,93

1 415,00

IV квартал 2015 г.

2563,81

1 297,00

III квартал 2015 г.

3239,28

1 290,00

II квартал 2015 г.

3357,02

1 220,00

I квартал 2015 г.

3299,28

1 241,00

Исходя из данных таблицы 6, мы можем предположить, что между ценой на нефть и стоимостью 100 паев фонда есть некоторая зависимость. Интуитивно понятно, что чем выше цена на нефть, тем выше стоимость паев фонда. Попробуем приближенно выразить зависимость между этими переменными, то есть построить модель, описывающую зависимость стоимости паев от цены на нефть.


Обозначим через – цену на нефть, через – стоимость паев и создадим таблицу с исходными данными в Microsoft Excel.
Чтобы построить диаграмму рассеяния, по оси X отложим значения цены нефти, по оси Y- цену ста паев за каждый из рассматриваемых кварталов (рис. 15).
Из диаграммы рассеяния можно предположить, что между переменными и существует приближенная линейная зависимость, которая описывается классической моделью парной линейной регрессии.



Рис. 15. Диаграмма рассеяния

2.1.2 Уравнение парной линейной регрессии


На основе имеющихся статистических данных и диаграммы рассеяния мы установили приближенную линейную зависимость между двумя наблюдаемыми величинами: независимой переменной и зависимой переменной . В математической форме эта зависимость описывается уравнением парной линейной регрессии (1).

2.1.3 Оценка параметров линейной регрессии

Для оценки параметров линейной регрессии используется метод наименьших квадратов (МНК).


Для расчета оценок и по формулам (5), (6), вычислим выборочные средние значения переменных и (табл. 7).


Таблица 7- Выборочные средние значения и и оценки параметров и

Выборочное среднее значение x

3474







Выборочное среднее значение y

1869,96

Оценка параметра a

624,21

Оценка параметра b

0,36

2.1.4 Построение линии регрессии


После получения оценок a и b, мы можем записать эмпирическую (выборочную) функцию регрессии:



Полученное уравнение можно интерпретировать следующим образом: при увеличении стоимости нефти на 1000 рублей, стоимость паев увеличится на 0,36 рублей.
Используя формулу (16), вычислим прогнозные значения зависимой переменной для наблюдаемых значений независимой переменной (рис. 16).

Рис. 16- Вычисление оценок параметров и прогнозного счета

Добавим теперь прогнозные значения на диаграмму рассеяния (рис. 15) и, сравнивая полученные прогнозные значения цен с исходными наблюдаемыми значениями, попытаемся дать визуальную оценку качества построенной модели (16).


Из рис. 17 видно, что модель (16) не достаточно хорошо описывает исходные данные. Для оценки адекватности модели воспользуемся статистическими методами.

2.2 Оценка качества регрессионной модели


2.2.1 Исследование остатков модели

Расчет остатков модели для наших данных можно увидеть на рисунке 18.





Рис. 17- Диаграмма рассеяния с построенной линией регрессии

Рис. 18 - Расчет остатков модели
Построим график остатков для нашего примера в зависимости от экспорта услуг (рис.19).
На полученном графике остатков в зависимости от цены на нефть видно, что остатки хаотично разбросаны, в чередовании знаков нет закономерности. Остатки чаще принимают отрицательные значения, чем положительные.
Вычислим выборочное среднее остатков, выборочную дисперсию и оценку стандартного отклонения (табл. 8).

Рис. 19 - График остатков в зависимости от цены на нефть

Таблица 8 - Расчет выборочного среднего остатков, выборочной дисперсии и выборочного стандартного отклонения



Выборочное среднее остатков

0,00000

Выборочная дисперсия

222748,89

Выборочное стандартное отклонение

471,96

Анализируя полученные результаты, можно сделать вывод о том, что модель подобрана правильно, так как оценка математического ожидания остатков (выборочное среднее остатков) равна 0, оценка дисперсии остатков (выборочная дисперсия) постоянна.


Проверим теперь предположение о нормальном распределении остатков, используя графический метод. Для начала составим таблицу для анализа остатков модели (рис. 20).

Рис. 20 - Анализ остатков
На основании данных рисунка 20 построим график остатков (рис. 21).

Рис. 21 - График остатков
На полученном графике остатков мы наблюдаем, что остатки частично ложатся на прямую, поэтому будем считать, что предположение о нормальном распределении остатков выполняется не полностью.

2.2.3 Коэффициент детерминации


Вычислим коэффициент детерминации (рис. 23).



Рис. 22 - Вычисление коэффициента детерминации
Получаем = 0,24. Это недостаточно хороший результат: коэффициент детерминации близок к нулю, чем к единице, что указывает на плохое качество аппроксимации наблюдаемых данных построенной моделью. Регрессия объясняет 24% разброса стоимости паев.

2.2.4 Оценки дисперсий МНК-оценок


Вычислим оценки дисперсий оценок a и b и оценки стандартных отклонений a и b по формулам (10), (11).



Рис. 23 - Оценки дисперсий МНК-оценок

2.2.5 Построение доверительных интервалов для параметров регрессии


Построим доверительные интервалы для параметров регрессии (рис. 24).



Рис. 24 - Расчет интервальных оценок параметров при  = 0.01
Получаем границы 99%-ых доверительных интервалов для параметров регрессии: α[-2508,31, 3756,72], β[-0,15, 0,87]. Можно утверждать, что истинные значения параметров с вероятностью 99% находятся в пределах указанных границ. По результатам проверки по доверительному интервалу оба параметра являются незначимыми т.к. в их доверительные интервалы входит нуль.

2.2.5 Проверка значимости параметров регрессии


Проведем t-тест (рис. 25).



Рис. 25- Проверка гипотезы о значимости параметров регрессии
Т.к. модули t-статистики для параметров α и β меньше табличных значений t-критериев, то в данном случае гипотезы принимаются. Параметры не являются значимыми на уровне значимости γ = 0.01.

2.2.6 Проверка значимости коэффициента детерминации. F-тест


Проведем F-тест (табл. 9).


Таблица 9- Проверка значимости регрессии (F-тест)

F-статистика

Уровень значимости

F (γ, 1, n-2)

Решение

6,79

0,01

7,95

регрессия не значима

Т.к. значение F-статистики меньше табличного значения F-критерия, мы принимаем нулевую гипотезу на уровне значимости γ = 0.01. Отсюда вывод: коэффициент регрессии не является значимым и полученное регрессионное уравнение малополезно для предсказания изменений стоимости паев.


2.3 Прогнозирование


Для начала построим доверительные интервалы для прогноза среднего и индивидуального значений (табл. 10)


Таблица 10- Доверительные интервалы для прогноза среднего и индивидуального значений



Оценка дисперсии ошибки прогноза

Доверительный интервал для среднего значения

Доверительный интервал для индивидуального значения










Среднего

Индивидуального

Нижняя граница среднего

Верхняя граница среднего

Нижняя граница индивид.

Верхняя граница индивид.







10 300,42

233 049,31

1 576,85

2 329,39

163,36

3 742,89







11 024,08

233 772,97

1 371,94

2 150,47

-31,34

3 553,75







14 112,27

236 861,16

1 248,47

2 129,32

-115,45

3 493,24







42 906,69

265 655,59

624,32

2 160,22

-518,60

3 303,14







15 778,32

238 527,22

1 614,24

2 545,63

269,25

3 890,61







16 584,39

239 333,28

1 615,14

2 570,02

278,84

3 906,32







17 487,92

240 236,81

1 615,67

2 596,23

288,79

3 923,11







19 908,44

242 657,34

1 615,40

2 661,61

312,22

3 964,79







9 582,32

232 331,21

1 552,24

2 278,08

128,15

3 702,17







70 633,74

293 382,63

1 529,88

3 500,53

507,08

4 523,33







40 601,74

263 350,64

1 583,94

3 078,03

428,42

4 233,55







12 089,33

234 838,23

1 600,37

2 415,64

211,38

3 804,63







11 108,08

233 856,98

1 590,56

2 372,05

188,44

3 774,17







10 309,73

233 058,62

1 409,97

2 162,85

-3,39

3 576,22







20 249,07

242 997,97

1 069,58

2 124,71

-230,43

3 424,71







15 821,93

238 570,83

1 192,94

2 125,62

-151,57

3 470,12







9 535,95

232 284,85

1 466,34

2 190,42

41,55

3 615,21







13 503,57

236 252,47

1 269,86

2 131,51

-101,34

3 502,71







11 364,27

234 113,17

1 355,84

2 146,29

-42,78

3 544,91







17 890,96

240 639,86

1 132,35

2 124,14

-190,44

3 446,92







24 979,25

247 728,14

957,62

2 129,52

-301,70

3 388,84







10 325,15

233 074,04

1 409,07

2 162,51

-4,07

3 575,65







9 540,50

232 289,39

1 465,89

2 190,14

41,16

3 614,86







9 859,65

232 608,54

1 439,17

2 175,44

19,23

3 595,38







Полученные доверительные интервалы добавим на диаграмму рассеяния (рис. 26).
Из построенной диаграммы видно, что ширина доверительных интервалов меняется для разных значений цены нефти. Это объясняется тем, что мы строим прогноз только на основе имеющихся наблюдений. Поэтому для значений, которые лежат внутри исследуемого диапазона, прогноз получается точнее (доверительные интервал уже), а для прогноза стоимости паев, цена на нефть для которой лежит за пределами наблюдаемого диапазона, прогноз будет менее точным.
Найдем прогнозную стоимость 100 паев фонда при цене нефти 7000 рублей за баррель (x = 7000) и построим доверительный интервал прогноза. Для этого создадим расчетную таблицу (рис. 27).

Рис. 26 - Диаграмма рассеяния с построенной линией регрессии и доверительными интервалами для прогноза среднего и индивидуального значений



Рис. 27 - Прогнозирование

Прогноз стоимости паев фонда при цене нефти 7000 рублей за баррель составляет . Доверительный интервал для прогноза среднего значения равен [1299,78; 4968,94], для прогноза индивидуального значения – [599,13; 5669,59]. Надежность выполненного прогноза 99%, прогноз среднего значения счета текущих операций намного точнее прогноза индивидуального значения, т.к. ширина доверительного интервала для среднего значения меньше, чем для индивидуального.




Download 3.57 Mb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling