Лекции.ИНФО


Прогнозирование. Доверительный интервал прогноза.



Получение оценок коэффициентов регрессии и проверка их достоверности не являются самоцелью, это лишь необходимый промежуточный этап. Основное – это использовать модель для анализа и прогноза значений изучаемого экономического явления. Прогноз осуществляется подстановкой значения фактора х в полученную формулу регрессии.

Используем полученное в примере 1.1 (прил.4) уравнение регрессии для прогноза объема товарооборота. Если намечается открыть магазин с численностью работников х=140 чел., то обоснованный объем товарооборота устанавливается по уравнению ŷ(х)= –0,974 + 0,01924×140=1,72 млрд. рублей.

Доверительный интервал для прогноза значения у(х)=a0+a1х определяется по формуле

, (2.2)

где tp – критическая граница распределения Стьюдента с n – 2 степенями свободы, соответствующая уровню значимости р. Для получения доверительного интервала воспользуемся выражением (2.2).

Выберем уровень значимости 5%. Количество степеней свободы у нас 8 – 2 = 6, тогда по таблице распределения Стьюдента (приложение 1) находим

t0.05(6)=2,447.s= =0,089,

следовательно, с вероятностью 95% истинные значения объемов товарооборота будут лежать в пределах

1,72 – 2,447×0,048<y(x)<1,72+2,447×0,048, или 1,60<y(x)<1,84.

 

2.8. Практический блок

Пример.Построить уравнение регрессии между заданными переменными, проверить её адекватность, сделать прогноз методом экстраполяции.

1. Построить диаграмму рассеяния в EXCELи сделать заключение о наличии корреляции.

Таблица 2.6Диаграмма 2.1

Y x
29,5 2,1
34,2 2,9
30,6 3,3
35,2 3,8
40,7 4,2
44,5 3,9
47,2 5,0
55,2 4,9
51,8 6,3
56,7 5,8

Из диаграммы 2.1 видно, что между переменнымиx и y имеется сильная линейная связь.

2. Рассчитать коэффициент корреляции. Проверить значимость коэффициента корреляции, используя при этом t-критерий Стьюдента. Сделать вывод о связи между х и у.

Таблица2.7

xy
29,5 2,1 61,95 4,41 870,25 27,91 0,054 1,59
34,2 2,9 99,18 8,41 1169,64 33,46 0,022 0,74
30,6 3,3 100,98 10,89 936,36 36,23 0,184 -5,63
35,2 3,8 133,76 14,44 1239,04 39,69 0,128 -4,49
40,7 4,2 170,94 17,64 1656,49 42,47 0,043 -1,77
44,5 3,9 173,55 15,21 1980,25 40,39 0,092 4,11
47,2 5,0 2227,84 48,01 0,017 -0,81
55,2 4,9 270,48 24,01 3047,04 47,32 0,143 7,88
51,8 6,3 326,34 39,69 2683,24 57,02 0,101 -5,22
56,7 5,8 328,86 33,64 3214,89 53,55 0,056 3,15
ИТОГО: 42,2 1902,04 193,34 19025,04 0,840  
Среднее 42,6 4,22 190,204 19,334 1902,504      

 

2.1.Теснота связи между переменными:

;

Вывод: сильная связь.

2.2.Проверим по критерию Стьюдента статистическую значимость:

-по критерию Стьюдента: tвыб<=tкр

-гипотеза Но: r=0,tкр=2,31,

tвыб=rвыб*

Так какtвыб=5,84<tкр=2,31, то с вероятностью 0,9 начальная гипотеза отвергается, что указывает на сильную линейную связь.

3. Записать систему нормальных уравнений для коэффициентов линейной регрессии. Используя метод наименьших квадратов, рассчитайте эти коэффициенты.

Подставляя в найденное уравнение регрессии значения (графа (3) табл.2.7), рассчитаем значения (графа (7) табл.2.7).

 

4. Для полученного уравнения регрессии между Х и У рассчитать среднюю ошибку аппроксимации. Сделать заключение об адекватности полученной модели.

Заполним 8-ю и 9-ю графу табл.2.7.

<Екр=12%

Модель признается удовлетворительной.

5. Проверить значимость коэффициента a1уравнения регрессии, используя критерий Стьюдента.

Решение: Таблица 2.8

29,5 2,1 27,91 214,623 2,5281 170,564
34,2 2,9 33,46 82,81 0,5476 69,8896
30,6 3,3 36,23 40,069 31,6969 143,0416
35,2 3,8 39,69 8,237 20,1601 54,1696
40,7 4,2 42,47 0,008 3,1329 3,46
44,5 3,9 40,39 4,709 16,8921 3,7636
47,2 48,01 29,703 0,6561 21,5296
55,2 4,9 47,32 22,658 62,0944 159,7696
51,8 6,3 57,02 209,092 27,2484 85,3776
56,7 5,8 53,55 120,78 9,9225 199,9396
ИТОГО: 425,6 42,2 426,1 732,687 174,8791 911,504
Среднее 42,56 4,22        

Статистическая проверка:

 


Выводы: С доверительной вероятностью 0.9 коэффициент a1 является статистически значимым, таким образом, гипотеза отвергается.

 

6. Проверить адекватность уравнения регрессии в целом, применив F-критерий Фишера-Снедекора.

Статистическая проверка:

:модель не адекватна

Так какFвыб>Fкр, то отвергается гипотеза (принимается альтернативная)с доверительной вероятностью 0.95. Данная модель адекватна и может использоваться для прогнозирования при принятии управленческих решений.

7. Рассчитать эмпирический коэффициент детерминации.

Имеем:

(таб. 2.8).

- доля вариации.

Таким образом, 80% вариации объясняемой переменной объясняется включенным в модель фактором, а 20% факторами, не включенными в модель.

8. Рассчитать корреляционное отношение. Сравнить полученное значение с линейным коэффициентом корреляции.

Имеем:

Тесноту связи между переменными для произвольной связи показывает эмпирическое корреляционное отношение, при линейной связи , и коэффициент корреляции равен коэффициенту детерминации.

9. Выполнить точечный прогноз для .

Решение:

10-12. Рассчитать доверительные интервалы при вероятности =90% для уравнения регрессии и для результирующей переменной . Изобразить в одной координатной системе:

- исходные данные,

- точечный прогноз,

- линию регрессии,

- 90% доверительные интервалы.

Сформулировать общие выводы относительно полученной регрессионной модели.

Имеем:

-математическое ожидание среднего.

Чтобы выполнить интервальный прогноз рассмотрим две области.

а) доверительные границы уравнения регрессии дляy из области значений переменнойx рассчитаем по формуле:

б) для прогнозных значений доверительный интервал для рассчитаем по формуле:

Имеем:n=10, t=2,31(таб. Приложение 1),

19,334-4,222)=1,53.

: 27,9; 42,6; 57,0; 66,7

Таблица 2.9

                   
1 2,1 -2,12 1,74 3,03 4,49 2,31 4,68 27,9 18,81 9,10 46,72
4,22 0,00 0,32 0,1 0,00 2,31 4,68 42,6 3,46 39,10 46,02
6,3 2,08 1,71 2,93 4,33 2,31 4,68 57,0 18,49 38,53 75,51
7,7 3,48 9,02 12,11 2,31 4,68 66,7 32,43 34,29 99,15

Т.к. 90% точек наблюдения находится в 90% - доверительном интервале, данная модель с ее доверительными границами может использоваться для прогнозирования с доверительной вероятностью 0,9.

Контрольные вопросы

1. Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.

2. Виды автокорреляции и их краткая характеристика.

3. Автокорреляция в остатках и порядок её обнаружения.

4. Виды автокорреляции в остатках.

5. Порядок использования критерия Дарбина-Уотсона.

6. Автокорреляция в исходных данных и порядок определения её наличия.

7. Методы устранения влияния автокорреляции на результаты прогнозирования.

8. Обобщенный метод наименьших квадратов (ОМНК).

9. Что понимается под гомоскедастичностью?

10. Как проверяется гипотеза о гомоскедастичности ряда остатков?

11. Оценка качества регрессии. Проверка адекватности и достоверности модели.

12. Значимость коэффициентов регрессии (критерий Стъюдента).

13. Дисперсионный анализ. Проверка достоверности модели связи (по F-критерию Фишера).

14. Коэффициенты и индексы корреляции. Мультиколлениарность.

15. Оценка значимости корреляции. Детерминация.

16. Средняя ошибка аппроксимации.

17. Принятие решений на основе уравнений регрессии.

18. В каких задачах эконометрики используется распределение Фишера?

19. Таблицы каких распределений используются при оценке качества линейной регрессии?

20. Каковы особенности практического применения регрессионных моделей?

21. Как осуществляется прогнозирование экономических показателей с использованием моделей линейной регрессии?

22. Как можно оценить «естественный» уровень безработицы с использованием модели линейной регрессии?

23. В каких случаях необходимо уточнение линейной регрессионной модели и как оно осуществляется?

24. Когда необходимо выведение из рассмотрения незначимых объясняющих переменных и добавление новых переменных?

 

Задания и задачи

1. Имеются данные о показателях деятельности компаний США в 2006г.

№ п/п Чистая прибыль, млрд$,у Использованный капитал, млрд $,х1 Оборот капитала, млрд$,х2 Капитализация компании, млрд$, х4 Числен­ность сотрудников, тыс.чел., х3
0,9 18,9 31,3 40,9 43,0
1,7 13,7 13,4 40,5 64,7
0,7 18,5 4,5 38,9 24,0
1,7 4,8 10,0 38,5 50,2
2,6 21,8 20,0 37,3 106,0
1,3 5,8 15,0 26,5 96,6
4,1 99,0 137,1 37,0 347,0
1,6 20,1 17,9 36,8 85,6
6,9 60,6 165,4 36,3 745,0
0,4 1,4 2,0 35,3 4,1
1,3 8,0 6,8 35,3 26,8
1,9 18,9 27,1 35,0 42,7
1,9 13,2 13,4 26,2 61,8
1,4 12,6 9,8 33,1 212,0
0,4 12,2 19,5 32,7 105,0
0,8 3,2 6,8 32,1 33,5
1,8 13,0 27,0 30,5 142,0
0,9 6,9 12,4 29,8 96,0
1,1 15,0 17,7 25,4 140,0
1,9 11,9 12,7 29,3 59,3
-0,9 1,6 21,4 29,2 131,0
1,3 8,6 13,5 29,2 70,7
2,0 11,5 13,4 29,1 65,4
0,6 1,9 4,2 27,9 23,1
0,7 5.8 15,5 27,2 80,8

Задание:

Рассчитать параметры уравнения линейноймножественной регрессии с данным перечнем факторов.

Рассчитать парные коэффициенты корреляции и отобрать информативные факторы для модели. Построить модель с информативными факторами и оценить ее параметры.

Рассчитать прогнозное значение результата.

Рассчитать доверительный интервал прогноза и ошибки и при
уровне значимости 5 или 10% (γ = 0,05; γ = 0,10).

2. Имеются данные о показателях деятельности компаний США в 2009г.

№ п/п Чистая прибыль, млрд $, у Использованный капитал, млрд $.х1 Оборот капи­тала, млрд$, х2 Численность, тыс. чел., х3
6,6 83,6 6,9 222,0
3,0 6,5 18.0 32,0
6,5 50,4 107,9 82,0
3,3 15,4 16,7 45,2
0,1 29,6 79,6 299,3
3,6 13,3 16,2 41,6
1,5 5,9 5,9 17,8
5,5 27,1 53,1 151,0
2,4 11,2 18,8 82,3
3,0 16,4 35,3 103,0
4,2 32,5 71,9 225,4
2,7 25,4 93,6 675,0
1,6 6,4 10,0 43,8
2,4 12,5 31,5 102,3
3,3 14,3 36,7 105,0
1,8 6,5 13,8 49,1
2,4 22,7 64,8 50,4
1,6 15,8 30,4 480,0
1,4 9,3 12,1 71,0
0,9 18,9 31,3 43,0

Задание:

Рассчитать параметры уравнения линейной множественной регрессии с данным перечнем факторов.

Рассчитать парные коэффициенты корреляции и отобрать информативные факторы для модели. Построить модель с информативными факторами и оценить ее параметры.

Рассчитать прогнозное значение результата.

Рассчитать доверительный интервал прогноза и ошибки при
уровне значимости 5 или 10% (γ = 0,05; γ = 0,10).









Читайте также:

Последнее изменение этой страницы: 2016-05-30; Просмотров: 165;


lektsia.info 2017 год. Все права принадлежат их авторам! Главная