Лекции.ИНФО


Гетероскедастичные и автокоррелированные остатки в линейных регрессионных моделях.



Итак, при исследовании остатков ei должно проверяться наличие следующих предпосылок МНК:

1) остатки должны иметь случайный характер;

2) средняя величина остатков должна равняться 0 и не зависеть от хi;

3) дисперсия отклонений ei должна быть одинакова для разных значений хi, это называется гомоскедастичность;

4) должна отсутствовать автокорреляция остатков, иначе, значения остатков ei распределяются друг от друга независимо;

5) остатки распределены по нормальному закону.

Если случайные остатки ei имеет распределение, не соответствующее некоторым предпосылкам МНК, модель следует корректировать.

В случае нарушения первых двух предпосылок следует применить другую функцию, или ввести дополнительную информацию и строить заново уравнение регрессии.

Пятая предпосылка позволяет осуществлять проверку параметров регрессии с помощью критериев t, F. Однако и при невыполнении пятой предпосылки МНК получающиеся оценки регрессии достаточно состоятельны.

Третья и четвертая предпосылка совершенно необходимы, чтобы получить по МНК состоятельные оценки параметров регрессии.

При несоблюдении гомоскедастичности имеет место гетероскедастичность. Она порождает смещенность оценок коэффициентов регрессии, а также уменьшает их достоверность. Поэтому все выводы, полученные на основе t- и F-статистик, и интервальные оценки являются ненадежными. Поэтому и статистические выводы, сделанные при стандартных проверках, могут оказаться ошибочными и приводить к построению неэффективной модели. При этом стандартные ошибки коэффициентов оказываются заниженными, а t-статистики завышенными. При этом статистически значимыми могут оказаться коэффициенты, которые на самом деле ими не являются. В подобной ситуации применяют обобщенный метод наименьших квадратов, заключающийся в том, что минимизация суммы квадратов отклонений производится при взвешивании отдельных ее слагаемых: наблюдения с большей дисперсией складываются с пропорционально меньшим весом. Чтобы установить гетероскедастичность остатков и, следовательно, необходимость использования обобщенного МНК, не ограничиваются визуальной проверкой поведения остатков, а используют эмпирическое подтверждение, например, метод Гольдфельда – Квандта. Покажем его действие на примере (табл.2.3).

Таблица 2.3. Поступления налогов в бюджет (yi – млн.руб.)

от численности работающих (хi – тыс.чел).

№ п/п хi yi ŷх ei
4,6 -1.0 5.6
8,3 2.5 5.8
12,9 4.9 8.0
21,0 16.6 4.4
15,7 19,0 -3,3
29,0 22,5 6,5
37,7 41,4 -3,7
48,9 53,2 -4,3
68,8 66,1 2,7
104,7 82,6 22,1
90,6 88,5 2,1
88,4 107,4 -19,0
132,5 121,4 11,1
122,1 127,4 -5,3
99,2 131,0 -31,8
114,3 142,7 -28,4
150,7 151,0 -0,3
156,2 170,9 -14,7
209,6 180,5 29,1
342,8 327,8 15,0
итого 1856,0 1856,0 0,0

По этим данным получаем уравнение регрессии

ŷх = – 4,565 + 1,178х.

Теоретические значения ŷх и отклонения от них фактических значений ei приведены в четвертой и пятой колонке табл.2.3. Видно, что остаточные значения ei имеют тенденцию к росту при увеличении х и у. Этот вывод подтвердит и критерий Гольдфельда – Квандта. Его применение предполагает выполнение следующих шагов:

- упорядочение наблюдений по возрастанию фактора х;

- исключение из центра таблицыk наблюдений (рекомендуется при n=60 исключать k=16 строк, при n=30 исключать k=8, при n=20 исключать k=4), в данном примере исключаем строки 9–12;

- разделение наблюдений на две группы (в данном случае по ń=(n – k):2=8 наблюдений в каждой, соответственно, с меньшими и большими значениями переменной х) и формирование по каждой из групп подходящего уравнения регрессии (результаты в табл.2.4.);

- определение остаточных сумм квадратов для первой (S1) и второй (S2) групп и нахождение их отношения R=S2:S1. Чем больше значение R превышает табличную величину F–критерия с ń –2 степенями свободы (приложение 2), тем более имеет место нарушение предпосылки о равенстве дисперсий остатков, или наблюдается гетероскедастичность остатков.

Таблица 2.4.

№ п/п хi yi ŷх ei ei2
4,5 5,9 –1,4 1,96
8,2 8,7 –0,5 0,25
12,8 10,3 2,5 6,25
20,9 19,8 1,1 1,21
15,6 21,6 –6,0 36,00
28,9 24,4 4,5 20,25
37,6 39,1 –1,5 2,25
48,8 48,3 0,5 0,25
Уравнение регрессии: ŷх = 2,978 + 0,921х. Сумма S1=68,42
132,5 110,9 21,6 466,56
122,1 118,9 3,2 10,24
99,2 122,9 –23,7 561,69
114,3 136,3 –22,0 484,00
150,7 145,6 5,1 26,01
156,2 168,4 –12,2 148,84
208,6 178,1 30,5 930,25
342,8 346,1 –3,3 10,89
Уравнение регрессии: ŷх = 31,142 + 1,338х. Сумма S2 =2638,48

Получили величину R=2638,48 : 68,42=38.56, которая существенно превышает критическую величинуF-критерия при 5%-м и при 1%-м уровне значимости (4,28 и 8,47, соответственно) для 6 (8-2) степеней свободы, тем самым подтверждая наличие гетероскедастичности.

При нарушении четвертой предпосылки – автокорреляции остатков проявляется корреляция между последовательными по времени остатками наблюдений. Основные причины, вызывающие автокорреляцию, это ошибки спецификации, инерционность при изменении экономических показателей, сглаживание данных, эффект паутины.

Ошибки спецификации. Если в модели не учтена какая-либо важная объясняющая переменная либо неправильно выбрана форма зависимости, то это приводит к систематическим отклонениям наблюдений от регрессии, что порождает автокорреляцию.

Инерционность. Многие экономические показатели (инфляция, ВНП, безработица, и др.) обладают некоторой цикличностью, связанной с периодичностью деловой активности. Экономический подъем приводит к увеличению ВНП, сокращению инфляции, росту занятости, и т.д. Рост продолжается, пока изменение рыночной конъюнктуры и некоторых экономических характеристик не приводит к замедлению роста, потом остановке и движению в обратную сторону рассматриваемых показателей. Во всех случаях эта трансформация обладает определенной инертностью и происходит не мгновенно.

Сглаживание данных. Часто данные по некоторому довольно продолжительному временному периоду усредняют по составляющим его подпериодам. Это может привести к некоторому сглаживанию колебаний, имеющихся в рассматриваемом периоде, что в свою очередь может повлечь автокорреляцию.

Эффект паутины. Многие экономические показатели в разных сферах деятельности реагируют с опозданием (временным лагом)при изменении экономических условий. Так, предложение агропродукции с запаздыванием реагирует на изменение цены (на период созревания урожая). Повышенная цена агропродукции в прошлом году, скорее всего, вызовет ее большее производство в текущем году, поэтому цена на нее понизится и т.д.

Последствия автокорреляции во многом сходны с последствиями гетероскедастичности. К ним относятся:

-Оценки параметров остаются линейными и несмещенными, но перестают быть лучшими несмещенными оценками.

-Дисперсия некоторых оценок получается смещенная, чаще всего, заниженная, из-за чего увеличивается t-статистика. При этом могут быть признаны статистически значимыми объясняющие факторы, которые фактически такими не являются.

-Оценка дисперсии регрессии может также является смещенной вниз оценкой фактического значения дисперсии.

Поэтому выводы по t- и F-статистикам, которые определяют значимость полученных коэффициентов регрессии и детерминации, могут быть неверными. Прогнозные качества модели вследствие этого ухудшаются.

Для обнаружения автокорреляции необходимо наблюдения упорядочить по значению фактора х (как в предыдущем примере) и составить ряды с текущими и предыдущими остатками. Коэффициент корреляции reiej между текущими и предыдущими остатками определяется по формуле коэффициента корреляции (1.1, прил.4).Рассмотрим расчет коэффициента корреляции между остатками, взяв в качестве примера данные из табл.2.3 и перенеся их в табл. 2.5 (n=19).

 

Таблица 2.5.

№ п/п ei ei-1 eiei-1
5,6 5,8 30.24
5,8 8,0 44.8
8,0 4,4 33.6
4,4 -3,3 –14.7
-3,3 6,5 –22.05
6,5 -3,7 –24.57
-3,7 -4,3 17.55
-4,3 2,7 –11.25
2,7 22,1
22,1 2,1
2,1 -19,0 –38.2
-19,0 11,1 –229.2
11,1 -5,3 –64.8
-5,3 -31,8 172.26
-31,8 -28,4 909.15
-28,4 -0,3 11.4
-0,3 -14,7 5.96
-14,7 29,1 –432.1
29,1 15,0
15,0 -
среднее –0,2842 –0,7949 48.5311

σei =15.1347, σej =14,7663 и в соответствие с (1.1, прил.4)

reiej =(48,5311 – (–0,2842)(–0,7949))/15,1347/14,7663=0,2161,

что при 17 степенях свободы незначимо и свидетельствует об отсутствии автокорреляции остатков.

Причины, вызывающие автокорреляцию остатков могут иметь различную природу. Иногда это связано с исходными данными и вызывается наличием ошибок измерения. Причину следует искать также в форме модели, если не включить существенный фактор, который может отражаться в остатках, вследствие чего они оказываются автокоррелированными. Часто этим фактором является время, поэтому проблема автокорреляции остатков весьма актуальна при исследовании динамических рядов, что мы рассмотрим в соответствующем разделе.

 

 









Читайте также:

  1. А если хочешь узнать что у тебя за команда, достаточно сыграть с сильным противником. Ты сразу удивишь все недостатки и недоработки, узнаешь, кто из игроков что стоит.
  2. Анализ информации, получаемой от САРП. Режимы истинного и относительного движения, их достоинства и недостатки. Проигрывание маневра. Возможная опасность чрезмерного доверия САРП.
  3. В чем преимущества и недостатки крупных плодов у растений?
  4. Важнейшие недостатки российской системы налогообложения
  5. Вопрос 2 Численные методы решения линейных и нелинейных уравнений
  6. Глаз как оптическая система. Недостатки зрения.
  7. Графические методы расчета параллельных нелинейных электрических цепей методом двух узлов.
  8. Декодирование линейных кодов.
  9. Делайте свои недостатки достоинствами
  10. Для уменьшения не линейных искажении и повышения КПД
  11. Достоинства и недостатки анкетирования по телефону, почте и при личной встрече с интервьюированным


Последнее изменение этой страницы: 2016-05-30; Просмотров: 109;


lektsia.info 2017 год. Все права принадлежат их авторам! Главная