Лекции.ИНФО


Понятие автокорреляции. Методы ее обнаружения и устранения



 

Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные данные). Среди основных причин, вызывающих появление автокорреляции, можно выделить ошибки спецификации, инерцию в изменении экономических показателей, эффект паутины, сглаживание данных.

Методы обнаружения автокорреляции остатков.

1. Критерий Дарбина-Уотсона.

При статистическом анализе уравнения регрессии на начальном этапе чаще других проверяют выполнимость одной предпосылки, а именно, условия статистической независимости отклонений между собой. Поскольку значения ε­i теоретического уравнения регрессии Y = β0 + β1X + ε остаются неизвестными ввиду неопределенности истинных значений коэффициентов регрессии, то проверяется статистическая незначимость их оценок – отклонений еi, i = 1,2, …, n. При этом обычно проверяется их некоррелированность, являющаяся необходимым, но недостаточным условием независимости. Причем проверяется некоррелированность не любых, а только соседних величин еi. Соседними обычно считаются соседние во времени (при рассмотрении временных рядов) или по возрастанию объясняющей переменной X (в случае перекрестной выборки) значения еi. Для этих величин несложно рассчитать коэффициент корреляции, называемый в этом случае коэффициентом автокорреляции первого порядка,

(3.1)

При этом учитывается, что M(ei) = 0, i = 1,2, …, n.

На практике для анализа коррелированности отклонений вместо коэффициента корреляции используют тесно с ним связанную статистику Дарбина-Уотсона DW, рассчитываемую по формуле:

(3.2)

Действительно,

.

Здесь сделано допущение, что при больших n выполняется соотношение: .

Тогда

. (3.3)

Нетрудно заметить, что если при любом i, то и DW = 0. Если , то , и DW = 4. Во всех других случаях 0<DW<4.

Согласно формуле 3.1 статистика Дарбина-Уотсона тесно связана с выборочным коэффициентом корреляции :

(3.4)

Таким образом, и его значения могут указать на наличие либо отсутствие автокорреляции. Действительно, если (автокорреляция отсутствует), то . Если (положительная автокорреляция), то . Если (отрицательная автокорреляция), то .

Для более точного определения, какое значение DW свидетельствует об отсутствии автокорреляции, а какое о ее наличии, была построена таблица критических точек распределения Дарбина-Уотсона. По ней для заданного уровня значимости a, числа наблюдений n и количества объясняющих переменных m определяются два значения: dL – нижняя граница и dU – верхняя граница.

Общая схема критерия Дарбина-Уотсона будет следующей:

1. По построенному эмпирическому уравнению регрессии определяются значения отклонений ei для каждого наблюдения.

2. По формуле 3.2 рассчитывается статистика DW.

3. По таблице критических точек Дарбина-Уотсона определяются два числа dL и dU и осуществляют вывод по следующей схеме:

0 ≤ DW < dL – существует положительная автокорреляция,

dL ≤ DW < dU – вывод о наличии автокорреляции не определен,

dU ≤ DW < 4 – автокорреляция отсутствует,

4- dU ≤ DW < 4-dL – вывод о наличии автокорреляции не определен,

4-dL ≤ DW ≤ 4 – существует отрицательная автокорреляция.

2. Метод рядов.

Этот метод достаточно прост: последовательно выписываются знаки отклонений ei. Например,

(-----)(+++++++)(---)(++++)(-),

т.е. 5 «-», 7 «+», 3 «-», 4 «+», 1 «-» при 20 наблюдениях.

Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называется длиной ряда.

Визуальное распределение знаков свидетельствует о неслучайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений n, то вполне вероятна положительная автокорреляция. Если же рядов слишком много, то вероятна отрицательная автокорреляция. Для более детального анализа предлагается следующая процедура. Пусть

n – объем выборки;

n1 – общее количество знаков «+» при n наблюдениях (количество положительных отклонений ei);

n2 – общее количество знаков «-» при n наблюдениях (количество отрицательных отклонений ei);

k – количество рядов.

При достаточно большом количестве наблюдений (n1 >10, n2 >10) и отсутствии автокорреляции СВ k имеет асимптотически нормальное распределение с

; .

Тогда, если , то гипотеза об отсутствии автокорреляции не отклоняется.

При небольшом числе наблюдений (n1<20, n2<20) Свед и Эйзенхарт разработали таблицы критических значений количества рядов при n наблюдениях. Суть таблиц в следующем. На пересечении строки n1 и столбца n2 определяется нижнее k1 и верхнее k2 значения при уровне значимости a = 0,05.

Если k1 < k < k2, то говорят об отсутствии автокорреляции.

Если k ≤ k1, то говорят о положительной автокорреляции остатков.

Если k ≥ k2, то говорят об отрицательной автокорреляции остатков.

 

Решение типовых задач

 

На примере задачи 2.6.1 рассмотрим обозначенные выше способы обнаружения автокорреляции остатков.

1. Критерий Дарбина-Уотсона.

Для расчета данной статистики необходимо рассчитать две суммы: и . Значения этих сумм можно получить используя расчетную таблицу (см. выше задача 2.6.1). В данном случае = 21343,64, а = 15453,08, следовательно:

По таблице критических точек Дарбина-Уотсона определяются два числа dL и dU и осуществляют вывод по следующей схеме:

В данном случае dL = 0,697, dU = 1,641. Обозначим, полученные значения на отрезке.

       
   


Так как статистика DW = 1,381 попадает в область неопределенности, то нельзя с полной уверенностью сделать вывод о поведении отклонений ei. Необходимо воспользоваться другим методом обнаружения автокорреляции остатков, например, методом рядов.

 

2. Метод рядов.

Последовательно определяются знаки отклонений ei. В данном случае,

(+)(-----)(+++)(-),

n (объем выборки) = 10;

n1 (общее количество знаков «+» при n наблюдениях) = 4;

n2 (общее количество знаков «-» при n наблюдениях) = 6;

k (количество рядов) = 4.

По таблицам критических значений количества рядов для определения наличия автокорреляции по методу рядов на пересечении строки n1 и столбца n2 определяется нижнее k1 и верхнее k2 значения при уровне значимости a = 0,05. В данном случае k1 = 2, верхнее k2 = 9. Следовательно, если k1 < k < k2, то делаем вывод об отсутствии автокорреляции.

В случае обнаружения автокорреляции в модели, необходимо ее устранить одним из следующих методов:

1. авторегрессионная схема первого AR(1), второго порядка AR(2), третьего AR(3) порядка;

2. метод Кохрана-Оркатта;

3. метод Хилдрета-Лу

4. метод первых разностей.

 

Упражнения и задачи

 

Задача 3.2.1.

По данным задачи 2.7.7. (см. выше) определить наличие в модели автокорреляции остатков, используя статистику Дарбина-Уотсона и метод рядов.

 

Задача 3.2.2.

Определить наличие автокорреляции методом рядов и проверить ее присутствие с помощью статистики Дарбина-Уотсона.

ei 8,3 4,26 -12,46 -1,86 -7,38 5,26 -9,66 -2,26 8,34 7,46

 


Гетероскедастичность

 

Суть гетероскедастичности

 

Одной из предпосылок МНК является условие постоянства дисперсий случайных отклонений (гомоскедастичность). Не должно быть априорной причины, вызывающей большую ошибку (отклонение) при одних наблюдениях и меньшую — при других. Невыполнимость данной предпосылки называется гетероскедастичностью.

На практике гетероскедастичность не так уж и редка. Проблема гетероскедастичности характерна для перекрестных данных и довольно редко встречается при рассмотрении временных рядов. Оценки, полученные по МНК, при наличии гетероскедастичности не будут эффективными (то есть они не будут иметь наименьшую дисперсию по сравнению с другими оценками данного параметра). Стандартные ошибки коэффициентов будут занижены. Поэтому статистики будут завышены, что может привести к признанию статистически значимыми коэффициентов, которые таковыми не являются. Доверительные интервалы теоретических коэффициентов уравнения линейной регрессии получаются уже, чем на самом деле.

Как выяснить наличие гетероскедастичности и смягчить ее по следствия?

 









Читайте также:

Последнее изменение этой страницы: 2016-06-05; Просмотров: 448;


lektsia.info 2017 год. Все права принадлежат их авторам! Главная