Лекции.ИНФО


Методы обнаружения гетероскедастичности



 

Тест ранговой корреляции Спирмена

Предполагается, что дисперсии отклонений будут либо увеличиваться, либо уменьшатся с ростом значений X. Пусть n – число наблюдений. Значения переменной X и ранжируются (упорядочиваются по величине). Обозначим через d разность между рангами значений переменной X и ,

Коэффициент ранговой корреляции . (4.1)

Зададим доверительную вероятность p. . По таблицам находим граничную точку . Статистика (4.2)

Если , то на уровне значимости a принимается гипотеза об отсутствии гетероскедастичности. Иначе гипотеза об отсутствии гетероскедастичности отклоняется. В модели содержащей несколько факторов, проверка гипотезы об отсутствии гетероскедастичности проводится с помощью t-статистики для каждого из них отдельно.

Тест Голдфельда-Квандта

Предполагается, что стандартное отклонение пропорционально значению xi переменной X в этом наблюдении, т.е. . Также предполагается, что имеет нормальное распределение и отсутствует автокорреляция остатков. Все n наблюдений упорядочиваются по величине x. Эта упорядоченная выборка делится на три примерно равные части объемом k, n-2k и k соответственно. При n = 30 k = 11, при n = 60 k = 22.

Для каждой из выборок объема k оценивается свое уравнение регрессии и находятся суммы квадратов отклонений и соответственно.

Задается доверительная вероятность p. a = 1 – p. По F-таблицам находим граничную точку , где m – число факторов модели. Статистика .

Если , то на уровне значимости a принимается гипотеза об отсутствии гетероскедастичности. Иначе гипотеза об отсутствии гетероскедастичности отклоняется. Для множественной регрессии тест обычно проводится для того фактора, который в максимальной степени связан с si . При этом выбирают k > m+1. Если нет уверенности относительно выбора фактора xj, то данный тест можно осуществить для каждого фактора.

 

Смягчение проблемы гетероскедастичности. Метод взвешенных наименьших квадратов

 

Гетероскедастичность не позволяет получить эффективные оценки коэффициентов уравнения регрессии, что приводит к необоснованным выводам относительно качества этих оценок. Поэтому при обнаружении гетероскедастичности возникает необходимость каких-то преобразований модели в целях ее устранения. Вид преобразований зависит от того, знаем мы поведение дисперсий отклонений или нет.

Корректировка гетероскедастичности также является достаточно серьезной проблемой. Один из возможных методов устранения гетероскедастичности – это метод взвешенных наименьших квадратов (ВНК). Для его применения необходима определенная информация, либо обоснованные предположения о величине дисперсий отклонений .

Например, может оказаться целесообразным предположить, что дисперсии отклонений ei пропорциональны значениям xi (рис.4.3.1, а) или значениям (рис. 4.3.1, б)

рис.4.3.1

 

Рассмотрим случай, когда дисперсии отклонений неизвестны и пропорциональны xi, т.е. . Тогда уравнение преобразуется делением его левой и правой частей на :

где

В случае, когда неизвестны и пропорциональны , в уравнении линейной регрессии разделим обе части на .

Тогда

Обозначим

Тогда .

Для этого уравнения уже выполнено условие гомоскедастичности. Методом наименьших квадратов находим оценки коэффициентов и возвращаемся к исходному уравнению . В случае, когда число факторов m > 1, исходное уравнение делится на переменную, которая в максимальной степени связана с si.

 

Решение типовых задач

 

Задача 4.4.1

На примере задачи 2.6.1, где m=2 проверим гипотезу об отсутствии гетероскедастичности в построенной модели по тесту Спирмена. Доверительная вероятность p = 95%.

Решение:

Заполним таблицу. Модули элементов четвертого столбца запишем в 5-й столбец. В 6-м, 7-м и 8-м столбцах ранжированы по возрастанию элементы 2-го, 3-го и 5-го столбцов соответственно. n = 10 наблюдений.

Коэффициент ранговой корреляции

= .

По таблицам находим граничную точку = = = 2,365.

Статистика = .

Таким образом , то на уровне значимости a принимается гипотеза об отсутствии гетероскедастичности по фактору X1. В модели, содержащей несколько факторов, как уже было сказано, проверка гипотезы об отсутствии гетероскедастичности проводится с помощью t-статистики для каждого из них отдельно. Следовательно, определим наличие гетероскедастичности по фактору X2.

Коэффициент ранговой корреляции

= .

По таблицам находим граничную точку = = = 2,365.

Статистика = .

Таким образом , то на уровне значимости a принимается гипотеза об отсутствии гетероскедастичности по фактору X2.

 

Задача 4.4.2.

Рассматривается регрессионная линейная модель с m=2 факторами. n = 30 наблюдений. Для первых и последних k=11 наблюдений суммы квадратов отклонений S1=20 и S3=45 соответственно. С помощью теста Голдфельда-Квандта проверим гипотезу об отсутствии гетероскедастичности. Доверительная вероятность p = 95%.

Решение:

a = 1- p = 1 – 0,95 = 0,05. По F – таблицам Фишера находим граничную точку .

Статистика F = = < 3,44.

Таким образом, на уровне значимости 5% принимается гипотеза об отсутствии гетероскедастичности.

 

Упражнения и задачи

 

Задача 5.5.1

Рассматривается регрессионная линейная модель с m=2 факторами. n = 30 наблюдений. Для первых и последних k=11 наблюдений суммы квадратов отклонений S1=18 и S3=52 соответственно. С помощью теста Голдфельда-Квандта проверим гипотезу об отсутствии гетероскедастичности. Доверительная вероятность p = 99%.

 

Задача 5.5.2

В задаче 2.7.7 определить наличие гетероскедастичности в построенной модели.

 

Мультиколлинеарность

 









Читайте также:

Последнее изменение этой страницы: 2016-06-05; Просмотров: 163;


lektsia.info 2017 год. Все права принадлежат их авторам! Главная