Лекции.ИНФО


Проверка значимости параметров множественной линейной регрессии с использованием f-критериев



В таблице2.1 содержатся ежегодные данные о показателях экономики России с 1999 по 2011 годы (трлн.руб., в ценах 2010 г.):

Y –объем товарного импорта в Россию;

X1 –ВВП;

X2 –личное потребление.

Таблица2.1

год Y X1 X2 год Y X1 X2
4.02 37.32 1.05 5.67 50.5 0.53
4.10 40.30 1.03 6.62 53.1 1.4
4.75 42.87 0.78 7.03 56.5 1.25
4.78 43.87 0.78 6.9 57.98 1.28
4.7 45.2 0.28 6.58 59.75 0.18
5.1 47.67 0.55 7.78 64.5 1.4

Будем искать модель в виде

где – значение фактора в i-м наблюдении. Предположим, что случайные величины, распределенные по нормальному закону с параметрами, и значение нам не известно. Выполняя регрессионный анализ, получаем следующие результаты: и

Переменная Коэффициент Станд. ошибка t-статистика P-значение
–8.571 2.868 -2.987 0.0154
X1 0.028 0.111 0.268 0.7954
X2 0.178 0.167 1.068 0.3137

В соответствии с полученными -значениями, каждая отдельная гипотеза , при уровне значимости должна быть принята. Т.е. проверка показывает, параметры или признаются статистически незначимыми. Это противоречит большому значению коэффициента детерминации.

Значит, нам надо проверить гипотезу

определяющую значения не одного, а одновременно двух коэффициентов.

В общем случае необходимо проверить гипотезу

в случае линейной множественной регрессии

Статистический критерий для решения этой задачи основывается на F-статистике, которая после небольших преобразований принимает вид:

где – остаточная сумма квадратов.

В некоторых пакетах обработки статистики (например, в EXCEL, см. п.2.5 приложение 4) в результатах приводятся числитель и знаменатель этой статистики (графа Средние квадраты Mean Squares).

Указанная -статистика имеет при гипотезе H0 (α1=¼= αm=0) распределение , которое называется F-распределение Фишера с m и (n-m-1) степенями свободы.

Чем больше значение критерия Фишера, тем больше оснований считать, что переменные в совокупности действительно объясняют изменчивость объясняемой переменной .

Значит, гипотеза

отвергается при больших значениях выражения F.

Пороговое значение уровня является квантилем распределения и обозначается .

Таким образом, гипотеза Н0 отвергается при выполнении неравенства

Вероятность ошибки при этом равна .

Статистические пакеты регрессионного анализа среди прочих результатов приводят также значение данной -статистики и соответствующее P-значение (P-value), или вероятность

В примере с товарным импортом в Россию получено значение -статистики, равное , а пороговое значение

Таким образом, в этом примере нет оснований принимать гипотезу , хотя каждая из отдельных гипотез

или ,

рассматриваемая по отдельности, не отвергается.

Подобные случаи встречаются на практике и объясняются мультиколлениарностью данных. Рассмотрим эту проблему ниже.

Пример 2.5.Анализ данных о безработице в примере 2.1дает следующие результаты:

, , -значение = , поэтому при выборе гипотеза принимается, а при отвергается.

Пример 2.6.Анализ данных о куриных окорочках в примере 2.3приводит к значениям

, , -значение = , поэтому гипотеза отвергается, а уравнение регрессии признается статистически значимым.

Пример 2.7. Потребление свинины в зависимости от цен (пример 2.4):

, , -значение = , поэтому гипотеза принимается даже при выборе .

Отметим, что во всех рассмотренных примерах парной линейной регрессии (m=1) были получены -значения -статистик, которые совпадают с -значениями -статистик, применяемые для проверки гипотезы . Такое совпадение не случайно и может быть доказано.

Кроме анализа значимости коэффициентов регрессии распределение Фишера (F-критерии) применяется также в процессе подбора вида модели.

Рассмотрим множественную линейную регрессию

имеющую объясняющих переменных. Гипотеза заключается в том, что в модели M(m) q последних коэффициентов равны нулю:

Тогда в случае справедливости гипотезы получается редуцированная модель

имеющая объясняющих переменных.

Если и – остаточные суммы квадратов в модели M(m) и редуцированной модели M(m-q) соответственно, гипотеза верна и погрешности являются нормально распределенными случайными величинами с параметрами , то F-статистика

имеет при гипотезе H0 F-распределение Фишера F (q, n-m-1) с q и (n-m-1) степенями свободы.

Дополнительное количество объясняющих переменных, включенных в уравнение, ведет к возрастанию объясненной суммы квадратов, что и показывает F-статистика.

Таким образом, получаем критерий проверки гипотезы

основанный на F-статистике и отвергающий гипотезу , если фактическое значение удовлетворяет неравенству

где – заданный уровень значимости критерия.









Читайте также:

Последнее изменение этой страницы: 2016-05-30; Просмотров: 73;


lektsia.info 2017 год. Все права принадлежат их авторам! Главная