Характеристики точности оценок коэффициентов регрессии
Из МНК следует, что оценки коэффициентов уравнения регрессии Исходя из МНК, можно показать, что для парной регрессии математическое ожидание дисперсии D(e) определяется выражением
Отсюда следует, что
является несмещенной оценкой теоретической дисперсии случайных отклонений Характеристиками точности оценок коэффициентов
Приведем формулы связи дисперсий коэффициентов регрессии с необъясненной дисперсией S2, которые необходимы для расчета стандартных ошибок. Формулу для определения
Вводя обозначение
Тогда Обозначив
Так как дисперсию Y можно считать постоянной и не зависящей от Х для конкретных выборочных наблюдений, то ci и di можно рассматривать как некоторые постоянные. Для регрессионной модели дисперсия Y будет фактически равна оценке дисперсии случайных отклонений S2. Следовательно,
Формулы (2.17), (2.20) и (2.21) позволяют определять стандартные ошибки коэффициентов регрессии. Из (2.20) следует, что дисперсия оценки Параметры эмпирической регрессионной модели изменяются при переходе от одной выборки к другой. Поэтому на практике возникает задача выбора наиболее точных и надежных параметров и определения их интервальных оценок. Эта задача решается путем сравнения коэффициентов регрессионных уравнений Если рассматривается гипотеза
которая, по определению статистики Стьюдента, имеет распределение Стьюдента с числом степеней свободы v = n - 2 для парной линейной регрессии. Следовательно, на основании t-критерия гипотеза Н0 отклоняется если
где tкр определяется по таблице критических точек распределения Стьюдента при требуемом уровне значимости α. В противном случае гипотеза Н0 принимается. Тогда (в предположении, что верна Н0) для определения доверительного интервала параметра b1 воспользуемся соотношением для доверительной вероятности
Переходя к двойному неравенству и разрешая его относительно b1 получим где Наиболее простой и в то же время важной для парной регрессии задачей является проверка гипотезы Если Н0 принимается, то есть основания считать, что исследуемая величина Y не зависит от Х. В этом случае коэффициент В данной постановке гипотез t-статистика (критерий) определяется отношением
Это значение приводится всеми эконометрическими компьютерными пакетами в результатах регрессионной статистики. В данном случае рассматривается двусторонняя критическая область, поскольку Чтобы сделать вывод о статистической значимости По аналогичной схеме на основе t-статистики проверяется гипотеза о статистической значимости коэффициента
Малые значения t-статистики соответствуют отсутствию достоверной статистической значимости коэффициентов. Для получения промежуточных выводов при оценке значимости коэффициентов линейной регрессии (параметров модели) можно использовать следующее «грубое» правило, позволяющее не прибегать к таблицам. Если |tнабл| < 2, то коэффициент не может быть признан достоверно статистически значимым. Если |tнабл| > 3, то коэффициент признается статистически значимым. Доверительная вероятность в этом случае составляет не менее 0,95. В случае 2 £ |tнабл| £ 3, найденная оценка может рассматриваться как относительно значимая. Предложенное правило достаточно надежно работает, если число наблюдений n ³ 10. Пример 2.2. По данным примера 2.1 вычислить характеристики точности и оценить статистическую значимость параметров построенной регрессионной модели. Вычислим стандартные ошибки параметров парной регрессии. Для Вычисления дисперсии D(x) проведены при оценке параметра Для параметра Проверим статистическую значимость параметров (коэффициентов регрессии). Расчетное (наблюдаемое значение) t-статистики для параметра
Табличное (критическое) значение t-статистики при уровне значимости α = 0,01 и числе степеней свободы v = n - 2 = 6 будет составлять tкр = 3,71. Поскольку |tнабл| > tкр (18,84 > 3,71), то гипотеза Н0 (нулевая гипотеза) отклоняется и принимается альтернативная гипотеза Н1, согласно которой коэффициент регрессии признается статистически значимым. Для параметра
Так как |tнабл| > tкр (8,74 > 3,71), то нулевая гипотеза отклоняется и свободный член в уравнении регрессионной модели Рассчитаем доверительные интервалы параметров Доверительный интервал для коэффициента регрессии [0,39 - 2,45 · 0,0207; 0,39 + 2,45 · 0,0207] ~ [0,339 (нижняя граница); 0,440 (верхняя граница)]. Построенный интервал накрывает истинное значение с надежностью 95 %. Доверительный интервал для свободного члена [34,845 - 2,45 · 3,643; 34,845 + 2,45 · 3,643] ~ [22,93; 40,76]. Таким образом, параметры построенной по имеющимся статистическим данным регрессионной модели будут находиться в указанных границах с вероятностью Р = 1 - α = 0,95.
Читайте также:
|
Последнее изменение этой страницы: 2016-06-05; Просмотров: 128;