Лекции.ИНФО


Нахождение доверительных интервалов для коэффициентов регрессионной модели



Построение доверительных интервалов для коэффициентов aj линейной множественной регрессии

у=a0+a1х1 +a2х2 +…+amхm+e.

где e нормально распределенная случайная величина с параметрами ,осложняется из-за присутствия в формуле для вычисления дисперсий

неизвестного значения s2.

Для преодоления этой проблемы предлагается заменить s2 подходящей оценкой, которую вычисляют на основании фактических данных. Такие оценки называют статистиками.

Такой подходящей оценкой для является статистика

где Т.к. эта сумма является функцией от отклонений, которые представляют собой случайные величины, она также является случайной величиной, и поэтому статистика`S2 тоже случайная величина.

Математическое ожидание статистики S2 равно :

таким образом, – несмещенная оценка для .

При отсутствии факторов модель принимает вид

Несмещенная оценка для :

Оценкой для параметра a0 является , так что

Следовательно, при вычислении выборочной дисперсии переменной , происходит деление на (а не на ), в результате получается несмещенная оценка для .

Отношение

распределено по закону, называемому распределением хи-квадрат с (n-m-1) степенями свободы. Аналогичный закон распределения имеет сумма квадратов независимых случайных величин, имеющих одинаковое нормальное распределение. При функция плотности распределения хи-квадрат имеет вид:

Распределение хи-квадрат с к степенями свободы обозначаетсяc2(к).

Таким образом, не зная истинного значения и строя доверительный интервал для ajмы заменяем неизвестное значение на его несмещенную оценку

Следовательно, вместо отношения

используем отношение

Последнее отношение не распределено по стандартному нормальному закону, т.к. в знаменателе теперь стоит случайная величина.

Распределение последнего отношения называется t-распределение Стьюдента с (n-m-1) степенями свободы.

Распределение Стьюдента с к степенями свободы обозначается t(к). Квантилем уровня р является такое число, которое случайная величина не превосходит с вероятностью р и обозначается tp(к).

Пример некоторых значений квантилей:

Из приведенных значений следует, что случайная величина, распределенная по Стьюденту с 10 степенями свободы, может принимать значения, меньшие, чем 1.812 с вероятностью 0.95.

Имеем,

~ .

Таким образом, выполняется соотношение

поэтому с вероятностью, равной , выполняется неравенство

т. е.

Т.е, с вероятностью, равной 1-р, интервал

покрывает истинные значения коэффициента αj, таким образом, является доверительным интервалом для αj с вероятностью 1-р. Границы данного интервала определены при условии, что нам не известно значение s2дисперсии случайных ошибок.

Выбор конкретного значения р определяет размер доверительного интервала, обеспечивающий соответствующий уровень доверия.

Размер доверительного интервала пропорционален величине . Таким образом, увеличение уровня доверия связано с увеличением размера доверительного интервала.

Например, для к= квантили уровня 1-р/2 распределения Стьюдента для значенийр=0.1, 0.05, 0.01 равны, соответственно, . Следовательно, изменение уровня доверия от 0.9к 0.95увеличивает доверительный интервал в 1.2раза, а дополнительное изменение уровня доверия до 0.99 увеличивает доверительный интервал еще в 1.3раза.

Перейдем теперь к получению интервальных оценок параметров линейной регрессии на конкретных примерах.

Пример 2.1.Пусть получена модель зависимости уровня безработицы жителей Челябинской области от размера средней зарплаты в виде

При этом количество наблюдений взято n=17 и получены следующие значения:

Š=0.161231; .

Получаем: = . Для построения доверительного интервала для 95%-уровня найдем квантиль уровня распределения Стьюдента с степенями свободы. Из приложения 1 находим: . Следовательно получаем следующий -доверительный интервал для :

или

Для имеем , ; -доверительный интервал для имеет вид

или

Отметим, что левая граница доверительного интервала для коэффициента имеет отрицательное значение.

Избежать этого можно, понизив уровень доверия до 0.9.Для чего квантиль заменим на квантиль , тогда левая граница доверительного интервала для станет равной 0.0164. Таким образом, истинное значение параметра будет находиться в новом доверительном интервале только в 90 случаев из 100, а не как в старом в 95 из 100.

 









Читайте также:

Последнее изменение этой страницы: 2016-05-30; Просмотров: 195;


lektsia.info 2017 год. Все права принадлежат их авторам! Главная