Лекции.ИНФО


Метод наименьших квадратов (МНК).



Оценка параметров регрессии a0 и a1 производится по наблюденным значениям зависимой и объясняющей переменным (xi,yi), i=1,2,…,n, где n – число пар наблюдений (объем выборки). Рассматриваются n уравнений уi=a0+a1хi+ei, где уклонения ei является следствием реализации случайной составляющей, и выбирают такие значения a0 и a1, которые минимизируют сумму квадратов этих уклонений, т.е. ищется минимум

Q=åiei2= åi(уi – a0 – a1хi)2 (5)

по отношению к параметрам a0 и a1. Заметим, что указанный метод наименьших квадратов (МНК)может быть применен к любой кривой регрессии f(x). “Наилучшая” по МНК прямая линия всегда существует, но даже наилучшая не всегда является достаточно хорошей. Если в действительности зависимость у= f(x) является, например, квадратичной, то ее не сможет адекватно описать никакая линейная функция, хотя среди всех линейных функций обязательно найдется “наилучшая”.

Для отыскания минимума берутся частные производные Q по искомым параметрам (в данном случае по a0 и a1) и приравниваются к нулю. После выполнения элементарных преобразований получают так называемую систему нормальных уравнений, из которой и находятся искомые параметры. Для парной линейной регрессии получаем

a1=( × )/( – ( )2), (6)

a0= –a1 × =(( ) × × )/( – ( )2),

где xiyi/n, xi/n, yi/n, хi2/n.

Коэффициент a1 называется коэффициентом регрессии и обозначается ryx. Из (2) и (6) следует, что

ryx = ryx sy /sх. (7)

Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репрезентативна), то заключение о тесноте линейной зависимости между признаками, полученными по данным выборки, в известной степени может быть распространено и на генеральную совокупность, т.е. можно выдвинуть гипотезу об имеющейся линейной связи во всей генеральной совокупности вида у=a0+a1х.

Свойства оценок МНК.

Оценки, сделанные с помощью МНК, обладают следующими свойствами:

– оценки являются несмещенными, т.е. математическое ожидание оценки каждого параметра равно его истинному значению. Это вытекает из того, что Мe=0, и говорит об отсутствии систематической ошибки в определении положения линии регрессии;

– оценки состоятельны, так как дисперсия оценок параметров при возрастании числа наблюдений стремится к нулю. Иначе говоря, надежность оценки при увеличении выборки растет;

– оценки эффективны, они имеют наименьшую дисперсию по сравнению с любыми другими оценками данного параметра (при линейной аппроксимации). В англоязычной литературе они называются BLUE (Best Linear Unbiased Estimators – наилучшие линейные несмещенные оценки).

Регрессия по эмпирическим (выборочным) данным и теоретическая регрессия.

Пример 1. Исследуем зависимость розничного товарооборота (млрд. руб.) магазинов от среднесписочного числа работников. В табл.1 во втором и третьем столбцах приведены значения соответственно объемов розничного товарооборота(у) и среднесписочного числа работников(х), а в следующих столбцах – значения необходимых расчетных величин.

Таблица 1

номер у х (х – )2 (у – )2 х2 ху ŷ ε ε2
0,5 0,49 36,5 0,43 0,07 0,0049
0,7 0,25 59,5 0,661 0,039 0,0015
0,9 0,09 91,8 0,998 -0,098 0,0096
1,1 0,01 126,5 1,239 -0,139 0,0193
1,4 0,04 170,8 1,373 0,027 0,0007
1,4 0,04 176,4 1,45 -0,05 0,0025
1,7 0,25 227,8 1,604 0,096 0,0092
1,9 0,49 279,3 1,854 0,046 0,0021
сумма 9,6 1,66 1168,6 9,592 0,001 0,0479
средн. 1,2 544,5 0,2075 13313,5 146,075 1,199 0,0001 0,0060

 

В соответствии с (6)

a1=( × )/( – ( )2) =(146,075 – 113×1,2)/544,5=0,01924;

a0=(( ) × × )/( –( )2)=(13313,5×1,2–113×146,075)/544,5= -0,974.

Таким образом, получено уравнение регрессии

ŷ = – 0,974 + 0,01924х.

Экономическая интерпретация параметров линейного уравнения регрессии.

Коэффициент регрессии a1=0,01924 показывает, что увеличение среднесписочной численности на одного человека приводит к увеличению объема товарооборота в среднем на 19,24 млн. руб. Это своего рода эмпирический норматив приростной эффективности использования работников данной группы магазинов. Если увеличение численности на одного работника приводит к меньшему росту объема товарооборота, то прием его на работу необоснован.

Выборочный коэффициент корреляции можно определить, используя равенство (7).

ryx = 0,01924√544,5/0,2075= 0,9856,

что свидетельствует о наличии тесной линейной связи между численностью работников и розничным товарооборотом.









Читайте также:

Последнее изменение этой страницы: 2016-05-30; Просмотров: 131;


lektsia.info 2017 год. Все права принадлежат их авторам! Главная