Лекции.ИНФО


Оценивание значимости качественных признаков при исследовании пространственных выборок



2.1.1. Задание*

Исследовать зависимость между результатами письменного вступительного экзамена и экзамена в первую сессию по таблице 24, где Y – число задач, решенных на экзамене в сессию (из 7 задач задания), Х – число задач, решенных на вступительном экзамене (из 10 задач). Ответить на вопросы: влияют ли результаты вступительных экзаменов на успеваемость в сессию? Влияет ли пол студента на успеваемость в сессию? Одинакова ли зависимость Y(Х) для лиц мужского и женского пола?

Таблица 24. Число задач, решенных на экзаменах

№ сту­дента (i) Число решенных задач Пол студента zi zi xi № сту­дента (i) Число решенных задач Пол студента zi zi xi
xi yi xi yi
1. муж. 7. жен.
2. жен. 8. муж.
3. муж. 9. муж.
4. жен. 10. жен.
5. жен. 11. муж.
6. муж. 12. жен.

Выполнение

Найдем уравнение парной линейной регрессии Y=mX+b по всем наблю­дениям таблицы 24 (т. е. не учитывая качественный признак «Пол студента»). Результаты функции ЛИНЕЙН, необходимые для дальнейших расчетов, приведены в таблице 25.

Значение статистики Фишера F=11,29 больше порога f(0,05, 1, 10)=4,96. Таким обра­зом, неравенство (35) справедливо, и уравнение Y=0,815X-1,44 значимо. Следовательно, успеваемость в сессию Y существенно зависит от результатов вступитель­ных экзаменов X.

Исследуем влияние пола студента на успеваемость в сессию. Для этого введем фиктивную переменную Z (равную 1 для мужчин и 0 для женщин) и оценим параметры уравнения регрессии Y=mX+m1Z+b. Результаты функции ЛИНЕЙН для этого уравнения приведены в таблице 25.

Таблица 25. Характеристики уравнений

Уравнение Оценки коэффициентов Выборочные СКО F k2 Qe
Y=mX+b =0,815 -1,44 =0,242 11,29 13,46
Y=mX+m1Z+b =0,743; =0,466 -1,17 =0,276; =0,763 5,48 12,93
Y=mX+m1(ZX)+b1Z+b =0,571 =0,211 =-0,952 -0,048 =0,676 =0,749 =5,10 3,31 12,80
Y=mX+m1(ZX)+b =0,680 =0,073 -0,765 =0,324 =0,112 5,53 12,86

 

Значение статистики Фишера F=5,48 больше порога f(0,05, 2, 9)=4,26. Таким обра­зом, уравнение Y=0,743X-0,466Z -1,17 значимо, и успеваемость в сессию в основном определяется двумя факторами: результатами вступитель­ных экзаменов и полом студента. Далее надо прове­рить значимость каждого из этих факторов. Рассчитаем статистики Стьюдента по формуле (36а):
=0,743/0,276=2,69; 0,466/0,763=0,611.

Сравнивая значения этих статистик с порогом t(0,05, 9)=2,26, получаем, что фактор X значим, а фактор Z незначим (см. формулу (37)). Таким образом, ус­певаемость студента в сессию в основном зависит от результатов вступительных экзаменов (и слабо зависит от пола студента). Незначимость переменной Z в рассматри­ваемом уравнении также означает, что пол студента не оказывает значимого влияния на величину сдвига b в уравнении Y=mX+b.

Для оценки влияния пола и на коэффициент, и на сдвиг уравнения Y=mX+b надо проанализировать значимость параметров m1 и b1 в уравнении (45). В таблицу 24 для работы с уравнением (45) добавим столбец значений ZX. Результаты функции ЛИ­НЕЙН приведены в таблице 25. Значение статистики Фишера F=3,31 меньше порога f(0,05, 3, 8)=4,07, что говорит о незначимости уравнения. Также оказы­ваются незначимыми все коэффициенты уравнения (это предлагается прове­рить самостоятельно). По-видимому, двенадцати наблюдений недостаточно для оценивания четырех параметров уравнения. Поэтому для оценки влияния пола на коэффициент уравнения Y=mX+b проверим значимость коэффициента m1 в уравнении Y=mX+m1(ZX)+b; характеристики уравнения представлены в таблице 25. Применяя критерии Фишера и Стьюдента так же, как и для предыдущих уравнений, получим, что уравнение значимо, а коэффициент m1 незначим. Отсюда можно сделать вывод, что признак «Пол студента» не влияет на коэффициент уравнения регрессии Y=mX+b.

Так как признак «Пол студента» не влияет ни на коэффициент, ни на сдвиг уравнения линейной регрессии Y=mX+b, то зависимость Y(Х) одинакова для лиц мужского и женского пола.

Этот же вывод можно получить по критерию Г. Чоу (см. §1.3). Если ги­потеза H0 верна (пол студента не влияет на зависимость Y(Х)), то справедливо уравнение Y=mX+b, поэтому Q0=13,46, k0=10. Если H0 неверна, то зависимость Y от X описывается уравнением (45), поэтому Q1=12,80, k1=8. Из формулы (46) имеем: DQ=0,663, из (47): kD=2. Подставив эти значения в формулу (48), получим FЧоу=0,207. Порог для статистики Чоу равен: f(0,05, 2, 8)=4,46. Неравенство (49) не справедливо, и гипотеза H0 не отклоня­ется.

Заметим, что значение остаточной суммы Q1 можно было получить другим способом. Именно, надо разделить наблюдения на две части: в одну часть отнести наблюдения, для которых Z=0 (женщины), а в другую – для которых Z=1 (мужчины). Далее следует рассчитать остаточные суммы для каждой части (Q1(Z=0)=2,19 и Q1(Z=1)=10,61) и просуммировать их (получим Q1=12,80).









Читайте также:

Последнее изменение этой страницы: 2016-08-31; Просмотров: 27;


lektsia.info 2017 год. Все права принадлежат их авторам! Главная