Лекции.ИНФО


Проверка гипотез на основе критерия согласия Пирсона



Цель:освоить алгоритм проверки непараметрических гипотез2

Критерий Пирсона или χ2 — наиболее часто используемый статистический критерий для проверки гипотезы о законе распределения случайной величины. Во многих практических задачах закон распределения неизвестен и требует определения. Для достоверного выбора того или иного закона формулируется гипотеза, которая требует подтверждения.

По выборочным данным строится полигон частот и рассчитываются параметры распределения. Гипотеза о предполагаемом законе распределения изучаемого признака выдвигается на основе исследования выборки.

Нулевая гипотеза несет информацию о законе распределения выборки. В данном случае Н0: F(x)=F0(x), где F0(x)=Ф(х; 0, 02). Это обозначает, что выборочная совокупность имеет нормальное распределение.

Конкурирующая гипотеза: выборочная совокупность имеет распределение, отличное от нормального.

Критерий Пирсона является алгоритмом, позволяющим сделать вывод о достоверности выдвинутой гипотезы. Последовательность действий для определения критерия χ2 описана ниже.

1. Построить таблицу частот опытного распределения в выбранных интервалах (см. лаб. работу 1). Если среди опытных частот имеются малочисленные (ni < 5), то объединить их с соседними. Это будет выбор групп.

2. Определить теоретические частоты при помощи выбранного закона распределения (например, нормального):

Теоретическая частота для i-го интервала (группы) определяется по формуле: , где n — объем выборки; i,i — границы интервала, Ф(t) —стандартная функция нормального распределения (в Excel она встроена и добавляется с помощью мастера функций; из категории статистические надо выбрать НОРМРАСП() и задать ее аргументы).

Определяются границы интервала i,i так. Например, имеется ряд интервалов: 25, 28, 31, 34, ... Для i = 2, i = 25, i = 28. Значение Ф(t) вычисляется, как функция нормального распределения, с n = 0, n = 1, а значение х — вычисляется по формуле: и .

3. По формуле вычислить величину 2 . Это будет20.

4. Определить число степеней свободы можно по формуле k=m-s, где s-число связей (среднее квадратичное отклонение, среднее арифметическое, частоты), а m – число интервалов выборочного распределения.

5. Воспользовавшись специальной таблицей, по полученным значениям 2 и k, найти вероятность того, что случайная величина, имеющая 2 -распределение, примет какое-либо значение, не меньшее 20: Р(2  20) = .

6. Сформулировать вывод, руководствуясь общим принципом применения критериев согласия: если вероятность больше 0.01, то имеющиеся расхождения между теоретическими и эмпирическими частотами следует считать несущественными, а опытное распределение — согласующимся с теоретическим. В противном случае (  0.01), указанные расхождения признаются неслучайными, а закон распределения, избранный в качестве предполагаемого теоретического — отвергается.

Задание:

1. Используя набор данных из лабораторной работы №1, провести оценку по критерию 2. В качестве гипотезы выбрать: «Экспериментальные данные подчиняются закону нормального распределения».

2. Рассчитать необходимые параметры для выбранной гипотезы.

3. Построить таблицу для расчета 2. Примерный вид таблицы для анализа (табл. 26.

4. Рассчитать критерий согласия Пирсона. Для вероятности  = 0.05, сделать вывод подтверждении или отрицании гипотезы нормального распределения данных измерений. Воспользоваться функцией Excel — ХИ2ОБР(),которая выдает значения таблицы вероятностей Р для критерия 2 (Пирсона).

Если табличное значение оказалось меньше рассчитанного экспериментальным путем2, то в этом случае нулевая гипотеза принимается, поскольку отклонения экспериментальных частот от теоретических являются несущественными.

 

Таблица 1

Расчетная таблица

Контрольные вопросы

1. Объясните, чем отличаются непараметрические методы проверки гипотез от параметрических.

2. К какому из методов проверки гипотез относится критерий Пирсона?

3. Что называется теоретической частотой?

4. Опишите алгоритм проверки гипотезы по критерию χ2.

5. Как определить число связей и число степеней свободы?

6. Что такое доверительный интервал и как он определяется?

7. Какие данные позволяют сделать вывод об истинности или ложности гипотезы при расчетах критерия Пирсона?

8.Что называется генеральной совокупностью?

9.Приведите пример генеральной совокупности, исследуемого признака и варианта.

10.Дайте понятие частоты.

11.Что представляет собой полигон частот? Какую информацию можно получить, исследуя полигон частот?

12.Какие формы распределений существуют и чем они отличаются друг от друга? В чем разница между теоретическими и экспериментальными распределениями?

13.Что называется медианой и как ее определяют?

14.Что такое мода?

15.Как определить дисперсию экспериментального распределения?

16.Что характеризует асимметрия выборки?

17Как рассчитывается эксцесс выборки?

 

 









Читайте также:

Последнее изменение этой страницы: 2016-03-22; Просмотров: 495;


lektsia.info 2017 год. Все права принадлежат их авторам! Главная