В обработке эмпирических данных
Краткие сведения по математической статистике
На заре развития экспериментальной психологии Эдвард Торндайк как-то с сожалением сказал, что математика входит в общую культуру человека, но психолог может проработать всю жизнь, так никогда с ней и не столкнувшись. Прошедшие с тех пор почти сто лет были постоянной попыткой внедрения математики в психологию, и уже в следующем веке поставят под сомнение горькое высказывание известного ученого.
Современная практика показывает, что психолог должен не только оперировать методами математической статистики, но и представлять предмет своей науки с точки зрения «царицы наук», в противном случае он обречен быть «антропотехником», носителем тестов, выдающих готовые результаты без их осмысления в рамках того направления, в котором они были созданы.
В данном пособии мы попытались вычленить из всего многообразия вопросов, связанных с математико-статистической обработкой психологических исследований, тот минимум знаний, который необходим студенту психологического факультета для решения исследовательских задач, которые ставятся в курсовых и выпускных квалификационных работах. По этой причине многие важные теоретические вопросы были опущены, и можно порекомендовать для ознакомления с ними обратиться к более полным и объемным руководствам [7, 12, 13, 14, 21, 25, 26, 27, 28, 31. 33, 34].
Типичные исследования
Выявление различий:
· сравнение зависимых выборок до и после экспериментального воздействия (формирующие эксперименты, коррекционные программы, тренинги);
· сравнение независимых выборок по каким-либо признакам (выявление различий между показателями контрольной и экспериментальной групп в рамках формирующего эксперимента, между различными группами в рамках констатирующего эксперимента, например, различия в характеристиках эмоциональной устойчивости в группах врачей и учителей.)
Примечание: выборка зависима, если одному случаю из выборки X соответствует один и только один случай из выборки Y и, наоборот, для каждого случая в двух выборках. Примеры зависимых выборок: пары близнецов, мужья и жены, одна и та же группа до и после формирующего или развивающего воздействия и т.п.
Выборка независима, если указанная выше связь отсутствует. Примеры независимых выборок: мужчины и женщины, физики и химики и т.п.
Статистические задачи и соответствующие им методы:
Статистические задачи, решаемые в рамках исследовательской работы, направлены на доказательство или опровержение гипотезы, выдвинутой в работе, с помощью статистических (параметрических и непараметрических) критериев.
Параметрические критерии (используют параметры распределения генеральной совокупности, такие как среднее, дисперсия и т.п.):
· различия в средних значениях (t-критерий Стьюдента для зависимых и независимых выборок);
· различия в дисперсиях (F-критерий Фишера).
Примечание: измерения должны быть проведены в шкале интервалов или отношений, при этом необходимо доказать, что значения признаков распределены нормально.
Непараметрические критерии (не используют параметры распределения генеральной совокупности), применимые для независимых выборок:
· различия в уровне выраженности признака (Q-критерий Розенбаума и U-критерий Манна-Уитни).
Примечания: для Q-критерия – n1 и n2≥11; для U-критерия – n1 и n2≥3 (или n1=2 и n2≥5) и n1 и n2≤60, где n1 и n2 – численное значение первой и второй выборок. Измерения должны быть проведены в шкале интервалов или отношений.
Непараметрические критерии (не используют параметры распределения генеральной совокупности), применимые для зависимых выборок:
· оценка достоверности сдвига значений исследуемого признака (G-критерий знаков, который лучше применять вместе с T-критерием Вилкоксона для оценки интенсивности типичного сдвига).
Примечание: измерение может быть проведено в шкале порядка, интервалов и отношения. Выборки должны быть количественно равны. Для G-критерия – 5≥n≥300, для T-критерия – 5≥n≥50, где n – численное количество выборки.
Многофункциональный критерий (измерения могут быть проведены в любой шкале):
· различия между процентными долями, которые соответствуют присутствию или отсутствию какого-либо эффекта (φ*–критерий углового преобразования Фишера. Очень удобный критерий, поскольку можно самим устанавливать границу проявления эффекта).
Примечание: n1 и n2≥5 (n1=2 и n2≥30), где n1 и n2 – численное значение первой и второй выборок.
Выявление взаимосвязи исследуемых признаков
Количественные признаки:
· если признаки измерены в шкале интервалов или отношений и распределились нормально, то применим коэффициент корреляции Пирсона rxy.
Примечание: для больших выборок от 5 человек и более. Значения признаков должны быть распределены нормально.
· если признаки измерены в порядковой (ранговой) шкале, шкале интервалов или отношений, то применим коэффициент корреляции Спирмена rs.
Примечание: для малых выборок обычно 5≥n≥40
· Если признаки измерены в порядковой (ранговой) шкале, то применим коэффициент корреляции Кендалла τ.
Примечание: не допускается использование одинаковых рангов.
Качественные признаки:
· если признаки измерены в дихотомической шкале, то применим коэффициент ассоциации Пирсона φ;
· если один признак измерен в дихотомической шкале, а другой в ранговой шкале, то применим рангово-бисериальный коэффициент корреляции Rrb;
· если один признак измерен в дихотомической шкале, а другой в шкале отношений или интервалов, то применим бисериальный коэффициент корреляции Rбис.
Выявление структуры взаимосвязей признаков:
· метод максимального корреляционного пути Л.К. Выханду (структура с доминирующими и подчиненными признаками);
· метод усредненного рангового места коэффициента корреляции (выявляет признаки, имеющие наибольший удельный вес в структуре взаимосвязей);
· метод корреляционных плеяд;
· метод факторного анализа (сокращение числа переменных [редукция данных] и определение структуры взаимосвязей, классификация переменных. Метод структурной классификации.)
Выявление влияния отдельных факторов на результаты экспериментов:
· дисперсионный анализ (анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов, т.е. выявление причинно-следственной связи);
· регрессионный анализ (функциональная, чаще линейная зависимость одного признака от другого или нескольких признаков);
· корреляционное отношение (вклад одних признаков в общее влияние всех признаков, воздействующих на коррелируемый признак – показатель уровня связи, употребляющийся в случае нелинейной зависимости между признаками).
Нулевая гипотеза (обозначается Н0) предполагает, что в эксперименте не будет выявлено различий. Например: «Между учениками 1 класса А и 1 класса Б нет различий по уровню интеллекта».
Альтернативная гипотеза (обозначается Н1) предполагает, что будут выявлены различия (что различия будут достоверны). Например: «Ученики 1 класса А и 1 класса Б отличаются по уровню интеллекта» .
Гипотезы также могут быть ненаправленными (см. предыдущий пример) и направленными: «Ученики 1 класса А превосходят по уровню интеллекта учеников 1 класса Б».
Уровни статистической значимости
Статистическая значимость (p-уровень) представляет собой оцененную меру уверенности в его «истинности». Более высокий уровень значимости соответствует более низкому уровню доверия к полученным результатам.
В психологии обычно используется три уровня значимости:
5-процентный, 1-процентный и 0,1- процентный (хотя последний намного реже). Если указывают, что различия достоверны на 5%-ом уровне значимости (p < 0.05), то имеют ввиду, что вероятность ошибочного вывода составляет 0,05, если на 1%-ом, то – 0,01 (p < 0.01) и т.д. При этом 5%-й уровень считается низшим, а 0,1%-й – высшим уровнем значимости (p < 0.001).
Различают эмпирическое значение критерия и его критическое значение. При использовании большинства критериев, если эмпирическое значение больше критического, то H0 отвергается.