Спирмен расчет. Изменения случайных величин

Коэффициент корреляции Пирсона

Коэффициентr- Пирсона применяется для изучения взаимосвязи двух метрических переменных, измеренных на одной и той же выборке. Существует множество ситуаций, в которых уместно его применение. Влияет ли интеллект на успеваемость на старших курсах университета? Связан ли размер заработной платы работника с его доброжелательностью к коллегам? Влияет ли настроение школьника на успешность решения сложной арифметической задачи? Для ответа на подобные вопросы исследователь должен измерить два интересующих его показателя у каждого члена выборки.

На величину коэффициента корреляции не влияет то, в каких единицах измерения представлены признаки. Следовательно, любые линейные преобразования признаков (умножение на константу, прибавление константы) не меняют значения коэффициента корреляции. Исключением является умножение одного из признаков на отрицательную константу: коэффициент корреляции меняет свой знак на противоположный.

Применение корреляции Спирмена и Пирсона.

Корреляция Пирсона есть мера линейной связи между двумя переменными. Она позволяет определить, насколько пропорциональна изменчивость двух переменных. Если переменные пропорциональны друг другу, то графически связь между ними можно представить в виде прямой линии с положительным (прямая пропорция) или отрицательным (обратная пропорция) наклоном.

На практике связь между двумя переменными, если она есть, является вероятностной и графически выглядит как облако рассеивания эллипсоидной формы. Этот эллипсоид, однако, можно представить (аппроксимировать) в виде прямой линии, или линии регрессии. Линия регрессии - это прямая, построенная методом наименьших квадратов: сумма квадратов расстояний (вычисленных по оси Y) от каждой точки графика рассеивания до прямой является минимальной.

Особое значение для оценки точности предсказания имеет дисперсия оценок зависимой переменной. По сути, дисперсия оценок зависимой переменной Y - это та часть ее полной дисперсии, которая обусловлена влиянием независимой переменной X. Иначе говоря, отношение дисперсии оценок зависимой переменной к ее истинной дисперсии равно квадрату коэффициента корреляции.

Квадрат коэффициента корреляции зависимой и независимой переменных представляет долю дисперсии зависимой переменной, обусловленной влиянием независимой переменной, и называется коэффициентом детерминации. Коэффициент детерминации, таким образом, показывает, в какой степени изменчивость одной переменной обусловлена (детерминирована) влиянием другой переменной.

Коэффициент детерминации обладает важным преимуществом по сравнению с коэффициентом корреляции. Корреляция не является линейной функцией связи между двумя переменными. Поэтому, среднее арифметическое коэффициентов корреляции для нескольких выборок не совпадает с корреляцией, вычисленной сразу для всех испытуемых из этих выборок (т.е. коэффициент корреляции не аддитивен). Напротив, коэффициент детерминации отражает связь линейно и поэтому является аддитивным: допускается его усреднение для нескольких выборок.

Дополнительную информацию о силе связи дает значение коэффициента корреляции в квадрате - коэффициент детерминации: это часть дисперсии одной переменной, которая может быть объяснена влиянием другой переменной. В отличие от коэффициента корреляции коэффициент детерминации линейно возрастает с увеличением силы связи.

Коэффициенты корреляции Спирмена и τ- Кендалла (ранговые корреляции)

Если обе переменные, между которыми изучается связь, представлены в порядковой шкале, или одна из них - в порядковой, а другая - в метрической, то применяются ранговые коэффициенты корреляции: Спирмена или τ- Кенделла. И тот, и другой коэффициент требует для своего применения предварительного ранжирования обеих переменных.

Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

Если члены группы численностью были ранжированы сначала по переменной x, затем - по переменной y, то корреляцию между переменными x и y можно получить, просто вычислив коэффициент Пирсона для двух рядов рангов. При условии отсутствия связей в рангах (т.е. отсутствия повторяющихся рангов) по той и другой переменной, формула для Пирсона может быть существенно упрощена в вычислительном отношении и преобразована в формулу, известную как Спирмена.

Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции.

Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений. Данный метод может быть использован не только для количественно выраженных данных, но также и в случаях, когда регистрируемые значения определяются описательными признаками различной интенсивности.

Коэффициент ранговой корреляции Спирмена при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений

Альтернативу корреляции Спирмена для рангов представляет корреляция τ- Кендалла. В основе корреляции, предложенной М.Кендаллом, лежит идея о том, что о направлении связи можно судить, попарно сравнивая между собой испытуемых: если у пары испытуемых изменение по x совпадает по направлению с изменением по y, то это свидетельствует о положительной связи, если не совпадает - то об отрицательной связи.

Коэффициенты корреляции были специально разработаны для численного определения силы и направления связи между двумя свойствами, измеренными в числовых шкалах (метрических или ранговых). Как уже упоминалось, максимальной силе связи соответствуют значения корреляции +1 (строгая прямая или прямо пропорциональная связь) и -1 (строгая обратная или обратно пропорциональная связь), отсутствию связи соответствует корреляция, равная нулю. Дополнительную информацию о силе связи дает значение коэффициента детерминации: это часть дисперсии одной переменной, которая может быть объяснена влиянием другой переменной.

9. Параметрические методы сравнения данных


Параметрические методы сравнения применяются в том случае, если ваши переменные были измерены в метрической шкале.

Сравнение дисперсий 2- х выборок по критерию Фишера.


Данный метод позволяет проверить гипотезу о том, что дисперсии 2-х генеральных совокупностей, из которых извлечены сравниваемые выборки, отличаются друг от друга. Ограничения метода - распределения признака в обеих выборках не должны отличаться от нормального.

Альтернативой сравнения дисперсий является критерий Ливена, для которого нет необходимости в проверке на нормальность распределения. Данный метод может применяться для проверки предположения о равенстве (гомогенности) дисперсий перед проверкой достоверности различия средних по критерию Стьюдента для независимых выборок разной численности.

Дата публикации: 03.09.2017 13:01

Термин «корреляция» активно используется в гуманитарных науках, медицине; часто мелькает в СМИ. Ключевую роль корреляции играют в психологии. В частности, расчет корреляций выступает важным этапом реализации эмпирического исследования при написании ВКР по психологии.

Материалы по корреляциям в сети слишком научны. Неспециалисту трудно разобраться в формулах. В то же время понимание смысла корреляций необходимо маркетологу, социологу, медику, психологу - всем, кто проводит исследования на людях.

В этой статье мы простым языком объясним суть корреляционной связи, виды корреляций, способы расчета, особенности использования корреляции в психологических исследованиях, а также при написании дипломных работ по психологии.

Содержание

Что такое корреляция

Корреляция - это связь. Но не любая. В чем же ее особенность? Рассмотрим на примере.

Представьте, что вы едете на автомобиле. Вы нажимаете педаль газа - машина едет быстрее. Вы сбавляете газ - авто замедляет ход. Даже не знакомый с устройством автомобиля человек скажет: «Между педалью газа и скоростью машины есть прямая связь: чем сильнее нажата педаль, тем скорость выше».

Это зависимость функциональная - скорость выступает прямой функцией педали газа. Специалист объяснит, что педаль управляет подачей топлива в цилиндры, где происходит сжигание смеси, что ведет к повышению мощности на вал и т.д. Это связь жесткая, детерминированная, не допускающая исключений (при условии, что машина исправна).

Теперь представьте, что вы директор фирмы, сотрудники которой продают товары. Вы решаете повысить продажи за счет повышения окладов работников. Вы повышаете зарплату на 10%, и продажи в среднем по фирме растут. Через время повышаете еще на 10%, и опять рост. Затем еще на 5%, и опять есть эффект. Напрашивается вывод - между продажами фирмы и окладом сотрудников есть прямая зависимость - чем выше оклады, тем выше продажи организации. Такая же это связь, как между педалью газа и скоростью авто? В чем ключевое отличие?

Правильно, между окладом и продажами заисимость не жесткая. Это значит, что у кого-то из сотрудников продажи могли даже снизиться, невзирая на рост оклада. У кого-то остаться неизменными. Но в среднем по фирме продажи выросли, и мы говорим - связь продаж и оклада сотрудников есть, и она корреляционная.

В основе функциональной связи (педаль газа - скорость) лежит физический закон. В основе корреляционной связи (продажи - оклад) находится простая согласованность изменения двух показателей. Никакого закона (в физическом понимании этого слова) за корреляцией нет. Есть лишь вероятностная (стохастическая) закономерность.

Численное выражение корреляционной зависимости

Итак, корреляционная связь отражает зависимость между явлениями. Если эти явления можно измерить, то она получает численное выражение.

Например, изучается роль чтения в жизни людей. Исследователи взяли группу из 40 человек и измерили у каждого испытуемого два показателя: 1) сколько времени он читает в неделю; 2) в какой мере он считает себя благополучным (по шкале от 1 до 10). Ученые занесли эти данные в два столбика и с помощью статистической программы рассчитали корреляцию между чтением и благополучием. Предположим, они получили следующий результат -0,76. Но что значит это число? Как его проинтерпретировать? Давайте разбираться.

Полученное число называется коэффициентом корреляции. Для его правильной интерпретации важно учитывать следующее:

  1. Знак «+» или «-» отражает направление зависимости.
  2. Величина коэффициента отражает силу зависимости.

Прямая и обратная

Знак плюс перед коэффициентом указывает на то, что связь между явлениями или показателями прямая. То есть, чем больше один показатель, тем больше и другой. Выше оклад - выше продажи. Такая корреляция называется прямой, или положительной.

Если коэффициент имеет знак минус, значит, корреляция обратная, или отрицательная. В этом случае чем выше один показатель, тем ниже другой. В примере с чтением и благополучием мы получили -0,76, и это значит, что, чем больше люди читают, тем ниже уровень их благополучия.

Сильная и слабая

Корреляционная связь в численном выражении - это число в диапазоне от -1 до +1. Обозначается буквой «r». Чем выше число (без учета знака), тем корреляционная связь сильнее.

Чем ниже численное значение коэффициента, тем взаимосвязь между явлениями и показателями меньше.

Максимально возможная сила зависимости - это 1 или -1. Как это понять и представить?

Рассмотрим пример. Взяли 10 студентов и измерили у них уровень интеллекта (IQ) и успеваемость за семестр. Расположили эти данные в виде двух столбцов.

Испытуемый

IQ

Успеваемость (баллы)

Посмотрите внимательно на данные в таблице. От 1 до 10 испытуемого растет уровень IQ. Но также растет и уровень успеваемости. Из любых двух студентов успеваемость будет выше у того, у кого выше IQ. И никаких исключений из этого правила не будет.

Перед нами пример полного, 100%-но согласованного изменения двух показателей в группе. И это пример максимально возможной положительной взаимосвязи. То есть, корреляционная зависимость между интеллектом и успеваемостью равна 1.

Рассмотрим другой пример. У этих же 10-ти студентов с помощью опроса оценили, в какой мере они ощущают себя успешными в общении с противоположным полом (по шкале от 1 до 10).

Испытуемый

IQ

Успех в общении с противоположным полом (баллы)

Смотрим внимательно на данные в таблице. От 1 до 10 испытуемого растет уровень IQ. При этом в последнем столбце последовательно снижается уровень успешности общения с противоположным полом. Из любых двух студентов успех общения с противоположным полом будет выше у того, у кого IQ ниже. И никаких исключений из этого правила не будет.

Это пример полной согласованности изменения двух показателей в группе - максимально возможная отрицательная взаимосвязь. Корреляционная связь между IQ и успешностью общения с противоположным полом равна -1.

А как понять смысл корреляции равной нулю (0)? Это значит, связи между показателями нет. Еще раз вернемся к нашим студентам и рассмотрим еще один измеренный у них показатель - длину прыжка с места.

Испытуемый

IQ

Длина прыжка с места (м)

Не наблюдается никакой согласованности между изменением IQ от человека к человеку и длинной прыжка. Это и свидетельствует об отсутствии корреляции. Коэффициент корреляции IQ и длины прыжка с места у студентов равен 0.

Мы рассмотрели крайние случаи. В реальных измерениях коэффициенты редко бывают равны точно 1 или 0. При этом принята следующая шкала:

  • если коэффициент больше 0,70 - связь между показателями сильная;
  • от 0,30 до 0,70 - связь умеренная,
  • меньше 0,30 - связь слабая.

Если оценить по этой шкале полученную нами выше корреляцию между чтением и благополучием, то окажется, что эта зависимость сильная и отрицательная -0,76. То есть, наблюдается сильная отрицательная связь между начитанностью и благополучием. Что еще раз подтверждает библейскую мудрость о соотношении мудрости и печали.

Приведенная градация дает очень приблизительные оценки и в таком виде редко используются в исследованиях.

Чаще используются градации коэффициентов по уровням значимости. В этом случае реально полученный коэффициент может быть значимым или не значимым. Определить это можно, сравнив его значение с критическим значением коэффициента корреляции, взятым из специальной таблицы. Причем эти критические значения зависят от численности выборки (чем больше объем, тем ниже критическое значение).

Корреляционный анализ в психологии

Корреляционный метод выступает одним из основных в психологических исследованиях. И это не случайно, ведь психология стремится быть точной наукой. Получается ли?

В чем особенность законов в точных науках. Например, закон тяготения в физике действует без исключений: чем больше масса тела, тем сильнее оно притягивает другие тела. Этот физический закон отражает связь массы тела и силы притяжения.

В психологии иная ситуация. Например, психологи публикуют данные о связи теплых отношений в детстве с родителями и уровня креативности во взрослом возрасте. Означает ли это, что любой из испытуемых с очень теплыми отношениями с родителями в детстве будет иметь очень высокие творческие способности? Ответ однозначный - нет. Здесь нет закона, подобного физическому. Нет механизма влияния детского опыта на креативность взрослых. Это наши фантазии! Есть согласованность данных (отношения - креативность), но за ними нет закона. А есть лишь корреляционная связь. Психологи часто называют выявляемые взаимосвязи психологическими закономерностями, подчеркивая их вероятностный характер - не жесткость.

Пример исследования на студентах из предыдущего раздела хорошо иллюстрирует использование корреляций в психологии:

  1. Анализ взаимосвязи между психологическими показателями. В нашем примере IQ и успешность общения с противоположным полом - это психологические параметры. Выявление корреляции между ними расширяет представления о психической организации человека, о взаимосвязях между различными сторонами его личности - в данном случае между интеллектом и сферой общения.
  2. Анализ взаимосвязей IQ с успеваемостью и прыжками - пример связи психологического параметра с непсихологическими. Полученные результаты раскрывают особенности влияния интеллекта на учебную и спортивную деятельность.

Вот как могли выглядеть краткие выводы по результатам придуманного исследования на студентах:

  1. Выявлена значимая положительная зависимость интеллекта студентов и их успеваемости.
  2. Существует отрицательная значимая взаимосвязь IQ с успешностью общения с противоположным полом.
  3. Не выявлено связи IQ студентов с умением прыгать с места.

Таким образом, уровень интеллекта студентов выступает позитивным фактором их академической успеваемости, в то же время негативно сказываясь на отношениях с противоположным полом и не оказывая значимого влияния на спортивные успехи, в частности, способность к прыгать с места.

Как видим, интеллект помогает студентам учиться, но мешает строить отношения с противоположным полом. При этом не влияет на их спортивные успехи.

Неоднозначное влияние интеллекта на личность и деятельность студентов отражает сложность этого феномена в структуре личностных особенностей и важность продолжения исследований в этом направлении. В частности, представляется важным провести анализ взаимосвязей интеллекта с психологическими особенностями и деятельностью студентов с учетом их пола.

Коэффициенты Пирсона и Спирмена

Рассмотрим два метода расчета.

Коэффициент Пирсона - это особый метод расчета взаимосвязи показателей между выраженностью численных значений в одной группе. Очень упрощенно он сводится к следующему:

  1. Берутся значения двух параметров в группе испытуемых (например, агрессии и перфекционизма).
  2. Находятся средние значения каждого параметра в группе.
  3. Находятся разности параметров каждого испытуемого и среднего значения.
  4. Эти разности подставляются в специальную форму для расчета коэффициента Пирсона.

Коэффициент ранговой корреляции Спирмена рассчитывается похожим образом:

  1. Берутся значения двух индикаторов в группе испытуемых.
  2. Находятся ранги каждого фактора в группе, то есть место в списке по возрастанию.
  3. Находятся разности рангов, возводятся в квадрат и суммируются.
  4. Далее разности рангов подставляются в специальную форму для вычисления коэффициента Спирмена.

В случае Пирсона расчет шел с использованием среднего значения. Следовательно, случайные выбросы данных (существенное отличие от среднего), например, из-за ошибки обработки или недостоверных ответов могут существенно исказить результат.

В случае Спирмена абсолютные значения данных не играют роли, так как учитывается только их взаимное расположение по отношению друг к другу (ранги). То есть, выбросы данных или другие неточности не окажут серьезного влияния на конечный результат.

Если результаты тестирования корректны, то различия коэффициентов Пирсона и Спирмена незначительны, при этом коэффициент Пирсона показывает более точное значение взаимосвязи данных.

Как рассчитать коэффициент корреляции

Коэффициенты Пирсона и Спирмена можно рассчитать вручную. Это может понадобиться при углубленном изучении статистических методов.

Однако в большинстве случаев при решении прикладных задач, в том числе и в психологии, можно проводить расчеты с помощью специальных программ.

Расчет с помощью электронных таблиц Microsoft Excel

Вернемся опять к примеру со студентами и рассмотрим данные об уровне их интеллекта и длине прыжка с места. Занесем эти данные (два столбца) в таблицу Excel.

Переместив курсор в пустую ячейку, нажмем опцию «Вставить функцию» и выберем «КОРРЕЛ» из раздела «Статистические».

Формат этой функции предполагает выделение двух массивов данных: КОРРЕЛ (массив 1; массив»). Выделяем соответственно столбик с IQ и длиной прыжков.

В таблицах Excel реализована формула расчета только коэффициента Пирсона.

Расчет с помощью программы STATISTICA

Заносим данные по интеллекту и длине прыжка в поле исходных данных. Далее выбираем опцию «Непараметрические критерии», «Спирмена». Выделяем параметры для расчета и получаем следующий результат.


Как видно, расчет дал результат 0,024, что отличается от результата по Пирсону - 0,038, полученной выше с помощью Excel. Однако различия незначительны.

Использование корреляционного анализа в дипломных работах по психологии (пример)

Большинство тем выпускных квалификационных работ по психологии (дипломов, курсовых, магистерских) предполагают проведение корреляционного исследования (остальные связаны с выявлением различий психологических показателей в разных группах).

Сам термин «корреляция» в названиях тем звучит редко - он скрывается за следующими формулировками:

  • «Взаимосвязь субъективного ощущения одиночества и самоактуализации у женщин зрелого возраста»;
  • «Особенности влияния жизнестойкости менеджеров на успешность их взаимодействия с клиентами в конфликтных ситуациях»;
  • «Личностные факторы стрессоустойчивости сотрудников МЧС».

Таким образом, слова «взаимосвязь», «влияние» и «факторы» - верные признаки того, что методом анализа данных в эмпирическом исследовании должен быть корреляционный анализ.

Рассмотрим кратко этапы его проведения при написании дипломной работы по психологии на тему: «Взаимосвязь личностной тревожности и агрессивности у подростков».

1. Для расчета необходимы сырые данные, в качестве которых обычно выступают результаты тестирования испытуемых. Они заносятся в сводную таблицу и помещаются в приложение. Эта таблица устроена следующим образом:

  • каждая строка содержит данные на одного испытуемого;
  • каждый столбец содержит показатели по одной шкале для всех испытуемых.

№ испытуемого

Личностная тревожность

Агрессивность

2. Необходимо решить, какой из двух типов коэффициентов - Пирсона или Спирмена - будет использоваться. Напоминаем, что Пирсон дает более точный результат, но он чувствителен к выбросам в данных Коэффициенты Спирмена могут использоваться с любыми данными (кроме номинативной шкалы), поэтому именно они чаще всего используют в дипломах по психологии.

3. Заносим таблицу сырых данных в статистическую программу.

4. Рассчитываем значение.



5. На следующем этапе важно определить, значима ли взаимосвязь. Статистическая программа подсветила результаты красным, что означает, что корреляция статистически значимы при уровне значимости 0,05 (указано выше).

Однако полезно знать, как определить значимость вручную. Для этого понадобится таблица критических значений Спирмена.

Таблица критических значений коэффициентов Спирмена

Уровень статистической значимости

Число испытуемых

р=0,05

р=0,01

р=0,001

0,88

0,96

0,99

0,81

0,92

0,97

0,75

0,88

0,95

0,71

0,83

0,93

0,67

0,63

0,77

0,87

0,74

0,85

0,58

0,71

0,82

0,55

0,68

0,53

0,66

0,78

0,51

0,64

0,76

Нас интересует уровень значимости 0,05 и объем нашей выборки 10 человек. На пересечении этих данных находим значение критического Спирмена: Rкр=0,63.

Правило такое: если полученное эмпирическое значение Спирмена больше либо равно критическому, то он статистически значим. В нашем случае: Rэмп (0,66) > Rкр (0,63), следовательно, взаимосвязь между агрессивностью и тревожностью в группе подростков статистически значима.

5. В текст дипломной нужно вставлять данные в таблице формата word, а не таблицу из статистической программы. Под таблицей описываем полученный результат и интерпретируем его.

Таблица 1

Коэффициенты Спирмена агрессивности и тревожности в группе подростков

Агрессивность

Личностная тревожность

0,665*

* - статистически достоверна (р 0,05)

Анализ данных, приведенных в таблице 1, показывает, что существует статистически значимая положительная связьмежду агрессивностью и тревожностью подростков. Это означает, что чем выше личностная тревожность подростков, тем выше уровень их агрессивности. Такой результат дает основание предположить, что агрессия для подростков выступает одним из способов купирования тревожности. Испытывая неуверенность в себе, тревогу в связи с угрозами самооценке, особенно чувствительной в подростковом возрасте, подросток часто использует агрессивное поведение, таким непродуктивным способом снижая тревогу.

6. Можно ли при интерпретации связей говорить о влиянии? Можно ли сказать, что тревожность влияет на агрессивность? Строго говоря, нет. Выше мы показали, что корреляционная связь между явлениями носит вероятностный характер и отражает лишь согласованность изменений признаков в группе. При этом мы не можем сказать, что эта согласованность вызвана тем, что одно из явлений является причиной другого, влияет на него. То есть, наличие корреляции между психологическими параметрами не дает оснований говорить о существовании между ними причинно-следственной связи. Однако практика показывает, что термин «влияние» часто используется при анализе результатов корреляционного анализа.

​ Коэффициент ранговой корреляции Спирмена – это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

1. История разработки коэффициента ранговой корреляции

Данный критерий был разработан и предложен для проведения корреляционного анализа в 1904 году Чарльзом Эдвардом Спирменом , английским психологом, профессором Лондонского и Честерфилдского университетов.

2. Для чего используется коэффициент Спирмена?

Коэффициент ранговой корреляции Спирмена используется для выявления и оценки тесноты связи между двумя рядами сопоставляемых количественных показателей . В том случае, если ранги показателей, упорядоченных по степени возрастания или убывания, в большинстве случаев совпадают (большему значению одного показателя соответствует большее значение другого показателя - например, при сопоставлении роста пациента и его массы тела ), делается вывод о наличии прямой корреляционной связи. Если ранги показателей имеют противоположную направленность (большему значению одного показателя соответствует меньшее значение другого - например, при сопоставлении возраста и частоты сердечных сокращений ), то говорят об обратной связи между показателями.

    Коэффициент корреляции Спирмена обладает следующими свойствами:
  1. Коэффициент корреляции может принимать значения от минус единицы до единицы, причем при rs=1 имеет место строго прямая связь, а при rs= -1 – строго обратная связь.
  2. Если коэффициент корреляции отрицательный, то имеет место обратная связь, если положительный, то – прямая связь.
  3. Если коэффициент корреляции равен нулю, то связь между величинами практически отсутствует.
  4. Чем ближе модуль коэффициента корреляции к единице, тем более сильной является связь между измеряемыми величинами.

3. В каких случаях можно использовать коэффициент Спирмена?

В связи с тем, что коэффициент является методом непараметрического анализа , проверка на нормальность распределения не требуется.

Сопоставляемые показатели могут быть измерены как в непрерывной шкале (например, число эритроцитов в 1 мкл крови), так и в порядковой (например, баллы экспертной оценки от 1 до 5).

Эффективность и качество оценки методом Спирмена снижается, если разница между различными значениями какой-либо из измеряемых величин достаточно велика. Не рекомендуется использовать коэффициент Спирмена, если имеет место неравномерное распределение значений измеряемой величины.

4. Как рассчитать коэффициент Спирмена?

Расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

5. Как интерпретировать значение коэффициента Спирмена?

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее - показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.

Статистическая значимость полученного коэффициента оценивается при помощи t-критерия Стьюдента. Если расчитанное значение t-критерия меньше табличного при заданном числе степеней свободы, статистическая значимость наблюдаемой взаимосвязи - отсутствует. Если больше, то корреляционная связь считается статистически значимой.

Назначение рангового коэффициента корреляции

Метод ранговой корреляции Спирмена позволяет определить тес­ноту (силу) и направление корреляционной связи между двумя призна­ками или двумя профилями {иерархиями) признаков.

Описание метода

Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы. Такими рядами значений могут быть:

1) два признака, измеренные в одной и той же группе испытуемых;

2) две индивидуальные иерархии признаков, выявленные у двух испы­туемых по одному и тому же набору признаков (например, личност­ные профили по 16-факторному опроснику Р. Б. Кеттелла, иерархии ценностей по методике Р. Рокича, последовательности предпочтений в выборе из нескольких альтернатив и др.);

3) две групповые иерархии признаков;

4) индивидуальная и групповая иерархии признаков.

Вначале показатели ранжируются отдельно по каждому из признаков. Как правило, меньшему значению признака начисляется меньший ранг.

Рассмотрим случай 1 (два признака). Здесь ранжируются ин­дивидуальные значения по первому признаку, полученные разными ис­пытуемыми, а затем индивидуальные значения по второму признаку.

Если два признака связаны положительно, то испытуемые, имею­щие низкие ранги по одному из них, будут иметь низкие ранги и по другому, а испытуемые, имеющие высокие ранги по одному из призна­ков, будут иметь по другому признаку также высокие ранги. Для под­счета r s необходимо определить разности (d) между рангами, получен­ными данным испытуемым по обоим признакам. Затем эти показатели d определенным образом преобразуются и вычитаются из 1. Чем меньше разности между рангами, тем больше будет r s , тем ближе он будет к +1.

Если корреляция отсутствует, то все ранги будут перемешаны и между ними не будет никакого соответствия. Формула составлена так, что вэтом случае r s , окажется близким к 0.

В случае отрицательной корреляции низким рангам испытуемых по одному признаку будут соответствовать высокие ранги по другому признаку, и наоборот.

Чем больше несовпадение между рангами испытуемых по двумя переменным, тем ближе r s к -1.

Рассмотрим случай 2 (два индивидуальных профиля). Здесь ранжируются индивидуальные значения, полученные каждым из 2-х испытуемым по определенному (одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым низким значением; второй ранг - признак с более высоким значением и т.д. Очевидно, что все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование невозможно. Например, невозможно проранжировать показатели по личностному опроснику Кеттелла (16PF ), если они вы­ражены в "сырых" баллах, поскольку по разным факторам диапазоны значений различны: от 0 до 13, от 0 до 20 и от 0 до 26. Мы не мо­жем сказать, какой из факторов будет занимать первое место по выра­женности, пока не приведем все значения к единой шкале (чаще всего это шкала стенов).

Если индивидуальные иерархии двух испытуемых связаны поло­жительно, то признаки, имеющие низкие ранги у одного из них, будут иметь низкие ранги и у другого, и наоборот. Например, если у одного испытуемого фактор Е (доминантность) имеет самый низкий ранг, то иу другого испытуемого он должен иметь низкий ранг, если у одного испытуемого фактор С (эмоциональная устойчивость) имеет высший ранг, то и другой испытуемый должен иметь по этому фактору высокий ранг и т.д.

Рассмотрим случай 3 (два групповых профиля). Здесь ранжи­руются среднегрупповые значения, полученные в 2-х группах испытуе­мых по определенному, одинаковому для двух групп, набору признаков. В дальнейшем линия рассуждений такая же, как и в предыдущих двух случаях.

Рассмотрим случай 4 (индивидуальный и групповой профили). Здесь ранжируются отдельно индивидуальные значения испытуемого исреднегрупповые значения по тому же набору признаков, которые полу­чены, как правило, при исключении этого отдельного испытуемого - он не участвует в среднегрупповом профиле, с которым будет сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить, насколько согласованы индивидуальный и групповой профили.

Во всех четырех случаях значимость полученного коэффициента корреляции определяется по количеству ранжированных значений N. В первом случае это количество будет совпадать с объемом выборки п. Во втором случае количеством наблюдений будет количество признаков, составляющих иерархию. В третьем и четвертом случае N - это также количество сопоставляемых признаков, а не количество испытуемых в группах. Подробные пояснения даны в примерах.

Если абсолютная величина r s достигает критического значения или превышает его, корреляция достоверна.

Гипотезы

Возможны два варианта гипотез. Первый относится к случаю 1, второй - к трем остальным случаям.

Первый вариант гипотез

H 0: Корреляция между переменными А и Б не отличается от нуля.

H 1: Корреляция между переменными А и Б достоверно отличается от нуля.

Второй вариант гипотез

H 0: Корреляция между иерархиями А и Б не отличается от нуля.

H 1: Корреляция между иерархиями А и Б достоверно отличается от нуля.

Графическое представление метода ранговой корреляции

Чаще всего корреляционную связь представляют графически в виде облака точек или в виде линий, отражающих общую тенденцию размещения точек в пространстве двух осей: оси признака А и призна­ка Б (см. Рис. 6.2).

Попробуем изобразить ранговую корреляцию в виде двух рядов ранжированных значений, которые попарно соединены линиями (Рис. 6.3). Если ранги по признаку А и по признаку Б совпадают, то между ними оказывается горизонтальная линия, если ранги не совпадают, то линия становится наклонной. Чем больше несовпадение рангов, тем бо­лее наклонной становится линия. Слева на Рис. 6.3 отображена макси­мально высокая положительная корреляция (r в =+1,0) - практически это "лестница". В центре отображена нулевая корреляция - плетенка с неправильными переплетениями. Все ранги здесь перепутаны. Справа отображена максимально высокая отрицательная корреляция (r s =-1,0) -паутина с правильным переплетением линий.

Рис. 6.3. Графическое представление ранговой корреляции:

а) высокая положительная корреляция;

б) нулевая корреляция;

в) высокая отрицательная корреляция

Ограничения коэффициента ранговой корреляции

1. По каждой переменной должно быть представлено не менее 5 на­блюдений. Верхняя граница выборки определяется имеющимися таб­лицами критических значений (Табл.XVI Приложения 1), а именно N 40.

2. Коэффициент ранговой корреляции Спирмена r s при большом коли­честве одинаковых рангов по одной или обеим сопоставляемым пе­ременным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпа­дающих значений. В случае, если это условие не соблюдается, необ­ходимо вносить поправку на одинаковые ранги. Соответствующая формула дана в примере 4.

Пример 1 - корреляция между двумя признаками

Висследовании, моделирующем деятельность авиадиспетчера (Одерышев Б.С., Шамова Е.П., Сидоренко Е.В., Ларченко Н.Н., 1978), группа испытуемых, студентов физического факультета ЛГУ проходила подготовку перед началом работы на тренажере. Испытуе­мые должны были решать задачи по выбору оптимального типа взлет­но-посадочной полосы для заданного типа самолета. Связано ли коли­чество ошибок, допущенных испытуемыми в тренировочной сессии, с показателями вербального и невербального интеллекта, измеренными по методике Д. Векслера?

Таблица 6.1

Показатели количества ошибок в тренировочной сессии и показатели уровня вербального и невербального интеллекта у студентов-физиков (N=10)

Испытуемый

Количество ошибок

Показатель вербального интеллекта

Показатель невербального интеллекта

Сначала попробуем ответить на вопрос, связаны ли между собой показатели количества ошибок и вербального интеллекта.

Сформулируем гипотезы.

H 0: Корреляция между показателем количества ошибок в тренировочной сессии и уровнем вербального интеллекта не отличается от нуля.

H 1 : Корреляция между показателем количества ошибок в тренировочной сессии и уровнем вербального интеллекта статистически значимо отличается от нуля.

Далее нам необходимо проранжировать оба показателя, Приписы­вая меньшему значению меньший ранг, затем подсчитать разности меж­ду рангами, которые получил каждый испытуемый по двум переменным (признакам), и возвести эти разности в квадрат. Произведем все необ­ходимые расчеты в таблице.

В Табл. 6.2 в первой колонке слева представлены значения по показателю количества ошибок; в следующей колонке - их ранги. В третьей колонке слева представлены значения по показателю вербаль­ного интеллекта; в следующем столбце - их ранги. В пятом слева пред­ставлены разности d между рангом по переменной А (количество оши­бок) и переменной Б (вербальный интеллект). В последнем столбце представлены квадраты разностей - d 2 .

Таблица 6.2

Расчет d 2 для рангового коэффициента корреляции Спирмена r s при сопоставлении показателей количества ошибок и вербального интеллекта у студентов-физиков (N=10)

Испытуемый

Переменная А

количество ошибок

Переменная Б

вербальный интеллект.

d (ранг А -

J 2

Индивидуальные

значения

Индивидуальные

значения

Коэффициент ранговой корреляции Спирмена подсчитывается по формуле:

где d - разность между рангами по двум переменным для каж­дого испытуемого;

N - количество ранжируемых значений, в. данном случае ко­личество испытуемых.

Рассчитаем эмпирическое значение r s:

Полученное эмпирическое значение г s близко к 0. И все же определим критические значения r s при N=10 по Табл. XVI Приложения 1:

Ответ: H 0 принимается. Корреляция между показателем коли­чества ошибок в тренировочной сессии и уровнем вербального интел­лекта не отличается от нуля.

Теперь попробуем ответить на вопрос, связаны ли между собой показатели количества ошибок и невербального интеллекта.

Сформулируем гипотезы.

H 0: Корреляция между показателем количества ошибок в тренировочной сессии и уровнем невербального интеллекта не отличается от 0.

H 1: Корреляция между показателем количества ошибок в тренировочной сессии и уровнем невербального интеллекта статистически значимо отличается от 0.

Результаты ранжирования и сопоставления рангов представлены в Табл. 6.3.

Таблица 6.3

Расчет d 2 для рангового коэффициента корреляции Спирмена r s при сопоставлении показателей количества ошибок и невербального интеллекта у студентов-физиков (N=10)

Испытуемый

Переменная А

количество ошибок

Переменная Е

невербальный интеллект

d (ранг А -

d 2

Индивидуальные

Индивидуальные

значения

значения

Мы помним, что для определения значимости r s неважно, являет­ся ли он положительным или отрицательным, важна лишь его абсолют­ная величина. В данном случае:

r s эмп

Ответ: H 0 принимается. Корреляция между показателем коли­чества ошибок в тренировочной сессии и уровнем невербального интел­лекта случайна, r s не отличается от 0.

Вместе с тем, мы можем обратить внимание на определенную тенденцию отрицательной связи между этими двумя переменными. Возможно, мы смогли бы ее подтвердить на статистически значимом уровне, если бы увеличили объем выборки.

Пример 2 - корреляция между индивидуальными профилями

В исследовании, посвященном проблемам ценностной реориента-ции, выявлялись иерархии терминальных ценностей по методике М. Рокича у родителей и их взрослых детей (Сидоренко Е.В., 1996). Ранги терминальных ценностей, полученные при обследовании пары мать-дочь (матери - 66 лет, дочери - 42 года) представлены в Табл. 6.4. Попытаемся определить, как эти ценностные иерархии коррелиру­ют друг с другом.

Таблица 6.4

Ранги терминальных ценностей по списку М.Рокича в индивидуальных иерархиях матери и дочери

Терминальные ценности

Ранг ценностей в

Ранг ценностей в

d 2

иерархии матери

иерархии дочери

1 Активная деятельная жизнь

2 Жизненная мудрость

3 Здоровье

4 Интересная работа

5 Красота природы и искусство

7 Материально обеспеченная жизнь

8 Наличие хороших и верных друзей

9 Общественное признание

10 Познание

11 Продуктивная жнзнь

12 Развитие

13 Развлечения

14 Свобода

15 Счастливая семейная жизнь

16 Счастье других

17 Творчество

18 Уверенность в себе

Сформулируем гипотезы.

H 0: Корреляция между иерархиями терминальных ценностей матери и дочери не отличается от нуля.

H 1: Корреляция между иерархиями терминальных ценностей матери и дочери статистически значимо отличается от нуля.

Поскольку ранжирование ценностей предполагается самой проце­дурой исследования, нам остается лишь подсчитать разности между рангами 18 ценностей в двух иерархиях. В 3-м и 4-м столбцах Табл. 6.4 представлены разности d и квадраты этих разностей d 2 .

Определяем эмпирическое значение r s по формуле:

где d - разности между рангами по каждой из переменных, в данном случае по каждой из терминальных ценностей;

N - количество переменных, образующих иерархию, в дан­ном случае количество ценностей.

Для данного примера:

По Табл. XVI Приложения 1 определяем критические значения:

Ответ: H 0 отвергается. Принимается H 1 . Корреляция между иерархиями терминальных ценностей матери и дочери статистически значима (р<0,01) и является положительной.

По данным Табл. 6.4 мы можем определить, что основные рас­хождения приходятся на ценности "Счастливая семейная жизнь", "Общественное признание" и "Здоровье", ранги остальных ценностей достаточно близки.

Пример 3 - корреляция между двумя групповыми иерархиями

Джозеф Вольпе в книге, написанной совместно с сыном (Wolpe J., Wolpe D., 1981) приводит упорядоченный перечень из наиболее час­то встречающихся у современного человека "бесполезных", по его обо­значению, страхов, которые не несут сигнального значения и лишь ме­шают полноценно жить и действовать. В отечественном исследовании, проведенном М.Э. Раховой (1994) 32 испытуемых должны были по 10-балльной шкале оценить, насколько актуальным для них является тот или иной вид страха из перечня Вольпе 3 . Обследованная выборка состояла из студентов Гидрометеорологического и Педагогического ин­ститутов Санкт-Петербурга: 15 юношей и 17 девушек в возрасте от 17 до 28 лет, средний возраст 23 года.

Данные, полученные по 10-балльной шкале, были усреднены по 32 испытуемым, и средние проранжированы. В Табл. 6.5 представлены ранговые показатели, полученные Дж. Вольпе и М. Э. Раховой. Сов­падают ли ранговые последовательности 20 видов страха?

Сформулируем гипотезы.

H 0: Корреляция между упорядоченными перечнями видов страха в аме­риканской и отечественных выборках не отличается от нуля.

H 1: Корреляция между упорядоченными перечнями видов страха в аме­риканской и отечественной выборках статистически значимо отли­чается от нуля.

Все расчеты, связанные с вычислением и возведением в квадрат разностей между рангами разных видов страха в двух выборках, пред­ставлены в Табл. 6.5.

Таблица 6.5

Расчет d для рангового коэффициента корреляции Спирмена при со­поставлении упорядоченных перечней видов страха в американской и отечественной выборках

Виды страха

Ранг в американской выборке

Ранг в российской

Страх публичного выступления

Страх полета

Страх совершить ошибку

Страх неудачи

Страх неодобрения

Страх отвержения

Страх злых люден

Страх одиночества

Страх крови

Страх открытых ран

Страх дантиста

Страх уколов

Страх прохождения тестов

Страх полиции ^милиции)

Страх высоты

Страх собак

Страх пауков

Страх искалеченных людей

Страх больниц

Страх темноты

Определяем эмпирическое значение r s:

По Табл. XVI Приложения 1 определяем критические значения г s при N=20:

Ответ: H 0 принимается. Корреляция между упорядоченными перечнями видов страха в американской и отечественной выборках не достигает уровня статистической значимости, т. е. значимо не отличает­ся от нуля.

Пример 4 - корреляция между индивидуальным и среднегрупповым профилями

Выборке петербуржцев в возрасте от 20 до 78 лет (31 мужчина, 46 женщин), уравновешенной по возрасту таким образом, что лица в возрасте старше 55 лет составляли в ней 50% 4 , предлагалось ответить на вопрос: "Какой уровень развития каждого из перечисленных ниже качеств необходим для депутата Городского собрания Санкт-Петербурга?" (Сидоренко Е.В., Дерманова И.Б., Анисимова О.М., Витенберг Е.В., Шульга А.П., 1994). Оценка производилась по 10-балльной шкале. Параллельно с этим обследовалась выборка из депута­тов и кандидатов в депутаты в Городское собрание Санкт-Петербурга (n=14). Индивидуальная диагностика политических деятелей и претен­дентов производилась с помощью Оксфордской системы экспресс-видеодиагностики по тому же набору личностных качеств, который предъявлялся выборке избирателей.

В Табл. 6.6 представлены средние значения, полученные для ка­ждого из качеств в выборке избирателей ("эталонный ряд") и индиви­дуальные значения одного из депутатов Городского собрания.

Попытаемся определить, насколько индивидуальный профиль де­путата К-ва коррелирует с эталонным профилем.

Таблица 6.6

Усредненные эталонные оценки избирателей (п=77) и индивидуальные показатели депутата К-ва по 18 личностным качествам экспресс-видеодиагностики

Наименование качества

Усредненные эталонные оценки избирателей

Индивидуальные показатели депутата К-ва

1. Общий уровень культуры

2. Обучаемость

4. Способность к творчеству нового

5.. Самокритичность

6. Ответственность

7. Самостоятельность

8. Энергия, активность

9. Целеустремленность

10. Выдержка, самообладание

И. Стойкость

12. Личностная зрелость

13. Порядочность

14. Гуманизм

15. Умение общаться с людьми

16. Терпимость к чужому мнению

17. Гибкость поведения

18. Способность производить благоприятное впечатление

Таблица 6.7

Расчет d 2 для рангового коэффициента корреляции Спирмена между эталонным и индивидуальным профилями личностных качеств депутата

Наименование качества

ранг качества в эталонном профиле

Ряд 2: ранг качества в индивидуальном профиле

d 2

1 Ответственность

2 Порядочность

3 Умение общаться с людьми

4 Выдержка, самообладание

5 Общий уровень культуры

6 Энергия, активность

8 Самокритичность

9 Самостоятельность

10 Личностная зрелость

И Целеустремленность

12 Обучаемость

13 Гуманизм

14 Терпимость к чужому мнению

15 Стойкость

16 Гибкость поведения

17 Способность производить благоприятное впечатление

18 Способность к творчеству нового

Как видно из Табл. 6.6, оценки избирателей и индивидуальные показатели депутата варьируют в разных диапазонах. Действительно оценки избирателей были получены по 10-балльной шкале, а индивидуальные показатели по экспресс-видеодиагностике измеряются по 20-ти балльной шкале. Ранжирование позволяет нам перевести обе шкалы измерения в единую шкалу, где единицей измерения будет 1 ранг, а максимальное значение составит 18 рангов.

Ранжирование, как мы помним, необходимо произвести отдельно по каждому ряду значений. В данном случае целесообразно начислять большему значению меньший ранг, чтобы сразу можно было увидеть, на каком месте по значимости (для избирателей) или по выраженности (у депутата) находится то или иное качество.

Результаты ранжирования представлены в Табл. 6.7. Качества перечислены в последовательности, отражающей эталонный профиль.

Сформулируем гипотезы.

H 0: Корреляция между индивидуальным профилем депутата К-ва и эталонным профилем, построенным по оценкам избирателей, не от­личается от нуля.

H 1: Корреляция между индивидуальным профилем депутата К-ва и эталонным профилем, построенным по оценкам избирателей, стати­стически значимо отличается от нуля. Поскольку в обоих сопоставляемых ранговых рядах присутствуют

группы одинаковых рангов, перед подсчетом коэффициента ранговой

корреляции необходимо внести поправки на одинаковые ранги Т а и Т b :

где а - объем каждой группы одинаковых рангов в ранговом ряду А,

b - объем каждой группы одинаковых рангов в ранговом ряду В.

В данном случае, в ряду А (эталонный профиль) присутствует одна группа одинаковых рангов - качества "обучаемость" и "гуманизм" имеют один и тот же ранг 12,5; следовательно, а =2.

T а =(2 3 -2)/12=0,50.

В ряду В (индивидуальный профиль) присутствует две группы одинаковых рангов, при этом b 1 =2 и b 2 =2.

T a =[(2 3 -2)+(2 3 -2)]/12=1,00

Для подсчета эмпирического значения r s используем формулу

В данном случае:

Заметим, что если бы поправка на одинаковые ранги нами не вносилась, то величина r s была бы лишь на (на 0,0002) выше:

При больших количествах одинаковых рангов изменения г 5 могут оказаться гораздо более существенными. Наличие одинаковых рангов означает меньшую степень дифференцированное™ упорядоченных переменных и, следовательно, меньшую возможность оценить степень связи между ними (Суходольский Г.В., 1972, с.76).

По Табл. XVI Приложения 1 определяем критические значения г, при N=18:

Ответ: Hq отвергается. Корреляция между индивидуальным профилем депутата К-ва и эталонным профилем, отвечающим требова­ниям избирателей, статистически значима (р<0,05) и является положи­тельной.

Из Табл. 6.7 видно, что депутат К-в имеет более низкий ранг по шкалам Умения общаться с людьми и более высокие ранги по шкалам Целеустремленности и Стойкости, чем это предписывается избиратель­ским эталоном. Этими расхождениями, главным образом, и объясняется некоторое снижение полученного r s .

Сформулируем общий алгоритм подсчета r s .

Корреляционный анализ является методом, позволяющим обнаруживать зависимости между определенным количеством случайных величин. Цель корреляционного анализа, сводится к выявлению оценки силы связей между такими случайными величинами либо признаками, характеризующими определенные реальные процессы.

Сегодня мы предлагаем рассмотреть, как применяется корреляционный анализ по Спирмену, для наглядного отображения форм связи в практическом трейдинге.

Корреляция по Спирмену или основа корреляционного анализа

Для того чтобы понять, что такое корреляционный анализ, изначально следует уяснить понятие корреляции.

При этом, если цена начнет двигаться в нужном Вам направлении необходимо вовремя произвести разлокирование позиций.


Для данной стратегии в основу которой положен корреляционный анализ, наилучшим образом подходят торговые инструменты имеющие высокую степень корреляции (EUR/USD и GBP/USD, EUR/AUD и EUR/NZD, AUD/USD и NZD/USD, контракты CFD и тому подобные).

Видео: Применение корреляции Спирмена на рынке Форекс

Похожие публикации