[МУЗЫКА] [МУЗЫКА] [МУЗЫКА] Теперь обратимся к ранговым корреляциям. Вообще говоря, корреляция Пирсона по сравнению с другими корреляциями дает самую точную оценку величины связи. Но при этом предъявляются довольно строгие требования к данным, а именно — нормальность распределения. В случае, если это требование не соблюдается, обычно обращаются к ранговым корреляциям. Ранговыми они называются потому, что вычисляются после замены исходных значений рангами. Широко используются два ранговых коэффициента корреляции, это r-Спирмена и τ-Кендалла. r-Спирмена основан на вычислении разности рангов, а τ-Кендалла — вероятностный и основан на подсчете совпадений и инверсий в парах наблюдений. На экране вы видите пример применения корреляции r-Спирмена. Вычисляется корреляция между временем решения задачи в секундах и средним баллом по математике. Первый шаг вычислений — это замена исходных значений той и другой переменной рангами. То есть наибольшему значению в данном случае присваивается 1, наибольшему из оставшихся — 2 и т.д. То есть в данном примере используется обратный порядок ранжирования, хотя отметим, что по умолчанию в программе SPSS, скажем, используется прямой порядок ранжирования. Следующий шаг после замены рангов, исходных значений рангами — вычисляется разность рангов, dᵢ. И затем эта разность возводится в квадрат. После этого сумма квадратов разностей рангов подставляется в формулу, которую вы видите на экране справа вверху. В данном случае коэффициента корреляции Спирмена равен −0,657. Как видите, корреляция Спирмена в вычислительном отношении гораздо проще, чем корреляция Пирсона. На это еще обращал внимание сам Карл Пирсон, когда отмечал, что после замены рангами существенно упрощается вычисление корреляции Пирсона. Этой особенностью корреляции после преобразования данных, то есть после ранжирования, воспользовался известный теоретик интеллекта Чарльз Спирмен и широко применял в своих исследованиях и в подтверждении гипотезы о факторе общего интеллекта. С его легкой руки ранговый коэффициент корреляции получил широкое распространение и также его имя. С тех пор он называется «корреляция r-Спирмена» или «ρ-Спирмена». Статистическая значимость корреляции r-Спирмена определяется так же, как корреляции r-Пирсона, поскольку r-Спирмена является прямым аналогом r-Пирсона, только для предварительно ранжированных переменных. Соответственно, и интерпретируется величина корреляции r-Спирмена так же, как и величина корреляции r-Пирсона, через долю дисперсии одной переменной, обусловленной влиянием другой переменной или через долю общей дисперсии переменных, то есть через r². Следующий коэффициент корреляции — τ-Кендалла. τ-Кендалла появляется гораздо позже, чем корреляции Пирсона и Спирмена. Если корреляция Пирсона относится к 80-м годам XIX столетия, а корреляция r-Спирмена получает широкое распространение с начала XX столетия, то корреляция τ-Кендалла была разработана, соответственно, математиком Кендаллом в 50-е годы XX столетия. В чем необходимость была разработки такого коэффициента корреляции? В том, что корреляции Пирсона и Спирмена не имеют вероятностной интерпретации. Как мы уже говорили, величина корреляции Пирсона и Спирмена интерпретируется в терминах долей дисперсии, а вот τ-Кендалла имеет четкий вероятностный смысл. Основное понятие корреляции τ-Кендалла — это вероятность совпадений и вероятность инверсий. Совпадение что означает? Вот предположим, если мы сравниваем двух людей по росту и весу, и у второго человека и рост больше, и вес больше, это будет свидетельствовать о прямой пропорции и называться совпадением. Если у второго человека по сравнению с первым рост больше, а вес меньше или наоборот, то это будет называться инверсией, то есть как свидетельство обратной пропорции той и другой переменной. Так вот τ-Кендалла равен разности вероятностей: вероятность совпадений минус вероятность инверсий. Ну, например, если τ-Кендалла равен 0,5, то это будет означать, что вероятность совпадений составляет 0,75, а вероятность инверсий — 0,25. То есть в 75% случаев мы будем наблюдать, чем больше рос, тем больше вес, и лишь в 25% случаев — обратную ситуацию, когда большему росту будет соответствовать меньший вес или наоборот, то есть инверсию. На экране вы видите технику подсчета корреляции τ-Кендалла. Ну, более подробно вы с ней познакомитесь на практических занятиях. Также вы видите формулу для расчета τ-Кендалла. Сначала подсчитывается количество совпадений или количество инверсий или и то, и другое. Затем разность между количеством совпадений и инверсий, (P − Q) делится на количество пар. А количество пар равно N(N − 1)/2. В свою очередь количество пар наблюдений равно сумме совпадений и инверсий. И формулу можно переписать: (P − Q) / (P + Q), ну и т.д. Формула может быть преобразована разными способами. В данном случае коэффициент корреляции τ-Кендалла равен −0,455. Ну теперь подробнее, да, по интерпретации. Приведем пример уместного применения корреляции τ-Кендалла. В одном из исследований исследователь разработал тест композиторских способностей и в качестве внешнего критерия этого теста использовал отметки на вступительных экзаменах в консерваторию на композиторское отделение, то есть достаточно убедительный внешней критерий валидности теста. Таким образом абитуриенты сначала проходили тестирование по тесту композиторских способностей, затем сдавали экзамены в консерваторию на композиторское отделение. Исследователь посчитал корреляцию Пирсона, корреляция Пирсона составила 0,8. Ну, как проинтерпретировать эту величину? Можно возвести в квадрат и интерпретировать, как 64% изменчивости или различий в отметках на вступительном экзамене можно объяснить результатами тестирования, предварительного тестирования композиторских способностей. Вот в данном случае такая интерпретация не всем будет понятна явно. И мной было предложено воспользоваться для более осязаемой интерпретации процента корреляции корреляцией τ-Кендалла. τ-Кендалла в этом случае составила 0,64. Как проинтерпретировать эту величину? Вероятность совпадения равна (1 + τ)/2, то есть (1 + 0,64)/2 = 0,82, а вероятность инверсий — 1 − 0,82 = 0,18. Это означает, что в 82% случаев более высокому результату тестирования будет соответствовать и более высокая отметка на вступительном экзамене. И напротив, лишь в 18% случаев более высокой... более высокому результату тестирования будет соответствовать более низкая отметка на вступительном экзамене. Такая интерпретация вероятностная зачастую более осязаема, более понятна, нежели интерпретация в терминах дисперсий.