Ранговая корреляция.
Коэффициент ранговой корреляции Кендалла

Краткая теория


Коэффициент корреляции Кендалла используется в случае, когда переменные представлены двумя порядковыми шкалами при условии, что связанные ранги отсутствуют. Вычисление коэффициента Кендалла связано с подсчетом числа совпадений и инверсий.

Этот коэффициент изменяется в пределах  и рассчитывается по формуле:

Для расчета  все единицы ранжируются по признаку ; по ряду другого признака  подсчитывается для каждого ранга число последующих рангов, превышающий данный (их обозначим через ), и число последующих рангов ниже данного (их обозначим через ).

Можно показать, что

и коэффициент ранговой корреляции Кендалла можно записать как

Для того, чтобы при уровне значимости , проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции  Кендалла при конкурирующей гипотезе , надо вычислить критическую точку:

где  – объем выборки;  – критическая точка двусторонней критической области, которую находят по таблице функции Лапласа по равенству

Если  – нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между признаками незначимая.

Если  – нулевую гипотезу отвергают. Между признаками существует значимая ранговая корреляционная связь.

Смежные темы решебника:

Примеры решения задач


Пример 1

Скачать пример 1 в формате pdf

При приеме на работу семи кандидатам на вакантные должности было предложено два теста. Результаты тестирования (в баллах) приведены в таблице:

Тест Кандидат
1 2 3 4 5 6 7
1 31 82 25 26 53 30 29
2 21 55 8 27 32 42 26

Вычислить ранговый коэффициент корреляции Кендалла между результатами тестирования по двум тестам и на уровне  оценить его значимость.

Решение

На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение), а также онлайн-помощь на экзамене или зачете. Для этого вам нужно только связаться со мной:

Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту.

Подробное решение получите точно в срок или раньше.

Вычислим коэффициент Кендалла. Ранги факторного признака  располагаются строго в порядке возрастания и параллельно записываются соответствующие им ранги результативного признака . Для каждого ранга  из числа следующих за ним рангов подсчитывается количество больших него по величине рангов (заносится в столбец ) и число рангов, меньших по значению (заносится в столбец ).

Расчетная вспомогательная таблица

1 1 6 0
2 4 3 2
3 3 3 1
4 6 1 2
5 2 2 0
6 5 1 0
7 7 0 0
Сумма   16 5

Искомый коэффициент корреляции Кендалла:

Вычислим критическую точку:

-коэффициент корреляции незначим

Вывод к задаче

Таким образом взаимосвязь между результатами тестирования по двум тестам является достаточно слабой.


Пример 2

Скачать пример 2 в формате pdf

Имеются данные об изменении спроса на отдельные виды продукции издательства.

Данные о спросе на отдельные виды продукции

Стратегическая единица Спрос на продукцию, тыс. экз.
2014 г. 2016 г.
1. Классика 35 45
2. Детская литература 90 100
3. Зарубежный детектив 70 65
4. Российский детектив 80 120
5. Женский роман 100 90
6. Фантастика 55 30
7. Приключения 40 30
8. Специальная литература 70 110
9. Рекламная продукция 40 60
10. Прочая литература 50 80

Определить уровень согласованности спроса на печатную продукцию с помощью коэффициента корреляции рангов Кендалла.

Решение

Рассчитаем коэффициент ранговой корреляции Кендалла.

Ранги факторного признака ( ) располагаются строго в порядке возрастания и параллельно записываются соответствующие им ранги результативного признака ( ). Для каждого ранга ( ) из числа следующих за ним рангов подсчитывается количество больших него по величине рангов (заносится в столбец ) и число рангов, меньших по значению (заносится в столбец ).

Расчетная вспомогательная таблица

1 3 7 2
2,5 1,5 8 0
2,5 4 6 1
4 6 3 3
5 1,5 5 0
6,5 5 4 0
6,5 9 1 2
8 10 0 2
9 8 0 1
10 7 0 0
Сумма --- 34 11

Искомый коэффициент корреляции рангов Кендалла:

Вывод к задаче

Таким образом, между спросом на продукцию в 2014 и 2016 году, судя по рассчитанному коэффициенту, имеется достаточно заметная связь.


Пример 3

Скачать пример 3 в формате pdf

Имеются данные о продолжительности жизни и расходах на здравоохранение в некоторых странах.

Страна Продолжительность жизни (годы) Расходы на здравоохранение (% от ВВП)
Испания 83,8 9
Южная Корея 82,2 7,4
Япония 83,6 10,2
США 78,9 17,1
Бразилия 74,4 8,3
Россия 70,4 7,1
Азербайжан 70,8 6

1. Оценить степень тесноты связи показателей на основе коэффициента Кендалла.

2. Сделать вывод.

Решение

Рассчитаем коэффициент ранговой корреляции Кендалла.

Ранги факторного признака ( ) располагаются строго в порядке возрастания и параллельно записываются соответствующие им ранги результативного признака ( ). Для каждого ранга ( ) из числа следующих за ним рангов подсчитывается количество больших него по величине рангов (заносится в столбец ) и число рангов, меньших по значению (заносится в столбец ).

Расчетная вспомогательная таблица

1 2 5 1
2 1 5 0
3 4 3 1
4 7 0 3
5 3 2 0
6 6 0 1
7 5 0 0
Сумма --- 15 6

Искомый коэффициент корреляции рангов Кендалла:

Вывод к задаче

По величине коэффициентов Спирмена и Кендэла можно предположить, что между продолжительностью жизни и расходами на здравоохранение существует корреляционная связь умеренной тесноты.