Ранговая корреляция.
Коэффициент ранговой корреляции Кендалла
Краткая теория
Коэффициент корреляции Кендалла используется в случае, когда переменные представлены двумя порядковыми шкалами при условии, что связанные ранги отсутствуют. Вычисление коэффициента Кендалла связано с подсчетом числа совпадений и инверсий.
Этот коэффициент изменяется в пределах
и рассчитывается по формуле:
Для расчета
все единицы ранжируются по признаку
;
по ряду другого признака
подсчитывается для каждого ранга число
последующих рангов, превышающий данный (их обозначим
через
),
и число последующих рангов ниже данного (их обозначим через
).
Можно показать, что
и коэффициент ранговой корреляции Кендалла можно записать как
Для того, чтобы при уровне значимости
,
проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой
корреляции
Кендалла при конкурирующей гипотезе
,
надо вычислить критическую точку:
где
– объем выборки;
– критическая точка двусторонней критической
области, которую находят по таблице функции Лапласа
по равенству
Если
– нет
оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между
признаками незначимая.
Если
– нулевую
гипотезу отвергают. Между признаками существует значимая ранговая
корреляционная связь.
Смежные темы решебника:
Примеры решения задач
Пример 1
Скачать пример 1 в формате pdf
При приеме на работу семи кандидатам на вакантные должности было предложено два теста. Результаты тестирования (в баллах) приведены в таблице:
Тест | Кандидат | ||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | |
1 | 31 | 82 | 25 | 26 | 53 | 30 | 29 |
2 | 21 | 55 | 8 | 27 | 32 | 42 | 26 |
Вычислить
ранговый коэффициент корреляции Кендалла между
результатами тестирования по двум тестам и на уровне
оценить его значимость.
Решение
На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение), а также онлайн-помощь на экзамене или зачете. Для этого вам нужно только связаться со мной:
Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту.
Подробное решение получите точно в срок или раньше.
Вычислим коэффициент
Кендалла. Ранги
факторного признака
располагаются строго в порядке возрастания и
параллельно записываются соответствующие им ранги результативного признака
. Для каждого
ранга
из числа следующих за ним рангов
подсчитывается количество больших него по величине рангов (заносится в столбец
) и число рангов,
меньших по значению (заносится в столбец
).
Расчетная вспомогательная таблица
|
|
|
|
1 | 1 | 6 | 0 |
2 | 4 | 3 | 2 |
3 | 3 | 3 | 1 |
4 | 6 | 1 | 2 |
5 | 2 | 2 | 0 |
6 | 5 | 1 | 0 |
7 | 7 | 0 | 0 |
Сумма | 16 | 5 |
Искомый коэффициент корреляции Кендалла:
Вычислим критическую точку:
-коэффициент
корреляции незначим
Вывод к задаче
Таким образом взаимосвязь между результатами тестирования по двум тестам является достаточно слабой.
Пример 2
Скачать пример 2 в формате pdf
Имеются данные об изменении спроса на отдельные виды продукции издательства.
Данные о спросе на отдельные виды продукции
Стратегическая единица | Спрос на продукцию, тыс. экз. | |
2014 г. | 2016 г. | |
1. Классика | 35 | 45 |
2. Детская литература | 90 | 100 |
3. Зарубежный детектив | 70 | 65 |
4. Российский детектив | 80 | 120 |
5. Женский роман | 100 | 90 |
6. Фантастика | 55 | 30 |
7. Приключения | 40 | 30 |
8. Специальная литература | 70 | 110 |
9. Рекламная продукция | 40 | 60 |
10. Прочая литература | 50 | 80 |
Определить уровень согласованности спроса на печатную продукцию с помощью коэффициента корреляции рангов Кендалла.
Решение
Рассчитаем коэффициент ранговой корреляции Кендалла.
Ранги факторного признака
(
)
располагаются строго в порядке возрастания
и параллельно записываются соответствующие
им ранги результативного признака (
).
Для каждого ранга (
)
из числа следующих за ним рангов
подсчитывается количество больших него
по величине рангов (заносится в столбец
)
и число рангов, меньших по значению
(заносится в столбец
).
Расчетная вспомогательная таблица
|
|
|
|
1 | 3 | 7 | 2 |
2,5 | 1,5 | 8 | 0 |
2,5 | 4 | 6 | 1 |
4 | 6 | 3 | 3 |
5 | 1,5 | 5 | 0 |
6,5 | 5 | 4 | 0 |
6,5 | 9 | 1 | 2 |
8 | 10 | 0 | 2 |
9 | 8 | 0 | 1 |
10 | 7 | 0 | 0 |
Сумма | --- | 34 | 11 |
Искомый коэффициент корреляции рангов Кендалла:
Вывод к задаче
Таким образом, между спросом на продукцию в 2014 и 2016 году, судя по рассчитанному коэффициенту, имеется достаточно заметная связь.
Пример 3
Скачать пример 3 в формате pdf
Имеются данные о продолжительности жизни и расходах на здравоохранение в некоторых странах.
Страна | Продолжительность жизни (годы) | Расходы на здравоохранение (% от ВВП) |
Испания | 83,8 | 9 |
Южная Корея | 82,2 | 7,4 |
Япония | 83,6 | 10,2 |
США | 78,9 | 17,1 |
Бразилия | 74,4 | 8,3 |
Россия | 70,4 | 7,1 |
Азербайжан | 70,8 | 6 |
1. Оценить степень тесноты связи показателей на основе коэффициента Кендалла.
2. Сделать вывод.
Решение
Рассчитаем коэффициент ранговой корреляции Кендалла.
Ранги факторного признака
(
)
располагаются строго в порядке возрастания
и параллельно записываются соответствующие
им ранги результативного признака (
).
Для каждого ранга (
)
из числа следующих за ним рангов
подсчитывается количество больших него
по величине рангов (заносится в столбец
)
и число рангов, меньших по значению
(заносится в столбец
).
Расчетная вспомогательная таблица
|
|
|
|
1 | 2 | 5 | 1 |
2 | 1 | 5 | 0 |
3 | 4 | 3 | 1 |
4 | 7 | 0 | 3 |
5 | 3 | 2 | 0 |
6 | 6 | 0 | 1 |
7 | 5 | 0 | 0 |
Сумма | --- | 15 | 6 |
Искомый коэффициент корреляции рангов Кендалла:
Вывод к задаче
По величине коэффициентов Спирмена и Кендэла можно предположить, что между продолжительностью жизни и расходами на здравоохранение существует корреляционная связь умеренной тесноты.