Ранговая корреляция.
Коэффициент ранговой корреляции Кендалла

Краткая теория

Коэффициент корреляции Кендалла используется в случае, когда переменные представлены двумя порядковыми шкалами при условии, что связанные ранги отсутствуют. Вычисление коэффициента Кендалла связано с подсчетом числа совпадений и инверсий.

Этот коэффициент изменяется в пределах  и рассчитывается по формуле:

Для расчета  все единицы ранжируются по признаку ; по ряду другого признака  подсчитывается для каждого ранга число последующих рангов, превышающий данный (их обозначим через ), и число последующих рангов ниже данного (их обозначим через ).

Можно показать, что

и коэффициент ранговой корреляции Кендалла можно записать как

Для того, чтобы при уровне значимости , проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции  Кендалла при конкурирующей гипотезе , надо вычислить критическую точку:

где  – объем выборки;  – критическая точка двусторонней критической области, которую находят по таблице функции Лапласа по равенству

Если  – нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между признаками незначимая.

Если  – нулевую гипотезу отвергают. Между признаками существует значимая ранговая корреляционная связь.

Пример решения задачи

Задача

При приеме на работу семи кандидатам на вакантные должности было предложено два теста. Результаты тестирования (в баллах) приведены в таблице:

Тест Кандидат
1 2 3 4 5 6 7
1 31 82 25 26 53 30 29
2 21 55 8 27 32 42 26

Вычислить ранговый коэффициент корреляции Кендалла между результатами тестирования по двум тестам и на уровне  оценить его значимость.

Решение

Если не находите примера, аналогичного вашему, если сами не успеваете выполнить работу, если впереди экзамен по предмету и нужна помощь - свяжитесь со мной:

ВКонтакте
WhatsApp
Telegram

Я буду работать с вами, над вашей проблемой, пока она не решится.

Вычислим коэффициент Кендалла. Ранги факторного признака  располагаются строго в порядке возрастания и параллельно записываются соответствующие им ранги результативного признака . Для каждого ранга  из числа следующих за ним рангов подсчитывается количество больших него по величине рангов (заносится в столбец ) и число рангов, меньших по значению (заносится в столбец ).

Расчетная вспомогательная таблица

1 1 6 0
2 4 3 2
3 3 3 1
4 6 1 2
5 2 2 0
6 5 1 0
7 7 0 0
Сумма   16 5

Искомый коэффициент корреляции Кендалла:

Вычислим критическую точку:

-коэффициент корреляции незначим

Вывод к задаче

Таким образом взаимосвязь между результатами тестирования по двум тестам является достаточно слабой.