Линейный коэффициент корреляции
Под теснотой связи между двумя величинами понимают степень сопряженности между ними, которая обнаруживается с изменением изучаемых величин. Если каждому заданному значению соответствуют близкие друг другу значения , то связь считается тесной (сильной); если же значения сильно разбросаны, то связь считается менее тесной.
Рассмотрим наиболее важный для практики и теории случай линейной зависимости вида:
При тесной корреляционной связи корреляционное поле представляет собой более или менее сжатый эллипс. Две корреляционные зависимости переменной от приведены на рисунке.
Очевидно, что в случае (а) зависимость между переменными менее тесная, чем в случае (б), так как точки корреляционного поля (а) дальше отстоят от линии регрессии, чем точки поля (б).
Перейдем к оценке тесноты линейной корреляционной зависимости. Для показателя тесноты связи нужная такая стандартная система единиц измерения, в которой данные по различным характеристикам оказались бы сравнимы между собой. Статистика знает такую систему единиц. Эта система использует в качестве единицы измерения переменной ее среднее квадратическое отклонение .
Учтем, что
и запишем уравнение парной линейной зависимости в эквивалентном виде:
В этой системе величина:
показывает, на сколько величин изменится в среднем , когда увеличится на одно .
Величина является показателем тесноты связи и называется линейным коэффициентом корреляции. Коэффициент корреляции, определяемый по выборочным данным, называется выборочным коэффициентом корреляции.
Если , то корреляционная связь между переменными называется прямой, если – обратной.
Приведем другие модификации формулы для расчета линейного коэффициента корреляции:
или
Наиболее часто для расчета используют формулу, получаемую простыми преобразованиями:
По этой формуле находится непосредственно из данных наблюдений и на значении не скажутся округления данных, связанных с расчетом средних и дисперсий.
Линейный выборочный коэффициент корреляции (при достаточно большом объеме выборки ) обладает следующими свойствами:
Расчет линейного коэффициента корреляции предполагает, что переменные и распределены нормально. В других случаях (когда распределения и отклоняются от нормальных) линейный коэффициент корреляции не следует рассматривать как строгую меру взаимосвязи переменных.
Задача
Компания, занимающаяся продажей радиоаппаратуры, установила на видеомагнитофон определенной модели цену, дифференцированную по регионам. Следующие данные показывают цены на видеомагнитофон в 10 различных регионах о соответствующее им число продаж:
Число продаж, шт. | 420 | 380 | 350 | 400 | 440 | 380 | 450 | 425 | 430 | 480 |
Цена, тыс.руб. | 5.6 | 6.0 | 6.5 | 6.0 | 5.0 | 6.4 | 4.5 | 5.0 | 5.7 | 4.4 |
Рассчитайте выборочный коэффициент линейной корреляции и проверьте его значимость при .
Решение
На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение). Для этого вам нужно только связаться со мной:
Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Составим расчетную таблицу:
Расчетная вспомогательная таблица
1 | 5.6 | 420 | 31.36 | 176400 | 2352 |
2 | 6 | 380 | 36 | 144400 | 2280 |
3 | 6.5 | 350 | 42.25 | 122500 | 2275 |
4 | 6 | 400 | 36 | 160000 | 2400 |
5 | 5 | 440 | 25 | 193600 | 2200 |
6 | 6.4 | 380 | 40.96 | 144400 | 2432 |
7 | 4.5 | 450 | 20.25 | 202500 | 2025 |
8 | 5 | 425 | 25 | 180625 | 2125 |
9 | 5.7 | 430 | 32.49 | 184900 | 2451 |
10 | 4.4 | 480 | 19.36 | 230400 | 2112 |
Сумма | 55.1 | 4155 | 308.67 | 1739725 | 22652 |
Вычислим линейный коэффициент корреляции:
Вывод
Связь между числом продаж и ценой очень тесная, обратная – с уменьшением цены увеличивается объем продаж.
Проверим значимость коэффициента корреляции:
По таблице критических точек t-критерия Стьюдента (по уровню значимости и числу степеней свободы ) находим:
- коэффициент корреляции значим.
Кроме этой задачи на другой странице сайта есть еще задача на расчет коэффициента корреляции, коэффициента детерминации, построение линии линейной регрессии и корреляционного поля.