Линейный коэффициент корреляции

Краткая теория

Под теснотой связи между двумя величинами понимают степень сопряженности между ними, которая обнаруживается с изменением изучаемых величин. Если каждому заданному значению   соответствуют близкие друг другу значения , то связь считается тесной (сильной); если же значения  сильно разбросаны, то связь считается менее тесной.

Рассмотрим наиболее важный для практики и теории случай линейной зависимости вида:

При тесной корреляционной связи корреляционное поле представляет собой более или менее сжатый эллипс. Две корреляционные зависимости переменной  от  приведены на рисунке.

Очевидно, что в случае (а) зависимость между переменными менее тесная, чем в случае (б), так как точки корреляционного поля (а) дальше отстоят от линии регрессии, чем точки поля (б).

Перейдем к оценке тесноты линейной корреляционной зависимости. Для показателя тесноты связи нужная такая стандартная система единиц измерения, в которой данные по различным характеристикам оказались бы сравнимы между собой. Статистика знает такую систему единиц. Эта система использует в качестве единицы измерения переменной ее среднее квадратическое отклонение .

Учтем, что

и запишем уравнение парной линейной зависимости в эквивалентном виде:

В этой системе величина:

показывает, на сколько величин  изменится в среднем , когда  увеличится на одно .

Величина  является показателем тесноты связи и называется линейным коэффициентом корреляции. Коэффициент корреляции, определяемый по выборочным данным, называется выборочным коэффициентом корреляции.

Если , то корреляционная связь между переменными называется прямой, если  – обратной.

Приведем другие модификации формулы для расчета линейного коэффициента корреляции:

или

Наиболее часто для расчета используют формулу, получаемую простыми преобразованиями:

По этой формуле  находится непосредственно из данных наблюдений и на значении  не скажутся округления данных, связанных с расчетом средних и дисперсий.

Линейный выборочный коэффициент корреляции  (при достаточно большом объеме выборки ) обладает следующими свойствами:

    Коэффициент корреляции принимает значения на отрезке , т.е. . При этом, чем ближе по модулю  к единице – тем теснее связь. При  корреляционная связь представляет собой линейную функциональную зависимость. При этом все наблюдаемые значения располагаются на прямой линии. При   линейная корреляционная связь отсутствует. При этом линия регрессии параллельна  оси .

Расчет линейного коэффициента корреляции предполагает, что переменные  и  распределены нормально. В других случаях (когда распределения  и  отклоняются от нормальных) линейный коэффициент корреляции не следует рассматривать как строгую меру взаимосвязи переменных.

Пример решения задачи

Задача

Компания, занимающаяся продажей радиоаппаратуры, установила на видеомагнитофон определенной модели цену, дифференцированную по регионам. Следующие данные показывают цены на видеомагнитофон в 10 различных регионах о соответствующее им число продаж:

Число продаж, шт. 420 380 350 400 440 380 450 425 430 480
Цена, тыс.руб. 5.6 6.0 6.5 6.0 5.0 6.4 4.5 5.0 5.7 4.4

Рассчитайте выборочный коэффициент линейной корреляции и проверьте его значимость при .

Решение

На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение). Для этого вам нужно только связаться со мной:

Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту. Опыт работы более 25 лет.

Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.

Составим расчетную таблицу:

Расчетная вспомогательная таблица

1 5.6 420 31.36 176400 2352
2 6 380 36 144400 2280
3 6.5 350 42.25 122500 2275
4 6 400 36 160000 2400
5 5 440 25 193600 2200
6 6.4 380 40.96 144400 2432
7 4.5 450 20.25 202500 2025
8 5 425 25 180625 2125
9 5.7 430 32.49 184900 2451
10 4.4 480 19.36 230400 2112
Сумма 55.1 4155 308.67 1739725 22652

Вычислим линейный коэффициент корреляции:

 

Вывод

Связь между числом продаж и ценой очень тесная, обратная – с уменьшением цены увеличивается объем продаж.

 

Проверим значимость коэффициента корреляции:

По таблице критических точек t-критерия Стьюдента (по уровню значимости  и числу степеней свободы )  находим:

  - коэффициент корреляции значим.

Кроме этой задачи на другой странице сайта есть еще задача на расчет коэффициента корреляции, коэффициента детерминации, построение линии линейной регрессии и корреляционного поля.