Линейный коэффициент корреляции

Краткая теория


Под теснотой связи между двумя величинами понимают степень сопряженности между ними, которая обнаруживается с изменением изучаемых величин. Если каждому заданному значению  соответствуют близкие друг другу значения , то связь считается тесной (сильной); если же значения  сильно разбросаны, то связь считается менее тесной.

Рассмотрим наиболее важный для практики и теории случай линейной зависимости вида:

При тесной корреляционной связи корреляционное поле представляет собой более или менее сжатый эллипс. Две корреляционные зависимости переменной  от  приведены на рисунке.

Очевидно, что в случае (а) зависимость между переменными менее тесная, чем в случае (б), так как точки корреляционного поля (а) дальше отстоят от линии регрессии, чем точки поля (б).

Перейдем к оценке тесноты линейной корреляционной зависимости. Для показателя тесноты связи нужная такая стандартная система единиц измерения, в которой данные по различным характеристикам оказались бы сравнимы между собой. Статистика знает такую систему единиц. Эта система использует в качестве единицы измерения переменной ее среднее квадратическое отклонение .

Учтем, что

и запишем уравнение парной линейной зависимости в эквивалентном виде:

В этой системе величина:

показывает, на сколько величин  изменится в среднем , когда  увеличится на одно .

Величина  является показателем тесноты связи и называется линейным коэффициентом корреляции. Коэффициент корреляции, определяемый по выборочным данным, называется выборочным коэффициентом корреляции.

Если , то корреляционная связь между переменными называется прямой, если  – обратной.

Приведем другие модификации формулы для расчета линейного коэффициента корреляции:

или

Наиболее часто для расчета используют формулу, получаемую простыми преобразованиями:

По этой формуле  находится непосредственно из данных наблюдений и на значении  не скажутся округления данных, связанных с расчетом средних и дисперсий.

Линейный выборочный коэффициент корреляции  (при достаточно большом объеме выборки ) обладает следующими свойствами.

Свойства коэффициента корреляции

    Коэффициент корреляции принимает значения на отрезке , т.е. . При этом, чем ближе по модулю  к единице – тем теснее связь. При  корреляционная связь представляет собой линейную функциональную зависимость. При этом все наблюдаемые значения располагаются на прямой линии. При   линейная корреляционная связь отсутствует. При этом линия регрессии параллельна  оси .

Расчет линейного коэффициента корреляции предполагает, что переменные  и  распределены нормально. В других случаях (когда распределения  и  отклоняются от нормальных) линейный коэффициент корреляции не следует рассматривать как строгую меру взаимосвязи переменных.

Смежные темы решебника:

Примеры решения задач


Пример 1

Скачать пример 1 в формате pdf

Компания, занимающаяся продажей радиоаппаратуры, установила на видеомагнитофон определенной модели цену, дифференцированную по регионам. Следующие данные показывают цены на видеомагнитофон в 10 различных регионах о соответствующее им число продаж:

Число продаж, шт. 420 380 350 400 440 380 450 425 430 480
Цена, тыс.руб. 5.6 6.0 6.5 6.0 5.0 6.4 4.5 5.0 5.7 4.4

Рассчитайте выборочный коэффициент линейной корреляции и проверьте его значимость при .

Решение

На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение), а также онлайн-помощь на экзамене или зачете. Для этого вам нужно только связаться со мной:

Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту.

Подробное решение получите точно в срок или раньше.

Составим расчетную таблицу:

Расчетная вспомогательная таблица

1 5.6 420 31.36 176400 2352
2 6 380 36 144400 2280
3 6.5 350 42.25 122500 2275
4 6 400 36 160000 2400
5 5 440 25 193600 2200
6 6.4 380 40.96 144400 2432
7 4.5 450 20.25 202500 2025
8 5 425 25 180625 2125
9 5.7 430 32.49 184900 2451
10 4.4 480 19.36 230400 2112
Сумма 55.1 4155 308.67 1739725 22652

Вычислим линейный коэффициент корреляции:

 

Вывод

Связь между числом продаж и ценой очень тесная, обратная – с уменьшением цены увеличивается объем продаж.

 

Проверим значимость коэффициента корреляции:

По таблице критических точек t-критерия Стьюдента (по уровню значимости  и числу степеней свободы )  находим:

  - коэффициент корреляции значим.


Пример 2

Скачать пример 2 в формате pdf

Имеются данные о товарообороте и численности работников 10 магазинов:

№ п/п Численность работников, чел. Товарооборот, тыс.руб.
1 41 452
2 56 524
3 43 506
4 53 518
5 49 533
6 42 468
7 45 486
8 42 478
9 55 524
10 58 568

Определить линейный коэффициент корреляции между численностью работников и товарооборотом.

Проанализировать результаты, сделать выводы.

Решение

Составим расчетную таблицу:

1 41 452 1681 204304 18532
2 56 524 3136 274576 29344
3 43 506 1849 256036 21758
4 53 518 2809 268324 27454
5 49 533 2401 284089 26117
6 42 468 1764 219024 19656
7 45 486 2025 236196 21870
8 42 478 1764 228484 20076
9 55 524 3025 274576 28820
10 58 568 3364 322624 32944
Итого 484 5057 23818 2568233 246571

Средние:

Средние квадратические отклонения:

Коэффициент корреляции:


Вывод к задаче

Таким образом, линейный коэффициент корреляции между численностью работников и товарооборотом равен 0,876 – его величина свидетельствуется, что связь между величинами сильная, прямая.


Пример 3

Скачать пример 3 в формате pdf

По 10 заводам одной отрасли имеются следующие данные:

№ завода Выпуск продукции, тыс.шт., Расход электроэнергии, тыс. квт-ч,
1 2 14
2 4 18
3 3 12
4 5 19
5 2 15
6 3 8
7 7 31
8 3 11
9 6 21
10 5 25

На основе приведенных данных для подтверждения положений логического анализа о наличии корреляционной прямолинейной зависимости между факторным признаком (объемом выпуска продукции) и результативным признаком (расходом электроэнергии) исчислите линейный коэффициент корреляции и проверьте его значимость при .

На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение), а также онлайн-помощь на экзамене или зачете. Для этого вам нужно только связаться со мной:

Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту.

Подробное решение получите точно в срок или раньше.

Решение

Составим расчетную таблицу:

1 2 14 -2 -3,4 4 11,56 6,8
2 4 18 0 0,6 0 0,36 0
3 3 12 -1 -5,4 1 29,16 5,4
4 5 19 1 1,6 1 2,56 1,6
5 2 15 -2 -2,4 4 5,76 4,8
6 3 8 -1 -9,4 1 88,36 9,4
7 7 31 3 13,6 9 184,96 40,8
8 3 11 -1 -6,4 1 40,96 6,4
9 6 21 2 3,6 4 12,96 7,2
10 5 25 1 7,6 1 57,76 7,6
Сумма 40 174 --- --- 26 434,4 90

Средние:

Средние квадратические отклонения:

Коэффициент корреляции вычислим по формуле:

Проверим значимость коэффициента корреляции:

По таблице критических точек t-критерия Стьюдента (по уровню значимости и числу степеней свободы ) находим:

- коэффициент корреляции значим.


Вывод к задаче

Величина коэффициента корреляции равна 0,847 - корреляционная линейная связь между показателями сильная.