Линейный коэффициент корреляции
Краткая теория
Под теснотой связи между двумя величинами понимают степень сопряженности между ними, которая обнаруживается с изменением изучаемых величин. Если каждому заданному значению соответствуют близкие друг другу значения , то связь считается тесной (сильной); если же значения сильно разбросаны, то связь считается менее тесной.
Рассмотрим наиболее важный для практики и теории случай линейной зависимости вида:
При тесной корреляционной связи корреляционное поле представляет собой более или менее сжатый эллипс. Две корреляционные зависимости переменной от приведены на рисунке.
Очевидно, что в случае (а) зависимость между переменными менее тесная, чем в случае (б), так как точки корреляционного поля (а) дальше отстоят от линии регрессии, чем точки поля (б).
Перейдем к оценке тесноты линейной корреляционной зависимости. Для показателя тесноты связи нужная такая стандартная система единиц измерения, в которой данные по различным характеристикам оказались бы сравнимы между собой. Статистика знает такую систему единиц. Эта система использует в качестве единицы измерения переменной ее среднее квадратическое отклонение .
Учтем, что
и запишем уравнение парной линейной зависимости в эквивалентном виде:
В этой системе величина:
показывает, на сколько величин изменится в среднем , когда увеличится на одно .
Величина является показателем тесноты связи и называется линейным коэффициентом корреляции. Коэффициент корреляции, определяемый по выборочным данным, называется выборочным коэффициентом корреляции.
Если , то корреляционная связь между переменными называется прямой, если – обратной.
Приведем другие модификации формулы для расчета линейного коэффициента корреляции:
или
Наиболее часто для расчета используют формулу, получаемую простыми преобразованиями:
По этой формуле находится непосредственно из данных наблюдений и на значении не скажутся округления данных, связанных с расчетом средних и дисперсий.
Линейный выборочный коэффициент корреляции (при достаточно большом объеме выборки ) обладает следующими свойствами.
Свойства коэффициента корреляции
Расчет линейного коэффициента корреляции предполагает, что переменные и распределены нормально. В других случаях (когда распределения и отклоняются от нормальных) линейный коэффициент корреляции не следует рассматривать как строгую меру взаимосвязи переменных.
Смежные темы решебника:
Примеры решения задач
Пример 1
Скачать пример 1 в формате pdf
Компания, занимающаяся продажей радиоаппаратуры, установила на видеомагнитофон определенной модели цену, дифференцированную по регионам. Следующие данные показывают цены на видеомагнитофон в 10 различных регионах о соответствующее им число продаж:
Число продаж, шт. | 420 | 380 | 350 | 400 | 440 | 380 | 450 | 425 | 430 | 480 |
Цена, тыс.руб. | 5.6 | 6.0 | 6.5 | 6.0 | 5.0 | 6.4 | 4.5 | 5.0 | 5.7 | 4.4 |
Рассчитайте выборочный коэффициент линейной корреляции и проверьте его значимость при .
Решение
На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение), а также онлайн-помощь на экзамене или зачете. Для этого вам нужно только связаться со мной:
Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту.
Подробное решение получите точно в срок или раньше.
Составим расчетную таблицу:
Расчетная вспомогательная таблица
1 | 5.6 | 420 | 31.36 | 176400 | 2352 |
2 | 6 | 380 | 36 | 144400 | 2280 |
3 | 6.5 | 350 | 42.25 | 122500 | 2275 |
4 | 6 | 400 | 36 | 160000 | 2400 |
5 | 5 | 440 | 25 | 193600 | 2200 |
6 | 6.4 | 380 | 40.96 | 144400 | 2432 |
7 | 4.5 | 450 | 20.25 | 202500 | 2025 |
8 | 5 | 425 | 25 | 180625 | 2125 |
9 | 5.7 | 430 | 32.49 | 184900 | 2451 |
10 | 4.4 | 480 | 19.36 | 230400 | 2112 |
Сумма | 55.1 | 4155 | 308.67 | 1739725 | 22652 |
Вычислим линейный коэффициент корреляции:
Вывод
Связь между числом продаж и ценой очень тесная, обратная – с уменьшением цены увеличивается объем продаж.
Проверим значимость коэффициента корреляции:
По таблице критических точек t-критерия Стьюдента (по уровню значимости и числу степеней свободы ) находим:
- коэффициент корреляции значим.
Пример 2
Скачать пример 2 в формате pdf
Имеются данные о товарообороте и численности работников 10 магазинов:
№ п/п | Численность работников, чел. | Товарооборот, тыс.руб. |
1 | 41 | 452 |
2 | 56 | 524 |
3 | 43 | 506 |
4 | 53 | 518 |
5 | 49 | 533 |
6 | 42 | 468 |
7 | 45 | 486 |
8 | 42 | 478 |
9 | 55 | 524 |
10 | 58 | 568 |
Определить линейный коэффициент корреляции между численностью работников и товарооборотом.
Проанализировать результаты, сделать выводы.
Решение
Составим расчетную таблицу:
1 | 41 | 452 | 1681 | 204304 | 18532 |
2 | 56 | 524 | 3136 | 274576 | 29344 |
3 | 43 | 506 | 1849 | 256036 | 21758 |
4 | 53 | 518 | 2809 | 268324 | 27454 |
5 | 49 | 533 | 2401 | 284089 | 26117 |
6 | 42 | 468 | 1764 | 219024 | 19656 |
7 | 45 | 486 | 2025 | 236196 | 21870 |
8 | 42 | 478 | 1764 | 228484 | 20076 |
9 | 55 | 524 | 3025 | 274576 | 28820 |
10 | 58 | 568 | 3364 | 322624 | 32944 |
Итого | 484 | 5057 | 23818 | 2568233 | 246571 |
Средние:
Средние квадратические отклонения:
Коэффициент корреляции:
Вывод к задаче
Таким образом, линейный коэффициент корреляции между численностью работников и товарооборотом равен 0,876 – его величина свидетельствуется, что связь между величинами сильная, прямая.
Пример 3
Скачать пример 3 в формате pdf
По 10 заводам одной отрасли имеются следующие данные:
№ завода | Выпуск продукции, тыс.шт., | Расход электроэнергии, тыс. квт-ч, |
1 | 2 | 14 |
2 | 4 | 18 |
3 | 3 | 12 |
4 | 5 | 19 |
5 | 2 | 15 |
6 | 3 | 8 |
7 | 7 | 31 |
8 | 3 | 11 |
9 | 6 | 21 |
10 | 5 | 25 |
На основе приведенных данных для подтверждения положений логического анализа о наличии корреляционной прямолинейной зависимости между факторным признаком (объемом выпуска продукции) и результативным признаком (расходом электроэнергии) исчислите линейный коэффициент корреляции и проверьте его значимость при .
На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение), а также онлайн-помощь на экзамене или зачете. Для этого вам нужно только связаться со мной:
Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту.
Подробное решение получите точно в срок или раньше.
Решение
Составим расчетную таблицу:
1 | 2 | 14 | -2 | -3,4 | 4 | 11,56 | 6,8 |
2 | 4 | 18 | 0 | 0,6 | 0 | 0,36 | 0 |
3 | 3 | 12 | -1 | -5,4 | 1 | 29,16 | 5,4 |
4 | 5 | 19 | 1 | 1,6 | 1 | 2,56 | 1,6 |
5 | 2 | 15 | -2 | -2,4 | 4 | 5,76 | 4,8 |
6 | 3 | 8 | -1 | -9,4 | 1 | 88,36 | 9,4 |
7 | 7 | 31 | 3 | 13,6 | 9 | 184,96 | 40,8 |
8 | 3 | 11 | -1 | -6,4 | 1 | 40,96 | 6,4 |
9 | 6 | 21 | 2 | 3,6 | 4 | 12,96 | 7,2 |
10 | 5 | 25 | 1 | 7,6 | 1 | 57,76 | 7,6 |
Сумма | 40 | 174 | --- | --- | 26 | 434,4 | 90 |
Средние:
Средние квадратические отклонения:
Коэффициент корреляции вычислим по формуле:
Проверим значимость коэффициента корреляции:
По таблице критических точек t-критерия Стьюдента (по уровню значимости и числу степеней свободы ) находим:
- коэффициент корреляции значим.
Вывод к задаче
Величина коэффициента корреляции равна 0,847 - корреляционная линейная связь между показателями сильная.