Множественная регрессия
Задача
По 20 предприятиям региона изучается зависимость выработки продукции на одного работника (тыс.руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (смотри таблицу своего варианта).
Требуется:
Исходные данные
№ | № | ||||||
1 | 7 | 3.5 | 9 | 11 | 11 | 7.1 | 22 |
2 | 7 | 3.6 | 10 | 12 | 11 | 7.5 | 23 |
3 | 7 | 3.9 | 12 | 13 | 12 | 7.8 | 25 |
4 | 7 | 4.1 | 17 | 14 | 12 | 7.6 | 27 |
5 | 8 | 4.2 | 18 | 15 | 12 | 7.9 | 29 |
6 | 8 | 4.5 | 19 | 16 | 13 | 8.1 | 30 |
7 | 9 | 5.3 | 19 | 17 | 13 | 8.5 | 32 |
8 | 9 | 5.5 | 20 | 18 | 14 | 8.7 | 32 |
9 | 10 | 5.6 | 21 | 19 | 14 | 9.6 | 33 |
10 | 10 | 6.1 | 21 | 20 | 15 | 9.8 | 36 |
Решение
Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу:
Расчетная вспомогательная таблица
№ | |||||||||
1 | 7 | 3.5 | 9 | 24.5 | 63 | 31.5 | 12.25 | 81 | 49 |
2 | 7 | 3.6 | 10 | 25.2 | 70 | 36 | 12.96 | 100 | 49 |
3 | 7 | 3.9 | 12 | 27.3 | 84 | 46.8 | 15.21 | 144 | 49 |
4 | 7 | 4.1 | 17 | 28.7 | 119 | 69.7 | 16.81 | 289 | 49 |
5 | 8 | 4.2 | 18 | 33.6 | 144 | 75.6 | 17.64 | 324 | 64 |
6 | 8 | 4.5 | 19 | 36 | 152 | 85.5 | 20.25 | 361 | 64 |
7 | 9 | 5.3 | 19 | 47.7 | 171 | 100.7 | 28.09 | 361 | 81 |
8 | 9 | 5.5 | 20 | 49.5 | 180 | 110 | 30.25 | 400 | 81 |
9 | 10 | 5.6 | 21 | 56 | 210 | 117.6 | 31.36 | 441 | 100 |
10 | 10 | 6.1 | 21 | 61 | 210 | 128.1 | 37.21 | 441 | 100 |
11 | 11 | 7.1 | 22 | 78.1 | 242 | 156.2 | 50.41 | 484 | 121 |
12 | 11 | 7.5 | 23 | 82.5 | 253 | 172.5 | 56.25 | 529 | 121 |
13 | 12 | 7.8 | 25 | 93.6 | 300 | 195 | 60.84 | 625 | 144 |
14 | 12 | 7.6 | 27 | 91.2 | 324 | 205.2 | 57.76 | 729 | 144 |
15 | 12 | 7.9 | 29 | 94.8 | 348 | 229.1 | 62.41 | 841 | 144 |
16 | 13 | 8.1 | 30 | 105.3 | 390 | 243 | 65.61 | 900 | 169 |
17 | 13 | 8.5 | 32 | 110.5 | 416 | 272 | 72.25 | 1024 | 169 |
18 | 14 | 8.7 | 32 | 121.8 | 448 | 278.4 | 75.69 | 1024 | 196 |
19 | 14 | 9.6 | 33 | 134.4 | 462 | 316.8 | 92.16 | 1089 | 196 |
20 | 15 | 9.8 | 36 | 147 | 540 | 352.8 | 96.04 | 1296 | 225 |
Сумма | 209 | 128.9 | 455 | 1448.7 | 5126 | 3222.5 | 911.45 | 11483 | 2315 |
Ср.знач. | 10.45 | 6.445 | 22.75 | 72.435 | 256.3 | 161.125 | 45.5725 | 574.15 | 115.75 |
Найдем средние квадратические отклонения признаков:
Расчет парных коэффициентов корреляции и параметров линейного уравнения множественной регрессии
1) Для нахождения параметров линейного уравнения множественной регрессии:
необходимо решить следующую систему линейных уравнений относительно неизвестных параметров :
Решать систему уравнений методом Крамера, методом обратной матрицы или методом Гаусса достаточно трудоемко, поэтому воспользуемся готовыми формулами:
Рассчитаем сначала парные коэффициенты корреляции:
Находим:
Таким образом, получили следующее уравнение множественной регрессии:
Коэффициенты стандартизированного уравнения регрессии
Коэффициенты и стандартизированного уравнения регрессии находятся по формулам:
То есть уравнение будет выглядеть следующим образом:
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.
На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение), а также онлайн-помощь на экзамене или зачете. Для этого вам нужно только связаться со мной:
Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту.
Подробное решение получите точно в срок или раньше.
Коэффициенты эластичности
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
Вычисляем:
Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,635% или 0,142% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем фактора .
Частные и парные коэффициенты корреляции
2) Коэффициенты парной корреляции мы уже нашли:
Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, так как ). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим факторов при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.
Коэффициенты множественной корреляции и детерминации
Коэффициент множественной корреляции определить по формуле:
Коэффициент множественной корреляции показывает на весьма сильную связь всего набора факторов с результатом.
3) Нескорректированный коэффициент множественной детерминации оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 98,4% и указывает на высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной корреляции:
определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на высокую (более 98%) детерминированность результата в модели факторами и .
Надежность уравнения регрессии. Критерий Фишера
4) Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает –критерий Фишера:
В нашем случае фактическое значение –критерия Фишера:
Получили, что (при ) (по таблице F-распределения Фишера-Снедекора, при уровне значимости α=0,05 и числе степеней свободы k1=2 и k2=20-2=18), то есть вероятность случайно получить такое значение – критерия не превышает допустимый уровень значимости 5%. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, то есть подтверждается статистическая значимость всего уравнения и показателя тесноты связи .
5) С помощью частных –критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул:
Найдем и .
Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, несущественным; фактор включать в уравнение после фактора не следует.
Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного –критерия для будет иным. , то есть вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного –критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .
6) Общий вывод состоит в том, что множественная модель с факторами и с содержит неинформативный фактор . Если исключить фактор , то можно ограничится уравнением парной регрессии: