Множественная регрессия

Пример решения задачи

Задача

По 20 предприятиям региона изучается зависимость выработки продукции на одного работника  (тыс.руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих  (смотри таблицу своего варианта).

Требуется:

    Построить линейную модель множественной регрессии. Записать стандартизированное уравнение множественной регрессии. На основе стандартизированных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентов детерминации. С помощью  –критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации С помощью частных  –критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора  после  и фактора  после . Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.

Исходные данные

1 7 3.5 9 11 11 7.1 22
2 7 3.6 10 12 11 7.5 23
3 7 3.9 12 13 12 7.8 25
4 7 4.1 17 14 12 7.6 27
5 8 4.2 18 15 12 7.9 29
6 8 4.5 19 16 13 8.1 30
7 9 5.3 19 17 13 8.5 32
8 9 5.5 20 18 14 8.7 32
9 10 5.6 21 19 14 9.6 33
10 10 6.1 21 20 15 9.8 36

Решение

Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу:

Расчетная вспомогательная таблица

1 7 3.5 9 24.5 63 31.5 12.25 81 49
2 7 3.6 10 25.2 70 36 12.96 100 49
3 7 3.9 12 27.3 84 46.8 15.21 144 49
4 7 4.1 17 28.7 119 69.7 16.81 289 49
5 8 4.2 18 33.6 144 75.6 17.64 324 64
6 8 4.5 19 36 152 85.5 20.25 361 64
7 9 5.3 19 47.7 171 100.7 28.09 361 81
8 9 5.5 20 49.5 180 110 30.25 400 81
9 10 5.6 21 56 210 117.6 31.36 441 100
10 10 6.1 21 61 210 128.1 37.21 441 100
11 11 7.1 22 78.1 242 156.2 50.41 484 121
12 11 7.5 23 82.5 253 172.5 56.25 529 121
13 12 7.8 25 93.6 300 195 60.84 625 144
14 12 7.6 27 91.2 324 205.2 57.76 729 144
15 12 7.9 29 94.8 348 229.1 62.41 841 144
16 13 8.1 30 105.3 390 243 65.61 900 169
17 13 8.5 32 110.5 416 272 72.25 1024 169
18 14 8.7 32 121.8 448 278.4 75.69 1024 196
19 14 9.6 33 134.4 462 316.8 92.16 1089 196
20 15 9.8 36 147 540 352.8 96.04 1296 225
Сумма 209 128.9 455 1448.7 5126 3222.5 911.45 11483 2315
Ср.знач. 10.45 6.445 22.75 72.435 256.3 161.125 45.5725 574.15 115.75

 

Найдем средние квадратические отклонения признаков:

Расчет парных коэффициентов корреляции и параметров линейного уравнения множественной регрессии

1) Для нахождения параметров линейного уравнения множественной регрессии:

необходимо решить следующую систему линейных уравнений относительно неизвестных параметров :

 

Решать систему уравнений методом Крамера, методом обратной матрицы или методом Гаусса достаточно трудоемко, поэтому воспользуемся готовыми формулами:

 

Рассчитаем сначала парные коэффициенты корреляции:

 

Находим:

 

Таким образом, получили следующее уравнение множественной регрессии:

Коэффициенты стандартизированного уравнения регрессии

Коэффициенты  и  стандартизированного уравнения регрессии  находятся по формулам:

То есть уравнение будет выглядеть следующим образом:

Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.

 

На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение), а также онлайн-помощь на экзамене или зачете. Для этого вам нужно только связаться со мной:

Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту.

Подробное решение получите точно в срок или раньше.

Коэффициенты эластичности

Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:

Вычисляем:

 

Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,635% или 0,142% соответственно. Таким образом, подтверждается большее влияние на результат    фактора   , чем фактора  .

 

Частные и парные коэффициенты корреляции

2)  Коэффициенты парной корреляции мы уже нашли:

 

Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы  и  явно коллинеарны, так как ). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.

Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим факторов при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.

При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:

 

Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.

Коэффициенты множественной корреляции и детерминации

Коэффициент множественной корреляции определить по формуле:

 

Коэффициент множественной корреляции показывает на весьма сильную связь всего набора факторов с результатом.

 

3) Нескорректированный коэффициент множественной детерминации  оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 98,4% и указывает на высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.

Скорректированный коэффициент множественной корреляции:

определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на высокую (более 98%) детерминированность результата    в модели факторами   и  .

 

Надежность уравнения регрессии. Критерий Фишера

4) Оценку надежности уравнения регрессии в целом и показателя тесноты связи  дает  –критерий Фишера:

В нашем случае фактическое значение  –критерия Фишера:

 

Получили, что  (при ) (по таблице F-распределения Фишера-Снедекора, при уровне значимости α=0,05 и числе степеней свободы k1=2 и k2=20-2=18), то есть вероятность случайно получить такое значение  – критерия не превышает допустимый уровень значимости 5%. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, то есть подтверждается статистическая значимость всего уравнения и показателя тесноты связи .

 

5) С помощью частных  –критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора  после  и фактора  после  при помощи формул:

Найдем  и .

 

 

Получили, что . Следовательно, включение в модель фактора  после того, как в модель включен фактор  статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака  оказывается незначительным, несущественным; фактор  включать в уравнение после фактора  не следует.

Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения  после , то результат расчета частного  –критерия для  будет иным. , то есть вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного  –критерия для дополнительно включенного фактора  не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор  должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .

 

6) Общий вывод состоит в том, что множественная модель с факторами  и  с  содержит неинформативный фактор . Если исключить фактор , то можно ограничится уравнением парной регрессии: