Множественная регрессия
Задача
По 20
предприятиям региона изучается зависимость выработки продукции на одного
работника
(тыс.руб.) от ввода в действие новых основных
фондов
(% от стоимости фондов на
конец года) и от удельного веса рабочих высокой квалификации в общей
численности рабочих
(смотри таблицу своего варианта).
Требуется:
Исходные данные
№ |
|
|
|
№ |
|
|
|
1 | 7 | 3.5 | 9 | 11 | 11 | 7.1 | 22 |
2 | 7 | 3.6 | 10 | 12 | 11 | 7.5 | 23 |
3 | 7 | 3.9 | 12 | 13 | 12 | 7.8 | 25 |
4 | 7 | 4.1 | 17 | 14 | 12 | 7.6 | 27 |
5 | 8 | 4.2 | 18 | 15 | 12 | 7.9 | 29 |
6 | 8 | 4.5 | 19 | 16 | 13 | 8.1 | 30 |
7 | 9 | 5.3 | 19 | 17 | 13 | 8.5 | 32 |
8 | 9 | 5.5 | 20 | 18 | 14 | 8.7 | 32 |
9 | 10 | 5.6 | 21 | 19 | 14 | 9.6 | 33 |
10 | 10 | 6.1 | 21 | 20 | 15 | 9.8 | 36 |
Решение
Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу:
Расчетная вспомогательная таблица
№ |
|
|
|
|
|
|
|
|
|
1 | 7 | 3.5 | 9 | 24.5 | 63 | 31.5 | 12.25 | 81 | 49 |
2 | 7 | 3.6 | 10 | 25.2 | 70 | 36 | 12.96 | 100 | 49 |
3 | 7 | 3.9 | 12 | 27.3 | 84 | 46.8 | 15.21 | 144 | 49 |
4 | 7 | 4.1 | 17 | 28.7 | 119 | 69.7 | 16.81 | 289 | 49 |
5 | 8 | 4.2 | 18 | 33.6 | 144 | 75.6 | 17.64 | 324 | 64 |
6 | 8 | 4.5 | 19 | 36 | 152 | 85.5 | 20.25 | 361 | 64 |
7 | 9 | 5.3 | 19 | 47.7 | 171 | 100.7 | 28.09 | 361 | 81 |
8 | 9 | 5.5 | 20 | 49.5 | 180 | 110 | 30.25 | 400 | 81 |
9 | 10 | 5.6 | 21 | 56 | 210 | 117.6 | 31.36 | 441 | 100 |
10 | 10 | 6.1 | 21 | 61 | 210 | 128.1 | 37.21 | 441 | 100 |
11 | 11 | 7.1 | 22 | 78.1 | 242 | 156.2 | 50.41 | 484 | 121 |
12 | 11 | 7.5 | 23 | 82.5 | 253 | 172.5 | 56.25 | 529 | 121 |
13 | 12 | 7.8 | 25 | 93.6 | 300 | 195 | 60.84 | 625 | 144 |
14 | 12 | 7.6 | 27 | 91.2 | 324 | 205.2 | 57.76 | 729 | 144 |
15 | 12 | 7.9 | 29 | 94.8 | 348 | 229.1 | 62.41 | 841 | 144 |
16 | 13 | 8.1 | 30 | 105.3 | 390 | 243 | 65.61 | 900 | 169 |
17 | 13 | 8.5 | 32 | 110.5 | 416 | 272 | 72.25 | 1024 | 169 |
18 | 14 | 8.7 | 32 | 121.8 | 448 | 278.4 | 75.69 | 1024 | 196 |
19 | 14 | 9.6 | 33 | 134.4 | 462 | 316.8 | 92.16 | 1089 | 196 |
20 | 15 | 9.8 | 36 | 147 | 540 | 352.8 | 96.04 | 1296 | 225 |
Сумма | 209 | 128.9 | 455 | 1448.7 | 5126 | 3222.5 | 911.45 | 11483 | 2315 |
Ср.знач. | 10.45 | 6.445 | 22.75 | 72.435 | 256.3 | 161.125 | 45.5725 | 574.15 | 115.75 |
Найдем средние квадратические отклонения признаков:
Расчет парных коэффициентов корреляции и параметров линейного уравнения множественной регрессии
1) Для нахождения параметров линейного уравнения множественной регрессии:
необходимо
решить следующую систему линейных уравнений относительно неизвестных параметров
:
Решать систему уравнений методом Крамера, методом обратной матрицы или методом Гаусса достаточно трудоемко, поэтому воспользуемся готовыми формулами:
Рассчитаем сначала парные коэффициенты корреляции:
Находим:
Таким образом, получили следующее уравнение множественной регрессии:
Коэффициенты стандартизированного уравнения регрессии
Коэффициенты
и
стандартизированного уравнения регрессии
находятся по формулам:
То есть уравнение будет выглядеть следующим образом:
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.
Если по каким-либо причинам не справляетесь с решением задач, на портале можно заказать выполнение расчетной домашней работы, ИДЗ, РГР, контрольной и даже отдельных задач в разумные сроки. Чтобы вы смогли сделать заказ, я доступен по следующим каналам связи:
Контакты будут для вас
видны на территории
России и Беларуси
Общение без посредников. Удобная оплата переводом на банковскую карту. Опыт работы более 25 лет.
Подробное решение в формате электронного документа получите точно в срок или раньше.
Коэффициенты эластичности
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
Вычисляем:
Т.е.
увеличение только основных фондов (от своего среднего значения) или только
удельного веса рабочих высокой квалификации на 1% увеличивает в среднем
выработку продукции на 0,635% или 0,142% соответственно. Таким образом,
подтверждается большее влияние на результат
фактора
, чем фактора
.
Частные и парные коэффициенты корреляции
2) Коэффициенты парной корреляции мы уже нашли:
Они
указывают на весьма сильную связь каждого фактора с результатом, а также
высокую межфакторную зависимость (факторы
и
явно коллинеарны, так как
). При такой сильной
межфакторной зависимости рекомендуется один из факторов исключить из
рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим факторов при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.
Коэффициенты множественной корреляции и детерминации
Коэффициент множественной корреляции определить по формуле:
Коэффициент множественной корреляции показывает на весьма сильную связь всего набора факторов с результатом.
3)
Нескорректированный коэффициент множественной детерминации
оценивает долю вариации результата за счет
представленных в уравнении факторов в общей вариации результата. Здесь эта доля
составляет 98,4% и указывает на высокую степень обусловленности вариации
результата вариацией факторов, иными словами – на весьма тесную связь факторов
с результатом.
Скорректированный коэффициент множественной корреляции:
определяет
тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает
такую оценку тесноты связи, которая не зависит от числа факторов и поэтому
может сравниваться по разным моделям с разным числом факторов. Оба коэффициента
указывают на высокую (более 98%) детерминированность результата
в модели факторами
и
.
Надежность уравнения регрессии. Критерий Фишера
4) Оценку
надежности уравнения регрессии в целом и показателя тесноты связи
дает
–критерий Фишера:
В нашем
случае фактическое значение
–критерия Фишера:
Получили,
что
(при
)
(по таблице F-распределения Фишера-Снедекора, при уровне значимости α=0,05 и числе степеней свободы k1=2 и k2=20-2=18), то есть вероятность
случайно получить такое значение
– критерия не превышает допустимый уровень
значимости 5%. Следовательно, полученное значение не случайно, оно
сформировалось под влиянием существенных факторов, то есть подтверждается
статистическая значимость всего уравнения и показателя тесноты связи
.
5) С
помощью частных
–критериев Фишера оценим целесообразность
включения в уравнение множественной регрессии фактора
после
и фактора
после
при помощи формул:
Найдем
и
.
Получили,
что
. Следовательно, включение
в модель фактора
после того, как в модель включен фактор
статистически нецелесообразно: прирост
факторной дисперсии за счет дополнительного признака
оказывается незначительным, несущественным;
фактор
включать в уравнение после фактора
не следует.
Если
поменять первоначальный порядок включения факторов в модель и рассмотреть
вариант включения
после
, то результат расчета
частного
–критерия для
будет иным.
, то есть вероятность его
случайного формирования меньше принятого стандарта
. Следовательно, значение
частного
–критерия для дополнительно включенного
фактора
не случайно, является статистически значимым,
надежным, достоверным: прирост факторной дисперсии за счет дополнительного
фактора
является существенным.
Фактор
должен присутствовать в уравнении, в том числе
в варианте, когда он дополнительно включается после фактора
.
6) Общий
вывод состоит в том, что множественная модель с факторами
и
с
содержит неинформативный фактор
. Если исключить фактор
, то можно ограничится
уравнением парной регрессии: