Учебная работа. Факторы, влияющие на среднемесячную номинальную заработную плату населения по регионам Российской Федерации

факторы, влияющие на среднемесячную номинальную заработную плату населения по регионам российской Федерации

Кафедра Прикладной информатики и моделирования экономических процессов

Факторы, влияющие на среднемесячную номинальную заработную плату населения по регионам российской Федерации

Специальность: Эконометрика

Выполнила студентка 141 группы

курса

Очеретина Анастасия Ивановна

Научный руководитель :

К. ф.-м.н., старший преподаватель

Я.Б. Панкратова

Санкт-Петербург 2016

Введение

Заработная плата уже долгое время привлекает к себе внимание различных специалистов экономической сферы, таких как А. Смита, У. Петти, К. Маркса, М. И. Туган-Барановского и других.

Заработная плата выражает интересы наёмных рабочих, работодателей и государства в целом. Государство заинтересовано в том, чтобы обеспечить рост благосостояния общества и социальную гармонию посредством увеличения заработной платы.

Работодатели, устанавливая заработную плату, стремятся увеличить прибыль своей компании и эффективность труда, рационально использовать ресурсы производства.

Наёмные рабочие заинтересованы в том, чтобы их труд оценивался по заслугам и заработная плата была бы равносильна вложенным усилиям, а также способна была бы удовлетворить материальные и духовные потребности.

Существующий продолжительное время на рынке труда конфликт между интересами работников и работодателей обострился в последние годы. В то время когда работники требуют увеличение оплаты их труда в связи с растущими ценами в магазинах, работодатель стремится получить максимальную прибыль при минимальных затратах, а в ряде случаях незаконно уменьшая работнику заработную плату. Тем самым образуется «замкнутый круг», из которого очень сложно найти выход.

Цель курсовой работы — выявить и изучить факторы, влияющие на размер заработной платы, выбрать наиболее значимые факторы и определить степень влияния данных факторов на среднемесячную номинальную заработную плату работников за 2014 год.

полученные результаты нельзя с уверенность применять в сегодняшней практике, в силу того, что в 2014 году в россии и в мире был экономический кризис. Поэтому изучение данной зависимости по-прежнему остаётся актуальным.

Анализ темы проводится с помощью эконометрических методов по данным Федеральной службы государственной статистики РФ.

Глава 1. Сбор данных и отбор факторов

Для проведения исследования были отобраны следующие факторы, влияющие на среднемесячную заработную плату работников (y) в 2014 году:- численность населения за 2014 г;- численность экономически активного населения в 2014 г., тыс. человек;- ВРП (валовой региональный продукт) на душу населения в млрд. рублей за 2014 г;- объём инвестиций в основной капитал в 2014 г., млн. руб.

Для исследования использовались данные, выражающие вариацию факторов и результирующего признака по регионом Центрального и Северо-Западного федеральных округов. Не были задействованы данные по двум городам (Москва и Санкт-Петербург), а также по московской области. Это объясняется тем, что наблюдается серьезное различие в экономическом развитии и заработной платы, которое отражает поле корреляции.

В исследовании использовались данные Федеральной службы государственной статистики, а также данные из единой межведомственной информационно-статистической системы (ЕМИСС) за 2014 год.

далее будет изучено влияние каждого из приведённых выше факторов на среднемесячную заработную плату работников в отдельности и влияние всех этих факторов.

Глава 2. исследование влияния отельных факторов

2.1. Исследование влияния численности населения на среднемесячную заработную плату работников по регионам

Представим исходные данные о среднемесячной номинальной заработной плате и численности населения по регионам в виде статистической таблицы, удобной для анализа (см. табл. 1).

Таблица 1

Среднемесячная номинальная заработная плата и численность населения по регионам

РегионЧисленность населения за 2014 г. (x1)Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y) Белгородская область1 544 10829821 Брянская область1 242 59924668 Владимирская область1 413 32127398 Воронежская область2 328 95930172 Ивановская область1 043 13026508 Калужская область1 004 54434752 Костромская область656 38925560 Курская область1 118 91529183 Липецкая область1 159 86630870 Орловская область769 98027196 Рязанская область1 140 84429678 Смоленская область967 89627282 Тамбовская область1 068 93427302 Тверская область1 325 24930722 Тульская область1 521 49731700 Ярославская область1 271 76631575 Республика Карелия634 40235726 Республика Коми872 05749734 Архангельская область1 191 78545634 Ненецкий автономный округ43 02541980 Вологодская область1 193 37135732 Калининградская область963 12835577 Ленинградская область1 763 92438448 Мурманская область771 05857845 Новгородская область622 43031221 Псковская область656 56125694

Для изучения влияния фактора X1 на результирующий признак Y сначала нужно построить поле корреляции (рис. 1).

Рис. 1 «Поле корреляции»

Из вида поля корреляции можно сделать предположение, что между X1 и Y имеется обратная зависимость. поэтому построим модель парно-линейной регрессии и исследуем её качество.

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии (см табл. 2).

Таблица 2

Модель парной линейной регрессии

ba-0,00437004,448mb — стандартная ошибка коэфф., b0,0044272,704mа — стандартная ошибка коэфф., аR^2 — коэфф., детерминации0,0388014,903Sост. — оценка стандартного отклонения остатковF статистика0,94024,000Число степеней свободы n-2Регрессионная сумма квадратов60367425,191541728139Остаточная сумма квадратов

По найденной таблице было записано уравнение выборочной регрессии (y^=37004,448-0,004х) и экономическая интерпретация коэффициентов линейной регрессии: =-0,004 показывает, что при увеличении численности населения на одного человека среднемесячная заработная плата уменьшается на 0,4 копейки.

Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис.1).

Из вида поля корреляции можно сделать предположение, что гетероскедастичность отсутствует, а присутствует гомоскедастичность.

Проверим первое наше предположение по тесту Голдфелда-Квандта и по тесту Спирмена. Оба теста указали на наличие гомоскедастичности. Fg=0,29присутствует гомоскедастичность.

Кроме того, из вида поля корреляции можно предположить, что в модели присутствует положительная автокорреляция. Используя критерий Дарбина-Уотсона мы выяснили, DW=1,45 принадлежит интервалу [dl=1,3;du=1,46], следовательно гипотеза о положительной автокорреляции отвергается, автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения.

Мною была найдена величина средней ошибки аппроксимации =16,56% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.

Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).

В результате получаем: статистика= 0,939; F-критическое=4,259.

Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.

Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим так как tb

Таблица 3

показатели значимости коэффициентов

ta8,660661979> 2,063898547коэффициент а значимtb-0,969400072Был вычислен доверительный интервал линейной регрессии. Были выявлены следующие результаты и выявлена экономическая интерпретация только для значимых коэффициентов:

Значение параметра α с вероятностью 95% будет находиться в интервале [28186,01978; 45822,87636].

разного знака.

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее Стандартная ошибка прогноза функции регрессии получилась равной 8100,11, а ошибка индивидуального значения — 11395,19. Так же вычислен доверительный интервал параметр для условного математического ожидания: [8732,150812; 42167,77998] и доверительный интервал для индивидуального значения [1931,433686; 48968,49727].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Коэффициент корреляции rxy =-0,19. следовательно, по шкале Чеддока наблюдается очень слабая обратная зависимость или вовсе отсутствует.

Коэффициент детерминации R2=0,038, говорит о том, что лишь 3,8% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением численности населения, а остальные 96,2% факторами, не включёнными в модель.

Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, не подходит для описания зависимой переменной. Поэтому включение данного фактора в модель множественной регрессии нецелесообразно.

2.2. исследование влияния численности экономически активного населения на среднемесячную заработную плату работников по регионам.

Представим исходные данные о среднемесячной номинальной заработной плате и численности экономически активного населения по регионам в виде статистической таблицы, удобной для анализа (см. табл. 4).

Таблица 4

Среднемесячная номинальная заработная плата и численность экономически активного населения по регионам

РегионЧисленность экономически активного населения в 2014 г., тыс. человек, (х2)Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y) Белгородская область812,229821 Брянская область627,124668 Владимирская область746,527398 Воронежская область1153,630172 Ивановская область524,226508 Калужская область541,634752 Костромская область334,725560 Курская область569,329183 Липецкая область594,230870 Орловская область394,827196 Рязанская область544,429678 Смоленская область545,527282 Тамбовская область512,427302 Тверская область712,330722 Тульская область808,131700 Ярославская область687,931575 Республика Карелия328,135726 Республика Коми500,149734 Архангельская область631,145634 Ненецкий автономный округ23,341980 Вологодская область628,235732 Калининградская область527,135577 Ленинградская область962,238448 Мурманская область468,357845 Новгородская область336,431221 Псковская область351,525694

Для изучения влияния фактора X2 на результирующий признак Y сначала нужно построить поле корреляции (рис. 2).

Рис. 2 «Поле корреляции»

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии (см. табл. 5).

Таблица 5

Модель парной линейной регрессии

ba-4,35435642,530mb — стандартная ошибка коэфф., b7,2354431,748mа — стандартная ошибка коэфф., аR^2 — коэфф., детерминации0,0158109,345Sост. — оценка стандартного отклонения остатковF статистика0,36224,000Число степеней свободы n-2Регрессионная сумма квадратов23820146,831578275417Остаточная сумма квадратов

По найденной таблице было записано уравнение выборочной регрессии (y^=35642,448-4,354x)и экономическая интерпретация коэффициентов линейной регрессии: =-4,354 показывает, что при увеличении численности экономически активного населения на одного человека, среднемесячная заработная плата. уменьшается на 4,3 рубля.

Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 3).

Из вида поля корреляции можно сделать предположение, что гетероскедастичность отсутствует, а присутствует гомоскедастичность. Проверим наше предположение по двум тестам: по тесту Голдфелда-Квандта и тесту Спирмена. По тесту Голдфелда-Квандта наше предположение подтвердилось. В модели действительно присутствует гомоскедастичность, так как Fg=0,27 < Fkp=3,43. однако тест Спирмена показал противоположный результат, поскольку tr=2,105 > tкрит=2,063 в модели присутствует гетероскедастичность. Такое разногласие, скорее всего, связано с небольшим объемом выборки. наличие гетероскедастичности приводит к тому, что возникают большие остатки, что приводит к высоким ошибкам прогнозирования.

кроме того, Из вида поля корреляции можно сделать предположение, что автокорреляция отсутствует. Тест Дарбина-Уотсона показал, что DW=1,56 принадлежит интервалу [du=1,46; 4-du=2,54], следовательно нет основания отклонять Hо — автокорреляция остатков отсутствует, что обеспечивает состоятельность и эффективность оценок выборочных коэффициентов регрессии.

Мною была найдена величина средней ошибки аппроксимации =16,69% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.

Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).

В результате получаем: статистика= 0,362; F-критическое=4,259.

Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.

Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим так как tb

Таблица 6

показатели значимости коэффициентов

ta8,042544481> 2,063898547коэффициент а значимtb-0,601847474Был вычислен доверительный интервал линейной регрессии. Были выявлены следующие результаты и выявлена экономическая интерпретация только для значимых коэффициентов:

Значение параметра α с вероятностью 95% будет находиться в интервале [26495,85194; 44789,20832].

разного знака.

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее Стандартная ошибка прогноза функции регрессии получилась равной 8424,58, а ошибка индивидуального значения — 11693,38. Так же вычислен доверительный интервал параметр для условного математического ожидания: [10786,30456; 45561,29799] и доверительный интервал для индивидуального значения [4039,847983; 48968,49727].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Коэффициент корреляции rxy =-0,12. следовательно, по шкале Чеддока наблюдается очень слабая обратная зависимость или вовсе отсутствует.

Коэффициент детерминации R2=0,015, говорит о том, что лишь 1,5% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением численности экономически активного населения, а остальные 98,5% факторами не включёнными в модель

Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, не подходит для описания зависимой переменной. Поэтому включение данного фактора в модель множественной регрессии нецелесообразно.

.3. исследование влияния ВРП (на душу населения) на среднемесячную заработную плату работников по регионам

Представим исходные данные о среднемесячной номинальной заработной плате и валовом региональном продукте на душу населения за 2014 год в виде статистической таблицы, удобной для анализа (см. табл. 7).

Таблица 7

Среднемесячная номинальная заработная плата и ВРП на душу населения

Регион ВРП (валовой региональный продукт) на душу населения в млрд. рублей за 2014 г. (х3)Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y) Белгородская область619,429821 Брянская область243,024668 Владимирская область327,927398 Воронежская область709,130172 Ивановская область151,026508 Калужская область324,934752 Костромская область146,325560 Курская область297,429183 Липецкая область395,730870 Орловская область179,727196 Рязанская область297,329678 Смоленская область234,727282 Тамбовская область275,827302 Тверская область307,430722 Тульская область408,531700 Ярославская область388,131575 Республика Карелия185,635726 Республика Коми480,949734 Архангельская область356,445634 Ненецкий автономный округ183,741980 Вологодская область388,435732 Калининградская область306,235577 Ленинградская область714,038448 Мурманская область320,357845 Новгородская область205,931221 Псковская область121,325694

Для изучения влияния фактора X3 на результирующий признак Y сначала нужно построить поле корреляции (рис. 3).

Рис. 5 «Поле корреляции»

Из вида поля корреляции можно сделать предположение, что между X3 и Y имеется прямолинейная зависимость. поэтому построим модель парно-линейной регрессии и исследуем её качество.

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии ( см. табл. 8).

Таблица 8

Модель парной линейной регрессии

ba12,41429061,719mb — стандартная ошибка коэфф., b9,9923641,100mа — стандартная ошибка коэфф., аR^2 — коэфф., детерминации0,0607919,635Sост. — оценка стандартного отклонения остатковF статистика1,54324,000Число степеней свободы n-2Регрессионная сумма квадратов96800688,731505294875Остаточная сумма квадратов

По найденной таблице было записано уравнение выборочной регрессии (y^=29061,719+12,414x) и экономическая интерпретация коэффициентов линейной регрессии: =12,414 показывает, что при увеличении ВРП на1 млрд. рублей, среднемесячная заработная плата увеличивается на 12,414 рублей.

Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 3).

Из вида поля корреляции можно сделать предположение, что гетероскедастичность отсутствует, а присутствует гомоскедастичность.

Проверим первое наше предположение по тесту Голдфелда-Квандта и по тесту Спирмена. Оба теста указали на наличие гомоскедастичности. Fg=1,78присутствует гомоскедастичность.

Из вида поля корреляции можно сделать предположение, что автокорреляция отсутствует. Тест Дарбина-Уотсона показал, что DW=2,05 принадлежит интервалу [du=1,46; 4-du=2,54], следовательно нет основания отклонять Hо — автокорреляция остатков отсутствует, что обеспечивает состоятельность и эффективность оценок выборочных коэффициентов регрессии.

Мною была найдена величина средней ошибки аппроксимации =16,11% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.

Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР (5%;1;24).

В результате получаем: статистика= 1,543; F-критическое=4,259

Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.

Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим так как tbТаблица 9

показатели значимости коэффициентов

ta7,981575687> 2,063898547коэффициент а значимtb1,242321648разного знака.

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее Стандартная ошибка прогноза функции регрессии получилась равной 6767,08, а ошибка индивидуального значения — 10417,008. Так же вычислен доверительный интервал параметр для условного математического ожидания: [27368,84514; 55302,00355] и доверительный интервал для индивидуального значения [19835,77; 48968,49].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Коэффициент корреляции rxy =0,24. следовательно, по шкале Чеддока наблюдается слабая прямо-линейная зависимость.

Коэффициент детерминации R2=0,06, говорит о том, что 6% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением ВРП, а остальные 74% факторами, не включёнными в модель.

Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, не подходит для описания зависимой переменной. Поэтому включение данного фактора в модель множественной регрессии нецелесообразно.

2.4 исследование влияния объёма инвестиций в основной капитал на среднемесячную заработную плату работников по регионам

Представим исходные данные о среднемесячной номинальной заработной плате и объёме инвестиций в основной капитал за 2014 год в виде статистической таблицы, удобной для анализа (см. табл. 10).

Таблица 10

Среднемесячная номинальная заработная плата и объем инвестиций в основной капитал

РегионОбъём инвестиций в основной капитал в 2014 г. Млн руб (х4)Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y) Белгородская область120390,629821 Брянская область66825,424668 Владимирская область7566727398 Воронежская область243259,830172 Ивановская область29803,326508 Калужская область99785,734752 Костромская область27512,825560 Курская область7174329183 Липецкая область110101,130870 Орловская область44931,127196 Рязанская область58209,929678 Смоленская область56747,127282 Тамбовская область112713,127302 Тверская область7449130722 Тульская область95434,731700 Ярославская область76491,831575 Республика Карелия30834,635726 Республика Коми207421,649734 Архангельская область148128,845634 Ненецкий автономный округ8424841980 Вологодская область63880,935732 Калининградская область64891,535577 Ленинградская область58501,138448 Мурманская область178777,457845 Новгородская область72254,831221 Псковская область64922,625694

Для изучения влияния фактора X4 на результирующий признак Y сначала нужно построить поле корреляции (рис. 4).

При рассмотрении графика сложно точно предположить, какой вид зависимости существует между переменными. Однако мы можем проанализировать следующие виды зависимостей:

Линейная зависимость;

Квадратичная зависимость;

Гиперболическая зависимость;

Степенная зависимость;

Показательная зависимость;

Экспоненциальная зависимость;

Логарифмическая зависимость.

каждая из рассмотреннчых моделей получилась значимой по критерию Фишера, поскольку Fстат>Fкр. Для того, чтобы выбрать качественную модель, необходимо использовать следующие критерии:

Коэффициент детерминации R^2. С помощью него можно оценить тесноту связи, и чем R^2 ближе к единице, тем лучше регрессия описывает зависимость между зависимой и объясняющими переменными;

Средняя ошибка аппроксимации А. лучше та модель, у которой наименьшая ошибка аппроксимации. На практике хорошем соответствии модели выбранным данным;

Стандартная ошибка регрессии Sост. Чем меньше этот показатель, тем лучше построенная модель;

Метод абсолютных отклонений. лучшая модель та, которая имеет наименьший показатель МАD.

Для выбора лучшей модели рассмотрим таблицу сравнения критериев:

Таблица 11

Таблица сравнения критериев

Тип моделиR^2ASostMAD1. Линейная0,29015,00%6886,2625133,1713112. Квадратичная0,31435263614,86%6910,8377425103,5539313. Гиперболическая0,17716,49%7413,2725682,1787064. Степенная0,26214,50%0,1885112,2797715. Показательная0,270944414,46%0,18663055057,0833856. Экспоненциальная 0,270944414,46%0,18663055057,0833857. Логарифмическая0,268611215,46%6987,35375965314,151177

В результате сравнения полученных критериев наилучшей моделью является показательная и/или экспоненциальная. Она лучше аппроксимирует выборочные данные и имеет более точный прогноз. Однако для исследования факторов X3 и Y была выбрана линейная модель из-за ее простоты. поэтому построим модель парно-линейной регрессии и исследуем её качество.

С помощью функции ЛИНЕЙН из категории «Статистические» строим модель парной линейной регрессии (см. табл. 12).

Таблица 12 инвестиция регрессияМодель парной линейной регрессии

ba0,08125855,921mb — стандартная ошибка коэфф., b0,0262695,486mа — стандартная ошибка коэфф., аR^2 — коэфф., детерминации0,2906886,262Sост. — оценка стандартного отклонения остатковF статистика9,78524,000Число степеней свободы n-2Регрессионная сумма квадратов464001142,51138094422Остаточная сумма квадратов

По найденной таблице было записано уравнение выборочной регрессии (y^=25855,921+0,081x) и экономическая интерпретация коэффициентов линейной регрессии:

Коэффициент b=0,081 показывает, что при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., среднемесячная заработная плата увеличивается на 8,1 коп.

Коэффициент a=25855,921 показывает, что при отсутствии инвестиций в основной Капитал (X4=0), среднемесячная заработная плата равна 25855,921 рубл.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 4).

Из вида поля корреляции можно сделать предположение, что гомоскедастичность отсутствует, а присутствует гетероскедастичность. Проверим наше предположение по двум тестам: по тесту Голдфелда-Квандта и тесту Спирмена. По тесту Голдфелда-Квандта наше предположение подтвердилось. В модели действительно присутствует гетероскедастичность, так как Fg= 4,1 > Fkp= 3,4. однако тест Спирмена показал противоположный результат, поскольку tr=1,95скорее всего, связано с небольшим объемом выборки. наличие гетероскедастичности приводит к тому, что возникают большие остатки, что приводит к высоким ошибкам прогнозирования.

кроме того, из вида поля корреляции можно предположить, что в модели присутствует положительная автокорреляция. Используя критерий Дарбина-Уотсона мы выяснили, DW=1,39 принадлежит интервалу [dl=1,3;du=1,46], следовательно гипотеза о положительной автокорреляции отвергается, автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения.

Мною была найдена величина средней ошибки аппроксимации =15,00% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные. незначительно превышает 7 %, поэтому можно считать, что построенная модель является удовлетворительной.

Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).

В результате получаем: статистика= 9,784; F-критическое=4,259.

Так как Fстат.>Fкр., то модель значима в целом.

Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициенты а, b и r являются значимыми, т.к tа> tкр; tb>tкр и tr>tкр. (см. табл. 13).

Таблица 13

показатели значимости коэффициентов

ta9,592303964> 2,063898547коэффициент а значимtb3,128066653>tкр2,063898547коэффициент b значимtr3,128066653> 2,063898547коэффициент r значим

основной капитал с вероятностью 0,95 среднемесячная заработная плата принимает значение в диапазоне [20292,7113; 31419,13052].

Значение параметра β показывает, что при увеличении инвестиций в основной капитал на 1 млн. рубл. с вероятностью 0,95 среднемесячная заработная плата увеличивается на значение в диапазоне [0,027606745; 0,134690429].

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее получилась равной 4857,05, а ошибка индивидуального значения — 8426,83. Так же вычислен доверительный интервал параметр для условного математического ожидания: [37722,55356; 57771,48587] и доверительный интервал для индивидуального значения [30354,88429; 48968,49727].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Коэффициент корреляции rxy =0,53. следовательно по шкале Чеддока между Х и У наблюдается заметная прямо-линейная зависимость.

Коэффициент детерминации R2=0,289, говорит о том, что 28,9% вариации (дисперсии, разброса) среднемесячной заработной платы. объясняется изменением численности населения, а остальные 71,1% факторами, не включёнными в модель.

Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, подходит для описания зависимой переменной. Поэтому данный фактор будет включён в модель множественной регрессии.

Глава 3 исследование влияния совокупности факторов

3.1 Процедура отбора переменных в множественной линейной регрессии

Для того чтобы построить качественную модель множественной регрессии, необходимо провести пошаговую процедуру включения существенных переменных в анализируемую модель. Для этого вначале построим корреляционную матрицу, найдём коэффициенты корреляции между всеми парами объясняющих переменных и сделаем предположение о наличии или отсутствии мультиколлинеарности (см. табл. 14).

Таблица 14

Корреляционная матрица

rx1x2rx1x3rx1x410,991784660,7965766250,3801747210,9917846610,8225793170,3930648730,7965766250,82257931710,5941236160,3801747210,3930648730,5941236161

Можно сделать предположение о наличие мультколлиниарности, поскольку между факторами x1 и x2, x1 и x3, x2 и x3 высокая взаимная зависимость(rxixj>0,7). Значит, не следует включать одновременно факторы в модель.

Для того, чтобы определить, какой из факторов связан с Y в большей степени и в какой последовательности следует включать факторы в модель, необходимо построить скорректированную корреляционную матрицу (см. табл. 15)

Таблица 15

Скорректированная корреляционная матрица

y ryx1ryx2ryx3ryx4y1-0,194114115-0,1219348950,2458074350,538164834×1-0,19411411510,991784660,7965766250,380174721×2-0,1219348950,9917846610,8225793170,393064873×30,2458074350,7965766250,82257931710,594123616×40,5381648340,3801747210,3930648730,5941236161

Исходя из полученных данных мы можем сделать вывод, что первым в модель следует включать фактор х4 (объем инвестиций в основной капитал), так как он имеет самый высокий коэффициент корреляции с признаком у, затем фактор х3,х1,х2.

следующим шагом необходимо проверить целесообразность включения фактора х3 (валовый региональный продукт) в модель ух4, используя частный критерий Фишера.

Так как частный критерий Фишера равен 0,28, а табличное значение 4,28, то включение данного фактора в модель yx4 нецелесообразно.

Аналогично с фактором х1 (численность населения), где Fч=8,15 > Fкр=4,28. Из этого следует, что фактор х1 целесообразно включать в модель ух4.

Последний фактор х2 (численность экономически активного населения) включать в модель целесообразно, т.к. Fч=5,23> Fкр=4,28.

Поскольку факторы х1 и х2 в модель yx4 включать целесообразно, проверим целесообразность включения фактора х1 в модель ух2х4.

получилось следующее: Fч=19,49>Fкр=4,3, значит включение переменной х1 оправдано.

таким образом, исключив нецелесообразный фактор х3, можно приступить к построению множественной линейной регрессии х1, х2, x4.

3.2 Построение множественной регрессии

Для построения множественной регрессии нужно исследовать влияние таких факторов, как:- численность населения за 2014 г;- численность экономически активного населения в 2014 г., тыс. человек;- объём инвестиций в основной капитал в 2014 г., млн. руб.

Объясняемым фактором по-прежнему является Y — среднемесячная заработная плата работников за 2014 год. исходные данные представлены выборкой объема n=26.

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель множественной регрессии (см. табл. 16):

Таблица 16

Модель множественной регрессии

b4b2b1a0,097476688131,4519007-0,07459433830395,691810,01943404233,278839060,0168941722698,5380670,6931038014727,468281#Н/Д#Н/Д16,5618251922#Н/Д#Н/Д1110418525491677039,6#Н/Д#Н/Д

Дадим экономическую интерпретацию коэффициентов множественной регрессии:

а — показывает, что если не будет численности населения (х1=0), экономически активного населения (х2=0) и объема инвестиций в основной капитал (х4=0), то среднемесячная зарплата составит 30 395 руб.;- показывает, что при увеличении численности населения на 1 человека, средняя заработная плата уменьшается на 0,07 рублей, при неизменных остальных факторах.- показывает, что при увеличении численности экономически активного населения на 1 человека, средняя заработная плата увеличивается на 131 рубль, при неизменных остальных факторах.- показывает, что при увеличении объема инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата увеличивается на 0,09 рублей, при неизменных остальных факторах.

Проверим значимость уравнения множественной линейной регрессии в целом по критерию Фишера:

Fстатистика16,56182519>Fкрит3,049125006

Поскольку Fстат.>Fкрит., значит уравнение регрессии значимо в целом.

Проверим значимость коэффициентов множественной линейной регрессии по критерию Стьюдента при уровне значимости 5% (см. табл. 17):

Таблица 17

показатели значимости коэффициентов множественной регрессии

ta11,26376247> а значимtb2-4,415388812>tкр2,073873058b1 значимtb33,950014616> b2 значимtb45,015770066> b3 значим

Все факторы значимы, из этого следует, что их можно использовать для дальнейшего исследования.

Для статистически значимых коэффициентов были построены доверительные интервалы (см. табл. 18):

Таблица 18

Доверительные интервалы

α24799,2664135992,1172β1-0,109630706-0,03955797β262,43581295200,4679884β40,0571729510,137780424

Дадим их экономическую интерпретацию:

α — показывает, что если не будет численности населения (х1=0), экономически активного населения (х2=0) и объема инвестиций в основной капитал (х4=0), то среднемесячная зарплата изменяется в пределах [24799,3; 35992,1] с вероятностью 95%.

β1 — показывает, что при увеличении численности населения на 1 человека, средняя заработная плата изменяется в пределах [-0,109; -0,039] с вероятностью 95%

β2 — показывает, что при увеличении численности экономически активного населения на 1 человека, средняя заработная плата изменяется в пределах [62,435; 200,467] с вероятностью 95%

β4 — показывает, что при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата изменяется в пределах [0,057; 0,137] с вероятностью 95%

Говоря о качестве построенной регрессии следует отметить, что модель имеет неплохую объясняющую способность, поскольку коэффициент детерминации R^2= 0,69 показывает, что 69% изменения средней заработной платы объясняется изменениями факторов, включенных в модель, а остальные 31% не включенными факторами.

Так как R² близок к 1, уравнение регрессии неплохо аппроксимирует эмпирические данные.

Средняя ошибка аппроксимации (A=11,10% > 10%) незначительно превышает 10%, поэтому можем считать, что построенная модель является удовлетворительной.

Был вычислен скорректированный коэффициент детерминации: R^2adj=0,65.

В ходе исследования были найдены стандартизованные коэффициенты регрессии b’i и частные средние коэффициенты эластичности Эi. ‘=-4,09;’=3,68;’=0,64.

Поскольку b1′ больше, чем все остальные стандартизированные коэффициенты, можем считать, что фактор x1 (численность населения) больше влияет на y (среднемесячная заработная плата), чем другие факторы (x2,х4)

Средней коэффициент эластичности Эср1=-2,44 показывает, что при увеличении x1 (численности населения) на 1 %, у (среднемесячная заработная плата) уменьшается на 244%. Средней коэффициент эластичности Эср2=2,26 показывает, что при увеличении х2 (численности экономически активного населения) на 1%, у (среднемесячная заработная плата) увеличивается на 226%. Средней коэффициент эластичности Эср4=0,26 показывает, что при увеличении x4 (объёма инвестиций в основной капитал ) на 1 %, y (среднемесячная заработная плата ) увеличивается на 26%.

Чтобы определить наличие мультиколлинеарности в данной модели, необходимо построить матрицу выборочных коэффициентов корреляции Q с помощью функции КОРЕЛЛ (см. табл. 19).

Таблица 19

Матрица выборочных коэффициентов корреляции Q

rx1х2rx1х410,991784660,380174721rx1х20,9917846610,393064873rx2х40,3801747210,3930648731rx1х4rx2х4

Проанализировав полученную матрицу, можно предположить, что между факторами х1 и х2 существует мультиколлинеарность, так как rx1x2 больше 0,7.

Необходимо проанализировать частные коэффициенты детерминации, которые были получены в результате возведения в квадрат частных коэффициентов корреляции:^2yx1 = 0,47 показывает, что на 47 % изменение средней заработной платы объясняется изменением численности населения, а оставшиеся 53 % — факторами, не включёнными в модель.^2yx2 =0,41 показывает, что на 41 % изменение средней заработной платы объясняется изменением численности экономически активного населения, а оставшиеся 59 % — факторами, не включёнными в модель.^2yx4 =0,53 показывает, что на 53% изменение средней заработной платы объясняется изменением объёма инвестиций в основной капитал, а оставшиеся 47 % — факторами, не включёнными в модель.

В результате проверки значимости частных коэффициентов корреляции было выявлено, что все коэффициенты значимы, так как tr>tкр по модулю.

tryx1/x2x4-4,415388812tryx2/x1x43,950014616tryx4/x1x25,015770066tкр(5%, 22)=2,073873058

чтобы убедиться в наличии мультиколлинеарности вычислим определитель матрицы =1,52374E+29. По этому критерию мультиколлиниарность отсутствует, поскольку определитель матрицы не равен нулю.

таким образом, при построении множественной модели не удалось полностью избежать мультиколенниарность , поскольку между факторами х1 и х2 она существует, так как rx1x2 больше 0,7. Поэтому, необходимо построить модель, состоящую из двух факторов, х2 и х4. О том, какая модель является лучшей будет сказано в заключение.

Заключение

Во время проведения исследования была выявлена и изучена зависимость каждого фактора на результирующий признак как в отдельности, так и в совокупности. Для этого были построены четыре парные линейные регрессии и две модели множественной регрессии.

Проведённое исследование показало, что значимыми можно признать не все построенные модели. Модель, отражающая зависимость среднемесячной номинальной заработной платы от численности населения, а также модель, отражающая зависимость среднемесячной номинальной заработной платы от численности экономически активного населения и модель, отражающая зависимость среднемесячной номинальной заработной платы от валового регионального продукта являются незначимыми. Модель, отражающая зависимость среднемесячной номинальной заработной платы от объема инвестиций в основной капитал значима.

Для того чтобы построить качественную множественную регрессию, необходимо, во-первых, проверить отсутствие или присутствие мультиколлинеарности в модели, во-вторых проверить целесообразность включения фактора хi в модель, используя частный критерий Фишера. Построив корреляционную матрицу, обнаружилось, что между факторами x1x2, x1x3, x2x3 высокая взаимная зависимость, а значит можно сделать предположение о наличие мультколлиниарности. Это говорит о том, что не следует включать одновременно факторы в модель. Поскольку фактор х4 имеет самый высокий коэффициент корреляции с признаком у, значит его следует включить в модель первым, а затем фактор х3,х1,х2. Как оказалось не все факторы можно включать в модель множественной регрессии. Включение фактора х3 в модель ух4 нецелесообразно, поскольку Fч=0,27факторов х1 в модель ух4, а также х2 в модель ух4, а затем х1 в модель ух2х4, оказалось, что включение всех этих факторов целесообразно. Поэтому для исследования была построена модель множественной регрессии y^=a+b1x1+b2x2+b4x4 или y^=30395-0,07х1+131,45х2+0,09х4.

Полученной модели можно дать экономическую интерпретацию: при увеличении численности населения на 1 человека, средняя заработная плата уменьшается на 0,07 рублей, при неизменных остальных факторах; при увеличении численности экономически активного населения на 1 человека, средняя заработная плата увеличивается на 131 рубль, при неизменных остальных факторах; при увеличении объема инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата увеличивается на 0,09 рублей, при неизменных остальных факторах. Коэффициент а интерпретировать невозможно, так как тяжело представить регион, где не существует людей, способных и желающих работать и где нет инвестиций в основной капитал.

Анализ данной модели установил, что 69% изменения средней заработной платы в 2014 году объясняется изменением численности населения, численности экономически активного населения и объема инвестиций в основной капитал. При увеличении x1 (численности населения) на 1 %, у (среднемесячная заработная плата) уменьшается на 244%. При увеличении х2 (численности экономически активного населения) на 1%, у (среднемесячная заработная плата) увеличивается на 226%. При увеличении x4 (объёма инвестиций в основной капитал ) на 1 %, y (среднемесячная заработная плата ) увеличивается на 26%.

Данная модель значима в целом по критерию Фишера, с удовлетворительной ошибкой аппроксимации и достаточно большим коэффициентов детерминации, т.е. в целом пригодной для прогнозирования. однако между факторами х1 и х2 существует мультиколлинеарность в стохастической форме. Определитель матрицы хоть и отличен от нуля, но очень мал. Однако стандартные ошибки коэффициентов регрессии получились небольшими, и коэффициенты получились значимы по t-критерию. Несмотря на то, что свойства несмещённости и эффективности оценок остаются в силе, мультиколлинеарность в любом случае затрудняет разделение влияния объясняющих переменных на факторов, а именно х2 и х4, нельзя точно определить присутствует гомоскедастичность или гетероскедастичность, так как результаты тестов Голдфелда-Квандта и Спирмена противоречат друг другу. Скорее всего, неточность связана с небольшим объёмом выборки. Кроме того, у факторов х1 и х4 автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения. Все этого говорит о том, что в построенной модели возможны ошибки, которые следует принять к сведению при построении прогнозов.

чтобы уменьшить наличие мультиколлинеарности было решено исключить из модели y^=a+b1x1+b2x2+b4x4 переменную х1.

Была построена множественная регрессияНесмотря на отсутствие мультиколлинеарности данная модель, по -моему мнению, получилась хуже.

Сделаем сводную таблицу и сравним модель парной регрессии, которая значима, и модели множественной регрессии по наиболее существенным критериям (см. табл. 20):

Таблица 20

сравнение моделей

Тип моделиR^2R^2adjSостMADAПарная y^=a+bx40,2896213890,260022286886,2617515133,17131115,00% y^=a+b1x1+b2x2+b4x40,6931038010,6512543194727,4682813603,47362311,10%y^=a+b2x2+b4x40,4211427350,370807326349,8875624626,06235513,89%

Как мы видим, по большинству критериев лучшая модель — множественная модель с тремя факторами y^=a+b1x1+b2x2+b4x4. Данная модель в большей степени влияет на величину заработной платы, чем остальные. Скорее всего это связано с тем, что сами работники, их количество и инвестиции в основной капитал заставляют работодателей изменять величину заработной платы.

В заключении хотелось бы отметить, что данный вопрос требует особого внимания и дальнейшего изучения, так как заработная плата играет значительную роль в развитии экономики, государства и жизни каждого человека. Дальнейшее изучение данного вопроса поможет в построении прогнозов и принятии целесообразных решений, а возможно приведёт к более качественной модели.

Список использованных источников

Евсеев Е.А., Буре В.М., Эконометрика: Учебник, Изд-во МБИ, 2007 г.

Тарашнина С. И., Панкратова Я.Б., Выполнение курсовой работы по эконометрике: учебно-методическое пособие, 2007 г.

Курс эконометрика: электронный ресурс URL: http://eos.ibi.spb.ru/course/view.php?id=608

Сайт федеральной статистики: электронный ресурс URL:

Федеральная служба государственной статистики (Росстат): электронный ресурс URL: http://government.ru/department/250/events/

Учебная работа. Факторы, влияющие на среднемесячную номинальную заработную плату населения по регионам Российской Федерации