Учебная работа. Расчет и анализ экономических показателей путем построения уравнения парной линейной регрессии

Расчет и анализ экономических показателей путем построения уравнения парной линейной регрессии

Контрольная работа по эконометрике

исходные данные

Имеются данные о часовом заработке 1 рабочего Y и общем стаже работы после окончания учебы Х.

№XY122,453,428,98313,315+№=22418,329,5513,832611,714,7719,513815,211,3914,418102211,81116,435-№=281218,9161316,129,51413,323,11517,355

Задание.

исследовать зависимость часового заработка одного рабочего от общего стажа работы после окончания учебы путем построения уравнения парной линейной регрессии

.

предварительный анализ данных

1.Вычислите и проанализируйте описательные статистики (выборочные средние, медиану, моду, среднее квадратичное отклонение) для переменных Х и У.

2.Постройте поле корреляции (диаграмму рассеяния) и сформулируйте гипотезу о форме связи.

.Вычислите парный коэффициент корреляции между переменными. Интерпретируйте полученные результаты: соответствуют ли знаки коэффициента вашим ожиданиям? Модель парной регрессии:

4.найти оценки и параметров модели парной линейной регрессии и . Записать полученное уравнение регрессии.

.Проверить значимость оценок коэффициентов и с надежностью 0,95 с помощью t-статистики Стьюдента и сделать выводы о значимости этих оценок. Значимо ли уровень образования влияет на заработок?

.определить интервальные оценки коэффициентов и с надежностью 0,95. Сделайте вывод о точности полученных коэффициентов.

.Рассчитайте стандартную ошибку регрессии. сделать вывод о точности полученного уравнения регрессии.

.определить коэффициент детерминации R2 и сделать вывод о качестве подгонки уравнения регрессии к исходным данным.

.Рассчитать среднюю ошибку аппроксимации и сделайте выводы о качестве уравнения регрессии.

.рассчитать прогнозное значение результата , если значение фактора X будет больше на 15% его среднего уровня .

.дать экономическую интерпретацию коэффициентов парной регрессии.

поле корреляция экономический показатель

Решение

1.Вычислим описательные статистики (выборочные средние, медиану, моду, среднее квадратичное отклонение) для переменных Х и У, для этого составим таблицу:

NXYХ-Хср (Х-Хср) 2У-Уср (У-Уср) 2 (Х-Хср) (У-Ycp) 122,453,46,339,6929,05843,9025183,01528,98-7,251,84-16,35267,3225117,72313,322-2,87,84-2,355,52256,58418,329,52,24,845,1526,522511,33513,832-2,35,297,6558,5225-17,595611,714,7-4,419,36-9,6593,122542,46719,5133,411,56-11,35128,8225-38,59815,211,3-0,90,81-13,05170,302511,745914,418-1,72,89-6,3540,322510,795102211,85,934,81-12,55157,5025-74,0451116,4280,30,093,6513,32251,0951218,9162,87,84-8,3569,7225-23,381316,129,5005,1526,522501413,323,1-2,87,84-1,251,56253,51517,3551,21,4430,65939,422536,78Сумма241,5365,3 196,14 2842,418271,41Среднее16,124,35333

выборочные средние

,

Хмах=22,4, Хмин=8,9

R=22.4-8.9=13.5

Медиана Xme=15.65

Мода Хмо=13,3

Дисперсия

среднее квадратичное отклонение

2.Построим поле корреляции и сформулируем гипотезу о форме связи.

Анализируя данное поле корреляции можно сделать следующие выводы:

между переменными Х и Y наблюдается прямая зависимость: с ростом Х значения Y увеличиваются.

точки располагаются близко к прямой линии, т.е. можно предположить, что связь между переменными линейная.

. Вычислим парный коэффициент корреляции между переменными.

связь между часовым заработком 1 рабочего Y и общим стажем работы после окончания учебы Х прямая и слабая.

. Найдем оценки и параметров модели парной линейной регрессии и .

Определим параметры линейной зависимости вида

Для расчета параметров α, β, коэффициента детерминации, оценки значимости уравнения результаты вспомогательных расчетов представим в виде таблицы.

NXYXYX2Y2122,453,41196,16501,762851,5628,9871,279,2164313,322292,6176,89484418,329,5539,85334,89870,25513,832441,6190,441024611,714,7171,99136,89216,09719,513253,5380,25169815,211,3171,76231,04127,69914,418259,2207,36324102211,8259,6484139,241116,428459,2268,967841218,916302,4357,212561316,129,5474,95259,21870,251413,323,1307,23176,89533,611517,355951,5299,293025Сумма241,5365,36152,744084,2911738,69Среднее16,124,35333410,1827272,286782,5793

сначала рассчитаем коэффициент β

Используя полученное значение рассчитаем α

Запишем полученное уравнение регрессии

Расчетные значения переменной у рассчитаем подстановкой значений Х в данное уравнение

NXYурY-yp (Y-yp) 2 (Y-yp) 2/Y122,453,433,076820,3232413,03257,7346928,9814,3523-6,352340,351725,043964313,32220,45511,54492,3867160,108487418,329,527,39012,10994,4516780,150904513,83221,148610,8514117,75293,679778611,714,718,2359-3,535912,502590,850516719,51329,0545-16,0545257,74719,82669815,211,323,0904-11,7904139,013512,30208914,41821,9808-3,980815,846770,880376102211,832,522-20,722429,401336,389941116,42824,75483,245210,531320,3761191218,91628,2223-12,2223149,38469,3365391316,129,524,33875,161326,639020,9030181413,323,120,45512,64496,9954960,3028351517,35526,003128,9969840,820215,28764Сумма241,5365,3 2466,857113,1736Среднее16,124,35333 164,45727,544905

5. Проверим значимость оценок коэффициентов и с надежностью 0,95 с помощью t-статистики Стьюдента

Для оценки значимости уравнения необходимо рассчитать стандартную ошибку регрессии S и Sβ

В среднем истинное значение может отклоняться от значения β=1,387 на величину 0,984. Рассчитаем

Значение tβ =1,41≤tкр=2,228, поэтому параметр β не является значимым.

Аналогично рассчитаем для параметра α

. Определим интервальные оценки коэффициентов и с надежностью 0,95.

Построим доверительные интервалы для параметра β для уровня доверия q=0,95.

,

Построим доверительные интервалы для параметра α для уровня доверия q=0,95.

. Определим коэффициент детерминации R2 и коэффициент корреляции rxy. сделать выводы о качестве уравнения регрессии.

Таким образом R2=0.133, т.е. на 13,3% дисперсия зависимой переменной у объясняется изменением переменной х, а 86,7% изменения у объясняется влиянием других факторов.

Рассчитаем коэффициент корреляции

между х и у слабая и прямая.

. Проверим при уровне значимости 0,05 значимость уравнения регрессии с помощью F-статистики Фишера и сделать выводы о значимости уравнения регрессии.

Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера:

R2 — коэффициент детерминации

Fтабл=4,98 для α=0,05; k1=k=1; k2=n-k-1=10

F=1,99≤Fтабл=4.98

Уравнение регрессии с вероятностью 0,95 статически не значимое

8.Рассчитаем среднюю ошибку аппроксимации и сделаем выводы о качестве уравнения регрессии.

В среднем на 50,26 % отличаются расчетные значения от фактических. Так как А=50,26≥10% то качество подгонки не достаточно хорошее.

.Рассчитаем прогнозное X будет больше на 15% его среднего уровня .

Х среднее равно 16,1

Хпрогн=16,1+15%=18,51,

10.дать экономическую интерпретацию коэффициентов парной регрессии.

Построенное уравнение регрессии

позволяет выполнить анализ взаимосвязи исследуемых показателей.

Экономический смысл параметра β состоит в следующем — при изменении переменной х на единицу

Это означает что при изменении переменной х на 1 % на 91,7% изменится значение у.

Дополнительно решим задание в программе Microsoft Excel:

ВЫВОД ИТОГОВРегрессионная статистикаМножественный R0,363495R-квадрат0,132129Нормированный R-квадрат0,06537стандартная ошибка13,77526Наблюдения15Дисперсионный анализ dfSSMSFЗначимость Fрегрессия КоэффициентыСтандартная ошибкаt-статистикаP-ЗначениеНижние 95%Верхние 95%Нижние 95,0%Верхние 95,0%Y-пересечение2,07485416,230410,1278370,900234-32,988837,13852-32,988837,13852Переменная X 11,3837570,9835961,4068340,182931-0,741173,508687-0,741173,508687ВЫВОД ОСТАТКАНаблюдениеПредсказанное YОстаткиСтандартные остатки133,07120,3291,53147214,39029-6,39029-0,48141320,478821,5211850,114597427,39762,1024020,158383521,1706910,829310,815818618,2648-3,5648-0,26855729,05811-16,0581-1, 20973823,10795-11,808-0,88954922,00095-4,00095-0,301411032,5175-20,7175-1,560741124,768463,231540,2434461228,22785-12,2279-0,921181324,353335,1466670,387721420,478822,6211850, 1974651526,0138428,986162,183651

Учебная работа. Расчет и анализ экономических показателей путем построения уравнения парной линейной регрессии