Учебная работа. Применение имитационного моделирования к сравнению методов оценивания и анализу их точности

Применение имитационного моделирования к сравнению методов оценивания и анализу их точности

ДИПЛОМНАЯ РАБОТА

по дисциплине "Эконометрическое моделирование"

на тему:

"Применение имитационного моделирования к сравнению методов оценивания и анализу их точности. Проверка смещенности и несостоятельности МНК-оценок в случае, когда неслучайный фактор измеряется с ошибками"

Содержание

Введение

Глава 1. сущность многофакторного регрессионного анализа с применением МНК-оценок

.1 сущность многофакторных регрессионных моделей

.2 Свойства оценок, полученных методом наименьших квадратов (МНК)

.3 Анализ вариации зависимой переменной. Качество оценивания в модели многофакторной линейной регрессии

Глава 2. Эконометрическая модель эффективности структуры кредитных активов и ресурсов коммерческих банков

.1 Математическая модель влияния структуры кредитных активов и кредитных ресурсов банков на уровень процентной прибыльности

.2 Построение модели многофакторной регрессии в пакете IBM SPSS -21

.3 анализ состоятельности и адекватности эконометрической модели основным гипотезам МНК-оценок

Глава 3. Применение имитационного моделирования в пакете IBM SPSS -21 для анализа влияния ошибок экзогенности в основных факторах эконометрической модели

.1 Подготовка эконометрической модели к имитационному моделированию в пакете IBM SPSS -21

.2 Результаты имитационного моделирования МНК — оценок уравнения многофакторной регрессии эконометрической модели

.3 влияние ошибок в измерении неслучайных факторов эконометрической модели на смещенность и несостоятельность МНК — оценок

Выводы

список использованной литературы

Введение

Статистическое и эконометрическое моделирование — это исследование объектов познания на их статистических моделях; построение и изучение моделей реально существующих предметов, процессов или явлений с целью получения объяснений этих явлений, а также для предсказания явлений или показателей, интересующих исследователя.

основным отличием функциональных и эконометрических моделей является вероятностный характер связи факторных независимых объясняющих переменных (регрессоров) и результирующей переменной (зависимой от регрессоров) с точностью до неизвестного случайного члена (регрессионного остатка). Оценка параметров таких моделей производится с помощью статистическиx методов: метод максимального правдоподобия, метод наименьших квадратов, метод моментов.

Экзогенность факторов (регрессоров) эконометрических (регрессионных) моделях (независимость от функционирования моделируемой системы) является одним из важнейших предположений при построении эконометрических моделей. Нарушение этого условия приводит к существенному ухудшению качества статистических стандартных оценок параметров, а именно — оценки параметров становятся смещенными и несостоятельными.

Одним из методов выявления эндогенности объясняющих факторов (связи факторов с случайными остатками модели) является имитационное моделирование — метод исследования, при котором изучаемая система заменяется моделью, с достаточной точностью описывающей реальную систему, с которой проводятся эксперименты с целью получения информации об этой системе.

Имитационная модель — это логико-математическое описание объекта, которое может быть использовано для экспериментирования на компьютере в целях проектирования, анализа и оценки функционирования объекта. Цель имитационного моделирования состоит в воспроизведении поведения исследуемой системы на основе результатов анализа наиболее существенных взаимосвязей между её элементами или другими словами — разработке симулятора (англ. simulation modeling) исследуемой предметной области для проведения различных экспериментов.

Объектом исследования курсовой работы является эконометрическая модель процентной рентабельности коммерческого банка как функции относительной структуры кредитов и кредитных ресурсов.

Предметом исследования курсовой работы является построение в компьютерном пакете IBM SPSS -21 многофакторной линейной регрессионной модели и исследование несмещенности и состоятельности полученных оценок.

Целью исследования курсовой работы является выявление с помощью имитационного моделирования влияния ошибок измерения неслучайных факторов модели на смещенность и состоятельность МНК-оценок для многофакторной линейной регрессии.

Источником статистических данных для курсового исследования являлись опубликованные на официальном Интернет-сайте Национального банка Украины данные о результатах деятель первых 55 банков банковской системы Украины за 2009 — 2012 гг.

инструментом статистических исследований и имитационного моделирования являлась русскоязычная версия компьютерного пакета IBM SPSS версии 21 (2012).

Глава 1. сущность многофакторного регрессионного анализа с применением МНК-оценок

.1 сущность многофакторных регрессионных моделей

Множественная (многофакторная) регрессия представляет собой модель, где среднее независимых (объясняющих) переменных , т.е. это модель вида

. (1.1)

любое эконометрическое исследование начинается со спецификации модели, т.е. с формулировки вида модели исходя из соответствующей теории связи между явлениями.

Для построения модели множественной линейной регрессии с объясняющими переменными зависимость между ними в генеральной совокупности представляется в виде:

, (1.2)

где: объясняемая — зависимая переменная;

объясняющие — независимые переменные;

параметры модели;

случайное слагаемое.

Случайная величина , или возмущение, включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели обусловлено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных.

К ошибкам спецификации будет относиться не только неправильный выбор той или иной математической функции для , но и недоучет в уравнении регрессии какого-либо существенного фактора, т.е. использование парной регрессии вместо множественной.

Наряду с ошибками спецификации могут иметь место ошибки выборки, поскольку исследователь чаще всего при установлении закономерной связи между признаками работает с выборочными данными. Ошибки выборки имеют место и в силу неоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла.

наибольшую опасность в практическом использовании методов регрессии представляют ошибки измерения. Если ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выборки ― увеличивая объем исходных данных, то ошибки измерения практически могут свести на нет все усилия по количественной оценке связи между признаками. Особенно велика роль ошибок измерения при исследовании на макроуровне.

Обычно при построении модели множественной линейной регрессии предполагается отсутствие корреляций всех объясняющих переменных друг с другом.

На основе наблюдений получают выборочное уравнение регрессии:

, (1.3)

где оценки параметров .

Для оценки параметров уравнения регрессии используется метод наименьших квадратов (МНК).

В случае модели множественной линейной регрессии с объясняющими переменными необходимым условием минимума суммы квадратов остатков является равенство нулю ее частных производных по всем коэффициентам уравнения регрессии .

Такое условие приводит к системе из линейного уравнения с неизвестным, называемой системой нормальных уравнений. Ее решение в матричной форме имеет вид:

, (1.4)

где: вектор с компонентами ;

матрица значений объясняющих переменных;

транспонированная матрица значений объясняющих переменных (при транспонировании в матрице строки и столбцы меняют местами);

вектор значений зависимой переменной.

Несмещенной оценкой дисперсии модели является остаточная дисперсия :

, (1.5)

при этом величину называют стандартной ошибкой регрессии.

Зная стандартную ошибку регрессии, можно определить вектор вариаций коэффициентов уравнения регрессии:

(1.6)

и стандартные ошибки оценок коэффициентов регрессии:

. (1.7)

1) Модель множественной линейной регрессии можно представить в виде:

, (1.8)

где е наблюдение зависимой переменной (),

объясняющие переменные,

я случайная составляющая, характеризующая отклонение от функции регрессии.

(1.9)

матрица-столбец, или вектор, значений объясняющих переменных размера ; в матрицу дополнительно введен столбец, все элементы которого равны 1, т.е. предполагается, что свободный член умножается на фиктивную переменную , принимающую Тогда в матричной форме модель множественной линейной регрессии примет вид:

. (1.10)

Оценкой этой модели по выборке является уравнение

, (1.11)

где , .

Для оценки вектора неизвестных параметров применим метод наименьших квадратов, согласно которому вектор неизвестных параметров выбирается таким образом, чтобы сумма квадратов отклонений эмпирических значений от значений , найденных по уравнению регрессии, была минимальной:

,

при этом используется свойство произведения

.

С учетом свойства транспонирования произведения матриц после раскрытия скобок условие минимизации примет вид:

. (1.12)

Можно доказать, что задача минимизации функции сводится к определению вектора неизвестных параметров из следующего матричного уравнения:

, (1.13)

при этом матрица сумм первых степеней, квадратов и попарных произведений наблюдений и векторпроизведений наблюдений объясняющих и зависимой переменных имеют вид:

,

.

Решением матричного уравнения является вектор

, (1.14)

где матрица, обратная матрице коэффициентов , матрица-столбец, или вектор, ее свободных членов.

Зная вектор , выборочное уравнение множественной регрессии можно представить в виде:

, (1.15)

где — групповая (условная) средняя переменной при заданном векторе значений объясняющей переменной .

.2 Свойства оценок, полученных методом наименьших квадратов (МНК)

Зависимая переменная в теоретической модели регрессии

(1.16)

имеет две составляющие: неслучайную составляющую

(1.17)

и случайную составляющую . Получаемые с помощью МНК оценки коэффициентов регрессии также можно представить в виде двух составляющих — неслучайной и случайной.

Неслучайные составляющие оценок равны параметрам , тогда как случайные составляющие этих оценок зависят от случайной составляющей теоретической модели регрессии .

На практике разложить коэффициенты регрессии на составляющие довольно затруднительно, так как значения и неизвестны.

Регрессионный анализ, основанный на применении метода наименьших квадратов (МНК), дает наилучшие из всех возможных результаты, если выполняются следующие условия (называемые условиями Гаусса-Маркова):

. Математическое ожидание случайного слагаемого в любом м наблюдении должно быть равно нулю — .

. Дисперсия случайного слагаемого должна быть постоянной для всех наблюдений — , где теоретическое . Случайные слагаемые должны быть статистически независимы, т.е. должно выполняться свойство некоррелированности их между собой.

. Объясняющие переменные должны быть величинами неслучайными.

При выполнении условий Гаусса-Маркова модель

называется классической нормальной линейной регрессионной моделью. Наряду с условиями Гаусса-Маркова предполагается, что случайное слагаемое имеет нормальное распределение. При этом предположении требование некоррелированности значений случайного слагаемого эквивалентно их независимости.

первое условие означает, что нет постоянно действующего фактора, не включенного в модель, но оказывающего влияние на результативный фактор. Другими словами, случайное слагаемое не должно иметь систематического смещения. Если постоянное слагаемое включено в уравнение регрессии, то можно считать, что это условие выполняется автоматически, так как роль постоянного слагаемого как раз и заключается в том, чтобы учитывать постоянную тенденцию показателя , не учтенную в уравнении регрессии.

Если не выполнено это условие, то оценки параметров уравнения регрессии, полученное с помощью МНК, будут неэффективными и смещенными.

второе условие означает, что дисперсия случайного слагаемого в каждом наблюдении имеет только одно значение. другими словами, не должно быть априорной причины для того, чтобы в одних наблюдениях величина была больше, чем в других, хотя на практике величина остатков уравнения регрессии в разных наблюдениях будет разной. Но ее величина заранее неизвестна, и одна из первоочередных задач регрессионного анализа состоит в ее оценке.

Если дисперсии случайного слагаемого зависят от номера наблюдения (т.е. выполняется условие гетероскедастичности), то оценки коэффициентов регрессии, полученные с помощью МНК, будут неэффективными и смещенными. поэтому (по крайней мере, формально) можно получить более надежные оценки с использованием других методов.

Так как условия Гаусса-Маркова предполагают независимость дисперсии случайного слагаемого от номера наблюдения (т.е. предполагает выполнение условия гомоскедастичности), то разработаны специальные методы диагностирования и устранения гетероскедастичности.

Третье условие указывает, что между значениями случайного слагаемого в разных наблюдениях нет систематической связи, т.е. указывает на некоррелированность (на независимость) случайных слагаемых для разных наблюдений. Если это условие нарушается (например, для временных рядов), то имеет место автокорреляция остатков, оценки коэффициентов регрессии, полученные МНК, оказываются неэффективными. Существуют методы диагностирования и устранения автокорреляции.

Если четвертое условие (о том, что объясняющие переменные должны быть неслучайными) не выполняется, то оценки коэффициентов регрессии оказываются смещенными и несостоятельными.

теорема Гаусса-Маркова.

Если перечисленные четыре условия выполняются, то оценки, сделанные с помощью МНК, являются наилучшими оценками, так как они обладают свойствами:

) несмещенности, что означает отсутствие систематической ошибки в положении линии регрессии;

) эффективности — имеют наименьшую дисперсию в классе всех линейных несмещенных оценок;

) состоятельности — при достаточно большом объеме данных оценки приближаются к истинным значениям.

Если условия Гаусса-Маркова не выполнены, то можно найти другие оценки параметров уравнения регрессии, которые будут более эффективными по сравнению с оценками, найденными методом МНК.

Кроме того, если не выполнены условия Гаусса-Маркова, то становятся неприменимы t-тесты и тест Фишера на качество оценивания и адекватность уравнения регрессии.

1.3 Анализ вариации зависимой переменной. Качество оценивания в модели многофакторной линейной регрессии

Пусть в уравнении регрессии содержится объясняющих переменных. Дисперсию зависимой переменной можно представить в виде суммы объясненной и необъясненной составляющих:

, (1.18)

где: остаток в м варианте реализации событий;

среднее — расчетное значение зависимой переменной в м варианте реализации событий, определяемое уравнением регрессии;

число реализации событий, в каждом из которых при сочетании значений независимых переменных было получено значение зависимой переменной.

каждая сумма в этом разложении имеет собственное название:

общий разброс зависимой переменной (обозначается );

разброс, объясненный регрессией (обозначается );

разброс, не объясненный регрессией (обозначается ).

Используя введенные обозначения, разложение дисперсии зависимой переменной можно записать в виде суммы:

. (1.19)

Мерой объясняющего качества уравнения регрессии по сравнению с оценкой в виде среднего значения является коэффициент детерминации , который измеряет долю дисперсии, совместно объясненной всеми независимыми переменными:

. (1.20)

. (1.21)

Если при добавлении новой переменной (при этом уменьшается на 1 число степеней свободы) увеличение доли объясненной регрессии мало, то скорректированный коэффициент детерминации может уменьшаться, следовательно, добавлять новую переменную не следует.

качество оценок для модели множественной линейной регрессии предполагает определение статистической значимости полученных коэффициентов уравнения регрессии и коэффициента детерминации .

Значимость коэффициентов уравнения регрессии оценивается с помощью критерия :

, (1.22)

где стандартные ошибки коэффициентов регрессии.

Величина имеет распределение Стьюдента с степенями свободы, где:

число пар данных в выборке, использованных для получения уравнения регрессии;

количество коэффициентов в уравнении регрессии.

Алгоритм оценки значимости для коэффициентов уравнения регрессии состоит в следующем:

) вычисляется наблюдаемое значение критерия ;

) по таблице распределения Стьюдента по заданному уровню значимости и числу степеней свободы находится критическое значение ;

) вычисленные критерии и сравниваются с критическим значением .

Если , то соответствующий коэффициент уравнения регрессии значим и принимается. Если , то соответствующий коэффициент уравнения регрессии незначим, не отличается от нуля и не принимается.

В эконометрике проверку гипотез осуществляют при 5%-м, реже на 10%-м уровне значимости. В первом случае стандартная ошибка оценки коэффициента регрессии составляет примерно до половины его величины. Последовательное исключение несущественных факторов (переменных), коэффициенты при которых оказались незначимы, составляют основу пошагового регрессионного анализа.

Для определения статистической значимости коэффициента детерминации используется статистика:

, (1.23)

где: число пар данных в выборке, использованных для получения уравнения регрессии;

количество коэффициентов в уравнении регрессии.

Величина имеет распределение Фишера с степенями свободы. Вычисленный критерий сравнивается с критической величиной следующим образом:

если , то считается незначимым, он не отличим от нуля;

если , то считается значимым, и уравнение регрессии может использоваться для объяснения изменения переменной под влиянием изменения переменных .

Величины критических значений критериев оценки значимости принимаются при 5%-м, реже при 10%-м уровне значимости. Указанные уровни значимости соответствуют 95%-му и 90%-му доверительным интервалам соответственно.

дополнительные аспекты использования метода наименьших квадратов (МНК):

. влияние мультиколлинеарности

Мультиколлинеарность — это коррелированность двух или нескольких объясняющих переменных в уравнении множественной линейной регрессии. При наличии мультиколлинеарности оценки, формально полученные методом наименьших квадратов (МНК), обладают недостатков:

1) небольшое изменение исходных данных приводит к существенному изменению оценок регрессии;

2) оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой (при больших коэффициентах детерминации ).

Если при оценке уравнения регрессии несколько факторов оказались незначимыми, то нужно выяснить наличие среди них факторов, сильно коррелированных между собой. При наличии корреляции один из пары связанных между собой факторов исключается. Если статистически незначим лишь один фактор, то он должен быть исключен или заменен другим показателем. В модель регрессии включаются те факторы, которые более сильно связаны с зависимой переменной, но слабо связаны с другими факторами.

. Спецификация переменных в уравнениях множественной линейной регрессии.

Построение эконометрической модели включает в себя обоснование решения о том, какие объясняющие переменные необходимо включить в уравнение множественной линейной регрессии, т.е. как правильно составить спецификацию модели, от которой в значительной степени зависят свойства оценок коэффициентов регрессии. здесь возможны две ситуации.

) В модели отсутствует переменная, которая должна быть включена.

Предположим, что переменная зависит от двух переменных. Однако в модель включена только одна независимая переменная :

В этом случае оценка и ее дисперсия являются смещенными. Смещенность оценки связана с тем, что при отсутствии второй переменной в регрессии переменная играет двойную роль: отражает свое прямое влияние и заменяет переменную в описании ее влияния. Для данной регрессии коэффициент детерминации , отражающий общую объясняющую способность переменной в обеих ролях, завышен.

) В модели включена переменная, которая не должна быть включена.

В этом случае оценки коэффициентов регрессии и их дисперсии являются несмещенными, но не эффективными. Если обнаруживается, что коэффициенты при излишних переменных статистически незначимы, то эти переменные исключаются из модели.

. основные проблемы идентификации и устранения проблем эндогенности (ошибок измерения) в факторах эконометрических моделей.

важным предположением регрессионных моделей является некоррелированность регрессоров и ошибок. Существует пять наиболее важных случаев, когда это предположение нарушено: пропущенные переменные, ошибки измерения, самоотбор, одновременность, серийная корреляция ошибок вместе с наличием лагированных значений зависимой переменной среди регрессоров.

Зависимость регрессоров и регрессионных ошибок возникает, если переменные, участвующие в модели, измеряются с ошибками (методические или инструментальные ошибки).

При наличии ошибок в измерениях зависимой переменной МНК-оценки остаются несмещенными и состоятельными, а наличие ошибок в измерениях независимых переменных приводит к возникновению корреляции между объясняющими переменными и ошибками и, как следствие, к смещенности и несостоятельности МНК-оценок.

факторы регрессионной модели называются экзогенными, если они некоррелированы со случайными ошибками. С учетом, стандартного для регрессионных моделей предположения о равенстве нулю математического ожидания случайных ошибок, это условие можно записать как , где x-вектор факторов регрессионной модели (причем, если в число факторов входит и константа, то такая формулировка включает в себя и условие равенства нулю математического ожидания случайных ошибок ).

Условие экзогенности может быть сформулировано также в более слабой форме: (слабая экзогенность).

Пусть — объясняемая переменная модели, а — некоторый набор факторов. Используется следующий вариант теста. На первом шаге оценивается МНК-регрессиярегрессияфакторов, полученных на первом шаге (или остатки регрессий, полученных на первом шаге). Если коэффициенты при дополнительных переменных совместно значимы (проверяется стандартными тестами — тест Вальда, F-тест, t-статистики), то регрессоры являются эндогенными.

Глава 2. Эконометрическая модель эффективности структуры кредитных активов и ресурсов коммерческих банков

.1 Математическая модель влияния структуры кредитных активов и кредитных ресурсов банков на уровень процентной прибыльности

В курсовой работе проводится построение, расчет и анализ эконометрической модели влияния структуры кредитных активов и кредитных ресурсов банков на уровень процентной прибыльности банков на примере опубликованных Национальным банком Украины в Интернет детальных xls — таблиц по интегральным показателям деятель 172 коммерческих банков банковской системы Украины за 2009 -2012 гг.[ ] .

экономическая модель процентной прибыльности банка от выполнения процентных операций (размещения кредитных активов и привлечения соответствующих объемов кредитных ресурсов) основана на разности процентов, полученных от кредитной деятельности, процентов, выплаченных за привлеченные кредитные ресурсы, а также уменьшения фактических объемов рабочих кредитов за счет создания внутренних резервов кредитного риска и внешних резервов для страхования привлеченных ресурсов, размещенных в национальном банке и фонде страхования депозитов. Процентная Прибыль банка является интервальным интегральным показателем:

(2.1)

где n — количество индивидуальных кредитов, действовавших и продолжающих действовать в интервале времени (t1- t0);

m — количество индивидуальных текущих и срочных привлеченных депозитов, действовавших и продолжающих действовать в интервале времени (t1- t0);

— текущая сумма i-го кредита;

— текущая сумма созданного внутреннего резерва риска под i — тый ;

— текущая сумма созданного внешнего резерва страхования ресурсов, привлеченных под i — тый кредит;

— текущая процентная ставка доходности по i-тому кредиту;

— текущая сумма привлеченного текущего или срочного j — того депозита;

— текущая процентная ставка затратности привлечения j — того депозита;

Для внешнего аналитика текущие параметры кредитов и депозитов банка являются недоступными и ежедневно обрабатываются во внутренних автоматизированных банковских системах, накапливая интегральные показатели процентной прибыли на отдельных счетах процентных доходов и расходов банка за период (t1 — t0).

опубликованные сводные таблицы результатов деятельности банков имеют 4 раздела, в которых помещены остатки на счетах банков на конец соответствующего отчетного периода и интегральные показатели доходов и расходов банка за отчетный период [ ]:

Активы банков;

Обязательства банков (привлеченные ресурсы);

Собственный капитал банков;

Результаты финансовой деятельности банков;

Информация о процентных ставках в отчетных таблицах — отсутствует.

Проведенный анализ данных, размещенных в таблицах [ ], позволяет по логике полного интегрального уравнения (2.1) создать линейную эконометрическую модель множественной регрессии влияния структуры кредитных активов и кредитных ресурсов банков на уровень процентной прибыльности банков следующего вида:

(2.2)

сумма чистых (без резервов) кредитов, выданных банкам на момент t1 (остатки балансовых счетов);

сумма чистых (без резервов) кредитов, выданных банкам на момент t0 (остатки балансовых счетов);

сумма чистых (без резервов) кредитов, выданных юрлицам на момент t0 (остатки балансовых счетов);

сумма чистых (без резервов) кредитов, выданных физлицам на момент t1 (остатки балансовых счетов);

сумма чистых (без резервов) кредитов, выданных физлицам на момент t0 (остатки балансовых счетов);

=

сумма срочных депозитов, привлеченных банком от других банков и долгосрочных инвесторов (субординированный долг и облигации) на момент t1 (остатки балансовых счетов);

=

сумма срочных депозитов, привлеченных банком от других банков и долгосрочных инвесторов (субординированный долг и облигации) на момент t0 (остатки балансовых счетов);

=

сумма срочных депозитов, привлеченных банком от юридических лиц на момент t1 (остатки балансовых счетов);

=

— сумма срочных депозитов, привлеченных банком от юридических лиц на момент t0 (остатки балансовых счетов);

=

сумма срочных депозитов, привлеченных банком от физических лиц на момент t1 (остатки балансовых счетов);

=

сумма срочных депозитов, привлеченных банком от физических лиц на момент t0 (остатки балансовых счетов).

В эконометрической модели сделаны следующие предположения:

. Платной ресурсной базой для выдачи кредитов банком являются следующие виды привлеченных ресурсов:

срочные депозиты, привлеченные от других банков;

привлеченный субординированный долг от инвесторов;

размещенные облигации, эмитированные банком;

срочные депозиты, привлеченные от юридических лиц;

срочные депозиты, привлеченные от физических лиц.

. Привлеченные текущие депозиты от банков, юридических и физических лиц в кредитной деятель не используются, они используются в платежной, валютообменной деятель банка с фиксацией результатов от их использования в отдельных регистрах доходности: доходы и расходы от комиссионных операций, доходы и расходы от валютообменных операций и операций с ценными бумагами, а также для создания объемов кассовой наличности и резервов риска.

. Для использования модели (2.2) для обработки результатов по разным банкам, а также по каждому банку за отдельные отчетные периоды (t1-t0), применяется масштабирование показателей кредитной и депозитной деятельности делением их на текущий объем активов валюты баланса в соответствующие периоды t1, t0.

(2.3)

таким образом, форма уравнений множественной регрессии выглядит следующим образом (факторные переменные Х 1 — Х 6 в % от суммы активов валюты баланса, результирующая переменная Y в % от суммы активов валюты баланса):

(2.4)

где — количество экспериментальных точек наблюдения за результатами деятель выборки k-банков за n — периодов деятельности (t1-t0);

искомые постоянные коэффициенты уравнения регрессии;

средняя относительная сумма чистых (без резервов) кредитов, выданных банкам на момент t1- t0;

;

— средняя относительная сумма чистых (без резервов) кредитов, выданных юридическим лицам на момент t1- t0;

;

средняя относительная сумма чистых (без резервов) кредитов, выданных физическим лицам на момент t1- t0;

;

средняя относительная сумма срочных депозитов, привлеченных банком от банков и инвесторов на момент t1-t0 .

;

средняя относительная сумма срочных депозитов, привлеченных банком от юридических лиц на момент t1-t0 .

.

средняя относительная сумма срочных депозитов, привлеченных банком от физических лиц на момент t1-t0 .

2.2 Построение модели многофакторной регрессии в пакете IBM SPSS -21

В табл. 2.1 представлен фрагмент таблицы исходных данных в пакете SPSS -21 факторных и результирующих параметров уравнений (2.4) для первых 55 банков рейтинга банковской системы Украины за 2009 — 2012 гг. (220 точек наблюдения).

Таблица 2.1 Фрагмент таблицы исходных данных для эконометрической функции

В табл. 2.2 представлены идентификаторы и их обозначения в таблицах расчета.

Таблица 2.2 Идентификаторы исходных данных для эконометрической функции

На рис. 2.1 — 2.5 приведены интерфейсы управления расчетом линейной множественной регрессии в SPSS-21 с сохранением модели для выполнения после-дующего имитационного моделирования:

головное подменю "анализ" — "Линейная регрессия";

подменю "Линейная регрессияподменю "Линейная регрессияподменю "Линейная регрессияподменю "Линейная регрессияпараметры".

Рис. 2.1. Интерфейс управления расчетом линейной регрессии в SPSS-21 (головное подменю "анализ" — "Линейная регрессия")

1. методы отбора переменных для линейной регрессии (рис.2.1).

Выбор метода отбора позволяет задать то, каким образом независимые переменные включаются в анализ:

Принудительный ввод (Регрессионный анализ). Процедура отбора переменных, при которой все переменные блока вводятся за один шаг.

Шаговый. На каждом шаге в уравнение включается новая независимая переменная с наименьшей вероятностью F, при условии, что эта вероятность достаточно мала. Переменные, уже введенные в регрессионное уравнение, исключаются из него, если их вероятность F становится достаточно большой. Алгоритм останавливается, когда не остается переменных, удовлетворяющих критерию включения или исключения.

Блочное исключение. Процедура отбора переменных, при которой все переменные блока исключаются на одном шаге.

Отбор исключением. Процедура отбора переменных, при которой все переменные вводятся в уравнение, а затем последовательно исключаются из него. Первым кандидатом на исключения считается переменная, имеющая наименьшую частную корреляцию с зависимой переменной. Если она удовлетворяет критерию исключения, ее удаляют. Следующим кандидатом на исключение становится переменная, имеющая наименьшую среди оставшихся переменных частную корреляцию с зависимой переменной. Процедура останавливается, когда не остается переменных, удовлетворяющих критерию исключения.

Последовательный выбор. Шаговая процедура отбора переменных, при которой переменные последовательно включаются в модель. Первым кандидатом на ввод служит переменная с наибольшим модулем корреляции с зависимой переменной. Если эта переменная удовлетворяет критерию ввода, она включается в модель. Если первая переменная включена в модель, то следующим кандидатом на включение среди оставшихся вне модели переменных становится переменная, имеющая наибольшую частную корреляцию. Процедура останавливается, когда не остается переменных, удовлетворяющих критерию ввода.

Рис. 2.2. Интерфейс управления расчетом линейной регрессии в SPSS-21 (подменю "Линейная регрессия

Рис. 2.3. интерфейс управления расчетом линейной регрессии в SPSS-21 (подменю "Линейная регрессия

2. Графики процедуры Линейная регрессияМожно построить следующие графики:

Диаграммы рассеяния. Можно строить диаграммы для любой пары переменных из следующего списка: зависимая переменная, стандартизованные предсказанные значения, стандартизованные остатки, удаленные остатки, скорректированные предсказанные значения, стьюдентизированные остатки, стьюдентизированные удаленные остатки. Для проверки линейности и равенства дисперсий строится график стандартизованных остатков против стандартизованных предсказанных значений.

список исходных переменных. В список входят зависимая переменная (DEPENDNT) и следующие предсказываемые и переменные остатков: стандартизованные предсказанные значения (*ZPRED), стандартизованные остатки (*ZRESID), удаленные остатки (*DRESID), скорректированные предсказанные значения (*ADJPRED), стьюдентизированные остатки (*SREZID), стьюдентизированные удаленные остатки (*DRESID).

Выдать все частные графики. Выводятся диаграммы рассеяния остатков для всех пар переменных, состоящих из зависимой переменной и одной независимой переменной. Остатки получаются при раздельном построении регрессионных моделей для каждой переменной из пары по всем остальным независимым переменным.

Графики стандартизованных остатков — гистограммы стандартизованных остатков и нормальные вероятностные графики, сравнивающие распределение стандартизованных остатков с нормальным распределением.

Рис. 2.4. Интерфейс управления расчетом линейной регрессии в SPSS-21 (подменю "Линейная регрессия

Рис. 2.5. интерфейс управления расчетом линейной регрессии в SPSS-21(подменю "Линейная регрессияпараметры")

Анализ результатов построения множественной регрессии

. анализ гистограмм распределения входных и выходных массивов

Таблица 2.3. Описательная статистика рядов факторов, результатов и оценок регрессионной модели

Рис. 2.6. Фактическая гисторамма распределения входного фактора Х 1 и модель его нормального распределения (построено в пакете SPSS -21, модуль "анализ" — "Описательная статистика")

Рис. 2.7. Фактическая гисторамма распределения входного фактора Х 2 и модель его нормального распределения(построено в пакете SPSS -21, модуль "анализ" — "Описательная статистика")

Рис. 2.8. Фактическая гисторамма распределения входного фактора Х 3 и модель его нормального распределения (построено в пакете SPSS -21, модуль "анализ" — "Описательная статистика")

Рис. 2.9. Фактическая гисторамма распределения входного фактора Х 4 и модель его нормального распределения (построено в пакете SPSS -21, модуль "анализ" — "Описательная статистика")

Рис. 2.10. Фактическая гисторамма распределения входного фактора Х 5 и модель его нормального распределения (построено в пакете SPSS -21, модуль "анализ" — "Описательная статистика")

Рис. 2.11. Фактическая гисторамма распределения входного фактора Х 6 и модель его нормального распределения (построено в пакете SPSS -21, модуль "анализ" — "Описательная статистика")

Рис. 2.12. Фактическая гисторамма распределения входного результата Y и модель его нормального распределения (построено в пакете SPSS -21, модуль "анализ" — "Описательная статистика")

Результаты построения множественной корреляции

Таблица 2.3 Выходные таблицы построения множественной регрессии в пакете SPSSІ-21 (режим "Исключение принудительно введенных всех 6 факторов модели"). Часть 1. Описательная статистика. Парная корреляция факторов и результата

Таблица 2.4 Выходные таблицы построения множественной регрессии в пакете SPSSІ-21 (режим "Исключение принудительно введенных всех 6 факторов модели") Часть 2. Исключенные программой переменные в уравнении регрессии

Таблица 2.5 Выходные таблицы построения множественной регрессии в пакете SPSSІ-21 (режим "Исключение принудительно введенных всех 6 факторов модели") Часть 3. Сводка для последовательных моделей исключения переменных. Дисперсионный анализ

Таблица 2.6 Выходные таблицы построения множественной регрессии в пакете SPSSІ-21 (режим "Исключение принудительно введенных всех 6 факторов модели") Часть 4. Сводка полученных постоянных коеффициентов для последовательных моделей исключения переменных.

Выходная регрессионная модель эконометрической функции (фактор Х 4 — исключен):

Обозначения в таблицах вывода результатов расчетов пакета SPSS-21:

1.Observed value — исходная функция результата

;

2.Predicted Value — прогнозируемая по уравнению регрессии оценка функции результата

;

3.Residuals — нестандартизованные остатки регрессии (оценка случайной переменной ):

.Среднеквадратический (RMS) остаток. Для вычисления среднеквадратического остатка все отдельные остатки возводятся в квадрат, суммируются, сумма делится на общее число остатков, затем из всего извлекается квадратный корень.

.стандартный остаток регрессии:

6.Std.Err.Pred.Val. — стандартизованные остатки прогнозируемой функции результата Predicted Value (текущий остаток отнесенный к cреднеквадратической (RMS) ошибке):

Таблица 2.7 Выходные таблицы построения множественной регрессии в пакете SPSSІ-21 (режим "Исключение принудительно введенных всех 6 факторов модели") Часть 5. Диагностика выбросов. Сводка полученных остатков модели

2.3 Анализ состоятельности и адекватности эконометрической модели основным гипотезам МНК-оценок

эконометрический регрессионный прибыльность Анализ исходных данных и результатов построения множественной регрессии показывает:

1.Корреляция между значениями исходных факторов Х 1 — Х 6 (табл. 2.3) не превышает значения 0,355, что характеризует низкий уровень или отсутствие мультиколлинеарности между исходными факторами модели (максимальные значения):

К парн.корел.= 0,355 между Х 2-Х 5;

К парн.корел.= 0,294 между Х 3-Х 5;

К парн.корел.= — 0,240 между Х 4-Х 6;

К парн.корел.= — 0,118 между Х 2-Х 1;

К парн.корел.= — 0,117 между Х 3-Х 1;

К парн.корел.= — 0,103 между Х 4-Х 1.

2. Значение коеффициента детерминации R2= 0,222 — что соответствует среднему уровня плотности корреляционной связи (табл.2.5). Показатель статистики Фишера — F = 12, 217 (табл.2.5), что при количестве наблюдений n =220 и количестве переменных m = 5 больше критического значения по таблицам [ ] Fкрит = 2,51. таким образом, построенная регрессия является значимой.

. В соответствии с предпосылками МНК остатки должны быть случайными, т.е. должна отсутствовать автокорреляция остатков. Автокорреляция в остатках может быть вызвана несколькими причинами, имеющими различную природу (ошибки в исходных данных, ошибки спецификации модели).

Расчетное об отсутствии автокорреляции остатков [ ]. Построенные на рис. 2.13 — 2.14 гистограммы предсказанных значений и остатков модели подтверждают близкий к нормальному характер распределения остатков.

На рис. 2.15 — 2.16 приведены графики рассеивания остатков между экспериментальными и модельными (по регрессионному уравнению) значения результирующего фактора Y, которые подтверждают отсутствие трендов, т.е. случайный характер остатков.

Рис. 2.13. Фактическая гисторамма распределения регрессионной модели результата Yрасч и модель его нормального распределения (построено в пакете SPSS -21, модуль "анализ" — "Описательная статистика")

Рис. 2.14. Фактическая гисторамма распределения остатков результатов Y — Yрасч и модель его нормального распределения (построено в пакете SPSS -21, модуль "анализ" — "Описательная статистика")

Рис. 2.15. анализ графика экспериментальной функции Y и расчетной (по регрессии) функции Yрасч

Рис. 2.16. анализ графика остатков между экспериментальной и расчетной (по регрессии) функциями Y-Yрасч

Глава 3. Применение имитационного моделирования в пакете IBM SPSS -21 для анализа влияния ошибок экзогенности в основных факторах эконометрической модели

.1 Подготовка эконометрической модели к имитационному моделированию в пакете IBM SPSS -21

одной из особенностей пакета IBM SPSS -21 является реализация в нем статистического имитационного моделирования по методу Монте-Карло.

Прогнозные модели, например линейная регрессияисхода или целевого значения. Во многих реальных применениях значения входных данных не являются определенными. Имитация позволяет учесть неопределенность входных данных прогнозных моделей и оценить вероятность различных исходов модели в присутствии этой неопределенности. Так, в рассматриваемой модели влияния структуры основных кредитных и депозитных агрегатов в балансе банка на показатель процентной прибыльности банка существуют неопределенности, связанные с неучетом процентных политики индивидуальных ставок кредитов и депозитов для отдельных банков в выборке. Для моделирования этой неопределенности и определения ее влияния на Прибыль можно воспользоваться имитацией.

Для имитации в IBM® SPSS® Statistics -21 используется метод Монте-Карло. Неопределенные входные данные моделируются с определенными распределениями вероятности (например, нормальным или треугольным распределением). Имитированные значения этих входных данных создаются, исходя из этих распределений. Входные данные, значения которых известны, остаются постоянными. Прогнозная модель оценивается при помощи имитированного значения для всех неопределенных входных данных и фиксированных значений для известных входных данных. На их основе рассчитывается целевое множество раз (обычно десятки тысяч или сотни тысяч раз). В результате получается распределение целевых значений, которое можно использовать для ответа на вопросы о вероятностях. В контексте SPSS Statistics при каждом повторе процесса создается отдельное наблюдение (запись) данных, которое состоит из набора имитированных значений для неопределенных входных данных, фиксированных значений и прогнозного целевого значения (или значений) модели.

Чтобы выполнить имитацию, необходимо указать подробные сведения, такие как прогнозную модель, распределения вероятности для неопределенных входными данных, корреляции между этими входными значениями и фиксированными значениями. При выполнении регрессионного анализа в пакете SPSSІ- 21 такая необходимая информация передается в виде.xml файла модели из блока "регрессияпосле указания всех сведений для имитации можно выполнить ее и дополнительно сохранить ее характеристики в файл плана имитации.

Конструктор имитаций (Simulation Builder) представляет собой расширенный интерфейс для пользователей, которые разрабатывают и выполняют имитации. Он обеспечивает полный набор возможностей: разработка имитации, сохранение ее характеристик в файл плана имитации, указание вывода и запуск имитации.

порядок разработки имитации на основе файла модели (рис.3.1):

. Выбор в меню: "анализ > Имитация…"

. Щелкнуть Выбрать файл модели SPSS, затем щелкнуть Продолжить.

. Открыть нужный файл модели.

Файлом модели может быть XML-файл или архив ZIP, который содержит PMML, созданный из IBM® SPSS® Statistics или IBM® SPSS® Modeler.

Рис. 3.1. интерфейс загрузки модели имитации в пакете SPSS-21

. На вкладке "Имитация" (в конструкторе имитаций) указать распределения вероятности для имитированных входящих данных и фиксированных значений. Если в активном наборе данных содержатся исторические данные для имитированных входов, щелкните Подогнать все для автоматического определения наиболее подходящего распределения для каждого входящего значения, а также для определения корреляций между ними (рис.3.2).

чтобы выполнить имитацию, каждое входящее значение в прогнозной модели должно быть указано как фиксированное или имитированное. Имитированные входные значения являются неопределенными и создаются на основе указанного распределения вероятностей. Наиболее подходящие распределения для имитированных входных данных и корреляции между ними можно автоматически определить из исторических данных для них.

Рис. 3.2. Интерфейс пункта "Смоделированные поля" конструктора модели имитации в пакете SPSS-21

наиболее подходящее распределение и связанные с ним параметры отображаются в столбце "Распределение" вместе с диаграммой распределения поверх гистограммы (или столбиковой диаграммы) исторических данных. Корреляции между имитированными входными данными отображаются в настройках корреляций.

Значки в "Подогнать по столбцу" указывают статус подгонки для каждого поля входных данных.

Для входных данных не указано распределение и входные данные не указаны как фиксированные. чтобы выполнить имитацию, необходимо указать распределение для этих входных данных или определить их как фиксированные и указать Наиболее подходящее распределение заменено альтернативным распределением из диалогового окна "Детали подгонки".

Входные данные установлены для наиболее подходящего распределения.

Рис. 3.3. Интерфейс пункта "Корреляция" конструктора модели имитации в пакете SPSS-21

Корреляции (имитация) — Входные данные для прогнозных моделей часто коррелируют. Корреляции между входными данными, которые будут имитированы, должны быть учтены, чтобы обеспечить их сохранение в имитированных значениях. пересчитать корреляции при подгонке. Этот параметр позволяет автоматически рассчитать корреляции между имитированными входными данными при подгонке распределений к активному набору данных посредством действий. Подогнать все в настройках "Имитированные поля". Не пересчитывать корреляции при подгонке. выберите этот параметр, если необходимо вручную указать корреляции значения, в сетке "Корреляции", должны быть в диапазоне между -1 и 1. Значение 0 указывает на отсутствие корреляции между связанными парами входных данных.

Дополнительные параметры (имитация):

1. Максимальное количество наблюдений. Указывает максимальное количество наблюдений имитированных данных, а также связанных целевых значений для создания. Если указан анализ чувствительности, это значение является максимальным значением для каждой итерации.

2. Цель для критерия останова. Если прогнозная модель содержит больше одного целевого значения, то можно выбрать цель, для которой будут применяться критерии остановки.

3. Критерий остановки. Эти выборы определяют критерий для остановки имитации, потенциально до генерации максимально разрешенного количества наблюдений.

Продолжать до достижения максимума. Указывает на то, что имитированные наблюдения будут сформированы до достижения максимального количества.

Остановить при выборке хвостов. Воспользуйтесь этим параметром для гарантии адекватной выборки одного из хвостов указанного целевого распределения. Имитированные наблюдения будут созданы до завершения выборки хвоста или до достижения максимального количества наблюдений.

— Тип. Можно определить границы региона хвоста, указав целевое Частота. Укажите количество целевых значений, которые должны лежать в области хвоста, чтобы обеспечить адекватную выборку хвоста. Генерирование наблюдений остановится, когда это количество будет достигнуто.

Остановиться, когда доверительный интервал среднего в пределах указанного порогового значения. Воспользуйтесь этим параметром, чтобы обеспечить заданную степень точности среднего целевого значения. Имитированные наблюдения будут созданы до достижения указанной степени точности или максимального количества наблюдений. чтобы воспользоваться этим параметром, укажите доверительный интервал и пороговое указанным уровнем, находится в пределах порогового значения.

Тип порога. Порог можно указать как числовое количество наблюдений для выборки. Указывает количество наблюдений для использования при автоматической подгонке распределений для имитированных входных данных в соответствии с активным набором данных.

Критерий статистики согласия (количественный). Для количественных входных данных можно использовать тест согласия статистики Андерсона-Дарлинга или тест Колмогорова-Смирнова для ранжирования распределений при их подгонке для имитированных входных значений в соответствии с активным набором данных. Тест Андерсона-Дарлинга выбирается по умолчанию и в особенности рекомендуется, когда необходимо обеспечить наилучшую возможную подгонку в областях хвоста.

Эмпирическое распределение. Для количественных входных данных эмпирическое распределение является кумулятивной функцией распределения исторических данных. Можно указать количество интервалов, которые используются для расчета эмпирического распределения для количественных входных данных. По умолчанию задано Воспроизвести результаты. Задание стартового числа генератора псевдослучайных чисел позволяет воспроизвести имитацию. Задайте целое число или щелкните по Генерировать, чтобы сгенерировать псевдослучайное целое число в диапазоне между 1 и 2147483647 включительно. Значение по умолчанию равно 498654860.

Рис. 3.5. интерфейс пункта "Функции плотности" конструктора модели имитации в пакете SPSS-21

Функции плотности (имитация) — Эти настройки позволяют настроить вывод для функций плотности вероятности и кумулятивных функций распределения для количественных целей, а также столбиковые диаграммы прогнозных значений для категориальных целей.

Функция плотности вероятности (Probability Density Function, PDF). Эта функция показывает распределение целевых значений. Для количественных целевых значений она позволяет определять вероятность того, что они находятся в данной области.

Опорные линии (количественные). Для функции плотности вероятности и кумулятивных функций распределения для количественных целевых значений можно добавить вертикальные опорные линии.

Сигмы. Можно добавить опорные линии с амплитудой указанного количества стандартных отклонений от среднего целевого значения.

Процентили. Можно добавить опорные линии в одном или двух значениях процентилей распределения для каждого целевого значения в текстовых полях "Нижняя" и "Верхняя".

значения категории для отчета. Для моделей PMML с категориальными целевыми значениями результатом модели является набор прогнозных вероятностей (по одной для каждой категории) того, что целевое используется при создании столбикового графика, описанного для настройки Функция плотности вероятности выше. Если выбрано Предсказанная категория, то будет создана столбиковая диаграмма. Если выбрать Предсказанные вероятности, то для каждой из категорий целевого значения создаются гистограммы распределения.

Группирование для анализа чувствительности. Имитации, которые включают анализ чувствительности, создают независимый набор предсказанных целевых значений для каждой итерации, определенной анализом (варьируется одна итерация для каждого значения входных данных).

Рис. 3.6. интерфейс пункта "Вывод" конструктора модели имитации в пакете SPSS-21

Диаграммы функций плотности вероятности для непрерывных целевых переменных. Эта диаграмма имеет две скользящих вертикальных опорных линии, которые разделяют ее на отдельные области. В таблице ниже на диаграмме показана вероятность того, что целевое значение находится в каждой из областей. Если на одной диаграмме отображаются несколько функций плотности, то таблица имеет отдельную строку для вероятностей, связанных с каждой функцией плотности.

Кумулятивная функция плотности для непрерывных целевых переменных. Эта диаграмма имеет такие же две перемещаемые вертикальные опорные линии и связанную таблицу, описанную для функции плотности вероятности на диаграмме выше.

Столбиковые диаграммы для категориальных целевых значений с итерациями анализа чувствительности. Для категориальных целевых значений с итерациями анализа чувствительности результаты для прогнозной категории целевых значений отображаются в виде кластеризованной столбиковой диаграммы, которая включает результаты всех итераций.

Ящичные диаграммы для нескольких целевых значений с итерациями анализа чувствительности. Для прогнозных моделей с несколькими количественными целевыми значениями и итерациями анализа чувствительности в результате выбора отображения ящичных диаграмм для всех целевых значений на одной диаграмме создается кластеризованная ящичная диаграмма.

Рис. 3.7. интерфейс пункта "Сохранение" конструктора модели имитации в пакете SPSS-21

3.2 Результаты имитационного моделирования МНК — оценок уравнения многофакторной регрессии эконометрической модели

В табл. 3.1 — 3.2 и на графике рис. 3.8 представлены результаты проведенного в пакете SPSS -21 имитационного моделирования.

Таблица 3.1 Выходные данные имитации регрессионного уравнения

.Автоматический подбор распределений исходных факторов

2.Оценка корреляции между входными факторами модели в имитации

Таблица 3.2 Сводка результатов имитации регрессионного уравнения

Рис. 3.8. Плотность вероятности распределения целевой функции Y модели имитации в пакете SPSS-21

3.3 влияние ошибок в измерении неслучайных факторов эконометрической модели на смещенность и несостоятельность МНК — оценок

В курсовой работе для анализа влияния ошибок в измерении неслучайных факторов эконометрической модели на смещенность и несостоятельность МНК — оценок проведен совместный анализ результатов построения 3-х регрессий и проведения с ними процедуры имитационного моделирования:

.Полная регрессионная модель №1 (5 переменных):

.Усеченная регрессионная модель № 2 (3 переменных — учет влияния только относительной структуры кредитов)

.Неполная регрессионная модель № 3 (3 переменных — учет влияния только относительной структуры кредитов + 1 переменная Х 6 — неучет влияния депозитов юридических лиц Х 5)

В результате выполнения расчетов в блоке "регрессияа) Полная регрессионная модель №1

б) Усеченная регрессионная модель № 2

в) Неполная регрессионная модель № 3

В табл. 3.3 — 3.4 приведены показатели расчетов множественной регрессии для моделей № 2 и № 3, которые имитируют ошибки в независимых факторах модели (неучет существенных переменных).

Таблица 3.3 показатели Усеченная регрессионная модель № 2

Таблица 3.4 показатели Неполная регрессионная модель № 3

В табл. 3.5 и на графиках рис. 3.9 — 3.11 приведены сравнительные характеристики распределений предсказанных результатов и остатков для моделей №1 (R2=0,204), №2(R2=0,065) и №3(R2=0,206), а также результатов имитационного моделирования в SPSS — 21 с этими моделями.

Таблица 3.5 Частотный анализ вариантов полной Yрасч=F(x1,x2,x3,х 5,x6) и неполных Yрасч=F(x1,x2,x3), Yрасч=F(x1,x2,x3,x6) регрессионных моделей

Рис. 3.9. Гистограммы распределения экспериментальных исходных факторов Х 1 -Х 6

Рис. 3.10. Регрессионная полная модель № 1 функций Yрасч, остатков Y-Yрасч и имитационного моделирования Yрасч

Рис. 3.11. Регрессионные модели № 2,3 функций Yрасч, остатков Y-Yрасч и имитационного моделирования Yрасч

Таблица 3.6 Статистика остатков вариантов полной Yрасч=F(x1,x2,x3,х 5,x6) и неполных Yрасч=F(x1,x2,x3), Yрасч=F(x1,x2,x3,x6) регрессионных моделей

а) модель №1

б) модель №2

в) модель №3

Как показывает сравнительный анализ результатов моделирования, приведенных в табл. 3.6 и на рис. 3.10 — 3.11:

.При уменьшении факторов в уравнении множественной регрессии с 5-ти до 3-х:

существенно изменяется свободный член ;

сужается среднеквадратическое отклонение прогнозируемого результата с 1,3969 (для 5) до 1,3468(4) и до 0,8284(3), а также, соответственно, сужается разброс гистограммы прогнозируемого результата (рис.3.11);

расширяется среднеквадратическое отклонение остатков прогнозируемого результата с 2,6145 (для 5) до 2,6407(4) и до 2,8462(3);

меняется структура гистограммы остатков относительно "нуля" — при равенстве "нулю" матожиданий остатков, при переходе от полной модели №1 (5 факторов) к урезанной модели №3 (3 фактора) принулевой пик гистограммы остатков смещается с положительного направления на отрицательное направление.

2. При имитационном моделировании в урезанной модели №2(3 фактора) возникает смещение влево пика вероятностной гистограммы относительно матожидания, что свидетельствует о вероятном смещении оценок в регрессионной модели МНК за счет ошибок измерения неучтенных факторов. Также модельная гистограмма значительно шире гистограммы остатков модели относительно измеренных результатов.

. Аналогично при имитационном моделировании в неполной модели №3 (4 фактора) возникает небольшое смещение вправо пика вероятностной гистограммы относительно матожидания, что свидетельствует о вероятном смещении оценок в регрессионной модели МНК за счет ошибок измерения неучтенных факторов, однако в меньшей мере, чем в модели №2.

Выводы

В курсовой работе построена множественная линейная регрессиясистемы Украины в 2009 — 2012 гг. (220 точек наблюдения).

Построенная в среде компьютерного пакета IBM SPSS -21 множественная линейная регрессиятеореме Гаусса — Маркова, а также на оптимальность количества определяющих факторов модели (от 6-ти до 3-х).

При использовании имитационного моделирования как аналитического этапа пакета SPSSІ-21 в процессе анализа несмещенности и состоятельности МНК — оценок за счет ошибок измерения или неучета существенных факторов в уравнении множественной регрессии удается выявить эффекты несовпадения форм и искажение пиков вероятностных диаграмм распределения результирующего (целевого) параметра модели в сравнении с формой и разбросом гистограммы остатков для ограниченного числа экспериментальных данных.

таким образом, совпадение форм и пиков вероятностных диаграмм распределения результирующего (целевого) параметра модели в сравнении с формой и разбросом гистограммы остатков для ограниченного числа экспериментальных данных позволяет предполагать отсутствие существенных ошибок в измерении факторов модели, а также отсутствие существенных факторов в модели множественной регрессии.

список использованной литературы

. Бабешко Л.О. Основы эконометрического моделирования: учебное пособие / Л.О. Баббешко. — М.: Комкнига, 2006. — 432 с.

. Бородачев С.М. Эконометрическое моделирование:учебное пособие/С.М. Бородачев.- Екатеринбург: УрФУ, 2013. -61 с.

. Доугерти К. Введение в эконометрику: Пер. с англ. / К.Доугерти.- М.: ИНФРА-М, 1999. — 402 с.

. Дрейпер Н. Прикладной регрессионный анализ. Множествен-ная регрессия = Applied Regression Analysis. / Н.Дрейпер, Г.Смит. — 3-е изд. — М.: "Диалектика", 2007. — 912 c.

. Елисеева И.И. Эконометрика: учебник./ И.И. Елисеева, С.В. Курышева, Т.В. Костеева — М.: финансы и статистика, 2006. — 576 с.

. Емельянов А.А. Имитационное моделирование экономических процессов: учеб. пособие для студентов, обучающихся по специальности "Прикладная информатика" / А.А. Емельянов, Е.А. Власова, Р.В. Дума; под ред. А.А. Емельянова. — М.: финансы и статистика, 2004. — 368 с.

. Кремер Н.Ш. Эконометрика./ Н.Ш. Кремер, Б.А. Путко. — М.: Юнити-Дана, 2003-2004. — 311 с.

. Лазарев Ю. Моделирование процессов и систем в MATLAB. Учебный курс. / Ю.Лазарев. — СПб.: Питер; Киев: Издат. группа BHV, 2005. — 512 с.

. Лоу. А.М. Имитационное моделирование / А.М. Лоу, В.Д. Кельтон; пер. с англ. А. Куленко под ред. В.Н. Томашевского. — 3-е изд. — М. ; СПб. ; Нижний Новгород [и др.]: Питер, 2004. — 847 с.:

11. Магнус Я.Р. Эконометрика. начальный курс./ Я.Р. Магнус, П.К. Катышев, А.А. Пересецкий — М.: Дело, 2007. — 504 с.

. Радченко С.Г. Методология регрессионного анализа: Монография. / С.Г. Радченко. — К.: "Корнийчук", 2011. — 376 c.

. Строгалев В.П. Имитационное моделирование./ В.П. Строгалев,

И.О. Толкачева. — МГТУ им. Баумана, 2008. — 697 c.

. Харин Ю.С. Эконометрическое моделирование: Учеб. пособие / Ю.С. Харин, В.И. Малюгин, А.Ю. Харин. — Мн.: БГУ, 2003. — 313 с.

. Хемди А. Таха Глава 18. Имитационное моделирование // Введение в исследование операций = Operations Research: An Introduction. / Хемди А. Таха — 7-е изд. — М.: "Вильямс", 2007. — 737 c.

. IBM SPSS Statistics Base 21 — электронное описание работы с блоком "Статистический анализ" в пакете IBM SPSS 21 / Copyright IBM Corporation, 2012. — 385 с. (HTTP://www.ibm.com/software/products/ru/spss-stats-base/ý)

17. HTTP://www.bank.gov.ua — Официальный Интернет-сайт Национального банка Украины, 2014

Учебная работа. Применение имитационного моделирования к сравнению методов оценивания и анализу их точности