Учебная работа. Матричные паттерны проектирования решений

Матричные паттерны проектирования решений

Матричные паттерны проектирования решений

А.М. Алексеева, Н.А. Клюжев

измерять, что измеримо, делать измеримым то, что, ещё не измеримо. Галилео Галилей

Предложенная в статье авторами методика получения оценок, непосредственно используемых в процедурах проектирования управленческих решений в сферах менеджмента различного уровня, отличается новизной и актуальностью, поскольку не имеет аналогов в литературе и отражает новый подход в прикладном использовании модели многофакторной линейной регрессии.

Управленческие задачи в экономике предполагают проверку гипотез, извлечённых из экономических теорий или воззрений относительно некоторого объекта. С этой целью применяются эконометрические методы, например, одномерного или двумерного статистического анализа, чтобы оценить некоторые существенные параметры объекта, необходимые для его понимания или принятия решений о его управляемом поведении. По этой причине на практике для убедительной проверки некоторой конкурирующей гипотезы опираются на анализ данных, что требует многомерного анализа, сущность которого в одновременном учёте взаимосвязей между более чем двумя переменными.

Важной составляющей многомерного анализа является регрессионный анализ по методу наименьших квадратов. В многофакторной регрессии используются несколько факторов, статистически взаимосвязанных между собой и с результативным признаком (результатом). В нашей работе показано, как, используя экономические данные, представленные в матричной (табличной) форме, можно получить важные количественные оценки для модели гипотетического линейного соотношения между несколькими экономическими показателями (факторами объясняющими переменными, и результатом — объясняемой переменной). Форму нашего подхода отражает понятие «паттерн» (анг. рattern): модель или шаблон; образец или пример; система или структура. Любой паттерн представляет собой формализованное описание часто встречающейся задачи совместно с указанием алгоритма удачного решения данной задачи, а также рекомендации по применению этого решения в различных ситуациях. Сообразное использование паттерна дает его пользователю ряд неоспоримых преимуществ. В науке, в том числе в математике, паттерны выявляются путем исследования.

Основная задача нашей статьи — это продемонстрировать положение, что вся необходимая для регрессионного анализа информация содержится в ковариационной матрице данных и производных от неё матриц-паттернов проектирования решений, и наглядно показать, как формируется матричная линейная модель для решения прямой и обратной задачи многофакторной регрессии. Под прямой задачей понимается оценка приращения результата вследствие заданных приращений факторов с учётом из статистической взаимосвязи, а под обратной задачей — оценка приращений факторов при заданном приращении результата. Отметим, что в методике применяемого сегодня линейного многофакторного регрессионного анализа обратная задача вообще не решается, несмотря на её практическую важность, а в решении прямой задачи не учитывается взаимосвязь факторов. Причина этого в экономической интерпретации коэффициента регрессии как коэффициента пропорциональности между приращением результата и приращением данного фактора при условии, что остальные факторы не варьируются и равны своим средним значениям. Такое моделирование экономических процессов ограничивает практическую значимость модели линейной регрессии в процедурах оценивания и принятия управленческих решений во всех сферах менеджмента.

Изложение методики решения сформулированных выше задач демонстрируется конструктивным примером, что способствует практическому усвоению темы данной работы.

Пример. В табл. 1 представлены центрированные значения индексов цен (%)производителей промышленных товаров по Российской Федерации за 15 лет (1998-2012 гг.). В таблице: промышленные товары (среднее 118,584%); добыча полезных ископаемых (среднее 127,847%); обрабатывающие производства (среднее 117,073%); Производство и распределение электроэнергии, газа и воды (среднее 116,006%).

Таблица 1

Центрированные значения индексов цен

№ nn№ nn1-29,1514,35-13,830,819-26,25-3,73-5,71-8,21297,3550,481,7052,071024,450,87-2,756,49321,257,6925,5713,3411-66,25-15,151,99-25,584-23,85-10,8011,38-10,251221,35-11,192,28-4,735-2,05-3,8810,00-0,9313-10,75-0,17-2,19-1,926-26,05-1,28-1,56-6,0414-1,55-8,75-10,92-6,57736,854,38-3,5610,2515-18,55-13,85-9,04-13,4483,15-8,93-3,42-5,23

Построим первый паттерн с именем — ковариационная матрица задачи (см. табл. 2).

Таблица 2

паттерн Ковариационная матрица задачи

1332,773156416,51747661,76125333556,1230133 =416,5174756245,558228,239997333245,135549361,761253338,2399973390,62538429,87230267556,1230133245,13554929,87230267278,5626107

Ковариационная матрица является симметрической матрицей и соответствует матрице второго дифференциала минимизируемой функции метода наименьших квадратов (МНК).

Диагональные элементы матрицы равны дисперсиям переменных, а вне диагонали стоят значения ковариаций элементов на пересечении й строки и го столбца матрицы.

Построим второй паттерн с именем — Матрица парных коэффициентов регрессии (см. табл. 3). Для этого разделим все элементы первой строки на элемент , второй строки на и так далее до последней строки ковариационной матрицы. В результате получаем матрицу, составленную из коэффициентов регрессии модели парной линейной регрессии переменной с индексом j на переменную с индексом i. например, , что позволяет количественно оценить приращение фактора за счёт приращения фактора . Элементы последнего столбца равны коэффициентам регрессии результата на фактор , т.е. . Элементы последней строки равны коэффициентам регрессии , например, . В общем случае парная регрессия означает, что по значениям переменной с индексом i можно статистически оценить

Таблица 3

10,3125194060,0463404090,417267568B=1,6962066110,033556190,998278740,6815005970,09092372310,3296240121,9964022160,8800016220,1072373011

Покажем основное свойство паттерна B, предположив, что нам известны коэффициенты регрессии трехфакторной линейной регрессии для центрированных переменных: . доказательство:

Для суммы справа выполняется равенство , которое совпадает с м уравнением нормальной системы алгебраических уравнений стандартизованной форме. Тогда получаем, что

Доказанное свойство паттерна B позволяет вычислить вектор .

Для этого выделим в паттерне B подматрицы и составим систему уравнений:

.

Решая эту систему уравнений, получаем вектор

.

таким образом, данные в паттерне B с применением алгоритма решения системы алгебраических уравнений в матричной форме дают построение модели регрессии в форме . Аналогичным образом вычисляются коэффициенты регрессии фактора на предшествующие ему факторов. Например, это требуется для формирования матрицы нагрузок (см. далее).

Докажем, что скалярное произведение вектора с первыми тремя компонентами последней строки матрицы на вектор коэффициентов регрессии классической модели регрессии для принятого в задаче порядка следования факторов равно значению коэффициента детерминации .

Имеем скалярное произведение в виде

последнее равенство есть коэффициент детерминации в стандартизованном масштабе. В нашем примере вычисление скалярного произведения даст

0,9963

С другой стороны , т.е. 99,63 % вариации индекса цен на промышленные товары объясняется вариацией всей совокупности факторов. Квадратный корень из равен множественному коэффициенту корреляции, если модель линейна по параметрам. Стандарт результативного признака: (см. паттерн COV).

паттерн В содержит информацию о коэффициентах детерминации , , которые вычисляются аналогично . Например,

.

Эти последовательные коэффициенты детерминации несут статистическую информацию о совокупной объяснительной способности влияния вариации первых факторов на й фактор.

Поскольку , то по данным паттерна В вычисляются все парные коэффициенты корреляции. Например,

следующим важным и далеко не очевидным, но крайне важным для практики свойством, является то, что в столбцах паттерна B отражено взаимное изменение приращений факторов при изменении на 1 единицу одного из них. Например, в первой строке приращение на 1 единицу индекса цен на добычу полезных ископаемых статистически должно изменить индексы цен: на 0,312519406 в обрабатывающих производствах, на 0,046340409 при производстве и распределении электроэнергии, газа и воды. При этих изменениях факторов изменение индекса цен на промышленные товары должно статистически получить приращение на 0,417267568, которое равно коэффициенту парной регрессии результата y на фактор парадокс? Нет! регрессия ковариационный матрица паттерн

В нашей работе [1, 2] рассмотрен метод построения системы ортогональных функций, названных спектральными и совпадающими с функциями П.Л. Чебышева для функций нескольких переменных. Из последнего равенства в линейной модели регрессии = Xa = XVc следует, что вектор коэффициентов регрессии классической модели может быть разложен по столбцам матрицы нагрузок V, т.е. a = Vc, с — вектор спектральных коэффициентов регрессии в модели c. Спектральные функции , например, для нашего примера имею вид: , , ортогональны в смысле скалярного произведения . Модель записана для центрированных переменных. Она показывает, что при принятой экономической интерпретации коэффициентов регрессии и приращении фактора и при приращение результата равно . таким образом, принятая на практике интерпретация коэффициентов регрессии не соответствует модели, поскольку игнорируется взаимосвязь факторов. Если положить, что при учесть взаимосвязь факторов условиями и , то , что и наблюдается в последней строке паттерна В, т.к. .

Следовательно, парадокс, выявленный ранее, нашел своё обоснование в рамках работы [1].

Матрица нагрузок для выбранного порядка следования факторов может быть вычислена различными способами [1, 2]. В примере с учётом числа факторов она имеет вид

.

Значение элемента легко усмотреть в матрице паттерна B, где он равен коэффициенту регрессии . Рассуждая аналогичным образом, получаем значения элементов и как коэффициенты двухфакторной регрессии по алгоритму получения вектора .

Составляем систему из двух равнений

Решая её, находим, что есть элементы последнего столбца матрицы .

С использованием данных паттерна COV и матрицы нагрузок по формуле

вычисляем оценки дисперсий спектральных функций и коэффициенты парной корреляции

, ,

что позволяет представить коэффициент детерминации в виде

Такое объяснение вариации результативного признака [3].

Например, , что позволяет оценить вклад в вариацию результата третьей спектральной функции в 0,5%, второй — 15,8%, а основной вклад вносит первый фактор — 83,3% (при принятой последовательности включения факторов в модель регрессии).

Вычисление статистических характеристик также возможно по данным матрицы паттерна B. Изложение этих алгоритмов составляет самостоятельную задачу.

Из перебора значений коэффициентов в последнем столбце паттерна В следует, что можно выделить фактор, приращение значений которого в наибольшей степени влияет на приращение результативного признака. Так в примере это будет фактор обрабатывающие производства.

Для контроля вычислений найдём спектральные коэффициенты, решая систему

Составим матричный паттерн R — Реверс задачи, который представляет структуру системы уравнений, позволяющих решать две взаимообратные задачи. Первая задача называется прямой: по заданным значениям факторов вычисляется значение результативного признака и соответствующих спектральных функций. Вторая задача называется обратной к прямой задаче, поскольку по приращению результативного признака вычисляются соответствующие приращения факторных признаков.

Обе задачи можно рассматривать как задачи прогнозирования. Решение прямой задачи даёт прогнозное воспользоваться прогнозными значениями факторов, полученными с учётом их статистической взаимосвязи. Паттерн В содержит частный случай решения прямой задачи, когда выбран доминирующий фактор, например, фактор — обрабатывающие производства, имеющий наибольший коэффициент корреляции с результатом. Решение непосредственно считывается как наибольшее случае для решения указанных выше задач необходим паттерн R — Реверс задачи.

В табл. 4 представлен паттерн R для линейной регрессии с тремя факторами.

Таблица 4

паттерн R- Реверс задачи

Ŷ 10*= 1

Паттерн R представляет:

1) прямую задачу ;

2) обратную задачу .

Решение обратной задачи представлено на рис. 1 для частного случая , описанного выше, для всех значений из табл. 1.

Рис. 1. Графики расчетных приращений факторов в функции от

Рис. 1 наглядно демонстрирует согласованную с вариацией результативного признака вариацию факторов, что обусловлено учётом их статистической взаимосвязи и согласуется с представлением об оценке показателей управляемых процессов, синтезируемых на основе управленческих решений.

На практике процессы управления и функционирования систем протекают во времени и с временным сдвигом друг к другу, что демонстрируют графики рис. 2.

Рис. 2. Графики приращений по фактическим значениям факторов (табл. 1)

Выводы.

1.Основная новизна методики состоит в постановке и методе решения прямой и обратной задач линейной регрессии, имеющих экспрессный характер анализа экономических данных и синтеза основных оценок прогнозных решений.

2.При необходимости статистической оценки параметров модели методика может быть дополнена соответствующими процедурами, использующими информацию, представленную ковариационной матрицей данных.

.Опыт применения в учебном процессе в высшей школе разработанной авторами методики показал, что наглядность и структурированность процесса проектирования решений на основе количественных моделей повышает их понимание и обоснованность для применения их в сфере менеджмента.

Литература:

1. Клюжев Н.А. Спектральный анализ регрессионных эконометрических моделей.// ВЕСТНИК ИНЖЭКОНА. 2007. Вып.4(17). Серия «Экономика» — с. 219-226

. Клюжев Н.А. Спектральное оценивание в прикладном регрессионном анализе (часть I) // Сборник научных трудов «Современные тенденции в науке, экономике и управлении» — Псков: Издательство «ЛОГОС Плюс», 2013.-стр.241-287.

. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. чл. корр. ран И.И. Елисеевой.- 4-е изд., перераб. и доп. — М.: финансы и статистика, 2002.- 480 с.: ил.

. Модели и методы социально-экономического прогнозирования / Учебн. пособие: составители д.э.н., проф. Давнис В.В. и др.Экономич. фак-т Воронежского ун-т: Воронеж, 2004 г.-114 с.

Учебная работа. Матричные паттерны проектирования решений