Менеджмент

Учебная работа. Страховое покрытие денежных остатков и запасов товаров в торговых точках ритейловой компании

Страховое покрытие денежных остатков и запасов товаров в торговых точках ритейловой компании

Оглавление

Введение

Глава 1. Исследование подходов к моделированию временных рядов с целью страхования активов ритейловых компаний

.1 Рынок ритейла в России

.2 Анализ страхования собственности от несчастных случаев

.3 Обзор современных подходов к моделированию временных рядов денежных средств и товарных запасов ритейловых компаний

Глава 2. Моделирование и прогнозирование запасов товаров в торговых точках

.1 Основные характеристики временного ряда запасов товаров

.2 Классификация торговых точек со схожими характеристиками запасов товаров с помощью кластерного анализа

.3Прогнозирование временных рядов запасов товаров по кластерам с помощью модели ARIMA

Глава 3. Эконометрическое моделирование и прогнозирование страхового покрытия остатков денежных средств в торговых точках

.1 Исследование временного ряда остатков денежных средств

.2 Объединение торговых точек со схожими характеристиками остатков денежных средств в группы

.3 Моделирование и прогнозирование временных рядов остатков денежных средств в группах торговых точек

.3.1 Прогнозирование временных рядов остатков денежных средств без выбросов с помощью моделей ARFIMA

.3.2 Прогнозирование временных рядов остатков денежных средств с выбросами с использованием модели ARIMA с интервенцией

Заключение

список литературы

Приложение 1. Прогнозирование запасов товаров с помощью моделей ARIMA

Приложение 2. Прогнозирование остатков денежных средств с помощью модели ARFIMA

Приложение 3. Оценки моделей ARIMA с интервенцией

приложение 4. Прогнозирование остатков денежных средств с помощью модели ARIMA с интервенцией

Введение

Рынок ритейла, как и многие другие сферы экономики, крайне сильно реагирует на изменения в макроэкономической среде страны. Так в 2016 году ритейловые компании в россии, как и в 2015 году, продолжили страдать от негативного воздействия экономического кризиса. В результате неустойчивого положения экономики России, которое привело к тому, что реальные зарплаты населения и располагаемый доход снизились, компании-ритейлеры испытывали низкие темпы роста продаж как в натуральном, так и в денежном выражении. Индекс потребительских настроений, отражающий оценку потребителями их настоящего и будущего финансового состояния, а также готовность тратить на товары и услуги, несмотря на наметившуюся положительную динамику, уже два года имеет негативное значение. Кроме снижения спроса, ритейлеры также пострадали от увеличения цен на товары производителей, произошедшего из-за падения курса рубля по отношению к иностранной валюте и подорожавшего производства.

Все это привело к тому, что крупные сети ритейлеров были вынуждены перестраивать свою стратегию развития и фокусироваться на оптимизации бизнеса и снижении операционных расходов. Одним из способов снижения убытков ритейловых компаний является страхование денежных средств и запасов в магазинах сети. Достаточно часто торговые точки подвергаются грабежам, разбоям, а также различным бедствиям, таким как пожар или наводнение. Данные происшествия могут принести достаточно большой ущерб компании, так как иногда в точках остается большой размер наличных средств, в связи с праздниками или отсутствием инкассации. Кроме того, в магазинах находится значительный объем продукции, который в случае торговли, например, электроникой имеет высокую стоимость. Именно поэтому страхование денежных остатков и запасов товаров в торговых точках актуально в текущей экономической ситуации.

Обычно, при страховании имущества, стоимость объекта страхования заранее известна и остается постоянной на протяжении всего срока страхования. однако основной сложностью данного исследования является необходимость предсказания величины будущих запасов товаров и денежных средств. Объекты страхования в данном случае являются величинами непостоянными и могут быть предсказаны лишь с определенным значением точности. Таким образом, основной целью страхователя (ритейловой компании) является наиболее точный прогноз страховой суммы.

Целью данной работы является построение моделей для расчёта страхового покрытия денежных остатков и запасов товаров в торговых точках крупной ритейловой компании.

Для достижения поставленной цели необходимо выполнить следующие задачи:

.Объединение торговых точек в однородные группы с помощью кластерного анализа, выделение типичных представителей групп.

2.Построение моделей прогнозирования временных рядов запасов товаров в торговых точках на 2017 год с помощью временных моделей ARIMA, SARIMA.

.Построение моделей прогнозирования остатков денежных средств без учета выбросов в праздничные дни в торговых точках на 2017 год с помощью временной модели ARFIMA.

.Построение моделей прогнозирования остатков денежных средств c учетом выбросов в праздничные дни в торговых точках на 2017 год с помощью временных моделей ARIMA с интервенцией.

Объектом данного исследования являются остатки денежных средств на конец дня и запас товаров в торговых точках крупной ритейловой российской компании.

Предметом исследования являются модели динамики денежных остатков и запасов товаров в торговых точках крупной ритейловой компании, определяющие оптимальное страховое покрытие соответствующих рисков.

Информационная база предоставлена одним из крупнейших ритейлеров на рынке сотовой связи. В данном исследовании анализируются 467 торговых точек, находящихся в московском регионе. Массив данных включает в себя временные ряды, состоящие из ежедневных наблюдений остатков наличных денежных средств в кассе на конец рабочего дня с 2013 по 2016 год, и временные ряды, состоящие из ежемесячных наблюдений запасов продукции с 2012 по 2016 год, итого около 1470 наблюдений.

Методологическая база включает в себя описательные статистики, табличные и графические методы представления данных, многомерные методы кластеризации, модели прогнозирования временных рядов. основными статистическими пакетами для обработки данных являются SPSS, Stata, Excel, Statistica, Eviews.

В первой главе работы дается обзор рынка ритейла и страхования: история их возникновения, описание текущего состояния и трендов в России, основные понятия. Особое внимание уделяется описанию теоретических основ временных моделей. Рассматриваются предпосылки их использования, достоинства и недостатки прогнозов, различные усовершенствования моделей. кроме того, рассматриваются примеры использования моделей для прогнозирования рядов продаж, которые имеют схожее с изучаемыми рядами поведение.

Во второй главе дается подробное описание ряда запасов товаров, выделяются основные характеристики точек. С целью построения небольшого числа моделей для обобщенных данных, торговые точки кластеризуются. Результатом данной главы является прогноз временного ряда на 2017 год и расчет страхового покрытия запасов товаров для каждой выделенной группы торговых точек.

третья глава повторяет структуру второй главы и анализирует более сложный временной ряд остатков денежных средств. особенностью данного раздела является анализ ряда данных без исключения и с исключением выбросов. Так как продажи в праздничные дни сильно отклоняются от среднего значения ряда, для их прогнозирования используются более сложные эконометрические модели.

Глава 1. исследование подходов к моделированию временных рядов с целью страхования активов ритейловых компаний

.1 Рынок ритейла в России

В данной работе рассматривается реальная задача, которую на практике решает один из крупнейших ритейлеров в категории электроники. поэтому, прежде всего, необходимо дать обзор рынку ритейла и его тенденциям.

История рынка ритейла насчитывает уже несколько столетий, в самом примитивном виде он появился еще во времена средневековой Европы, когда торговцы закупали товар на мелких региональных базарах и перепродавали его на крупных централизованных рынках. С тех пор разнообразие продаваемой продукции увеличилось в разы, а организация ритейла, начиная с покупки и заканчивая последующей перепродажей, была оптимизирована и подстроена под запросы потребителей. В россии крупные сети ритейлеров в современном представлении впервые появились в 1990-х годах в виде сети с небольшим количеством магазинов в премиум-сегменте. С течением времени данная модель продажи начала развиваться: количество розничных точек увеличивалось, а ценовая политика становилась все более гибкой — так появились гипермаркеты и дискаунтеры.

несмотря на то, что данный вид торговли начал формироваться очень давно, точного определения он не имеет и по сей день, однако выделяют несколько устойчивых характеристик, присущих подобному виду бизнеса. В широком смысле ритейл характеризует принцип торговли, при котором любой покупатель может свободно приобрести товар. В узком же смысле под ритейлом понимают розничную продажу потребительских товаров и услуг через многочисленные каналы распространения (точки ритейла) с целью получения прибыли. Под точкой ритейла понимают точку розничной торговли, магазин.

В настоящее время одной из наиболее ярких тенденций ритейла во всем мире является переход потребителей в онлайн-сегмент (рис. 1). Розничные ритейлеры, модель которых была построена на оффлайн-продажах в многочисленных торговых точках, вынуждены приспосабливаться к меняющимся условиям и конкурировать с интернет-магазинами, предлагающими ту же продукцию по более низким ценам.

Рис. 1. Доля электронной коммерции (продаж через интернет) в ритейле в категории «электроника». Источник: Аналитика АКИТ. Интернет-торговля в России-2016 гг. [27]

Наиболее сильно данный тренд затронул торговлю именно электроникой — смартфонами, телефонами, компьютерами и ноутбуками. Объяснить данное явление можно тем, что крупные компании несут гораздо большие затраты на официальный импорт электроники в страну. В то время как небольшие интернет-магазины не имеют столь пристального контроля со стороны государства, что позволяет им демпинговать, предлагать более низкие цены.

Таблица 1

Темпы роста продаж бытовой техники и электроники с 2011 по 2015 гг.

Среднегодовой темп роста с 2011 по 2015 годыИюнь 2015/2016Июль 2015/2016Август 2015/2016объем продаж в натуральном выражении-5%2%-4%-1%Объем продаж в денежном выражении10%17%9%5%Средняя цена15%16%15%6%

Источник: Аналитика АКИТ. Интернет-торговля в России-2016 гг. [27]

Кроме возросшей конкуренции со стороны интернет-магазинов, ритейлеры электроники страдают от снижения объемов рынка. С 2011 года объем рынка в натуральном выражении ежегодно снижался на 5% (табл. 1). лишь за счет сильного роста средней цены, объем продаж в денежном выражении рос. Однако в августе 2016 года рост цен на электронику сильно понизился, что спровоцировало падение темпов роста объема продаж в деньгах.

Согласно исследованию Infoline, в Топ-20 крупнейших ритейлеров входит 5 компаний, занимающихся продажей бытовой, компьютерной техники и электроники (табл. 2). Данные ритейлеры занимали в 2015 году 7, 10-13 места по размеру выручки, причем по сравнению с 2014 годом три из них потеряли 1 или 2 строчки рейтинга, а другие остались на прежних местах.

Также крупные сети ритейлеров, в следствии кризиса и перехода в онлайн сегмент, стали экономить на арендуемых площадях. например, крупнейший продавец бытовой техники и электроники «М.видео» в 2014 году урезал свои площади вдвое. А «Media Markt» начал арендовать новые магазины с площадью вдвое меньше обычного.

Таблица 2

крупнейшие сети продаж электроники и бытовой техники, входящие в ТОП-20 ритейлеров

место в рейтингеКомпанияСегмент рынкаВыручка за 2014 год, млрд. руб.Прирост выручки,%Изменение в рейтинге7М.ВидеоБиКТ175,918,6-110DNSБиКТ115,16,1Без изменений11ЕвросетьЭлектроника1151,8-212ЭльдорадоБиКТ111,616,2Без изменений13СвязнойЭлектроника1112,8-2

Источник: Infoline retail Russia ТОП-100 — 2015 гг. [28]

именно эти негативные изменения на рынке электроники и онлайн-коммерции вынуждают бизнес перестраивать привычные бизнес-процессы и искать способы сокращения издержек.

.2 анализ страхования собственности от несчастных случаев

несмотря на то, что страхование в различных сферах жизнедеятельности широко описано и проанализировано актуариями, это — первое исследование, посвященное статистическому моделированию и прогнозированию остатков наличных денежных средств и запасов в торговых точках одного из крупнейших ритейлеров, функционирующих на рынке России с целью расчета оптимального страхового покрытия. Несмотря на обилие литературы, данная проблема никогда прежде не была рассмотрена с данной точки зрения.

Так как страхование денежных средств и запасов товаров относится к страхованию собственности от несчастных случаев, важно понять основные концепции, характеризующие данный вид страхования. Страхование собственности от несчастных случаев зародилось в средние века в виде страхования морских торговых судов и развивалось вплоть до 1900-х годов, когда данный вид страхования окончательно сформировался в современном виде (American Insurance Association, 2010). American Insurance Association (2010) выделяет две основные функции страхования: предотвращение убытков и возмещение потерь, которые несут физические или юридические лица в случае наступления определенных рисков. Более детальный обзор различных видов страхования для бизнеса дает Insurance Information Institute (2010). Страхование, направленное на защиту организаций от различных рисков, делится на четыре категории:

.Страхование собственности.

2.Страхование на случай невыполнения обязательств.

.Страхование основных средств.

.Страхование для выплат компенсаций работникам.

В данном исследовании рассматривается страхование собственности, которое включает покрытие не только для недвижимого имущества, но и для других различных активов, помогающих вести операционную деятельность, таких как запасы, материалы, оборудование офисов.

Рис. 2. Квартальная динамика страхового рынка по всем видам страхования, 2013-2016 гг. Источник: Аналитический обзор НРА. Страховой Рынок в 2017 году [29]

Рис. 3. Структура всех собранных на рынке премий по видам страхования в третьем квартале 2016 года. Источник: Аналитический обзор НРА. Страховой Рынок в 2017 году [29]

Объем всего рынка страхования в россии ежегодно растет. В 2016 году сборы страховых компаний превысили триллион рублей (рис. 2). Наибольшие доли рынка занимают КАСКО и ОСАГО: в 2015 году они вместе составляли 43% страхового рынка. Объем страхования имущества юридическими лицами в третьем квартале 2015 года составлял 27,3 миллиарда рублей, а в аналогичном периоде 2016 года 24,6 миллиарда. Падение объемов данного вида страхования вызвано сокращением его доли в структуре рынка (рис. 3). За год структура страхования сильно изменилась: значительно сократилась доля КАСКО и ОСАГО (до 34,4%), увеличились сегменты страхования жизни, ответственности и страхования от несчастных случаев.

Таблица 3

Рейтинг компаний по страхованию имущества юридических лиц

КомпанияПремии по страхованию имущества юр. лиц за 2015 год, тыс. руб.Динамика премий за годДоля отказов в выплатеСОГАЗ46 018 2522,0%8,1%Чулпан827 70864,3%0,0%ВТБ страхование3 344 07989,0%22,1%Росгосстрах4 452 886-6,3%8,3%Согласие2 399 40132,0%10,6%

Источник: лучшие страховые компании 2015 года (по работе с юридическими лицами) [26]

лучшей компанией в секторе страхования имущества юридических лиц, согласно рейтингу лучших страховых компаний для юридических лиц в 2015 году, является «СОГАЗ». Собранные премии по страхованию имущества юридических лиц превышают 46 миллиардов рублей, что больше, чем у компании «Ингосстрах» (второго лидера по объему премий) более чем в 4 раза. Наибольший рост страховых премий за год произошел в компании «ВТБ страхование», там премии выросли практически в два раза. Отрицательную динамику собранных премий показали «Росгосстрах», «Энергогарант», «Ингосстрах» и «ВСК страховой дом». По объему выплат в 2015году лидировали «СОГАЗ», «ВТБ страхование» и «Альфа страхование». Их выплаты составляли 8,7; 3,0; 2,5 миллиарда рублей соответственно.

Основным понятием, используемым в данном исследовании, является страховая сумма. Согласно статье 10 Закона РФ «об организации страхового дела в РФ» [29] под страховой суммой понимается «денежная сумма, которая установлена федеральным законом и (или) определена договором страхования и, исходя из которой, устанавливается размер страховой премии (страховых взносов) и размер страховой выплаты при наступлении страхового случая». Страховая премия выплачивается страхователем в соответствии с договором и тарифами за то, что страховщик берет на себя риски страхователя.

Чаще всего в страховании объект страхования или риск имеет определенную стоимость, согласно которой и определяется не превышающая эту стоимость страховая сумма. Особенностью данного исследования является наличие у компании-ритейлера, выступающей в роли страхователя, страховых рисков, стоимость которых трудно оценить однозначно вследствие ее быстрой изменчивости. Целью ритейловой компании является страхование запасов товаров и остатков денежных средств в следующем году, однако эти величины не определены и должны быть предсказаны. Прогноз данных величин и представляет собой страховую сумму. От качества модели и прогноза зависит размер страховых премий и выплат в случае наступления застрахованных рисков. Если прогнозы товаров и денежных средств будут занижены, то при наступлении убытков компания получит недостающую компенсацию, если завышены, то ритейлер будет выплачивать слишком высокие страховые премии. Это и определяет сложность и практическую значимость исследования.

1.3 Обзор современных подходов к моделированию временных рядов денежных средств и товарных запасов ритейловых компаний

Так как массив анализируемых данных представлен в виде временных рядов, чтобы рассчитать страховое покрытие, необходимо прежде всего построить временную эконометрическую модель для прогнозирования денежных средств и запасов на ближайший год. Объекты страхования обладают различными характеристиками: запасы товаров имеют гладкий ряд с небольшим трендом, в ряду остатков денежных средств множество выбросов. Следовательно, каждый вид данных требует подбора наиболее оптимальной временной модели. Ниже были описаны модели, соответствующие характеристикам страховых объектов, и рассмотрены примеры моделирования похожих временных рядов.

Одной из наиболее распространенных и хорошо зарекомендовавших себя на практике эконометрических моделей временных рядов является интегрированная модель авторегрессии-скользящего среднего (ARIMA). Эта модель была впервые представлена Боксом и Дженкинсом [11] и впоследствии большинство инноваций в области моделирования временных рядов усовершенствовали или усложняли модель ARIMA.

Одной наиболее известной моделью для прогнозирования временных рядов является модель ARMA (модель авторегрессии-скользящего среднего). Данная модель позволяет моделировать стационарные временные ряды и обобщает две простые модели: модель авторегрессии AR и модель скользящего среднего MA.

Уравнение модели ARMA (p,q) имеет вид:

где p — порядок авторегрессии;- порядок разностей;- временная переменная;

скользящее среднее ряда;

α — оценки параметров авторегрессии

θ — оценки параметров скользящего среднего

Для того, чтобы ряд был стационарным, должны выполнятся следующие предпосылки:

Однако в реальной жизни стационарные ряды встречаются достаточно редко, обычно в данных присутствует сезонность, периодичность, случайное блуждание или же линейная составляющая времени. В этом случае ряд называют нестационарным и применяют модель авторегрессии интегрированного скользящего среднего ARIMA(p,d,q), имеющее вид:

где d — порядок разностей;-лаг переменной;

Идея данной модели состоит в том, что при переходе к d-й разности, временной ряд становится стационарным и можно применять модель ARMA.

Данная модель достаточно гибкая и агрегирует большое количество информации, содержащейся во временных рядах. кроме того, было доказано, что ARIMA применима для нестационарных рядов, которые имеют ярко выраженный тренд (Stoffer & Dhumway, 2010). Леонард в своей статье [19] доказал, что ARIMA также подходит для моделирования спроса на продукт и влияния маркетинговых мероприятий на продажи. Можно сделать вывод, что ARIMA применима для анализируемой задачи, так как спрос на товар имеет схожую динамику с продажами товаров.

Для того, чтобы сделать модель ARIMA более реалистичной и отразить влияние сезонности, которая характерна для таких переменных как продажи товаров, туризм или дневная температура, была разработана сезонная модель авторегрессии-скользящего среднего (SARIMA). однако было доказано, что модели ARIMA с включенными сезонными дамми-переменными показывают лучшие результаты, чем SARIMA на примере агрегированных ритейл продаж в Южной Африке [15].

SARIMA (p, d, q)(Ps, Ds, Qs)s

где Ps — сезонный параметр авторегрессии;s — порядок сезонной разности;s — сезонный параметр скользящего среднего;

Δ — оператор разности

основной особенностью временных рядов, отражающих продажи или объем наличных денежных средств, является наличие выбросов, находящихся значительно выше среднего значения, характерных для праздничных дней. Данные выбросы тяжело смоделировать с помощью обычных моделей, но именно они представляют наибольший интерес. Одной из попыток решения данной проблемы является использование нейронных сетей (Shine and Basak, 2015). Для того, чтобы учесть нестационарность данных, которая возникает в объеме продаж из-за праздничных дней, нейронные сети были интегрированы в модель ARIMA: ARIMA моделировала линейную компоненту, а нейронные сети нелинейную компоненту, наблюдавшуюся в остатках.

однако, так как применение нейронных сетей к большому объему данных достаточно проблематично, данное исследование опирается на Interrupted ARIMA — временные модели с интервенцией (McDowall, McCleary, Meidinger and Hay, 1980). Данные модели оценивают параметры авторегрессионной модели, а также параметры, моделирующие дискретные события, которые постоянно или временно изменяют уровень среднего значения временного ряда [17]. Interrupted ARIMA моделирует аномальные значения ряда T с помощью введения dummy (фиктивной) переменной, которая принимает значения:

Таким образом, модель позволяет учитывать выбросы без влияния на среднее

где Yt — временная переменная- коэффициент при аномальных значенияхt — dummy переменная- авторегрессионная модель

кроме того, данная модель может быть расширена до следующей спецификации:

где V1 — коэффициент при аномальных значениях, объясняющий влияние выброса на тренд временного ряда;2 — коэффициент при аномальных значениях, объясняющий влияние выброса на среднее временного ряда.

Еще одной модификацией модели ARIMA является модель ARFIMA (Autoregressive fractionally integrated moving average) [23]. Модели ARFIMA моделируют процессы с длинной памятью. Стационарный процесс является процессом с длинной памятью (Long memory processes), если существуют α, c (0<α<1, c>0) и для автокорреляционной функции (ACF) выполняется соотношение:

Процесс ARFIMA достаточно трудно отличить от обычных I (1) c помощью тестов малой мощности — Дики-Фуллера и Филипса-Перрона. тест KPSS (Kwiatkowski-Phillips-Schmidt-Shin) состоятелен для стационарных процессов с длинной памятью, но необходимо большое количество наблюдений. Поэтому наиболее надежным является использование R/S анализа (анализ фрактальной структуры временных рядов). Также процессы с длинной памятью можно обнаружить исходя из графика автокорреляционной функции (ACF), который убывает с более медленной гиперболической скоростью.

Таким образом, были проанализированы предпосылки и примеры временных моделей. Для прогнозирования запасов товаров оптимальной моделью является ARIMA, а в случае выявления сезонности SARIMA. Наиболее подходящими моделями для расчета страховых сумм остатков денежных средств являются ARFIMA и Interrupted ARIMA. первая модель хорошо подходит для данных с длинной памятью и большим числом наблюдений. Вторая позволяет учесть влияние аномально высоких продаж в праздники и выходные. В следующих главах представлены оценки коэффициентов данных моделей и прогноз страховых сумм.

Глава 2. Моделирование и прогнозирование запасов товаров в торговых точках

.1 Основные характеристики временного ряда запасов товаров

Данная глава посвящена моделированию страхового покрытия запасов товаров в торговых точках. Первоначальный набор данных содержит ежемесячные наблюдения по 594 торговым точкам с 1 января 2012 года по 1 ноября 2016 года. Таким образом, в данной главе изучается 465 торговых точек с числом наблюдений от 47 до 59.

чтобы выдвинуть предположение о виде будущей модели, необходимо проанализировать графическое представление временных рядов. Ниже (рис. 4) представлены временные ряды нескольких типичных торговых точек.

Рис. 4. Запасы товаров в торговых точках 2120, 2021, 2248, 2012-2016 гг.

На графике (рис. 4) видно, что ряды являются не стационарными, один значительный скачок во время январских праздников в 2015 году. Поведение двух других торговых точек является стабильным и временные ряды не имеют заметных выбросов. таким образом, можно предположить, что для моделирования запасов товаров наиболее подходящей будет модель ARIMA, построенная для первой разности.

Также рассмотрим распределение средних значений временного ряда для 465 точек.

Рис. 5. гистограмма распределения средних значений запасов в торговых точках

Можно видеть, что средние значения распределены крайне неравномерно (рис. 5). Большая часть наблюдений лежит в интервале от 700 тысяч до 5 миллионов рублей. Однако есть также торговые точки с очень большими средними запасами товаров (до 42 миллионов рублей). Гистограмма средних значений товаров напоминает форму плотности логнормального распределения. поэтому для дальнейшего анализа и разбиения наблюдений на группы денежные величины были прологарифмированы.

Рассмотрим гистограмму средних значений прологарифмированных значений запасов товаров в торговых точках. Форма данной гистограммы близка к форме нормального закона распределения. Однако тест Жарка-Бера отвергает гипотезу о нормальном законе распределения (J-B=125, prob = 0,000). Но в целях нашего исследования близость логарифмированных данных по виду гистограммы к нормальной кривой можно считать достаточной.

Рис. 6. гистограмма среднего значения логарифма запасов товаров в точках

Так как число торговых точек очень велико, построение отдельной модели для каждой из них не целесообразно. Поэтому, для обобщения большого числа данных и упрощения оценки стоимости страховых рисков, торговые точки следует разбить на группы. кроме того, разбиение на группы будет производиться на основе логарифмированных данных, так как алгоритм k-средних чувствителен к выбросам, которые наблюдаются в данных, отличных от нормального распределения.

2.2 Классификация торговых точек со схожими характеристиками запасов товаров с помощью кластерного анализа

Данный параграф посвящен разделению торговых точек на группы. прежде всего, необходимо рассмотреть графическое представление точек в пространстве. Можно видеть, что практически все точки расположены плотно друг к другу и представляют одну большую совокупность (рис. 7). кроме того, точечная диаграмма построена только в двух координатах, а кластеризация позволяет учесть и другие факторы. Данные факты обуславливают применение метода кластерного анализа.

Рис. 7. Точечная диаграмма средних запасов и средних первых разностей торговых точек

наиболее удобным способом разбиения точек на группы с однородными характеристиками является метод кластеризации k-средних. Суть метода k-средних заключается в том, что изначально алгоритм случайно разбивает объекты на k кластеров, а затем изменяет принадлежность наблюдений к этим кластерам таким образом, чтобы минимизировать значение суммы квадратов расстояния от объекта до центра соответствующего кластера:

где d — мера расстояния между наблюдением x и центром кластера m, к которому эта точка принадлежит.

Существует несколько наиболее часто употребляемых мер расстояния:

2.Манхэттенское расстояние

3.Расстояние Чебышева

В данном исследовании в качестве меры длины используется Евклидово расстояние, наиболее подходящее природе используемых данных.

В качестве характеристик, по которым будут кластеризованы точки, были взяты различные описательные статистики как самого временного ряда, так и его первой разности:

.Среднее 2.стандартное отклонение запасов товаров;

.Размах временного ряда (max-min);

.максимальный размах между соседними наблюдениями;

.Среднее первой разности;

.стандартное отклонение первой разности.

При классификации торговых точек по запасам товаров количество выбросов не учитывается, так как экстремальные значения наблюдаются лишь у небольшого количества точек и не имеют повторяющихся закономерностей.

Метод k-средних очень удобен в применении, однако требует, чтобы число кластеров было задано изначально. Существует несколько способов определения числа кластеров.

прежде всего, рассмотрим двумерную частотную таблицу, которая строится на основе среднего значения и стандартного отклонения значения логарифма запасов товаров (табл. 4).

Таблица 4

Двумерная частотная таблица логарифма запасов товаров

Пики частотСреднее значение логарифма запасов товаров(11.4,12.6](12.6,13.8](13.8,15.1](15.1,16.3](16.3,17.5]Стандартное отклонение логарифма запасов товаров(0.08,1.4]018251675(1.4,2.7]072100(2.7,4.0]3253910(4.0,5.2]87000(5.2,6.5]112000

Можно видеть, что существует несколько областей концентрации частот. В данной таблице можно выделить от трех до четырех групп.

Отчетливо выделяется класс со стандартным отклонением в интервале (4; 6,5) и средним в интервале (11,4; 12,6). остальные пики частот концентрируются в области со средним (12,6; 16,3) и стандартным отклонением (0,08; 4). В данной области можно выделить три или две группы в зависимости от того, выделять интервал со значением частоты, равным 21, в отдельный класс или нет.

Рассмотрим двумерную гистограмму для другой пары переменных: среднее значение и максимальный размах между соседними наблюдениями. На гистограмме (рис. 8) также видно два сгустка частот. одна область намного больше другой и содержит три ярко выраженные группы. таким образом, первичный анализ показал, что вся совокупность может быть разбита на три-четыре кластера.

Рис. 8. Двумерная гистограмма средних запасов товаров и максимального размаха между соседними наблюдениями

Еще одним способом определения числа кластеров является иерархический кластерный анализ. Преимущество данного анализа заключается в том, что он учитывает не отдельные пары переменных, а весь набор характеристик. В данном анализе используется метод Варда и расстояние Евклида. Число кластеров зависит от значения меры расстояния, на которой выделяются кластеры (рис. 9): для расстояния, равного 50, количество кластеров равно четырем; для расстояния 100, трем. Так как совокупность точек велика, совокупность будет разбита на 4 кластера.

Рис. 9. Дендрограмма классификации торговых точек с помощью иерархического кластерного анализа с использованием метода Варда

Ниже изображено (рис. 10) разбиение торговых точек на четыре кластера. Видно, что кластеры разделены на 4 совокупности, различающиеся по двум переменным.

Рис. 10. Разбиение торговых точек по запасам товаров и их различным характеристикам на четыре кластера

Ниже (табл. 5) представлено обобщение результатов кластеризации. черный кластер содержит в себе наименьшее количество наблюдений. зеленый и красный кластеры похожи друг на друга по количеству наблюдений и по среднему значению. более подробные характеристики кластеров представлены ниже (табл.5).

Таблица 5

характеристики четырех кластеров торговых точек по запасам товаров и их характеристикам

КластерЛогарифм товарных запасовПервая разность логарифма товарных запасовЧисло наблюденийСреднееМаксимальный размах между соседними наблюдениямиСтандартное отклонениеСреднееРазмах временного рядаСтандартное отклонениеЧерный12,4715,084,920,870,120,1633красный15,140,980,240,340,090,08159Зеленый14,271,230,300,480,100,10181Синий13,9715,032,900,640,110,1392

Можно видеть, что все кластеры различаются по всем переменным. синий с черным и красный с зеленым кластеры похожи по максимальному размаху между соседними наблюдениями и стандартному отклонению. Для того, чтобы проверить значимость разбиения был проведен дисперсионный анализ. Дисперсионный анализ проверяет значимость различий хотя бы между двумя центроидами кластеров по всем характеристикам разбиения.

Таблица 6

Дисперсионный анализ разбиения на четыре кластера

ЧерныйКрасныйЗеленыйСинийSS Within18749194234SS Between18989SS Total19653Дисперсионный анализ показал, что дисперсия между кластерами объясняет 97% от общей дисперсии. Также была рассчитана F-статистика по следующей формуле:

где SSbetween — сумма квадратов отклонений между кластерами,within — сумма квадратов отклонений внутри кластеров,- число кластеров,- число кластеризованных наблюдений.

полученная F-статистика = 148 больше значима, следовательно, полученное разбиение на кластеры значимо.

Таким образом, было получено четыре группы со значимыми различиями по характеристикам кластеризации. Далее временные ряды для каждой из них будут усреднены и на их основе будут построены временные модели.

.3 Прогнозирование временных рядов запасов товаров по кластерам с помощью модели ARIMA

прежде всего, необходимо провести графический анализ усредненных временных рядов для каждого из пяти кластеров.

На графике (рис. 11) видно, что красный кластер значительно превышает другие ряды по среднему значению. Кластеры черный, синий и зеленый имеют одинаковую динамику и пики в похожие даты. например, самый заметный скачек в данных кластерах произошел в начале 2015 года. Черный кластер имеет значительный рост в 2012 году и к 2013 году сокращает разрыв с синими кластером практически до нуля. зеленый кластер имеет наиболее спокойное поведение, и пики в нем практически отсутствуют.

Рис. 11. Усредненные временные ряды для четырех кластеров

Все кластеры имеют примерно схожие характеристики временных рядов, поэтому исследование будет проводиться на примере одного кластера.

Данные временные ряды имеют слабый тренд, и, чтобы получить стационарный белый шум, необходимо перейти к первой разности. Чтобы доказать это, прежде всего необходимо провести анализ корреллограмм и периодограммы. рассмотрим данные графики для синего кластера (рис. 12-15).

Рис. 12. Коррелограмма временного ряда запасов точек синего кластера

На данной коррелограмме (рис. 12) значимы первые 5 лагов, в то время как у стационарных рядов автокорреляции не наблюдается.

Рис. 13. частная коррелограмма запасов точек синего кластера

частная коррелограмма также показывает значимость первого лага. Периодограмма позволяет понять, есть ли в данных сезонность и тренд. Периодограмма (рис. 13) показывает, что временной ряд синего кластера имеет тренд, так как наблюдается скачок на нулевой частоте. Сезонности в данных не наблюдается.

Рис. 14. Периодограмма запасов точек синего кластера

Проведем также тест на единичный корень Дики-Фуллера. Первым был проведен тест Дики-Фуллера с константой и трендом, в результате чего было выявлено, что тренд не значим. тест с исключенным трендом представлен ниже (табл.7).

Таблица 7

тест Дики-Фуллера для синего кластера

LevelCritical valuest-статистикаProb1%-4,12-2,250,455%-3,4910%-3,17

таким образом, гипотеза о наличии единичного корня не отвергается. рассмотрим те же характеристики для ряда после взятия первой разности. Видно (рис. 15), что практически все значения автокорреляционной функции лежат внутри доверительного интервала. Кроме того, наибольшие значения корреляционная функция принимает на лаге 12, следовательно, можно предположить, что в модель ARIMA войдет именно этот лаг.

Рис. 15. Автокорреляционная функция для первой разности синего кластера

Тест Дики-Фуллера также показал отсутствие единичных корней: t-статистика равна -8,17 (prob = 0,0001). таким образом, можно переходить к построению модели ARIMA, наиболее оптимальной модели для ряда первой разности (рис. 16), чье

Рис. 16. Временной ряд первой разности запасов точек синего кластера

Первая разность временного ряда синего кластера не имеет тренда, сезонности (рис. 16) и, как уже говорилось ранее, имеет наибольшее поэтому при подборе модели было включено более 12 лагов и на каждом шаге исключались незначимые.

Для всех кластеров модель ARIMA построена после взятия первой разности (d = 1). Все кластеры имеют в качестве наилучшей модель с AR(12) и MA(12) лагами. Результаты моделирования для всех кластеров представлены ниже. Все лаги значимы на уровне 0,001. Оценки лагов имеют похожие значения для зеленого и красного кластера, несмотря на то, что данные временные ряды имеют разное поведение.

Таблица 8

КластерЧерныйКрасныйЗеленыйСинийAR(12)-0,75***0,70***0,80***MA(12)0,88***-0,88***-0,85***-0,58***Akaike27,328,0625,4726,86

***-Значимость на уровне 0,001

В черный кластер вошел только MA(12) лаг. таким образом, можно сделать вывод, что на прогноз следующего года влияют значения прошлогодних запасов товаров.

Для красного кластера был построен динамический прогноз на год вперед. Данный прогноз является усредненным для всех точек. На основе оценок моделей кластеров можно спрогнозировать также запасы товаров в каждой конкретной торговой точке. Исходя из прогноза (рис.17) можно сказать, что в начале 2017 года страховая сумма не превысит пяти с половиной миллионов. Весь 2017 год запасы товаров будут иметь общий возрастающий тренд. Пик запасов придется на конец 2017 года, в новогодние праздники. В это время страховая сумма не превысит 6 миллионов в среднем для каждой точки.

Рис. 17. Прогноз продаж красного кластера на 2017 год

В таблице представлены характеристики прогноза на 2017 год для всех кластеров. черный, зеленый и синий кластеры в 2017 году демонстрируют слабую динамику, рост не превышает 10%. только в зеленом кластере с наименьшими средними значениями наблюдается небольшое падение запасов товаров. Прогнозные ряды имеют небольшой разброс: среднее и максимальное значение ряда отличаются слабо.

Таблица 9

Характеристики прогноза запасов товаров в точках выделенных кластеров на 2017 год

КластерКрасныйЧерныйЗеленыйСинийСреднее запасов товаров13,50%3%-2,60%7,40%Страховое покрытие с надежностью 0,956 381 8183 598 8641 961 8183 527 273

Выводы по главе 2

таким образом, все торговые точки были разделены на четыре кластера со значимыми различиями в характеристиках ряда и его первой разности. Данные кластеры имеют схожие временные ряды и характеристики автокорреляционной и частной автокорреляционной функций. Было доказано, что ряды становятся стационарными после взятия первой разности. Была построена модель ARIMA с лагами AR(12) и MA(12). высокие корреляции на 12 лаге означают зависимость прогноза от прошлогодних наблюдений. Для определения страховой суммы были построены прогнозы для всех кластеров. В 2017 году ряды демонстрируют слабую динамику. Наибольшая страховая сумма приходится на красный кластер, максимальное значение прогноза 5,8 миллионов рублей. В других кластерах страховая сумма не превышает трех миллионов.

модель страховой ритейловый денежный товар

.1 Исследование временного ряда остатков денежных средств

Данная глава посвящена анализу и моделированию временных рядов остатков денежных средств в торговых точках. Изучаемый набор данных содержит 466 торговых точек, торговые точки с большим числом пропусков были исключены, как и в случае с временными рядами запасов товаров. Временной ряд представляет собой 1401 дневное наблюдение в период с 1 января 2013 года по 1 ноября 2016 года.

Основным отличием данных временных рядов является наличие большого числа выбросов. Данные выбросы связаны с сезонным увеличением спроса и аномально высокими продажами в праздничные дни.

Поведение всех точек, независимо от среднего значения, похоже и имеет приблизительно одинаковые характеристики, поэтому далее описание данных будет происходить на примере торговой точки 1948 (рис. 18).

Рис. 18. Временной ряд торговой точки 1948, 2013-2016 гг.

На графике (рис. 18) временного ряда можно видеть множество пиков, которые значительно изменяют среднее видеть аномально высокие продажи в летние месяцы и предновогоднее время. Чтобы проанализировать основные периоды аномальных значений остатков денежных средств, был построен график, отражающий число точек с выбросами в каждый день наблюдения.

Рис. 19. Число торговых точек, в которых наблюдаются выбросы в конкретную дату

На графике (рис. 19) изображены даты, в которые выбросы происходили более чем в 14 точках. В 2013 году выбросы наблюдались в конце июля и перед новогодними праздниками в феврале. В 2014 году среднее число выбросов во все дни выросло по сравнению с 2013 годом. В 2015 в течение всего года число выбросов оставалось на невысоком уровне, однако перед Новым годом, продажи резко возросли практически в 20% точек. Основным отличием 2016 года является наличие множества аномалий в весенние месяцы. Группы точек отличаются как по количеству выбросов, так и по дням, следовательно, данные признаки необходимо включить в характеристики кластеризации точек.

Гистограмма остатков денежных средств имеет форму, подобную плотности логнормального распределения с длинным правым хвостом, который появился в результате наличия выбросов с высоким значением денежных средств. Если среднее значение ряда равно 134 тысячам, то выбросы в конце хвоста превосходят миллион рублей.

Рис. 20. Гистограмма остатков денежных средств в торговой точке 1948

рассмотрим также распределение средних значений временных рядов на гистограмме (рис. 21).

Рис. 21. гистограмма средних значений временных рядов во всех торговых точках

Средние временных рядов, как и множество денежных величин, распределены предположительно логнормально. Около 80% средних всех точек лежит в промежутке от 24 до 246 тысяч рублей. Однако есть и точки со средним значением больше миллиона рублей. Так как алгоритм кластеризации k-средних очень чувствителен к выбросам, денежные величины были прологарифмированы.

Рис. 22. гистограмма логарифма среднего значения денежных средств в торговых точках

Распределение логарифмированных значений близко к нормальному закону распределения. Тест Жарка-Бера подтверждает гипотезу о нормальном законе распределения (J-B = 1,23, prob = 0,54).

таким образом, для кластеризации остатков денежных средств должны быть использованы характеристики логарифмированных величин, а также величины, характеризующие число и даты выбросов.

.2 Объединение торговых точек со схожими характеристиками остатков денежных средств в группы

Как и в случае с запасами товаров в точках, кластеризация на основе данных о денежных средствах производится с помощью метода k-средних. На первом этапе вся совокупность точек будет разбита на несколько больших однородных классов с учетом количества выбросов. далее каждый из классов будет разбит на подклассы в зависимости от того, в какие дни выбросы в точках происходили.

Первоначальное разбиение на классы было произведено на основе следующих признаков:

.Число выбросов в точке

2.Среднее .Стандартное отклонение

.максимальный размах между соседними наблюдениями

.Среднее первой разности

.стандартное отклонение первой разности

Как упоминалось ранее, для классификации точек по остаткам денежных средств необходимо учитывать выбросы. Так как в дальнейшем временные ряды точек одного кластера будут усреднены, очень важно, чтобы в группе находились точки с одинаковым поведением и аномальными наблюдениями в одни и те же дни. Для кластерного анализа были взяты данные по выбросам в точке в следующие даты, где общее число аномальных наблюдений больше 30:

.2,3,4 июля; 17,26,30,31 декабря 2014 года

2.1 января; 30,31 декабря 2015 года

.1 января; 3 марта; 4 апреля 2016 года

Данные точки невозможно кластеризовать графически, так как число характеристик для кластеризации велико. Поэтому для разбиения на группы применялся кластерный анализ, метод k-средних. Для определения числа кластеров, прежде всего, необходимо провести графический анализ двумерной гистограммы.

Рис. 23. Двумерная гистограмма разброса точек для среднего и числа выбросов остатков денежных средств

Также выделяются области с желтыми и зелеными частотами. Однако, данный метод не позволяет точно определить количество кластеров, так как отражает разбиение только по двум переменным. Поэтому был проведен иерархический кластерный анализ и построена дендрограмма с использованием метода Варда.

Рис. 24. Дендрограмма классификации торговых точек по остаткам денежных средств и их характеристикам

На дендрограмме (рис. 24) отчетливо выделяются четыре кластера практически равного размера для расстояния, равного 300. таким образом, в кластеризации методом k-средних задано 4 кластера.

Рис. 25. Точечная диаграмма разбиения точек с остатками денежных средств на четыре кластера

Так как для классификации точек в однородные группы использовалось множество факторов, на точечной диаграмме (рис. 25) трудно описать различия кластеров и определить принадлежность точек. Можно сказать только, что синий кластер имеет наибольшие значения стандартного отклонения, а зеленый кластер наименьшие средние (рис. 26). Для понимания различий между кластерами необходимо рассмотреть значения всех характеристик в каждой группе.

Рис. 26. Остатки денежных средств с выбросами в торговых точках в четырех кластерах

Можно видеть (табл. 10), что кластеры имеют примерно одинаковые средние значения, однако отличаются по количеству выбросов, максимальному размаху между соседними наблюдениями, среднему первой разности и стандартному отклонению первой разности. Синий кластер имеет значительно больший максимальный размах, чем другие. Наибольшее количество выбросов содержится в зеленом кластере.

Также необходимо определить, в какие дни в каждом кластере происходят выбросы. В черном и красном кластере превалирует только одна дата. В данных группах выбросы происходят в конце декабря 2014 года. Зеленый и синий кластер включают большее число дат с аномалиями.

Таблица 10

характеристики кластеров по остаткам денежных средств в торговых точках

КластерЛогарифм товарных запасовПервая разность логарифма товарных запасовЧисло наблюденийСреднееМаксимальный размах между соседними наблюдениямиСтандартное отклонениеСреднееРазмах временного рядаСтандартное отклонениеЧерный23,7311,490,8340,00010,86183красный15,2611,960,854,260,00020,77117Зеленый31,7111,061,035,410,00010,9679Синий21,4711,481,6411,25-0,00050,9187

Таблица 11

Даты с аномальными наблюдениями, характерные для каждого кластера

ЧерныйКрасныйЗеленыйСиний30.12.1417.12.1404.07.1403.03.1603.07.1401.01.1631.12.1430.04.1602.07.1426.12.1401.01.1530.12.1531.12.15

Для проверки значимости различий между кластерами был проведен дисперсионный анализ. Дисперсия между кластерами объясняет 72% общей дисперсии. Данное разделение на кластеры значимо, F-статистика = 392 (probability = 0,001).

Таблица 12

ЧерныйКрасныйЗеленыйСинийSize1831177987SS Within1276204017641491SS Between16742SS Total23313

таким образом, было получено 4 кластера. Разбиение учитывает характеристики временного ряда, первой разности временного ряда и даты, в которые в точках происходят пики продаж. Дисперсионный анализ доказал значимость разделения.

3.3 Моделирование и прогнозирование временных рядов остатков денежных средств в группах торговых точек

Как говорилось в предыдущих разделах, отличительной особенностью данных временных рядов является наличие аномальных наблюдений в летние месяцы и праздничные дни. Существует два способа моделирования временных рядов с подобными характеристиками:

.Исключение выбросов из временного ряда и прогнозирование с помощью более простых временных моделей. Данный метод в дальнейшем предполагает отдельное страхование аномальных дней. Это может быть выгодно с точки зрения экономии страховых премий.

2.Прогнозирование временных рядов с выбросами с использованием сложных, смешанных моделей. Это позволяет страховать подобные риски без заключения дополнительных соглашений на страхование выбросов.

Оба метода интересны ритейловой компании, так как каждый из них обладает своими преимуществами и может быть рассмотрен в процессе заключения договора страхования. Интересным является вариант страхования точек кластеров с малым значением выбросов по первой схеме, а с большим числом — по второй.

3.3.1 Прогнозирование временных рядов остатков денежных средств без выбросов с помощью моделей ARFIMA

Для построения моделей данной главы из каждого кластера были исключены дни с большим количеством точек, в которых в это время происходили выбросы. Полученные временные ряды представлены на графике (рис. 27).

Рис. 27. Временные ряды остатков денежных средств четырех кластеров

Можно видеть, что даже после удаления типичных дней с аномальными продажами, ряды имеют множество пиков. Видно, что ряды имеют схожие характеристики: различная волатильность, восходящие и нисходящие тренды. поэтому предварительный анализ перед построением модели будет проведен на примере синего кластера.

Рис. 28. Гистограмма средних остатков денежных средств в торговых точках синего кластера

Распределение данного кластера, хоть и напоминает по форме кривую Гаусса, но сильно отличается от нормального распределения. Также гистограмма показывает наличие тяжелых хвостов: частоты имеют высокое значение на большинстве интервалов. Подобное предположения необходимо также рассмотреть коррелограмму.

Рис. 29. Коррелограмма временного ряда синего кластера

На коррелограмме видно, что все автокорреляции имеют высокие положительные значения и значимы не менее чем на 15 лагах. кроме того, корреляции не убывают с гиперболической скоростью, а имеют синусоидальные колебания. На лагах, кратных семи, корреляции резко возрастают. Данные признаки говорят о наличии длинной памяти во временном ряду. Процессы с длинной памятью прогнозируются с помощью модели ARFIMA.

На периодограмме также наблюдается недельная сезонность. Наибольшее

Рис. 30. Периодограмма временного ряда синего кластера

Как уже было отмечено в 1 главе, процесс ARFIMA достаточно трудно отличить от обычных I(1) c помощью тестов малой мощности, Дики-Фуллера и Филипса-Перрона, а тест KPSS состоятелен при стационарных процессах с длинной памятью, но необходимо большое количество наблюдений. поэтому наиболее надежным является использование R/S анализа. Проведем R/S анализ и найдем экспоненту Херста Н — меру, используемую для анализа процессов с длинной памятью:

.H>0.5 процесс персистентен (монотонно следующий вдоль детерминированного тренда) и имеет положительную автокорреляцию- сохраняет имеющуюся тенденцию.

2.H=0.5 — тенденции не выражено.

.H<0.5 процесс характеризуется антиперсистентностью и отрицательной автокорреляцией-любая тенденция стремится смениться противоположной.

Экспонента Херста рассчитывается с помощью следующих формул:

где H — экспонента Херста; n — длина временного ряда- размах временного ряда; S — стандартное отклонение;

Кроме того, найдя экспоненту Херста, можно вычислить предполагаемое

Таблица 13

значения экспоненты Херста для кластеров остатков денежных средств

КластерЭкспонента ХерстаПредполагаемое значение разности dЧерный0,940,44красный0,970,47Зеленый0,970,47Синий0,940,44

Можно видеть, что значения экспоненты имеет схожие значения для всех кластеров. Значение экспоненты больше 0,5, что говорит о персистентности процесса. Также данные ряды называются трендоустойчивыми, то есть, если в данных на определенном промежутке времени наблюдался восходящий или нисходящий тренд, то данные ряды будут сохранять этот тренд еще какое-то время. Наблюдения ряда не являются независимыми, они сохраняют данные о том, что было на предыдущих интервалах. Также можно предположить, что расчетное полученным с помощью экспоненты Херста. Экспонента Херста подтверждает возможность использования модели ARFIMA. Для всех кластеров была оценена модель ARFIMA. Результаты оценивания приведены в табл. 14.

Таблица 14

Результаты оценивания модели ARFIMA для четырех кластеров

ЧерныйКрасныйЗеленыйСинийРазность d0,49***0,29***0,41***0,27***Константа154860***234480***110162***14721***AR(1)-0,22***-0,28***-0,89***-0,23***MA(1)0,67***0,65***0,92***0,27****** — Значимость на уровне 0,001

недостатком данной модели является сложность вычисления оценок параметров: в модель невозможно добавить сезонный фактор, вычисления не производятся для больших лагов. Поэтому в модель были включены лаги AR(1) и MA(1), так как коррелограмма показала значимость на первом лаге. Все полученные оценки модели значимы на уровне 0,001. полученная разность модели наиболее близка к расчетной для зеленого и черного кластеров. Несмотря на схожесть поведения рядов, оценки имеют существенно различающиеся значения. Оценка AR(1) значительно меньше у зеленого кластера, в то время как MA(1) наоборот больше, чем у остальных. Константа отражает среднее Еще одним недостатком данной модели является сложность прогнозирования будущих наблюдений, а также краткосрочный интервал прогнозирования. Для упрощения вычислений модель ARFIMA может аппроксимироваться с помощью формулы:

Расчет страховой суммы представлен на примере красного кластера. Были предсказаны значения остатков денежных средств в точках в 2017 году.

Рис. 31. Прогноз остатков денежных средств модели ARFIMA в торговых точках красного кластера на 2017 год

Наибольшая страховая сумма была спрогнозирована для красного кластера: среднее значение ряда равно 252 тысячам рублей, а верхняя граница доверительного интервала не превосходит 400 тысяч. Страховые суммы для зеленого и синего кластера отличаются незначительно. Во всех кластерах, кроме красного, наблюдается небольшой спад остатков денежных средств.

Таблица 15

характеристики прогноза ARFIMA на 2017 год для четырех кластеров

КластерКрасныйЧерныйЗеленыйСинийСреднее значение ряда252 005116 421167 607185 137Верхняя граница 95% интервала страхового покрытия371 318236 276197 384268 970Динамика остатков денежных средств1%-1%-3%-1%

Итак, нами была построена адекватная модель для прогнозирования остатков денежных средств без выбросов. Оптимальной моделью для прогнозирования является модель ARFIMA. Были получены значимые оценки модели ARFIMA для лагов AR(1) и MA(1), также в модель вошла константа, отражающая среднее денежных средств на 2017 год и рассчитаны страховые суммы, требуемые для страхования исследуемых рисков.

В данном параграфе моделируются временные ряды остатков денежных средств без исключения выбросов с помощью модели ARIMA с интервенцией. Данная модель учитывает наиболее высокие непостоянные скачки, резко меняющие среднее

Рис. 32. Остатки денежных средств с выбросами в торговых точках в четырех кластерах

Можно видеть, что стабильное поведение ряда сменяется резкими скачками. Данные скачки могут сильно влиять на оценку моделей, поэтому важно экзогенно ввести в модель даты, в которые интервенции (выбросы) происходят, и учесть их влияние. Также необходимо понимать природу интервенций: влияют ли они на общий тренд модели или происходят и исчезают внезапно. В случае изучаемых данных, изменения временные и на общее поведение ряда не влияют. Это объясняется особенностью исследуемой предметной области — поведением покупателей электроники. Большая часть продаж приходится на праздничные дни и выходные, после чего спрос возвращается к обычным значениям.

Для построения модели необходимо знать номера наблюдений, в которых происходят скачки. наиболее простым способом обнаружения интервенций является графический анализ. Как правило, для данных остатков денежных средств интервенции в несколько раз превышают другие значения. Далее оценки модели подтвердят или опровергнут значимость интервенции. Можно видеть (табл. 16), что некоторые значения интервенций в кластерах повторяются.

Таблица 16

Номера дат (наблюдений) предполагаемых интервенций в четырех кластерах

ЧерныйКрасныйЗеленыйСинийИнтервенция 1121480360121Интервенция 2480700519359Интервенция 3828828952707Интервенция 4986828

Для определения лагов в модели ARIMA с интервенцией применяются те же методы, что и для обычной ARIMA модели. В предыдущем параграфе были рассмотрены характеристики данных без выбросов и выявлена недельная сезонность. поэтому в модель ARIMA с интервенцией будет включен сезонный AR(1)7 лаг. Также были подобраны обычные AR и МА лаги путем исключения незначимых значений. результат оценки ARIMA с интервенцией показан на примере зеленого кластера (табл. 17), остальные оценки приведены в приложении (прил.1).

Таблица 17

Результаты оценивания модели ARIMA с интервенцией для зеленого кластера

Оценка параметраЗначимостьНомер интервенцииAR(1)0,80,00AR(1)70,50,00Omega(1)963110,00360Delta(1)1,00,00360Omega(2)604200,00519Delta(2)1,00,00519Omega(3)542530,00952Delta(3)-0,30,13952Omega(4)1133580,00986Delta(4)0,10,55986

Параметр Delta отвечает за значимость интервенции. Так как в данной модели интервенции задаются с помощью бинарных фиктивных переменных, значимые значения Delta должны быть близки к единице. Показатель Omega отражает коэффициент при бинарной переменной. Для зеленого кластера наблюдения 952 и 986 не являются интервенциями, несмотря на то, что оценки их параметров значимы. Наибольшее влияние оказывает интервенция с номером 360. Также в модели значимы AR лаги, как сезонный, так и обычный.

Рис. 33. Прогноз остатков денежных средств зеленого кластера в 2017 году

Прогнозирование для данной модели имеет те же недостатки, что и прогнозирование модели ARFIMA. Основным результатом прогнозирования является 95% доверительный интервал для остатков денежных средств в 2017 году (табл. 18).

Таблица 18

характеристики прогноза на 2017 год модели ARIMA с интервенцией по четырем кластерам

КрасныйЧерныйЗеленыйСинийСреднее денежных средств-82%8%11%-76%

Согласно данной модели, в красном и синем кластере в 2017 году произойдет большой спад. Также в этих кластерах верхняя граница доверительного интервала почти в 4 раза больше среднего значения. Черный и зеленый кластеры спрогнозированы более достоверно: в них наблюдается небольшой рост, а страховые суммы равны 198 и 133 тысячи соответственно.

Выводы по главе 3

Точки были разбиты на четыре кластера методом k-средних. При кластеризации учитывались не только значения ряда и его первой разности, но и характеристики выбросов, а именно даты, в которые они происходили. Значимость различий между средними хотя бы двух кластеров подтверждена дисперсионным анализом.

Таким образом, в данном параграфе были получены значимые оценки модели ARIMA с интервенцией. Данная модель определяет значимость скачков остатков денежных средств и их влияние на оценки модели. Кроме интервенций в модель вошли лаги AR(1) и AR(1)7. Страховые суммы, полученные с помощью модели c интервенцией, ниже оценок модели ARFIMA и показывают значительный спад и рост остатков денежных средств.

Обе модели могут быть использованы для прогнозирования страховых сумм остатков денежных средств в точках. Модель ARFIMA хорошо прогнозирует временные ряды с малым числом выбросов. В данном случае ритейлер может исключать выбросы и отдельно страховать денежные средства в праздничные дни с более высокой суммой. Это поможет снизить общий уровень страховых сумм для обычных дней. Модель ARIMA с интервенцией позволяет учесть влияние выбросов на среднее значение ряда. Она проверяет значимость экзогенно значимых выбросов и более точно предсказывает страховые суммы.

Заключение

В данной работе рассчитываются страховые покрытия для запасов товаров и денежных средств в магазинах одного из лидеров на рынке продаж электроники. Ритейлер мобильной техники выступает в роли страхователя и вынужден прогнозировать страховые суммы для волатильных объектов страхования. Компания представляет собой ритейловую сеть, состоящую из множества торговых точек розничной продажи. Данный вид торговли появился еще 1990-х годах и продолжает развиваться и претерпевать изменения и по сей день. Текущая экономическая ситуация в россии значительно повлияла на ритейловые компании: ослабление рубля привело к снижению покупательной активности населения, расходы людей на электронику резко упали, выручка ритейлеров снизилась. кроме того, ритейл-продажи быстрыми темпами переходят в онлайн-сегмент, что негативно сказывается на продажах торговых точек. Это вынуждает ритейлеров разрабатывать стратегии по снижению издержек. Кроме того, ритейловые компании могут получить существенные потери вследствие различных несчастных случаев и противоправных действий. Одним из способов предотвращения убытков от грабежей и несчастных случаев является страхование запасов товаров и остатков денежных средств. Так как данные активы страхуются на год вперед, необходимо спрогнозировать страховую сумму, на основе которой будут рассчитываться страховые премии.

Для практического использования, обобщения информации и построения небольшого числа универсальных моделей торговые точки ритейловой компании были разбиты на несколько значимых кластеров. визуально разбить точки на группы невозможно, поэтому были применены методы кластерного анализа — иерархический и метод k-средних. Для запасов товаров было выделено четыре однородных кластера по следующим переменным:

. Среднее значение логарифма запасов товаров в данной торговой точке

. Стандартное отклонение логарифма запасов товаров;

. Размах временного ряда логарифма запасов товаров (max-min);

. Максимальный размах между соседними наблюдениями;

. Среднее первой разности логарифма запасов товаров;

. Стандартное отклонение первой разности логарифма запасов товаров.

Дальнейший анализ был проведен на усредненных временных рядах. исследование показало, что поведение рядов запасов товаров становится стационарным после взятия первой разности: тест на единичный корень Дики-Фуллера отвергает гипотезу о наличии единичных корней. Автокорреляционная функция показала значимость 3, 4 и 12 лагов, периодограмма не выявила наличия сезонности, поэтому путем исключения незначимых лагов была построена модель ARIMA для первой разности. В модель вошли лаги AR(12) и MA(12). Модель позволила спрогнозировать с заданной надежностью страховые суммы для страхования запасов товаров на 2017 год.

В начале исследования остатков денежных средств, торговые точки также были разделены кластеры. Кроме характеристик, используемых при группировке точек по запасам товаров, были добавлены переменные, описывающие количество выбросов в данной точке и наличие выбросов в праздничные и летние дни. В большинстве точек выбросы наблюдались в следующие дни:

. 2,3,4 июля; 17,26,30,31 декабря 2014 года

. 1 января; 30,31 декабря 2015 года

. 1 января; 3 марта; 4 апреля 2016 года

Было выделено 4 значимых кластера, временные ряды в каждом из которых были усреднены. Поведение временных рядов значительно отличается от стационарных или стационарных после взятия некой разности рядов. Поэтому ряды такого рода моделируются с помощью более сложных моделей. В первом случае из временных рядов были удалены наблюдения с аномально высокими значениями. Гистограмма и коррелограмма этих рядов выявила наличие длинной памяти у наблюдений и их трендоустойчивость, что позволило построить адекватные ARFIMA, в которые были включены лаги AR(1) и MA(1), так как коррелограмма показала значимость на первом лаге. Все полученные оценки модели значимы на уровне 0,001. Прогноз остатков денежных средств с помощью модели ARFIMA на 2017 год позволит страховой компании оценить возможные риски для всех торговых точек и определить оптимальное страховое покрытие. Данный метод удобен тем, то ритейловая компания может заключить основной договор страхования на относительно невысокие страховые суммы, а затем заключить дополнительные соглашения на увеличение страхового покрытия в выделенные с помощью анализа даты.

далее использован другой подход оценки временных рядов, отличающихся возможно резкими колебаниями значений. Для временного ряда с выбросами была построена модель ARIMA с интервенцией. В модель ARIMA с интервенцией будет включен сезонный AR(1)7 лаг и AR(1) лаг. Данная модель проверяет значимость интервенций, то есть наблюдений в модели, которые значительно влияют на среднее значение ряда. Интервенции задаются с помощью бинарных фиктивных переменных Delta, а показатель Omega отражает коэффициент при бинарной переменной. Прогнозирование остатков денежных средств с помощью модели ARFIMA на 2017 год даст возможность страховой компании оценить возможные риски для всех торговых точек и определить оптимальное страховое покрытие рисков без заключения дополнительных соглашений со страховой компании.

Средние страховые суммы, полученные из модели ARFIMA, превышают страховые суммы из модели с интервенцией, однако верхняя граница 95% доверительного интервала у первой модели больше. Модель с интервенцией прогнозирует значительные спады и рост остатков денежных средств, в то время как во временных рядах и прогнозах ARFIMA тренда не наблюдается. таким образом, можно сделать вывод, что модель ARFIMA больше подходит для расчета страховых сумм. Хотя для ряда торговых точек может быть удобнее на практике модели с интервенцией и полученный с их помощью прогноз оптимального страхового покрытия.

таким образом, в работе проведено практически важное исследование, позволяющее страховой компании оценить возможные страховые риски, связанные с неблагоприятными ситуациями в торговых точках — кражей товаров и денежных средств, стихийными бедствиями, способными уничтожить товары и денежные запасы и повлечь серьезные убытки ритейловой компании. Представленный в работе подход позволяет разделить все многочисленные торговые точки с помощью методов кластерного анализа на однородные в многомерном пространстве признаков группы, с учетом различных характеристик изучаемых временных рядов, а затем в этих группах построить наиболее подходящие временные модели. Товарные запасы, отличающиеся большей равномерностью рядов, и приводимые к стационарным, предлагается моделировать с помощью моделей ARIMA и SARIMA, подробно описанные в работе. Временные ряды денежных остатков на конец дня в торговых точках отличаются большей изменчивостью и неравномерностью, наличием большого числа выбросов. Поэтому к ним в работе применен другой подход — анализ с помощью моделей с долгой памятью ARFIMA и моделей ARIMA с интервенцией, позволяющих построить качественно отличные модели — для временного ряда без выбросов в первом случае, дополнительно застраховав наиболее «опасные» дни года и для временного ряда с большим числом выбросов во втором случае, сразу назначив страховые преии, покрывающие любые возможные риски. Все это дает возможность ритейловой компании выбрать совместно со страховой компанией наиболее выгодные стратегии страхования всего портфеля рисков.

список литературы

1.Айвазян С.А., Методы эконометрики: учебник, Москва, 2010, ИНФРА-М

.Айвазян С.А., Мхитарян В.С., Прикладная статистика. основы эконометрики, Москва, 2001, ЮНИТИ-ДАНА

3.Дубров А.М., Мхитарян В.С., Трошин Л.И., Многомерные статистические методы, Москва, 2011, Финансы и статистика

.Канторович Г.Г., анализ временных рядов (курс лекций), Экономический журнал ВШЭ, №1, 2002, 85-116 с.

.Касимов Ю.Ф., Введение в актуарную математику (страхования жизни и пенсионных схем), Москва, 2001, Анкил

6.Носко В.П., Эконометрика книга1, Москва, 2011, Изд. Дом «Дело»

7.Магнус Я.Р., Катышев П.К., Пересецкий А.А., Эконометрика. начальный курс., Москва, 2004, Изд. Дом «Дело»

.Миронкина Ю.Н., Звездина Н.В., Скорик М.А., Иванова Л.В., Актуарные расчеты: учебник и практикум для бакалавриата и магистратуры, Москва, 2014, Юрайт

9.Мхитарян В.С., Архипова М.Ю., Дуброва Т.А., Сиротин В.П. и др., Эконометрика, Москва, 2012, Проспект

10.American Insurance Association, Property-Casualty Insurance Basics, 2010, p. 1-8

11.Box, G., Jenkins, G.&Reinsel, G., Time Series Analysis: Forecasting and Control, San Francisco, 1970, Holden-Day

12.Deloitte, Property and Casualty Insurance Outlook, 2015, p. 1-30

.Dubois D., Prade H., Fundamentals of Fuzzy Sets. Handbook., 2003, IRIT, CNRS&University of Toulouse III

.Gautam, S.&Basak, S., Sales Prediction with Time Series Modeling., 2015, p. 1-5

.Gupta, R., Balcilar, M., Majumdar, A., Forecasting Aggregate Retail Sales: The Case of South Africa, University of Pretoria, 2013, p. 1-20

.Hastie T., Tibshirani R., Friedman J., The Elements of Statistical Learning Theory: Data Mining, 2008, Springe

.Insurance Information Institute, Insurance Handbook A guide to insurance: what it does and how it works, 2010, p. 1-5

18.Jarrett J., Kyper E., ARIMA Modeling With Intervention to Forecast and Analyze Chinese Stock Prices, University of Rhode Island, 2011

.Kohl M., Introduction to statistical data analysis with R., 2015, London, Bookboon

.Leonard, M., Promotional Analysis and Forecasting for Demand Planning: A Practical Time Series Approach, SAS Institute Inc., 2008

.Leonard, M.&Elsheimer, B., Count Series Forecasting., SAS Institute Inc., 2015

22.McDowall, D., McCleary, R., Meidinger, E.&Hay, R., Interrupted Time Series Analysis, Beverly Hills, 1980, Sage

23.Robinson, P.M., Time Series With Long Memory, 2003, Oxford University Press

.Stoffer, D.,&Dhumway, R., Time Series Analysis and its Application (3rd ed.), 2010, Springer.

.Vorontsov K.V., Uspenskii V.M., Disease classification using electrocardiogram time series data, 2014, Moscow Institute of Physics and Technology

26.Аналитический центр «Сравни.ру»

.Ассоциация компаний Интернет торговли

28.Информационное агентство «Infoline»

.Национальное рейтинговое агентство

.Справочно правовая система «консультант Плюс»

.Электронный учебник StatSoft

.Eviews Guide

приложение 1

Прогнозирование запасов товаров с помощью моделей ARIMA

Рис. П1. Прогноз запасов товаров черного кластера на 2017 год

Рис. П2. Прогноз запасов товаров зеленого кластера на 2017 год

Рис. П 3.Прогноз запасов товаров синего кластера на 2017 год

приложение 2

Прогнозирование остатков денежных средств с помощью модели ARFIMA

Рис. П 4. Прогноз модели ARFIMA на 2017 год для зеленого кластера

Рис. П 5.Прогноз модели ARFIMA на 2017 год для черного кластера

Рис. П 6.Прогноз модели ARFIMA на 2017 год для синего кластера

Приложение 3

Рис. П 7. Оценивание модели с интервенцией для черного кластера

Рис. П 8. Оценивание модели с интервенцией для красного кластера

Рис. П 9. Оценивание модели с интервенцией для синего кластера

Приложение 4

Прогнозирование остатков денежных средств с помощью модели ARIMA с интервенцией

Рис. П 10. Прогноз остатков денежных средств с интервенцией на 2017 год для красного кластера

Рис. П 11. Прогноз остатков денежных средств с интервенцией на 2017 год для черного кластера

Рис. П 12. Прогноз остатков денежных средств с интервенцией на 2017 год для синего кластера