Новый взгляд анализа

ДЛИННЫЕ ПЛАНЫ ПРОСТРАНСТВ

Внимательно изучим диаграмму рассеяния для модели. По ней можно сделать такой вывод. Лишь 15% предсказанных значений выходили за пределы границ допустимой ошибки. Этот маленький процент портил всю модельную картину. Как же быть? Необходимо что-то придумать и всё исправить.

Поэтому для уменьшения влияния выбросов и стабильности выходной погрешности создан алгоритм корректировки. Он пропорционально уменьшает отклонения элементов от основного интервала распределения. Таким образом, все аномалии были сокращены. Уже этот набор передан в следующую нейронную сеть.

Сохранив преемственность, характеристики новой сети остались идентичными. Именно эта структура является наилучшей для конкретного массива данных. В результате нового процесса обучения этой нейросети кардинально уменьшилась ошибка. Точность любого значения составила 95% и более. Высокое качества модели было достигнуто благодаря схеме, известной как ансамбль нейросетей.

В проекте использовались сведения о продажах компании за предыдущие 2,5 года. Прогнозы были смоделированы по каждому месяцу и пространству (филиалу, группе товаров) на протяжении следующих 9 месяцев. Большую часть времени проекта заняли выбор архитектуры, настройка связей и процесс обучения. Подготовка данных отобрала около 65% всего времени. Сверхзадача работы - это формирование моделей рынков продаж каждого пространства в отдельности.

В итоге, оригинальная группировка товаров позволила повысить качество маркетингового анализа и прогнозирования. Разработан алгоритм для сглаживания рядов практически любого количества, большой длины и сложности динамики. Определена схема поиска аномалий в продажах. Выявлены серьёзные ошибки предыдущих прогнозов.

Конечно, полученные значения не могут быть абсолютно точными. За проходящее время достижения границ многое изменится. Не всем прогнозам суждено сбыться. Наилучшая точность прогнозирования составляет от 4 до 7 месяцев. Поэтому следует ежемесячно обновлять все прогнозы на основе появившихся данных.

Это решение позволило компании увидеть ближайшую величины продаж и перспективную динамику. В процессе построения моделей возникло неожиданное и приятное дополнение. Определился самый эффективный филиал по управлению сбытом за весь предоставленный период данных.

Использование такого подхода к прогнозированию снизит влияние человеческих ошибок. Только после формирования надёжного прогноза можно осуществить качественное планирование. Следствием может стать оптимизация товарных запасов на складах и в магазинах. Ведь деятельность на основе качественного прогноза позволит избежать резких колебаний материальных и финансовых потоков. Это положительно скажется на общем состоянии компании.

Часть II. Классической является полносвязная структура нейросети на основе логистической функции. В ней все нейроны одного слоя связаны со всеми нейронами смежных слоёв. Типичными для этой структуры бывают сужающиеся или расширяющиеся схемы. Нейронная сеть представляет модель взаимосвязей между различными входными и выходными показателями. Они фиксируются в виде весовых коэффициентов, различных функций активации и их кривизны.

Настройка сети представляет совокупность методов машинного обучения, основанных на обучении представлениям. Слой, на нейроны которого поступает вектор входного воздействия, называют входным. Вектором является совокупность показателей состояния процесса за один период времени. Последний слой называют выходным, на выходах его нейронов формируется результат работы всей сети. Между этими слоями находятся дополнительные скрытые слои. Именно в них производится основная обработка данных.

Итак, имеется следующая ситуация. Торговая компания реализует товары в нескольких регионах. В каждом из них задействованы как собственные филиалы, так и сторонние сетевые гипермаркеты. Условно они определены как некие пространства продаж. Так гораздо лучше учитывать специфику территории и специфику динамики. В таком разрезе прогнозы по товарным группам будут более качественными.

Для повышения качества модели приумножим объём входных данных. Это также необходимо для нейросети. Количество существующих товарных групп недостаточно. Поэтому увеличим их число. Проведём маркетинговый анализ уже имеющихся групп и собранных в них товаров. Сформируем новые критерии группировок за несколько этапов. После этой большой работы размер сведений возрос почти в 50 раз.

Далее создадим модель для прогнозирования на основе нейронной сети. Проведённая ранее автокорреляция указывает на высокую степень сезонности в 12 месяцев. Далее осуществим обучение нейросети. На входы подадим исходные данные месяцев одного года. Они указывают на принадлежность временного ряда к конкретному пространству, группе, периоду. На выходе будут данные аналогичных месяцев следующего года. Это будет обучение нейросети «с учителем».

Первоначально используем один скрытый слой и проведём обучение сети. Многократно пропуская данные через модель, будем стремиться к минимуму ошибки. Будем постепенно формировать её структуру, и настраивать параметры. Таким образом, нейросеть запомнит величину взаимосвязей между входами и выходом.

После этого этапа обучения установился высокий уровень ошибки. Данную ситуацию необходимо срочно исправлять. Поэтому для улучшения модели добавим ещё один скрытый слой. По теории известно, что любая задача может решаться нейросетью с двумя слоями. В результате ошибка снизилась, но она оказалась нестабильной. Из этого положения скоро будет найден выход, а пока следующее.

Данная искусственная нейронная сеть имеет такую структуру: 4x12x3x1. Перемножив эти числа, получим общее число связей, которое составляет 144. Начальные значения поступают на 4 входа, показанные слева. Выходные значения подаются на один выходной слой, показанный справа. Между входным и выходным слоями имеются 2 скрытых слоя. В первом есть 12 нейронов, во втором - 3 нейрона. Здесь присутствует расширяющаяся схема. Цвета линий показывают силу взаимосвязей между узлами структуры.

Структура нейронной сети

Для оценки качества построенной модели рассмотрим диаграмму рассеяния. Центральная синяя прямая, проходящая по диагонали, представляет идеальную линию. На ней располагаются значки фактических данных, поданных на выход в процессе обучения. Они окрашены в зелёный цвет. Значения, рассчитанные моделью, показаны значками красного цвета. В наилучшем случае значки разных цветов должны совпадать. Сверху и снизу параллельно центральной линии приходят границы интервала точности.

gallery/dgrmrss