Новый взгляд аналитики

ОЦЕНКА ДИНАМИКИ УВЕРЕННОСТИ

 

Заблудиться в массиве можно очень легко. Совсем другое дело, когда это отдельный временной ряд. Они бывают разными, случаются пропуски и аномалии. Для выявления тенденции надлежит провести сглаживание. Целью этой операции является ослабление случайной составляющей по отношению к тренду. Обычно её проводят над несколькими рядами в наборе.

Методы для сглаживания используют различные. Обычно применяют скользящую среднюю и экспоненциальное сглаживание. Это полезно делать в качестве предобработки перед построением уравнения регрессии. Лишь небольшое число программ имеют необходимые инструменты. Ещё меньше систем дают возможность создавать собственные алгоритмы выравнивания.

Иногда разрабатываются новые методики для конкретных ситуаций. Начальный анализ временных рядов обычно содержит три операции. Это сглаживание временных рядов, выявление и устранение аномальных наблюдений. Только после этого следует выявлять возможные тенденции в рядах. Ниже показана схема составления оригинального алгоритма. Для визуального проектирования и составления сценария использовалась программа Loginom.

Сценарий Loginom, сглаживание

Необходимо также учитывать, что колебания значений в рядах совершенно разные. В случае их большого количества изучить динамику каждого крайне сложно. Наилучшим способом представляется визуализация каждого ряда массива отдельно. Сравнить во времени динамику фактических и сглаженных значений. Таким образом, можно оценить качество применённого алгоритма сглаживания. Рекомендуется применять единый алгоритм для всех временных рядов массива.

Обычно качество получаемых гладких величин ряда оценивается с помощью доверительных интервала и вероятности. Устанавливая эти показатели можно отбраковать аномалии и получить более адекватные значения. Такая вероятность всего лишь одно число для целого временного ряда. Это хорошо для моделирования. Если нужно определить отклонение фактического значения от нового используется степень уверенности.

Это принципиально новый подход к оценке качества данных. Она удобна тем, что является целым числом и меняется от нуля до ста включительно. Первое значение показывает абсолютную неуверенность и мало применяется. Второе, наоборот, показывает на отсутствие изменения или на исторический факт. Обычно это бухгалтерские данные. Для каждого значения ряда, даже при отсутствии значения, может быть определена уверенность.

Она является ступенчатой функцией и существует граница, ниже которой величина признаётся абсолютно неизвестной. Степень может принудительно устанавливаться пользователем. Ориентируясь на уверенность можно сохранить качество и информационную ценность рядов. Это очень удобно в управлении и использовании данных.

Далее представлен дашборд, показывающий колебания во времени фактических и сглаженных данных. На графике можно оценить качество созданного алгоритма. Наглядно видно адекватность для отдельных значений. Дополнительно справа указаны номера групп товаров. Используются данные продаж мясных изделий из мяса за некоторый период.

Дашборд оценки сглаживания