Новый взгляд аналитики

СИЛА ЛИЧНОГО ПОТРЕБЛЕНИЯ

 

Большая семья переезжает в частный дом с готовой планировкой. В нём электрические коммуникации разведены на три части. Первый элемент представлен кухней с посудомоечной машиной, духовкой и микроволновкой.


Вторым является ванная со стиральной машиной и барабанным сушителем, также имеются холодильник и свет. В последней группе находятся электрический водонагреватель и кондиционер. Для каждого пространства установлен счётчик, учитывающий расход электричества и находящийся внутри коттеджа.


За несколько лет с момента покупки накопились данные об израсходовании электроэнергии. За 47 месяцев собралось более 2075 тыс. записей с поминутной детализацией. Числовые значения с декабря 2006 по ноябрь 2010 распределены между несколькими измерениями. Ими являются общие активная и реактивная мощности, сила и напряжение тока. Автоматические счётчики по ним находятся в закрытом уличном шкафу.


Задачей назначено предсказание ежедневного потребления жильцами энергии из электрических розеток. Оно предусматривает построение прогнозной модели на основании наружной информации. Дополнительно семейство предоставило числа по внутренним приборам учёта.


На первом этапе рассчитаем новое измерение. А именно найдём разность между активной мощностью и суммой величин указанных выше пространств. Будем считать его индивидуальным потреблением жильцов.


Проведём оценку качества сведений, определим количество пропусков. Они составляют около 1,25%. Отрезки пропусков имеют различную продолжительность от одной минуты до целого дня. Для стабилизации колебаний сгруппируем минутные сведения по датам. Вся динамика показана на рисунке. Представленный далее текст существует как гипотеза, основанная на этом массиве. Моделирование и графики выполнены в программе Loginom.

График исходной динамики потребления электроэнергии

Начиная с 16.12.2006 производился ремонт жилища для семейства и закончился 24.04.2007. Это показывает большой размах колебаний мощности и её максимальная величина. Они значительно превышают среднее за аналогичные месяцы последующих лет. Далее оставлено небольшое томление для жилища.


Уже с мая в нём обосновались жильцы. В середине октября 2007 они уезжали на регулярное недельное мероприятие. В начале декабря к ним приехали гости, совместная радость затянулась до окончания зимних праздников. Жарким в 2008 году выдался август. Большинство членов фамилии поехало в длительный отдых.


В зимний сезон 2008-2009 снова вернулись гости. Все радовались жизни по выходным с утра до ночи. В последующий временной отрезок таких торжеств не наблюдается. Ведь уже прошло два года с момента заселения. Семья стала меньше, и жизнь повернула в стабильное русло.


На втором этапе сделаем очистку и трансформацию исходных данных. Удалим записи некорректных интервалов начале и конце временного массива. Они совершенно не отражают типичную динамику. Это необходимо для построения качественной структуры для прогнозирования. Поэтому сдвинулись границы - начальная на 04.06.2007 и конечная на 25.11.2010.


Далее используем данные с детализацией по часам каждого дня. Исходные пропуски заполним усреднёнными часовыми величинами по номерам недель смежных лет. Объединим по датам, сокращённые границами, значения. Усредним числа с помощью окна и проведём сглаживание фильтрами. Передадим полученные результаты для обучения модели.


Использовалась нейросеть, специально подобранная для регрессии. В ней, наряду с начальными сведениями, ещё представляются и прогнозы для проверки. Генеральная совокупность была разделена случайным образом на 2 набора - тренировочный и проверочный в пропорции 82:18.


Первая часть аналогично разложена на обучающее и тестовое множества в пропорции 90:10. Именно на них обучалась нейронная сеть. Минимальную ошибку в этом процессе показала архитектура 4x8x1.


На вход подавались показатели четырёх факторов. Один скрытый слой содержит восемь нейронов, в них использовалась сигмоидная функция. Единственным выходом значится объём личной утилизации электроэнергии.


В заключении осуществим моделирование на основе проверочного набора. На следующем рисунке можно увидеть и сравнить фактические, сглаженные и предиктивные параметры. Отклонение фактических и прогнозных сумм за весь выделенный период составило менее 0,4%.


Это означает, что можно точно рассчитать личного потребления по каждому дню и суммарно по месяцу. Это не требует дополнительной проверки и прохода на личную территорию. Полученную структуру параметров следует ежегодно переобучать.

График совмещения исходных и модельных данных