на главную

ДОБРАЯ КЛАССИФИКАЦИЯ УСЛУГ

 

Компания предоставляет частным лицам услуги связи. Разработан комплекс из 36 конфигураций. Ведётся учёт действий пользователей, количество которых насчитывает 45033. Частота оплаты меняется от 1 до 84. За квартал обслуживания накопилось 202803 записи. Для лучшего понимания ситуации необходимо сформировать классы клиентов и критерии отбора.

Для достижения цели воспользуемся деревьями решений (decision trees). Так называется один из наиболее эффективных методов интеллектуального анализа данных. Он поможет решить задачу классификации. Для его работы имеющихся сведений недостаточно, нужны дополнительные. Подготовим их с помощью другой технологии.

Сначала сгруппируем значения по каждому покупателю. Проведём кластеризацию множества по методу k-средних. Она объединит элементы в сравнительно однородные группы. Учитываются следующие показатели: число заказов, число и сумма платежей. Начиная с расширенных границ и постепенно уменьшая погрешности, получим семь сегментов.

Отделим шум в виде набора из семи записей. Он набирает 0,02%, что показывает крайне высокое качество исходной информации. Полученный массив снова подвергнем аналогичной подробной обработке и выделим девять кластеров. Получена надёжная модель, результаты которой будут применяться в дальнейшем.

В заключении построим модель на фундаменте алгоритма C4.5. Выходным полем считаем номер расчётной группы. Сразу участвовали три представленные характеристики. Меньшую значимость в 2,4% показала «сумма платежей», далее используем только оставшиеся. Управляя минимальным количеством примеров в узле и границей отсечения, построим конечное дерево решений.

Оно сформировалось компактным с наиболее достоверными правилами. Значимость чисел по платежам и заказам составляет соответственно 74,2% и 25,8%. Все операции проводились на аналитической платформе Deductor. Ниже представлены итоги, созданная структура и заполнение кластеров. Последние являются теми классами с критериями, которые определены в виде цели.

Деревья решений классификации
Таблица сопряженности кластеров
Таблица наполнения кластеров