Обнаружение нетипичного потребления интернет-трафика абонентами компании — оператора связи с целью определения взлома оборудования абонента
Данное задание предполагает проведение анализа представленных данных о потреблении интернет-трафика абонентами. Нетипичное изменение расхода трафика может сигнализировать о взломе оборудования абонента и установке на него вредоносного ПО — например для спам-рассылок, DDoS-атак и т.д. Выявление таких фактов помогает временно заблокировать учетную запись абонента, до исправления ситуации
Для решения этой задачи необходимо использовать методы очистки данных, загрузки данных, расчет витрин данных и т. д. Помимо анализа данных, важно применять практики управления данными (data governance) для контроля качества данных на всех этапах анализа (data quality), определения происхождения данных (data lineage), описания глоссария данных
Полученные результаты помогут в улучшении качества обслуживания клиентов оператора связи
Необходимо на основе имеющихся данных построить набор выходных таблиц с интервалом расчета в 1 час входных данных и содержащих информацию о расходе трафика потребителями и признака подозрения на взлом. Схема входных данных и витрины, а также основания для детекции указанной аномалии представлены в детальном описании