Данный проект представляет собой решение задачи бинарной классификации для прогнозирования, совершит ли клиент интернет-магазина одежды покупку в течение следующих 90 дней. Модель анализирует историю транзакций, взаимодействие с маркетинговыми кампаниями и общую эффективность этих кампаний для выявления наиболее перспективных клиентов.
Цель: Оптимизировать маркетинговые усилия, предоставляя бизнесу инструмент для ранжирования клиентов по вероятности совершения покупки. Основной метрикой качества является ROC-AUC.
.
├── data/ # Папка с исходными данными (не включена в репозиторий)
├── apparel_purchase_prediction.ipynb # Jupyter Notebook с полным циклом анализа и моделирования
├── requirements.txt # Список необходимых библиотек
└── README.md # Данный файл
Финальная модель показала ROC-AUC = 0.7534 на отложенной тестовой выборке, подтвердив свою надежность и отсутствие переобучения.
Анализ коэффициентов модели позволил сформулировать следующие бизнес-рекомендации:
-
Фокус на «неопределившихся». Самый перспективный сегмент — клиенты без явного предпочтения канала коммуникации (
emailилиpush). Они наиболее восприимчивы к маркетингу. -
Борьба с «баннерной слепотой». Клиенты, «запертые» в одном канале, покупают реже. Требуется ротация каналов для "уставшей" аудитории, чтобы повысить их отклик.
-
Регулярный контакт важнее покупок. Давность последнего взаимодействия с клиентом (открытие письма, клик) оказалась более значимым негативным фактором, чем давность последней покупки. Удержание требует постоянного контакта.