Skip to content

ProWalker/booking_score_prediction

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🏨 Hotel Review Score Prediction

Предсказание оценки отеля по отзывам постояльцев на основе данных с Booking.com.

О проекте

Задача — предсказать числовую оценку (reviewer_score), которую гость поставит отелю, используя текстовые отзывы, метаданные отеля и информацию о рецензенте.

Метрика: MAPE (Mean Absolute Percentage Error)
Лучший результат: 0.1195
Модель: Random Forest Regressor

Данные

Датасет содержит отзывы об отелях Европы (Лондон, Париж, Амстердам, Милан, Вена, Барселона).

Методология

1. EDA и проверка гипотез

Для проверки статистических гипотез использовались непараметрические тесты (критерий Краскела-Уоллиса, U-критерий Манна-Уитни), так как данные не соответствуют нормальному распределению.

2. Кодирование категориальных признаков

  • BinaryEncoder для признаков с высокой кардинальностью (район, почтовый индекс)
  • OneHotEncoder для остальных категориальных признаков

3. Модель

RandomForestRegressor(n_estimators=100, random_state=42)

Установка и запуск

Клонировать репозиторий

git clone https://github.com/your-username/hotel-review-score-prediction.git
cd hotel-review-score-prediction

Установить зависимости

pip install -r requirements.txt

Скачать датасет и закинуть его в папку data

ссылка на google drive

Запустить ноутбук

jupyter notebook EDA_Project_3_model.ipynb

About

Репозиторий демонстрирующий работу с анализом и подготовкой данных для предсказания оценки отелей

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors