Предсказание оценки отеля по отзывам постояльцев на основе данных с Booking.com.
Задача — предсказать числовую оценку (reviewer_score), которую гость поставит отелю, используя текстовые отзывы, метаданные отеля и информацию о рецензенте.
Метрика: MAPE (Mean Absolute Percentage Error)
Лучший результат: 0.1195
Модель: Random Forest Regressor
Датасет содержит отзывы об отелях Европы (Лондон, Париж, Амстердам, Милан, Вена, Барселона).
Для проверки статистических гипотез использовались непараметрические тесты (критерий Краскела-Уоллиса, U-критерий Манна-Уитни), так как данные не соответствуют нормальному распределению.
BinaryEncoderдля признаков с высокой кардинальностью (район, почтовый индекс)OneHotEncoderдля остальных категориальных признаков
RandomForestRegressor(n_estimators=100, random_state=42)git clone https://github.com/your-username/hotel-review-score-prediction.git
cd hotel-review-score-prediction
pip install -r requirements.txt
jupyter notebook EDA_Project_3_model.ipynb