Desarrollar un modelo para predecir cancelaciones de reservas hoteleras y entender los factores clave que las influyen.
-
Exploración y Limpieza de Datos
- Eliminación de valores nulos y transformación de variables relevantes.
-
División de Datos
- Separación en entrenamiento (70%), validación (15%) y prueba (15%).
-
Modelado
- Regresión Logística para interpretar el impacto de variables clave.
- Modelos de Machine Learning: LDA, SVM, Random Forest, XGBoost, Redes Neuronales, entre otros.
-
Resultados
- Random Forest fue el mejor modelo con 85.23% de exactitud.
- Lead time y previous cancellations son los principales predictores.
- Se puede anticipar cancelaciones con alta precisión.
- Recomendación: mejorar la especificidad del modelo y aplicar estrategias para reducir cancelaciones.