Este repositorio contiene un proyecto de análisis de datos basado en los resultados de las elecciones presidenciales de Estados Unidos de 2020. El objetivo es aplicar técnicas de aprendizaje supervisado y no supervisado para explorar los patrones, tendencias y resultados de las votaciones. Además, utilizaremos diversas metodologías de ciencia de datos para visualizar y predecir el comportamiento electoral.
- Exploración de datos: Limpiar y preparar los datos de las elecciones para análisis.
- Análisis supervisado: Construcción de modelos predictivos utilizando los datos históricos.
- Análisis no supervisado: Descubrimiento de patrones ocultos mediante técnicas como el clustering.
- Visualización: Creación de gráficos e informes interactivos para visualizar los resultados y conclusiones clave.
-
Aprendizaje Supervisado 🧠:
- Regresión logística
- Árboles de decisión
- Random Forest
- Análisis discriminante
- Naive Bayes
- KNN
-
Aprendizaje No Supervisado 🌀:
- Clustering (K-Means)
- Análisis de Componentes Principales (PCA)
-
Visualización de Datos 📈:
- Gráficos de distribución del voto
- Mapas interactivos
- Series temporales y tendencias de participación
├── data/ # Datos crudos de las elecciones └── README.md # Este archivo
- Python 🐍
- Pandas, NumPy
- Scikit-learn
- Matplotlib, Seaborn
- Plotly (para visualizaciones interactivas)
- Jupyter Notebooks 📓
- Git y GitHub 🛠️
Los datos incluyen los resultados por circunscripción, así como características demográficas y socioeconómicas adicionales.
2020_US_County_Level_Presidential_Results.csv
: Datos electorales por US county.
county_complete.csv
: Datos con las características socioeconómicas y demográficas en cada US county.
URL datasets características 📊
- Modelos predictivos para prever resultados electorales en futuras elecciones.
- Descubrimiento de clústeres de comportamiento electoral por regiones.
- Análisis de cómo variables demográficas impactan en los resultados.
En progreso 🚀. Actualmente estamos en la fase de preprocesamiento de datos y exploración inicial.
¡Las contribuciones son bienvenidas! Si te interesa colaborar en este proyecto, no dudes en hacer un fork, abrir una pull request o reportar problemas.
- [Lucía Cordero] - Máster en IA Aplicada - Métodos Probabilísticos en IA
- [Cristina Sanchís] - Máster en IA Aplicada - Métodos Probabilísticos en IA
- [Jorge Garcelán] - Máster en IA Aplicada - Métodos Probabilísticos en IA
Este proyecto está bajo la licencia MIT.
¡Gracias por tu interés en este proyecto! Si te gustó, no olvides darle una estrella ⭐ en GitHub.