Skip to content

jorgegarcelan/elections_usa_2020

Repository files navigation

🗳️ Análisis de las Elecciones Presidenciales de Estados Unidos 2020

Este repositorio contiene un proyecto de análisis de datos basado en los resultados de las elecciones presidenciales de Estados Unidos de 2020. El objetivo es aplicar técnicas de aprendizaje supervisado y no supervisado para explorar los patrones, tendencias y resultados de las votaciones. Además, utilizaremos diversas metodologías de ciencia de datos para visualizar y predecir el comportamiento electoral.

🚀 Objetivos del Proyecto

  • Exploración de datos: Limpiar y preparar los datos de las elecciones para análisis.
  • Análisis supervisado: Construcción de modelos predictivos utilizando los datos históricos.
  • Análisis no supervisado: Descubrimiento de patrones ocultos mediante técnicas como el clustering.
  • Visualización: Creación de gráficos e informes interactivos para visualizar los resultados y conclusiones clave.

📊 Técnicas a Utilizar

  1. Aprendizaje Supervisado 🧠:

    • Regresión logística
    • Árboles de decisión
    • Random Forest
    • Análisis discriminante
    • Naive Bayes
    • KNN
  2. Aprendizaje No Supervisado 🌀:

    • Clustering (K-Means)
    • Análisis de Componentes Principales (PCA)
  3. Visualización de Datos 📈:

    • Gráficos de distribución del voto
    • Mapas interactivos
    • Series temporales y tendencias de participación

🗂️ Estructura del Proyecto

├── data/ # Datos crudos de las elecciones └── README.md # Este archivo

🔧 Herramientas y Tecnologías

  • Python 🐍
    • Pandas, NumPy
    • Scikit-learn
    • Matplotlib, Seaborn
    • Plotly (para visualizaciones interactivas)
  • Jupyter Notebooks 📓
  • Git y GitHub 🛠️

📈 Dataset

Los datos incluyen los resultados por circunscripción, así como características demográficas y socioeconómicas adicionales.

Datasets Electorales

  • 2020_US_County_Level_Presidential_Results.csv: Datos electorales por US county.

URL datasets electorales 📊

Datasets Características Población

  • county_complete.csv: Datos con las características socioeconómicas y demográficas en cada US county.

URL datasets características 📊

🔮 Posibles Resultados

  • Modelos predictivos para prever resultados electorales en futuras elecciones.
  • Descubrimiento de clústeres de comportamiento electoral por regiones.
  • Análisis de cómo variables demográficas impactan en los resultados.

🚧 Estado del Proyecto

En progreso 🚀. Actualmente estamos en la fase de preprocesamiento de datos y exploración inicial.

📝 Contribuciones

¡Las contribuciones son bienvenidas! Si te interesa colaborar en este proyecto, no dudes en hacer un fork, abrir una pull request o reportar problemas.

🧑‍💻 Autores

  • [Lucía Cordero] - Máster en IA Aplicada - Métodos Probabilísticos en IA
  • [Cristina Sanchís] - Máster en IA Aplicada - Métodos Probabilísticos en IA
  • [Jorge Garcelán] - Máster en IA Aplicada - Métodos Probabilísticos en IA

📝 Licencia

Este proyecto está bajo la licencia MIT.


¡Gracias por tu interés en este proyecto! Si te gustó, no olvides darle una estrella ⭐ en GitHub.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •