Skip to content

Latest commit

 

History

History
37 lines (29 loc) · 2.11 KB

proyecto_final.md

File metadata and controls

37 lines (29 loc) · 2.11 KB

Formato de entrega

ITESO

DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA

ANÁLISIS ESTADÍSTICO MULTIVARIADO

SOLUCIÓN A UN PROBLEMA DE REGRESIÓN LOGÍSTICA.

El objetivo específico del proyecto es determinar la relación existente entre una variable dependiente y una o más variables independientes utilizando regresión logística múltiple.

Para la realización de este proyecto se contemplan las siguientes actividades:

  1. Elegir una base de datos apropiada de Kaggle para el análisis de regresión logística.
  2. Realizar análisis descriptivo, e.g., cómo se distribuyen las variables, datos faltantes, conteo para la variable target (para evaluar si hay un desbalance de clases).
  3. Realizar selección de variables con Método de Regularización L1 (Lasso) previo a la regresión logística. En esta notebook explico cómo.
  4. Explica brevemente qué es el penalty, qué tipos de penalty hay para LASSO y sus diferencias.
  5. Dividir la base de datos en conjuntos de entrenamiento (train) y prueba (test).
  6. Entrenar un modelo de regresión logística múltiple con el conjunto de entrenamiento.
  7. Probar el modelo con el conjunto de prueba y obtener métricas relevantes.
  8. Decidir si el modelo necesita alguna técnica como SMOTE para corregir el desbalance de clases.
  9. Interpretar los resultados obtenidos (analizar qué significan los estimadores, determinar qué variables tienen un impacto positivo o negativo en la respuesta, etc.).
  10. Realizar conclusiones en base a los resultados.

Entregables:

a) Reporte que valide la realización de las actividades.

Especificaciones generales:

  • El reporte de trabajo realizado se entregará en digital (CANVAS) en un documento elaborado en computadora (no fotografías de hojas o cuadernos) e incluirá como mínimo:
    • Portada.
    • Introducción.
    • Descripción de la base de datos.
    • Objetivo.
    • Desarrollo.
    • Resultados.
    • Conclusiones.
    • Incluir el link para acceder a la base de datos en Kaggle y el código que generaron para la realización del proyecto.