Skip to content

Latest commit

 

History

History
21 lines (15 loc) · 1.54 KB

tarea_1.md

File metadata and controls

21 lines (15 loc) · 1.54 KB

Tarea 1a (semana 2)

  1. Descargar el conjunto de datos winequality-red.csv. Se puede descargar desde aquí o desde aquí.
  2. Indicar cuáles son las variables numéricas y cuáles son las categóricas.
  3. Realizar un gráfico pairsplot de todas las variables numéricas.
  4. Calcular los estadísticos descriptivos para la variable alcohol. Separarlos por estadísticos de tendencia central y de dispersión.
  5. Usar StandardScaler de Scikit-Learn para estandarizar dos variables numéricas de su elección. Comparar los estadísticos descriptivos de las variables originales y las estandarizadas con histogramas.
  6. Usar MinMaxScaler Scikit-Learn para estandarizar dos variables numéricas de su elección. Comparar los estadísticos descriptivos de las variables originales y las estandarizadas con histogramas.

Referencias:

Tarea 2a (semana 3)

  1. Obtener una matriz de correlaciones de todas las variables numéricas excepto quality.
  2. Ordenar en orden descendente las correlaciones con respecto a density.
  3. Seleccionar aquellas variables cuyo valor absoluto de correlación con respecto a density sea mayor o igual a 0.4.
  4. ¿De qué variables depende (linealmente) más la densidad?