- Descargar el conjunto de datos
winequality-red.csv
. Se puede descargar desde aquí o desde aquí. - Indicar cuáles son las variables numéricas y cuáles son las categóricas.
- Realizar un gráfico pairsplot de todas las variables numéricas.
- Calcular los estadísticos descriptivos para la variable
alcohol.
Separarlos por estadísticos de tendencia central y de dispersión. - Usar StandardScaler de Scikit-Learn para estandarizar dos variables numéricas de su elección. Comparar los estadísticos descriptivos de las variables originales y las estandarizadas con histogramas.
- Usar MinMaxScaler Scikit-Learn para estandarizar dos variables numéricas de su elección. Comparar los estadísticos descriptivos de las variables originales y las estandarizadas con histogramas.
Referencias:
- Obtener una matriz de correlaciones de todas las variables numéricas excepto
quality
. - Ordenar en orden descendente las correlaciones con respecto a
density
. - Seleccionar aquellas variables cuyo valor absoluto de correlación con respecto a
density
sea mayor o igual a 0.4. - ¿De qué variables depende (linealmente) más la densidad?