Seaborn - Estimación estadística
En la mayoría de las situaciones, tratamos con estimaciones de la distribución total de los datos. Pero cuando se trata de la estimación de tendencia central, necesitamos una forma específica de resumir la distribución. La media y la mediana son las técnicas más utilizadas para estimar la tendencia central de la distribución.
En todas las tramas que aprendimos en el apartado anterior, realizamos la visualización de toda la distribución. Ahora, analicemos las parcelas con las que podemos estimar la tendencia central de la distribución.
Gráfico de barras
los barplot()muestra la relación entre una variable categórica y una variable continua. Los datos se representan en barras rectangulares donde la longitud de la barra representa la proporción de los datos en esa categoría.
El diagrama de barras representa la estimación de la tendencia central. Usemos el conjunto de datos 'titánico' para aprender diagramas de barras.
Ejemplo
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.barplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()
Salida
En el ejemplo anterior, podemos ver que el número promedio de supervivencias de hombres y mujeres en cada clase. De la trama podemos entender que sobrevivieron más hembras que machos. Tanto en machos como en hembras, la mayor parte de las supervivencias son de primera clase.
Un caso especial en el diagrama de barras es mostrar el número de observaciones en cada categoría en lugar de calcular una estadística para una segunda variable. Para esto usamoscountplot().
Ejemplo
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.countplot(x = " class ", data = df, palette = "Blues");
plt.show()
Salida
Plot dice que el número de pasajeros en la tercera clase es mayor que en la primera y segunda clase.
Gráficos de puntos
Los gráficos de puntos sirven igual que los gráficos de barras pero con un estilo diferente. En lugar de la barra completa, el valor de la estimación está representado por el punto a una cierta altura en el otro eje.
Ejemplo
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.pointplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()