Seaborn - Cuadrícula de facetas

Un enfoque útil para explorar datos de dimensiones medias es dibujar varias instancias del mismo gráfico en diferentes subconjuntos de su conjunto de datos.

Esta técnica se denomina comúnmente trazado en "celosía" o "enrejado" y está relacionada con la idea de "múltiplos pequeños".

Para usar estas funciones, sus datos deben estar en un Pandas DataFrame.

Trazar pequeños múltiplos de subconjuntos de datos

En el capítulo anterior, hemos visto el ejemplo de FacetGrid donde la clase FacetGrid ayuda a visualizar la distribución de una variable, así como la relación entre múltiples variables por separado dentro de subconjuntos de su conjunto de datos usando múltiples paneles.

Un FacetGrid se puede dibujar con hasta tres dimensiones: fila, columna y tono. Los dos primeros tienen una correspondencia obvia con el conjunto de ejes resultante; Piense en la variable de tono como una tercera dimensión a lo largo de un eje de profundidad, donde se trazan diferentes niveles con diferentes colores.

FacetGrid El objeto toma un marco de datos como entrada y los nombres de las variables que formarán las dimensiones de fila, columna o tono de la cuadrícula.

Las variables deben ser categóricas y los datos de cada nivel de la variable se utilizarán para una faceta a lo largo de ese eje.

Ejemplo

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
g = sb.FacetGrid(df, col = "time")
plt.show()

Salida

En el ejemplo anterior, acabamos de inicializar el facetgrid objeto que no dibuja nada sobre ellos.

El enfoque principal para visualizar datos en esta cuadrícula es con el FacetGrid.map()método. Veamos la distribución de consejos en cada uno de estos subconjuntos, usando un histograma.

Ejemplo

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
g = sb.FacetGrid(df, col = "time")
g.map(plt.hist, "tip")
plt.show()

Salida

El número de parcelas es más de uno debido al parámetro col. Hablamos sobre el parámetro col en nuestros capítulos anteriores.

Para hacer una gráfica relacional, pase los nombres de múltiples variables.

Ejemplo

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
g = sb.FacetGrid(df, col = "sex", hue = "smoker")
g.map(plt.scatter, "total_bill", "tip")
plt.show()

Salida