Seaborn - Visualización de la relación por parejas

Los conjuntos de datos en estudio en tiempo real contienen muchas variables. En tales casos, se debe analizar la relación entre todas y cada una de las variables. Trazar la distribución bivariada para (n, 2) combinaciones será un proceso muy complejo y que llevará mucho tiempo.

Para trazar múltiples distribuciones bivariadas por pares en un conjunto de datos, puede usar el pairplot()función. Esto muestra la relación para (n, 2) combinación de variables en un DataFrame como una matriz de gráficos y los gráficos diagonales son los gráficos univariados.

Ejes

En esta sección, aprenderemos qué son los ejes, su uso, parámetros, etc.

Uso

seaborn.pairplot(data,…)

Parámetros

La siguiente tabla enumera los parámetros de los ejes:

No Señor. Descripción de parámetros
1

data

Marco de datos

2

hue

Variable en datos para mapear aspectos de la trama a diferentes colores.

3

palette

Conjunto de colores para mapear la variable de tono

4

kind

Tipo de trama para las relaciones de no identidad. {'dispersión', 'reg'}

5

diag_kind

Tipo de trama para las subtramas diagonales. {'hist', 'kde'}

Excepto los datos, todos los demás parámetros son opcionales. Hay algunos otros parámetros quepairplotpoder aceptar. Los mencionados anteriormente son params de uso frecuente.

Ejemplo

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.set_style("ticks")
sb.pairplot(df,hue = 'species',diag_kind = "kde",kind = "scatter",palette = "husl")
plt.show()

Salida

Podemos observar las variaciones en cada parcela. Los gráficos están en formato de matriz donde el nombre de la fila representa el eje xy el nombre de la columna representa el eje y.

Las gráficas diagonales son gráficas de densidad de kernel donde las otras gráficas son gráficas de dispersión como se mencionó.