ggplot2 - Gráficos marginales

En este capítulo, analizaremos las gráficas marginales.

Comprensión de las gráficas marginales

Las gráficas marginales se utilizan para evaluar la relación entre dos variables y examinar sus distribuciones. Cuando hablamos de crear gráficas marginales, no son más que gráficas de dispersión que tienen histogramas, gráficas de caja o gráficas de puntos en los márgenes de los respectivos ejes x e y.

Los siguientes pasos se utilizarán para crear una gráfica marginal con R usando el paquete “ggExtra”. Este paquete está diseñado para mejorar las características del paquete "ggplot2" e incluye varias funciones para crear gráficos marginales exitosos.

Paso 1

Instale el paquete "ggExtra" usando el siguiente comando para una ejecución exitosa (si el paquete no está instalado en su sistema).

> install.packages("ggExtra")

Paso 2

Incluya las bibliotecas necesarias en el espacio de trabajo para crear gráficos marginales.

> library(ggplot2)
> library(ggExtra)

Paso 3

Leyendo el conjunto de datos requerido "mpg" que hemos utilizado en capítulos anteriores.

> data(mpg)
> head(mpg)
# A tibble: 6 x 11
manufacturer   model  displ   year   cyl   trans      drv   cty   hwy  fl  class
<chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
1 audi         a4     1.8     1999   4     auto(l5)   f     18    29   p   compa~
2 audi         a4     1.8     1999   4     manual(m5) f     21    29   p   compa~
3 audi         a4     2       2008   4     manual(m6) f     20    31   p   compa~
4 audi         a4     2       2008   4     auto(av)   f     21    30   p   compa~
5 audi         a4     2.8     1999   6     auto(l5)   f     16    26   p   compa~
6 audi         a4     2.8     1999   6     manual(m5) f     18    26   p   compa~
>

Etapa 4

Ahora creemos una gráfica simple usando “ggplot2” que nos ayudará a entender el concepto de gráficas marginales.

> #Plot
> g <- ggplot(mpg, aes(cty, hwy)) +
+    geom_count() +
+    geom_smooth(method="lm", se=F)
> g

Relación entre variables

Ahora creemos las gráficas marginales usando la función ggMarginal que ayuda a generar la relación entre dos atributos "hwy" y "cty".

> ggMarginal(g, type = "histogram", fill="transparent")
> ggMarginal(g, type = "boxplot", fill="transparent")

La salida de los gráficos marginales de histograma se menciona a continuación:

El resultado de las parcelas marginales de caja se menciona a continuación: