geom_col - ggplot geom_bar: significado de aes(grupo=1)
ggplot title (2)
Estoy aprendiendo geom_bar en la sección 3.7 de r4ds.had.co.nz. Ejecuto un código como este:
library(ggplot2)
ggplot(data = diamonds) + geom_bar(mapping = aes(x = cut, y = ..prop.., group = 1))
Entonces tengo esta trama:
El punto es, si excluyo la parte "grupo = 1":
library(ggplot2)
ggplot(data = diamonds) + geom_bar(mapping = aes(x = cut, y = ..prop..))
La trama estará mal,
Pero si sustituyo el grupo = 1 por el grupo = 2 o el grupo = "x", la gráfica aún se ve correcta. Así que no entiendo bien el significado de grupo = 1 aquí y cómo usarlo.
El grupo ayudará a la gráfica a observar las filas específicas que contienen el corte específico y la proporción se encuentra con respecto a la base de datos completa como proporción del corte ideal en el conjunto de datos completo.
Si no se usa el grupo, la proporción se calcula con respecto a los datos que contienen ese campo y, en última instancia, será del 100% en cualquier caso. Por ejemplo, la proporción de un corte ideal en los datos específicos del corte ideal será 1.
group="whatever"
es una agrupación "ficticia" para anular el comportamiento predeterminado, que (aquí) es agrupar por cut
y en general es agrupar por la variable x. El valor predeterminado para geom_bar
es agrupar por la variable x para contar por separado el número de filas en cada nivel de la variable x. Por ejemplo, aquí, el valor predeterminado sería que geom_bar
devuelva el número de filas con cut
igual a "Aceptable", "Bueno", etc.
Sin embargo, si queremos proporciones, debemos considerar todos los niveles de cut
juntos. En la segunda gráfica, los datos se agrupan primero por cut
, por lo que cada nivel de cut
se considera por separado. La proporción de Feria en Feria es del 100%, al igual que la proporción de Bien en Bien, etc. group=1
(o group="x"
, etc.) evita esto, por lo que las proporciones de cada nivel de corte serán relativas A todos los niveles de corte.