instalar - ggplot2 descargar
Explique la advertencia de ggplot2: "Se eliminaron k filas que contienen valores faltantes" (2)
El comportamiento que está viendo se debe a cómo
ggplot2
maneja los datos que están fuera de los rangos de eje del gráfico.
Puede cambiar este comportamiento dependiendo de si usa
scale_y_continuous
(o, equivalentemente,
ylim
) o
coord_cartesian
para establecer rangos de eje, como se explica a continuación.
library(ggplot2)
# All points are visible in the plot
ggplot(mtcars, aes(mpg, hp)) +
geom_point()
En el siguiente código, un punto con hp = 335 está fuera del rango y de la gráfica.
Además, debido a que usamos
scale_y_continuous
para establecer el rango del eje y, este punto no se incluye en ninguna otra estadística o medida de resumen calculada por ggplot, como la línea de regresión lineal.
ggplot(mtcars, aes(mpg, hp)) +
geom_point() +
scale_y_continuous(limits=c(0,300)) + # Change this to limits=c(0,335) and the warning disappars
geom_smooth(method="lm")
Warning messages:
1: Removed 1 rows containing missing values (stat_smooth).
2: Removed 1 rows containing missing values (geom_point).
En el siguiente código, el punto con hp = 335 todavía está fuera del rango y de la gráfica, pero este punto se incluye en cualquier estadística o medida de resumen que calcula ggplot, como la línea de regresión lineal.
Esto se debe a que usamos
coord_cartesian
para establecer el rango del eje y, y esta función no excluye los puntos que están fuera de los rangos de la trama cuando realiza otros cálculos en los datos.
Si compara esto y el gráfico anterior, puede ver que la línea de regresión lineal en el segundo gráfico tiene una pendiente ligeramente más pronunciada, porque el punto con hp = 335 se incluye al calcular la línea de regresión, aunque no sea visible en el gráfico .
ggplot(mtcars, aes(mpg, hp)) +
geom_point() +
coord_cartesian(ylim=c(0,300)) +
geom_smooth(method="lm")
Recibo esta advertencia cuando intento generar un diagrama con
ggplot
.
Después de investigar en línea durante un tiempo, muchos sugirieron que mi base de datos contiene valores nulos o datos faltantes en general, lo cual no fue el caso.
En esta pregunta, la respuesta aceptada dice lo siguiente:
La advertencia significa que algunos elementos se eliminan porque caen fuera del rango especificado
Me preguntaba a qué se refiere exactamente este rango y cómo alguien puede aumentarlo manualmente para evitar todas las advertencias.
Solo por el batido completando la respuesta dada por eipi10.
Estaba enfrentando el mismo problema, sin usar
scale_y_continuous
ni
coord_cartesian
.
El conflicto provenía del eje x, donde definí
limits = c(1, 30)
.
Parece que tales límites no proporcionan suficiente espacio si quieres "esquivar" tus barras, por lo que R aún arroja el error
Se eliminaron 8 filas que contienen valores faltantes (geom_bar)
Ajustar los límites del eje x a los
limits = c(0, 31)
resolvió el problema.
En conclusión, incluso si no está poniendo límites a su eje y, verifique el comportamiento de su eje x para asegurarse de tener suficiente espacio