resueltos para online intervalos hacer ejercicios ejemplos diagrama conclusiones como caja bigotes bigote r ggplot2 boxplot

para - diagrama de caja y bigotes



En ggplot2, ¿qué representa el final de las líneas del diagrama de caja? (3)

No puedo encontrar una descripción de lo que representan los puntos finales de las líneas de un diagrama de caja.

Por ejemplo, aquí hay valores de puntos arriba y abajo donde terminan las líneas.

(Me doy cuenta de que la parte superior e inferior de la caja son percentiles 25 y 75, y la línea central es la 50). Supongo que, como hay puntos arriba y debajo de las líneas, no representan los valores max / min.


Creo que ggplot usa los valores predeterminados estándar, al igual que el diagrama de caja: "los bigotes se extienden hasta el punto de datos más extremos que no es más de [1.5] veces la longitud de la caja lejos de la caja"

Ver: boxplot.stats


Los "puntos" al final de la gráfica de caja representan valores atípicos. Hay varias reglas diferentes para determinar si un punto es un valor atípico, pero el método que R y ggplot usan es la "regla 1.5". Si un punto de datos es:

  • menos de Q1 - 1.5 * IQR
  • mayor que Q3 + 1.5 * IQR

entonces ese punto se clasifica como un "valor atípico". Los bigotes se definen como:

bigote superior = min (max (x), Q_3 + 1.5 * IQR)

barba inferior = max (min (x), Q_1 - 1.5 * IQR)

donde IQR = Q_3 - Q_1, la longitud de la caja. Por lo tanto, el bigote superior se encuentra en el menor valor de x máximo y Q_3 + 1.5 IQR, mientras que el bigote inferior se encuentra en el mayor del menor valor xy Q_1 - 1.5 IQR.

Información Adicional

  • Consulte la página de diagrama de caja de wikipedia para conocer las reglas de valores atípicos alternativos.
  • En realidad, hay una variedad de formas de calcular cuantiles. Eche un vistazo a `? Cuantile para la descripción de los nueve métodos diferentes.

Ejemplo

Considera el siguiente ejemplo

> set.seed(1) > x = rlnorm(20, 1/2)#skewed data > par(mfrow=c(1,3)) > boxplot(x, range=1.7, main="range=1.7") > boxplot(x, range=1.5, main="range=1.5")#default > boxplot(x, range=0, main="range=0")#The same as range="Very big number"

Esto da la siguiente trama:

A medida que disminuimos el rango de 1.7 a 1.5, reducimos la longitud del bigote. Sin embargo, range=0 es un caso especial - es equivalente a "range = infinito"


Tutorial de P1IMSA 8 - Descripción del video de Box and Whisker Plots ofrece una explicación visual paso a paso del cuadro (Tukey) y diagramas de bigotes.

En 4m 23s explico el significado de los extremos de bigotes y su relación con el 1.5 * IQR.

Aunque el gráfico que se muestra en el video se representó utilizando D3.js en lugar de R, sus explicaciones se corresponden con las implementaciones R de los diagramas de caja mencionados.