Un diagrama de caja que también se conoce como diagrama de bigotes muestra un resumen de un conjunto de datos que contiene el mínimo, el primer cuartil, la mediana, el tercer cuartil y el máximo. En un diagrama de caja, dibujamos una caja desde el primer cuartil hasta el tercer cuartil. Una línea vertical atraviesa el cuadro en la mediana. Los bigotes van de cada cuartil al mínimo o al máximo.
Creemos los datos para los diagramas de caja. Usamos elnumpy.random.normal()función para crear los datos falsos. Se necesitan tres argumentos, la desviación estándar y media de la distribución normal y el número de valores deseados.
np.random.seed(10)
collectn_1 = np.random.normal(100, 10, 200)
collectn_2 = np.random.normal(80, 30, 200)
collectn_3 = np.random.normal(90, 20, 200)
collectn_4 = np.random.normal(70, 25, 200)
La lista de matrices que creamos arriba es la única entrada requerida para crear el diagrama de caja. Utilizando eldata_to_plot línea de código, podemos crear el diagrama de caja con el siguiente código:
fig = plt.figure()
# Create an axes instance
ax = fig.add_axes([0,0,1,1])
# Create the boxplot
bp = ax.boxplot(data_to_plot)
plt.show()
La línea de código anterior generará el siguiente resultado: