Estadísticas: patrones de datos

Los patrones de datos son muy útiles cuando se dibujan gráficamente. Los patrones de datos se describen comúnmente en términos de características como centro, extensión, forma y otras propiedades inusuales. Otras etiquetas descriptivas especiales son simétricas, en forma de campana, sesgadas, etc.

Centrar

El centro de una distribución, gráficamente, se encuentra en la mediana de la distribución. Un gráfico de este tipo muestra que casi la mitad de las observaciones están a ambos lados. La altura de cada columna indica la frecuencia de las observaciones.

Propagar

La extensión de una distribución se refiere a la variación de los datos. Si el conjunto de observación cubre un rango amplio, la extensión es mayor. Si las observaciones se centran en un solo valor, entonces el margen es menor.

Forma

La forma de una distribución se puede describir utilizando las siguientes características.

  • Symmetry - En distribución simétrica, el gráfico se puede dividir en el centro de tal manera que cada mitad sea una imagen especular de la otra.

  • Number of peaks.- Distribuciones con uno o varios picos. La distribución con un pico claro se conoce como unimodal y la distribución con dos picos claros se llama bimodal. Una distribución simétrica de un solo pico en el centro se denomina en forma de campana.

  • Skewness- Algunas distribuciones pueden tener múltiples observaciones en un lado del gráfico que en el otro. Se dice que las distribuciones que tienen menos observaciones hacia valores más bajos están sesgadas a la derecha; y se dice que las distribuciones con menos observaciones hacia valores más bajos están sesgadas a la izquierda.

  • Uniform - Cuando el conjunto de observaciones no tiene un pico y los datos se distribuyen por igual en el rango de la distribución, la distribución se denomina distribución uniforme.

Características inusuales

Las características inusuales comunes de los patrones de datos son lagunas y valores atípicos.

  • Gaps- Gaps apunta a áreas de una distribución que no tienen observaciones. La siguiente figura tiene un espacio, ya que no hay observaciones en el medio de la distribución.

  • Outliers- Las distribuciones pueden caracterizarse por valores extremos que difieren mucho del otro conjunto de datos de observación. Estos valores extremos se denominan valores atípicos. La siguiente figura ilustra una distribución con un valor atípico.