Estadísticas - Curtosis
El grado de cola de una distribución se mide por curtosis. Nos dice hasta qué punto la distribución es más o menos propensa a valores atípicos (más pesada o de cola ligera) que la distribución normal. A continuación se muestran tres tipos diferentes de curvas, cortesía de Investopedia:
Es difícil distinguir diferentes tipos de curtosis a partir de las gráficas de densidad (panel izquierdo) porque las colas son cercanas a cero para todas las distribuciones. Pero las diferencias en las colas son fáciles de ver en las gráficas normales de cuantiles-cuantiles (panel derecho).
La curva normal se llama curva mesocúrtica. Si la curva de una distribución es más propensa a valores atípicos (o con una cola más pesada) que una curva normal o mesocúrtica, se la denomina curva leptocurtica. Si una curva es menos propensa a valores atípicos (o tiene una cola más clara) que una curva normal, se denomina curva platicúrtica. La curtosis se mide por momentos y viene dada por la siguiente fórmula:
Fórmula
$ {\ beta_2 = \ frac {\ mu_4} {\ mu_2}} $
Donde -
$ {\ mu_4 = \ frac {\ sum (x- \ bar x) ^ 4} {N}} $
Cuanto mayor sea el valor de \ beta_2, más puntiaguda o leptocúrtica será la curva. Una curva normal tiene un valor de 3, una leptocúrtica tiene \ beta_2 mayor que 3 y platicúrtica tiene \ beta_2 menor que 3.
Ejemplo
Problem Statement:
Se dan los datos sobre los salarios diarios de 45 trabajadores de una fábrica. Calcule \ beta_1 y \ beta_2 usando el momento sobre la media. Comente los resultados.
Salarios (Rs.) | Numero de trabajadores |
---|---|
100-200 | 1 |
120-200 | 2 |
140-200 | 6 |
160-200 | 20 |
180-200 | 11 |
200-200 | 3 |
220-200 | 2 |
Solution:
Salarios (Rs.) |
Número de trabajadores (f) |
Punto medio m |
m - $ {\ frac {170} {20}} $ d |
$ {fd} $ | $ {fd ^ 2} $ | $ {fd ^ 3} $ | $ {fd ^ 4} $ |
---|---|---|---|---|---|---|---|
100-200 | 1 | 110 | -3 | -3 | 9 | -27 | 81 |
120-200 | 2 | 130 | -2 | -4 | 8 | -dieciséis | 32 |
140-200 | 6 | 150 | -1 | -6 | 6 | -6 | 6 |
160-200 | 20 | 170 | 0 | 0 | 0 | 0 | 0 |
180-200 | 11 | 190 | 1 | 11 | 11 | 11 | 11 |
200-200 | 3 | 210 | 2 | 6 | 12 | 24 | 48 |
220-200 | 2 | 230 | 3 | 6 | 18 | 54 | 162 |
$ {N = 45} $ | $ {\ sum fd = 10} $ | $ {\ sum fd ^ 2 = 64} $ | $ {\ sum fd ^ 3 = 40} $ | $ {\ sum fd ^ 4 = 330} $ |
Dado que las desviaciones se han tomado de una media supuesta, primero calculamos los momentos sobre el origen arbitrario y luego los momentos sobre la media. Momentos sobre el origen arbitrario '170'
Momentos sobre la media
A partir del valor del movimiento sobre la media, ahora podemos calcular $ {\ beta_1} $ y $ {\ beta_2} $:
De los cálculos anteriores, se puede concluir que $ {\ beta_1} $, que mide la asimetría es casi cero, lo que indica que la distribución es casi simétrica. $ {\ beta_2} $ que mide la curtosis, tiene un valor mayor que 3, lo que implica que la distribución es leptocúrtica.