Estadísticas: coeficiente de correlación

Coeficiente de correlación

Un coeficiente de correlación es una medida estadística del grado en que los cambios en el valor de una variable predicen el cambio en el valor de otra. En las variables correlacionadas positivamente, el valor aumenta o disminuye en conjunto. En las variables correlacionadas negativamente, el valor de una aumenta a medida que el valor de la otra disminuye.

Los coeficientes de correlación se expresan como valores entre +1 y -1.

Un coeficiente de +1 indica una correlación positiva perfecta: un cambio en el valor de una variable predecirá un cambio en la misma dirección en la segunda variable.

Un coeficiente de -1 indica un negativo perfecto: un cambio en el valor de una variable predice un cambio en la dirección opuesta en la segunda variable. Los grados menores de correlación se expresan como decimales distintos de cero. Un coeficiente de cero indica que no existe una relación discernible entre las fluctuaciones de las variables.

Fórmula

$ {r = \ frac {N \ sum xy - (\ sum x) (\ sum y)} {\ sqrt {[N \ sum x ^ 2 - (\ sum x) ^ 2] [N \ sum y ^ 2 - (\ sum y) ^ 2]}}} $

Donde -

  • $ {N} $ = Número de pares de puntuaciones

  • $ {\ sum xy} $ = Suma de productos de puntuaciones emparejadas.

  • $ {\ sum x} $ = Suma de x puntuaciones.

  • $ {\ sum y} $ = Suma de y puntajes.

  • $ {\ sum x ^ 2} $ = Suma de x puntuaciones al cuadrado.

  • $ {\ sum y ^ 2} $ = Suma de puntuaciones y cuadradas.

Ejemplo

Problem Statement:

Calcule el coeficiente de correlación de lo siguiente:

X Y
1 2
3 5
4 5
4 8

Solution:

$ {\ sum xy = (1) (2) + (3) (5) + (4) (5) + (4) (8) = 69 \\ [7pt] \ sum x = 1 + 3 + 4 + 4 = 12 \\ [7pt] \ sum y = 2 + 5 + 5 + 8 = 20 \\ [7pt] \ sum x ^ 2 = 1 ^ 2 + 3 ^ 2 + 4 ^ 2 + 4 ^ 2 = 42 \ \ [7pt] \ sum y ^ 2 = 2 ^ 2 + 5 ^ 2 + 5 ^ 2 + 8 ^ 2 = 118 \\ [7pt] r = \ frac {69 - \ frac {(12) (20)} { 4}} {\ sqrt {(42 - \ frac {(12) ^ 2} {4}) (118- \ frac {(20) ^ 2} {4}}} \\ [7pt] = .866} $