SAS - Análisis de correlación
El análisis de correlación se ocupa de las relaciones entre variables. El coeficiente de correlación es una medida de asociación lineal entre dos variables. Los valores del coeficiente de correlación están siempre entre -1 y +1. SAS proporciona el procedimientoPROC CORR para encontrar los coeficientes de correlación entre un par de variables en un conjunto de datos.
Sintaxis
La sintaxis básica para aplicar PROC CORR en SAS es:
PROC CORR DATA = dataset options;
VAR variable;
A continuación se muestra la descripción de los parámetros utilizados:
Dataset es el nombre del conjunto de datos.
Options es la opción adicional con un procedimiento como trazar una matriz, etc.
Variable es el nombre de la variable del conjunto de datos utilizado para encontrar la correlación.
Ejemplo
Los coeficientes de correlación entre un par de variables disponibles en un conjunto de datos se pueden obtener usando sus nombres en la declaración VAR. En el siguiente ejemplo usamos el conjunto de datos CARS1 y obtenemos el resultado que muestra los coeficientes de correlación entre caballos de fuerza y peso.
PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
FROM
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;
proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;
Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:
Correlación entre todas las variables
Los coeficientes de correlación entre todas las variables disponibles en un conjunto de datos se pueden obtener simplemente aplicando el procedimiento con el nombre del conjunto de datos.
Ejemplo
En el siguiente ejemplo usamos el conjunto de datos CARS1 y obtenemos el resultado que muestra los coeficientes de correlación entre cada par de variables.
proc corr data = cars1 ;
run;
Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:
Matriz de correlación
Podemos obtener una matriz de diagrama de dispersión entre las variables eligiendo la opción de graficar la matriz en el PROC declaración.
Ejemplo
En el siguiente ejemplo, obtenemos la matriz entre caballos de fuerza y peso.
proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;
Cuando se ejecuta el código anterior, obtenemos el siguiente resultado: