SAS - Estructura del programa

La programación SAS implica primero crear / leer los conjuntos de datos en la memoria y luego hacer el análisis de estos datos. Necesitamos comprender el flujo en el que se escribe un programa para lograr esto.

Estructura del programa SAS

El siguiente diagrama muestra los pasos que se deben escribir en la secuencia dada para crear un programa SAS.

Cada programa SAS debe tener todos estos pasos para completar la lectura de los datos de entrada, analizar los datos y dar la salida del análisis. También elRUN Se requiere una declaración al final de cada paso para completar la ejecución de ese paso.

Paso de datos

Este paso implica cargar el conjunto de datos requerido en la memoria SAS e identificar las variables (también llamadas columnas) del conjunto de datos. También captura los registros (también llamados observaciones o sujetos). La sintaxis de la declaración DATA es la siguiente.

Sintaxis

DATA data_set_name;		#Name the data set.
INPUT var1,var2,var3; 		#Define the variables in this data set.
NEW_VAR;			#Create new variables.
LABEL;			      	#Assign labels to variables.
DATALINES;		      	#Enter the data.
RUN;

Ejemplo

El siguiente ejemplo muestra un caso simple de nombrar el conjunto de datos, definir las variables, crear nuevas variables e ingresar los datos. Aquí las variables de cadena tienen un $ al final y los valores numéricos no lo tienen.

DATA TEMP;
INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*0.25;
LABEL ID = 'Employee ID' comm = 'COMMISION';
DATALINES;
1 Rick 623.3 IT
2 Dan 515.2 Operations
3 Michelle 611 IT
4 Ryan 729 HR
5 Gary 843.25 Finance
6 Nina 578 IT
7 Simon 632.8 Operations
8 Guru 722.5 Finance
;
RUN;

Paso PROC

Este paso implica invocar un procedimiento integrado de SAS para analizar los datos.

Sintaxis

PROC procedure_name options; #The name of the proc.
RUN;

Ejemplo

El siguiente ejemplo muestra el uso de MEANS procedimiento para imprimir los valores medios de las variables numéricas en el conjunto de datos.

PROC MEANS;
RUN;

El paso de SALIDA

Los datos de los conjuntos de datos se pueden mostrar con declaraciones de salida condicionales.

Sintaxis

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Ejemplo

El siguiente ejemplo muestra el uso de la cláusula where en la salida para producir solo unos pocos registros del conjunto de datos.

PROC PRINT DATA = TEMP;
WHERE SALARY > 700;
RUN;

El programa SAS completo

A continuación se muestra el código completo para cada uno de los pasos anteriores.

Salida del programa

La salida del código anterior se ve en el RESULTS lengüeta.