introduction to sas in spanish

78
Introduction to SAS

Upload: ajay-ohri

Post on 15-Apr-2017

1.230 views

Category:

Data & Analytics


0 download

TRANSCRIPT

Page 1: Introduction to sas in spanish

Introduction to SAS

Page 2: Introduction to sas in spanish

Introducción al lenguaje SAS por : Isabel Rodríguezhttps://www.linkedin.com/profile/view?

id=384254439&trk=hp-identity-name

Page 3: Introduction to sas in spanish

Que es SAS?• SAS (Statistical Analysis System)(sistema de

análisis de estadistica)• Software suite fue desarrollado por SAS Instituto

para la analitica avanzada, inteligencia empresarial y gestion de datos predicción-

• Desarrollado en la universidad estatal Carolina de norte desde 1966 hasta 1976, Cuando SAS fue incorporada.

•Además desarróllo en la década de 1980 y 1990 los procedimientos y componentes estadísticos adicionales.

Page 4: Introduction to sas in spanish

Componentes de SASActualmente, SAS tiene más de 200 componentes,

algunos de ellos son –• Base SAS –Procedimientos básicos y datos de

gestión• SAS/STAT – Análisis de estadística.• SAS/GRAPH – Gráficas y presentación.• SAS/OR – Investigación de operaciones• SAS/ETS – Econometría y Series de Tiempo

Análisis.• SAS/IML – Lenguaje matrix de interacción.

Page 5: Introduction to sas in spanish

SAS en University Editionhttp://www.sas.com/en_in/software/university-edition/download-software.html

https://welcomedata.wordpress.com/2015/03/13/downloading-and-installing-sas-university-edition/

Page 6: Introduction to sas in spanish

SAS Interface• Code Editor donde nosotros escribimos y modificamos el

modo.• Log es la grabación de cada cosa que nosotros hacemos en

una sesión de SAS o del programa SAS :– Declaración del programa identificados por línea de

números – Mensajes de comienzo puede ser nota, información,

advertencia ,error o número de error y procesos de tiempo

Page 7: Introduction to sas in spanish

SAS Code Editor

Page 8: Introduction to sas in spanish

SAS Log

Page 9: Introduction to sas in spanish

SAS Result

Page 10: Introduction to sas in spanish

SAS Explorer

• Todas las librerías , carpeta,archivos estan incluidos los data y guardan códigos los puedes encontrar aquí.

Page 11: Introduction to sas in spanish

Lenguaje SAS • Programa SAS consiste en declaraciones SAS• Cada declaración SAS termina con punto y coma (;)• Básicas declaraciones de SAS son:

– Data Step– Proc Step

DATA Step – Usado para crear o modificar conjunto de datos.PROC Step (Procedimiento) - - Normas que analizan los datos del proceso pre-escrito en un conjunto de datos SAS y luego elaboran un informe.

Page 12: Introduction to sas in spanish

Lenguaje SAS • Un Programa SAS puede consistir en un paso de datos o un

paso PROC o cualquier combinación de pasos de datos y Proc.• Data Step y Proc Step son seguidos por la declaración Run.• Data Step y Proc Step son seguidos por la Declaración Run• SAS declaraciones de formato libre.

–Ellos pueden comenzar y terminar al final de cualquier línea.

–Una declaración puede continuar en varias líneas tu usas To Comment (/*Comment*/).

Page 13: Introduction to sas in spanish

Clase de asignación• Crear una hoja de códigos ,para que la ejecutes en la

clase.• Añadir comentarios cortos para cada programa o cada

nuevo paso.• Presentar la hoja de códigos al final de la clase.

Page 14: Introduction to sas in spanish

Crear una Temporary Data set

i. Hay seis declaraciones de SAS .ii. DATA step – Crear un nuevo dataset llamado

primero.iii. PROC step – Imprimir/pantallas este dataset

en resultados /output ventana.

Page 15: Introduction to sas in spanish

Pasos PROC • Proc PRINT• Proc DATASETS• Proc CONTENTS• Proc SORT• Proc FREQ• Proc MEANS• Proc UNIVARIATE• Proc CORR

Page 16: Introduction to sas in spanish

Crear una Temporary Data set• Declaracion Input –

– Input nombres de variables, – Describe el arreglo de valores en el registro

de datos de entrada y sus asignaciones.• Datalines/Cards Statement indica ahí

debajo una existencia de líneas de datos.En el programa anterior:i. Hay 7 declaraciones de SAS ;ii. Declaraciones de INPUT define las variables va para ser leído en cada línea de datos.iii. Las declaraciones de DATALINES indica SAS estás DATA declaraciones son completadas y la proxima linea es step el contenido real del Data .iv.Observe que las líneas de datos no terminan en un punto y coma.

Page 17: Introduction to sas in spanish

Crear Temporary Data set

Perdiendo valores para un caracter variable o?Vamos a chequear Log para errores

Page 18: Introduction to sas in spanish

Crear Temporary Data setPara un carácter añadir la variable “$” Después el nombre de la

variable en el carácter en la declaración Input .

Page 19: Introduction to sas in spanish

SAS Options

Aqui, PROC step prints solo la primera 4 observación del data set third

Page 20: Introduction to sas in spanish

SAS Options

Aqui, PROC step prints el data set third empezando con la observación 2 hasta observación 4

Page 21: Introduction to sas in spanish

SAS Libraries

Permanentes Libraries (Default) –• SASHELP – contiene conjuntos de

datos de muestra.• SASUSER – Almacena archivos

personales.Temporary Library – WORK – Almacena los archivos sólo

para la sesión actual

Page 22: Introduction to sas in spanish

SAS FilesReglas para nombres -data set names –• i. 1 a 32 cáracteres• ii. Debe comenzar con un alfabeto AZ (mayúsculas o minúsculas)

o un guión• iii. Puede continuar con alguna combinación del alfabeto,

números y guiones bajos. Hacer referencia de SAS Files• Dos -niveles de nombre.• Referencia permanente de SAS data set en tu programa SAS ,

nosotros usamos dos-niveles de nombre , library name y el filename, o el nombre de data set :

• libref.filename

Page 23: Introduction to sas in spanish

PROC Datasets

PROC DATASETS es usado • to list, copy, remove, or delete SAS files.• Cambiar información variable, como el nombre, formato,

Informat y la etiqueta.

PROC Datasets no requiere la declaracion RUN.

Page 24: Introduction to sas in spanish

PROC Datasets

EL SAS log da el nombre de todo SAS datasets en la libreria llamada SASHELP

Page 25: Introduction to sas in spanish

PROC Datasets – Declaracion CHANGE Siguiendo el programa , nosotros cambiamos el nombre del

dataset first to one usando la declaración CHANGE.

Page 26: Introduction to sas in spanish

PROC Datasets – Declaracion DELETE

Siguiendo el programa, Nosotros usamos el dataset one con la declaración DELETE.

Page 27: Introduction to sas in spanish

Crear data set con tu cuenta datasetrun• Uso la declaración SET y creó una temporary data set para

el uso actual de la sesión a partir de una existente data set• Imprima el nuevo conjunto de datos utilizando PROC PRINT

• Intenta y ver que el siguiente programa existente hará

Page 28: Introduction to sas in spanish

PROC Print – TITLE Como su nombre indica, Declaraciones TITLE se añade mientras se imprime la salida.

Page 29: Introduction to sas in spanish

PROC Print – SUM

Para generar los totales de columna utilizan Declaración SUMA dentro PROC Step

Page 30: Introduction to sas in spanish

PROC SortAquí, PROC Sort se utiliza para crear un conjunto de datos

ordenados en orden ascendente de acuerdo con la variable team.

Page 31: Introduction to sas in spanish

Calcular un Subtotal Aquí, Nosotros calculamos y imprimimos el subtotal para nhits

ordenado por la variable team.

Page 32: Introduction to sas in spanish

PROC Contents

PROC Contents -• Proporciona información para SAS datasets o libraries • Se da el nombre del dataset or library,la ubicación, Cuando

este fue creado, el anfritrión que lo creó y el tiempo de la última modificación

• Para el datasets también proporciona el número de observaciones al data set y los atributos para cada variable

Page 33: Introduction to sas in spanish

PROC ContentsSiguiendo los requerimientos de información para sashelp.baseball

dataset usando PROC Contents.

Page 34: Introduction to sas in spanish

PROC Freq

PROC FREQ – •Cuenta el número (frecuencia) de ocurrencias de cada

variable (tanto carácter y numérico).• Proporciona estadísticas de los datos.• Produce unidireccional a la frecuencia n-forma y las tablas de

tabulación cruzada.• Produce impresos de salida por defecto.• Enumera cada valor de la variable junto con las frecuencias y

porcentajes.

Page 35: Introduction to sas in spanish

PROC FreqSiguiendo el programa demuestra la simple forma de PROC FREQ y proceso de salida output

La salida de este programa es demasiado larga para nuestro propósito de incluir aquí.

Añadir Declaración MESAS para limitar la salida de una sola variable y crear una tabla de frecuencias en un solo sentido

Page 36: Introduction to sas in spanish

PROC FreqCrear tablas bidireccionales de tabulación cruzada:En la declaración TABLE, los nombres de variables separadas por asterisco

Page 37: Introduction to sas in spanish

PROC Means

PROC MEANS –•Produce las estadísticas de las variables numéricas.•Produce salida impresa por defecto•Calcula N, MEDIA, STD, MIN y MAX de una forma predeterminada

•Similar a PROC RESUMEN sin embargo, PROC RESUMEN no produce una salida de impresión por defecto.

Page 38: Introduction to sas in spanish

PROC Means La siguiente muestra es el uso más simple del

procedimiento PROC MEANS.

Page 39: Introduction to sas in spanish

PROC Means – VAR Declaración VAR – • Selecciona una variable específica. • Identifica las variables de análisis y su orden en la salida.

Page 40: Introduction to sas in spanish

PROC Means – EstadisticaPara obtener una estadística específica se debe indicar la

declaración PROC MEANS .

Page 41: Introduction to sas in spanish

PROC Means – Class • La declaración CLASS asigna una variable usada desde los

subgrupos. • La variable CLASS pueden ser numérica o de carácteres.

Page 42: Introduction to sas in spanish

PROC Means – Output

Declaración Output dan lugar a nueva.data set. Aqui, la nueva data set es baseball_new.

Page 43: Introduction to sas in spanish

PROC UnivariatePROC UNIVARIATE• Examina la distribucción de las variables numéricas.• Produce salida impresa por defecto.• Siguiendo la muestra del simple uso del procedimiento de

PROC Univariate.

Page 44: Introduction to sas in spanish

PROC Univariate – NORMAL NORMAL Solicitudes de opciones para las pruebas de normalidad

que incluyen una serie de pruebas goodness-of-fit de ajuste sobre la base de la función de distribución empírica.

Page 45: Introduction to sas in spanish

PROC Univariate – PLOT PLOT Option en PROC Univariate ,produce un

diagrama de tallo y hojas (o un gráfico de barras horizontales), un diagrama de caja y una parcela de distribución normal.

Page 46: Introduction to sas in spanish

PROC Univariate – PLOT

Page 47: Introduction to sas in spanish

DO Loops.

Page 48: Introduction to sas in spanish

Incrementando un bucle Aquí el i se incrementa en 2 en el bucle.

Page 49: Introduction to sas in spanish

Variable Dropping Aquí, nosotros creamos un dataset Sixth. Corremos una repetición usando una nueva variable i, pero colóquelo de modo

que no incluye en el conjunto de dataset.

Page 50: Introduction to sas in spanish

Disminución del Loop

Aquí la i disminuye por 2 en un bucle

Page 51: Introduction to sas in spanish

Dataset usando Raw file1. Crea una nueva carpeta en myfolders y

llámala mine.

2. Usa la declaración libname para crear una nueva SAS library mine.

Page 52: Introduction to sas in spanish

Dataset usando Raw file

3. diamonds.csv dataset en la carpeta mine (SAS University Edition however can use datasets only till 10 mb. You can also use other data (SAS Universidad Edición embargo puede utilizar conjuntos de datos sólo hasta 10 mb. También puede utilizar otros datos desde: https://vincentarelbundock.github.io/Rdatasets/datasets.html)

4. Chequea la carpeta

Page 53: Introduction to sas in spanish

PROC ImportNosotros usamos Proc IMPORT para importar el dataset. • OUT Option específica a un nombre para SAS data set• DATAFILE Es una declaracion especifíca de la locación /path de la

uploaded file. • DBMS Es una declaracion que indica el tipo de uploaded file. • GETNAMES Es una declaración que dice SAS en la primera fila de

los valores de datos se ha de considerar como nombres de variables o no (Sí - si para ser considerado como nombres de variables).

Page 54: Introduction to sas in spanish

Dataset usando Raw file

Chequea la MINE Library

Crea un temporary data set llamada diamantes , usando el asistente data set.

Page 55: Introduction to sas in spanish

PROC CorrLa correlación es uno de los primeros pasos para entender la relación entre las variables. Para calcular la correlación en el SAS, utilizamos PROC CORR.

Procedimiento Corr calcula la correlación de pares de variables numéricas. Este procedimiento también proporciona algunas estadísticas de resumen por defecto - media, desviación estándar, Suma, Mínimo y Máximo.

Page 56: Introduction to sas in spanish

ASIGNACION

Hacer uso de los procedimientos aprendidos en la clase para calcular las estadísticas de los diamantes data set.

https://vincentarelbundock.github.io/Rdatasets/csv/Ecdat/Diamond.csv

Page 57: Introduction to sas in spanish

DOCUMENTACION SAS = Hallelujah!http://support.sas.com/documentation/

Page 58: Introduction to sas in spanish

PROC SQLhttp://www2.sas.com/proceedings/sugi27/p191-27.pdf

Page 59: Introduction to sas in spanish

PROC SQL

Page 60: Introduction to sas in spanish

LENGUAJE MACRO https://v8doc.sas.com/sashtml/macro/znemacro.htm

Page 61: Introduction to sas in spanish

LENGUAJE MACRO

Page 62: Introduction to sas in spanish

ODS

http://support.sas.com/rnd/base/ods/scratch/ods-tips.pdf

Page 63: Introduction to sas in spanish

ODS

http://support.sas.com/rnd/base/ods/scratch/ods-tips.pdf

Page 64: Introduction to sas in spanish
Page 65: Introduction to sas in spanish

Data Visualization usando SAS

Page 66: Introduction to sas in spanish

Data Visualization usando SAS

Page 67: Introduction to sas in spanish

Data Visualization usando SAS

Page 68: Introduction to sas in spanish

Data Visualization usando SASUsando tareasmire https://welcomedata.wordpress.com/2015/03/23/quick-pie-charts-in-sas-university-edition/

Page 69: Introduction to sas in spanish

Usando SAS

proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;

Page 70: Introduction to sas in spanish

Usando SAS

proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;

Page 71: Introduction to sas in spanish

Modelando usando SAS

proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;

Page 72: Introduction to sas in spanish

Usando SAS

proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;

Page 73: Introduction to sas in spanish

Usando SAS

Try this

proc reg data=sashelp.iris; model SepalLength = SepalWidth PetalLength PetalWidth ;run;

NOW TRY THIS

proc reg data=sashelp.iris; model SepalLength = SepalWidth PetalLength PetalWidth /vif collin;run;

Page 74: Introduction to sas in spanish

Usando SAS : Multicollinearity

http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_reg_sect038.htm

Page 75: Introduction to sas in spanish

Usando SAS : PROC LOGISTIC

proc logistic data=sashelp.Bmt; class Group; model Status=Group; run;

Page 76: Introduction to sas in spanish

Usando SAS : PROC LOGISTIC

proc logistic data=sashelp.Bmt;

class Group; model Status=Group; run;

Page 77: Introduction to sas in spanish

Preguntas y retroalimentación

Nuestro mail:

[email protected]

Page 78: Introduction to sas in spanish

Introduction to SAS