introduction to sas in spanish

Post on 15-Apr-2017

1.230 Views

Category:

Data & Analytics

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Introduction to SAS

Introducción al lenguaje SAS por : Isabel Rodríguezhttps://www.linkedin.com/profile/view?

id=384254439&trk=hp-identity-name

Que es SAS?• SAS (Statistical Analysis System)(sistema de

análisis de estadistica)• Software suite fue desarrollado por SAS Instituto

para la analitica avanzada, inteligencia empresarial y gestion de datos predicción-

• Desarrollado en la universidad estatal Carolina de norte desde 1966 hasta 1976, Cuando SAS fue incorporada.

•Además desarróllo en la década de 1980 y 1990 los procedimientos y componentes estadísticos adicionales.

Componentes de SASActualmente, SAS tiene más de 200 componentes,

algunos de ellos son –• Base SAS –Procedimientos básicos y datos de

gestión• SAS/STAT – Análisis de estadística.• SAS/GRAPH – Gráficas y presentación.• SAS/OR – Investigación de operaciones• SAS/ETS – Econometría y Series de Tiempo

Análisis.• SAS/IML – Lenguaje matrix de interacción.

SAS en University Editionhttp://www.sas.com/en_in/software/university-edition/download-software.html

https://welcomedata.wordpress.com/2015/03/13/downloading-and-installing-sas-university-edition/

SAS Interface• Code Editor donde nosotros escribimos y modificamos el

modo.• Log es la grabación de cada cosa que nosotros hacemos en

una sesión de SAS o del programa SAS :– Declaración del programa identificados por línea de

números – Mensajes de comienzo puede ser nota, información,

advertencia ,error o número de error y procesos de tiempo

SAS Code Editor

SAS Log

SAS Result

SAS Explorer

• Todas las librerías , carpeta,archivos estan incluidos los data y guardan códigos los puedes encontrar aquí.

Lenguaje SAS • Programa SAS consiste en declaraciones SAS• Cada declaración SAS termina con punto y coma (;)• Básicas declaraciones de SAS son:

– Data Step– Proc Step

DATA Step – Usado para crear o modificar conjunto de datos.PROC Step (Procedimiento) - - Normas que analizan los datos del proceso pre-escrito en un conjunto de datos SAS y luego elaboran un informe.

Lenguaje SAS • Un Programa SAS puede consistir en un paso de datos o un

paso PROC o cualquier combinación de pasos de datos y Proc.• Data Step y Proc Step son seguidos por la declaración Run.• Data Step y Proc Step son seguidos por la Declaración Run• SAS declaraciones de formato libre.

–Ellos pueden comenzar y terminar al final de cualquier línea.

–Una declaración puede continuar en varias líneas tu usas To Comment (/*Comment*/).

Clase de asignación• Crear una hoja de códigos ,para que la ejecutes en la

clase.• Añadir comentarios cortos para cada programa o cada

nuevo paso.• Presentar la hoja de códigos al final de la clase.

Crear una Temporary Data set

i. Hay seis declaraciones de SAS .ii. DATA step – Crear un nuevo dataset llamado

primero.iii. PROC step – Imprimir/pantallas este dataset

en resultados /output ventana.

Pasos PROC • Proc PRINT• Proc DATASETS• Proc CONTENTS• Proc SORT• Proc FREQ• Proc MEANS• Proc UNIVARIATE• Proc CORR

Crear una Temporary Data set• Declaracion Input –

– Input nombres de variables, – Describe el arreglo de valores en el registro

de datos de entrada y sus asignaciones.• Datalines/Cards Statement indica ahí

debajo una existencia de líneas de datos.En el programa anterior:i. Hay 7 declaraciones de SAS ;ii. Declaraciones de INPUT define las variables va para ser leído en cada línea de datos.iii. Las declaraciones de DATALINES indica SAS estás DATA declaraciones son completadas y la proxima linea es step el contenido real del Data .iv.Observe que las líneas de datos no terminan en un punto y coma.

Crear Temporary Data set

Perdiendo valores para un caracter variable o?Vamos a chequear Log para errores

Crear Temporary Data setPara un carácter añadir la variable “$” Después el nombre de la

variable en el carácter en la declaración Input .

SAS Options

Aqui, PROC step prints solo la primera 4 observación del data set third

SAS Options

Aqui, PROC step prints el data set third empezando con la observación 2 hasta observación 4

SAS Libraries

Permanentes Libraries (Default) –• SASHELP – contiene conjuntos de

datos de muestra.• SASUSER – Almacena archivos

personales.Temporary Library – WORK – Almacena los archivos sólo

para la sesión actual

SAS FilesReglas para nombres -data set names –• i. 1 a 32 cáracteres• ii. Debe comenzar con un alfabeto AZ (mayúsculas o minúsculas)

o un guión• iii. Puede continuar con alguna combinación del alfabeto,

números y guiones bajos. Hacer referencia de SAS Files• Dos -niveles de nombre.• Referencia permanente de SAS data set en tu programa SAS ,

nosotros usamos dos-niveles de nombre , library name y el filename, o el nombre de data set :

• libref.filename

PROC Datasets

PROC DATASETS es usado • to list, copy, remove, or delete SAS files.• Cambiar información variable, como el nombre, formato,

Informat y la etiqueta.

PROC Datasets no requiere la declaracion RUN.

PROC Datasets

EL SAS log da el nombre de todo SAS datasets en la libreria llamada SASHELP

PROC Datasets – Declaracion CHANGE Siguiendo el programa , nosotros cambiamos el nombre del

dataset first to one usando la declaración CHANGE.

PROC Datasets – Declaracion DELETE

Siguiendo el programa, Nosotros usamos el dataset one con la declaración DELETE.

Crear data set con tu cuenta datasetrun• Uso la declaración SET y creó una temporary data set para

el uso actual de la sesión a partir de una existente data set• Imprima el nuevo conjunto de datos utilizando PROC PRINT

• Intenta y ver que el siguiente programa existente hará

PROC Print – TITLE Como su nombre indica, Declaraciones TITLE se añade mientras se imprime la salida.

PROC Print – SUM

Para generar los totales de columna utilizan Declaración SUMA dentro PROC Step

PROC SortAquí, PROC Sort se utiliza para crear un conjunto de datos

ordenados en orden ascendente de acuerdo con la variable team.

Calcular un Subtotal Aquí, Nosotros calculamos y imprimimos el subtotal para nhits

ordenado por la variable team.

PROC Contents

PROC Contents -• Proporciona información para SAS datasets o libraries • Se da el nombre del dataset or library,la ubicación, Cuando

este fue creado, el anfritrión que lo creó y el tiempo de la última modificación

• Para el datasets también proporciona el número de observaciones al data set y los atributos para cada variable

PROC ContentsSiguiendo los requerimientos de información para sashelp.baseball

dataset usando PROC Contents.

PROC Freq

PROC FREQ – •Cuenta el número (frecuencia) de ocurrencias de cada

variable (tanto carácter y numérico).• Proporciona estadísticas de los datos.• Produce unidireccional a la frecuencia n-forma y las tablas de

tabulación cruzada.• Produce impresos de salida por defecto.• Enumera cada valor de la variable junto con las frecuencias y

porcentajes.

PROC FreqSiguiendo el programa demuestra la simple forma de PROC FREQ y proceso de salida output

La salida de este programa es demasiado larga para nuestro propósito de incluir aquí.

Añadir Declaración MESAS para limitar la salida de una sola variable y crear una tabla de frecuencias en un solo sentido

PROC FreqCrear tablas bidireccionales de tabulación cruzada:En la declaración TABLE, los nombres de variables separadas por asterisco

PROC Means

PROC MEANS –•Produce las estadísticas de las variables numéricas.•Produce salida impresa por defecto•Calcula N, MEDIA, STD, MIN y MAX de una forma predeterminada

•Similar a PROC RESUMEN sin embargo, PROC RESUMEN no produce una salida de impresión por defecto.

PROC Means La siguiente muestra es el uso más simple del

procedimiento PROC MEANS.

PROC Means – VAR Declaración VAR – • Selecciona una variable específica. • Identifica las variables de análisis y su orden en la salida.

PROC Means – EstadisticaPara obtener una estadística específica se debe indicar la

declaración PROC MEANS .

PROC Means – Class • La declaración CLASS asigna una variable usada desde los

subgrupos. • La variable CLASS pueden ser numérica o de carácteres.

PROC Means – Output

Declaración Output dan lugar a nueva.data set. Aqui, la nueva data set es baseball_new.

PROC UnivariatePROC UNIVARIATE• Examina la distribucción de las variables numéricas.• Produce salida impresa por defecto.• Siguiendo la muestra del simple uso del procedimiento de

PROC Univariate.

PROC Univariate – NORMAL NORMAL Solicitudes de opciones para las pruebas de normalidad

que incluyen una serie de pruebas goodness-of-fit de ajuste sobre la base de la función de distribución empírica.

PROC Univariate – PLOT PLOT Option en PROC Univariate ,produce un

diagrama de tallo y hojas (o un gráfico de barras horizontales), un diagrama de caja y una parcela de distribución normal.

PROC Univariate – PLOT

DO Loops.

Incrementando un bucle Aquí el i se incrementa en 2 en el bucle.

Variable Dropping Aquí, nosotros creamos un dataset Sixth. Corremos una repetición usando una nueva variable i, pero colóquelo de modo

que no incluye en el conjunto de dataset.

Disminución del Loop

Aquí la i disminuye por 2 en un bucle

Dataset usando Raw file1. Crea una nueva carpeta en myfolders y

llámala mine.

2. Usa la declaración libname para crear una nueva SAS library mine.

Dataset usando Raw file

3. diamonds.csv dataset en la carpeta mine (SAS University Edition however can use datasets only till 10 mb. You can also use other data (SAS Universidad Edición embargo puede utilizar conjuntos de datos sólo hasta 10 mb. También puede utilizar otros datos desde: https://vincentarelbundock.github.io/Rdatasets/datasets.html)

4. Chequea la carpeta

PROC ImportNosotros usamos Proc IMPORT para importar el dataset. • OUT Option específica a un nombre para SAS data set• DATAFILE Es una declaracion especifíca de la locación /path de la

uploaded file. • DBMS Es una declaracion que indica el tipo de uploaded file. • GETNAMES Es una declaración que dice SAS en la primera fila de

los valores de datos se ha de considerar como nombres de variables o no (Sí - si para ser considerado como nombres de variables).

Dataset usando Raw file

Chequea la MINE Library

Crea un temporary data set llamada diamantes , usando el asistente data set.

PROC CorrLa correlación es uno de los primeros pasos para entender la relación entre las variables. Para calcular la correlación en el SAS, utilizamos PROC CORR.

Procedimiento Corr calcula la correlación de pares de variables numéricas. Este procedimiento también proporciona algunas estadísticas de resumen por defecto - media, desviación estándar, Suma, Mínimo y Máximo.

ASIGNACION

Hacer uso de los procedimientos aprendidos en la clase para calcular las estadísticas de los diamantes data set.

https://vincentarelbundock.github.io/Rdatasets/csv/Ecdat/Diamond.csv

DOCUMENTACION SAS = Hallelujah!http://support.sas.com/documentation/

PROC SQLhttp://www2.sas.com/proceedings/sugi27/p191-27.pdf

PROC SQL

LENGUAJE MACRO https://v8doc.sas.com/sashtml/macro/znemacro.htm

LENGUAJE MACRO

ODS

http://support.sas.com/rnd/base/ods/scratch/ods-tips.pdf

ODS

http://support.sas.com/rnd/base/ods/scratch/ods-tips.pdf

Data Visualization usando SAS

Data Visualization usando SAS

Data Visualization usando SAS

Data Visualization usando SASUsando tareasmire https://welcomedata.wordpress.com/2015/03/23/quick-pie-charts-in-sas-university-edition/

Usando SAS

proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;

Usando SAS

proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;

Modelando usando SAS

proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;

Usando SAS

proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;

Usando SAS

Try this

proc reg data=sashelp.iris; model SepalLength = SepalWidth PetalLength PetalWidth ;run;

NOW TRY THIS

proc reg data=sashelp.iris; model SepalLength = SepalWidth PetalLength PetalWidth /vif collin;run;

Usando SAS : Multicollinearity

http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_reg_sect038.htm

Usando SAS : PROC LOGISTIC

proc logistic data=sashelp.Bmt; class Group; model Status=Group; run;

Usando SAS : PROC LOGISTIC

proc logistic data=sashelp.Bmt;

class Group; model Status=Group; run;

Preguntas y retroalimentación

Nuestro mail:

info@decisionstats.org

Introduction to SAS

top related