stata, tipos de archivos, sintaxis y comandos bàsicos

25
Bases de STATA, tipos de archivos, sintaxis y comandos básicos (Referencia Seminario de Stata – Universidad Nacional de La Plata) Camilo F. Gómez Agosto 6 de 2014 Econometría I - Camilo F. Gómez 1

Upload: carolina-figueroa

Post on 11-Dec-2015

10 views

Category:

Documents


0 download

DESCRIPTION

Còmo usar Stata

TRANSCRIPT

Page 1: Stata, tipos de archivos, sintaxis y comandos bàsicos

Bases de STATA, tipos de archivos, sintaxis y comandos

básicos(Referencia Seminario de Stata – Universidad Nacional de La Plata)

Camilo F. Gómez

Agosto 6 de 2014

Econometría I - Camilo F. Gómez 1

Page 2: Stata, tipos de archivos, sintaxis y comandos bàsicos

Hoja de Ruta

Introducción a STATA

• Detalles sobre versiones

• Manuales y guías de aprendizaje

• Entorno de trabajo – Interface

• Sintaxis

• Comandos básicos

• Memoria

• Abreviaturas

Econometría I - Camilo F. Gómez 2

Page 3: Stata, tipos de archivos, sintaxis y comandos bàsicos

Introducción a STATA

• STATA es un sistema que permite la gestión y manejo de datos para poder realizar estimaciones econométricas y estadísticas.

• La ventaja de STATA es que basa su lenguaje en programación a través de una sintaxis.

• Posee comandos predefinidos que permite realizar trabajos complejos.

• Admite la creación de nuevos comandos por parte del usuario, generando posibilidades de expnasión.

Econometría I - Camilo F. Gómez 3

Page 4: Stata, tipos de archivos, sintaxis y comandos bàsicos

Detalle sobre versiones

Existen varias versiones de STATA las más importantes son:

• Windows (32 - bit), Windows (64 - bit)

• Mac (32 – bit Intel), Mac (64 – bit Intel)

• Linux (32 – bit), Linux (64 – bit x 86 – 64)

Hasta la versión 10 del programa existían dos tipos: SE (special edition) y el IC (standard).

A partir de la versión 11 existen versiones optimizadas.

Para saber la versión de STATA instalada ejecutar el comando

about

Econometría I - Camilo F. Gómez 4

Page 5: Stata, tipos de archivos, sintaxis y comandos bàsicos

Manuales y guías de aprendizaje

Las fuentes oficiales para aprender STATA son los manuales originales.

• Para dar una base es suficiente con la guía de usuario.

• Para usuarios avanzados, existen libros y manuales detallados por comando.

• STATA posee una ayuda en línea que permite acceder a información con respecto a inquietudes concretas, esta se puede obtener de doamaneras:

• Utilizando man comando

• Se utiliza desde el menú o la línea de comando la opción help.

Econometría I - Camilo F. Gómez 5

Page 6: Stata, tipos de archivos, sintaxis y comandos bàsicos

Entorno de trabajo - Interface

La interface en STATA corresponde al entorno de trabajo. A continuación se trabajará en interface en las siguientes clases se realizará la interface a través de archivos do y log.

Estas son las ventajas que hacen parte del entorno de trabajo.

• Ventana “Review”. Muestra el historial de comandos utilizados.

• Ventana “Variables”. Determina las variables de la base de datos.

• Ventana “Results”. Es la ventana que expone los resultados (ventana de color negro) después de tulizar los comandos.

• Ventana “Command”. En esta ventana se introducen los comandos a utilizar.

Econometría I - Camilo F. Gómez 6

Page 7: Stata, tipos de archivos, sintaxis y comandos bàsicos

Sintaxis

El programa STATA trabaja mediante ordenes por parte del usuario a través de comandos. Los comandos conforman un lenguaje de comunicación del programa, por lo que existe una determinada sintaxis que se debe respetar.

comando [varlist] [=exp] [if exp] [in range] [weight] [,opciones]

Los corchetes indican elementos opcionales, todos los elementos que pueden acompañar un comando.

Econometría I - Camilo F. Gómez 7

Page 8: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

Para ver los diferentes comandos simples y que permita entender la estructura de la sintaxis. Para ello utilizaremos la base de datos auto.dta. Esta base de datos contiene 74 observaciones de vehículos incluye las variables precio, largo, marca, consumo, etc.

Comando para cargar la base de datos

use “c:\clase 4\auto.dta”

• No se puede utilizar dos bases de datos simultáneamente, o abrir una base con una que ya esta siendo utilizada para ello se puede utilizar

use c\clase 4\auto.dta, clear

Econometría I - Camilo F. Gómez 8

Page 9: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

• Utilizando el comando “cd c:\clase 4\auto.dta” para indicarle a STATA donde esta la carpeta que esta trabajando. Luego se utiliza el comando “use auto.dta”

• La otra alternativa es abrir la base a través del menú “open”.

Una vez cargada la base de datos, se puede observar “Review”, “Variables” y “Results” que cambiaron.

Econometría I - Camilo F. Gómez 9

Page 10: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

Sintaxis: Comando sin opciones

El comando summarize permite obtener una descripción estadística de cualquier variable que componen la base de datos.

summarize

Se puede usar para obtener la descripción estadística de una variable.

summarize price

Econometría I - Camilo F. Gómez 10

Page 11: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

Más variables

summarize price weigth length

Lista de variables (todas las variables que están entre Price y trunk)

summarize price-trunk

Variables que inician con la letra l (en este caso length)

summarize l*

Econometría I - Camilo F. Gómez 11

Page 12: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

Sintaxis [if exp]

La aplicación de comandos a veces se debe realizar para variables que debe cumplir ciertas restricciones, esto se hace utilizando el “si condicional” (if en ingles).

summarize length if price > 4500

Calcula el resumen estadístico de la variable largo de aquellos autos con un precio mayor a 4.500.

Econometría I - Camilo F. Gómez 12

Page 13: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

Para construir una sentencia se debe utilizar los siguientes componentes:

• Operadores de comparación

== igual

!= no igual (similar a ~=)

>, <, >=, <= los usuales mayor, menor, mayor igual y menor igual.

• Operadores lógicos

& y

| o

! No

Econometría I - Camilo F. Gómez 13

Page 14: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

• Operadores jerárquicos. El paréntesis determina el orden de la aplicación de las condiciones.

summarize length if (price > 4500) & (length < 180)

summarize length if (price > 4500 & length < 180) | weight > 3400

summarize length if !(price > 4500) & (length < 180) | weight > 3400)

Sintaxis [in range]

Permite aplicar el comando a un rango de observaciones.

summarize price in 1/10

Obtiene la descripción estadística de las 10 primeras observaciones.

Econometría I - Camilo F. Gómez 14

Page 15: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

summarize price in 7/12

Obtiene la descripción estadística de la 7 a la 12 observación.

summarize price in -10/-1

El comando se aplica a las ultimas 10 observaciones.

Debemos tener claro que la aplicación de [in range] a su vez depende de como esta ordenada la base de datos. Los comandos para ordenar son:

sort price

Permite ordenar de manera ascendente según la variables especifcada.

Econometría I - Camilo F. Gómez 15

Page 16: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

gsort-price

Ordena de manera descendente, según el precio del auto.

gsort+price

Ordena de manera ascendente, según el precio del auto.

Sintaxis [=exp]

Para generar se utiliza solo dos comandos: generate y replace.

Econometría I - Camilo F. Gómez 16

Page 17: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

generate eleccion = 0

Este comando permite crear una nueva variable en la base de datos. Para ello se debe indicar que valores puede tomar esta variable, en este caso la variable se llama elección y tiene un valor de cero.

Se puede generar una nueva variable combinándola con otras existentes.

generate price2 = price*2

generate lnprice = ln(price)

Así mismo se puede verificar los valores con el siguiente comando:

list price price lnprice

Econometría I - Camilo F. Gómez 17

Page 18: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

Se puede crear un variable con valor nulo, en STATA se identifica con un punto (.)

generate nulo = .

El otro comando que se usa es el replace, este comando permite reemplazar valores de la variable creada.

replace price2 = 0 if price < 4500

¿ Que hizo este comando?

Econometría I - Camilo F. Gómez 18

Page 19: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

Sintaxis [by varlist]

Permite aplicar el comando a un grupo de observaciones definidos por los distintos valores de la variables indicada. Para saber cuantos autos nacionales y extranjeros existen.

sort foreign

By foreign: summarize price

Se puede utilizar el siguiente método

summarize price if foreign==0

summarize price if foreign==1

¿Cuál es la diferencia entre ambos métodos?

Econometría I - Camilo F. Gómez 19

Page 20: Stata, tipos de archivos, sintaxis y comandos bàsicos

Comandos básicos

Sintaxis [, opciones]

Existen comandos que pueden aceptar opciones adicionales, estas se especifican en la sintaxis luego de la coma.

summarize price, detail

¿Qué cambio?

Sintaxis[weight]

Esta indica a una variable como ponderador de las observaciones. Cuando estemos trabajando Encuestas de Hogares la utilizaremos como parte del sintaxis.

Econometría I - Camilo F. Gómez 20

Page 21: Stata, tipos de archivos, sintaxis y comandos bàsicos

Otros comandos

Para tabular cantidades de observaciones para distintos valores de una variables tenemos:

tabulate foreign

Así mismo puede ser combinado con el comando summarize

tabulate foreign, summarize (price)

De esta manera se obtiene la media, el desvió estándar y la frecuencia, del precio para los autos nacionales y extranjeros.

Econometría I - Camilo F. Gómez 21

Page 22: Stata, tipos de archivos, sintaxis y comandos bàsicos

Otros comandos

Se puede combinar con más variables

tabulate foreign price

Por su parte el comando tabstat es más avanzado para generar estadísticas descriptivas.

tabstat price, statistics(mean)

De igual manera se pueden obtener otros.

tabstat price, statistics(mean sum count max min range sd variance cv median p10)

Para más variables

tabstat price length, statistics(mean sum count max min range sd variance cv median p10)

Econometría I - Camilo F. Gómez 22

Page 23: Stata, tipos de archivos, sintaxis y comandos bàsicos

Memoria

STATA trabaja de una manera en donde la base de datos es almacenada en la memoria RAM del PC. Esto trae ventajas y desventajas.

• La ejecución de comandos es más rápida, ya que no accede al disco.

• El tamaño de la base de datos procesada depende de la cantidad de memoria RAM del PC.

El comando para conocer el uso de la memoria es:

memory

Econometría I - Camilo F. Gómez 23

Page 24: Stata, tipos de archivos, sintaxis y comandos bàsicos

Memoria

El programa comienza la sesión con una capacidad de memoria asignada. Dado que este espacio puede no ser suficiente, se puede ampliar la memoria.

set memory 100m

Este comando asigna 100 mega bytes de memoria para el uso de STATA, sin embargo para las ediciones posteriores a STATA 11 no es necesario, ya que se asigna la cantidad automáticamente.

Econometría I - Camilo F. Gómez 24

Page 25: Stata, tipos de archivos, sintaxis y comandos bàsicos

Abreviatura

Es interesante que los comandos que se explicaron pueden ser abreviados, es decir, pensaron que se tenían que escribir siempre summarize.

La regla es sencilla se puede realizar la abreviatura siempre y cuando no se confunda con otro comando.

• Los comando destructivos no se abrevian drop, clear

• Existe el comando describe que se abrevia con d, a pesar de confundirse con otros.

Ejemplo

sum price foreign

Econometría I - Camilo F. Gómez 25