introduccion general al
DESCRIPTION
INTRODUCCION GENERAL AL. Aplicaciones con la Encuesta Nacional de Hogares. Abrir archivos de datos. USE use d:\panel\panel_1.dta Abre el archivo “panel_1.dta” use d:\panel\panel_1.dta, clear - PowerPoint PPT PresentationTRANSCRIPT
Aplicaciones con la Encuesta Nacional de Hogares
INTRODUCCION GENERAL INTRODUCCION GENERAL ALAL
Abrir archivos de datos
USE
use d:\panel\panel_1.dta
Abre el archivo “panel_1.dta”
use d:\panel\panel_1.dta, clear
Abre el archivo “panel_1.dta” aun si se encuentra en la memoria activa y tiene cambios respecto a la versión guardada
STAT TRANSFER
Guardar archivos de datos
SAVE
save d:\panel\panel_2.dta
Guarda datos con el nombre “panel_2.dta”
save d:\panel\panel_1.dta, replace
Reemplaza el archivo “panel_1.dta” con los datos de la base de datos activa.
LOG USING
log using d:\panel\resulta_1.txt
Crea el archivo “resulta_1.txt” y graba los resultados en formato texto.
log using d:\panel\resulta_1.txt, replace
Reemplaza el contendido del archivo “resulta_1.txt” con los nuevos resultados
log using d:\panel\resulta_1.txt, append
Adiciona los nuevos resultados al final del archivo “resulta_1.txt”
DESCRIBE
describe
Muestra el formato y etiqueta de las variables de la base de datos
d
Es el modo abreviado de describe
d mieperho
Muestra el formato y etiqueta de la variable “mieperho”
SUMMARIZE
summarize
Muestra el número de casos, media, desviación estándar, mínimo y máximosum
Es el modo abreviado de summarize
sum mieperho, detail
Además de los estadísticos por defecto, muestra percentiles, kurtosis, Skewness de la variable “mieperho”
INSPECT
inspect mieperho
Muestra un histograma pequeño e información sobre las observaciones de la variable “mieperho”
TABULATE
tabulate mieperho
Muestra las frecuencias de “mieperho”tab mieperho
Es la forma abreviada de tabulate
tab pobreza, generate (pob99)
Muestra las frecuencias de “pobreza” y crea 3 variables dicotómicas con los valores de “pobreza”
TABULATE
tabulate year pobreza
Muestra el número de casos del cruce de las variables “year” y pobreza”tabulate year pobreza, row
Muestra el número de casos y el porcentaje horizontal del cruce de las variables “year” y “pobreza”
TABULATE, SUM
tabulate year, sum(mieperho)Muestra la media, desviación estándar y el número de casos de la variable “mieperho” en cada categoría de la variable “year”
tabulate pobreza (if year==1999), sum mieperhoMuestra la media, desviación estándar y el número de casos de la variable “mieperho” en cada categoría de la variable “pobreza”, cuando “year “ es igual a 1999.
TABULATE,SUM
tabulate year pobreza, sum(mieperho)Muestra la media, desviación estándar y el número de casos de la variable “mieperho” en cada categoría del cruce de las variables “year” y “pobreza”
tabulate year pobreza, sum(mieperho) meansMuestra la sólo la media de la variable “mieperho” en cada categoría del cruce de las variables “year” y “pobreza”
SORT, BY, TABULATE
sort year
Ordena los datos en función de la variable “year”
by year: tabulate(pobreza)
Presenta las frecuencias de la variable “pobreza” en forma indepediente para cada valor de la variable “year”
TABLE
table yearPresenta el conteo de casos por cada valor de la variable “year”table year pobreza, row colPresenta el conteo de casos del cruce de las variables “year” (en filas) y “”pobreza” (en columnas), así como los totales de filas y columnastable year pobreza, row col c(mean mieperho)Presenta el promedio de miembros de los hogares pertenecientes a cada categoría del cruce de las variables “year” (en filas) y “”pobreza” (en columnas), así como los totales de filas y columnas
GENERATE
generate inghogm=inghogtr/3Crea la variable “inghogm” que resulta de dividir la variable “inghogtr” entre 3.gen pobre=1 if(pobreza==1 | pobreza ==2)Crea la variable “pobre” que toma valor 1 si la variable “pobreza” tiene valor 1 o valor 2.gen pobregas = (pobre==1)Crea la variable dummy “pobregas” que toma valor 1 cuando la variable “pobre” es igual a 1, y es 0 en los otros casos
Operadores matemáticos y lógicos
+ sumasqrt() raíz cuadrada> mayor que- restaexp() exponencial>= mayor o igual que/ división< menor que* multiplicación
• ~ not• <= menor o igual
que• ^ potencia• & y• == igual • ln() logaritmo
natural• | o• ~= diferente• != diferente
GENERATE
1. Variable numérica
gen ingmpc=(inghog1d/(miperho*3)) 2. Número de orden
gen id=_n
3. Variable rezagada: gen lagid=id[_n-1]
GENERATE
4. Variable dummy: gen mas5=(mieperho>=5)
5. Variable tipo carácter:gen str2 texto="si“
REPLACE
replace inghogm=inghogtr/3
Reemplaza los valores de la variable “inghogm” que se encuentra en la base de datos.
replace pobre=1 if(pobreza==1 | pobreza ==2)
Reemplaza la variable “pobre” que se encuentra en la base de datos
ANALISIS DE DATOS DE ENCUESTAS
Incorporación del Diseño Muestral de la Enaho
Diseño de la Enaho
La Enaho es una encuesta con diseño complejo . Todas las estimaciones deben realizarse teniendo en cuenta este diseño.
PONDERACION = Factorho
CONGLOMERADOS O CLUSTER = Conglome
ESTRATOS = Estrato
SVYSET, SVYDES
svyset pweight fachogIndica que las poderaciones se encuentran en la variable “fachog”
svyset psu conglomeIndica que los conglomerados están identificados en la variable “conglome”
svyset strata estratoIndica que los estratos están determinados por la variable “estrato”
svydesPermite visualizar los parámetros especificados con los comandos anteriores.
SVYDES
. svydes pweight: fachogStrata: estratoPSU: conglome #Obs per PSU Strata ---------------------------- estrato #PSUs #Obs min mean max-------- -------- -------- -------- -------- -------- 1 447 1197 1 2.7 6 2 182 555 1 3.0 6 3 158 466 1 2.9 5 4 24 197 3 8.2 12 5 126 1102 1 8.7 12-------- -------- -------- -------- -------- -------- 5 937 3517 1 3.8 12
SVYMEAN
svymean mieperho percepho
Estima del promedio de las variables “mieperho” y “percepho”
svymean mieperho percepho if(pobreza==3)
Estima el promedio de las variables “mieperho” y “percepho” pero sólo para los “Hogares Pobres extremos”, es decir, cuando la variable “pobreza” toma valor 1
SVYMEAN
. svymean mieperho percepho Survey mean estimation pweight: fachog Number of obs = 3517Strata: estrato Number of strata = 5PSU: conglome Number of PSUs = 937 Population size = 5447315.2 ---------------------------------------------------------------------- Mean | Estimate Std. Err. [95% Conf. Interval] Deff---------+------------------------------------------------------------mieperho | 4.701369 .0515334 4.600234 4.802504 1.850805percepho | 2.133357 .0278439 2.078713 2.188001 2.027123----------------------------------------------------------------------
SVYMEAN
svymean mieperho, by(pobreza)Estima del promedio de “mieperho” para cada categoría de la variable “pobreza”
svymean mieperho, by (estrato) ci obsEstima del promedio de “mieperho” para cada categoría de la variable “estrato” y además obtiene el intervalo de confianza y el número de observaciones que intervino en cada cálculo.
SVYPROP
svyprop pobrezaEstimación de las proporciones de cada categoría de la variable “pobreza”svyprop pobreza if (urru5==1)Estima la proporción de hogares en cada categoría de la variable “pobreza” del área urbana, es decir, cuando “urru5” toma el valor de 1svyprop pobreza, by (urru5)Estima la proporción de hogares en cada categoría de la variable “pobreza”, en forma independiente para cada categoría de la variable “urru5”
SVYTAB
svytab estrato pobrezaEstimación de las proporciones de cada categoría de la variable “pobreza”svytab,se ci deffLuego de la coma se especifican los estadísticos que se mostrarán en la celda de la tablasvytab, rowEspecifica que la proporción se estima en forma independiente para cada filasvytab pobreza estrato if (urru5==1)Presenta la proporciones del cruce de “pobreza” con estrato” en los hogares donde “urru5” toma valor 1, es decir, el área urbana.
SVYREG
svyreg gashpcmd ingpcmd
Estima un modelo de regresión lineal donde la variable dependiente es “gashpcmd” y las variables independientes son la constante e “ingpcmd”
svyreg gashpcmd inghpcmd mieperho percepho
Estima un modelo de regresión lineal con variable independiente “gashpcm” y variables independientes constante, “inghpcmd”, “mieperho” y “percepho”
POVDECO
povdeco gashpcmd, varpl (lp)
Estimación de los índices FGT en función de la variable “gashpcmd”, comparándola con la variable “lp”. En otras palabras, “lp” es la variable que contiene el valor de la Linea de Pobreza y “gashpcmd” (gasto per cápita mensual deflactado) es la variable que mide el bienestar del individuo.
povdeco gashpcmd [w=facpob], varpl (lp)
Estima los índices FGT al igual que el comando anterior , pero considera los datos ponderados por la variable “facpob”
SEPOV
sepov gashpcmd, p(lp)Estimación de los índices FGT en función de la variable “gashpcmd”, comparándola con la variable “lp”. “lp” es la variable que contiene el valor de la Linea de Pobreza y “gashpcmd” (gasto per cápita mensual deflactado) es la variable que mide el bienestar del individuo.sepov gashpcmd, p(lp) by (urru5)Estimación de los índices FGT, al igual que en el caso anterior, para cada categoría de la variable “urru5”sepov gashpcmd if(dominio==8), p(lp)
SEPOV
. sepov gashpcmd, p(lp)
Poverty measures for the variable gashpcmd: gasto total percapita mensualSurvey mean estimation
pweight: facpob Number of obs = 3517
Strata: estrato Number of strata = 5
PSU: conglome Number of PSUs = 937
Population size = 25609840--------------------------------------------------------------------- Mean | Estimate Std. Err. [95% Conf. Interval] Deff---------+----------------------------------------------------------- p0 | .3784438 .01526 .3484958 .4083918 3.480784 p1 | .110638 .0059543 .0989527 .1223234 3.803857 p2 | .0450111 .0030714 .0389834 .0510388 3.497021---------------------------------------------------------------------