proyecto 2 estadistica
Post on 18-Feb-2018
230 Views
Preview:
TRANSCRIPT
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 1/18
Universidad Simón Bolívar
Departamento de Cómputo Científico y Estadística
CO3321 Estadística para Inenieros!"atem#ticos
Septiem$re%Diciem$re 2&1'
(royecto 2
Interantes)*
%David +lie, Carnet) 11%1&-&&
%.uusto /ara0ona, Carnet) 1&%1113-
%Dieo Borneo, Carnet) 11%1&11
%Cristian (erdomo, Carnet) 1&%113-2
Sarteneas 21 de noviem$re de 2&1',
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 2/18
RESUMEN.
En estadística 4ay situaciones en las cuales se 5uiere sa$er si ciertos par#metros de inter6s
para un investiador cumplen cierta propiedad o est#n dentro de un conunto específico es
entonces cuando sure la utilidad de las prue$as de 4ipótesis,
Una prue$a de 4ipótesis es un procedimiento en el cual el investiador supone un valor para
sus par#metros y determina si la suposición puede ser rec4a0ada o no con cierto rado de
confia$ilidad,
(or otro lado 4ay casos en los cuales se tiene un conunto de datos relacionados y se 5uiere
de aluna manera encontrar un patrón 5ue ayude a predecir de forma precisa un valor
desconocido y relacionado con esas condiciones, 7os modelos de reresión lineal son
4erramientas 5ue permiten predecir este valor desconocido,
El propósito de este informe es estudiar la aplicación de estos modelos usando 8 en
situaciones de importancia para aluna investiación de un #rea de estudio como la
computación medicina economía o cual5uier otra disciplina 5ue re5uiera un an#lisis de
datos,
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 3/18
PRIMERA PARTE (a) (Análisis Descriptivo)
Se clasificaron el ala n,a2 y n,a9 se:n la temporada en las 5ue fueron recolectadas el
tama;o del río y la velocidad del río y se o$tuvo lo siuiente)
.la n,a2 "in,
<1
"ediana
"edia
<3
"a*,
/emp
orada
=au
tumn>
%
21,?9
&
,32&9
'
,?3'&
'
,'2'&
@
,@'@&
2
2,21
=sp
rin>
%
,3--@
1
,239
@
,?@9
@
,9'?
1
-,9-&
3
',-3&
=su
mmer>
%
23,22
&
,&&'
,&?@
?
,33-
1
-,1@
3
&,2?
=Ai
nter>
%
2&,91&
%
2,?9
9
,391
'
,&'
1
3,'&
2
-,1-&
/ama
;o de 8io
=lar
e>
%
3,@11
3
,-9
@
,@
1
&,1'&
1
9,33&
2
?,-1&
=m
6dium>
%
23,22
%
1,'39
?
,29-
9
,1@'
1
',@1&
3
&,2?&
=s
mall>
%
2&,91&
%
2,&2?
'
,-@-
'
,9&-
1
2,1&
3
',-3&
eloci
dad 8io
=4i
4>
%
23,22
%
-,-39
1
,'11
2
,?@3
1
2,-1&
3
&,2?&
=sl
oA>
%
21,?9
3
,1
@
,'-1
,?1
1
',?3
2
2,@3
=m
6dium>
%
1&,-2
2
,-@1
@
,12-
@
,'&?
1
-,9@&
3
',-3&
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 4/18
Tabla 1- Analisis Descriptivo para la ala n.a!
Se puede o$servar 5ue la media muestral se:n la estación es mayor en sprin se:n el
tama;o del río la media m#s alta esta para los ríos =lare> y para la velocidad del río
medium fue la m#s alta, (or otra parte las medias mas $aas se o$tuveron en autum
small y 4i4,
En cuanto a las alas n,a9 se o$tuvo lo siuiente)
.la n,a9 "
in,
<
1
"
ediana
"
edia
<
3
"
a*,
/emporada
=a
utumn>
%
1,-
%
&,392
?
,@
9
,--2&
1
3,&
3
',&?
=s
prin>
%
11,3'
%
1,231
2
,?'
-
,@2
?
,1
3
@,--&
=s
ummer>
%
2@,@2&
%
',@99
'
,&?
3
,&3@
1
1,32
2
?,2@
=A
inter>
%
19,@3&
%
1,-@3
-
,&-
?
,???
1
3,2
'
?,2-
/a
ma;o de
8io
=la
re>
%
1,-
%
2,&
3
,31?
'
,2'3
1
&,'
3
?,?3&
=
m6dium>
%
2@,@2
%
1,?31
@
,3-3
,-?
1
?,@&
'
?,2-&
=s
mall>
%
9,929
%
&,2-&
2
,?'&
3
,&3@&
9
,'@&
1
,32
el
ocidad de
8io
=4
i4>
%
2&,1&
%
1,@&@
3
,?3-
-
,1&@
1
&,33
'
2,-'
=sl
oA>
%
1,-
&
,-@2
?
,-&
@
,91&
1
,&3
'
?,2-&
=
m6dium>
%
2@,@2
%
1,-?-
'
,311
-
,2?@
1
1,'2
3
?,?3
Tabla !- Análisis "escriptivo "e la ala n.a#
Se puede o$servas 5ue las mayores medias muestrales se tienen en la temporada autum el
tama;o =m6dium> y la velocidad sloA, "ientras 5ue las mas $aas se reistraron en la
temporada =summer> lare> y 4i4,
/am$i6n ca$e destacar 5ue la media muestral sin clasificar por ninuna cateoría de n,a2
9,-'-F es mayor 5ue la de n,a9 -,@3'F, (or lo 5ue se puede pensar 5ue la po$lación de
alas n,a2 es mayor en eneral 5ue la de n,a9,
Gráfco 1- Boxplot de la población de algas por temporada, por tamaño de río y porvelocidad del mismo (En el mismo orden de la tabla 1
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 5/18
PRIMERA PARTE (b) (co$paraci%n "e varian&as)
Se reali0a una proramación de los datos para 5ue realice una prue$a con una 4ipotesis nula
Go) σ 2
n . i . n−σ 2
n . i . n=0 contra Ga) σ 2
n . i . n−σ 2
n . i .n≠0 con iHa2a9 para cada alaF
para cada temporada,
Es decir se 5uiere ver si las varian0as de cada ala no cam$ia de una temporada GoF o si GaF
con un nivel de confian0a 1−α =0.99 , Se o$tuvieron los siuientes resultados del valor
del estadistico de prue$a el p valor y conclusion respecto al no rec4a0o de la 4ipotesis nula
GoH&F o su rec4a0o GoH1F)
Tabla '. o$paracion "e varian&as
(uede verse 5ue con los datos aportados no e*iste suficiente evidencia para afirmar 5ue las
varian0as en la aparicion de am$as alas n,a2,n y n,a9,n para cada una de las temporadas
sean distintas GoH&H no se rec4a0a la 4ipotesis nulaF en ninuno de los casos con un nivel de
confian0a del @@, Es decir la varian0a de ninuna de las dos alas cam$ia con la temporada,
PRIMERA PARTE (c) (co$paraci%n "e $e"ias)
Se reali0a una proramación de los datos para 5ue realice una prue$a con una 4ipotesis nula
Go) μn .i . n− μn .i . n=0 contra Ga) μn . i . n− μn . i . n≠0 con iHa2a9 para cada alaF para
cada temporada,
Es decir se 5uiere ver si las medias po$lacionales de cada ala no cam$ia de una temporada
GoF o si GaF con un nivel de confian0a 1−α =0.97 , Se o$tuvieron los siuientes
resultados del valor del estadistico de prue$a el p valor y conclusion respecto al no rec4a0ode la 4ipotesis nula GoH&F o su rec4a0o GoH1F)
Gráfco !- Boxplot de las algas na" por temporada, tamaño de río yvelocidad del río
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 6/18
tabla . o$paracion "e $e"ias
Se o$serva 5ue la evidencia muestral revela 5ue para la ala n,a2,n su media po$lacional si
varia 4oH1H se rec4a0a 4ipotesis nulaF entre las temporadas de oto;o%primavera y primavera%
invierno con un nivel de confian0a del @?,
(ara las demas temporadas el numero medio de la ala n,a2,n no revela cam$ios 4oH&H no serec4a0a 4ipotesis nulaF y para la ala n,a9,n no e*iste evidencia muestral 5ue e*ista diferencia
sinificativa en su cantidad media para ninun par de temporadas en el mismo nivel de
prue$a,
PRIMERA PARTE (") (n*$ero $e"io "e alas n.a#.n en verano)
Se reali0a una proramación de los datos para 5ue realice una prue$a con una 4ipotesis nula
Go) μn .a 6. n=0 contra Ga) μn .a 6. n>0 ,
Es decir se 5uiere ver si la media po$lacional de la ala tipo n,a9,n es iual a cero GoF o es
mayor 5ue cero durante el verano GaF con un nivel de confian0a 1−α =0.92 , Se
o$tuvo 5ue el estadistico de prue$a dio 1,--? el p%valor &,&93',
Como α > p−valor=0.08>0.063 por lo tanto para la prue$a reali0ada y con el valor del
estadistico dado se concluye 5ue se rec4a0a la 4ipotesis nula,
(or lo tanto dada la evidencia muestral podemos concluir con una confian0a del @2 5ue la
po$lacion media de alas tipo n,a9,n sera mayor 5ue cero para la temporada de invierno, 7a
curva de potencia de la prue$a se muestra acontinuacion)
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 7/18
+ra,ico '. Potencia "e la preba con na probabili"a" $ini$a "e #.' "e rec/a&ar la/ipotesis nla can"o ha : μn .a 6. n>0 . Se observa a $e"ia se to$a n valor ca"a ve&
$as alto "e la /ipotesis alternativa la probabili"a" "e rec/a&ar la /ipotesis nla es
$a0or.
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 8/18
SE+UNDA PARTE.-(a) co$paraci%n "e $e"ias "e n.a! 0 n.a# con respecto al ta$ao
"e r2o
Juestra Go es 5ue la media de na,2 es iual a na,9 y la alternativa es 5ue la media de na,2 es
mayor a la media de n,a9 para cada nivel de tama;o de río,
Se calculó el estadístico de prue$a y el p%valor, Se compara el p%valor con el valor KH&,&- ysi es menor se rec4a0a la 4ipótesis,
Se utili0ó el comando t,test para o$tener lo valor del estadístico de prue$a y el p%valor
Ta$ao Esta"2stico "e
preba
P-valor se rec/a&a
34
n.a!. - n.a#. lare 2?3? &&&' Sí
n.a!. - n.a#. medium %129' &@9 Jo
n.a!. - n.a#. small &@2@ &1? Jo
7os datos de la muestra permiten rec4a0ar 5ue la media de na,9 es iual a la de n,a2 en ríos detama;o) lare randeF afirmando 5ue la media de na,2 es mayor en este escenario conconfia$ilidad de @-,
SE+UNDA PARTE.- (b) co$paraci%n "e $e"ias "e n.a! 0 n.a# con respecto a la
veloci"a" "e r2o
Juestra Go es 5ue la media de na,2 es iual a na,9 y la alternativa es 5ue la media de na,9 esdiferente a la media de n,a2 para cada nivel de tama;o de río,
Se utili0ó el comando t,test para o$tener lo valor del estadístico de prue$a y el p%valor
5eloci"a" Esta"2stico "e
preba
P-valor Se rec/a&a
34
n.a!. - n.a#. Gi4 %12,122,1&- &,22?33?2 Jo
n.a!. - n.a#. 7oA %&,23&23@ &,12-'9 Jon.a!. - n.a#. medium 23,91-,'1 &,&1@-3'1- Sí
7os datos de la muestra permiten rec4a0ar 5ue la media de na,9 es iual a la de n,a2 en ríos develocidad) medium medianaF afirmando 5ue la media de na,9 es mayor en este escenario conconfia$ilidad de @-,
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 9/18
TERERA PARTE6 RE+RESI7N 8INEA8 MU8TIP8E
(ara esta actividad se tiene una ta$la con los precios de ciertas viviendas y las características
5ue influyen en el precio de la misma, Se 5uiere determinar cu#l de estas varia$les tiene
mayor influencia so$re el precio de estas viviendas y austarlas a un modelo de reresión
lineal,
El primer modelo 5ue se o$tuvo fue el de todas las varia$les involucradas este es)
−¿ freeway
−¿lot −0.9373dist ¿−¿ lot +0.0158 large
¿
price=10.8980+0.0649 sqft −0.0013age−0.0451 bedrooms−0.057 vacant ¿
Este modelo tuvo como coeficientes m#s sinificativos 1&,@& termino
independienteF y &,&9'@ y menos sinificativos %&,&'-1 L %&,@3?3 y &,&1-, Como estas
:ltimas varia$les son las menos sinificativas recalcular el modelo sin estas varia$les de$e
afectar muy poco el modelo oriinal,
8epitiendo este procedimiento viilando 5ue los valores 8%cuadrado m:ltiple no
cam$ien sustancialmente se lleó a 5ue el modelo m#s pe5ue;o 5ue meor descri$e los datos
es el modelo) price=10.6829+0.0637 sqft
Este modelo lineal simple es el 5ue meor descri$e las el precio pues los coeficientes
β0
, β1 tienen un p%valor de 2∙10
−16 lo cual para efectos pr#cticos se pueden
apro*imar a & y en consecuencia para todo α , p−valor<α por lo cual estos valores son
sinificativos para el modelo, .dem#s la correlación lineal entre price> y =s5ft> es $astante
cercana a 1 &,@?1-2&F lo cual apoya tam$i6n este modelo como un $uen descriptor de los
precios de los inmue$les,
Se puede o$servar 5ue los datos de los residuales son normales en el r#fico 1,
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 10/18
+rá,ico ' 9 Nor$ali"a" "el error "e esti$acion
7os errores est#n acotados entre %2 y 3 y no siuen nin:n patrón, Minalmente los valoes de la
varia$le s5ft son independientes de los errores como se o$serva en el r#fico 2,
Concluido todo este an#lisis de los residuos del modelo y de valores sinificativos se puede
decir 5ue este modelo con las varia$les es el 5ue meor trata de descri$ir los precios de las
viviendas
Gráfco #- $arian%a del error, e independencia de la variable s&'t del error
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 11/18
7N8USI7NES
Culminadas las prue$as actividades y los an#lisis correspondientes se puede determinar 5ue
dado 5ue no se pudo rec4a0ar la 4ipótesis nula en ninuna de las prue$as de varian0a de la
primera parte la varian0a de las po$laciones de alas no se ven afectadas por la temporada en
la 5ue se realice la prue$a,
.lunas po$laciones de alas si se ven afectadas por las temporadas pues si se perci$ieron
cam$ios en las medias po$lacionales con el uso de las prue$as de 4ipótesis, N por :ltimo en el
verano las alas n,a9 la media po$lacional de alas en los ríos es mayor 5ue cero pues se
proporcionó suficiente evidencia para 5ue la prue$a de 4ipótesis rec4a0ara la suposición de
5ue la media po$lacional en verano es cero,
En la seunda parte se compararon los crecimientos de las alas de acuerdo al tama;o del río
y de la velocidad en particular 5ue la media del ala n,a2 fuera mayor 5ue la de n,a9, Con el
tama;o de río rande las muestras arroaron suficiente evidencia para decir 5ue la media de
n,a2 era mayor 5ue n,a9 pero con los otros tama;os la evidencia no proporcionó información
suficiente para aceptar esta 4ipótesis,
En cuanto a la velocidad de los ríos se puede decir 5ue al menos los ríos con una velocidad
moderada afectan de manera sinificativa el crecimiento de las alas pero como sucedió en
para los tama;os del río la evidencia no pudo confirmar la e*istencia de diferencia
sinificativa entre las alas,
Con respecto al modelo de reresión lineal se puede decir 5ue no todas las varia$les 5ue
determinan un cierto valor respuesta tienen influencia e5uitativa en la determinación de este
valor, 7as varia$les con mayor correlación lineal tienen mayor influencia mientras 5ue las
menos correlacionadas podrían uar un papel desprecia$le en el modelo tanto 5ue podría
prescindirse se ellas, /al es el caso del modelo estudiado para el cual se tenían 9 varia$les
pero al final la varia$le m#s influyente era una sora =s5ft>,
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 12/18
ANE:7S (SRIPT)
(8ONEC/O 2
7ectura de la /a$la
ta$laHread,ta$lePalasfin,normP4eaderH/FL
columnasHcolnamesta$laFL
(8I"E8 (8OB7E".
.n#lisis descriptivo de las varia$les
printP.nalisis descriptivo de las varia$lesPF
dev,neAF
parmfroAHc13FF
$o*plotsplitta$laQ13Rta$laseasonFmainHP(o$lacion de ala n,a2 por/emporadaPcolHcPdarTorane1PPforestreenPPold1PPdeepsTy$luePFyla$HPn,a2,PF
$o*plotsplitta$laQ13Rta$lasi0eFmainHP(o$lacion de ala n,a2 por tamanio delrioPcolHcPdarTorane1PPforestreenPPold1PFyla$HPn,a2,PF
$o*plotsplitta$laQ13Rta$laspeedFmainHP(o$lacion de ala n,a2 por velocidad delrioPcolHcPred3PPforestreenPP$luePFyla$HPn,a2,PF
fori in levelsta$laseasonFF
printsprintfPtemporada s n,a2PiFF
printsummaryta$laQta$laseasonHHi13RFF
V
printWWF
for i in levelsta$lasi0eFF
printsprintfPtamanio rio s n,a2PiFF
printsummaryta$laQta$lasi0eHHi13RFF
V
printWWF
for i in levelsta$laspeedFF
printsprintfPvelocidad rio s n,a2PiFF
printsummaryta$laQta$laspeedHHi13RFF
V
dev,neAF
parmfroAHc13FF
$o*plotsplitta$laQ1?Rta$laseasonFmainHP(o$lacion de ala n,a9 por
/emporadaPcolHcPdarTorane1PPforestreenPPold1PPdeepsTy$luePFyla$HPn,a9,PF
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 13/18
$o*plotsplitta$laQ1?Rta$lasi0eFmainHP(o$lacion de ala n,a9 por tamanio delrioPcolHcPdarTorane1PPforestreenPPold1PFyla$HPn,a9,PF
$o*plotsplitta$laQ1?Rta$laspeedFmainHP(o$lacion de ala n,a9 por velocidad delrioPcolHcPred3PPforestreenPP$luePFyla$HPn,a9,PF
printPPFL
fori in levelsta$laseasonFF
printsprintfPtemporada s n,a9PiFF
printsummaryta$laQta$laseasonHHi1?RFF
V
printPPF
for i in levelsta$lasi0eFF
printsprintfPtamanio rio s n,a9PiFF
printsummaryta$laQta$lasi0eHHi1?RFF
V
printPPF
for i in levelsta$laspeedFF
printsprintfPvelocidad rio s n,a9PiFF
printsummaryta$laQta$laspeedHHi1?RFF
V
Comparacion de varian0as para de las alas n,a2, y n,a9,
printWComparacion de varian0as para las alas n,a2, y n,a9,WF
estacionesHlevelsta$laseasonFL
colsHcF
4ipXvarsHmatri*nroAH12ncolH3FL
colnames4ipXvarsFY%cPEstadistico de prue$aPP(%valorPPse rec4a0a G&PF
roAnames4ipXvarsFY%roAnames4ipXvarsdo,JU77HMprefi*HWalaWF
for i in 1)lent4columnasFF
if columnasQiRHHWn,a2,W ZZ columnasQiRHHWn,a9,WF
colsHappendcolsiF
V
V
TH1L
testHJU77L
A4ile lent4estacionesF[H&F
au*HestacionesQ1RL
estacionesHestacionesQ%1RL
au*tHta$laQta$laseasonHHau*colsRL
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 14/18
fori in estacionesF
au*iHta$laQta$laseasonHHicolsRL
c1Hau*tQ1R
c2Hau*iQ1R
if varc1FYvarc2FF
testHvar,testc2c1conf,levelH&,@@F
V else
testHvar,testc1c2conf,levelH&,@@F
V
4ipXvarsQT1RHteststatistic
4ipXvarsQT2RHtestp,value
4ipXvarsQT3RHtestp,valueYH1%&,@@roAnames4ipXvarsFQTRY%sprintfPs s%sPPn,a2,Pau*iFL
c1Hau*tQ2R
c2Hau*iQ2R
if varc1FYvarc2FF
testHvar,testc2c1conf,levelH&,@@F
V else
testHvar,testc1c2conf,levelH&,@@F
V
4ipXvarsQT\91RHteststatistic
4ipXvarsQT\92RHtestp,value
4ipXvarsQT\93RHtestp,valueYH1%&,@@
roAnames4ipXvarsFQT\9RY%sprintfPs s%sPPn,a9,Pau*iFL
THT\1L
V
V
print4ipXvarsF
estacionesHlevelsta$laseasonF
Incidencia de las estaciones en el crecimiento de las alas n,a2, n,a9,
printPIncidencia de las estaciones en el crecimiento de las alas n,a2, n,a9,PFL
4ipXdmedHmatri*nroAH12ncolH3F
colnames4ipXdmedFY%cPEstadistico de prue$aPP(%valorPPse rec4a0a G&PF
roAnames4ipXdmedFY%roAnames4ipXvarsdo,JU77HMprefi*HWalaWF
TH1L
A4ile lent4estacionesF[H&F
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 15/18
au*HestacionesQ1RL
estacionesHestacionesQ%1RL
au*tHta$laQta$laseasonHHau*colsRL
testHJU77L
fori in estacionesF
au*iHta$laQta$laseasonHHicolsRL
c1Hau*tQ1R
c2Hau*iQ1R
testHt,testc2c1conf,levelH&,@?F
4ipXdmedQT1RHteststatisticL
4ipXdmedQT2RHtestp,value
4ipXdmedQT3RHtestp,valueYH1%&,@?roAnames4ipXvarsFQTRY%sprintfPs s%sPPn,a2,Pau*iFL
c1Hau*tQ2R
c2Hau*iQ2R
testHt,testc2c1conf,levelH&,@?F
4ipXdmedQT\91RHteststatisticL
4ipXdmedQT\92RHtestp,value
4ipXdmedQT\93RHtestp,valueYH1%&,@?
roAnames4ipXvarsFQT\9RY%sprintfPs s%sPPn,a9,Pau*iFL
THT\1L
V
V
print4ipXdmedF
Jumero medio de alas tipo n,a9, mayor 5ue cero en verano ]F
printWEs numero medio de alas n,a9 en verano es mayor 5ue cero ]FWF
c1Hta$laQta$laseasonHHWsummerW1?R
n1Hlent4c1F
vHvarc1F
testHt,testc1alternativeHWreaterWconf,levelH&,@2FL
printP7a media de las alas m,a9, en verano es mayor 5ue cero con confian0a de @2PFL
printsprintfP Estadistico de prue$a) s p%valor) s rec4a0ado G&)sPteststatistictestp,valuetestp,valueYH1%&,@2FFL
Curva de potencia
*Hse5&1&&&,1FL
yH1%pt&%*F!v!s5rtn1FFdfHn1%1F
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 16/18
dev,neAF
plot*ytypeHWlWmainHPCurva de potencia para la prue$a de n,a9, mayor 5ue & enveranoPcolHWoraneredW *la$HWalor alternativoWyla$HP(ro$a$ilidadPFL
rmestaciones*yvau*iF
Seunda (arte
(arte .) Comparacion de las medias po$lacionales de n,a9 y n,a2 para cada tama;o de río
printPSeunda (artePFL
tamXvelHlevelsta$lasi0eF
4ipXdmedrHmatri*nroAH3ncolH3F
colnames4ipXdmedrFY%cPEstadistico de prue$aPP(%valorPPse rec4a0a G&PF
roAnames4ipXdmedrFY%roAnames4ipXdmedrdo,JU77HMprefi*HWalaWF
TH1L
for i in tamXvelF
au*tHta$laQta$lasi0eHHicolsR
c1Hau*tQ1R
c2Hau*tQ2R
testHt,testc1c2alternativeHWreaterWF
4ipXdmedrQT1RHteststatistic
4ipXdmedrQT2RHtestp,value
4ipXdmedrQT3RHtestp,valueYH1%&,@-roAnames4ipXdmedrFQTRY%sprintfPn,a2, % n,a9, tamnio sPiF
THT\1
V
printPComparacion de medias de las alas n,a9, y n,a2 de acuerdo al tamanio del rioPFL
print4ipXdmedrF
(arte B) Comparación de "edias po$lacionales de las alas n,a2 y n,a9, para cada velocidad de río
tamXvelHlevelsta$laspeedFL
4ipXdmedvHmatri*nroAH3ncolH3F
colnames4ipXdmedvFY%cPEstadistico de prue$aPP(%valorPPse rec4a0a G&PF
roAnames4ipXdmedvFY%roAnames4ipXdmedrdo,JU77HMprefi*HWalaWF
TH1
fori in tamXvelF
au*tHta$laQta$laspeedHHicolsR
c1Hau*tQ1R
c2Hau*tQ2R
testHt,testc1c2F
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 17/18
4ipXdmedvQT1RHteststatistic
4ipXdmedvQT2RHtestp,value
4ipXdmedvQT3RHtestp,valueYH1%&,@-
roAnames4ipXdmedvFQTRY%sprintfPn,a2, % n,a9, velociad sPiF
THT\1
V
printPComparacion de medias de de las alas n,a9, y n,a2 de acuerdo a la velocidad del rioPF
print4ipXdmedvFL
rmau*ttamXvelc1c2colstestn1Tau*iF
/ercera parte
lectura de las varia$les
casasHread,ta$leW4ouseXprices2,t*tW4eaderH/FcasasHcasasQc1)?FR
priceHcasasprice
s5ftHcasass5ft
aeHcasasae
$edroomsHcasas$edrooms
vacantXlotHcasasvacant
lareXlotHcasaslareXlot
distXfreeAayHcasasdistXfreeAay
corXvarsHcorcasasuseHWcomplete,o$sWF Correlacion entre las varia$les,
O$tención del modelo lineal con todas las varia$les
modeloXcompletoHlmprice^s5ft\ae\$edrooms\vacantXlot\lareXlot\distXfreeAayF .uste contodas las varia$les
printP/E8CE8. (.8/EPF
printP"odelo con todas las varia$lesPF
printsummarymodeloXcompletoFF
.n#lisis y crítica completo del modelo o$tenido
corXvarsHcorcasasuseHWcomplete,o$sWF Correlacion entre las varia$les,
printPCorrelacion e*istente entre las varia$les independientes y la varia$le respuestaPF
printcorXvarsQ1c2)?FRF
dev,neAF
pairscasasmainHPCuadro de dispersion de los datos por cada par de varia$lesPla$elsHcP(recioPP(iesCuadradosPP.ntiuedadPPCant, Ga$,PP7ote acantePP7ote _randePPDist .utopistaPFF
Bus5ueda del meor modelo
printP"odelo sin lare lotPF
modeloHlmprice^s5ft\ae\$edrooms\vacantXlot\distXfreeAayF
7/23/2019 PROYECTO 2 ESTADISTICA
http://slidepdf.com/reader/full/proyecto-2-estadistica 18/18
printsummarymodeloFFL
printP"odelo sin DistXfreeAayPF
modeloHlmprice^s5ft\ae\$edrooms\vacantXlotF
printsummarymodeloFF
printP"odelo sin aePF
modeloHlmprice^s5ft\$edrooms\vacantXlotF
printsummarymodeloFF
printP"odelo sin $edroomsPF
modeloHlmprice^s5ft\vacantXlotF
printsummarymodeloFF
El modelo lineal 5ue meor se austa al precio de las viviendas es el modelo (recioH $&\$1`s5ftF lasinificancia de las varia$les es la mas alta W```WF
printP"EO8 "ODE7OPF
meorXmodeloHlmprice^s5ftF
printsummarymeorXmodeloFF
ustificación del meor modelo
dev,neAF
parmfroAHc12FF
rHrstandardmeorXmodeloF
55normrmainHPDistri$ucion de los valores residualesPcolHWred2W*la$HPCuantiles/eoricosPyla$HPCuantiles de muestraPF
55linerF
$o*plotrmainHPDistri$ucion de los cuantilesPcolHWoraneWyla$HP"uestra Jormali0adaPF
C4e5ueo de la 4omeocedasticidad
dev,neAF
parmfroAHc12FF
plotfitted,valuesmeorXmodeloFrmainHPDispersion de los datosaustadosPcolHPdeepsTy$lueP*la$HPalores austadosPyla$HPError estandarPFL
plots5ftQ[is,napriceFRrmainHPDispersion de los datos (ie,CuadradoPcolHPold3P*la$HPalores des5ftPyla$HPError estandarPFL
Con este modelo dependiente solo de los pies cuadrados de terreno se puede modelarsatisfactoriamente el precio de la las casas
rmaes5ftdistXfreeAayvacantXlotlareXlotmeorXmodelomodelo$edroomsF
top related