regresión lineal simple
DESCRIPTION
Regresión Lineal Simple. Capitulo 17. Los temas. Regresión Lineal Comparando ecuaciones lineales Bondad de ajuste (Chi square) Tabla de contingencia The sign test (la prueba de signos) The run test (la prueba de corrida). Regresión vs. correlación. la relación entre dos variables - PowerPoint PPT PresentationTRANSCRIPT
Regresión Lineal Simple
Capitulo 17
Los temas
• Regresión Lineal• Comparando ecuaciones lineales• Bondad de ajuste (Chi square)• Tabla de contingencia• The sign test (la prueba de signos)• The run test (la prueba de corrida)
Regresión vs. correlación
• la relación entre dos variables– la magnitud de una variable (dependiente) se
asume que es determinada por una segunda variable (independiente)
– el termino “dependiente” no implica “causa y efecto”
La edad de los chupacabras
La
inte
ligen
cia
La edad de los chupacabras
La
inte
ligen
cia
Yi X i
La edad de los chupacabras
La
inte
ligen
cia
Yi X i i
La edad de los humanos
La
inte
ligen
cia
La edad de los chupacabras
La
inte
ligen
cia
Yi X i i
La edad de los humanos
La
inte
ligen
cia
Y “Best fit” Line, Ajuste Optimo
(X1,Y1)
(X2,Y2)
(X3,Y3)
(X4,Y4)
La edad de los humanos
La
inte
ligen
cia
Y “Best fit” Line, Ajuste Optimo
(X1,Y1)
(X2,Y2)
(X3,Y3)Y2 Y
La edad de los humanos
La
inte
ligen
cia
Y “Best fit” Line, Ajuste Optimo
(X1,Y1)
(X2,Y2)
(X3,Y3)Y2 Y
Y2 ˆ Y
Minimizar la diferencia entre (Y2 ˆ Y i 1
n
)2
X
Y
X
Y
X
Y
Positiva Negativa
Zero
El largo de las alas de los gorrión pardal de diferente edad
• X (Edad) Y Largo del ala (cm)• 3.0 1.4• 4.0 1.5• 5.0 2.2• 6.0 2.4• 8.0 3.1• 9.0 3.2• 10.0 3.2
El largo de las alas de los gorrón pardal de diferente edad
• X (Edad) Y Largo del ala (cm)• 11.0 3.9• 12.0 4.1• 14.0 4.7• 15.0 4.5• 16.0 5.2• 17.0 5.0•
Calcular la linea
x2 (Xi X)2 Xi2
( Xi )2
n
xy XiYi ( Xi )( Yi )
n
b xyx2
n
X X
X2
x2 b
a Y bX
Y Y
X iYi xy
n 13
X 130.0
X 10.0
X2 1562.0
x2 1562.00 (130.0)2
13262.0
b
a Y bX
Y 44.4
Y 3.415
XY 514.80
xy 514.80 (130.0)(44.4)13
70.80
b xyx2
70.80
262.000.270
a Y bX 3.415 (0.270cm / day)(10.0days)0.715cm
Y 0.715 0.270X
Assumptions
• 1. Para cada “x” hay una poblacion con distribución normal de “y”
• 2. homogeneidad de varianza• 3. la relación es lineal• 4. datos al azar e independientes• 5. los x’s se obtiene sin error.
La prueba
• Source SS DF MS• Total n-1• Linear reg. 1
• Residual (total SS -reg SS) n-2
• F =
y2( xy)2
x2regSSregDF
resSSresDF
regMSresMS
La prueba
• Source SS DF MS• Total 19.656923 12• Linear reg.19.132214 1 19.132214• Residual 0.524709 11 0.047701• • F = 401.1• F0.05(1),1,11= 4.84
r2 19.13221419.656923
0.97
Ejercicio• Determinar si el area fotosintetica de una orquidea
esta relacionado con la cantidad de flores producidas.
• Lepanthes rupestris, una orquídea endemic de Puerto Rico
• Trabajo de investigación de Eveneida Rodríguez
Area fotosintética (cm2) # de flores producidas2.644 222.709 02.759 282.598 242.718 102.262 42.520 162.826 382.559 162.395 42.160 02.830 293.097 46
130
.806
.650
.6189.046
CountNum. MissingRR SquaredAdjusted R SquaredRMS Residual
Regression Summary #fl vs. Leaf area
1 1668.190 1668.190 20.386 .000911 900.118 81.82912 2568.308
DF Sum of Squares Mean Square F-Value P-ValueRegressionResidualTotal
ANOVA Table #fl vs. Leaf area
-104.899 27.386 -104.899 -3.830 .002846.973 10.403 .806 4.515 .0009
Coefficient Std. Error Std. Coeff. t-Value P-ValueInterceptLeaf area
Regression Coefficients #fl vs. Leaf area
-505
101520253035404550
#fl
2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2Leaf area
Y = -104.899 + 46.973 * X; R^2 = .65
Regression Plot