6679107_probabilidadti

5
Abstractin the following paper shows how to apply simple regression and correlation of variables in the field of engineering and other fields in which it is essential to solution concepts or problems of this type are proposed. Keywords— variables, correlation, slope, intercorrelations. I. INTRODUCCIÓN Este proyecto de investigación, tiene como finalidad presentar un avance de la aplicación de correlaciones de variables y regresión simple en la ingeniería y la importancia de esta, en el cual se podrá observar y analizar sus soluciones y aplicaciones a problemas determinados de este aspecto obteniendo desarrollos a los mismos sin alguna dificultad y reconociendo además, que este algoritmo matemático es empleado no solo en ingeniería sino en muchos otros campos de la vida. II. REGRESIÓN LINEAL En estadística la regresión lineal o ajuste lineal es un método matemático que modela la relación entre una variable dependiente Y, las variables independientes X i y un término aleatorio ε. Este modelo puede ser expresado como: Y’= a+bX Donde Y’ es el valor predicho a es el intercepto b es la pendiente de la línea y X es el predictor. Donde a puede ser calculada a partir de la siguiente fórmula: a = My - bMx Donde My es la media de Y, y Mx es la media de X Donde b puede ser calculada a partir de la siguiente fórmula: 4 b = r (Sy/Sx), Donde Sy es la desviación estándar de Y, y Sx la de X Siguiendo asi obtenemos una formula general como la siguiente: : Variable dependiente : Variables explicativas : Parámetros, miden la influencia que las variables explicativas tienen sobre el regresando. Donde es la intersección o término "constante", las son los parámetros respectivos a cada variable independiente, y es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal. Esta regresión se utiliza para predecir una medida basándonos en el conocimiento de otra. [1] A. Regresión lineal simple: CORRELACION DE VARIABLES Y REGRESION SIMPLE Florez, Laura 1 ; Montilla, Juan 2 ; Piratova, Joel 3 ; Rodríguez, David 4 [email protected] 1 ; [email protected] 2 ; [email protected] 3 ;

Upload: pato-florecita

Post on 29-Sep-2015

214 views

Category:

Documents


2 download

DESCRIPTION

conceptos de correlación y regresión simple

TRANSCRIPT

IEEE Paper Template in A4 (V1)

CORRELACION DE VARIABLES Y REGRESION SIMPLE

Florez, Laura1; Montilla, Juan2; Piratova, Joel3; Rodrguez, David4 [email protected]; [email protected]; [email protected]; [email protected] MANUELA BELTRANAbstract in the following paper shows how to apply simple regression and correlation of variables in the field of engineering and other fields in which it is essential to solution concepts or problems of this type are proposed.

Keywords variables, correlation, slope, intercorrelations.I. introduccinEste proyecto de investigacin, tiene como finalidad presentar un avance de la aplicacin de correlaciones de variables y regresin simple en la ingeniera y la importancia de esta, en el cual se podr observar y analizar sus soluciones y aplicaciones a problemas determinados de este aspecto obteniendo desarrollos a los mismos sin alguna dificultad y reconociendo adems, que este algoritmo matemtico es empleado no solo en ingeniera sino en muchos otros campos de la vida.II. regresin lineal Enestadsticalaregresin linealoajuste lineal es un mtodo matemtico quemodelala relacin entre una variable dependienteY, lasvariables independientesXiy un trminoaleatorio. Este modelo puede ser expresado como:Y= a+bXDonde Y es el valor predicho a es el intercepto b es la pendiente de la lnea y X es el predictor.

Donde a puede ser calculada a partir de la siguiente frmula: a = My - bMx

Donde My es la media de Y, y Mx es la media de X Donde b puede ser calculada a partir de la siguiente frmula: 4 b = r (Sy/Sx), Donde Sy es la desviacin estndar de Y, y Sx la de XSiguiendo asi obtenemos una formula general como la siguiente:

: Variable dependiente: Variables explicativas: Parmetros, miden la influencia que las variables explicativas tienen sobre el regresando. Dondees la interseccin o trmino "constante", lasson los parmetros respectivos a cada variable independiente, yes el nmero de parmetros independientes a tener en cuenta en la regresin. La regresin lineal puede ser contrastada con laregresin no lineal. Esta regresin se utiliza para predecir una medida basndonos enel conocimientode otra. [1]A. Regresin lineal simple:Slo se maneja unavariable independiente, por lo que slo cuenta con dosparmetros. Son de la forma:

Dondees el error asociado a la medicin del valory siguen los supuestos de modo que:

(Media cero,varianzaconstante e igual a uny

Con).[2]III. CORRELACION DE VARIABLESLa correlacin es una tcnica estadstica usada para determinar la relacin entre dos o ms variables en una distribucin bidimensional; la correlacin puede ser de al menos dos variables o de una variable dependiente y dos o ms variables independientes, denominada correlacin mltiple. La correlacin en otras palabras son los cambios que posee una variable y al mismo tiempo este influyen en los cambios que pueda tener otra. B. Coeficiente de la correlacin:El Coeficiente de Correlacin es un valor cuantitativo de la relacin entre dos o ms variables, el cual puede variar entre -1.00 hasta 1.00; la correlacin es positiva si al aumentar una de las variables aumenta tambin la otra, y negativa en caso contrario.El coeficiente de relacin lo podemos exponer mediante la letra r y la frmula para utilizarlo es la siguiente:

Donde se puede observar que la correlacin de proporcionalidad directa o positiva esta con los valores +1.00 y de proporcionalidad inversa o negativa, con -1.00 y esta no existe si la relacin entre las variables esta cuando el coeficiente es de 0.00 [3]

El Coeficiente de variacin (CV) es una medida de la dispersin relativa de un conjunto de datos, que se obtiene dividiendo la desviacin estndar del conjunto entre su media aritmtica y se expresa generalmente en trminos porcentuales.

Para los datos de una muestra se define el coeficiente de correlacin de momento del producto de Pearson. [8]

Coeficiente de correlacin de momento del producto de Pearson: datos de una muestra.

Ecuacin (1)

r (xy )=Sxy/(Sx Sy )

Dnde:

rxy=Coeficiente de correlacion de la muesta

sxy=Covarianza de la muestra

sx =Desviacion estandar de la muestra del x

sy = Desviacion estandar de la muestra del y Ecuacin (2)

Ecuacin (3)

IV. DIAGRAMA DE DISPERSIONLa forma de un diagrama de dispersin est basado en un grfico en el plano cartesiano mostrando la relacin de dos variables X y Y que son consecuentes entre s, siendo estas la relacin entre una variable controlable y una caracterstica de esa variable controlable en funcin de algn fenmeno. Resultando una relacin o correlacin entre ambas donde cada vez que aumenta el valor de X aumenta proporcionalmente el valor de Y o negativa si cada vez que aumenta el valor de X disminuye en igual proporcin el valor de Y. Los diagramas de dispersin son muy utilizados para comparar y mostrar valores numricos que se correlacionan entre s como datos, relacin causa-efecto, entre otros.Se pueden dividir as:

Correlacin directa donde la recta corresponde a una nube de puntos de la distribucin en una forma de recta creciente.

Fig.1 diagrama de dispersionde correlacion directa

Correlacion inversa aligual que en la anterior la nube de puntos de la relacion forman una recta pero en forma inversa o decreciente.

Fig.2 diagrama de dispersionde correlacion inversaCorrelacion nula quiere decir son incorreladas y la nube de puntos tiene una forma redondeada.

Fig.3 diagrama de dispersionde correlacion nulaSe dice que es una correlacion fuer cuando los puntos o la dispersion estan mucho mas juntos y se aproximan la la pendiente de la recta y debil cuando sucede lo contrario.

V. CORRELACION LINEALHace referencia a que tan dependiente es una variable de la otra (variables estadsticas), adems permite conocer la proporcionalidad existente entre ellas (dos variables necesariamente cuantitativas), es decir la correlacin solo mide la fuerza de una relacin lineal entre dos variables. [7]

De acuerdo con lo anterior se dice que el grado o nivel de correlacin pude ser: fuerte o dbil, directa o inversa, y por tanto se considera una relacin lineal fuerte si los puntos del diagrama de dispersin estn ubicados cerca de la recta y se considera dbil si: los puntos se encuentran esparcidos con respecto a la recta. [7]

Tambin es importante mencionar que la medida numrica de correlacin es el coeficiente de correlacin lineal o coeficiente de Pearson, se simboliza con la letra (r), y por medio de un diagrama de dispersin se puede observar la forma, la direccin y la fuerza de la relacin entre las dos variables.VI. SOLUCION EJERCICIO

estudiante prom. Medio superior prom. Superior

jaime801

eduardo821

carolina842,1

marcia851,45

pedro872,1

jose881,7

tomas882

irene893,5

claudi903,1

maria 912,4

antonio912,7

ana923

javier943,9

erika 963,6

linda984

TOTAL:133537,55

PROMEDIO892,503333333

DESVIACION50,99614734

COEFICIENTE DE CORRELACION0,900612611

Tabla.1 datos

Fig.4 diagrama de datos del promedio superior

Fig.5 diagrama de dispersion de promedio medio

Fig.6 diagrama de flujo

Las variables a intervenir son los promedios de los diferentes niveles que se tienen. Donde posee dos variables explicativas que son los dos promedios, ya que son independientes una de la otra y sus datos son calificados en rangos completamente distintos.En el promedio de los datos se observa que al hacer el equivalente en el promedio medio superior el resultado de dicho promedio es de 4.45 lo que nos muestra que los estudiantes tuvieron mejores notas en este aspecto a dirferencia de los que estaban en el superior sin embargo se correlacionan por que se realiza la equivalencia de una calificacion de 0-100 en una de 0-5.VII. conclusinEn este archivo se analiz y conceptualizo los trminos de correlacin y regresin para el afianzamiento de proponer soluciones a un determinado problema que nos incluya una relacin directa con variables y distinga entre ellas la dependencia o no de cada una.VIII. Referencias[1] C.F. Gauss. Theoria combinationis observationum erroribus minimis obnoxiae. (1821/1823). [2] "Frmulas", Probabilidad y Estadstica.Cs. Bsicas. U.D.B. Matemtica.Universidad Tecnolgica Nacional,Facultad Regional Buenos Aires. Editorial CEIT-FRBA. (Cdigo BM2BT2).[3] (2013) enciclopedia virtual wikipedia. [Online]. Available: http://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal

[4] (2013) enciclopedia virtual ditutor. [Online]. Available: http://www.ditutor.com/estadistica_2/correlacion_estadistica.html[5] http://www.monografias.com/trabajos88/dispersion-relativa/dispersion-relativa.shtml[6] http://www.bioestadistica.uma.es/libro/node23.htm[7] David S.Moore.(25/08/2013).Estadstica aplicada bsica.Recuperado de: http://books. google.com.co/books?id=oqOCiEyEjYcC&pg=PA122&dq=correlacion+estadistica&hl=es&sa=X&ei=BZMeUou8GbOysATq74Bo&ved=0CCwQ6AEwAA#v=onepage&q=correlacion%20estadistica&f=false.[8] Anderson,Sweeny.(25/08/2013).Estadistica.Recuperado de: http://books.google.com.pe/books?id=rT7WtNM2rOQC&pg=PA555&dq=coeficiente+de+correlacion&hl=es&sa=X&ei=sH4nUt3eOZLa9ATOmICIAQ&ved=0CDYQ6AEwAQ#v=onepage&q&f=false.