Esta actividad debera ser realizada en idioma espanol. Para realizar este documento usted debera leer los siguientes docuementos: (TEMA 13, TEMA 14, TEMA 15, TEMA 16, TEMA 17). REALIZAR UN DOCUMENTO

Iniciación a la investigación educativa Tema 1 7 . Correlación lineal y Chi -cuadrado Iniciación a la investigación educativa Tema 1 7. Correlación lineal y Chi -cuadrado 2 © Copyright Universidad Europea. Todos los derechos reservados. Índice Objetivos de aprendizaje ................................ ............................... 3 1. Presentación ................................ ................................ ........... 3 2. La correlación lineal ................................ ................................ . 3 3. Representación gráfica de una relación ................................ ........... 4 4. Correlación de Pearson ................................ .............................. 5 5. Interpretación de una correlación ................................ ................. 5 6. Propiedades de la correlación de Pearson ................................ ........ 6 7. Chi -cuadrado de Pearson ................................ ............................ 7 8. Ejemplo de análisis de independencia entre categorías ........................ 7 9. Resumen ................................ ................................ ............... 8 Referencias bibliográfic as ................................ .............................. 8 Iniciación a la investigación educativa Tema 1 7. Correlación lineal y Chi -cuadrado 3 © Copyright Universidad Europea. Todos los derechos reservados. Objetivos de aprendizaje Los objetivos que se pretenden alcanzar en este recurso son los siguientes: • Describir el indicador de Correlación de Pearson. • Describir el indicador Chi -cuadrado de Pearson. 1. Presentación El contenido del presente tema está dedicado a presentar los dos estadísticos más usados para el análisis y la relación entre dos variables ; relación entre dos variable s cuantitativa e independencia entre dos variables cualitativas. 2. La correlación lineal Recordemos que la estadística se encarga en parte de resumir y trasmitir información. En ese objetivo, la estadística analiza las relaciones que existen entre variabl es. La descripción de una relación simplifica el entendimiento de los fenómenos de estudio en tanto que resume la información de dos variables. Un ejemplo de relación entre dos variables cuantitativas es la que se puede dar entre cantidad de alcohol ingerido al mes y el número de episodios de la violencia contra la pareja. El consumo de drogas está relacionado con otras conductas delictivas (Muñoz -Rivas, Grana, Peña y Andreu, 2002). Las relaciones pueden ser de varios tipos, tantos tipos de relaciones como nos imaginemos y como seamos capaces de formalizar matemáticamente. Sin embargo, en estadística, las relaciones mayormente analizadas son las lineales. Figura 1. Gráfico de dispersión entre dos variables cuantitativas. Los dos ejes representan la m agnitud de cada variable, es decir, que se muestran los valores de las dos variables a la vez. Iniciación a la investigación educativa Tema 1 7. Correlación lineal y Chi -cuadrado 4 © Copyright Universidad Europea. Todos los derechos reservados. Los diagramas de dispersión permiten visualizar la relación entre dos variables de una manera sencilla. El estudio de las relaciones lineales se ha centrado ge neralmente en variables cuantitativas de intervalo, aunque de forma práctica también se haya analizado las relaciones con variables ordinales y de razón. 3. Representación gráfica de una relación Existen tres tipos de relación lineal , que se pueden diferenciar mediante una representación gráfica de dispersión (ver en la Figura 2, A, B, C) . En general puede afirmarse que entre dos variables (X e Y) hay una relación lineal directa o positiva (A) cuando a los valores altos en Y tienden a corresponderse con valores altos en X, los valores intermedios en Y suelen emparejarse con valores intermedios en X y así también en los casos de valores bajos. Cuando entre dos variables se da una relación lineal inversa o negativa (B) cuando los valores altos en Y tien den a ir acompañados por valores bajos en X, los valores intermedios en Y tienden a emparejarse con valores intermedios en X y a los valores bajos en Y suelen corresponder valores altos en X. Un ejemplo de esta relación se da entre fatiga y rendimiento , es decir, que a mayor fatiga corresponde un menor rendimiento. Se dice que entre dos variables no existe relación lineal (C) cuando no se observa un emparejamiento sistemático entre ellas; eso ocurre bien porque no existe ningún tipo de relación, bien porque la relación no es lineal . Un ejemplo de no relación existe entre la variable altura e inteligencia, mientras que una relación no lineal se da entre la variable ansiedad y rendimiento. La manera más sencilla de reconocer los tipos de relación existente ent re dos variables es la representación gráfica mediante el diagrama de dispersión. Figura 2. Tipos de relación . Iniciación a la investigación educativa Tema 1 7. Correlación lineal y Chi -cuadrado 5 © Copyright Universidad Europea. Todos los derechos reservados. 4. Correlación de Pearson La fórmula desarrollada por Pearson cuantifica la relación lineal entre dos variables: = ∑ Nótese que la fórmula refleja que la relación es el resultado de multiplicar (el producto) de las puntuaciones estandarizadas de dos variables, para después dividirlo entre n. La fórmula expresada con puntuaciones directas es la siguiente: = ( ∑)− (∑∑) (√ ∑2− (∑)2) (√ ∑2− (∑)2) El resultado de la resolución de la ecuación es un número que expresa en magnitud el grado en que dos variables se parecen linealmente, es decir, su similitud. 5. Interpretación de una correlació n Cuando la relación es positiva , significa que cuando una de las variables aumenta, la otra también lo hace. Cuando la relación entre variables es negativa, aumenta la cantidad en una de las variables y disminuye la cantidad en la otra. Finalmente, si el índice es igual a cero, no hay relación lineal entre variables. • El índice de correlación (r xy), tiene un rango [ -1,1] . • rxy = 1, correlación positiva lineal perfecta. • 0, rxy 1, correlación positiva. • rxy = 0, no hay relación lineal. • -1 r xy 0, correlación negativa. • rxy = -1, correlación lineal negativa perfecta. Se suele considerar que una correlación es baja cuando es inferior a .40. Es una correlación de magnitud media cuando es inferior a .60 y es una correlación alta con Iniciación a la investigación educativa Tema 1 7. Correlación lineal y Chi -cuadrado 6 © Copyright Universidad Europea. Todos los derechos reservados. magnitudes superiore s a .80. Lo mimo podemos decir aunque la correlación sea negativa o inversa: Figura 3. Tipo de correlación (positiva y negativa) . 6. Propiedades de la correlación de Pearson A continuación , listaremos alguna de las propiedades de la correlación de Pearson (rxy): • Si elevamos al cuadrado el índice de correlación y lo multiplicamos por 100, el cálculo resultante nos indica el porcentaje (%) de variabilidad común entre X e Y: (r 2xy x 100). • Hay que recordar que una r xy = 0 no indica falta de otros tipos de relaciones. Puede haber relaciones cuadráticas y cúbicas entre otras. • La variabilidad, es decir, la distribución y la dispersión de las variables y las propiedades métricas de la medida, afecta a la magnitud del índice. • La correlación no implica causalidad. Esta idea es importante, es decir, una correlación describe una relación entre dos variables, pero no explica la causa de la relación. Para determinar o cuantificar la causa de una relación son necesarios análisis, método s de investigación y/o marcos teóricos complementarios. Iniciación a la investigación educativa Tema 1 7. Correlación lineal y Chi -cuadrado 7 © Copyright Universidad Europea. Todos los derechos reservados. 7. Chi -cuadrado de Pearson Además de relacionar variables podemos analizar su falta de relación o independencia.

Este es el caso de las variables cualitativas, donde lo que se analiza es la falta de relación entre las categorías de dos variables. Para ello , Pearson desarroll ó otro indicador. Aunque previamente aún no hemos utilizado los conceptos de la estadística inferencial, diremos solo que para realizar este análisis será necesario realizar una prueba llamada de contraste. La lógica concreta de este tipo de técnicas excede los objetivos de este tema, por lo que , de forma práctica diremos que lo que realiza la prueba es un análisis de igualdad de frecuencias entre categorías. Si las frecuencias en las categorías de las variables no son iguales, el estadístico es mayor. Si las categorías entre dos variables son ig uales, el estadístico tiende a cero. El estadístico en este caso se llama Chi -Cuadrado y se representa por una X2. La fórmula del estadístico presenta la siguiente forma: 2= ∑ ∑(− ̂)2 ̂ Y las frecuencias esperadas son: ̂ = 1+ 2 Si asumimos que dos variables categóricas son independientes, cabe esperar que las ñ o frecuencias esperadas, es decir, sus probabilidades, sean iguales entre categorías contingentes. 8. Ejemplo de análisis de independencia entre categorías Imaginemos dos variables que a priori suponemos independientes, es decir, no relacionadas. Vamos a analizar en una muestra de n = 1000 personas (500 hombres y 500 mujeres) la independencia entre la variable sexo y los delitos de circulación vial. Variables: X: Sexo (hombre y mujeres), Y: Delito de circulación vial (S í, No). Tabla 1. Tabla de contingencia entre sexo y delitos de circulación vial (entre paréntesis, frecuencias esperadas) . Delitos de circulación vial Sexo SÍ NO Total Hombres 113 (80) 387 (420) 500 Mujeres 47 (80) 453 (420) 500 Total 160 840 1000 Iniciación a la investigación educativa Tema 1 7. Correlación lineal y Chi -cuadrado 8 © Copyright Universidad Europea. Todos los derechos reservados. 2= ∑ ∑(− ̂)2 ̂ = (113 − 80 )2 80 + (47 − 80 )2 80 + (387 − 420 )2 420 + (453 − 420 )2 420 = 32 ,41 El valor final de X 2 es igual a 32,41. Esta magnitud del estadístico significa que las categorías no son independientes. En circunstancias de igualdad, el estadístico según su normal distribución (consultar una tabla de distribución del estadístico), tiene un valor de: 2 1;0,95 = 3,84 Dado que 32,41 es casi nueve veces mayor que el valor de independencia, se concluye que las categorías no son independientes. 9. Resumen En este tema se han presentado y ejemplificado los dos estadísticos básicos para la relación o independencia de variables cualitativas y cuantitativas. • La fórmula de correlación desarrollada por Pearson cuantifica la relación lineal entre dos variables. • Si las frecuencias en las categorías de las variables son iguales (independientes), el estadístico Chi -cuadrado de Pearson tiende a cero. Referencias bibliográficas Muñ oz -Rivas, M.J. , Grana , J.L., Peña, M.E. y Andreu, J.M. (2002). Influencia de la conducta antisocial en el consumo de drogas ilegales en población adolescente. Adicciones, 14 , 313 -320. Pardo, A., Ruiz, M. A., y San Martín, R. (2011). Análisis de datos en ci encias sociales y de la salud I . Madrid: Editorial Síntesis. Yau, N. (2011). Visualize This: The FlowingData Guide to Design, Visualization, and Statistics. New Jersey: Wiley. Iniciación a la investigación educativa Tema 1 7. Correlación lineal y Chi -cuadrado 9 © Copyright Universidad Europea. Todos los derechos reservados. © Todos los derechos de propiedad intelectual de esta obra pertenecen en exclusiva a la Universidad Europea de Madrid, S.L.U. Queda terminantemente prohibida la reproducción, puesta a disposición del público y en general cualquier otra forma de explotación de toda o parte de la misma. La utilización no autorizada de esta obra, así como los perjuicios ocasionados en los derechos de propiedad intelectual e industrial de la Universidad Europea de Madrid, S.L.U., darán lugar al ejercicio de las acciones que legalmente le correspondan y, en su caso, a las responsabilid ades que de dicho ejercicio se deriven.