15 ESTADÍSTICA BIDIMENSIONAL



Documentos relacionados
Covarianza y coeficiente de correlación

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

TEMA 9 DISTRIBUCIONES BIDIMENSIONALES

2 Resolución de algunos ejemplos y ejercicios del tema 2.

Semana de dieta (X) Peso en Kg (Y)

12 Distribuciones bidimensionales

CORRELACIÓN Y PREDICIÓN

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

FUNCIONES CUADRÁTICAS Y RACIONALES

Funciones lineales. Objetivos. Antes de empezar. 1.Función de proporcionalidad directa pág. 170 Definición Representación gráfica

Departamento de Economía Aplicada I ESCUELA UNIVERSITARIA DE ESTUDIOS EMPRESARIALES DIPLOMATURA EN CIENCIAS EMPRESARIALES ESTADÍSTICA

9 FUNCIONES DE PROPORCIONALIDAD DIRECTA E INVERSA

Selectividad Septiembre 2006 SEPTIEMBRE 2006

2 VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Muestreo estadístico. Relación 2 Curso

REGRESION simple. Correlación Lineal:

Módulo 9 Sistema matemático y operaciones binarias

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

Pruebas de Acceso a las Universidades de Castilla y León

Profr. Efraín Soto Apolinar. La función lineal. y = a 0 + a 1 x. y = m x + b

Funciones más usuales 1

Este documento ha sido generado para facilitar la impresión de los contenidos. Los enlaces a otras páginas no serán funcionales.

6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS

x y 8000 x + y a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

Colegio Las Tablas Tarea de verano Matemáticas 3º ESO

TEMA: ECUACIONES CON NÚMEROS NATURALES ECUACIONES DE PRIMER GRADO CON UNA INCÓGNITA.

Tema 9 Estadística Matemáticas B 4º E.S.O. 1 TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRÁFICAS EN VARIABLES DISCRETAS

Medidas de tendencia central o de posición: situación de los valores alrededor

GRADO TURISMO TEMA 3: ANÁLISIS DE DATOS TURÍSTICOS BIDIMENSIONALES

Estadística I Ejercicios Tema 3 Curso 2015/16

MATEMÁTICAS CCSS II Sobrantes 2010 (Modelo 1) SELECTIVIDAD ANDALUCÍA OPCIÓN A EJERCICIO 1

CORRELACIONES CON SPSS

Pruebas de Acceso a las Universidades de Castilla y León

FUNCIONES DE PROPORCIONALIDAD

LAS FUNCIONES ELEMENTALES

Lección 24: Lenguaje algebraico y sustituciones

4. Se considera la función f(x) =. Se pide:

13Soluciones a los ejercicios y problemas

La Pirámide Humana. En el Norte de Ecuador hay una tradición. Cada 18 de septiembre los hombres del pueblo entre 22 y 30 años hacen una pirámide.

Otras medidas descriptivas usuales

Recuerdas qué es? Constante de proporcionalidad Es el cociente de cualquiera de las razones que intervienen en una proporción.

ANÁLISIS DE CORRELACIÓN EMPLEANDO EXCEL Y GRAPH

Pruebas de acceso a enseñanzas universitarias oficiales de grado Castilla y León

Ejercicios de Trigonometría

a) x 1 = 2 b) x + x 6 = 2 + = + = c) x 9x + 20 = 2 d) x 6x 7 = a) x = 1 y x = 1 b) x = 3 y x = 2 c) x = 4 y x = 5 d) x = 1 y x = 7

MATEMÁTICAS 3º DE ESO UNIDAD 9

PROBABILIDAD Y ESTADÍSTICA

Unidad 6 Cálculo de máximos y mínimos

Ejercicio de estadística para 3º de la ESO

4 INECUACIONES Y SISTEMAS

EJERCICIOS PROPUESTOS. c) 5 2 d) 5 2 3

ANÁLISIS DESCRIPTIVO CON SPSS

SELECCIÓ D ACTIVITATS RESOLTES 4RT ESO MATEMÁTIQUES B

17.- PARABRISAS RESOLUCIÓN

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales

Actividades con GeoGebra

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

Análisis de medidas conjuntas (conjoint analysis)

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

1.4.- D E S I G U A L D A D E S

EJERCICIOS PROPUESTOS. Halla el dominio y el recorrido de estas funciones. a) f (x) 3x 1 b) g(x) x c) h(x) x 3

Selectividad Septiembre 2009 SEPTIEMBRE Opción A

15 PARÁMETROS ESTADÍSTICOS

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

Modelos estadísticos aplicados en administración de negocios que generan ventajas competitivas

SISTEMAS DE COORDENADAS SISTEMA COORDENADO UNIDIMENSIONAL

Sistemas de dos ecuaciones lineales con dos incógnitas

MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL

8 FUNCIONES: PROPIEDADES GLOBALES

INFORME DE ANÁLISIS DE ENCUESTAS DE SATISFACCIÓN DE USUARIOS PERÍODO

Examen de Matemáticas 2 o de Bachillerato Mayo 2003

Población, muestra y variable estadística

b) Los lados de un triángulo rectángulo tienen por medida tres números naturales consecutivos. Halla dichos lados.

Lecturas previas Cuando llegue a su primera sesión de laboratorio debe haber estudiado el contenido de la lectura que aparece a continuación.

UNIVERSIDADES DE ANDALUCÍA PRUEBA DE ACCESO A LA UNIVERSIDAD OPCIÓN A

Función exponencial y Logaritmos

ESTIMACIÓN. puntual y por intervalo

UCLM - Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG)

La derivada de y respecto a x es lo que varía y por cada unidad que varía x. Ese valor se designa por dy dx.

b1ct Propuesta Actividades Recuperación Matemáticas

Selectividad Septiembre 2008 SEPTIEMBRE 2008

EJERCICIOS DE REPASO SOBRE DERIVABILIDAD III. PROBLEMAS DE OPTIMIZACIÓN

EJERCICIOS PROPUESTOS. Copia y completa de modo que estas expresiones sean igualdades numéricas. a) c) 2 32 b) d)

ESTADÍSTICA SEMANA 4

EJERCICIOS RESUELTOS TEMA 1

IES Fco Ayala de Granada Junio de 2012 (General Modelo 4) Soluciones Germán-Jesús Rubio Luna

EJERCICIOS PROPUESTOS. a) En efecto, ya que a cada medida en centímetros le corresponde otra en pulgadas.

6Soluciones a los ejercicios y problemas PÁGINA 133

14 ESTADÍSTICA UNIDIMENSIONAL

Aplicaciones de Estadística Descriptiva

Página 123 EJERCICIOS Y PROBLEMAS PROPUESTOS. Dominio de definición PARA PRACTICAR UNIDAD. 1 Halla el dominio de definición de estas funciones: 2x + 1

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

4º ESO 1. ECUAC. 2º GRADO Y UNA INCÓGNITA

Media vs mediana vs moda Cual medida de tendencia central es mas adecuada? MEDIA conveniencias:

Tema 5: Análisis conjunto y teoremas límite

IES Fco Ayala de Granada Septiembre de 2011 (Modelo 5) Soluciones Germán-Jesús Rubio Luna

1. Funciones y sus gráficas

Transcripción:

ESTADÍSTICA BIDIMENSINAL EJERCICIS PRPUESTS. Copia y completa la siguiente tabla. A B C Total A B C Total a 4 b c 0 7 Total 7 6 a 4 b c 4 3 0 7 Total 7 6 3 6 a) Qué porcentaje de datos presentan la característica B en la variable unidimensional? b) Qué porcentaje de datos presentan la característica c en la variable unidimensional? c) Qué porcentaje de datos presentan la característica (B, c) en la variable bidimensional (, )? 6 a) Porcentaje de datos que presenta la característica B en la variable unidimensional 00 37, % 6 7 b) Porcentaje de datos que presenta la característica c en la variable unidimensional 00 43,7 % 6 3 c) Porcentaje de datos que presenta la característica (B, c) en la variable bidimensional (, ) 00 8,7 % 6. bserva la siguiente variable bidimensional. N. o de cigarrillos consumidos al día 3 6 8 0 Índice de mortalidad 0, 0,4 0,,,7 a) Representa la nube de puntos. b) Indica el tipo de correlación. a) La nube de puntos es la siguiente: Indice de mortalidad %0,8,6,4, 0,8 0,6 0,4 0, 4 6 8 0 4 6 8 0 4 6 8 30 N. de cigarrillos consumidos al día b) Como al aumentar el número de cigarrillos consumidos aumenta el índice de mortalidad, la correlación es positiva. 36

.3 Una variable bidimensional viene dada por la siguiente tabla. N. o de horas de estudio 3 4 N. o de horas de televisión 4 3 3 a) Representa el diagrama de dispersión. b) Indica el tipo de correlación. a) La nube de puntos es la siguiente: N. de horas de televisión 4 3 3 4 N. de horas de estudio b) Como al aumentar el número de horas de estudio disminuye el número de horas de televisión, la correlación es negativa..4 Una variable bidimensional viene dada por la siguiente tabla. a) Calcula las medias y las desviaciones típicas de las variables e. b) Calcula la covarianza de la variable (, ). Consideramos la siguiente tabla: a) x 6,40 N.º de cigarrillos xi 3 6 8 0 0, 0,4 0,,,7 Índice de mortalidad y i x i y i x i y i 3 0, 9 0,04 0,6 6 0,4 36 0,6,4 8 0, 64 0, 4 0, 400,44 4,7 6,89 4, 6 4 34 4,78 73, y 4 0,8 s 34,4 8,463 s 4, 78 0,8 0,6 b) s 73,,4 0,8 4,78 37

. Dados los siguientes valores de una variable bidimensional: 3 4 6 7 8 9 4 3 3 3 4 6 3 a) Halla las medias y las desviaciones típicas de las variables e. b) Calcula la covarianza de la variable (, ). Consideramos la siguiente tabla: x i y i x i y i x i y i 4 4 6 8 3 3 9 9 9 4 3 6 9 6 3 36 9 8 7 4 49 6 8 8 6 64 36 48 9 3 8 9 7 4 3 8 30 60 a) x 4 9 y 3 3,v 9 s 8 9,8 s 3 0 9 3, v,346 b) s 6 0 3,v 0 9.6 Dada la siguiente variable bidimensional, calcula el coeficiente de correlación. 3 6 7 8 9 0 4 0 6 4 Consideramos la siguiente tabla: x i y i x i y i x i y i 3 9 4 6 4 6 0 6 0 36 00 60 7 49 3 8 64 4 6 9 6 8 36 4 0 4 00 6 40 48 33 364 0 3 x 4 8 6,87 7 y 3 3 4,743 7 s 36 4 7 6,87,36 s 0 7 4,743,47 s 3 x y 0,6736 7 s r s s 0,8 38

.7 Calcula el coeficiente de correlación e interprétalo. 6 8 4 8 0 3 4 6 7 8 Consideramos la siguiente tabla: x i y i x i y i x i y i 6 3 36 9 8 8 4 64 6 3 4 4 96 70 6 36 90 8 7 34 49 6 0 8 400 64 60 9 3 366 03 8 x 9 3,49 7 y 3 7 s 3 66 7 3, 49 4,7336 s 0 3 7 s 8 x y 8,8 7 s r s s 0,87 Como r 0,87 las variables tienen una correlación positiva media..8 Una variable bidimensional viene dada por la siguiente tabla. 3 4 3 4 4 4 4 3 3 0 49 4 a) Calcula el coeficiente de correlación. b) Halla la recta de regresión. c) Si x, cuánto valdrá y? d) Es fiable esta predicción? Justifícalo. x i y i x i y i x i y i 3 4 69 96 70 4 96 704 78 4 96 94 3 3 69 809 689 4 3 96 809 74 4 0 96 00 700 49 40 73 4 484 764 94 6 407 76 0 89 84 a) x 6 4, 8 y 40 7 0,87 8 s 7 6 8 4, 3,044 0, s 0 89 8 87 3,76 s 8 4 x y 0,937 8 s r s s 0,974 b) y y s (x x) y 0,87 0, 937 (x 4,) y 0,87,84(x 4,) s 9, 0 c) Para x y 0,87,84( 4,) y 3,83 d) La predicción es fiable pues el valor del coeficiente de correlación, 0,974, está muy próximo a. 39

RESLUCIÓN DE PRBLEMAS.9 Halla, usando la recta de regresión, los valores de para, 4, 0,, 4, 6 y 8 años. Comprueba que se aproximan lo suficiente a los valores reales y calcula el error relativo cometido. La recta de regresión es: y 38,9,60(x 0,86). Para x 0 y 88,6970 Error relativo 90 88,697 0,0 90 Para x 40 y 99,83970 Error relativo 00 99,8397,603 0 3 00 Para x 0 y 33,4697 Error relativo 30 33,4697 0,067 30 Para x y 44,67970 Error relativo 4 44,6797,090 0 3 4 Para x 4 y,88970 Error relativo,8897,74 0 3 Para x 6 y 67,09970 Error relativo 70 67,0997 0,07 70 Para x 8 y 78,30970 Error relativo 78 78,3097,7399 0 3 78.0 Qué ocurre al tomar pocos valores para construir la recta de regresión? Halla la recta usando sólo las tallas correspondientes a los 0 y años. Comprueba si la aproximación es mejor o peor que en el caso anterior. Al tomar pocos valores obtendremos una aproximación peor. Calculemos la recta de regresión para las tallas correspondientes a los 0 y años. Para ello, consideremos la siguiente tabla: x i y i x i y i x i y i 0 30 00 6 900 300 4 44 0 740 7 44 37 9 3040 x y 7 37, s 30 40 x y 7, s 4 4 Luego la ecuación de la recta de regresión será: y y s (x x) y 37, 7, (x ) y 37, 7,(x ) s Si hallamos los valores de para, 4, 0,, 4, 6 y 8 usando la ecuación de esta recta de regresión, comprobaremos que, efectivamente, las aproximaciones son peores que en el caso anterior. 30

ACTIVIDADES EJERCICIS PARA ENTRENARSE Variables bidimensionales, dependencia y diagramas de dispersión. Sea la siguiente tabla de doble entrada. 3 7 Total 4 3 4 9 7 3 6 3 0 3 3 7 Total 6 8 9 9 3 Copia y completa las siguientes frases. a) La frecuencia absoluta de (, ) es b) El número de puntos del tipo (3, y) es c) El número de puntos del tipo (x, 3) es d) El punto de mayor frecuencia absoluta es e) El punto tiene frecuencia 4. a) 3 b) 8 c) 7 d) (7, ) e) (, 4). Elabora una tabla de doble entrada a partir de la siguiente variable bidimensional. a) Qué porcentaje de datos representa el valor (6, 8) dentro del conjunto de datos de la variable (, )? b) Calcula x, s. 3 6 0 0 8 f i 4 3 3 6 0 Total 0 8 4 4 3 3 Total 4 3 4 a) 00 33,3v % x b) x 8 i f 6 4 30 4 N i 7,08 s x i f x 8 44 300 88 N i 7,0 8 6,8 0,3,4 3,3 3

.3 Determina la media y la desviación típica de las variables e, y representa la nube de puntos de la siguiente distribución. 0 4 6 8 3 4 3 3 3 6 4 7 4 9 4 4 Qué tipo de relación existe entre ambas variables? x x i f 0 0 60 30 40 N i,9 48 s x i f x 0 0 40 80 30 N i,9 48 y y i f 8 6 77 8 N i, 48 s y i f y 8 63 3 39 79 N i, 34,7 48,8 8,4 7,39,7 7,6,7 Como se observa en el diagrama de dispersión, las variables no están relacionadas. Estamos ante un caso de independencia..4 Indica qué tipo de relación tienen las variables bidimensionales (, ); (, ), y (, 3 ). 3 4 7 9 7 4 3 0 3 3 (, ) Dependencia funcional y x 3. (, ) Correlación negativa y fuerte. (, 3 ) Correlación positiva y débil. 3

Covarianza y correlación. Asocia cada índice de correlación con el diagrama de dispersión correspondiente. r r 0,9 r 0, r 0,78 a) c) r 0,9 r 0, b) d) r 0,78 r.6 La siguiente tabla muestra los valores de una variable bidimensional. 0,,3,4 0,7 0, 0,33 0,63, 0,46 0, a) Calcula el coeficiente de correlación. b) Indica el tipo de correlación que existe entre ambas variables. s a) r s s x, 86 0,70 y 3, 8 0,636 0,08 0,83,9 0,078 0,0 s 0,7 0,636 0,778 0,3638 0,40 0,06,744,376 0,089 0,044 7 s 0, s 0,6 0,677 0,089 0,3969,40 0,6 0,044 36 0,638 0,40 r 0,77 0,9 6 0,4778 b) Entre las dos variables existe una correlación positiva media. 7 0,3 0,96 047 0,4 0,4778 33

.7 Dado el siguiente diagrama de dispersión: a) Elabora una tabla de doble entrada. b) Qué tipo de correlación tienen las dos variables? Fuerte o débil? Positiva o negativa? c) Qué coeficiente de correlación de los indicados se ajustaría mejor a la nube de puntos r 0,9, r 0,3, r 0,9? Compruébalo calculando numéricamente dicho coeficiente. a) 3 4 6 7 Total 3 4 6 7 8 Total b) Correlación positiva y fuerte. c) Se ajusta más r 0,9. s r s s 4 3 8 4 x 4,3 4 3 8 6 7 6 y 4, 6 6 6 0 0 4 48 4 6 s 4,3 4, 60 9,3 4,9 s 8 9 3 7 98 4,3 s 8 9 3 36 49 8 4, 4,9 4, 9 r 0,99 (como ya se había intuido),9,43 4, 67,7 8,49 3,8,9 6,8 0,,93,43 34

.8 La relación entre dos variables viene dada en la siguiente tabla. 3 4 6 7 8 9 4 9 6 4 30 34 38 4 a) Dibuja la nube de puntos asociada a la tabla. b) Elabora una tabla de doble entrada. c) Halla x, y, s. d) Calcula el coeficiente de correlación lineal. Cómo es la correlación? a) 4 b) 3 4 6 7 8 9 Total 4 9 6 4 30 34 38 4 Total 8 c) x 4 4, 8 y 9 7 4,6 8 8 7 64 0 80 38 304 378 s, 4,6 3 9 3,437 9,437 8 8 s d) r s s s 4 9 6 36 49 64 8, 8 s 4, 3, 30,,,93 6 8 6 76 900 6 444 764 6 67,73 44,9 8 9, 437 r 0,990,9 3,9 La correlación es positiva y muy fuerte. 3

Rectas de regresión y estimaciones.9 bserva el siguiente diagrama de dispersión y calcula la recta de regresión. 4 Consideramos la siguiente tabla: x i y i x i y i x i y i 7 34 4 89 4 0 6 4 3 6 69 6 66 36 7 7 49 49 49 3 4 9 4 9 36 6 8 6 9 4 36 8 6 90 36 8 9 7 64 8 0 0 8 8 346 x 0 0 y 0 0 s 8 3, 0 s 8 x y 3, 0 Recta de regresión: y (x ) y (x ).0 A qué nube de puntos se ajustaría mejor la recta de regresión de ecuación y 3x? Justifica la respuesta. a) b) Se ajusta mejor a la distribución B. Para comprobarlo, consideramos la siguiente tabla: 3 4 6 0 y 3x 4 7 0 3 bsérvese que las de la distribución B son muy semejantes a las que proporciona la recta de regresión. 36

. En la siguiente variable bidimensional: 3 4 3 7 6 3 4 4 30 30 0 0 0 a) Halla su centro de masas y su covarianza. b) Calcula su coeficiente de correlación lineal. Tiene sentido calcular su recta de regresión y realizar predicciones? c) Calcula su recta de regresión. d) Si el valor de la variable es, cuál es el valor estimado de la variable? e) Si el valor de la variable es 3, cuál es el valor estimado de la variable? a) Centro de masas (x, y) x 3 8 3,8 0 y, 0 4 60 90 00 7 70 0 4 40 7 s 3,8, 7 0 8, 3, 0 0 b) s 4 9 6 9 49 36 9 6 3,8 0,70 0 900 900 6 6 00 400 00 0 0,3078 s, 3, r 0,76,70 0,3078 Es una correlación media, por lo que sí tendría sentido calcular predicciones. c) Recta de regresión: y y s 3, (x x) y, (x 3,8) y, 4,608(x 3,8) s,960 d) x y, 4,608 ( 3,8) 8,8 e) y 3 3, 4,608 (x 3,8) 9, 4,608x 7,3304 x,8830 37

CUESTINES PARA ACLARARSE. Contesta verdadero (V) o falso (F) a las siguientes afirmaciones. a) Si r 0,34, las estimaciones con la recta de regresión son poco fiables. b) Dos variables no correlacionadas e tienen un coeficiente de correlación de 0,98. c) Dos variables e relacionadas por la ecuación y 6x 7 tienen un coeficiente de correlación lineal r 0,8. d) Una variable bidimensional de centro de masas (3;,) tiene una recta de regresión que pasa por el punto (3, ). a) Verdadero b) Falso c) Falso d) Falso.3 Si la covarianza de una distribución es negativa, qué podemos afirmar tanto del coeficiente de correlación como de la pendiente de la recta de regresión? Signo de coeficiente de correlación: Signo de la pendiente: s r s s ( )() m s s.4 Un coeficiente de correlación negativo significa una correlación débil de las variables? No necesariamente. Lo que significa es una nube de puntos decreciente.. Si dos variables bidimensionales (, ), (Z, T) tienen coeficientes de correlación r 0,989 y r ZT 0,989, en cuál de ellas será más fiable hacer una estimación? En cualquiera de las dos, ya que el valor absoluto del coeficiente de correlación es el mismo..6 El coeficiente de correlación de una distribución bidimensional es 0,8. Si los valores de las variables se multiplican por 0, cuál será el coeficiente de correlación de esa nueva distribución? 0 s r b r 0s 0 0 a s.7 En una distribución de 40 datos, la covarianza vale,60 y x,4, y,6. Calcula el valor de: f ij x i y j x s i y n i x y x i y i (s x y) n (,60,4,6) 40 3 38

.8 Sabiendo que m es la pendiente de la recta de regresión, justifica si la siguiente igualdad es cierta. m r s s La igualdad es cierta: m r s s m s r s s s s s s s s s.9 La variable bidimensional (, ) tiene como recta de regresión y 3x y r 0,7. La variable bidimensional (T, P) tiene como recta de regresión p 3t y r 0,96. En cuál de las dos rectas es más fiable estimar,? A qué valor corresponde la estimación realizada? Es más fiable en (T, P) al tener una correlación más fuerte., 3t 3t 0, t 3, PRBLEMAS PARA APLICAR.30 Escoge una variable de las dos primeras tablas y, a partir de la tercera, indica el tipo de relación que existe. Por ejemplo:. Número de horas sentado al cabo del día. A: Peso del individuo. : correlación positiva media.. Número de cigarros fumados al día.. Número de horas sentado al cabo del día. 3. Velocidad a la que voy en el coche. 4. Nota en una asignatura. A. Peso del individuo. B. Número de horas diarias de móvil. C. Capacidad pulmonar. D. Espacio que recorro. W. Dependencia funcional.. Correlación negativa fuerte.. Correlación positiva media. Z. Correlación positiva medio-fuerte. Podemos hacer las siguientes relaciones: C, AZ, 3DW, 4B 39

.3 En una encuesta a 30 jóvenes sobre el número de libros que leen al cabo de un año han respondido lo siguiente. sobre el número de películas vistas en un año: 0 3 4 6 7 f i 6 8 3 3 3 7 9 8 0 f i 6 8 3 3 a) Está relacionado el número de libros que leen los jóvenes con las películas que visualizan? Considera para ello la variable bidimensional (, ) construida a través de los pares (x i, y i ), y elabora una tabla de doble entrada. b) Dibuja el diagrama de dispersión. Indica qué tipo de correlación tienen. a) b) 0 3 4 6 7 Total 3 6 6 7 8 8 9 3 3 3 3 8 0 Total 6 8 3 3 30 Tienen una correlación positiva y fuerte..3 El siguiente diagrama expresa la relación entre la edad y el número de pulsaciones de personas. Calcula la recta de regresión. Consideramos la siguiente tabla: N. Pulsaciones 0 40 30 0 0 00 x i y i x i y i x i y i 60 60 600 40 40 9 600 0 300 4 00 3 40 40 9 9 600 3 30 390 9 6 900 3 0 360 9 4 400 4 30 0 6 6 900 4 0 440 6 00 0 0 00 00 00 0 000 6 0 660 36 00 7 00 700 49 0 000 44 00 40 00 9 800 3 4 6 7 Edad (años) x 4 4 3,6v y 00 s 00 3,6v 3,v s 40 x y 30 Recta de regresión: y 9,303(x 3,6v) y 9,303(x 3,6v) 330

.33 Una empresa realiza un estudio de los efectos de la publicidad sobre sus ventas. Los resultados de ese estudio en un determinado producto son los siguientes. Gasto 3 4 6 N. o productos 9 8 3 7 40 46 Los datos están dados en miles de euros. a) Calcula su coeficiente de correlación. b) btén su recta de regresión. c) Si se invierten 000 euros en publicidad, cuántas ventas del producto se estima que se producirán? d) Si en un determinado año se consiguen vender 60000 unidades del producto, cuánto se estima que se ha invertido en publicidad ese año? s a) r s s x 3, mil y 8,6v mil 9 36 96 08 00 76 s 3, 8,6v 0,8 00,3v 0, 6 s 4 9 6 36 3, 6 s 8,,6v,,7078 8 34 04 79 600 6 6 6v,388 0, r 0,973,7078,388 b) y y s 0, (x x) y 8,6v (x 3,) y 7,084x 4,0673 s,967 c) x 000 mil y 7,084 4,0673 09,4933 mil 09 493,3 d) y 60 000 60 mil 60 7,084x 4,0673 x 7,98 mil 798,.34 La media de los pesos de los individuos de una población es de 7 kilogramos, y la de sus estaturas, 73 centímetros. Las desviaciones típicas son 4 kilogramos y 9 centímetros, y la covarianza es 3. a) Cuál es el coeficiente de correlación? b) Calcula la recta de regresión del peso respecto a la estatura. c) Cuál es el peso estimado para un individuo de 8 centímetros? s 3 a) Consideremos la variable bidimensional (, ) (Peso, Estatura) r s s 3 0,97 4 9 36 b) y 73 3 (x 7) y 73,87 (x 7) y,87x, 6 c) Si y 8 cm x 8, 76,43 kg,87 33

.3 En un curso de Bachillerato de 40 alumnos se ha querido estudiar la correlación de notas de las asignaturas de Lengua () e Historia () como materias clave en itinerarios de letras. Los resultados han sido los siguientes. 3 4 6 7 8 0 4 7 6 3 7 9 0 El coeficiente de correlación es r 0,99, y su recta de regresión, y x 0,. a) Comprueba que la recta pasa por (x, y). b) Se define la desviación de cada punto, d, como la diferencia entre el valor real (y r ) y el valor estimado (y e ); es decir, d y r y e. Calcula todas las desviaciones de los datos y halla su suma, comprobando que se van equilibrando unas con otras. a) (x, y) (,4;,6) Sustituyendo en la recta de regresión se comprueba que,6,4 0,. b) Consideramos la siguiente tabla: x i y i y e d y r y e 3 3,, 4 4, 0,8, 0, 6 6 6, 0, 6 7 6, 0,8 7 6 7,, 7 7 7, 0, 8 9 8, 0,8 0 0 0, 0, (y r y e ) 0,3 Como se observa en la tabla, (y r y e ) 0,3, que es un valor muy pequeño. Esto nos muestra que las desviaciones de los datos se van equilibrando unas con otras. 33

REFUERZ Diagramas de dispersión. Correlación.36 Dada la siguiente distribución bidimensional: a) Dibuja la nube de puntos. 3 4 Total b) Qué porcentaje de veces aparece (, )? c) Cuál es la frecuencia absoluta del valor (3, y)? d) Cuál es la frecuencia absoluta del valor (x, )? a) 3 3 6 3 4 4 Total 3 3 b) 00 0 % c) d) 4.37 Los valores de una variable bidimensional (, ) son los que siguen. (, ); (4, ); (4, 4); (4, 3); (7, ); (7, 7); (7, 6); (, 6); (, ); (, 4); (8, 6); (9, 7) a) Dibuja el diagrama de dispersión. b) Halla el coeficiente de correlación. Interpreta el resultado. c) Indica el tipo de dependencia entre ambas variables. a) b) Consideramos la siguiente tabla: x i y i x i y i x i y i r 0,860 Las variables tienen una correlación positiva media. c) La dependencia entre ambas variables es aleatoria. 4 4 4 4 8 6 4 4 4 6 6 6 4 3 6 9 7 3 49 7 7 49 49 49 7 6 4 49 36 6 30 36 4 0 6 8 6 48 64 36 9 7 63 8 49 67 7 3 49 30.38 Asocia cada coeficiente de correlación con su gráfica correspondiente: 0,6; 0,8; 0,9; 0,7 a) b) c) d) r 0,9 r 0,6 r 0,8 r 0,7 333

Recta de regresión y estimaciones.39 La relación entre dos variables (, ) viene dada por la siguiente tabla. 3 4 4 6 6 7 4 4 6 7 6 7 7 a) Calcula el coeficiente de correlación lineal. b) Halla la recta de regresión. c) Si x 8, cuánto valdría y? d) Es buena esta predicción? Justifica la respuesta. a) x i y i x i y i x i y i 4 4 4 4 3 4 9 6 4 4 6 6 6 4 6 4 6 36 7 3 49 6 6 36 36 36 6 7 4 36 49 7 7 49 49 49 40 4 96 7 x 4 0 4 0 y 4 4, 0 s 9 6 0 4,8974 s 7 0 4,,334 s x y 4, 0 s Luego r s s 0,96 b) y 4, 4, (x 4) y 4,,389 (x 4) y 4,,389(x 4) 3, 6 c) Si x 8 y 4,,389(8 4) 9,06 d) La predicción es buena, ya que el coeficiente de correlación está muy próximo a y el valor pedido no está alejado del resto de valores de. AMPLIACIÓN.40 Se ha medido experimentalmente el área de distintos triángulos equiláteros de lados,, 3 decímetros, sucesivamente, y se han obtenido los siguientes resultados. a) Calcula el coeficiente de correlación lineal entre el cuadrado del lado y el área del triángulo. Qué tipo de correlación existe? b) Debería haber una relación funcional? A qué se debe que la relación no llegue a ser funcional? a) La correlación es positiva y fuerte. Veámoslo: s r s s x y 4, 0,84 6,6 33,3 04 s 4, 30,4 4 6 8 6 6 8,7 s s 0,8,7 3,7 4, 04,04 4, (Lado) 4 9 6 Área 0,4,6 3,7 6, 0, 3, 30,4 r 0,99 La correlación es positiva y fuerte. 8,7 3, b) Sí debería haber relación funcional, pero el coeficiente de correlación no es debido al redondeo que se hace al medir experimentalmente. 334

.4 Una variable bidimensional viene dada por la siguiente tabla. 3 a b 3 Sabiendo que s ys 3 y que a es el valor máximo de la variable, calcula a y b. Planteamos el siguiente sistema: 7 b 3a s 0 a 4 4 3 s 3 4 9 a 4 0 a 4 9 4 b (b 9) a(b 7) 6 3a 0a 4 00 a 6,4603 b 30,46 a 0,064 b 0,38 Como nos dicen que a es el valor máximo de la variable, la única solución válida es a 6,4603 y b 30,46..4 En una variable bidimensional (, ), su coeficiente de correlación lineal es 0,48 y la pendiente de su recta de regresión es,34. Sabiendo que la suma de las desviaciones típicas de e es 7,33, calcula cada una de ellas y la covarianza de la variable bidimensional. s r 0,48 s s m s,34 s s s 7,33 s s s 0,48 s,34 s s s 7,33 s s s 0,48 s s,34 s 7,33 s s 7,33,93,4 s,34 s 0,48 s (7,33 s ),34 s 3, s 0,48 s,34 s,8 s 3, s 0 s 3,,93, 8.43 Encuentra la recta de regresión de la variable (, ) sabiendo que es paralela a la recta x 4y 7 y que su centro de masas es un punto que comparte con las rectas: x 3y 9 4x y La recta de regresión es paralela a x 4y 7; por tanto, tienen la misma pendiente: m. x 3y 9 (x, y) 3x x 4x y x 3y 6 (x, y) (,9;,6) x 3y 9 La recta de regresión es: y,6 (x,9).,9 y,6 3 33

.44 Una variable bidimensional (, ) tiene de coeficiente de correlación r 0,78, y las medias de las distribuciones marginales son x ey 9. Razona cuál de las siguientes rectas se ajusta más a dicha variable. y 3x y,x 6 y,x 4 Descartamos la recta y 3x porque el punto ( x, y) no pertenece a ella. Descartamos también la recta y,x 4, pues el coeficiente de correlación es r 0,78, que es número positivo. Por tanto, la recta que más se ajusta a dicha variable es y,x 6. PARA INTERPRETAR RESLVER.4 La página del instituto Juan se ha molestado en observar los segundos que ha tardado en acceder a la página web de su instituto en diferentes momentos del día. El siguiente gráfico de dispersión muestra los tiempos empleados en nueve momentos comprendidos entre las tres y las siete de la tarde. Indica cuál de las siguientes opciones (en las que se incluyen la recta de regresión, el coeficiente de correlación y el tiempo esperado cuando se conecta a las 7.30) se corresponde con los datos. N. segundos 3 3.30 4 4.30.30 6 6.30 7 Hora A B C y 3,4x,3 y,3x 3,4 y x 3 r 0,90 r 0,9 r 0,9 x 7, y 7 x 7, y 6,6 x 7, y 6 La opción que se corresponde con los datos es la B..46 Diferentes rectas La tabla siguiente muestra el crecimiento de los beneficios obtenidos por una empresa en cada uno de los ocho trimestres de los últimos dos años. Primer año Trimestre. o. o 3. o 4. o Beneficios (%) 7 6 7 Segundo año Trimestre. o. o 3. o 4. o Beneficios (%) 6 4 3 a) Representa los datos en un diagrama de dispersión. b) Calcula y dibuja la recta de regresión considerando los ocho pares de datos. Qué crecimiento se estima para el primer trimestre del tercer año? c) Calcula y dibuja la recta de regresión considerando únicamente los datos correspondientes al segundo año. Qué crecimiento se estima para el primer trimestre del tercer año? d) Indica alguna ventaja y algún inconveniente al utilizar la segunda recta en vez de la primera para realizar la estimación solicitada. a) y b) Se numeran los trimestres de forma correlativa:,, 3 8 Considerando x como el trimestre e y como el crecimiento del beneficio, se obtiene la recta de regresión y 0,69x 8,. Así pues, para el primer trimestre del tercer año se espera un crecimiento de 0,69 9 8,,89 %. Crec. beneficios (%) Trimestre c) Si se consideran solo los datos del segundo año, se obtiene la recta y,3x,. Así, para el primer trimestre del tercer año se espera un crecimiento de,3 9, 0, %. d) Se utilizan datos más cercanos en el tiempo, pero en menor cantidad. 336

AUTEVALUACIÓN.A Sea la siguiente tabla simple de una variable bidimensional. a) Elabora una tabla de doble entrada. b) Dibuja su nube de puntos. c) Elige el coeficiente de correlación que crees que se puede ajustar más a la nube y justifica la respuesta. r 0,9 r, r 0, r 0,8 d) Calcula r y contrasta tu suposición. 4 0 3 6 9 9 7 6 4 4 3 a) b) 4 0 3 6 9 3 4 6 7 9 c) r 0,8, al tener una correlación fuerte y negativa (decreciente). s d) r s s x, y 4, 36 7 8 0 6 7 s, 4,,, 8,7 8 s 6 4 9 36 8, 8 s 6, 0,, 8,7 r 8,7 0,89 3,9, 9,7, 6, 3,9.A Relaciona en tu cuaderno cada coeficiente de correlación con el tipo de correlación. a) r b) r 0,9 c) r 0,6 d) r 0,89 e) r 0,6 III. Correlación positiva fuerte III. Independientes III. Dependencia funcional IV. Correlación negativa débil IV. Correlación negativa fuerte r r 0,9 r 0,6 r 0,89 r 0,6 Dependencia funcional Correlación positiva fuerte Independientes Correlación negativa fuerte Correlación negativa débil 337

.A3 En una encuesta realizada a personas, se les ha preguntado su edad y el número de horas de ejercicio que realizan al día. Las respuestas han sido las siguientes. (, 3); (7;,); (, ); (3, ); (40; 0,); (4, ); (0, ); (60, ); (6, 3); (6, 4); (0, ); (, ); (3;,); (;,); (47, ); (, ); (68;,); (6, 4); (4;,); (40, 30); (, ); (3;,); (4, 0); (6;,); (; 3,). Calcula la recta de regresión. Realizamos una tabla de doble entrada. 6 7 0 4 3 3 3 40 4 47 0 60 6 6 68 Total 0 0 30 0 h 4, h h 3 6, h 3 h 3, h 4 h Total 3 La recta de regresión es de la forma: y y s (x x) s x y 30 3 7 0 4 7 3 3 3 80 90 47 0 04 60 6 6 68 60 0 40 80 70 70 360 0 480 s 03 00 36,88 37,36 s 40 97 36,88 78,746 min 37,36 y (x 36,88) y,33(x 36,88) y,33x 7,0 78,746 36,88 años.a4 Se ha preguntado a los alumnos de un centro el número de horas de estudio diario,, y el número de asignaturas aprobadas al final del curso,. A la nube de puntos resultado de la encuesta se ha ajustado la recta de regresión y 3,8x 0,. a) Para aprobar 4 asignaturas, cuánto tiempo de estudio deberían emplear? b) para superar las asignaturas, es decir, todas, cuál sería la recomendación de horas de estudio? a) Si y 4 4 3,8x 0, x 4 0, hora 3,8 b) Si y 3,8x 0, x 0,,84 horas (aproximadamente h 0 min) 3,8 338

MURAL DE MATEMÁTICAS MATETIEMPS Metros y kilogramos? Un profesor ha realizado un estudio sobre la altura y el peso medios de los alumnos de una clase de 4.º de ES, obteniendo los siguientes valores: Qué varía más, la altura o el peso? Por qué? Variable Media Desviación típica Altura (m),7 0,9 Peso (kg) 6,4 4,68 La única forma de comparar las magnitudes es mediante el coeficiente de variación definido como CV x s. De este modo se eliminan las unidades, y el resultado se expresa en porcentaje de variación que compara el grado de dispersión entre las distribuciones. En nuestro caso: Altura: CV A 0, 9 00 6,86 %, 7 Peso: CV P 4, 68 00 7, % 6, 4 Luego hay más dispersión de valores en la altura que en el peso. 339