Tema 9: Estadística descriptiva

Documentos relacionados
Estadística Inferencial. Estadística Descriptiva

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

Tema 1. Estadística Unidimensional

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES

Estadística ESTADÍSTICA

Muestra Una muestra es una parte de la población que elegimos para estudiar la población.

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.

UNIDAD 8. ESTADÍSTICA

ESTADÍSTICA. A su vez, las variables pueden ser :

Tabla de frecuencias Los datos obtenidos en estadística se organizan en una tabla, llamada tabla de frecuencias.

ESTADÍSTICA. Individuo. Es cada uno de los elementos que forman la población o muestra.

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

TEMA 8: ESTADÍSTICA. 8.1 Elementos de la Estadística. 8.2 Parámetros estadísticos. 8.3 Parámetros de posición para datos aislados.

Conceptos de Estadística

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1

Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales:

ESTADÍSTICA. Rincón del Maestro:

Muestra Una muestra es una parte de la población que elegimos para estudiar la población.

RESUMEN PROGRAMACIÓN ESTADÍSTICA I. 3. Diseñar tablas estadísticas para coleccionar y ordenar datos.

ESTADÍSTICA 1.- NOCIONES GENERALES

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

ESTADÍSTICA UNIDIMENSIONAL

Estadística. Análisis de datos.

Sumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad...

Técnicas Cuantitativas para el Management y los Negocios

Estadística Descriptiva 2da parte

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Estadística

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

TEMA 1: ESTADISTICA DESCRIPTIVA

Nombre: Curso: Fecha:

10/02/2015. Ángel Serrano Sánchez de León

Estadística Descriptiva

2º ESO UNIDAD 14 ESTADÍSTICA Y PROBABILIDAD

1 POBLACIÓN Y MUESTRA

TEMA 14: ESTADÍSTICA 1. CONCEPTOS ESTADÍSTICOS

y = 2, entonces: a) x es más dispersa que y. b) son igual de dispersas. 9.- Sean dos variables estadísticas x e y con los siguientes valores x = 5, σ

M Dolores Redondas Curso

2.- Tablas de frecuencias

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

Tema 9: Estadística en dos variables (bidimensional)

Apuntes de Estadística

TEMA: 9 ESTADÍSTICA 4º ESO

Matemáticas Aplicadas I: Ev2 Recuperación febrero 2018

REPASO DE ESTADÍSTICA DESCRIPTIVA

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Curso: 2º Créditos ECTS: 6 Tipo de asignatura: Básica Tipo de formación: Teórico-Práctica

MATEMÁTICAS 1º BI-NM Serie Estadística Unidimensional y Bidimensional

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión

c) Pictograma. Un mapa geográfico o cualquier otro elemento pictográfico que representa los datos. Es muy utilizado en prensa

Distribuciones bidimensionales

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)

TEMA 11. ESTADÍSTICA

Estadística I Tema 2: Análisis de datos univariantes

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Contenidos Didácticos.

Dos variables x e y están relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda.

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i

1 de 12 15/07/ :49

TEMA 7. ESTADÍSTICA. INDIVÍDUO: Es cada uno de los elementos que forman la población o la muestra.

El ejemplo: Una encuesta de opinión

Estadística unidimensional

Tema 3: Estadística Descriptiva

Tema 1: Análisis de datos univariantes

ESTADÍSTICA. DISTRIBUCIÓN BIDIMENSIONAL

En este caso la variable X es el n de hijos, es por tanto una variable discreta. Veamos todas las frecuencias.

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1

1. Caracteres estadísticos

Apuntes y ejercicios de Estadística para 2º E.S.O

SELECCIÓN Y SECUENCIACIÓN DE CONTENIDOS PARA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. BLOQUE 1 : ARITMÉTICA Y ÁLGEBRA

TEMA: 13 y 14 ESTADÍSTICA 3º ESO

UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONÓMICAS

Prueba de Evaluación Continua Grupo A 26-XI-14

Estadística Descriptiva

2º GES T.5 - ESTADÍSTICA TEMA 5. ESTADÍSTICA

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS

Se refiere a un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas.

Estadística para el análisis de los Mercados S2_A1.1_LECV1

Diagnóstico. Dirección de Cómputo para la Docencia. UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Dirección General de Servicios de Cómputo Académico

Estadística Descriptiva o deductiva Inferencial o inductiva Población: Variable: Variable cualitativa: Variable cuantitativa: Variable discreta

Tema 12. Estadística

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

CLASIFICACIÓN DE LA ESTADÍSTICA

3 Número de goles marcados por tu equipo favorito en la última temporada.

Tema 2: Análisis de datos bivariantes

Apuntes y ejercicios de Estadística para 2º E.S.O

Julio Deride Silva. 18 de agosto de 2010

La asignatura de Matemática estimula el desarrollo de diversas habilidades:

Algunos apuntes de Estadística de 4º (nivel avanzado)

DISTRIBUCIONES BIDIMENSIONALES

Libro de ejercicios de refuerzo de matemáticas. María de la Rosa Sánchez

Tema 5 La información que recibimos 1.- Conceptos

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

Tema 2 Estadística descriptiva Conceptos y objetivos de la estadística descriptiva

3 ANALISIS DESCRIPTIVO DE LOS DATOS

Estadística I. Finanzas y contabilidad

Transcripción:

Tema 9: Estadística descriptiva Matemáticas específicas para maestros Grado en Educación Primaria Matemáticas específicas para maestros Tema 9: Estadística descriptiva Grado en Educación Primaria 1 / 47

ÍNDICE 1 Introducción 2 Conceptos generales 3 Estadística descriptiva unidimensional Representación de datos: tablas de frecuencias y gráficos Parámetros estadísticos (medidas numéricas) 4 Estadística descriptiva bidimensional Matemáticas específicas para maestros Tema 9: Estadística descriptiva Grado en Educación Primaria 2 / 47

ÍNDICE 1 Introducción 2 Conceptos generales 3 Estadística descriptiva unidimensional Representación de datos: tablas de frecuencias y gráficos Parámetros estadísticos (medidas numéricas) 4 Estadística descriptiva bidimensional

4 / 47 Introducción Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Tipos: Estadística descriptiva: Recogida y análisis de datos para realizar una descripción de las características de un colectivo, deduciendo conclusiones sobre su estructura y sobre las relaciones existentes con otros colectivos. Inferencia estadística: Realización de inferencias acerca de las características de una población a partir del estudio de una muestra (necesita probabilidad). RAE: inferir es deducir algo o sacarlo como conclusión de otra cosa.

ÍNDICE 1 Introducción 2 Conceptos generales 3 Estadística descriptiva unidimensional Representación de datos: tablas de frecuencias y gráficos Parámetros estadísticos (medidas numéricas) 4 Estadística descriptiva bidimensional

6 / 47 Conceptos generales Población: conjunto total de individuos que se quiere analizar. A veces demasiado grande o inaccesible. Muestra: subconjunto de la población que representa al total de individuos. Hay técnicas de muestreo para elegir una buena muestra, es decir, la más representativa posible. Variable o carácter estadístico: característica o propiedad de un individuo que se quiere estudiar. Tipos de variables: Cualitativas: cualidades no numéricas. Ejemplos: sexo, nacionalidad, calificación no numérica, etc. Cuantitativas: valores numéricos. Cuantitativas discretas: número finito de valores. Ejemplos: número de asistentes, asignaturas aprobadas. Cuantitativas continuas: valores reales dentro de un intervalo. Ejemplos: temperatura, peso, tiempo.

ÍNDICE 1 Introducción 2 Conceptos generales 3 Estadística descriptiva unidimensional Representación de datos: tablas de frecuencias y gráficos Parámetros estadísticos (medidas numéricas) 4 Estadística descriptiva bidimensional

Representación de datos: tablas de frecuencias y gráficos La forma en que representamos los datos puede ayudarnos a extraer información de ellos y, por tanto, sacarles utilidad. Ejemplo Mala representación de datos. Tenemos las siguientes observaciones sobre el tipo de árboles/arbustos en un parque: Abeto, Durillo, Abeto, Brezo, Ciprés, Brezo, Brezo, Abeto, Brezo, Durillo, Durillo, Brezo, Brezo, Ciprés, Brezo, Abeto, Brezo, Brezo, Durillo, Brezo. Cuántas observaciones hay? Cuántas clases diferentes? Repeticiones de cada clase? 8 / 47

Tablas de frecuencias 9 / 47 Se pueden utilizar para cualquier tipo de variable. Con las n = 20 observaciones del ejemplo se construye una tabla: x i f i h i = f i n F i = i j=1 f j H i = F i n A 4 4/20 = 0.2 4 0.2 B 10 10/20 = 0.5 14 0.7 C 2 2/20 = 0.1 16 0.8 D 4 4/20 = 0.2 20=n 1 Total n = 4 i=1 f i = 20 4 i=1 h i = 1 - - x i : datos distintos observados (marcas de clase si los datos están agrupados) f i : frecuencia absoluta h i : frecuencia relativa F i : frecuencia absoluta acumulada H i : frecuencia relativa acumulada

Representaciones gráficas 10 / 47 Diagrama de barras (datos NO agrupados en intervalos) Diagrama de sectores (datos NO agrupados en intervalos) Histograma (datos agrupados en intervalos) Polígono de frecuencias (datos agrupados o no)

Representaciones gráficas 11 / 47 Diagrama de barras: la altura de cada barra representa la frecuencia absoluta (o relativa) de cada una de las diferentes observaciones consideradas. Se usa con variables cualitativas y cuantitativas discretas (datos NO agrupados en intervalos). ( Barras separadas!) En el ejemplo anterior:

Representaciones gráficas 12 / 47 Diagrama de sectores: cada sector del círculo representa la frecuencia relativa. Se usa con variables cualitativas y cuantitativas discretas (datos NO agrupados en intervalos). En el ejemplo anterior:

Representaciones gráficas 13 / 47 Histograma: el área de cada rectángulo es proporcional a la frecuencia absoluta (o relativa) de cada una de las clases consideradas. Se usa con variables cuantitativas continuas (datos agrupados en intervalos). ( Barras juntas!)

Representaciones gráficas 14 / 47 Polígono de frecuencias: Si la variable es discreta, el polígono de frecuencias se obtiene uniendo los extremos superiores de las barras en el diagrama de barras.

Representaciones gráficas 15 / 47 Polígono de frecuencias: Si la variable es continua y está agrupada en intervalos, el polígono de frecuencias se obtiene uniendo los puntos medios de las bases superiores de cada rectángulo en el histograma.

16 / 47 Parámetros estadísticos Valores numéricos calculados a partir de los valores de la muestra. Proporcionan herramientas útiles para extraer información de la muestra. Varios tipos: Parámetros de centralización y posición: información del valor en torno al cual se agrupan los datos de la muestra, y valores que ocupan cierta posición. Parámetros de dispersión: información sobre la concentración o dispersión de los datos con respecto a los valores centrales.

Parámetros de centralización y posición 17 / 47 Media aritmética Moda Mediana Percentiles y cuartiles

Parámetros de centralización y posición 18 / 47 Media aritmética Datos sin agrupar o marcas de clase de intervalos: x 1,..., x n x = 1 n x i. n i=1 Si algunos de los n datos aparecen repetidos, se podrían escribir como x 1,..., x m con frecuencias absolutas f 1,..., f m y relativas h 1,..., h m y entonces x = 1 m m x i f i = x i h i. n i=1 i=1 Propiedades de la media: c + x = c + x, c constante. cx = cx, c constante. x + y = nx x+ny y n x +n y

Parámetros de centralización y posición 19 / 47 Moda Es el valor o valores que más se repite en la muestra, es decir, en el que se alcanza el máximo de las frecuencias relativas. Si los datos están agrupados, se llama clase modal. No tiene que ser única. Mediana Primer valor x i (o intervalo) con frecuencia relativa acumulada mayor o igual que 0.5. En un conjunto de datos ordenado de manera creciente, la mediana es el valor mínimo que divide la muestra en dos conjuntos con el mismo número de datos.

20 / 47 Parámetros de centralización y posición Percentiles y cuartiles Percentil P r, primer valor tal que su frecuencia relativa acumulada es mayor o igual que el r/100. Extendiendo la idea de mediana, el percentil P 10 es el valor en el cual hemos recorrido el 10 % de los datos de la muestra. Casos importantes: Primer cuartil, P 25 = Q 1. Segundo cuartil, P 50 = Q 2, es la mediana! Tercer cuartil, P 75 = Q 3.

Parámetros de dispersión 21 / 47 Rango o recorrido Diferencia entre el valor más grande x max y el valor más pequeño x min en un conjunto ordenado de datos. R = x max x min. Recorrido intercuartílico Indica dónde se encuentra el 50 % de los datos centrales. Se calcula como la diferencia entre el tercer cuartil y el primer cuartil. RI = Q 3 Q 1.

Parámetros de dispersión Varianza es la media aritmética de las diferencias (al cuadrado) entre las observaciones y la media: sx 2 = 1 n (x i x) 2 n También se puede expresar en función de las frecuencias relativas y absolutas. sx 2 = 1 m m f j (x j x) 2 = h j (x j x) 2 n j=1 Y con esta fórmula equivalente: i=1 s 2 X = (x 2 ) (x) 2 = 1 n j=1 n i=1 x 2 i x 2. Desviación típica es la raíz cuadrada (positiva) de la varianza. s X = + sx 2. 22 / 47

Análisis descriptivo de una variable estadística 23 / 47 Tipo de Tablas Gráficos Medidas numéricas variable Cualitativa Frecuencias absolutas y relativas/porcentajes (no acumuladas) Diagrama de sectores o barras Moda Cuantitativa discreta Frecuencias de valores aislados Diagrama de barras o sectores Todas las medidas características Cuantitativa continua Frecuencias de valores agrupados Histograma Todas las medidas características

ÍNDICE 1 Introducción 2 Conceptos generales 3 Estadística descriptiva unidimensional Representación de datos: tablas de frecuencias y gráficos Parámetros estadísticos (medidas numéricas) 4 Estadística descriptiva bidimensional

25 / 47 Estadística descriptiva bidimensional Hasta ahora hemos considerado una única variable. A continuación vamos a estudiar la relación entre dos variables de una misma muestra, es decir, dos características de cada uno de los individuos de la muestra. Se puede describir esta relación mediante una tabla de doble entrada o mediante un gráfico. Ejemplos: 1 Edad y peso de una persona. 2 Edad y nivel de inglés (bajo-medio-alto). 3 Color de ojos y pelo. Las dos variables X e Y pueden ser: Las dos cuantitativas: ejemplo 1. Una cuantitativa y la otra cualitativa: ejemplo 2. Las dos cualitativas: ejemplo 3.

Tablas de doble entrada 26 / 47 Ejemplo X : color de ojos Y : color de pelo Posibles preguntas: Y Claro Oscuro X Claro 7 2 Oscuro 1 10 Cuántas personas tienen ojos de color claro? Cuántas personas tienen ojos de color oscuro? Cuántas personas tienen pelo de color claro? Cuántas personas tienen pelo de color oscuro?

Tablas de doble entrada 27 / 47 Ejemplo X : calificación en la asignatura de Matemáticas Y : calificación en la asignatura de Didáctica de las Matemáticas X 5 3 5 5 5 6 3 9 9 Y 6 1 8 8 8 7 1 10 10 Construimos la tabla de doble entrada (de frecuencias absolutas): X 3 5 6 9 Y 1 2 0 0 0 6 0 1 0 0 7 0 0 1 0 8 0 3 0 0 10 0 0 0 2

Diagramas de dispersión o nube de puntos 28 / 47 Dadas dos variables cuantitativas X, Y, la forma más intuitiva de ver si están relacionadas es representarlas mediante un diagrama de dispersión, también llamado nube de puntos.

Diagramas de dispersión o nube de puntos 29 / 47 Dadas dos variables cuantitativas X, Y, la forma más intuitiva de ver si están relacionadas es representarlas mediante un diagrama de dispersión, también llamado nube de puntos.

Correlación lineal Nos centraremos en estudiar si hay dependencia lineal entre X, Y. Para ello, definiremos la Covarianza muestral: s XY = 1 n (x i x)(y i ȳ), n i=1 que también puede calcularse como s XY = (xy) x y = 1 n n x i y i xȳ. Sabemos que > 0, relación lineal directa s XY < 0, relación lineal inversa = 0, no hay relación lineal (posible otro tipo de relación) Pregunta: Si existe relación lineal (s XY 0), cómo de fuerte es la relación? La covarianza depende de la escala de los datos, luego necesitamos calcular el Coeficiente de correlación de Pearson. i=1 30 / 47

Correlación lineal 31 / 47 Correlación muestral o coeficiente de correlación de Pearson r XY r XY = s XY [ 1, 1], s X : desviación típica. s X s Y > 0, relación lineal directa < 0, relación lineal inversa ±1 0, relación fuerte, no relación lineal (posible otro tipo de relación)

Algunos ejemplos 32 / 47 Relación lineal directa: Relación lineal inversa: s XY > 0, r XY 1. s XY < 0, r XY 1.

Algunos ejemplos 33 / 47 Relación no lineal: Sin Relación: s XY = 0, r XY = 0. s XY 0, r XY 0. ( Pero sí otro tipo de relación!)

Regresión lineal 34 / 47 Si r XY 1, es decir X e Y tienen una fuerte relación lineal, podemos preguntarnos cuál es la recta que mejor se ajusta a los datos. Esta recta, llamada de regresión lineal, es muy útil para hacer predicciones. Pero... cómo la calculamos?

35 / 47 Recta de regresión lineal Recta de regresión de Y sobre X: Conocido un valor x i, queremos estimar y i. Buscamos una recta y = a + bx que minimice las distancias (errores) entre los puntos de la muestra (x i, y i ) y la predicción de la recta, obteniendo: y ȳ = s XY s 2 X (x x).

36 / 47 Recta de regresión lineal Recta de regresión de Y sobre X: (conocido x i, queremos estimar y i ) y ȳ = s XY s 2 X (x x). Recta de regresión de X sobre Y : (conocido y i, queremos estimar x i ) Importante: x x = s XY s 2 Y (y ȳ). LAS DOS RECTAS NO SON IGUALES EN GENERAL! Las rectas de regresión pasan por el punto ( x, ȳ). El producto de sus pendientes es r 2 XY.

37 / 47 Problema 6 del Boletín (Regresión lineal simple) Observando las edades y los pesos de 5 niños se obtuvieron los siguientes resultados: Edad (en años) 2 4.5 6 7.2 8 Peso (en kg) 15 19 25 33 34 a) Halla las medias y las desviaciones típicas de cada una de las variables. b) Calcula el coeficiente de correlación lineal y la recta de regresión del peso sobre la edad. c) Qué indica el coeficiente de correlación lineal?

a) Medias y desviaciones típicas 38 / 47 Edad (en años) 2 4.5 6 7.2 8 Peso (en kg) 15 19 25 33 34 Llamemos X a la edad e Y al peso. Sus medias serán: x = 1 27.7 (2 + 4.5 + 6 + 7.2 + 8) = = 5.54 años 5 5 ȳ = 1 126 (15 + 19 + 25 + 33 + 34) = = 25.2 kg 5 5 Sus varianzas y desviaciones típicas: s 2 x = 1 5 (22 + 4.5 2 + 6 2 + 7.2 2 + 8 2 ) 5.54 2 = 4.5264 s x = 4.5264= 2.13 años s 2 y = 1 5 (152 + 19 2 + 25 2 + 33 2 + 34 2 ) 25.2 2 = 56.16 s y = 56.16= 7.49 kg

b) Coeficiente de correlación lineal 39 / 47 Covarianza: Edad (en años) 2 4.5 6 7.2 8 Peso (en kg) 15 19 25 33 34 s XY = 1 5 5 (x i x)(y i ȳ) = 1 5 i=1 5 x i y i xȳ i=1 = 1 (2 15 + 4.5 19 + 6 25 + 7.2 33 + 8 34) 5.54 25.2 5 = 775.1 5 5.54 25.2 = 15.412 Luego el coeficiente de correlación lineal es: r XY = s XY s X s Y = 15.412 2.13 7.49 = 0.94.

b) Recta de regresión del peso sobre la edad 40 / 47 Recta de regresión de Y (peso) sobre X (edad) y ȳ = s XY s 2 X (x x). En este caso: y 25.2 = 15.412 (x 5.54). 4.5264 y 25.2 = 3.4(x 5.54).

c) Significado del coeficiente de correlación 41 / 47 Como r xy = 0.97 es un valor positivo, existe una relación lineal directa o positiva. Por ser próximo a 1 sabemos que esta relación es muy fuerte.

Ejercicio extra de Regresión lineal simple 42 / 47 En un depósito cilíndrico, la altura del agua que contiene varía conforme pasa el tiempo, según la siguiente tabla. X (tiempo en horas) 8 22 27 33 50 Y (altura en metros) 17 14 12 11 6 1 Realiza un gráfico que represente la altura en función del tiempo. Qué conclusiones se pueden extraer de este gráfico? 2 Halla e interpreta la covarianza. 3 Halla e interpreta el coeficiente de correlación lineal entre el tiempo y la altura. 4 Cuál será la altura del agua cuando hayan transcurrido 60 horas? 5 Cuando la altura del agua es de 2 metros, suena una alarma. Qué tiempo ha de transcurrir para que avise la alarma?

Solución de 1: Diagrama de dispersión. En el gráfico de dispersión se muestra que a medida que aumenta el tiempo (variable X), la altura del agua (variable Y) disminuye, es decir, hay una relación inversa entre las dos variables, lo que se traduce en una covarianza y un coeficiente de correlación negativo. Además, como los puntos forman aproximadamente una recta deducimos que el coeficiente de correlación debe ser próximo a 1. 43 / 47 X 8 22 27 33 50 Y 17 14 12 11 6

Solución de 2: Covarianza 44 / 47 Calculamos 1 5 5 i=1 Luego s XY = 1 5 5 (x i x)(y i ȳ) = 1 5 i=1 5 x i y i xȳ x i y i = 1 (8 17 + 22 14 + 27 12 + 33 11 + 50 6) = 286.2, 5 x = 1 (8 + 22 + 27 + 33 + 50) = 28, 5 ȳ = 1 (17 + 14 + 12 + 11 + 6) = 12. 5 i=1 s XY = 286.2 28 12 = 49.8. La covarianza negativa implica que existe una relación lineal inversa entre el tiempo y la altura del agua en el depósito.

Solución de 3: Coeficiente de correlación lineal 45 / 47 Calculamos primero las desviaciones típicas: s 2 x = 1 5 s 2 y = 1 5 5 (x i x) 2 = 1 5 i=1 5 (y i ȳ) 2 = 1 5 i=1 5 i=1 5 i=1 x 2 i x 2 = 189.2 s x = 13.755, y 2 i ȳ 2 = 13.2 s y = 3.6332. Luego el coeficiente de correlación lineal es: r XY = s XY s X s Y = 49.5 13.755 3.6332 = 0.9965. Por ser un valor negativo existe una relación lineal inversa y por ser próximo a 1 sabemos que esta relación es muy fuerte.

Solución de 4: altura del agua cuando hayan transcurrido 60 horas 46 / 47 Recta de regresión de Y (Altura) sobre X (Tiempo) y ȳ = s XY s 2 X (x x). Por tanto, la altura estimada cuando hayan transcurrido 60 horas es: y 12 = 49.8 (60 28) 189.2 y = 12 49.8 (60 28) = 3.58 metros. 189.2

Solución de 5: tiempo transcurrido para que la altura del agua sea 2 metros 47 / 47 Recta de regresión de X (tiempo) sobre Y (altura). x x = s XY s 2 Y (y ȳ). En este caso, el tiempo transcurrido cuando suene la alarma es x 28 = 49.8 (2 12) 13.2 x = 28 49.8 (2 12) = 65.73 horas. 13.2