TEMA 10: ESTADÍSTICA

Documentos relacionados
ACTIVIDADES ESTADÍSTICA UNIDIMENSIONAL. a) Calcula la temperatura media y la temperatura mediana de la semana.

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

SOLUCIONES A LOS EJERCICIOS DE LA UNIDAD

INTRODUCCIÓN. Técnicas estadísticas

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Estadística Unidimensional: SOLUCIONES

Tema 1: Estadística Descriptiva Unidimensional

Medidas de centralización

I.E.S. Historiador Chabás -1- Juan Bragado Rodríguez

4º DE ESO MATEMÁTICAS-B CURSO UNIDAD 14: ESTADÍSTICA

DISTRIBUCIONES BIDIMENSIONALES

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

2 Dos tipos de parámetros estadísticos

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

Medidas de Variabilidad

1. Notación y tabulación

Tema 1: Análisis de datos unidimensionales

Tema 6. Estadística descriptiva bivariable con variables numéricas

UNIDAD 1: Tablas de frecuencias

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL

ESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

UNIDAD 12: Distribuciones bidimensionales. Correlación y regresión

ACCESO A CICLOS FORMATIVOS DE GRADO SUPERIOR FUNDAMENTOS DE MATEMÁTICAS

MEDIDAS DESCRIPTIVAS

Tema 1 Descripción de datos: Estadística descriptiva unidimensional Estadística descriptiva

SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

EJERCICIOS RESUELTOS TEMA 2

5ª Parte: Estadística y Probabilidad

INICIACIÓN A LA ESTADÍSTICA. ACTIVIDADES DE AUTOEVALUACIÓN DE LA UNIDAD ESTADÍSTICA. (SOLUCIONES)

5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS.

EJERCICIOS DE ESTADÍSTICA BIDIMENSIONAL.

EJERCICIOS: Tema 3. Los ejercicios señalados con.r se consideran de conocimientos previos necesarios para la comprensión del tema 3.

Problemas donde intervienen dos o más variables numéricas

Tema 8: Estadística en una variable (unidimensional)

Estadística. Problemas de Estadística 1º Ciclo ESO Departamento de Matemáticas Raúl González Medina

Variables Aleatorias

Organización y resumen de datos cuantitativos

Estadística Descriptiva

Cálculo y EstadísTICa. Primer Semestre.

Introducción a la Física. Medidas y Errores

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

TEMA 1.- CONCEPTOS BÁSICOS

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos:

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

Bloque 5. Probabilidad y Estadística Tema 2. Estadística descriptiva Ejercicios resueltos

b) Encuentra el criterio de formación de la siguiente sucesión recurrente:

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

3. VARIABLES ALEATORIAS.

Población y Muestra, Variables Estadísticas, Diagramas y Medidas de Centralización en 3º de ESO

ENUNCIADOS DE LOS EJERCICIOS PROPUESTOS EN 2011 EN MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. 3 y

ESTADÍSTICA DESCRIPTIVA

Transcripción:

TEMA 10: La Estadístca es la parte de las matemátcas que se ocupa de recoger, organzar y analzar grandes cantdades de datos para estudar alguna característca de un colectvo. 1. VARIABLES S UIDIMESIOALES 1.1. Conceptos báscos Llamamos: Poblacón al conjunto de todos los elementos sobre el que se realza el estudo. Indvduo a cada uno de los elementos de la poblacón o de la muestra. Varable estadístca undmensonal: es el resultado de una característca de la poblacón que deseamos estudar. S la varable estadístca undmensonal toma valores numércos se llama cuanttatva; en caso contraro se llama cualtatva. A su vez, las varables cuanttatvas se clasfcan en contnuas o dscretas. En el prmer caso la varable puede tomar cualquer valor dentro de un ntervalo, mentras que en el segundo sólo puede tomar un número fnto de valores. Ejemplos: 1. S analzamos las preferencas deportvas de los alumnos de tu clase: la poblacón es toda la clase, ndvduo es cada uno de los alumnos de la clase y la varable estadístca es cualtatva.. S estudamos el tempo medo que los alumnos del nsttuto dedcan cada día a estudar: la poblacón es todos los alumnos del nsttuto, ndvduo es cada uno de los alumnos del nsttuto y la varables estadístca es cuanttatva contnua. 3. S el ayuntamento está nteresado en averguar cuántos lbros saca al año de la bbloteca cada usuaro, la poblacón son todos los vecnos de la localdad socos de la bbloteca, ndvduo es cada uno de esos socos y la varable estadístca es cuanttatva dscreta. Al realzar un estudo estadístco no sempre es posble analzar a todos los ndvduos de la poblacón. En estos casos se toma una muestra de la poblacón sobre la que se observa la característca objeto del estudo. Para que el estudo sea fable la muestra debe ser representatva del total de la poblacón. Se llama tamaño de la muestra al número de ndvduos que la forman. 1.. Tablas de frecuencas Para ordenar los datos y proceder a su análss se utlzan las tablas de frecuencas. Una vez realzado el recuento de los resultados, construmos una tabla: en la prmera columna ponemos los datos,, (s la varable es cuanttatva se deben poner ordenados d e menor a mayor) y en la segunda el número de veces que aparece ese dato en la muestra (frecuenca absoluta, La tabla de frecuencas puede completarse con: La frecuenca relatva, f, es el cocente de la frecuenca absoluta y el número total de datos,. n ). 1/13 IBR-IES LA ÍA

La frecuenca absoluta acumulada,, es la suma de todas las frecuencas absolutas de los valores anterores. La frecuenca relatva acumulada, F, es la suma de todas las frecuencas relatvas de los valores anterores. Ejemplo1: Un equpo de baloncesto ha anotado en 0 partdos los sguentes puntos: 80, 101, 9, 80, 110, 83, 101, 75, 80, 107, 75, 85, 80, 110, 101, 9, 85, 110, 85, 80. La varable estadístca es cuanttatva dscreta. Vamos a construr la tabla de frecuencas: Valor n Total =0 1 f F Observa que: La últma frecuenca absoluta acumulada,, es 0 y debe concdr con el total de datos,. La últma frecuenca relatva acumulada, F, debe ser sempre 1. S las frecuencas relatvas se multplcan por 100 se obtenen los porcentajes. Los valores de la varable del ejemplo anteror podrían no haber presentado repetcones y ser todos, o cas todos, dferentes. En ese caso no tendría sentdo hacer una tabla con 0 valores de frecuenca absoluta 1 cada uno de ellos. Cuando la varable estadístca es contnua, o el número de datos del estudo es grande, convene organzar los datos en ntervalos, llamados clases. Los ntervalos deben ser todos de la msma ampltud, y el punto medo de cada uno es la marca de clase. La tabla de frecuencas tene una columna más con las marcas de clase. El etremo nferor del ntervalo se toma cerrado y el superor aberto, de modo que, s un dato concde con un etremo, pertenece al ntervalo posteror Ejemplo: Las calfcacones de 49 alumnos en una prueba son: 3; 5,5; 4,4; 6; 4,3; 7,; 4,7; 6,5; 6,7; 4; 5,9; 5,8; 1,4; 3,; 5,8; 4,6; 4,1; 3,5; 6,8; 5; 5,9;,1; 4,; 4,5; 4,1; 4,8;,8; 4,7; 7,7; 6; 3; 5,7; 4,5; 4,9; 3,3; 4,8; 4,7; 7,7; 6; 3; 5,7; 4,5; 4,9; 3,3; 4,8; 4,7; 5,; 3,8; 6,1. Vamos a agrupar los datos en 7 ntervalos (se suelen poner entre 5 y 10) y a construr la tabla de frecuencas. Prmero buscamos el valor mínmo: 1,4, y el valor mámo: 7,7, y calculamos su dferenca: 7,7 1,4 = 6,3, este es el recorrdo de la varable. Ahora dvdmos el recorrdo entre el nº de 6,3 ntervalos: = 0,9 1, esto nos da la longtud de cada ntervalo. 7 /13 IBR-IES LA ÍA

El etremo nferor del prmer ntervalo debe ser algo nferor al valor mínmo (1,4) y el etremo superor del últmo ntervalo debe ser algo mayor que el valor mámo (7,7). En este caso, s empezamos con el 1 y acabamos en el 8, con sete ntervalos de longtud 1 cubrremos todo el recorrdo: Intervalo Marca de clase, [1,[ [,3[ [3,4[ [4,5[ [5,6[ [6,7[ [7,8[ n Total 49 1 f F Ejerccos: 1º) Se ha realzado un estudo sobre la edad de los asstentes al teatro. Esta tabla muestra los resultados. Completa la tabla de frecuencas. Qué porcentaje de los asstentes tene entre 30 y 40 años? Qué porcentaje tene menos de 40 años? Edad º personas [0,30[ 19 [30,40[ 36 [40,50[ 41 [50,60[ 9 1.3. Gráfcos estadístcos La nformacón de las tablas de frecuencas tambén se puede representar medante gráfcos estadístcos. Dagrama de barras Ejemplo1 Polígono de frecuencas Ejemplo1 En el eje de abscsas se escrben los datos de la varable con la msma separacón (aunque sean datos numércos no equdstantes), y en el eje de ordenadas las frecuencas. Sobre cada valor se levanta un rectángulo cuya altura es gual a la frecuenca. En el eje de abscsas se escrben los datos de la varable con la msma separacón (aunque sean datos numércos no equdstantes), y en el eje de ordenadas las frecuencas. Sobre cada valor se marca un punto cuya altura es gual a la frecuenca y se unen formando una polgonal. 3/13 IBR-IES LA ÍA

Hstograma Ejemplo (para ntervalos) Dagrama de sectores Ejemplo1 En el eje de abscsas se representan los ntervalos de clase y en el eje de ordenadas las frecuencas. Sobre cada ntervalo se levanta un rectángulo de altura gual a su frecuenca. S se traza la polgonal que une los puntos medos de las bases superores de los rectángulos se puede obtener tambén el polígono de frecuencas. En el caso, poco frecuente, de que los ntervalos no tengan la msma ampltud, los rectángulos que se levantan deben tener el área proporconal a las frecuencas. Se dvde un círculo en tantos sectores como datos tenga la varable, y la ampltud de cada uno debe ser proporconal a las frecuencas que toma la varable. Se suele acompañar por el tanto por cento que representa cada sector, f 100. Se trata de repartr los 360º del círculo proporconalmente a las frecuencas: f 360. Hay otros gráfcos estadístcos como: Pctogramas: Dagrama de barras con dbujos representatvos de la varable, en lugar de rectángulos. Cartogramas: Mapas coloreados según los valores de la varable. Dagrama de barras horzontal: Dagrama de barras con la poscón de los ejes nvertda. Prámde de poblacón: Dos hstogramas horzontales que comparten los ntervalos de clase en el eje vertcal. 1.4. Parámetros de centralzacón Una vez ordenados los datos en las tablas de frecuencas, la nformacón se suelde sntetzar con unas meddas llamadas parámetros estadístcos. Los hay de dos tpos: de centralzacón y de dspersón. Los parámetros de centralzacón nos ndcan en torno a qué valor (centro) se dstrbuyen los datos, y son la meda, la moda y la medana. La meda artmétca: es el valor que se obtene al dvdr la suma de todos los datos entre el número total de éstos. En lugar de sumar los datos es más cómodo multplcar cada por su frecuenca absoluta n. n La meda se representa por:. S los datos están agrupados por ntervalos se toman como las marcas de clase. La moda, Mo, es el valor de la varable con mayor frecuenca absoluta. Puede haber varables con más de una moda. S los datos están agrupados por ntervalos se puede tomar como moda la marca de clase del ntervalo con mayor frecuenca, aunque tene más sentdo hablar del ntervalo modal. 4/13 IBR-IES LA ÍA

La medana, Me, es el valor que ocupa la poscón central, una vez ordenados todos los datos. S el nº de datos es par hay dos datos centrales y tomaremos como medana el promedo (meda) de los dos. S los datos están agrupados por ntervalos se habla de ntervalo medano, y es el prmero cuya frecuenca absoluta acumulada,, es mayor o gual que la mtad del nº de datos, /. Ejemplo3: Se pregunta a una sere de personas cuántos cafés toman º de cafés 0 1 3 al día y obtenemos los sguentes datos: º de personas 4 3 1 0 + 4 1+ 3 + 1 3 La meda es = = 1, 3 cafés. 10 La mayor frecuenca es 4, que corresponde a 1 café: Mo=1 café, es la moda. Ordenamos los datos: 0, 0, 1, 1, 1, 1,,,, 3; como =10 es par hay dos datos centrales, los que 1+ 1 ocupan el 5º y el 6º lugar, luego la medana es la meda de esos dos datos: Me = = 1. La meda ndca que, por térmno medo, el nº de cafés daros es 1,3. Es decr entre 1 y cafés (aunque más veces 1 que ). La moda señala que lo más frecuente es tomarse un café al día. La medana ndca que hay tanta gente que toma un café o más como gente que toma un café o menos. Ejerccos: º) Los sguentes datos corresponden a los precos de 5 dscos que están en oferta: 10, 8, 1, 9, 11, 11, 11, 1, 9, 10, 11, 1, 11, 10, 8, 11, 10, 10, 9, 10, 11, 11, 1, 9, 15. Calcula los parámetros de centralzacón. 3º) a) Completa los datos que faltan en la sguente tabla estadístca, donde n, y f representan, respectvamente, la frecuenca absoluta, acumulada y relatva. b) Calcula la meda, medana y moda de esta dstrbucón. 1.5. Parámetros de dspersón n f 1 4 0,08 4 3 16 0,16 4 7 0,14 5 5 8 6 38 7 7 45 8 Los parámetros de dspersón nforman sobre cuánto se alejan del centro los valores de la varable, es decr, permten conocer el grado de agrupamento de los datos en torno a las meddas de centralzacón. Los más comunes son el recorrdo, la varanza y la desvacón típca. Recorrdo: es la dferenca entre el mayor y el menor valor de la varable. En el ejemplo3 el recorrdo es 3. os da una dea de la ampltud del conjunto de datos. Varanza: es la meda de los cuadrados de las desvacones de los datos respecto de ( ) n la meda. Se representa por =. Hay otra fórmula equvalente n para calcular la varanza y de cálculo un poco más sencllo:. Desvacón típca: es la raíz cuadrada de la varanza. Se representa con σ. 5/13 IBR-IES LA ÍA

Coefcente de varacón: es el cocente entre la desvacón típca y la meda: CV =. Se puede epresar en forma de porcentaje y se utlza para comparar la dspersón de dos conjuntos de datos de la msma varable que no tenen la msma meda. S la meda es el centro de gravedad de la dstrbucón, la desvacón típca nos dce cómo de dspersos están los datos. S observamos las sguentes dstrbucones, todas tenen la msma meda, pero sus desvacones típcas son dferentes: En la prmera todos los valores están acumulados en la meda. Su desvacón típca es 0, ya que no hay dspersón. Al pasar de cada una a la sguente aumenta la dspersón, pues cada vez más ndvduos se van alejando de la meda. Ejemplo4: Queremos comparar la duracón de dos marcas de lentes desechables, A y B. Para ello observamos la duracón en horas de 10 pares de lentes de cada marca y obtenemos los resultados de la sguente tabla. Qué marca es aconsejable escoger? A 144 14 140 141 145 144 139 141 14 144 B 143 143 148 136 14 150 134 14 134 150 Organzamos los datos en tablas para calcular la meda y la desvacón típca de cada una de las dos dstrbucones. A B n n n n n n = = n La meda es: = = n = La desvacón típca es: n La meda es: = = n = La desvacón típca es: 6/13 IBR-IES LA ÍA

Las dos tenen la msma duracón meda. Es aconsejables escoger la marca A pues la DT es mucho menor: 1,89 frente a 5,74. Esto ndca que, por lo general, la duracón de estas lentllas se aleja poco de la meda. Ejemplo5: Dos grupos de 1º de bachllerato, B y C, han hecho el msmo eamen. Los parámetros obtendos son 6,5, =,08, = 8,5, =, 38. S las medas fueran guales, como en el B = B C C ejemplo anteror, estaría claro que las notas de 1ºC serían más dspersas porque C > B. Como las medas son dstntas, para comparar la dspersón, utlzamos el coefcente de varacón:,08,38 CV B = = = 0,3 y CV C = = 0, 8 6,5 8,5 Ejerccos: 4º) El nº de acertos de 100 alumnos en una prueba de 30 pregunta se representa en la sguente tabla. Calcula todos los parámetros de centralzacón y dspersón. Acertos [0,5[ [5,10[ [10,15[ [15,0[ [0,5[ [5,30[ Alumnos 3 10 5 38 16 8 1.6. Meddas de poscón Sabemos que la medana es el valor que ocupa la poscón central en un conjunto ordenado de valores (o el promedo de los valores centrales s el nº de datos es par): S generalzamos este concepto, podemos consderar los valores que dvden la dstrbucón en cuatro partes guales: los cuartles. Hay tres cuartles, Q 1, Q y Q 3, que son los valores de la varable que dvden el conjunto ordenado de datos en cuatro partes guales. En el caso de dstrbucones dscretas obtenemos prmero la medana, Q, en la forma ya eplcada. Para obtener el prmer cuartl, Q1 hacemos otra medana con los datos anterores a Q. Para el tercer cuartl, Q3 hacemos otra medana más, pero ahora con los datos posterores a Q. Ejemplo6: Estudamos el nº de horas semanales que cada uno de los 5 alumnos de un grupo ha faltado a clase: Prmero calculamos la medana, Q : como =5 es mpar hay un valor central, que ocupará la poscón nº 13 Me= Q =. De los doce valores anterores a la medana, los valores centrales serían dos, la seta y la séptma poscones, luego se haría el promedo de ambos valores, pero como ambos son 0 Q =0. 1 7/13 IBR-IES LA ÍA

El tercer cuartl estaría entre las poscones 19 y 0, por tanto hacemos el promedo de los 6 + 10 dos valores que ocupan esas poscones Q 3 = =8. Para obtener los cuartles en el caso de datos agrupados se analzan las frecuencas acumuladas. Buscamos prmero el ntervalo que contene al cuartl: el prmer valor que tene una frecuenca absoluta acumulada mayor que 4 para Q 1, el prmer valor que tene una frecuenca absoluta acumulada mayor que para Q (medana) y el prmer valor que tene una frecuenca absoluta acumulada mayor que 3 4 para Q 3. Una vez determnados los ntervalos utlzamos las sguentes fórmulas: 3 1 1 1 Q1 = L + a 4, Q = L + a y Q3 = L + a 4, donde n n n L es el etremo nferor del ntervalo I que contene al cuartl a es la ampltud de los ntervalos el nº de datos -1 es la frecuenca absoluta acumulada del ntervalo anteror a I n es la frecuenca absoluta del ntervalo I. Estas fórmulas se obtenen por nterpolacón lneal, suponendo que los datos de cada ntervalo se reparten unformemente en él, y que es al fnal de cada ntervalo cuando se alcanza la frecuenca acumulada correspondente: El recorrdo ntercuartílco es la dferenca entre el tercer y el prmer cuartl: Q3 Q1. En el recorrdo ntercuartílco fgura el 50% de los datos; por tanto, cuanto menor sea este recorrdo, más concentrados estarán. Cuando un conjunto de datos está muy dsperso, no es convenente representarlos con la meda artmétca y, por tanto, tampoco tene sentdo calcular la desvacón típca, ya que es un parámetro de dspersón que depende de la meda. En estos casos, el parámetro central que se debe hallar es la medana, y los parámetros de dspersón son el recorrdo y el recorrdo ntercuartílco. De la msma manera, podemos dvdr la dstrbucón en 100 partes guales y consderar los valores que dejan por debajo un porcentaje (k%) determnado de datos. Estos valores se llaman percentles y se representan P k. Para calcularlos se procede como en el caso de los cuartles: k buscamos el prmer ntervalo con frecuenca absoluta acumulada mayor que el k% de :, y 100 k 1 susttumos en: Pk = L + a 100 n Ejerccos: 5º) Con los datos del Ejemplo1 calcula la meda, la moda, la medana, la desvacón típca, el coefcente de varacón, los cuartles, el recorrdo, el recorrdo ntercuartílco y el percentl 3. 8/13 IBR-IES LA ÍA

6º) Halla los cuartles, el recorrdo ntercuartílco y el percentl 95 en la dstrbucón de las estaturas representadas en Estatura 148,5-153,5 153,5-158,5 158,5-163,5 163,5-168,5 168,5-173,5 173,5-178,5 n 4 11 14 5 4 7º) En la sguente tabla aparece el peso (en gr) de 100 comprmdos de un medcamento. Intervalo [4,45, 4,55) n 1 a) Construye el hstograma y el polígono de frecuencas. [4,55, 4,65) b) Calcula la meda y la desvacón típca. [4,65, 4,75) 10 c) Calcula el prmer y tercer cuartles y el percentl 15. [4,75, 4,85) 1 d) Qué porcentaje de comprmdos pesa menos de 4,87 gr? [4,85, 4,95) 33 [4,95, 5,05) 18 [5,05, 5,15) 9 [5,15, 5,5) 4 [5,5, 5,35). VARIABLES S BIDIMESIOALES S al efectuar un estudo estadístco se consderan conjuntamente dos característcas dferentes de los ndvduos de una msma poblacón, X e Y, resulta una varable estadístca bdmensonal (X,Y). Ejemplos: Estudo de la altura y el peso de un colectvo. Calfcacón de dos asgnaturas de un curso. Captal nvertdo en publcdad y ventas obtendas posterormente. úmero de leucoctos y plaquetas en la sangre de personas afectadas por una certa enfermedad..1. ORGAIZACIÓ DE DATOS Para organzar los datos de una varable estadístca bdmensonal se utlzan las tablas de doble entrada, en las cuales se agrupan los datos en flas y columnas. Construmos una tabla con tantas columnas como valores tome X y con tantas flas como valores tome Y en la dstrbucón. Hallamos la frecuenca absoluta de cada par de valores de la varable (X, Y). Para ello contamos el número de veces que se repte ese par de valores en la dstrbucón y lo anotamos en la caslla correspondente (frecuenca absoluta conjunta). Después añadmos la últma fla y la últma columna de la tabla de doble entrada que contenen, respectvamente, las frecuencas absolutas de las varables X e Y, consderadas por separado. Estas frecuencas recben el nombre de frecuencas margnales. Ejemplo7: Preguntamos a algunas personas sobre el nº de autobuses (X) que utlzan y el tempo (Y), en mnutos, que tardan en llegar a su destno. Mostramos los resultados en una tabla de doble entrada: 9/13 IBR-IES LA ÍA

16 es la frecuenca absoluta conjunta del par (,0), es decr, hay 16 personas que utlzan dos autobuses y tardan vente mnutos en llegar a su destno. S sumamos toda la columna de X= obtenemos 30, que es la frecuenca absoluta margnal de ese resultado para la varable undmensonal X. Sgnfca que hay 30 personas que cogen autobuses. S sumamos toda la fla de y=0 obtenemos 7, que es la frecuenca absoluta margnal de ese resultado para la varable undmensonal Y. Sgnfca que hay 7 personas que tardan 0 mnutos en llegar. S consderamos por separado los datos de la últma columna y de la últma fla se obtenen las dstrbucones margnales: Tambén se puede hacer una tabla de la dstrbucón bdmensonal con todos los pares de resultados y sus frecuencas absolutas: 1 1 1 1 1 3 3 3 3 3 y 10 0 30 40 50 10 0 30 40 50 10 0 30 40 50 n 1 8 14 7 4 4 16 3 5 1 3 5 4 Dstrbucón margnal de X Dstrbucón margnal de Y n y n 1 45 10 17 30 0 7 3 15 30 Σ 90 40 16 50 8 Σ 90 Ejercco: 8º) Los datos obtendos al estudar las varables X = número de goles marcados e Y = número de goles recbdos, en 40 partdos jugados \ por el equpo campeón de la lga de fútbol sala, son: (5, 4), (4, ), (6, 3), (4, 4), (3, ), (6, 4), (3, 1), (4, ), (4, ), (6, 4), (4, ), (5, 3), (3, 1), (, ), (4, 3), (3, 1), (4, ), (5, 3), (5, 3), (4, ), (3, 3), (1,1), (4, ), (5, 3), (3, ), (5, 3), (6, 4), (4, ), (5, 3), (, 1), (3, ), (6, 4), (5, 3), (4, ), (4, ), (3, 3), (3, 1), (, ), (6, 4), (5, 3) Construye la tabla de doble entrada, las dstrbucones margnales y la tabla de la dstrbucón bdmensonal con las frecuencas de todos los pares de resultados... Relacón entre varables- Dagrama de dspersón Se llama dagrama de dspersón o nube de puntos al gráfco que se obtene al representar en unos ejes de coordenadas todos los pares correspondente a los datos observados. S los puntos se ajustan completamente a una recta o a una curva cuya epresón matemátca podríamos determnar, hay una dependenca funconal entre las dos varables. S los puntos de la nube se agrupan en torno a una posble curva o recta, no muy defnda, pero reconocble, dremos que hay dependenca estadístca o correlacón entre las dos varables 10/13 IBR-IES LA ÍA

S los puntos de la nube no se agrupan en torno a nnguna curva y están completamente dspersos, dremos que las dos varables son ndependentes. osotros vamos a estudar la dependenca o correlacón lneal, es decr, s los puntos sguen apromadamente una confguracón rectlínea. Dremos que la correlacón o dependenca es postva s la recta a la que se ajustan los puntos es crecente, y que es negatva s la recta a la que se ajustan los puntos es decrecente. Dremos que la correlacón o dependenca es fuerte s la nube de puntos está muy próma a la recta (la nube es estrecha), y que es débl s la nube de puntos se ajusta menos a la recta (la nube es más ancha)..3. Covaranza y coefcente de correlacón Cada una de las varables estadístcas que forman la dstrbucón bdmensonal puede ser analzada ndependentemente, y podemos calcular su meda y su desvacón típca:,, y,. El punto (, y) es el punto medo de la dstrbucón bdmensonal, es decr, s se sujetara la nube de puntos apoyándola en él, el dagrama estaría en equlbro. Introducmos un nuevo parámetro estadístco que mde la desvacón de cada varable respecto de ( )( y y) n yn su meda, la covaranza: XY = = y. Par cuantfcar la correlacón lneal entre dos varables se calcula el coefcente de correlacón XY de Pearson: r = X Y El coefcente de correlacón ndca la apromacón de los valores de la varable a una línea recta: S r >0 la correlacón es postva; s r <0 la correlacón es negatva. Su valor está comprenddo entre -1 y 1. Cuanto más se acerque a 0 la dependenca es más débl. Cuanto más se acerque a -1 o 1 la dependenca es más fuerte. (s llega a -1 o a 1 es dependenca funconal) y 11/13 IBR-IES LA ÍA

Ejerccos: 9º) Se han observado dos varables conjuntas en 50 ndvduos. La nformacón obtenda se ha resumdo en la sguente tabla ncompleta: a) Completa la tabla. b) Obtén la covaranza. c) Calcula el coefcente de correlacón e nterprétalo. 10º) El número de horas dedcadas al estudo de una asgnatura y la Horas de estudo:x Calfcacón: Y 0 16 34 3 7 3 18 6,5 6 8,5 7 9 9,5 7,5 8 calfcacón fnal obtenda en el correspondente eamen por ocho personas venen dados en la sguente tabla. Halla la covaranza y el coefcente de correlacón entre las dos varables. Interpreta el sgnfcado del coefcente de correlacón..4. Rectas de regresón. Estmacón Llamaremos recta de regresón a la que mejor se ajuste a la nube de puntos. La regresón pretende eplcar el comportamento de una varable según los valores que toma la otra. S deseamos saber el valor de la varable Y según los valores que toma X, la regresón se llama de Y sobre X. La recta de regresón de Y sobre X debe hacer mínma la suma de las dstancas entre las ordenadas de cada punto y la recta, y su ecuacón es: y y y = ( ) S deseamos saber el valor de la varable X según los valores que toma Y, la regresón se llama de X sobre Y. La recta de regresón de X sobre Y debe hacer mínma la suma de las dstancas entre las abscsas de cada punto y la y recta, y su ecuacón es: = () y y y Las dos rectas de regresón tenen un punto en común, (, y), luego se cortan en ese punto. Además, cuanto más fuerte sea la dependenca (r más cerca de -1 o 1), menor será el ángulo que forman las rectas: Las rectas de regresón nos permten obtener de forma apromada el valor esperado de una varable, conocda la otra. El valor obtendo es una estmacón, y es más fable s r toma valores prómos a -1 o 1. Además la estmacón debe hacerse para valores dentro del ntervalo de datos o muy prómos a él. Ejerccos: 11º) El índce de mortaldad, Y, de una muestra de poblacón que consumía daramente X cgarrllos aparece en la sguente tabla, donde se estudaron sete muestras dstntas de poblacón que consumía dstnto nº de cgarrllos. Estuda la correlacón entre X e Y. 1/13 IBR-IES LA ÍA

nº cgarrllos 3 5 6 15 0 40 45 Índce mortaldad 0, 0,3 0,3 0,5 0,7 1,4 1,5 Qué mortaldad se podría predecr para un consumdor de 60 cgarrllos daros? 1º) La sguente tabla muestra los valores de las varables (X,Y), X: gastos en publcdad de un producto (mles de ), Y: ventas consegudas (mles de ) 1 3 4 5 6 y 10 17 30 8 39 47 Halla las dos rectas de regresón y calcula la estmacón de Y para =5,5, y la estmacón de X para y=15, y eplca su sgnfcado. 13º) Una persona se somete a una deta de adelgazamento. La sguente tabla muestra el peso en klogramos de esta persona, Y, según el nº de semanas, X, que lleva hacendo deta: X 1 3 4 5 6 Calcula e nterpreta el coefcente de correlacón. Y 9 88 85 83 80 77 Cuánto cabe esperar que pese esta persona después de 8 semanas de deta? Cuánto pesaría s sguese esta deta 0 semanas? Valora los resultados. 14º) La sguente tabla recoge las notas en Matemátcas, X, y las notas medas de todas las asgnaturas, Y, de 10 alumnos.. X 4 6 8 5 6 3 5 6 8 3 Y 5 7 8 6 6 4 6 7 8 4 a) S un alumno obtene un 7 en Matemátcas, qué nota meda se podría estmar? b) S un alumno tuvera un 3 de nota meda qué nota tendría en Matemátcas? c) Son fables ambas estmacones? Razona la respuesta. [ 5,4; y = 6,1; = 1,69; = 1,37; =, 6 ; y = 0,8 + 1, 78 ; = 1, y 1, 9 = y y b)1,68; r=0,98] ; a)7,38; 15º) Se ha realzado un estudo estadístco a un grupo de 100 alumnos. Con los datos recogdos se ha obtendo que la estatura meda del grupo es de 155 cm, con una desvacón típca de 15,5 cm. La recta de regresón que relacona el peso de los alumnos, X, con su estatura, Y, es y = 80 + 1,5 a) Cuál es el peso medo del grupo de alumnos? b) Cuál será el sgno de la covaranza? c) Se puede afrmar, en este grupo de alumnos, que cuanto mayor sea el peso hay mayor altura? 16º) Indca cuál es la correlacón correspondente a cada una de las nubes de puntos y eplca por qué. 1) r=0,95 ) r=-1 3) r=0 4) r=-0,63 17º) Asoca razonadamente las sguentes rectas de regresón con las nubes de puntos de las 1 fguras: 1) y=-+10 ) y=+4 3) y = + 3 13/13 IBR-IES LA ÍA