FCEN-UBA. 3. MEDIDAS RESUMEN: Numéricas y Gráficas. 3.1 Introducción

Tamaño: px
Comenzar la demostración a partir de la página:

Download "FCEN-UBA. 3. MEDIDAS RESUMEN: Numéricas y Gráficas. 3.1 Introducción"

Transcripción

1 18 3. MEDIDAS RESUMEN: Numéricas y Gráficas. 3.1 Introducción Ejemplo. Admítelo una salchicha no es una zanahoria. Así decía la revista El Consumidor en un comentario sobre la baja calidad nutricional de las salchichas. Hay tres tipos de salchichas: i. carne vacuna, ii. mezcla (carne porcina, vacuna y de pollo) iii. pollo. Existe alguna diferencia sistemática entre estos tres tipos de salchichas, en estas dos variables? Calorías y sodio en salchichas por tipo Vacuno Mezcla Pollo Calorías Sodio Calorías Sodio Calorías Sodio Nos interesa resumir las características más importantes del conjunto de datos en una pequeña cantidad de números que sean fácilmente interpretables. La distribución de la cantidad de sodio en las salchichas de pollo muestra dos grupos distintivos. Este tipo de distribuciones no estará bien representada por las medidas resumen.

2 19 Los resúmenes pueden ser muy útiles pero no son los detalles. Generalmente los detalles agregan poco, pero es importante estar preparados para las ocasiones en que sí agregan mucho. 3.2 Centro y dispersión. Los conjuntos de datos provenientes de una población homogénea poseen, en general, dos propiedades importantes: un valor central y la dispersión alrededor de ese valor. Vemos esta idea en los siguientes histogramas hipotéticos:

3 20 Veremos medidas de la posición del centro, la dispersión y otras medidas de posición. 3.3 Media y varianza muestrales Las medidas resumen clásicas utilizan solamente operaciones aritméticas simples (+, *, raíz cuadrada) para resumir un conjunto de datos de n observaciones, x 1, x 2,..., x n. La media muestral x, como medida de la posición del centro de los datos, x x + n + x n = 1, la varianza muestral, s 2 = 1 n 1 n i= 1 ( x i x) 2 ó el desvió estándar s =DS = 1 n 1 n i= 1 ( x x) i 2 como medida de variabilidad o dispersión. El desvío estándar es la medida clásica de variabilidad. Observación: el desvío estándar (DS) tiene las mismas unidades que las observaciones. Desviación respecto de la media x i x desviación i-ésima respecto de la media. Los datos menores que la media tienen un desvío negativo. Los datos mayores que la media tienen un desvío positivo.

4 21 Si todas las diferencias son pequeñas en valor absoluto: las observaciones x i están cerca de x los datos presentan poca variabilidad, algún x x i es grande en valor absoluto se tiene mayor variabilidad. 0. Es fácil ver que ( xi x) = La varianza muestral mide la desviación cuadrática de los datos respecto de su media 2 Es más fácil realizar cálculos con desvíos cuadráticos, (xi x), que con desvíos absolutos, xi x. 3.3 Media y varianza poblacionales, para poblaciones finitas Si datos son poblacionales tendremos: como medida de posición, la media poblacional μ que se calcula como N x i μ = = 1 N como medida de dispersión, la varianza poblacional σ 2 σ N = ( x μ N i ) i= 1 ó la raíz cuadrada de σ 2, σ, que llamaremos desvío estándar.. Población ocupada, República Argentina, Octubre de Síntesis 3, INDEC, 1995 Aglomerado Urbano Pobl. Ocup. Aglomerado Urbano Pobl. Ocup. Gran Buenos Aires Gran Tucumán y Tafí Viejo Gran Córdoba Neuquén Gran Mendoza Paraná Gran Rosario Santa Rosa - Toay La cantidad media de ocupados por aglomerado urbano (n=8) es y su desvío estándar es Si excluimos Gran Buenos Aires (n=7) tendremos media = y desvío estándar = Una sola observación ha modificado fuertemente los resultados. Las medidas resumen deberían ser resistentes (varíen poco en presencia de un cambio arbitrario de una pequeña parte del lote). i

5 22 Un único dato aberrante puede producir un importante efecto adverso tanto en la media muestral como la varianza muestral 3.4 Medidas resistentes a datos extremos o aberrantes. Las medidas resistentes utilizan los datos ordenados. Ordenamos los datos, x 1, x 2,..., x n, en orden ascendente y obtenemos la muestra ordenada: x (1) x (2)... x (n) ; Podemos contar desde el más pequeño hacia el más grande, rango ascendente, ó desde el más grande hacia el más pequeño, rango descendente. Definición: La profundidad de un dato en la muestra es el menor de los rangos ascendente y descendente Mediana Definición: La mediana, M es el valor que deja la misma cantidad de los datos ordenados de cada lado. La mediana es una medida resistente de posición del centro de los datos. La profundidad de la mediana es p M = n La mediana se calcula como el valor central si n es impar y promedio de los dos valores centrales si n es par Ejemplo (continuación): La mediana es el dato con profundidad = 30. M = PROF. # hojas TALLO HOJAS : : : : : : : : : : : : : : : 147 La media, , es cercana a la mediana. Este hecho es coherente con la simetría que presentan los datos alrededor de la mediana. Una profundidad identifica dos valores de los datos, uno por debajo y otro por encima de la mediana.

6 : : 02 Comparación de media y mediana para distintos tipos de distribuciones mediante histogramas suavizados. Asimétrica a izquierda Simétrica Asimétrica a derecha Media podada Ordene los datos, descarte las 100α% de las observaciones menores y el 100α% de las observaciones mayores; calcule el promedio de los datos restantes. Se recomienda tomar α entre 0.1 y 0.2: x α = x [ n α ] + 1 n + + x 2[ n α ] n [ n α ], Otras medidas de posición A la mediana y los extremos les agregamos otro par de valores resumen, los cuartiles, que dejan un cuarto y tres cuartos de las observaciones a cada lado. profundidad del cuartil = En el ejemplo, la profundidad del cuartil es = 15 4 Por lo tanto: Cuartil inferior=63.36 Cuartil superior= Otras medidas de dispersión de los datos. distancia intercuartil (d Q ), o rango intercuartil, d Q = Cuartil superior - Cuartil inferior n + 1 4

7 24 rango, la diferencia entre los valores extremos, también refleja la dispersión pero valores sueltos afectan tanto el rango que su resistencia es despreciable. MAD: Desvio absoluto respecto de la Mediana: Es una versión resistente del desvío estándar basada en la mediana. Cómo calculamos la MAD? MAD = mediana i Ordenamos los datos de menor a mayor. Calculamos la mediana, valor en la posición (n+1)/2. ( x M ) Calculamos los desvíos absolutos de cada dato respecto de la mediana (la distancia de cada dato a la mediana, sin signo). Ordenamos los desvíos absolutos de menor a mayor. Calculamos la mediana de los desvíos. Observación: Si deseamos comparar la distancia intercuartil y la MAD con el desvío estándar es conveniente dividirlas por constantes adecuadas. En ese caso se compara el DS con d Q MAD Ejemplo: continuamos con los puntos de fusión de ceras naturales DESCRIPTIVE STATISTICS CERA MEAN SD MINIMUM ST QUARTI RD QUARTI MAXIMUM MAD d Q = Cuartil superior - Cuartil inferior = = 0.48 MAD = 0.23 / =

8 25 d Q 1.35 = 0.48 / 1.35 = SD = Las correcciones han acercado las estimaciones de la variabilidad de la MAD y la distancia intercuartil al valor obtenido para el desvío estándar. Veremos más adelante qué características deben presentar los datos para que las tres medidas de dispersión sean similares, como ocurre en el ejemplo Más medidas de posición: Percentiles La mediana de un conjunto de datos ordenados es el valor que los divide en dos partes iguales, tiene profundidad (n+1)*0.5. Es el percentil del 50% (100*0.5%). El cuartil inferior, que deja a su izquierda al 25% de los datos y se encuentra en la posición (n+1)*0.25, es el percentil del 25% (100*0.25%). El cuartil superior, tiene la posición (n+1)*0.75. Así, el valor que deja un 95% de los datos por debajo y un 5% por encima es el percentil del 95%. Gráfico de un percentil en un histograma suavizado. El percentil del 100*α%, P α, de un conjunto de datos ordenados, es el valor que deja un 100*α% de los datos por debajo y un 100*(1-α)% por encima se encuentra en la posición (n+1)* α. Cuando este valor no es entero se interpola. Percentiles de la altura (cm) de mujeres y varones de 18 años (Crecimiento y Desarrollo. Sociedad Arg. de Pediatría. 1986) Percentil 3% 10% 25% 50% 75% 90% 97% Varón Mujer

9 26 En distribuciones perfectamente simétricas los percentiles del 100*α% y del 100*(1-α)% equidistan de la mediana. La distribución de las alturas de mujeres y varones es aproximadamente simétrica, pero la de los pesos no lo es.

10 27 4. Box Plots o Gráficos Caja El boxplot es la representación gráfica de la mediana, los cuartiles, y el máximo y mínimo siempre que no haya valores atípicos (outliers). En este caso el máximo y el mínimo se reemplazan por los valores adyacentes superior e inferior respectivamente y los valores atípicos se grafican por separado. Se trata de los valores externos que pueden clasificarse como moderados o severos. Permite extraer los siguientes aspectos del lote: Posición del centro - Dispersión - Asimetría - Longitud de la cola Puntos que yacen fuera del conjunto. 4.1 Identificación de valores atípicos. Utilizamos una medida de dispersión que sea insensible a los valores atípicos, la distancia intercuartil y definimos puntos de corte para detectar outliers: Valla Interna Inferior = QI -1.5 d Valla Interna Superior = QS +1.5 d Valla Externa Inferior = QI - 3 dq Valla Externa Superior = Q + 3 d S Q Q Q VALOR ADYACENTE valor más cercano, mayor o igual, INFERIOR (VAI) =. a la valla interna inferior VALOR ADYACENTE valor más cercano, menor o igual, SUPERIOR (VAS) = a la valla interna superior.

11 28 Si no hay valores atípicos: VAI = mínimo VAI = máximo 4.2 Construcción del Box Plot Construiremos un boxplot para las 15 concentraciones siguientes: de CO2 (miligramos/m 2 *minuto ) medidas en diferentes puntos de un depósito de residuos patológicos El boxplot se construye dibujando: i) una caja cuyos extremos son los cuartiles (Q I =14.17) y (Q S =206.43) y con una barra vertical en la mediana (M= 41.28), ii) una línea de cada extremo de la caja hasta el corresp. valor adyacente (VAI = VAS = ), iii) los valores que caen fuera de las vallas internas pero dentro de las externas son outliers moderados, iv) los valores que caen fuera de las vallas externas son outliers severos. OJO! no confundir la valla con el valor adyacente! Cálculos parciales La mediana (M= 41.28) se encuentra en la posición (15+1)/2 = 8 El cuartil inferior (Q I =14.17) en la posición (15+1)/ 4 = 4 El cuartil superior (Q S =206.43) en la posición (15+1)*3/4 = 12 distrancia intercuartil (d Q ) = Q S - Q I = = * d Q = 1.5 * = * d Q = 3 * = Q I - 1.5* d Q = Q I - 3* d Q = Q S + 1.5* d Q = Q S + 3* d Q =

12 29 Resistencia del Boxplot Un gráfico similar podría construirse en base a la media y el desvío muestrales. Tal gráfico carecería de resistencia. Porqué es esto importante? 4.3 Comparación de lotes Boxplots del contenido calórico de tres tipos de salchichas

13 30 Diagramas-tallo hoja de los datos de calorías en diferentes clases de salchichas. Vacuno Mezcla Pollo Tallo Hojas Tallo Hojas Tallo Hojas De los Box-Plots: Las salchichas de pollo, como grupo, contienen menos calorías que las de carne o las de mezcla: la mediana del contenido calórico de las de pollo está por debajo del cuartil inferior de las otras distribuciones. Todos los tipos muestran una gran dispersión entre marcas; las salchichas de pollo no garantizan una comida de bajas calorías. De los diagramas Tallo-Hoja: Para los datos de mezcla vemos que se distinguen claramente dos grupos de marcas, la distribución tiene dos picos y un outlier en la cola inferior. Los cuartiles, Ci= y Cs=179.75, están aproximadamente en el centro de cada uno de los grupos, de manera que gran parte de la distancia intercuartil (d c ) está dada por la distancia entre los grupos. Por esta razón el 1.5* d c que se utiliza para graficar el box-plot no distinguió al outlier. Aunque en el diagrama correspondiente a las salchichas de pollo no se observan dos grupos separados, como en vacuno y mezcla, pueden verse claramente dos picos. Retomemos el ejemplo de la cantidad de sodio en las salchichas de pollo, cuyo diagrama tallo hoja tenemos a continuación Esta distribución bimodal también sugiere la presencia de dos grupos en los datos.

14 31 Los valores ordenados de la cantidad de sodio en salchichas de pollo son: La media (449,66) se encuentra en una zona donde no hay datos y la mediana (426) cerca del borde de uno de los dos grupos. El intervalo ( x s, x + s ) no es una buena representación de los datos y el gráfico caja tampoco. Ni la media ni la mediana ni el boxplot dan una buena información sobre este tipo de datos porque no está presente en ellos un centro claro. 4.4 Ejemplos con Valores atípicos Ejemplo 1: En 1985 los científicos británicos anunciaron un agujero en la capa de ozono de la atmósfera terrestre sobre el polo sur. El reporte de los británicos fue descartado al comienzo pues estaba basado en instrumentos terrestres enfocados hacia arriba. Observaciones más completas, obtenidas por instrumentos satelitales mirando hacia abajo, no habían mostrado nada inusual. Luego, un análisis más exhaustivo de las mediciones satelitales, reveló que las lecturas de

15 32 ozono en el polo sur eran tan bajas que el programa de computadora que las analizaba las había suprimido automáticamente como outliers en forma equivocada. Se reanalizaron las lecturas desde Éstas mostraron un agujero de tamaño creciente en la capa de ozono que no tenía explicación. Ejemplo 2: Mediciones obtenidas por Newcomb entre Julio y Septiembre de qué variable ha sido medida? Newcomb midió cuánto tardó la luz en llegar, desde su laboratorio sobre el río Potomac a la base del monumento a Washington y volver, una distancia total de 7400 metros. es necesario tener la descripción del instrumento juzgar si la variable medida es la adecuada (conocimiento experto) sobre el campo particular en estudio. Por ejemplo Newcomb construyó aparatos nuevos y complicados para medir el tiempo en que pasaba la luz. Nosotros aceptamos el juicio de los físicos sobre que este instrumento es adecuado para su propósito y más preciso que instrumentos anteriores. Codificación: La primera medición del tiempo de paso de la luz era segundos. Corremos al punto decimal nueve lugares a la derecha, obteniendo y luego registramos únicamente el desvío respecto de Luego 28 es la versión corta de y -2 se corresponde con Variación Los aparatos cambian levemente con la temperatura, la densidad de la atmósfera cambia día a día y así siguiendo. Incluso los mejores experimentos producen resultados variables. Esta es la razón porque Newcomb tomó muchas mediciones en vez de una. En general, el promedio de varias observaciones es menos variable que el de una única observación. Poniéndonos en lugar de Newcomb, estamos tentados de calcular el promedio de los tiempos de pasaje de la luz, convertir este tiempo en una estimación nueva y mejor de la velocidad de la luz y correr, para hacernos una reputación, a publicar el resultado.!!peligro!!

16 33 Histograma de las 66 mediciones de Simon Newcomb Un dato atípico en la brillantez vista por un satélite de vigilancia puede representar el lanzamiento de un misil. Un dato atípico de las mediciones de actividad eléctrica en un detector utilizado en física de altas energías puede ser evidencia de una nueva partícula elemental. En tales casos la distribución general simplemente provee un patrón de referencia sobre el cual sobresalen los eventos extraordinarios. Cuando los datos atípicos son inesperados e indeseados se debería hallar una causa clara para cada outlier, como la falla del equipo durante el experimento o un error en la transcripción de los datos, en esos casos, se puede corregir o eliminar el dato. Cuando no se encuentra ninguna causa es muy difícil tomar una decisión. Newcomb finalmente eliminó el peor outlier (-44) pero retuvo el otro. La media de todas las 66 observaciones es 26.21; la media de las 65 observaciones retenidas es El gran efecto del único valor -44 sobre la media es la razón para eliminarlo.

17 34 Este gráfico sugiere levemente que la variabilidad (dispersión vertical) es decreciente con el tiempo. Quizás, a medida que ganó experiencia, Newcomb se volvió más experto en el uso de su equipo. Los efectos de aprendizaje como el que muestran los datos de Newcomb son muy frecuentes y deben ser tenidos en consideración. Si dejamos las primeras 20 observaciones de Newcomb para el aprendizaje, la media de las 46 restantes resulta Las mejores mediciones modernas sugieren que el verdadero valor para el tiempo de paso de la luz del experimento de Newcomb es Eliminar los outliers ó fijar un período de aprendizaje, acercan los resultados al verdadero valor. Pero si es posible, siempre, hay que hallar la razón de un outlier. RESUMEN Una medida resistente no se ve afectada por cambios en los valores numéricos de una pequeña proporción de la cantidad total de observaciones, sin importar cuánto cambien estos valores. El centro de una distribución es medido por la media, la media α podada ó la mediana. La media es el promedio aritmético de todos los datos. La media α podada es el promedio aritmético de los datos excluidos el 100*α% de los valores mayores y el 100*α% de los valores menores. La mediana es el punto medio de los datos ordenados. La distancia intercuartil provee una medida resistente de la dispersión o variabilidad de la distribución. Los cinco números resumen, dados por la mediana, los cuartiles, el máximo y el mínimo proveen una descripción rápida de la forma global de una distribución. Los Boxplots, basados en los cinco números resumen, son útiles para comparar varias distribuciones. Las vallas internas y externas son útiles para identificar potenciales valores atípicos (outliers).

18 35 La varianza muestral s 2 y especialmente su raíz cuadrada, el desvío estándar DS, son medidas muy usuales, pero no resistentes, de la dispersión de los datos alrededor de la media. 5. Curvas de densidad Existe alguna manera de describir una distribución completa mediante una única expresión? un diagrama tallo-hoja no es práctico pues se trata de demasiados datos un histograma elimina los detalles y depende de la elección de las clases la mediana y los percentiles registran algunos aspectos específicos de los datos. Si queremos tener una descripción de la forma global de la distribución, omitiendo valores atípicos y otras desviaciones del patrón general, la respuesta es sí. Histograma del puntaje de vocabulario y la aproximación por una curva gaussiana. Aproximamos al histograma por una curva suave que muestre la forma de la distribución sin las irregularidades del histograma. En este ejemplo se trata de la curva gaussiana que describiremos en las próximas secciones. Observe que la escala de frecuencias relativas (Frecuencias/ 947; ) coincide en este caso con la escala de densidad porque la longitud de los intervalos de clase del histograma es Superposición de una curva normal a un histograma a mano

19 36 1 grafique una curva simétrica de altura = y puntos de inflexión en x DS DS 2π ±. la escala en el eje vertical es la frecuencia relativa, siempre que la longitud de la base de los rectángulos de clase sea 1. En cualquier otro caso, en el eje vertical se grafica (la frecuencia relativa de cada clase) / (longitud de la clase) de manera que el área de un rectángulo = (longitud de la base)*(altura del rectángulo)= frecuencia relativa Verifiquemos este procedimiento para la superposición que muestra la figura sabiendo que la media del puntaje es , el desvío es , la longitud del intervalo de clase es 1 y 1 DS 2π = Propiedades de una curva de densidad Como la frecuencia relativa de todas las observaciones es 1, requerimos que el área total bajo la curva sea 1. El área bajo la curva y sobre un intervalo, correspondiente a cualquier rango de valores de la variable, es la proporción de observaciones que caen en ese rango. La curva describe la forma de la distribución y el área bajo la curva = frecuencia relativa. Es llamada curva de densidad de la distribución. El eje vertical mide la frecuencia relativa/(longitud del intervalo de clase). Una curva de densidad con la forma apropiada suele ser una descripción adecuada del patrón global de una distribución. Los datos atípicos, que son desviaciones del patrón global, no están descriptos por la curva.

20 37 Media y mediana en una curva de densidad simétrica Media y mediana en una curva de densidad asimétrica a derecha Las medidas de posición y dispersión también se aplican al caso de curvas de densidad. El p-ésimo percentil, x p, en una curva de densidad es el punto que deja a su izquierda un p % del área bajo la curva y el (100 - p) % restante, a la derecha. p % del área (100 - p) % del área x p En particular la mediana es el punto de áreas iguales, es decir, el punto que deja áreas iguales de cada lado. Si pensamos a las observaciones como pesos en una vara delgada la media es el punto en que la vara quedaría equilibrada al poner un fiel justo debajo de él. Esta interpretación se extiende a la curva de densidad.

21 38. La media es un punto de equilibrio de una curva de densidad. Las curvas de densidad simétricas son perfectamente simétricas a pesar que los datos reales rara vez mostrarán simetría perfecta. Debemos distinguir los parámetros poblacionales, la media = μ y el desvío = σ, de una curva de densidad de los números x y DS calculados a partir de las observaciones. 5.3 Distribuciones Normales o Gaussianas. Todas las distribuciones gaussianas tienen la misma forma. Vemos dos curvas normales con μ= 1 y μ=5 y σ=1. Dos curvas normales con diferente σ.

22 39 Podemos localizar σ a ojo en una curva normal. A medida que nos movemos en ambas direcciones desde el centro μ de la curva, ésta aumenta su pendiente hasta un punto (punto de inflexión) en que la pendiente empieza a disminuir Los dos puntos en los cuales ocurre este cambio de curvatura están localizados a una distancia σ a cada lado del centro μ. Recuerde que μ y σ sólos no determinan la forma de una distribución en general. Éstas son propiedades de las distribuciones gaussianas. Existen otras distribuciones no gaussianas con forma de campana. Las curvas de densidad normal están descriptas por la siguiente ecuación x μ 2 1 ( ) y = e σ (2) σ 2π Observación: la ecuación (2) de la curva queda completamente especificada cuando se conocen los valores de μ y σ.

23 40 Las distribuciones normales proveen buenos modelos para puntajes de pruebas tomadas en poblaciones grandes (pruebas habilidades escolares y muchas pruebas psicológicas), mediciones cuidadosamente replicadas y de la misma calidad (datos de Newcomb tabla 2.1 sin outliers), características de una población biológicamente homogénea (longitudes de las cucarachas, rendimiento de la soja y pérdida de humedad en carne de pollo envasada). Las distribuciones de las siguientes variables, en cambio, son generalmente asimétricas: variables económicas (ingreso personal, ventas en firmas comerciales), tiempos de sobrevida (de pacientes de cáncer luego de realizado un tratamiento), tiempo de vida (de componentes mecánicos o electrónicas). A pesar que la experiencia puede sugerir si un modelo gaussiano es o no factible en un caso particular, es muy riesgoso suponer la normalidad de los datos sin inspeccionarlos. Observaciones El desvío estándar no significa nada si los datos no son Normales o aproximadamente Normales La media no describe el centro si los datos no son simétricos La mediana y la distancia intercuartil pueden fallar si los datos forman grupos El significado de las medidas resumen está atado a la forma de la distribución de los datos. 5.4 Propiedades de la distribución Normal o gaussiana Sabemos que una transformación lineal no modifica la forma global de una distribución. a) Cualquier variable, X*, obtenida de una variable X que se distribuye de acuerdo con la curva Normal con media μ y desvío σ (X ~ N(μ,σ 2 ) ) mediante una transformación lineal, sigue siendo teniendo distribución Normal (es decir gaussiana). b) Si los valores, x, de la variable X se transforman por la variable transformada, X*, tendrá media x * = a + bx con b > 0 a + bμ y desvío b σ. c) Si una variable X tiene distribución normal con media μ y desvío σ entonces la variable estandarizada

24 41 Z = X μ σ tiene una distribución normal con media 0 y desvío 1 (N(0,1)). Esta es llamada distribución normal estándar. Cuando la distribución de los valores de una variable es aproximadamente normal, las observaciones son frecuentemente estandarizadas restándole la media y dividiéndolas por el desvío. La estandarización de una observación indica a cuantos desvíos se encuentra de la media y para qué lado. Ejemplo. Las alturas de las mujeres jóvenes argentinas están distribuídas (aprox.) normalmente con μ = 160 cm σ = 4 cm. La altura estandarizada sigue una distribución normal estándar. Z altura -160 = 4 Una mujer que mide 170 cm tiene una altura estandarizada Z = = 4 es decir 2.5 desvíos estándar por encima de la media. Análogamente una mujer que mide 155 cm tiene una altura estandarizada Z = = 4 es decir 1.25 desvíos estándar por debajo de la media Qué proporción de mujeres miden menos de 155 cm? Esta frecuencia relativa es el área bajo la curva N(160, 4 2 ) a la izquierda del punto 155. Como la altura estandarizada es -1.25, esta área es la misma que el área bajo la curva normal estándar por debajo de

25 42 El área bajo la curva y sobre el punto 155 es cero, por lo tanto la frecuencia relativa de los valores de la variable que son estrictamente menores que él (X < 155) es igual a la frecuencia relativa de los valores de la variable que son menores ó iguales que él (X 155). Esto no es verdad en conjunto de datos reales, que pueden contener la altura 155 cm. 5.5 Función de distribución acumulada. Si Z es una variable cuya función de densidad está dada por la curva normal estándar, el área bajo dicha curva para valores menores o iguales que z es la frecuencia relativa de los valores de Z que son menores o iguales que z se representa por φ(z) se denomina Función de Distribución Acumulada de la variable Z se calcula mediante la siguiente integral, que está tabulada para diferentes valores de z y también es calculada por los programas estadísticos usuales, Φ( z x 1 z) = e 2 2π 2

26 Gráfico de probabilidad normal. Gráfico cuantil-cuantil. Un histograma o un diagrama tallo-hoja pueden revelar aspectos no normales en los datos como los outliers (Histograma de los datos de Newcomb ) o mostrar una pronunciada asimetría (ejemplo de gastos, tallo-hoja) Una medida más sensible para determinar si el modelo normal es adecuado para un conjunto de datos está provista por un gráfico cuantil-cuantil. Cuantil es la denominación alternativa a percentil cuando hablamos de proporciones en vez de porcentajes. La idea general de un gráfico cuantil-cuantil es comparar dos distribuciones graficando sus cuantiles (ó sus percentiles) uno versus el otro. Si las distribuciones son aproximadamente iguales sus cuantiles serán también aproximadamente iguales. El gráfico cuantil-cuantil estará cerca de la recta y = x. Si nó, las desviaciones de esta recta mostrarán cómo difieren las distribuciones. Estamos interesados en una aplicación de esta idea general: la comparación de la distribución observada de la variable, con la distribución normal. La idea de un gráfico cuantil-normal para un conjunto de observaciones es considerar a cada observación como el cuantil de la distribución observada y graficarlo contra el cuantil de la distribución normal estándar. La menor de 20 observaciones, es el cuantil 0.05 de los datos, porque 1/20 ó 0.05 de las observaciones son menores o iguales que ella. Graficamos cada observación contra el valor de la normal que deja la misma proporción de la distribución por debajo.

27 44 Gráfico cuantil-normal para los datos del tiempo de paso de la luz de Newcomb. La mayoría de los puntos están cerca de una recta, indicando que un modelo gaussiano ajustaría bien. Los dos valores atípicos se desvían de la recta y muestra cómo responde el gráfico a colas pesadas a izquierda ó a outliers bajos. En una distribución asimétrica a izquierda las observaciones menores yacen notoriamente por debajo de la recta trazada por cuerpo principal de las observaciones mayores. El gráfico correspondiente a los datos del contenido calórico en salchichas de mezcla de carnes, muestra claramente dos grupos (clusters) y el outlier bajo. Es visible la asimetría a derecha del grupo de los valores más bajos por la curvatura de dichos puntos. Al trazar una recta por los primeros 4 puntos del grupo los otros cuatro quedan por encima de dicha recta. El diagrama tallo-hoja muestra muy claramente la distribución de este pequeño conjunto de datos, que es definitivamente no gaussiano. Comparar el diagrama tallo-hoja con el gráfico cuantil normal nos permite ver claramente como es el comportamiento de un gráfico cuantilnormal.

28 45 Gráfico cuantil-normal para los datos del gasto de los clientes en un almacén. La marcada asimetría a derecha de esta distribución se destaca al trazar una recta por los puntos que se encuentran más abajo, que corresponden a las observaciones menores. Las observaciones mayores están sistemáticamente por encima de esta recta, indicando asimetría a derecha. No se observan outliers individuales. Gráfico cuantil-normal para los datos del tiempo de paso de la luz de Newcomb con los outliers

29 46 omitidos. Las únicas desviaciones importantes de la normalidad son los numerosos grupitos horizontales de datos. Estos representan observaciones con el mismo valor, debidas a la limitación en la precisión y no traen problemas al adoptar el modelo normal Los datos reales, casi siempre, mostrarán algún apartamiento del modelo gaussiano teórico. Es importante al examinar un gráfico cuantil-normal buscar formas que muestren un claro apartamiento de la normalidad. RESUMEN Una curva de densidad frecuentemente permite describir en forma compacta el patrón general de una distribución. El área por debajo de una curva de densidad es una frecuencia relativa. El área total es 1. La media μ (punto de equilibrio), la mediana (punto de áreas iguales) y otros percentiles pueden ser localizados bajo una curva normal. El desvío estándar σ no puede localizarse a ojo en la mayoría de las curvas de densidad. La media y la mediana coinciden para curvas de densidad simétricas, pero la media de una curva asimétrica a derecha está localizada más lejos hacia la cola larga que la mediana. Las distribuciones normales, ó gaussianas, están representadas por curvas simétricas con forma de campana. La media μ y el desvío estándar σ especifican completamente la distribución N(μ,σ 2 ). La media es el centro de simetría y σ es la distancia desde μ hasta los puntos de inflexión de la curva. Todas las curvas normales coinciden cuando las mediciones están realizadas en unidades de σ alrededor de la media. Estas son llamadas mediciones estandarizadas. Si X tiene distribución N(μ,σ 2 ) luego la variable estandarizada Z = (X-μ)/σ tiene distribución normal estándar N(0,1). Las frecuencias relativas de cualquier distribución normal pueden calcularse a partir de la distribución N(0,1).

Histograma del puntaje de vocabulario y la aproximación por una curva gaussiana.

Histograma del puntaje de vocabulario y la aproximación por una curva gaussiana. 35 Curvas de densidad Existe alguna manera de describir una distribución completa mediante una única expresión? un diagrama tallo-hoja no es práctico pues se trata de demasiados datos un histograma elimina

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA Medidas de tendencia central y de dispersión Giorgina Piani Zuleika Ferre 1. Tendencia Central Son un conjunto de medidas estadísticas que determinan un único valor que define el

Más detalles

Módulo de Estadística

Módulo de Estadística Módulo de Estadística Tema 2: Estadística descriptiva Tema 2: Estadísticos 1 Medidas La finalidad de las medidas de posición o tendencia central (centralización) es encontrar unos valores que sinteticen

Más detalles

Estadística Inferencial. Estadística Descriptiva

Estadística Inferencial. Estadística Descriptiva INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y

Más detalles

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:

Más detalles

Transformaciones de variables

Transformaciones de variables Transformaciones de variables Introducción La tipificación de variables resulta muy útil para eliminar su dependencia respecto a las unidades de medida empleadas. En realidad, una tipificación equivale

Más detalles

ESTADÍSTICA SEMANA 3

ESTADÍSTICA SEMANA 3 ESTADÍSTICA SEMANA 3 ÍNDICE MEDIDAS DESCRIPTIVAS... 3 APRENDIZAJES ESPERADOS... 3 DEFINICIÓN MEDIDA DESCRIPTIVA... 3 MEDIDAS DE POSICIÓN... 3 MEDIDAS DE TENDENCIA CENTRAL... 4 MEDIA ARITMÉTICA O PROMEDIO...

Más detalles

Estadística Descriptiva

Estadística Descriptiva Estadística Descriptiva Observamos datos provenientes de una o varias muestras de la población bajo estudio. El objetivo es obtener conclusiones sobre toda la población a partir de la muestra observada.

Más detalles

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA 1 UNIVERSIDAD NACIONAL EXPERIMENTAL DE LOS LLANOS OCCIDENTALES EZEQUIEL ZAMORA VICE-RECTORADO DE PLANIFICACIÓN Y DESARROLLO SOCIAL PROGRAMA CIENCIAS SOCIALES Y JURIDICAS SUBPROGRAMA ADMINISTRACIÓN SUBPROYECTO:

Más detalles

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro

Más detalles

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012 NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012 Matilde Ungerovich- mungerovich@fisica.edu.uy DEFINICIÓN PREVIA: Distribución: función que nos dice cuál es la probabilidad de que cada suceso

Más detalles

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada. ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos

Más detalles

ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL

ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL DEPARTAMENTO DE GEOGRAFÍA FACULTAD DE HUMANIDADES UNNE Prof. Silvia Stela Ferreyra Revista Geográfica Digital. IGUNNE. Facultad de Humanidades.

Más detalles

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios. ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS Ejemplos y ejercicios de Estadística Descriptiva yanálisis de Datos Diplomatura en Estadística Curso 007/08 Descripción estadística de una variable. Ejemplos

Más detalles

Teorema Central del Límite (1)

Teorema Central del Límite (1) Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico

Más detalles

Curva de Lorenz e Indice de Gini Curva de Lorenz

Curva de Lorenz e Indice de Gini Curva de Lorenz Curva de Lorenz e Indice de Gini Curva de Lorenz La curva de Lorenz es útil para demostrar la diferencia entre dos distribuciones: por ejemplo quantiles de población contra quantiles de ingresos. También

Más detalles

Dispone de 1 hora para resolver las siguientes cuestiones planteadas.

Dispone de 1 hora para resolver las siguientes cuestiones planteadas. ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL FACULTAD DE ECONOMÍA Y NEGOCIOS EXAMEN TEÓRICO DE ESTADÍSTICA COMPUTARIZADA NOMBRE: PARALELO: Dispone de 1 hora para resolver las siguientes cuestiones planteadas.

Más detalles

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza CARACTERÍSTICAS DE LA POBLACIÓN. Una pregunta práctica en gran parte de la investigación de mercado tiene que ver con el tamaño de la muestra. La encuesta, en principio, no puede ser aplicada sin conocer

Más detalles

Curso de Estadística Básica

Curso de Estadística Básica Curso de SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez Objetivo Conocer y calcular las medidas de tendencia central y medidas de dispersión

Más detalles

Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE

Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE Objetivos 2 Identificar los tipos de gráficas. Definir los conceptos tablas y cuadros Reconocer las partes de una gráfica. Construir

Más detalles

LECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL.

LECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL. LECTURA 1: LA DISTRIBUCIÓN NORMAL GENERAL LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I) TEMA 1: LA DISTRIBUCION NORMAL GENERAL PROPIEDADES 1 INTRODUCCION La distribución de probabilidad continua más importante

Más detalles

Fase 2. Estudio de mercado: ESTADÍSTICA

Fase 2. Estudio de mercado: ESTADÍSTICA 1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.

Más detalles

Estadística. Análisis de datos.

Estadística. Análisis de datos. Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un

Más detalles

UNIDAD 6. Estadística

UNIDAD 6. Estadística Matemática UNIDAD 6. Estadística 2 Medio GUÍA N 1 MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS ACTIVIDAD Consideremos los siguientes conjuntos de valores referidos a las edades de los jugadores de dos

Más detalles

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo U.D.1: Análisis estadístico de una variable Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.: Alumnos del colegio. - Individuo:

Más detalles

1 - TEORIA DE ERRORES : distribución de frecuencias

1 - TEORIA DE ERRORES : distribución de frecuencias - TEORIA DE ERRORES : distribución de frecuencias CONTENIDOS Distribución de Frecuencias. Histograma. Errores de Apreciación. Propagación de errores. OBJETIVOS Representar una serie de datos mediante un

Más detalles

Taller No 1. Laboratorio Estadística con Matlab. Estadística Descriptiva - Análisis exploratorio de datos con Matlab

Taller No 1. Laboratorio Estadística con Matlab. Estadística Descriptiva - Análisis exploratorio de datos con Matlab Taller No 1. Laboratorio Estadística con Matlab Estadística Descriptiva - Análisis exploratorio de datos con Matlab Dos objetivos importantes de Análisis exploratorio de datos son: 1) para determinar un

Más detalles

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Algunas Distribuciones Continuas de Probabilidad UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción El comportamiento de una variable aleatoria queda

Más detalles

A continuación se presenta la información de la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes.

A continuación se presenta la información de la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes. M150: Creciendo A) Presentación del problema LOS JOVENES CRECEN MAS ALTO A continuación se presenta la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes. B) Preguntas del problema

Más detalles

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro) UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro) 1. ESTADÍSTICA: CLASES Y CONCEPTOS BÁSICOS En sus orígenes históricos, la Estadística estuvo ligada a cuestiones de Estado (recuentos, censos,

Más detalles

DISTRIBUCIÓN NORMAL CAPÍTULO 16

DISTRIBUCIÓN NORMAL CAPÍTULO 16 CAPÍTULO 6 DISTRIBUCIÓN NORMAL Cuando los datos están distribuidos con frecuencias ascendentes-descendentes aproimadamente simétricas, se le llama distribución normal. Cuando se trata de una variable discreta,

Más detalles

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011 NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011 CÓMO CARACTERIZAR UNA SERIE DE DATOS? POSICIÓN- dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos CENTRALIZACIÓN-

Más detalles

Métodos de Investigación en Psicología (10) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Métodos de Investigación en Psicología (10) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández Métodos de Investigación en Psicología (10) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema

Más detalles

Tema 4: Probabilidad y Teoría de Muestras

Tema 4: Probabilidad y Teoría de Muestras Tema 4: Probabilidad y Teoría de Muestras Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009

Más detalles

2.1. Introducción Análisis exploratorio Análisis exploratorio para variables con muchas modalidades

2.1. Introducción Análisis exploratorio Análisis exploratorio para variables con muchas modalidades Tema 2 Análisis gráfico Contenido 2.1. Introducción............................. 1 2.2. Análisis exploratorio......................... 2 2.2.1. Análisis exploratorio para variables con pocas modalidades

Más detalles

Tema 1.- Correlación Lineal

Tema 1.- Correlación Lineal Tema 1.- Correlación Lineal 3.1.1. Definición El término correlación literalmente significa relación mutua; de este modo, el análisis de correlación mide e indica el grado en el que los valores de una

Más detalles

UNIVERSIDAD INTERAMERICANA DE PUERTO RICO RECINTO DE ARECIBO CENTRO DE SERVICIOS DE APOYO AL ESTUDIANTE

UNIVERSIDAD INTERAMERICANA DE PUERTO RICO RECINTO DE ARECIBO CENTRO DE SERVICIOS DE APOYO AL ESTUDIANTE UNIVERSIDAD INTERAMERICANA DE PUERTO RICO RECINTO DE ARECIBO CENTRO DE SERVICIOS DE APOYO AL ESTUDIANTE Glosario Media: es la puntuación promedio de un grupo de datos. Mediana: la mediana viene a ser la

Más detalles

Estadística Descriptiva de una variable con STATGRAPHICS

Estadística Descriptiva de una variable con STATGRAPHICS Estadística Descriptiva de una variable con STATGRAPHICS Ficheros empleados: AlumnosIndustriales.sf3, 1. Introducción El objetivo de este documento es la utilización de las técnicas de estadística descriptiva

Más detalles

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 Ignacio Martín Tamayo 11 Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 ÍNDICE ------------------------------------------------------------- 1. Introducción 2. Frecuencias 3. Descriptivos 4. Explorar

Más detalles

Anexo 4. Herramientas Estadísticas

Anexo 4. Herramientas Estadísticas Anexo 4 Herramientas Estadísticas La estadística descriptiva es utilizada como una herramienta para describir y analizar las características de un conjunto de datos, así como las relaciones que existen

Más detalles

Expliquemos con exactitud qué queremos decir con valores máximos y mínimos.

Expliquemos con exactitud qué queremos decir con valores máximos y mínimos. Introducción: Ahora que conocemos las reglas de derivación nos encontramos en mejor posición para continuar con las aplicaciones de la derivada. Veremos cómo afectan las derivadas la forma de la gráfica

Más detalles

Laboratorio de Física para Ingeniería

Laboratorio de Física para Ingeniería Laboratorio de para Ingeniería 1. Al medir la longitud de un cilindro se obtuvieron las siguientes medidas: x [cm] 8,45 8,10 8,40 8,55 8,45 8,30 Al expresar la medida en la forma x = x + x resulta: (a)

Más detalles

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa Materia: Estadística I Maestro: Dr. Francisco Javier Tapia Moreno Semestre: 015- Hermosillo, Sonora, a 14 de septiembre de

Más detalles

UNIDAD 4: FUNCIONES POLINOMIALES Y RACIONALES

UNIDAD 4: FUNCIONES POLINOMIALES Y RACIONALES UNIDAD 4: FUNCIONES POLINOMIALES Y RACIONALES En la Sección anterior se abordó contenidos relacionados con las funciones y gráficas, continuamos aprendiendo más sobre funciones; en la presente unidad abordaremos

Más detalles

ANÁLISIS DE DATOS UNIDIMENSIONALES

ANÁLISIS DE DATOS UNIDIMENSIONALES ANÁLISIS DE DATOS UNIDIMENSIONALES TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRÁFICAS MEDIDAS DE POSICIÓN MEDIDAS DE TENDENCIA CENTRAL MEDIA ARITMÉTICA OTRAS MEDIAS: GEOMÉTRICA.ARMÓNICA.MEDIA GENERAL MEDIANA

Más detalles

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24 Comenzado el lunes, 25 de marzo de 2013, 17:24 Estado Finalizado Finalizado en sábado, 30 de marzo de 2013, 17:10 Tiempo empleado 4 días 23 horas Puntos 50,00/50,00 Calificación 10,00 de un máximo de 10,00

Más detalles

ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO

ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO RELACIÓN DE PROBLEMAS PROPUESTOS DE UNA VARIABLE Curso académico 2004-2005 DPTO. ECONOMÍA APLICADA I 1. Obtener las frecuencias acumuladas, las frecuencias relativas

Más detalles

Percentil q (p q ) Si en este conjunto de valores se quiere encontrar el percentil 20, la solución gráfica es muy simple

Percentil q (p q ) Si en este conjunto de valores se quiere encontrar el percentil 20, la solución gráfica es muy simple Percentil q (p q ) Una medida de posición muy útil para describir una población, es la denominada 'percentil'. En forma intuitiva podemos decir que es un valor tal que supera un determinado porcentaje

Más detalles

Otra forma de enumerar los resultados es en una tabla de frecuencia:

Otra forma de enumerar los resultados es en una tabla de frecuencia: Materia: Matemática de Séptimo Tema: Intervalo de Clases e Histogramas Qué pasa si quisieras matar algo tiempo mientras esperas tu vuelo de conexión en el aeropuerto? Empiezas a contar el número de personas

Más detalles

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL Son valores numéricos que localizan e informan sobre los valores medios de una serie o conjunto de datos, se les considera como indicadores debido a que resumen la información

Más detalles

Julio Deride Silva. 27 de agosto de 2010

Julio Deride Silva. 27 de agosto de 2010 Estadística Descriptiva Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 27 de agosto de 2010 Tabla de Contenidos Estadística Descriptiva Julio Deride

Más detalles

Bioestadística: Estadística Descriptiva

Bioestadística: Estadística Descriptiva Bioestadística: M. González Departamento de Matemáticas. Universidad de Extremadura Bioestadística 1 2 Bioestadística 1 2 Coneptos Básicos ESTADÍSTICA Ciencia que estudia el conjunto de métodos y procedimientos

Más detalles

Gráficos estadísticos. Estadígrafo

Gráficos estadísticos. Estadígrafo Tema 12: Estadística y probabilidad Contenidos: Gráficos estadísticos - Estadígrafos de tendencia central Nivel: 4 Medio Gráficos estadísticos. Estadígrafo 1. Distribución de frecuencias Generalmente se

Más detalles

Estadística para investigadores: todo lo que siempre quiso saber y nunca se atrevió a preguntar

Estadística para investigadores: todo lo que siempre quiso saber y nunca se atrevió a preguntar Estadística para investigadores: todo lo que siempre quiso saber y nunca se atrevió a preguntar Módulo 2. Estadística Descriptiva: Medidas de síntesis Mª Purificación Galindo Villardón Mª Purificación

Más detalles

MEDIDAS ESTADÍSTICAS Medidas de Tendencia Central y de Variabilidad

MEDIDAS ESTADÍSTICAS Medidas de Tendencia Central y de Variabilidad MEDIDAS ESTADÍSTICAS Medidas de Tendencia Central y de Variabilidad 1 Propiedades deseables de una medida de Tendencia Central. 1) Definida objetivamente a partir de los datos de la serie. 2) Que dependa

Más detalles

Tema 4: Probabilidad y Teoría de Muestras

Tema 4: Probabilidad y Teoría de Muestras Tema 4: Probabilidad y Teoría de Muestras Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009

Más detalles

Estadística para la toma de decisiones

Estadística para la toma de decisiones Estadística para la toma de decisiones ESTADÍSTICA PARA LA TOMA DE DECISIONES. 1 Sesión No. 7 Nombre: Distribuciones de probabilidad para variables continúas. Objetivo Al término de la sesión el estudiante

Más detalles

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas: Ejercicio 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas: a) Marca de los coches. b) Peso de los coches. c) Número de coches vendidos

Más detalles

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Descriptiva Para Psicólogos (EST-225)

Más detalles

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,

Más detalles

No es otra cosa, que la representación de los resultados de una función sobre el plano carteciano.

No es otra cosa, que la representación de los resultados de una función sobre el plano carteciano. FUNCIONES GRAFICAS No es otra cosa, que la representación de los resultados de una función sobre el plano carteciano. INTÉRVALOS Un intervalo es el conjunto de todos los números reales entre dos números

Más detalles

Medidas de dispersión

Medidas de dispersión Medidas de dispersión Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Las medidas de dispersión son: Rango o recorrido El rango es la diferencia

Más detalles

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016 ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una

Más detalles

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Jesús Fernández Fernández Carmen María Sordo García DEPARTAMENTO DE MATEMÁTICA APLICADA Y CIENCIAS DE LA COMPUTACIÓN UNIVERSIDAD DE CANTABRIA

Más detalles

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m Ing. Eduardo Cruz Romero eduar14_cr@hotmail.com w w w. tics-tlapa. c o m La estadística es tan vieja como la historia registrada. En la antigüedad los egipcios hacían censos de las personas y de los bienes

Más detalles

MEDIDAS DE POSICIÓN. FUENTE: Gómez, Elementos de Estadística Descriptiva Levin & Rubin. Estadística para Administradores

MEDIDAS DE POSICIÓN. FUENTE: Gómez, Elementos de Estadística Descriptiva Levin & Rubin. Estadística para Administradores UNIVERSIDAD DE COSTA RICA ESCUELA DE ESTADÍSTICA Prof. Olman Ramírez Moreira MEDIDAS DE POSICIÓN FUENTE: Gómez, Elementos de Estadística Descriptiva Levin & Rubin. Estadística para Administradores 1 OBJETIVO

Más detalles

Estadística descriptiva y métodos diagnósticos

Estadística descriptiva y métodos diagnósticos 2.2.1. Estadística descriptiva y métodos diagnósticos Dra. Ana Dorado Díaz Consejería de Sanidad Diplomado en Salud Pública Diplomado en Salud Pública - 2 Objetivos específicos 1. El alumno aprenderá a

Más detalles

Exactitud y Linearidad del Calibrador

Exactitud y Linearidad del Calibrador Exactitud y Linearidad del Calibrador Resumen El procedimiento Exactitud y Linearidad del Calibrador fue diseñado para estimar la exactitud del sistema de medición. En contraste con los procedimientos

Más detalles

ESTADÍSTICA. Tema 4 Regresión lineal simple

ESTADÍSTICA. Tema 4 Regresión lineal simple ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del

Más detalles

Medidas de centralización

Medidas de centralización 1 1. Medidas de centralización Medidas de centralización Hemos visto cómo el estudio del conjunto de los datos mediante la estadística permite realizar representaciones gráficas, que informan sobre ese

Más detalles

Representación de números enteros: el convenio exceso Z

Representación de números enteros: el convenio exceso Z Representación de números enteros: el convenio exceso Z Apellidos, nombre Martí Campoy, Antonio (amarti@disca.upv.es) Departamento Centro Informàtica de Sistemes i Computadors Escola Tècnica Superior d

Más detalles

LOS ESTADÍGRAFOS BÁSICOS Y SU INTERPRETACIÓN, M TENDENCIA CENTRAL

LOS ESTADÍGRAFOS BÁSICOS Y SU INTERPRETACIÓN, M TENDENCIA CENTRAL PreUnAB LOS ESTADÍGRAFOS BÁSICOS Y SU INTERPRETACIÓN, MEDIDAS DE TENDENCIA CENTRAL Clase # 26 Noviembre 2014 ESTADÍGRAFOS Concepto de estadígrafo Un estadígrafo, o estadístico, es un indicador que se calcula

Más detalles

Variable Aleatoria Continua. Principales Distribuciones

Variable Aleatoria Continua. Principales Distribuciones Variable Aleatoria Continua. Definición de v. a. continua Función de Densidad Función de Distribución Características de las v.a. continuas continuas Ejercicios Definición de v. a. continua Las variables

Más detalles

ESTADÍSTICA CON EXCEL

ESTADÍSTICA CON EXCEL ESTADÍSTICA CON EXCEL 1. INTRODUCCIÓN La estadística es la rama de las matemáticas que se dedica al análisis e interpretación de series de datos, generando unos resultados que se utilizan básicamente en

Más detalles

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS 1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias

Más detalles

Hoja 6: Estadística descriptiva

Hoja 6: Estadística descriptiva Hoja : Estadística descriptiva Hoja : Estadística descriptiva May Dada la siguiente distribución de frecuencias, halle: a) la mediana; b) la media. Número (x) Frecuencia (y) May De enero a septiembre la

Más detalles

Distancia focal de una lente convergente (método del desplazamiento) Fundamento

Distancia focal de una lente convergente (método del desplazamiento) Fundamento Distancia focal de una lente convergente (método del desplazamiento) Fundamento En una lente convergente delgada se considera el eje principal como la recta perpendicular a la lente y que pasa por su centro.

Más detalles

Mediciones II. Todas las mediciones tienen asociada una incertidumbre que puede deberse a los siguientes factores:

Mediciones II. Todas las mediciones tienen asociada una incertidumbre que puede deberse a los siguientes factores: Mediciones II Objetivos El alumno determinará la incertidumbre de las mediciones. El alumno determinará las incertidumbres a partir de los instrumentos de medición. El alumno determinará las incertidumbres

Más detalles

RELACIÓN DE EJERCICIOS TEMA 2

RELACIÓN DE EJERCICIOS TEMA 2 1. Sea una distribución estadística que viene dada por la siguiente tabla: Calcular: x i 61 64 67 70 73 f i 5 18 42 27 8 a) La moda, mediana y media. b) El rango, desviación media, varianza y desviación

Más detalles

Tema 2. Descripción Conjunta de Varias Variables

Tema 2. Descripción Conjunta de Varias Variables Tema 2. Descripción Conjunta de Varias Variables Cuestiones de Verdadero/Falso 1. La covarianza mide la relación lineal entre dos variables, pero depende de las unidades de medida utilizadas. 2. El análisis

Más detalles

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos: 15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo

Más detalles

La variable independiente x es aquella cuyo valor se fija previamente. La variable dependiente y es aquella cuyo valor se deduce a partir de x.

La variable independiente x es aquella cuyo valor se fija previamente. La variable dependiente y es aquella cuyo valor se deduce a partir de x. Bloque 8. FUNCIONES. (En el libro Temas 10, 11 y 12, páginas 179, 197 y 211) 1. Definiciones: función, variables, ecuación, tabla y gráfica. 2. Características o propiedades de una función: 2.1. Dominio

Más detalles

Tema 6. Estadística Descriptiva e Introducción a la Inferencia Estadística

Tema 6. Estadística Descriptiva e Introducción a la Inferencia Estadística Tema 6. Estadística Descriptiva e Introducción a la Inferencia Estadística Fuente de los comics: La Estadística en Comic. LarryGonicky Woollcatt Smith. Ed. ZendreraZariquiey, 1999 ESTADÍSTICA ESTADÍSTICA

Más detalles

TEMA 1 Estadística Descriptiva. Introducción Comparativos gráficos Medidas de tendencia central Medidas de dispersión

TEMA 1 Estadística Descriptiva. Introducción Comparativos gráficos Medidas de tendencia central Medidas de dispersión TEMA 1 Estadística Descriptiva Introducción Comparativos gráficos Medidas de tendencia central Medidas de dispersión 1 Haz escuchado el término de estadística? A diario recibimos muchos datos ó información

Más detalles

Los Gráficos. Que son? Cuales son los tipos que conoces. Cual es su relación con la estadística?

Los Gráficos. Que son? Cuales son los tipos que conoces. Cual es su relación con la estadística? Los Gráficos Que son? Cual es su relación con la estadística? Que factores se deben considerar para leerlos correctament e? Cuales son los tipos que conoces La representación grafica de datos sobre un

Más detalles

2.- Tablas de frecuencias

2.- Tablas de frecuencias º BACHILLERATO MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II TEMA 3.- ESTADÍSTICA DESCRIPTIVA PROFESOR: RAFAEL NÚÑEZ -----------------------------------------------------------------------------------------------------------------------------------------------------------------

Más detalles

MEDIDAS DE TENDENCIA CENTRAL O DE PRECISIÓN

MEDIDAS DE TENDENCIA CENTRAL O DE PRECISIÓN MEDIDAS DE TENDENCIA CENTRAL O DE PRECISIÓN Cuando se analiza un conjunto de datos, normalmente muestran una tendencia a agruparse o aglomerarse alrededor de un punto central. Para describir ese conjunto

Más detalles

Matemáticas UNIDAD 5 CONSIDERACIONES METODOLÓGICAS. Material de apoyo para el docente. Preparado por: Héctor Muñoz

Matemáticas UNIDAD 5 CONSIDERACIONES METODOLÓGICAS. Material de apoyo para el docente. Preparado por: Héctor Muñoz CONSIDERACIONES METODOLÓGICAS Material de apoyo para el docente UNIDAD 5 Preparado por: Héctor Muñoz Diseño Gráfico por: www.genesisgrafica.cl LA RELACIÓN DE PROPORCIONALIDAD 1. DESCRIPCIÓN GENERAL DE

Más detalles

Inecuaciones lineales y cuadráticas

Inecuaciones lineales y cuadráticas Inecuaciones lineales y cuadráticas 0.1. Inecuaciones lineales Una inecuación lineal tiene la forma ax + b < 0 ó ax + b > 0 ó ax + b 0 ó ax + b 0. El objetivo consiste en hallar el conjunto solución de

Más detalles

Variables aleatorias

Variables aleatorias Variables aleatorias DEFINICIÓN En temas anteriores, se han estudiado las variables estadísticas, que representaban el conjunto de resultados observados al realizar un experimento aleatorio, presentando

Más detalles

Tema 4 Variables Aleatorias

Tema 4 Variables Aleatorias Tema 4 Variables Aleatorias 1 Introducción En Estadística Descriptiva, se estudiaron las distribuciones de frecuencias de conjuntos de datos y posteriormente se vimos los fundamentos de la teoría de probabilidades.

Más detalles

c). Conceptos. Son los grupos o conceptos que se enlistan en las filas de la izquierda de la tabla

c). Conceptos. Son los grupos o conceptos que se enlistan en las filas de la izquierda de la tabla Tema 5. Tablas estadísticas Como ya se había establecido en el tema anterior sobre el uso de las tablas estadísticas, éstas son medios que utiliza la estadística descriptiva o deductiva para la presentación

Más detalles

Profesorado de Nivel Medio y Superior en Biología Matemática - 1º Cuatrimestre Año 2013 FUNCIÓN CUADRÁTICA

Profesorado de Nivel Medio y Superior en Biología Matemática - 1º Cuatrimestre Año 2013 FUNCIÓN CUADRÁTICA Matemática - º Cuatrimestre Año 0 FUNCIÓN CUADRÁTICA Hemos definido anteriormente la función lineal como una función f: R R de la forma f()a+b con a R y b R, que se representa en el plano mediante una

Más detalles

Teoría de errores -Hitogramas

Teoría de errores -Hitogramas FÍSICA I Teoría de errores -Hitogramas Autores: Pablo Iván ikel - e-mail: pinikel@hotmail.com Ma. Florencia Kronberg - e-mail:sil_simba@hotmail.com Silvina Poncelas - e-mail:flo_kron@hotmail.com Introducción:

Más detalles

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Suponga que le pedimos a un grupo de estudiantes de la asignatura de estadística que registren su peso en kilogramos. Con los datos del peso de los estudiantes

Más detalles

SESIÓN N 07 III UNIDAD RELACIONES Y FUNCIONES

SESIÓN N 07 III UNIDAD RELACIONES Y FUNCIONES SESIÓN N 07 III UNIDAD RELACIONES Y FUNCIONES RELACIONES BINARIAS PAR ORDENADO Es un arreglo de dos elementos que tienen un orden determinado donde a es llamada al primera componente y b es llamada la

Más detalles

Viernes 7 de octubre de 2005 Mate 3026 Estadística con Programación Prof. José N. Díaz Caraballo

Viernes 7 de octubre de 2005 Mate 3026 Estadística con Programación Prof. José N. Díaz Caraballo Viernes 7 de octubre de 2005 Mate 3026 Estadística con Programación Prof. José N. Díaz Caraballo Favor de abrir el navegador Mozilla Firefox y escriba la siguiente dirección http://math.uprag.edu/area.mtw

Más detalles

Pruebas Puertorriqueñas de Evaluación Alterna (PPEA) Ejemplos de Actividades del Portafolio Septiembre 2011

Pruebas Puertorriqueñas de Evaluación Alterna (PPEA) Ejemplos de Actividades del Portafolio Septiembre 2011 Pruebas Puertorriqueñas de Evaluación Alterna (PPEA) Ejemplos de Actividades del Portafolio Septiembre 211 Objetivo de los ejemplos de actividades del portafolio del PPEA: Tener un mejor entendimiento

Más detalles

ACTIVIDADES SELECTIVIDAD APLICACIONES DERIVADAS

ACTIVIDADES SELECTIVIDAD APLICACIONES DERIVADAS ACTIVIDADES SELECTIVIDAD APLICACIONES DERIVADAS Ejercicio 1 De la función se sabe que tiene un máximo en, y que su gráfica corta al eje OX en el punto de abscisa y tiene un punto de inflexión en el punto

Más detalles