Universidad de Alcalá Departamento de Ecología MÉTODOS DE ANÁLISIS DE DATOS EN ECOLOGÍA

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Universidad de Alcalá Departamento de Ecología MÉTODOS DE ANÁLISIS DE DATOS EN ECOLOGÍA"

Transcripción

1 Universidad de Alcalá Departamento de Ecología MÉTODOS DE ANÁLISIS DE DATOS EN ECOLOGÍA Prácticas de Ecología Licenciaturas de Biología y Ciencias Ambientales Curso

2 . INTRODUCCIÓN 4.. Distribuciones de datos 4.. Pruebas de contraste de hipótesis 6. ASOCIACIÓN ENTRE VARIABLES CUALITATIVAS: TEST DE LA c 7.. Requisitos e hipótesis de trabajo 7.. Procedimiento de cálculo 7.. Contraste de hipótesis 9.4. Caso práctico 9. TESTS DE COMPARACIÓN DE DOS MEDIAS 0.. Selección del test 0.. Test paramétrico: t de Student 0... Requisitos 0... Hipótesis... Procedimiento de cálculo..4. Caso Práctico.. Test no paramétrico: U de MannWhitney... Requisitos... Hipótesis... Procedimiento de cálculo..4. Caso práctico 4. TESTS DE COMPARACIÓN DE MÁS DE DOS MEDIAS 4.. Selección del test Test paramétrico: Análisis de la Varianza (ANOVA) Requisitos Hipótesis Procedimiento de cálculo Caso Práctico Test no paramétrico: KruskalWallis Requisitos Hipótesis Procedimiento de cálculo Caso práctico: 7

3 5. ASOCIACIÓN ENTRE VARIABLES CUANTITATIVAS: ÍNDICES DE CORRELACIÓN Rangos de variación de los coeficientes Hipótesis Selección del test Correlación paramétrica: r de Pearson Procedimiento de cálculo Caso práctico Correlación no paramétrica: r de Spearman Procedimiento de cálculo Caso práctico 0 6. TABLAS ESTADÍSTICAS 6.. Tabla de valores críticos del estadístico c 6.. Tabla de valores críticos del estadístico t de Student 6.. Tabla de valores críticos del estadístico U de Mann Whitney Tabla de valores críticos del estadístico F de Snedecor Tabla de valores críticos del estadístico H de KruskalWallis Tabla de valores críticos del coeficiente de correlación de Pearson (r) Tabla de valores críticos del coeficiente de correlación de Spearman (r s )

4 . INTRODUCCIÓN La estadística es una disciplina que proporciona a la Ecología las herramientas necesarias para el análisis de los datos. Dado que no podemos hacer estudios en toda la población (no es posible contar todos los ácaros que hay en un suelo, ni es posible medir el área foliar de todas las hojas de los árboles de un bosque, ni medir la longitud del cuerpo de todas las carpas que tiene un lago), la estadística nos permite cuantificar la probabilidad de cometer error al extrapolar los resultados obtenidos de una serie de muestras al conjunto de la población. Por tanto, la estadística permite cuantificar el error que cometemos al aceptar nuestros resultados obtenidos a partir de muestras ( encuestas ) de una población generalmente muy extensa. Hay dos tipos de estadística, la estadística descriptiva, que reúne un conjunto de técnicas que facilitan la organización, resumen y comunicación de datos; y la estadística inferencial, que permite hacer pruebas de contraste de hipótesis... Distribuciones de datos Cuando tenemos una colección de datos como resultado de un trabajo científico que hemos realizado, es importante conocer el tipo de distribución que siguen esos datos para poder decidir posteriormente qué herramientas estadísticas son más adecuadas para el análisis de los mismos. Los histogramas de frecuencias son una herramienta de representación de datos que nos permiten observar cómo se distribuyen los mismos. Están formados por rectángulos adyacentes que tienen por base cada uno de los intervalos de la variable medida y por altura las frecuencias absolutas (nº de veces que aparecen datos dentro de ese intervalo). La superficie de cada rectángulo es proporcional a la frecuencia de cada una de las clases y el área total lo será al número de individuos en la muestra. El número de intervalos a utilizar (k) se puede calcular según la regla de Sturges (96): K =. * log (n), donde n es el tamaño de muestra. Frecuencia 4,5 4,5,5,5 0,5 0,*,4*,5*,6*,7*,8*,9* 4,0* 4,* 4,* 4,* 4,4* 4,5* Longitud del ala (cm) Figura : Representación gráfica de la distribución de frecuencias de la variable longitud del ala en una población de aves Asimismo, para conocer mejor cómo se distribuyen unos datos es importante conocer cuál es valor central de los mismos así como el grado de dispersión de los datos alrededor de ese valor central. Para ello existen una serie de parámetros que informan acerca de estas características de las distribuciones de datos. 4

5 Medidas de tendencia central: indican alrededor de qué valores se agrupan los datos observados. Distinguimos:. Media aritmética: es el centro de gravedad de la serie de datos y se calcula como x i /n. µ media de la población x media de la muestra.. Mediana: es el punto medio de una serie ordenada de datos. Moda: es el valor más frecuente de la serie de datos. Figura. Representación de la media (mean), mediana y moda en cuatro distribuciones. Medidas de dispersión: indican si los valores de la variable están muy dispersos o se concentran alrededor de la medida de centralización. Son: Rango. Diferencia entre el valor máximo y el mínimo observado. Rango: x max x min Varianza. Expresa la dispersión de valores entorno a la media σ varianza de la población σ ( x i x) = n x) s varianza de la muestra s = n Desviación estándar. Es la raíz cuadrada de la varianza σ desviación estándar de la población s desviación estándar de la muestra De entre todas las distribuciones posibles que puedan seguir unos datos, la distribución normal es la más interesante desde el punto de vista estadístico, pues reúne unas propiedades que han hecho posible que a partir de ella se desarrollaran numerosos métodos de análisis de datos. En ella, los valores cercanos a la media son los más abundantes y a medida que nos alejamos de la media, los datos presentan una frecuencia cada vez menor. Por este motivo, el histograma de frecuencias adopta una forma de campana de Gauss: ( x i 5

6 La distribución normal posee una serie de características: Corresponde a variables cuantitativas continuas. Se caracteriza por dos medidas: media y desviación típica. Es unimodal. Es simétrica alrededor de la media. Por tanto, media, mediana y moda coinciden. Tiene forma acampanada, sin un pico excesivo. El área bajo la curva =. El 50% de las observaciones se encuentran por debajo de la media y el 50% por encima. El 68% de las observaciones se encuentran dentro del intervalo x ± s El 95% de las observaciones se encuentran dentro del intervalo x ±,96 s El 99% de las observaciones se encuentra dentro del intervalo x ±,57 s... Pruebas de contraste de hipótesis Debido a esta propiedad de poder conocer la probabilidad de que un valor determinado forme parte de la distribución normal, se han desarrollado numerosos tests estadísticos que permiten realizar pruebas de contraste de hipótesis a partir de la distribución normal, son las pruebas paramétricas. Sin embargo, no siempre los datos que obtenemos en un trabajo científico se ajustan a la distribución normal, por lo que para hacer pruebas de contraste de hipótesis necesitaremos recurrir a la estadística no paramétrica. La aplicación del método científico no nos permite demostrar la veracidad de una hipótesis sino su falsedad, es decir, que las hipótesis ecológicas (H ecol ) que proponemos se dan por válidas siempre y cuando no se demuestre que son falsas. En las pruebas de contraste de hipótesis, las diferentes pruebas estadísticas utilizan la llamada hipótesis nula (H 0 ) para verificar la validez de las hipótesis ecológicas. La hipótesis nula siempre presupone que la distribución de los datos es al azar, es decir, que no existen diferencias entre los grupos o asociación entre las variables debidas a factores ecológicos. Dicho de otra forma, la H 0 es la negación de la hipótesis ecológica. Por tanto, cuando realizamos cualquier test estadístico de contraste de hipótesis, nuestro objetivo será rechazar la H 0, lo que nos permite seguir dando por válida la hipótesis ecológica. El grado de significación estadística (p) es el parámetro que cuantifica el error que se estamos cometiendo al aceptar nuestros resultados. Concretamente, lo que indica es la probabilidad de que rechacemos la H 0 siendo cierta. Cuanto más pequeño sea el valor de p menor será la probabilidad de que H 0 sea cierta, y por tanto mayor es la probabilidad de que H ecol sea la correcta. Para tomar una decisión respecto a cuál sea la hipótesis verdadera, el investigador fija el nivel máximo de error que se permite al aceptar H ecol (a). En general, se ha fijado por convenio el umbral de p=0.05 como válido, es decir, nos permitimos un error máximo del 5% en nuestra afirmación de la hipótesis ecológica. En cualquier caso, conviene señalar que lo más importante es dar a conocer el error de nuestros resultados. En función del número de variables implicadas en un análisis estadístico, distinguimos tres tipos de métodos de análisis de datos: Métodos monovariantes: Se han registrado los valores de una sola variable, o de dos variables pero al menos una de ellas es cualitativa Métodos bivariantes: Se han registrado los valores de dos variables cuantitativas Métodos multivariantes: Se han registrado los valores de tres o más variables En el siguiente cuadro se muestran de forma resumida las diferentes pruebas estadísticas que la estadística paramétrica y la no paramétrica proporcionan a los 6

7 investigadores para realizar las pruebas de contraste de hipótesis necesarias en los trabajos científicos: Variable Variable Métodos paramétricos Métodos no paramétricos Cualitativa Cualitativa Test de la c (tablas de contingencia) Cuantitativa Cualitativa t de Student t de Student para datos pareados Análisis de la Varianza U de MannWhitney Prueba de los rangos de Wilcoxon Prueba de KruskalWallis Cuantitativa Cuantitativa Coeficiente de Correlación de Pearson Coeficiente de Correlación de Spearman. ASOCIACIÓN ENTRE VARIABLES CUALITATIVAS: TEST DE LA c El test de la χ se utiliza para analizar la asociación entre dos variables cualitativas (por ejemplo, la presencia de una especie con el tipo de suelo, o la presencia de individuos en estado de flor con una época del año, etc...). Lo que hace el test es comparar la distribución de frecuencias observadas de la asociación entre las variables con la distribución de frecuencias esperadas en caso de que no existiera asociación (es decir, si las dos variables cualitativas no están asociadas sino que se distribuyen al azar). Para analizar la asociación entre las variables cualitativas multiestado se utilizan las tablas de contingencia. A nivel general, este test sirve para comparar frecuencias, por lo que puede utilizarse para verificar si una colección de datos se distribuye de acuerdo a algún tipo de distribución específica... Requisitos e hipótesis de trabajo La aplicación de este test requiere que las muestras estén tomadas al azar y que las frecuencias esperadas sean superiores a 5. Como se trata de un test que relaciona variables cualitativas, no hay ningún requisito acerca de la distribución de las variables. Las hipótesis de trabajo serán del tipo: H ecol : Existe relación entre las variables H 0 :.. Procedimiento de cálculo Las dos variables son independientes (no hay asociación entre ellas) Supongamos, por ejemplo, que queremos saber si existe asociación entre la presencia de la especie A (un invertebrado acuático) y el tramo del río (alto, medio y bajo) para el caso del río Henares. Para ello hemos hecho un muestreo a lo largo del río y en cada tramo hemos registrado la presencia () o ausencia () de la especie en 5 muestras de agua tomadas al azar. Los resultados obtenidos son: 7

8 Tramo Alto Tramo Medio Tramo Bajo A partir de estos datos construiríamos una tabla de contingencia con los datos observados en campo de la siguiente manera: Especie A Tramo del río Alto Medio Bajo 4 A continuación se calcula el estadístico χ siguiendo la siguiente fórmula: cal χ( α, gl.) = ( o e) e o = frecuencias observadas en el inventario e = frecuencia esperada de una celda, suponiendo que no hubiese asociación c * f t t e = N c t = total de la columna donde está la celda f t = total de la fila donde está la celda N = nº total de casos gl. (grados de libertad) = (nº columnas)*(nº filas) En nuestro ejemplo, el cálculo del estadístico χ se haría de esta forma: cal 8

9 * Tramo del río Alto Medio Bajo Total Especie A (5.) (5.) (5.) 6 (9.7) (9.7) 4 (9.7) 9 Total * Entre paréntesis aparecen las frecuencias esperadas calculadas Caso especial: En las tablas de contingencia de x, como la de la figura: Variable A B Total filas (a) (b) (ab) Variable (c) (d) (cd) Total columnas (ac) (bd) (abcd) el estadístico χ se puede calcular también de esta forma : cal χ cal Si N 0 ( a* d b* c) * N = ( a b) *( c d)*( a c)*( b d).. Contraste de hipótesis χ cal Si N < 0 (Corrección de Yates) N * ( a * d b * c N / ) = ( a b) * ( c d) *( a c) *( b d) Se compara el valor obtenido de χ con el valor χ correspondiente al número de cal crit grados de libertad apropiados y al valor de α previamente seleccionado (normalmente, α=0.05 ó 0.0): Si χ, se rechaza la H 0 (hay asociación entre las variables) Si cal χ crit χ < χ cal crit, se acepta la H 0 (no hay asociación entre las variables).4. Caso práctico Continuamos con el ejemplo que hemos empezado antes, en el que queremos estudiar si existe asociación entre la presencia de la especie A y el tramo del río Henares donde esta especie vive. Recordemos que, en nuestro caso: siguiente forma: H ecol : Existe relación entre la presencia de la especie A y el tramo del río H 0 : La presencia de la especie A es independiente del tramo del río A partir de la tabla de contingencia elaborada en el apartado., calculamos el estadístico χ de la cal χ cal = ( 5,) ( 5,) ( 5,) ( 9,7) ( 9,7) ( 4 9,7) =.8 9

10 ? crít ( g.l., a=0.05) = 5.99? cal >? crít Se rechaza H 0 ; por tanto, concluimos que la especie A aparece preferentemente en los tramos altos del río.. TESTS DE COMPARACIÓN DE DOS MEDIAS Sirven para comparar las medidas de tendencia central (media o mediana) de dos grupos de datos distintos, para determinar si las diferencias entre dichas medidas se deben al azar del muestreo o a diferencias reales entre los grupos que se están comparando. Relacionan una variable cualitativa de dos casos (variable independiente) con otra cuantitativa (variable dependiente). Los dos estados de la variable cualitativa son los que designan los grupos. Si quisiéramos estudiar, por ejemplo, si existen diferencias en el potencial hídrico de las encinas entre el día y la noche, y hubiéramos tomado muestras de potencial hídrico en encinas de día y otras muestras en encinas por la noche, para analizar los datos utilizaríamos un test de este tipo. En ese caso, la variable cualitativa es la hora del día, que es la variable independiente que define los dos grupos de datos; y el potencial hídrico sería la variable dependiente y cuantitativa... Selección del test Para seleccionar el test apropiado para analizar nuestros datos, una vez realizado el muestreo se construye un diagrama de frecuencias (o se realiza un test estadístico si se dispone de software apropiado) para comprobar la normalidad de la variable cuantitativa en cada uno de los dos grupos. Asimismo, se realiza el test de la F de Snedecor* para comprobar la homogeneidad de las varianzas entre los dos grupos. * Prueba de comprobación de varianzas iguales: F de Snedecor Se calculan las varianzas de cada una de las dos muestras: s y Se calcula el estadístico F cal a partir de la siguiente fórmula: F = cal s s mayor menor grados libertad: n, n (n tamaño de la muestra de varianza mayor) H o : varianzas iguales. Si F cal F crít (La F crít se busca en las tablas, ver sección dedicada al ANOVA ), se rechaza la H o, es decir, se concluye que las varianzas no son iguales. s Si la variable cuantitativa sigue la distribución normal en todos los casos y las varianzas no son significativamente distintas, se utilizará el test paramétrico: t de Student En cualquier otro caso se realizará el test no paramétrico: U de MannWhitney.. Test paramétrico: t de Student Se utiliza para detectar la existencia de diferencias significativas entre las medias de una determinada variable cuantitativa en dos grupos de datos.... Requisitos Datos distribuidos según una distribución normal en cada grupo Las varianzas de las dos muestras han de ser iguales Muestras independientes y tomadas al azar 0

11 ... Hipótesis a) HIPÓTESIS DE DOS COLAS: La hipótesis ecológica establece que existen diferencias entre las medias de los dos grupos considerados, sin presuponer cuál de las dos medias es mayor que la otra. La hipótesis nula establece que no existen diferencias entre dichas medias. H ecol : µ? µ H 0 : µ = µ b) HIPÓTESIS DE UNA COLA: La hipótesis ecológica establece que existen diferencias entre las medias de los grupos considerados, presuponiendo que una de las dos medias es mayor que la otra. La hipótesis nula establece que no existen diferencias entre dichas medias, o que las diferencias van en sentido contrario a como han sido expresadas en la hipótesis ecológica.... Procedimiento de cálculo H ecol : µ > µ H 0 : µ µ H ecol : µ < µ H 0 : µ µ Se calcula el estadístico t cal a partir de la siguiente fórmula: tcal x x = donde: Sc n n n y n = tamaños de las muestras y respectivamente x y x = medias de las muestras y respectivamente s y Sc = s = varianzas de las muestras y respectivamente n s n s n n A continuación se mide la significación del estadístico t cal, comparando ese valor con el valor de un estadístico t crit que se obtiene mirando las tablas correspondientes. Para identificar el t crit que nos corresponde hemos de fijarnos en el número de colas que tiene nuestra hipótesis (una cola: onetailed; dos colas: twotailed), en el nivel de significación (a) con el que pretendemos rechazar la hipótesis nula (normalmente a = 0.05 ó 0.0); y en los grados de libertad del test (n n ). Si t cal t crit (a=0.05 o inferior) se rechaza H 0 y se acepta H ecol (las medias son diferentes) Si t cal < t crit (a=0.05) se acepta H 0 y se rechaza H ecol (las medias son iguales)..4. Caso Práctico Queremos saber si la humedad del suelo en un determinado lugar varía en función de la cubierta vegetal del mismo (tomillar o suelo desnudo), pues suponemos que la cubierta vegetal contribuye a aumentar la humedad del suelo por disminución de la evaporación. Para ello se ha realizado un muestreo en el que se ha medido la humedad de suelo (en % del volumen) en seis muestras distribuidas al azar bajo tomillares y en 8 muestras también distribuidas al azar en la misma zona, pero en condiciones de suelo desnudo. Variables: Cobertura de suelo (cualitativa, independiente) Humedad del suelo (cuantitativa, dependiente) Hipótesis ecológica: H ecol : la humedad de suelo es mayor bajo el tomillar: µ tomillar >µ suelo desnudo Se trata, por tanto, de un test de una cola.

12 Hipótesis nula: H 0 : µ tomillar µ suelo desnudo Tras el muestreo se obtienen los siguientes datos: Cobertura Humedad de suelo (%) n Media tomillar suelo desnudo s Cálculo del estadístico t cal : t cal = =.6 Comprobación de la significación del estadístico t cal : t cal =.6 > t crít (a=0.05, gl, una cola) =.78 Por tanto, se rechaza la H 0, y se acepta la H ecol, es decir, se concluye que existen diferencias significativas en la humedad del suelo en función de la cobertura vegetal, siendo mayor en condiciones de cubierta vegetal de tomillar que en condiciones de suelo desnudo... Test no paramétrico: U de MannWhitney Compara las diferencias entre dos medianas, por lo que se basa en rangos en lugar de en los parámetros de la muestra (media, varianza). Se emplea cuando los datos no siguen la distribución normal, en lugar del test de la t de Student (paramétrico).... Requisitos Variable cuantitativa que no cumple los requisitos de normalidad y/o homogeneidad de varianzas, o variable semicuantitativa. Muestras independientes y al azar.... Hipótesis a) HIPÓTESIS DE DOS COLAS: La hipótesis ecológica establece que existen diferencias entre las medianas (M) de los dos grupos considerados, sin presuponer cuál de las dos medianas es mayor que la otra. La hipótesis nula establece que no existen diferencias entre dichas medianas. H ecol : M? M H 0 : M = M b) HIPÓTESIS DE UNA COLA: La hipótesis ecológica establece que existen diferencias entre las medianas de los grupos considerados, presuponiendo que una de las dos medianas es mayor que la otra. La hipótesis nula establece que no existen diferencias entre dichas medianas, o que las diferencias son en sentido contrario a lo expresado en la hipótesis ecológica.... Procedimiento de cálculo H ecol : Μ > M H 0 : Μ M H ecol : Μ < M H 0 : Μ M Asignación de rangos a cada dato. Para ello se ordenan todos los datos (juntando los dos grupos) en orden creciente. El rango de cada dato será el número de orden que le

13 corresponde a cada dato. Cuando se repita el mismo valor numérico, el rango que se asigna a esos datos es la media aritmética de los rangos que les corresponderían en función del número de orden que ocupan. Se suman los rangos de cada uno de los inventarios (grupos) y se calcula la suma de los rangos de los datos de cada uno de los grupos (R y R ) Se calculan los estadísticos U y U a partir de las siguientes fórmulas: U n ( n = n n U = n n ) R n ( n ) R Se obtiene el estadístico U cal escogiendo el valor más grande entre U y U. Se comprueba la significación estadística del estadístico U cal comparando este valor con el valor de un estadístico U crít obtenido a partir de las tablas correspondientes. Si U cal U crít (a=0.05 o inferior) se rechaza H 0 y se acepta H ecol (las medianas son diferentes) Si U cal < U crít (a=0.05) se acepta H 0 y se rechaza H ecol (las medianas son iguales)..4. Caso práctico Se quiere estudiar si el número de especies de ácaros edáficos se ve influido por un incendio de baja intensidad. Para ello se simuló un incendio de baja intensidad en una parcela de un territorio homogéneo, y se tomaron 6 muestras al azar de la zona incendiada y 7 muestras también al azar de la zona no incendiada, contándose el número de especies de ácaros edáficos en cada muestra. Variable dependiente: número de especies de ácaros edáficos (cuantitativa) Variable independiente: ocurrencia de un incendio (cualitativa) H 0 = La mediana del número de especies de ácaros edáficos es igual en la parcela quemada que en la no quemada: M quemada = M no quemada H ecol = La mediana del número de especies de ácaros edáficos varía dependiendo de que se haya producido un incendio: M quemada? M no quemada. Por tanto, de acuerdo con nuestra hipótesis ecológica, vamos a hacer un test de dos colas. Los datos obtenidos en el muestreo son los siguientes: Parcela Número de especies de ácaros edáficos n quemada no quemada Asignación de rangos a cada dato: dato * rango * en negrita los valores correspondientes al inventario de la parcela quemada Se suman los rangos de cada grupo: R =8 R =6 Cálculo del estadístico U cal : U =6x7[(7x8)/]6=7 U =6x7[(6x7)/]8=5 U cal Comprobación de la significación del estadístico U cal : U cal = 5 < U cít (a=0.05) = 6 No se rechaza la H 0, concluimos que el número de especies de ácaros edáficos no se ve influido significativamente por la ocurrencia de un incendio de baja intensidad. 4. TESTS DE COMPARACIÓN DE MÁS DE DOS MEDIAS Sirven para comparar las medidas de tendencia central (media o mediana) de más de dos grupos de datos distintos, para determinar si las diferencias entre dichas medidas se deben al azar del muestreo o a diferencias reales entre los grupos que se están comparando.

14 Relacionan una variable cualitativa de más de dos casos (variable independiente) con otra cuantitativa (variable dependiente). Los estados de la variable cualitativa designan dichos grupos. Un ejemplo de problema científico en el que utilizaríamos este tipo de tests sería determinar si existen diferencias significativas en la densidad de escarabajos (variable dependiente, cuantitativa) que encontramos en un determinado lugar en las cuatro estaciones del año (variable independiente, cualitativa, define los grupos). 4.. Selección del test La selección del test apropiado para analizar nuestros datos se hace a través del siguiente procedimiento: Una vez que se ha hecho el muestreo y se ha medido la variable cuantitativa en cada uno de los grupos de la población, se construye un diagrama de frecuencias (o se realiza un test estadístico si se dispone de software apropiado) para comprobar la normalidad de la variable cuantitativa en cada uno de los grupos. Asimismo, se realiza el test de la F de Snedecor para comprobar la homogeneidad de las varianzas entre los distintos grupos. Si la variable cuantitativa sigue la distribución normal en todos los casos y las varianzas no son significativamente distintas, se utilizará el test paramétrico: ANOVA En cualquier otro caso se realizará el test no paramétrico: KruskalWallis 4.. Test paramétrico: Análisis de la Varianza (ANOVA) Se utiliza para detectar la existencia de diferencias significativas entre las medias de una determinada variable cuantitativa en tres o más grupos de datos Requisitos Datos distribuidos según una distribución normal Las varianzas de las distintas muestras han de ser iguales Muestras independientes y tomadas al azar 4... Hipótesis La hipótesis ecológica establece que existen diferencias entre las medias de los grupos considerados, es decir, que al menos dos de las medias serán distintas. La hipótesis nula establece que no existen diferencias entre dichas medias. H ecol : No todas las medias son iguales H 0 : 4... Procedimiento de cálculo µ = µ =... = µ k La valoración de las diferencias entre las medias de los distintos grupos se basa en la descomposición de la variabilidad total del conjunto de datos en dos términos: variabilidad debida a las diferencias entre los grupos (variabilidad entre grupos), y variabilidad debida al azar del muestreo (variabilidad dentro de grupos). Variabilidad total = Variabilidad entre grupos Variabilidad dentro grupos La variabilidad entre datos se puede estimar con la varianza (s ), y con Suma de Cuadrados (SS), que es el cociente entre la varianza y los grados de libertad (gl.). Por tanto: 4 SS total = SS entre grupos SS dentro grupos

15 k = n ú m e r o d e g r u p o s N = n úú mm e or o t o t at ol t a l d e d e d a t od sa t o s n n, n, n,..,..,.. n, n k k = = n ú m en rú om e r o d e d e d a t od sa t o s e n e n c a d ca a d a g r u pg or u p SS total k Las diferentes sumas de cuadrados se obtienen a partir de las siguientes fórmulas: ( x) ( x ) ( x ) ( x ) ( x) k = x SSentre grupos =... N n n nk N número de grupos N = número total de datos n, n,..., n = número de datos en cada grupo = k x = cada uno de los datos de cada grupo El cálculo de la suma de cuadrados dentro de grupos es más laboriosa y por ello la obtenemos despejando de la ecuación: SS dentro grupos = SS total SS entre grupos Cálculo de los grados de libertad de las sumas de cuadrados: g. l. SStotal = N g. l. SS = k s entre grupos entre gupos g. l. SS dentrogrupos = N k Conversión de las sumas de cuadrados (SS) en varianzas: SS = g. l. entregrupos entregrupos SS = entre grupos k Cálculo del estadístico F: s dentrogrupos SS = g. l. dentrogrupos dentrogrupos SS = dentro grupos N k F = s s entregrupos dentrogrupos Si en la población de la que proceden las muestras no hay diferencias reales entre los grupos definidos por la variable cualitativa, la varianza entre grupos será similar a la varianza dentro de grupos (por tanto el cociente entre ambas estará cerca de ). En el caso de que existan diferencias reales entre los grupos (lo que presupone la hipótesis ecológica) la varianza entre grupos será mayor que la varianza dentro de los grupos (el cociente entre ambas será mayor de ). El estadístico que nos dice si las desviaciones respecto a ese valor de son significativas es F. El contraste de hipótesis se realiza comparando el valor de la F cal con el valor F crít obtenido a partir de la tabla para el valor de α previamente establecido (normalmente α=0.05 o inferior). La búsqueda de dicha F crít requiere del número de grados de libertad del numerador y del denominador. La forma habitual de notación que se usa en las tablas lleva el valor de α entre paréntesis, y los grados de libertad del numerador y del denominador a continuación, en orden consecutivo y separados por comas. Por ejemplo, F crít (0.05),. significa el valor del estadístico F de las tablas para un α=0.05, con grados de libertad en el numerador y en el denominador. Si F cal F crít se rechaza H 0 y se acepta H ecol (alguna de las medias es diferente) Si F cal < F crít se acepta H 0 y se rechaza H ecol (las medias son iguales) Caso Práctico Se quiere saber si el tipo de cobertura de suelo (suelo desnudo, piedras, hojarasca y pastizal) influye sobre la densidad de hormigueros. Para ello se ha realizado un muestreo en el que se ha medido el número de hormigueros en diez muestras distribuidas al azar dentro de cada una de las zonas con diferente cobertura. 5

16 Variables: cobertura de suelo (cualitativa, independiente) y densidad de hormigueros (cuantitativa, dependiente) H ecol : Alguna de las medias es diferente (la cobertura de suelo influye sobre la densidad de hormigueros) H 0 : µ suelo desnudo = µ piedras =µ hojarasca = µ pastizal Tras el muestreo se obtienen los siguientes datos: Cobertura Densidad de hormigueros n Media Sx (Sx) Sx suelo desnudo piedras hojarasca pastizal Total Cálculo de la suma de cuadrados total: SS T = 500 (70) /40 = Cálculo de la variabilidad entre grupos (SS entre grupos ): SS entre = /0 6046/ / /0 70 /40 = 4.9 Cálculo de la variabilidad dentro de los grupos (SS dentro grupos ): SS T = SS entre SS dentro SS dentro = SS total SS entre = = Determinar los grados de libertad de cada una de las suma de cuadrados estimadas: SS T = N = 40 = 9 SS entre grupos = k = 4 = SS dentro grupos = N k = 40 4 = 6 Estimación de las varianzas dividiendo las SS por los grados de libertad: s entre grupos = 4.9/ =.97 s dentro grupos = 455.6/6.66 Cálculo del estadístico F cal y comparación con el estadístico F crít : F cal = s entre grupos /s dentro grupos =.97/.66 = 9.00 F crít (0.05), 6 <.9 F cal > F crít Rechazamos H o La abundancia de hormigueros no es la misma en todas las zonas con distinta cobertura de suelo 4.. Test no paramétrico: KruskalWallis Se basa en rangos en lugar de los parámetros de la muestra (media, varianza). Se emplea cuando los datos no siguen la distribución normal y/o tienen varianzas distintas, en sustitución del ANOVA paramétrico. Cuando el número de grupos es es idéntico a la U de MannWhitney Requisitos Variable cuantitativa que no cumple los requisitos de normalidad y/o homogeneidad de varianzas, o variable semicuantitativa. Muestras independientes y al azar Hipótesis La hipótesis ecológica establece que existen diferencias entre las medianas (Μ) de los grupos considerados, es decir, que al menos dos de las medianas serán distintas. La hipótesis nula establece que no existen diferencias entre dichas medianas. H ecol : Las medianas no son todas iguales H 0 : Μ = Μ =... = Μ k 4... Procedimiento de cálculo Asignación de rangos: se realiza exactamente igual que para la U de MannWhitney. 6

17 Cálculo del estadístico H: k Ri H = N( N ) ni i= ( N ) k = número de grupos N = número totalde datos = número de datosen el grupo Cuando existen rangos ligados (dos o más números con el mismo rango) se aplica un factor de corrección, siendo H c el estadístico que se utiliza en lugar de H, calculado según la siguiente expresión: Hc = H C C = m ( ti i= N t ) i N El valor crítico del estadístico calculado (H o H c ) se consulta en la tabla de la χ si N 5, o si k > 5, para (k) grados de libertad. Si N<5 y k<5 se consulta en la tabla específica para H. Si H cal H crít (χ crít) se rechaza H 0 y se acepta H ecol (alguna de las medianas es diferente) Si H cal < H crít (χ crít) se acepta H 0 y se rechaza H ecol (las medianas son iguales) ni t i m = número de rangos ligados en cada grupo = número de grupos de rangos ligados i Caso práctico: Se quiere estudiar si el ph de cuatro charcas situadas sobre sustratos diferentes es distinto. Para ello se obtuvieron 8 muestras de agua procedentes de cada una de las charcas, midiéndose el ph en cada una de ellas. Los datos de ph se ordenaron de forma ascendente para cada charca. (Una muestra de agua de la charca nº se perdió, de forma que n =7; pero el test no requiere igualdad en el número de datos de cada grupo). Los rangos se muestran entre paréntesis. Variable dependiente: ph (cuantitativa) Variable independiente: tipo de sustrato sobre el que cada charca (cualitativa) H 0 = el ph es el mismo en las cuatro charcas H ecol = el ph no es el mismo en las cuatro charcas * Rangos ligados Charca Charca Charca Charca () 7.7 (6*) 7.74 (.5*) 7.7 (6*) 7.69 () 7.7 (0*) 7.75 (6) 7.7 (6*) 7.70 (.5*) 7.74 (.5*) 7.77 (8) 7.74 (.5*) 7.70 (.5*) 7.74 (.5*) 7.78 (0*) 7.79 () 7.7 (8) 7.78 (0*) 7.80 (.5*) 7.8 (6*) 7.7 (0*) 7.78 (0*) 7.8 (6*) 7.85 (9) 7.7 (0*) 7.80 (.5*) 7.84 (8) 7.87 (0) 7.76 (7) 7.8 (6*) 7.9 () n =8 n =8 n =7 n 4 =8 R =55 R =.5 R =45 R 4 =6.5 7

18 N = = = Ri H N ( N ) n k i= i ( N ) = () Número de gruposde rangos ligados = m = m ( t i ti) = ( ) ( i= m ( ti ti ) i= 68 C = = = N N ) ( ) ( = ) ( ) ( H.876 H c = = =.94 ν = k = χ C , = () =.876 ) ( ) = 68 H c cal > χ crít Se rechaza H 0 El ph no es el mismo en todas las charcas 5. ASOCIACIÓN ENTRE VARIABLES CUANTITATIVAS: ÍNDICES DE CORRELACIÓN El coeficiente de correlación cuantifica el grado de asociación entre dos variables cuantitativas. ρ es el coeficiente de correlación real que existe entre dos variables en el conjunto de la población. r y r s son los coeficientes medidos sobre la muestra. 5.. Rangos de variación de los coeficientes Los coeficientes de correlación varían entre y del siguiente modo: a) ρ > 0 : correlación positiva. b) ρ < 0 : correlación negativa. c) ρ 0 : no hay correlación, los valores de x e y varían de forma independiente. Cuanto más cerca esté el coeficiente de ó, más fuerte es la correlación 5.. Hipótesis a) HIPÓTESIS DE DOS COLAS Existe correlación entre las variables x e y, ya sea positiva o negativa. La hipótesis nula dice que no existe correlación entre las variables. H ec : ρ 0 (ρ < 0 ó ρ > 0) 8

19 H 0 : ρ = 0 b) HIPÓTESIS DE UNA COLA Existe correlación positiva o negativa entre las variables x e y. La hipótesis nula dice que no hay correlación o que ésta es del signo contrario al esperado en la hipótesis ecológica. 5.. Selección del test H ecol : ρ > 0 H 0 : ρ 0 H ecol : ρ < 0 H 0 : ρ 0 Para seleccionar el tipo de correlación con el que analizaremos nuestros datos (paramétrica o no paramétrica), seguiremos los siguientes pasos: una vez que se haya realizado el muestreo y hayamos medido las variables x e y en la muestra, representaremos los pares de datos en un diagrama xy. A continuación comprobaremos la normalidad de las variables (construyendo el diagrama de frecuencias o utilizando un software apropiado). Si las dos variables cuantitativas siguen una distribución normal, utilizaremos la correlación de Pearson (paramétrica). Si alguna de las dos variables cuantitativas no sigue una distribución normal, utilizaremos la correlación de Spearman (no paramétrica) Correlación paramétrica: r de Pearson Procedimiento de cálculo r = El cálculo del índice de correlación de Pearson se hace a partir de la siguiente fórmula: n n= i n= x i n i= n i= n= i n= x y i i xi i= n x n n= i n= i= n i i= i= y y i i n= i n= yi n nº de pares de muestras x i valores de la variable x y i valores de la variable y A continuación, se comprueba la significación del índice de correlación calculado comparándolo con el valor de un estadístico r crit obtenido a partir de la tabla correspondiente, para una a = 0.05 o inferior y las colas que establezca la hipótesis. Si r cal r crit (a=0.05 o inferior) Se rechaza la hipótesis nula. Existe correlación Caso práctico Un ornitólogo está interesado en conocer la longitud del pico de una población de aves que estudia. Sin embargo esa medida resulta más costosa de tomar que el peso corporal. Por ello quiere saber si ambas variables se correlacionan para estimar la primera a partir de la segunda. Variables: x longitud del pico; y peso corporal. Ambas son cuantitativas y normales. Hipótesis de dos colas: H ecol : ρ 0 (ρ < 0 ó ρ > 0) H 0 : ρ = 0 Tras tomar una muestra de 0 individuos se obtienen los siguientes datos: 9

20 Obs. Longitud del pico (mm) Peso corporal (g) x y xy SUMA n = 0; r = 0.779, r cal = > r crit (0.0) n=0 = Se rechaza H 0 y se acepta H ecol Por tanto, se puede concluir que existe una correlación positiva entre el peso corporal y la longitud del pico de esa población de aves. Esto significa que los cambios en peso corporal de esas aves son un fiel reflejo de los cambios en la longitud del pico Correlación no paramétrica: r de Spearman Procedimiento de cálculo Para calcular la r de Spearman hay que realizar los siguientes pasos: Ordenar los pares de datos en función del valor de x y asignar rangos a x. Repetir la ordenación en función de y y asignar rangos a y. Calcular el coeficiente: r s = 6 i n = i= n d i n n = nº de pares de datos d i = diferencia de rangos en las variables del par i Para comprobar la significación estadística del índice de correlación se consulta en la tabla correspondiente el valor crítico de r s para n pares de datos, para p=0.05 o inferior y para el número de colas acorde con la hipótesis. Si r s cal r s crít, se rechaza H Caso práctico Se sospecha que la abundancia de la especie de gramínea Poa bulbosa en los pastizales mediterráneos depende en gran medida de la humedad que hay en el suelo. Para comprobar la hipótesis se realiza un muestreo con una cuadrícula de 0 cm de lado, que se dispone veces al azar sobre la comunidad de pasto. En cada cuadrícula se mide la cobertura de la especie y la humedad del suelo mediante un TDR. Variables: Cobertura de la especie y humedad del suelo. Ambas son cuantitativas, y no siguen una distribución normal. Hipótesis de una cola: existirá una correlación positiva entre la cobertura de Poa y la humedad. H ec : ρ > 0 H 0 : ρ 0 Tras realizar el muestreo se obtienen los siguientes datos: 0

21 Obs. Cobertura Humedad Rango cob. Rango hum. d d Suma = = 0.8 r s > r s crit (0.05) = 0.50 > Se rechaza H 0, hay correlación positiva entre la cobertura de Poa bulbosa y la humedad del suelo. Es importante destacar que este muestreo no es una demostración de una relación causaefecto entre las variables, es decir, que con este muestreo no podemos concluir que la mayor humedad de suelo es la causa de la mayor abundancia de Poa bulbosa. Para determinar relaciones de causaefecto se necesita realizar experimentos controlados y otros tests estadísticos que verifiquen ese tipo de relación.

22 6. TABLAS ESTADÍSTICAS 6.. Tabla de valores críticos del estadístico c

23 6.. Tabla de valores críticos del estadístico t de Student One tailed: hipótesis de una cola Two tailed: hipótesis de dos colas

24 6.. Tabla de valores críticos del estadístico U de Mann Whitney a una cola a dos colas n n a una cola a dos colas n n a una cola a dos colas n n

25 a una cola a dos colas n n a una cola a dos colas n n a una cola a dos colas n n

26 a una cola a dos colas n n a una cola a dos colas n n a una cola a dos colas n n

27 a una cola a dos colas n n a una cola a dos colas n n a una cola a dos colas n n

28 6.4. Tabla de valores críticos del estadístico F de Snedecor? : grados de libertad del numerador? : grados de libertad del denominador a = 0.05 a = 0.0 8

29 6.5. Tabla de valores críticos del estadístico H de KruskalWallis n n n n4 n5 a=0.05 a= n n n n4 n5 a=0.05 a=

30 6.6. Tabla de valores críticos del coeficiente de correlación de Pearson (r) Una cola Dos colas n a=0.05 a=0.0 a=0.05 a=

31 6.7. Tabla de valores críticos del coeficiente de correlación de Spearman (r s ) a (): hipótesis de una cola a (): hipótesis de dos colas

Estadística Avanzada y Análisis de Datos

Estadística Avanzada y Análisis de Datos 1-1 Estadística Avanzada y Análisis de Datos Javier Gorgas y Nicolás Cardiel Curso 2006-2007 2007 Máster Interuniversitario de Astrofísica 1-2 Introducción En ciencia tenemos que tomar decisiones ( son

Más detalles

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación Francisca José Serrano Pastor Pedro A. Sánchez Rodríguez - Implica siempre a variables

Más detalles

D.2 ANÁLISIS ESTADÍSTICO DE LAS TEMPERATURAS DE VERANO

D.2 ANÁLISIS ESTADÍSTICO DE LAS TEMPERATURAS DE VERANO Anejo Análisis estadístico de temperaturas Análisis estadístico de temperaturas - 411 - D.1 INTRODUCCIÓN Y OBJETIVO El presente anejo tiene por objeto hacer un análisis estadístico de los registros térmicos

Más detalles

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico. Introducción a la Melilla Definición de La trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico

Más detalles

Julia García Salinero. Departamento de Investigación FUDEN. Introducción

Julia García Salinero. Departamento de Investigación FUDEN. Introducción 1 Análisis de datos en los estudios epidemiológicos V Prueba de Chi cuadrado y Análisis de la varianza. Departamento de Investigación FUDEN. Introducción Continuamos el análisis de los estudios epidemiológicos,

Más detalles

Teoría de la decisión Estadística

Teoría de la decisión Estadística Conceptos básicos Unidad 7. Estimación de parámetros. Criterios para la estimación. Mínimos cuadrados. Regresión lineal simple. Ley de correlación. Intervalos de confianza. Distribuciones: t-student y

Más detalles

Análisis de Datos CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA

Análisis de Datos CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA 1. INTRODUCCIÓN En el tema 1 veíamos que la distribución de frecuencias tiene tres propiedades: tendencia central, variabilidad y asimetría. Las medidas de tendencia central las hemos visto en el tema

Más detalles

Cómo describir e interpretar los resultados de un estudio de investigación quirúrgica? Variables cuantitativas

Cómo describir e interpretar los resultados de un estudio de investigación quirúrgica? Variables cuantitativas Cómo describir e interpretar los resultados de un estudio de investigación quirúrgica? Variables cuantitativas Sesión de Residentes 13 de febrero, 2012 ÍNDICE Diferencia entre población y muestra. Diferencia

Más detalles

Estadística inferencial. Aplicación con el SPSS

Estadística inferencial. Aplicación con el SPSS Estadística inferencial. Aplicación con el SPSS Sabina Pérez Vicente Unidad de Calidad APES Hospital Costa del Sol sabina.perez.exts@juntadeandalucia.es Comparabilidad inicial de los grupos Se debe realizar

Más detalles

2.5. Asimetría y apuntamiento

2.5. Asimetría y apuntamiento 2.5. ASIMETRÍA Y APUNTAMIENTO 59 variable Z = X x S (2.9) de media z = 0 y desviación típica S Z = 1, que denominamos variable tipificada. Esta nueva variable carece de unidades y permite hacer comparables

Más detalles

Tema 3. 3. Correlación. Correlación. Introducción

Tema 3. 3. Correlación. Correlación. Introducción 3-1 Introducción Tema 3 Correlación Coeficiente de correlación lineal de Pearson Coeficiente de correlación poblacional Contraste paramétrico clásico Transformación de Fisher Correlación bayesiana Test

Más detalles

Problemas resueltos. Tema 12. 2º La hipótesis alternativa será que la distribución no es uniforme.

Problemas resueltos. Tema 12. 2º La hipótesis alternativa será que la distribución no es uniforme. Tema 12. Contrastes No Paramétricos. 1 Problemas resueltos. Tema 12 1.- En una partida de Rol se lanza 200 veces un dado de cuatro caras obteniéndose 60 veces el número 1, 45 veces el número 2, 38 veces

Más detalles

Técnicas Cuantitativas para el Management y los Negocios I

Técnicas Cuantitativas para el Management y los Negocios I Técnicas Cuantitativas para el Management y los Negocios I Licenciado en Administración Módulo II: ESTADÍSTICA INFERENCIAL Contenidos Módulo II Unidad 4. Probabilidad Conceptos básicos de probabilidad:

Más detalles

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN INTERVALO DE CONFIANZA PARA LA PROPORCIÓN Si deseamos estimar la proporción p con que una determinada característica se da en una población, a partir de la proporción p' observada en una muestra de tamaño

Más detalles

Pruebas de bondad de ajuste

Pruebas de bondad de ajuste Pruebas de bondad de ajuste Existen pruebas cuantitativas formales para determinar si el ajuste de una distribución paramétrica a un conjunto de datos es buena en algún sentido probabilístico. Objetivo:

Más detalles

Problemas resueltos. Temas 10 y 11 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.

Problemas resueltos. Temas 10 y 11 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15. Temas 10 y 11. Contrastes paramétricos de hipótesis. 1 Problemas resueltos. Temas 10 y 11 1- las puntuaciones en un test que mide la variable creatividad siguen, en la población general de adolescentes,

Más detalles

4. Medidas de tendencia central

4. Medidas de tendencia central 4. Medidas de tendencia central A veces es conveniente reducir la información obtenida a un solo valor o a un número pequeño de valores, las denominadas medidas de tendencia central. Sea X una variable

Más detalles

Tema 5: Principales Distribuciones de Probabilidad

Tema 5: Principales Distribuciones de Probabilidad Tema 5: Principales Distribuciones de Probabilidad Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 5: Principales Distribuciones de Probabilidad

Más detalles

PRUEBAS PARA DOS MUESTRAS RELACIONADAS

PRUEBAS PARA DOS MUESTRAS RELACIONADAS PRUEBAS PARA DOS MUESTRAS RELACIONADAS Estos contrastes permiten comprobar si hay diferencias entre las distribuciones de dos poblaciones a partir de dos muestras dependientes o relacionadas; es decir,

Más detalles

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág.

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág. ÍNDICE CAPITULO UNO Pág. Concepto de Estadística 1 Objetivo 1 Diferencia entre estadísticas y estadística 1 Uso de la estadística 1 Divisiones de la estadística 1 1. Estadística Descriptiva 1 2. Estadística

Más detalles

DISTRIBUCIONES DE PROBABILIDAD (RESUMEN)

DISTRIBUCIONES DE PROBABILIDAD (RESUMEN) DISTRIBUCIONES DE PROBABILIDAD (RESUMEN) VARIABLE ALEATORIA: un experimento produce observaciones numéricas que varían de muestra a muestra. Una VARIABLE ALEATORIA se define como una función con valores

Más detalles

Nivel socioeconómico medio. Nivel socioeconómico alto SI 8 15 28 51 NO 13 16 14 43 TOTAL 21 31 42 94

Nivel socioeconómico medio. Nivel socioeconómico alto SI 8 15 28 51 NO 13 16 14 43 TOTAL 21 31 42 94 6. La prueba de ji-cuadrado Del mismo modo que los estadísticos z, con su distribución normal y t, con su distribución t de Student, nos han servido para someter a prueba hipótesis que involucran a promedios

Más detalles

11. PRUEBAS NO PARAMÉTRICAS

11. PRUEBAS NO PARAMÉTRICAS . PRUEBAS NO PARAMÉTRICAS Edgar Acuña http://math.uprm/edu/~edgar UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ PRUEBAS NO PARAMÉTRICAS Se estudiarán las pruebas noparamétricas, las cuales

Más detalles

Tema II. Las muestras y la teoría paramétrica

Tema II. Las muestras y la teoría paramétrica 2.1. Muestras y muestreos: - La muestra:. Subconjunto de elementos de la población. Necesidad práctica:. Motivos económicos. Imposibilidad (práctica/teórica) de estudiar TODA la población. Inconveniencia

Más detalles

Estadística descriptiva. Representación de datos descriptivos

Estadística descriptiva. Representación de datos descriptivos 6 Estadística descriptiva. Representación de datos descriptivos Alberto Rodríguez Benot Rodolfo Crespo Montero 6.1. Introducción Tal como vimos en la introducción, la estadística descriptiva comprende

Más detalles

Unidad Temática 5 Estimación de parámetros: medias, varianzas y proporciones

Unidad Temática 5 Estimación de parámetros: medias, varianzas y proporciones Unidad Temática 5 Estimación de parámetros: medias, varianzas y proporciones Responda verdadero o falso. Coloque una letra V a la izquierda del número del ítem si acepta la afirmación enunciada, o una

Más detalles

Tema 1. Modelo de diseño de experimentos (un factor)

Tema 1. Modelo de diseño de experimentos (un factor) Tema 1. Modelo de diseño de experimentos (un factor) Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 1: Diseño de experimentos (un factor) 1 Introducción El objetivo del Análisis de la Varianza

Más detalles

Técnicas de validación estadística Bondad de ajuste

Técnicas de validación estadística Bondad de ajuste Técnicas de validación estadística Bondad de ajuste Georgina Flesia FaMAF 28 de mayo, 2013 Pruebas de bondad de ajuste Dado un conjunto de observaciones, de qué distribución provienen o cuál es la distribución

Más detalles

3. Análisis univariable y bivariable

3. Análisis univariable y bivariable FUOC P01/71039/00748 36 Investigación descriptiva: análisis de información 3. Análisis univariable y bivariable 3.1. Análisis univariable Como se ha visto, los métodos de análisis univariable se utilizan

Más detalles

Nociones de Estadística Descriptiva. Medidas de tendencia central y de variabilidad

Nociones de Estadística Descriptiva. Medidas de tendencia central y de variabilidad Nociones de Estadística Descriptiva. Medidas de tendencia central y de variabilidad Introducción a la estadística descriptiva La estadística descriptiva ayuda a describir las características de grupos

Más detalles

Análisis estadístico básico (I) Magdalena Cladera Munar mcladera@uib.es Departament d Economia Aplicada Universitat de les Illes Balears

Análisis estadístico básico (I) Magdalena Cladera Munar mcladera@uib.es Departament d Economia Aplicada Universitat de les Illes Balears Análisis estadístico básico (I) Magdalena Cladera Munar mcladera@uib.es Departament d Economia Aplicada Universitat de les Illes Balears CONTENIDOS Introducción a la inferencia estadística. Muestreo. Estimación

Más detalles

5 Relaciones entre variables.

5 Relaciones entre variables. ANÁLISIS EPLORATORIO DE DATOS 39 ANÁLISIS EPLORATORIO DE DATOS 40 Relaciones entre variables..1 Ejercicios. Ejercicio.1 En una muestra de 0 individuos se recogen datos sobre dos medidas antropométricas

Más detalles

Validación de los métodos microbiológicos HERRAMIENTAS ESTADISTICAS. Bqca. QM Alicia I. Cuesta, Consultora Internacional de la FAO

Validación de los métodos microbiológicos HERRAMIENTAS ESTADISTICAS. Bqca. QM Alicia I. Cuesta, Consultora Internacional de la FAO Validación de los métodos microbiológicos HERRAMIENTAS ESTADISTICAS Bqca. QM Alicia I. Cuesta, Consultora Internacional de la FAO Objetivos de la clase Objetivos de la estadística. Concepto y parámetros

Más detalles

Medidas de Dispersión

Medidas de Dispersión Medidas de Dispersión Revisamos la tarea de la clase pasada Distribución de Frecuencias de las distancias alcanzadas por las pelotas de golf nuevas: Dato Frecuencia 3.7 1 4.4 1 6.9 1 3.3 1 3.7 1 33.5 1

Más detalles

7. Distribución normal

7. Distribución normal 7. Distribución normal Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución normal, gaussiana o

Más detalles

Estadística. Estadística

Estadística. Estadística Definición de La trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta de las siguientes

Más detalles

SnapStat: Análisis de Una Muestra

SnapStat: Análisis de Una Muestra SnapStat: Análisis de Una Muestra Resumen La SnapStat Análisis de Una Muestra crea un resumen en una hoja de una sola columna de datos numéricos. Calcula estadísticas de resumen e intervalos de confianza,

Más detalles

TEMA 5 Inferencia no paramétrica. Guía docente:

TEMA 5 Inferencia no paramétrica. Guía docente: TEMA 5 Inferencia no paramétrica Guía docente: Pruebas estadísticas unidireccionales (una cola) y pruebas estadísticas bidireccionales (dos colas) Antes de continuar con el tema nos vamos a detener en

Más detalles

3. VARIABLES ALEATORIAS

3. VARIABLES ALEATORIAS . VARIABLES ALEATORIAS L as variables aleatorias se clasiican en discretas y continuas, dependiendo del número de valores que pueden asumir. Una variable aleatoria es discreta si sólo puede tomar una cantidad

Más detalles

TEMA II: DISTRIBUCIONES RELACIONADAS CON LA NORMAL

TEMA II: DISTRIBUCIONES RELACIONADAS CON LA NORMAL ESTADÍSTICA II TEMA II: DISTRIBUCIONES RELACIONADAS CON LA NORMAL II.1.- Distribución chi-cuadrado. II.1.1.- Definición. II.1..- Función de densidad. Representación gráfica. II.1.3.- Media y varianza.

Más detalles

Distribución muestral de proporciones. Algunas secciones han sido tomadas de: Apuntes de Estadística Inferencial Instituto Tecnológico de Chiuhuahua

Distribución muestral de proporciones. Algunas secciones han sido tomadas de: Apuntes de Estadística Inferencial Instituto Tecnológico de Chiuhuahua Distribución muestral de proporciones Algunas secciones han sido tomadas de: Apuntes de Estadística Inferencial Instituto Tecnológico de Chiuhuahua Distribución muestral de Proporciones Existen ocasiones

Más detalles

TRABAJO PRÁCTICO ESTADISTICA APLICADA (746)

TRABAJO PRÁCTICO ESTADISTICA APLICADA (746) UNIVERSIDAD NACIONAL ABIERTA VICERRECTORADO ACADEMICO AREA DE MATEMATICA TRABAJO PRÁCTICO ESTADISTICA APLICADA (746) JOSE GREGORIO SANCHEZ CASANOVA C.I. V-9223081 CARRERA: 610 SECCION Nº 1 SAN CRISTOBAL,

Más detalles

CONCEPTOS FUNDAMENTALES

CONCEPTOS FUNDAMENTALES TEMA 8: CONTRASTES DE HIPÓTESIS PARAMÉTRICAS PRIMERA PARTE: Conceptos fundamentales 8.1. Hipótesis estadística. Tipos de hipótesis 8.2. Región crítica y región de aceptación 8.3. Errores tipo I y tipo

Más detalles

DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL

DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL 3.1 INTRODUCCIÓN Como ya sabes, una distribución de probabilidad es un modelo matemático que nos ayuda a explicar los

Más detalles

Técnicas de validación estadística Bondad de ajuste

Técnicas de validación estadística Bondad de ajuste Técnicas de validación estadística Bondad de ajuste Georgina Flesia FaMAF 31 de mayo, 2011 Pruebas de bondad de ajuste Dado un conjunto de observaciones, de qué distribución provienen o cuál es la distribución

Más detalles

Tema 11: Intervalos de confianza.

Tema 11: Intervalos de confianza. Tema 11: Intervalos de confianza. Presentación y Objetivos. En este tema se trata la estimación de parámetros por intervalos de confianza. Consiste en aproximar el valor de un parámetro desconocido por

Más detalles

Test de Kolmogorov-Smirnov

Test de Kolmogorov-Smirnov Test de Kolmogorov-Smirnov Georgina Flesia FaMAF 2 de junio, 2011 Test de Kolmogorov-Smirnov El test chi-cuadrado en el caso continuo H 0 : Las v.a. Y 1, Y 2,..., Y n tienen distribución continua F. Particionar

Más detalles

LA DISTRIBUCIÓN NORMAL

LA DISTRIBUCIÓN NORMAL LA DISTRIBUCIÓN NORMAL En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad que con más frecuencia aparece

Más detalles

El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la variable.

El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la variable. TEMA 3: ESTADÍSTICA DESCRIPTIVA 3.1 Conceptos fundamentales Es el conjunto de procedimientos y técnicas empleadas para recolectar, organizar y analizar datos, los cuales sirven de base para tomar decisiones

Más detalles

MODELO DE RESPUESTAS Objetivos del 1 al 9

MODELO DE RESPUESTAS Objetivos del 1 al 9 PRUEBA INTEGRAL LAPSO 05-764 - /9 Universidad Nacional Abierta Probabilidad y Estadística I (Cód. 764) Vicerrectorado Académico Cód. Carrera: 6 Fecha: 0-04-06 MODELO DE RESPUESTAS Objetivos del al 9 OBJ

Más detalles

PROBABILIDAD Y ESTADÍSTICA. Sesión 5 (En esta sesión abracamos hasta tema 5.8)

PROBABILIDAD Y ESTADÍSTICA. Sesión 5 (En esta sesión abracamos hasta tema 5.8) PROBABILIDAD Y ESTADÍSTICA Sesión 5 (En esta sesión abracamos hasta tema 5.8) 5 DISTRIBUCIONES DE PROBABILIDAD CONTINUAS Y MUESTRALES 5.1 Distribución de probabilidades de una variable aleatoria continua

Más detalles

EJERCICIOS RESUELTOS TEMA 7

EJERCICIOS RESUELTOS TEMA 7 EJERCICIOS RESUELTOS TEMA 7 7.1. Seleccione la opción correcta: A) Hay toda una familia de distribuciones normales, cada una con su media y su desviación típica ; B) La media y la desviaciones típica de

Más detalles

Estadística Descriptiva. SESIÓN 12 Medidas de dispersión

Estadística Descriptiva. SESIÓN 12 Medidas de dispersión Estadística Descriptiva SESIÓN 12 Medidas de dispersión Contextualización de la sesión 12 En la sesión anterior se explicaron los temas relacionados con la desviación estándar, la cual es una medida para

Más detalles

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste Técnicas de Inferencia Estadística II Tema 3. Contrastes de bondad de ajuste M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2014/15 Contenidos 1. Introducción

Más detalles

Estadística II Tema 3. Comparación de dos poblaciones. Curso 2010/11

Estadística II Tema 3. Comparación de dos poblaciones. Curso 2010/11 Estadística II Tema 3. Comparación de dos poblaciones Curso 2010/11 Tema 3. Comparación de dos poblaciones Contenidos Comparación de dos poblaciones: ejemplos, datos apareados para la reducción de la variabilidad

Más detalles

Econometria. 4. Modelo de Regresión Lineal Simple: Inferencia. Prof. Ma. Isabel Santana

Econometria. 4. Modelo de Regresión Lineal Simple: Inferencia. Prof. Ma. Isabel Santana Econometria 4. Modelo de Regresión Lineal Simple: Inferencia Prof. Ma. Isabel Santana MRLS: Inferencia Hasta ahora nos hemos ocupado solamente de la estimación de los parámetros del modelo de regresión

Más detalles

web: http://www.uv.es/friasnav/

web: http://www.uv.es/friasnav/ LAS PRUEBAS PARAMÉTRICAS 1. Se conoce el modelo de distribución de la población objeto de estudio y se desconoce un número finito de parámetros de dicha distribución que hay que estimar con los datos de

Más detalles

Estadística Descriptiva

Estadística Descriptiva Estadística Descriptiva 1 Sesión No. 3 Nombre: Estadística descriptiva Contextualización Parte fundamental de la Estadística es la organización de los datos, una forma de realizar esta organización es

Más detalles

La distribución t de student. O lo que es lo mismo: La relación entre la cerveza y los estudios de estadística

La distribución t de student. O lo que es lo mismo: La relación entre la cerveza y los estudios de estadística La distribución t de student O lo que es lo mismo: La relación entre la cerveza y los estudios de estadística La distribución t de student fue descubierta por William S. Gosset en 1908. Gosset era un estadístico

Más detalles

Entre las múltiples formas de baremar un test, destacamos las siguientes: - Baremos cronológicos: Edad Mental y Cociente Intelectual.

Entre las múltiples formas de baremar un test, destacamos las siguientes: - Baremos cronológicos: Edad Mental y Cociente Intelectual. 104 TEMA V: BAREMACIÓN DE UN TEST 1.- INTRODUCCIÓN La puntuación directa de una persona en un test no es directamente interpretable si no la referimos a los contenidos incluidos en el test o al rendimiento

Más detalles

b) Haz otra distribución en 12 intervalos de la amplitud que creas conveniente.

b) Haz otra distribución en 12 intervalos de la amplitud que creas conveniente. Página EJERCICIOS Y PROBLEMAS PROPUESTOS PARA PRACTICAR Deseamos hacer una tabla con datos agrupados a partir de datos, cuyos valores extremos son 9 y. a) Si queremos que sean 0 intervalos de amplitud,

Más detalles

Estadística Inferencial 3.7. Prueba de hipótesis para la varianza. σ gl = n -1. Es decir: Ho: σ 2 15 Ha: σ 2 > 15 (prueba de una cola)

Estadística Inferencial 3.7. Prueba de hipótesis para la varianza. σ gl = n -1. Es decir: Ho: σ 2 15 Ha: σ 2 > 15 (prueba de una cola) UNIDAD III. PRUEBAS DE HIPÓTESIS 3.7 Prueba de hipótesis para la varianza La varianza como medida de dispersión es importante dado que nos ofrece una mejor visión de dispersión de datos. Por ejemplo: si

Más detalles

Estadística Inferencial. Sesión 5. Prueba de hipótesis

Estadística Inferencial. Sesión 5. Prueba de hipótesis Estadística Inferencial. Sesión 5. Prueba de hipótesis Contextualización. En la práctica, es frecuente tener que tomar decisiones acerca de poblaciones con base en información de muestreo. Tales decisiones

Más detalles

Práctica 1: Introducción a SPSS 1

Práctica 1: Introducción a SPSS 1 Estadística Aplicada Curso 2010/2011 Diplomatura en Nutrición Humana y Dietética Práctica 1: Introducción a SPSS 1 Este programa estadístico está organizado en dos bloques: el editor de datos y el visor

Más detalles

Y = ßo + ß1X + ε. La función de regresión lineal simple es expresado como:

Y = ßo + ß1X + ε. La función de regresión lineal simple es expresado como: 1 Regresión Lineal Simple Cuando la relación funcional entre las variables dependiente (Y) e independiente (X) es una línea recta, se tiene una regresión lineal simple, dada por la ecuación donde: Y =

Más detalles

Tema 3: Estadística Descriptiva

Tema 3: Estadística Descriptiva Tema 3: Estadística Descriptiva Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 3: Estadística Descriptiva Curso 2008-2009 1 / 27 Índice

Más detalles

1) Características del diseño en un estudio de casos y controles.

1) Características del diseño en un estudio de casos y controles. Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55-10536) Estudios de casos y controles CONCEPTOS CLAVE 1) Características del diseño en un estudio de casos y controles. )

Más detalles

bloques SC Suma de Cuadrados k trat bloques

bloques SC Suma de Cuadrados k trat bloques Análisis de un diseño en bloques aleatorios Cuando sólo hay dos tratamientos, el análisis de varianza de una vía equivale al test t de Student para muestras independientes. A su vez, el análisis de varianza

Más detalles

DISTRIBUCIONES DE PROBABILIDAD

DISTRIBUCIONES DE PROBABILIDAD DISTRIBUCIONES DE PROBABILIDAD Se llama variable aleatoria a toda función que asocia a cada elemento del espacio muestral E un número real. Una variable aleatoria discreta es aquella que sólo puede tomar

Más detalles

Diferencia de medias. Estadística II Equipo Docente: Iris Gallardo Andrés Antivilo Francisco Marro

Diferencia de medias. Estadística II Equipo Docente: Iris Gallardo Andrés Antivilo Francisco Marro Sesión 15 Prueba de Hipótesis para la Diferencia de medias En qué contexto es útil una prueba de hipótesis i para la diferencia i de medias? 1. Cuando se trabaja simultáneamente con una variable categórica

Más detalles

FUNDAMENTOS METODOLÓGICOS EN PSICOLOGÍA ANÁLISIS BÁSICOS CON SPSS

FUNDAMENTOS METODOLÓGICOS EN PSICOLOGÍA ANÁLISIS BÁSICOS CON SPSS UNIVERSIDAD DE SEVILLA FACULTAD DE PSICOLOGIA FUNDAMENTOS METODOLÓGICOS EN PSICOLOGÍA PROFESORES: Gutiérrez, Mayte Martínez, Rafael J. Moreno, Rafael ANÁLISIS BÁSICOS CON SPSS INDICE: Pág. 1. Estadísticos

Más detalles

Tamaño de muestra agropecuaria

Tamaño de muestra agropecuaria Pablo Tadeo Cruz * RESUMEN En este documento, se analizan condiciones de productividad y rentabilidad de los Sistemas de Producción Agropecuaria, dónde se aplica metodología de determinación de tamaño

Más detalles

P (X 5) = P (x = 5) + P (X = 6) + P (X = 7) + P (X = 8) = 0.005416467 + 0.051456432 + 0.79334918 + 0.663420431 = 0.999628249

P (X 5) = P (x = 5) + P (X = 6) + P (X = 7) + P (X = 8) = 0.005416467 + 0.051456432 + 0.79334918 + 0.663420431 = 0.999628249 Hoja 3: robabilidad y variables aleatorias 1. La probabilidad de que un enfermo se recupere tomando un nuevo fármaco es 0.95. Si se les administra a 8 enfermos, hallar: a La probabilidad de que se recuperen

Más detalles

Prueba de hipótesis. 1. Considerando lo anterior específica: a. La variable de estudio: b. La población: c. El parámetro. d. Estimador puntual:

Prueba de hipótesis. 1. Considerando lo anterior específica: a. La variable de estudio: b. La población: c. El parámetro. d. Estimador puntual: Prueba de hipótesis Problema Un grupo de profesores, de cierto estado de la república, plantea una investigación acerca del aprendizaje de las ciencias naturales en la escuela primaria. Uno de los objetivos

Más detalles

Estadística Inferencial. Sesión No. 8 Pruebas de hipótesis para varianza.

Estadística Inferencial. Sesión No. 8 Pruebas de hipótesis para varianza. Estadística Inferencial. Sesión No. 8 Pruebas de hipótesis para varianza. Contextualización. En las dos sesiones anteriores se vieron métodos de inferencia estadística para medias y proporciones poblacionales.

Más detalles

Tema 5. Muestreo y distribuciones muestrales

Tema 5. Muestreo y distribuciones muestrales Tema 5. Muestreo y distribuciones muestrales Contenidos Muestreo y muestras aleatorias simples La distribución de la media en el muestreo La distribución de la varianza muestral Lecturas recomendadas:

Más detalles

1º BACH CCSS - MATEMÁTICAS - PROBLEMAS DE ANÁLISIS ESTADÍSTICO DE UNA VARIABLE ˆ EJERCICIO 25

1º BACH CCSS - MATEMÁTICAS - PROBLEMAS DE ANÁLISIS ESTADÍSTICO DE UNA VARIABLE ˆ EJERCICIO 25 1º BACH CCSS - MATEMÁTICAS - PROBLEMAS DE ANÁLISIS ESTADÍSTICO DE UNA VARIABLE ˆ EJERCICIO 24 Dada la siguiente tabla de ingresos: Ingresos mensuales Frecuencia Menos de 1000 35 [1000, 1100) 70 [1100,

Más detalles

ESTADÍSTICA INFERENCIAL

ESTADÍSTICA INFERENCIAL ESTADÍSTICA INFERENCIAL ESTADÍSTICA INFERENCIAL 1 Sesión No. 9 Nombre: Pruebas de hipótesis referentes al valor de la media de la población Contextualización Los métodos estadísticos y las técnicas de

Más detalles

PRÁCTICA 1. Mediciones

PRÁCTICA 1. Mediciones PRÁCTICA 1 Mediciones Objetivo General El alumno determinará la incertidumbre de las mediciones. Objetivos particulares 1. El alumno determinará las incertidumbres a partir de los instrumentos de medición..

Más detalles

FUNCIONES CUADRÁTICAS. PARÁBOLAS

FUNCIONES CUADRÁTICAS. PARÁBOLAS FUNCIONES CUADRÁTICAS. PARÁBOLAS 1. FUNCIONES CUADRÁTICAS Representemos, en función de la longitud de la base (x), el área (y) de todos los rectángulos de perímetro 1 metros. De ellos, cuáles son las medidas

Más detalles

Dr. Abner A. Fonseca Livias

Dr. Abner A. Fonseca Livias UNIVERSIDAD NACIONAL HERMILIO VALDIZAN FACULTAD DE ENFERMERÍA Dr. Abner A. Fonseca Livias 3/21/2015 6:17 AM Dr. Abner Fonseca Livias 1 UNIVERSIDAD NACIONAL HERMILIO VALDIZAN ESCUELA DE POST GRADO Dr. Abner

Más detalles

6. ESTIMACIÓN DE PARÁMETROS

6. ESTIMACIÓN DE PARÁMETROS PROBABILIDAD Y ESTADÍSTICA Sesión 7 6. ESTIMACIÓN DE PARÁMETROS 6.1 Características el estimador 6. Estimación puntual 6..1 Métodos 6..1.1 Máxima verosimilitud 6..1. Momentos 6.3 Intervalo de confianza

Más detalles

Estadística II Examen Final - Enero 2012. Responda a los siguientes ejercicios en los cuadernillos de la Universidad.

Estadística II Examen Final - Enero 2012. Responda a los siguientes ejercicios en los cuadernillos de la Universidad. Estadística II Examen Final - Enero 2012 Responda a los siguientes ejercicios en los cuadernillos de la Universidad. No olvide poner su nombre y el número del grupo de clase en cada hoja. Indique claramente

Más detalles

TEMA 11. LA FIABILIDAD DE LOS TESTS

TEMA 11. LA FIABILIDAD DE LOS TESTS TEMA 11. LA FIABILIDAD DE LOS TESTS 11.1. Métodos empíricos para estimar el coeficiente de Fiabilidad 11.2. Factores que afectan al Coeficiente de Fiabilidad 11.3. Interpretación del Coeficiente de Fiabilidad

Más detalles

PROGRAMA COMPLETO DEL CURSO DE BIOESTADÍSTICA APLICADA A LAS CIENCIAS DE LA SALUD

PROGRAMA COMPLETO DEL CURSO DE BIOESTADÍSTICA APLICADA A LAS CIENCIAS DE LA SALUD PROGRAMA COMPLETO DEL CURSO DE BIOESTADÍSTICA APLICADA A LAS CIENCIAS DE LA SALUD 1.- Introducción a la bioestadística Introducción a la bioestadística como herramienta aplicada a las Ciencias de la Salud.

Más detalles

Distribución Normal Curva Normal distribución gaussiana

Distribución Normal Curva Normal distribución gaussiana Distribución Normal La distribución continua de probabilidad más importante en todo el campo de la estadística es la distribución normal. La distribución normal tiene grandes aplicaciones prácticas, en

Más detalles

Introducción a la estadística básica, el diseño de experimentos y la regresión

Introducción a la estadística básica, el diseño de experimentos y la regresión Introducción a la estadística básica, el diseño de experimentos y la regresión Objetivos José Gabriel Palomo Sánchez gabriel.palomo@upm.es E.U.A.T. U.P.M. Julio de 2011 Objetivo general Organizar el estudio

Más detalles

Estadística II Tema 2. Conceptos básicos en el contraste de. Curso 2010/11

Estadística II Tema 2. Conceptos básicos en el contraste de. Curso 2010/11 Estadística II Tema 2. Conceptos básicos en el contraste de hipótesis Curso 2010/11 Tema 2. Conceptos básicos en el contraste de hipótesis Contenidos Definición de contraste e hipótesis estadística. Hipótesis

Más detalles

Distribuciones bidimensionales. Regresión.

Distribuciones bidimensionales. Regresión. Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 5: Distribuciones bidimensionales. Regresión. Resumen teórico Resumen teórico de los principales conceptos estadísticos

Más detalles

Tema 2. Contraste de hipótesis en una población

Tema 2. Contraste de hipótesis en una población Tema 2. Contraste de hipótesis en una población Contenidos Introducción, las hipótesis nula y alternativa El procedimiento de contraste de hipótesis Errores de Tipo I y Tipo II, potencia del contraste

Más detalles

Medidas de asociación

Medidas de asociación 13 Medidas de asociación Irene Moral Peláez 13.1. Introducción Recurriremos a las medidas de asociación cuando queramos evaluar el grado de asociación entre dos variables y no únicamente comprobar analíticamente

Más detalles

Selectividad Junio 2007 JUNIO 2007

Selectividad Junio 2007 JUNIO 2007 Bloque A JUNIO 2007 1.- Julia, Clara y Miguel reparten hojas de propaganda. Clara reparte siempre el 20 % del total, Miguel reparte 100 hojas más que Julia. Entre Clara y Julia reparten 850 hojas. Plantea

Más detalles

Obtención de Datos. Obtención de Datos. Clasificaciones de estudios. Clasificaciones de estudios

Obtención de Datos. Obtención de Datos. Clasificaciones de estudios. Clasificaciones de estudios Obtención de Datos Obtención de Datos Muestreo y Objetivo Representar la población n lo mejor posible con el mínimo m coste. Condiciones para conseguirlo Procedimientos adecuados Tamaño o muestral suficiente

Más detalles

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios. ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS Ejemplos y ejercicios de Estadística Descriptiva yanálisis de Datos Diplomatura en Estadística Curso 007/08 Descripción estadística de una variable. Ejemplos

Más detalles

Distribuciones muestrales. Distribución muestral de Medias

Distribuciones muestrales. Distribución muestral de Medias Distribuciones muestrales. Distribución muestral de Medias Algunas secciones han sido modificadas de: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua TEORIA DEL MUESTREO

Más detalles

Tema 2: Estadísticos

Tema 2: Estadísticos Bioestadística Tema 2: Estadísticos Tema 2: Estadísticos 1 Parámetros y estadísticos Parámetro: Es una cantidad numérica calculada sobre una población La altura media de los individuos de un país La idea

Más detalles

Análisis de Capabilidad (Porcentaje Defectuoso)

Análisis de Capabilidad (Porcentaje Defectuoso) Análisis de Capabilidad (Porcentaje Defectuoso) STATGRAPHICS Rev. 9/4/2006 Este procedimiento esta diseñado para estimar el porcentaje de artículos defectuosos en una población basándose en muestra de

Más detalles

Julio Deride Silva. 27 de agosto de 2010

Julio Deride Silva. 27 de agosto de 2010 Estadística Descriptiva Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 27 de agosto de 2010 Tabla de Contenidos Estadística Descriptiva Julio Deride

Más detalles

ANÁLISIS ESTADÍSTICO. Estadística descriptivos: Tablas, gráficos, estadísticos descriptivos. Jorge Fallas jfallas56@gmail,com

ANÁLISIS ESTADÍSTICO. Estadística descriptivos: Tablas, gráficos, estadísticos descriptivos. Jorge Fallas jfallas56@gmail,com ANÁLISIS ESTADÍSTICO Estadística descriptivos: Tablas, gráficos, estadísticos descriptivos Jorge Fallas jfallas56@gmail,com 2010 1 Describiendo el set de datos Conocer contexto de los datos Variable, nivel

Más detalles

Determinación del tamaño muestral para calcular la significación del coeficiente de correlación lineal

Determinación del tamaño muestral para calcular la significación del coeficiente de correlación lineal Investigación: Determinación del tamaño muestral para calcular 1/5 Determinación del tamaño muestral para calcular la significación del coeficiente de correlación lineal Autores: Pértegas Día, S. spertega@canalejo.org,

Más detalles