Taller de análisis estadístico con R

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Taller de análisis estadístico con R"

Transcripción

1 Taller de análisis estadístico con R 4. Pruebas estadísticas Rodolfo Mora rmora@cenat.ac.cr Ricardo Román rroman@cenat.ac.cr Julio, 2016

2 Contenido 1 Pruebas de hipótesis Introducción Confianza Naturaleza de datos Poder estadístico 2 Comprobación de supuestos Pruebas de normalidad Transformación Homocedasticidad 3 Selección de prueba Tipo de prueba Prueba por tipo de pregunta 4 Pregunta tipo 1 T-Test Mann-Whitney-Wilcoxon Test One-way Anova 2 / 72

3 Pruebas de hipótesis 3 / 72

4 Pruebas de hipótesis Introducción Hace uso de información sobre la distribución de la población para determinar la respuesta a una pregunta. Pasos: 1 Desarrollar una pregunta de interés clara la cual va a guiar el análisis estadístico 2 Definir hipótesis 3 Determinar nivel de significancia 4 Elegir (y realizar) análisis estadístico 5 Tomar decisión 4 / 72

5 Pruebas de hipótesis Definición de la pregunta Para análisis estadístico la pregunta de investigación debe estar formulada en función al comportamiento de los datos. Principalmente las preguntas que giran en torno a explicar o describir el comportamiento de una variable en relación a otra(s). 5 / 72

6 Pruebas de hipótesis Definición de hipótesis La hipótesis es una respuesta potencial a la pregunta, por lo tanto está extremadamente ligada a la pregunta a realizar. Una vez planteada la hipótesis se determina la hipótesis nula (H 0 ), que siempre es la negación a la alternativa. Por ejemplo: Existe relación proporcional entre A y B? H 0 : No hay relación significativa. Alternativa: Sí hay una relación proporcional. Prueba: Correlación. Es A influenciada por el valor de B? H 0 : No hay diferencia significativa en el valor de B. Alternativa: Sí es clara la influencia de A en el valor de B Prueba: ANOVA. Están los valores de A dados en función de B? H 0 : No hay una función que determine A a partir de B. Alternativa: Sí existe una función de B que determina A. Prueba: Regresión. 6 / 72

7 Pruebas de hipótesis Nivel de significación Una vez definida H 0, se debe establecer un margen de error aceptable, este se establece con un porcentaje y es denotado por α. Si el margen de error aceptado es de 5 % entonces el valor de α debe ser Al ejecutar una prueba estadística, el resultado de la prueba, comúnmente representado por el valor-p (p-value) debe ser menor a α para rechazar H 0. El margen de confianza (1 α) se denomina nivel de significación. En el caso de α = 0,05, la significación es 95 %. El valor depende del área de estudio, tema, tipo de prueba, tipo de muestra, etc. En biociencias usualmente 5 % (0.05) mientras que en ingeniería puede ser << 1 % (0.01) 7 / 72

8 Pruebas de hipótesis Tipos de error H 0 Rechazada H 0 Aceptada H 0 Verdadera Error tipo I Falso Positivo Confianza = 1 β H 0 : Falsa Confianza = 1 α Error tipo II Falso Negativo Error de tipo I - Falsos positivos: Se representa por α, siendo 1 α el poder estadístico de la prueba. Denota la probabilidad de que la hipótesis nula haya sido rechazada, pero en realidad es verdadera. Es decir se asume que los datos cumplen propiedades que en realidad no cumplen. Error de tipo II - Falsos negativos: Se representa por β. Denota la probabilidad de que la hipótesis nula haya sudo aceptada, cuando en realidad es falsa. Es decir se asume que los datos no cumplen propiedades cuando sí las tienen. 8 / 72

9 Pruebas de hipótesis Tipos de error Un valor α de 0.05 significa dos cosas: Que existe un 5 % de probabilidad de que la hipótesis nula sea verdadera, a pesar de que haya sido rechazada. Que para un 5 % de los datos, el resultado positivo en realidad es falso. La significancia (1 α) indica qué tanto debe confiar el usuario en la prueba, de ahí que también se denomine la confianza, este parámetro se define de forma completamente arbitraria, ya que depende absolutamente de la aplicación. Por ejemplo es común que en pruebas médicas se acepte con más flexibilidad el error tipo I, mientras que se establece un umbral estrecho para el error tipo II. Es mejor decirle a un paciente que posiblemente tiene algo, cuando está sano, que decirle que no tiene nada, cuando en realidad está enfermo. 9 / 72

10 Pruebas de hipótesis Valor-p El p-value de una prueba estadística es el resultado obtenido al analizar los datos que indica si la hipótesis nula ha sido aprobada o rechazada. Si p > α = H 0 es aceptada. Esto significa que está demostrado que los datos NO cumplen la propiedad buscada, la hipótesis alternativa es descartada definitivamente. Si p < α = H 0 no puede ser aceptada. Esto significa que no es posible demostrar que los datos no cumplen la propiedad buscada, la hipótesis alternativa se asume como cierta, con una confianza de 1 α. Normalmente rechazar la hipótesis nula es suficiente para dar un resultado positivo al experimento, pero es importante recalcar que el resultado es una asunción, carente de certeza. Aún en el caso en que se acepta H 0, existe una probabilidad β de que H 0 sea falsa, así que este resultado tampoco tiene certeza absoluta. 10 / 72

11 Naturaleza de datos No paramétricos Datos no paramétricos No tienen parámetros estadísticos definidos: promedio, varianza, etc... Normalmente carecen de magnitud numérica No son necesariamente ordenados Etiquetas, binarios, ordinales Pueden ser números que no tengan una distribución de probabilidad específica 11 / 72

12 Naturaleza de datos Paramétricos Datos paramétricos Tienen una distribución de probabilidad definida, en la mayoría de los casos la distribución normal Tienen promedio y desviación estándar definida Obligatoriamente tienen magnitud numérica Son ordenables y comparables 12 / 72

13 Poder estadístico Definición Denota la probabilidad de encontrar resultados relevantes cuando estos existan (vital en diseño experimental). Hace posible determinar el tamaño de la muestra requerido para detectar un efecto de un tamaño determinado con un nivel de confianza dado. Si la probabilidad calculada es muy baja, sería necesario modificar o del todo abandonar el experimento. 13 / 72

14 Poder estadístico Cálculo Otra forma de definirlo, es la probabilidad de obtener resultados positivos cuando la hipótesis alternativa es verdadera, es decir 1 β. El cálculo del poder estadístico toma en consideración el tipo de prueba a realizar y 3 valores principalmente: 1 Tamaño de muestra 2 Efecto de tamaño 3 Nivel de significación (1 α) 14 / 72

15 Poder estadístico Introducción No existe un estándar definido para establecer el poder estadístico, al igual que la significancia, depende del área de estudio. Típicamente se define β = 4α, por lo tanto para un α = 0,05 (5 %), β = 0,2. Por lo tanto se establece que el poder estadístico P es de 80 % (0.8). 15 / 72

16 Comprobación de supuestos 16 / 72

17 Comprobación de supuestos Las pruebas paramétricas requieren que los datos cumplan ciertos supuestos. Que los datos sean paramétricos Que los datos tengan una distribución de probabilidad normal Que las varianzas sean homogéneas (Homocedasticidad) Analizar el tipo de dato es suficiente para determinar si son paramétricos, sin embargo para los otros dos puntos es necesario realizar pruebas. 17 / 72

18 Pruebas de normalidad Para verificar la normalidad de un conjunto de datos se puede: Visualizar los datos (histograma, QQ-Plot) Evaluar la simetría (skewness) y la curtosis (kurtosis) Aplicar una prueba formal 18 / 72

19 Pruebas de normalidad Visualización Para evaluar los datos visualmente es necesario generar un histograma o un gráfico Q-Q par(mfrow=c(1,2)) # Mostrar dos gráficos adyatences A <- rnorm(n = 30, mean = 30, sd = 20) # Generar datos ficticios hist(a) # Genera histograma de A qqnorm(a) # Genera plot de cuantiles de A qqline(a) # Genera línea datos ideales 19 / 72

20 Pruebas de normalidad Visualización Figura : Visualización inicial de datos 20 / 72

21 Pruebas de normalidad Simetría Simetría hace referencia a la distancia de la media al menor valor en proporción a la distancia de la media al valor mayor. Si el valor de la simetría se acerca a 0, indica que la distribución es simétrica, es decir ambos valores extremos están aproximadamente a la misma distancia de la media. Si el valor de la simetría es positivo (S > 0) indica que el valor menor está más cerca de la media que el valor mayor, inclinando la media hacia la izquierda. Si el valor de la simetría es negativo (S < 0) indica que el valor mayor está más cerca de la media que el valor menor, inclinando la media hacia la derecha. 21 / 72

22 Pruebas de normalidad Simetría Figura : Simetría en la distribución de los datos 22 / 72

23 Pruebas de normalidad Curtosis La curtosis indica qué tan pronunciada es la forma de campana en una distribución normal. Una curtosis muy alta denota una campana alargada y con las colas muy bajas - Leptocúrtica Un valor intermedio denota una campana ideal con la punta semicircular y la curva de las colas pronunciada - Mesocúrtica Una curtosis muy baja indica una campana chata y ancha con la curva de las colas poco pronunciada - Platycúrtica En una distribución normal ideal, la curtosis tiene un valor cercano a / 72

24 Pruebas de normalidad Curtosis Figura : Forma de la curva según el tipo de curtosis 24 / 72

25 Pruebas de normalidad Simetría y Curtosis El paquete moments de R tiene las funciones para calcular la simetría: skewness(), y la curtosis: kurtosis(). library("moments") A <- rbeta(500,5,5) curtosis <- kurtosis(a) simetria <- skewness(a) plot (density(a), main = "Normal", xlab = paste("curtosis ", round(curtosis, 2), "\n", "Simetría ", round(simetria,2))) 25 / 72

26 Pruebas de normalidad Simetría y Curtosis 26 / 72

27 Pruebas de normalidad Pruebas formales Existen varias pruebas estadísticas diseñadas para determinar la normalidad de los datos. En general, todas se basan en los siguientes enunciados: H 0 : Los datos vienen de una población con distribución normal H A : Los datos vienen de una población con distribución no normal 27 / 72

28 Pruebas de normalidad Pruebas formales Los más comunes son: 1 Anderson-Darling 2 Shapiro-Wilk 3 Lilliefors (Kolmogorov Smirnov) 28 / 72

29 Pruebas de normalidad Pruebas formales Shapiro-Wilk El más común de las pruebas de normalidad. Tiene más poder que variaciones del Kolgomorov-Smirnov. a <- rnorm(100, 40, 5) b <- runif(100, 50, 70) c <- rpois(100, 6) # Normal # Uniforme # Poisson shapiro.test(a) shapiro.test(b) shapiro.test(c) 29 / 72

30 Pruebas de normalidad Pruebas formales Si p > α se acepta H 0, por lo tanto los datos tienen distribución normal. Shapiro-Wilk normality test data: a W = , p-value = data: b W = 0.961, p-value = data: c W = , p-value = En el ejemplo, para una confianza del 95 % a (0.2710) Sí tiene distribución normal b (0.0002) No tiene distribución normal c (0.0009) No tiene distribución normal 30 / 72

31 Pruebas de normalidad Pruebas formales Lilliefors test y Anderson-Darling: Versión del test de Kolmogorov-Smirnov diseñada para distribuciones normales (Lilliefors). Ambos requieren la instalación del paquete nortest. # Empleando los mismos datos anteriores lillie.test(a); lillie.test(b); lillie.test(c) data: a > D = , p-value = data: b > D = , p-value = data: c > D = , p-value = ad.test(a); ad.test(b); ad.test(c) data: a > A = , p-value = data: b > A = , p-value = data: c > A = , p-value = Nótese que sólo los datos del set a cumplen con la distribución normal. 31 / 72

32 Pruebas de normalidad Pruebas formales Si se quiere ser formal, los Resultados de sólo una prueba no suelen ser concluyentes. Decisión debe basarse en combinación de visualización de los datos, la simetría, curtosis así como de tests formales de normalidad. 32 / 72

33 Transformación de datos Qué hacer si los datos no están normalmente distribuidos? Aplicar una transformación simple a los datos para alterar su distribución. 33 / 72

34 Transformación de datos Transformaciones logarítmicas Estas son las más comunes y se emplean principalmente cuando: Los datos están altamente sesgados El rango de los datos es muy amplio, incluso varía en órdenes de magnitud Existen outliers (datos extremos) No hay valores negativos 34 / 72

35 Transformación de datos Transformaciones logarítmicas 35 / 72

36 Transformación de datos Transformaciones logarítmicas Ejemplo de transformación logarítmica: library("moments") par(mfrow=c(1,2)) # Mostrar dos gráficos simultáneamente A <- rbeta(1000,1.5,500) # Generar datos en distribución beta A1 <- log(a) # Transformar datos # Graficar los resultados hist(a, xlab = paste("curtosis ", round(kurtosis(a),2), "\n", "Simetría ", round( skewness(a),2))) hist(a1, xlab = paste("curtosis ", round(kurtosis(a1),2), "\n", "Simetría ", round( skewness(a1),2)))c) 36 / 72

37 Transformación de datos Transformaciones exponenciales Incluyen todas aquellas elevadas a una potencia (pueden ser fracciones, negativa o positiva). La más común es la raíz cuadrada. 37 / 72

38 Transformación de datos Ejemplo de transformaciones exponenciales par(mfrow=c(1,2)) library("moments") A <- rnorm(100, 10, 4)^2 A1 <- A^(1/2) hist(a, xlab = paste("curtosis ", round(kurtosis(a),2), "\n", "Simetría ", round( skewness(a),2))) hist(a1, xlab = paste("curtosis ", round(kurtosis(a1),2), "\n", "Simetría ", round( skewness(a1),2))) 38 / 72

39 Homocedasticidad El último parámetro a evaluar para las pruebas paramétricas es el comportamiento de la varianza del error de un modelo. La homocedasticidad es una propiedad de los datos que se presenta cuando la varianza de un conjunto es igual a la varianza de cualquiera de sus subconjuntos. Es decir, la varianza es constante a través de todos los datos del conjunto. Las regresiones lineales suponen que los residuos del modelo presentan esta propiedad, por lo tanto es necesario evaluarla para establecer la confianza del modelo. Es posible evaluar la homocedasticidad visualmente, mejor dicho, es posible determinar si la relación entre dos variables presenta heterocedasticidad visualizando la distribución de los datos con un gráfico de dispersión. 39 / 72

40 Homocedasticidad Visualización 40 / 72

41 Homocedasticidad Prueba de Fisher Prueba de Fisher: Evalua homocedasticidad (homogeneidad de varianza) en las muestras. Asume que la proporción de las varianzas entre las dos muestras es 1 (H 0 varianzas son iguales) var.test(x, y) Donde x corresponde al primer set de datos y y el segundo. El resultado indica un intervalo de confianza, si el radio de varianzas cae dentro de este intervalo, se puede asumir que la relación entre las variables presenta homocesdasticidad, por lo que puede aplicarse pruebas de regresión lineal con alto nivel de confianza. 41 / 72

42 Homocedasticidad Ejemplo: x <- rnorm(50, mean = 0, sd = 2) y <- rnorm(30, mean = 1, sd = 1) var.test(x, y) F test to compare two variances data: x and y F = , num df = 49, denom df = 29, p-value = 8.885e-05 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: sample estimates: ratio of variances Según los datos, el F-value se encuentra dentro del intervalo de confianza por lo que la prueba es fiable. Se descarta la H 0 ya que p-value << a / 72

43 Selección de prueba 43 / 72

44 Selección de prueba Tipos de prueba Pruebas no paramétricas Para datos no paramétricos Tienen menos supuestos (no tienen) sobre los datos Más conservadoras (Menos probable que rechacen H 0 ) Mayor probabilidad de error tipo 1 si los datos son paramétricos Se usan cuando hay pocos datos, los datos no son confiables, no tienen distribución clara, etc... Pruebas paramétricas Estadísticamente más poderosas (resultados más precisos y más confiables) Tienen más supuestos sobre los datos (distribución, varianzas, etc...) Más probabilidad de producir error tipo 2, si los datos usados son no parámetricos Si los datos cumplen los supuestos de la prueba, se pueden establecer significancia y poder estadístico más altos (márgenes de error más bajos) 44 / 72

45 Selección de test Tipo de prueba A modo de resumen: Parámetro Tipo de datos Distribución asumida Asume varianzas constantes Asume muestras independientes paramétri- Pruebas cas Intervalos o proporcionales Pruebas no paramétricas Nominales, ordinales, otros No asumen forma No No Requieren conocimiento de distribución (usualmente normal) Usualmente Sí 45 / 72

46 Tipo de pregunta Todas las preguntas pueden clasificarse en varios tipos, típicamente van a ser estos dos: 1 Mis muestras difieren significativamente? 2 Existe alguna relación entre mis variables? 46 / 72

47 Pregunta tipo 1 47 / 72

48 Mis muestras difieren significativamente? 48 / 72

49 T-Test t-test Prueba empleada para comparar diferencias significativas entre dos muestras. Asume: Poblaciones normalmente distribuidas Selección de muestras aleatorias e independientes 49 / 72

50 T-Test Es una de las pruebas más comúnmente utilizadas ya que ofrece facilidades como: No es necesario que las muestras tengan varianzas iguales (existe la aproximación de Welch para este caso) No es necesario que las muestras tengan el mismo tamaño No hay un tamaño mínimo de la muestra (siempre que las suposiciones se mantengan) 50 / 72

51 T-Test Es posible desarrollar la prueba para datos pareados y no pareados. datos pareados: sobre el mismo individuo: efectos de una dieta en las mismas personas (antes y despues) datos no-pareados: sobre diferentes individuos: efectos de una dieta en un grupo control y un grupo de prueba Un t-test no pareada busca comparar muestras distintas mientras que una pareada se basa en mediciones distintas a una misma muestra. 51 / 72

52 T-Test Ejemplos de uso: Concentración de fosfatos en aguas de dos zonas es significativamente diferente (t-test no pareada) Crecimiento de plantas (gramos de biomasa) luego de 6 meses de tratamiento entre grupo control y con agroquímico (t-test no pareada) Peso de personas antes y después de una dieta (t-test pareada) Azúcar en sangre en personas diabéticas antes y después de un tratamiento (t-test pareada) 52 / 72

53 T-Test Ejemplo # Un arreglo de 10 entradas con distribución normal # Promedio 15, desviación estándar 1 A <- rnorm(10, 15, 1) # Un arreglo calculado a partir del primero B <- A * 10 # T Test de dos colas, no pareado, con varianzas iguales y confianza del 95 % t.test(a, B, alternative = "two.sided", paired = F, var.equal = T, conf.level = 0.95) Two Sample t-test data: A and B t = , df = 18, p-value < 2.2e / 72

54 T-Test Análisis T-Test no pareado de dos colas prueba si las muestras son significativamente distintas. El t indica la distancia que las poblaciones tienen, en la magnitud de la muestra. Entre más cercano este valor a 0, menos diferencia se detectó entre las poblaciones. El p-value, como ya se ha visto, indica si se puede rechazar la hipótesis nula, para esto tiene que ser menor al margen de error aceptable (α). El T-Test se puede probar con una sola cola, en R el valor del parámetro alternative se puede cambiar por "greater" o "g" para probar si la primera variable es más grande que la segunda. Así mismo puede cambiarse por "less" o "l" para probar si la primera variable es menor a la segunda. La versión pareada requiere que las poblaciones sean del mismo tamaño y que estén ordenadas, de forma que cada muestra del primer conjunto tenga un correspondiente en el segundo conjunto. 54 / 72

55 Mann-Whitney-Wilcoxon test y Wilcoxon Signed-Rank Alternativa no paramétrica al t-test no pareado (Mann-Whitney U-test) o pareado (Wilcoxon Signed-Rank). Las asunciones del test son simples: Datos son independientes Muestras corresponden a observaciones aleatorias de la población Observaciones en cada muestra son independientes (el resultado de una observación no altera el de otra medición en una misma muestra) 55 / 72

56 Mann-Whitney-Wilcoxon test y Wilcoxon Signed-Rank Se basa en comparar si los rangos de dos sets de datos difieren significativamente. Puede ser empleado para datos continuos u ordinales siempre y cuando puedan ser ordenados en rangos de menor a mayor. # Una variable aleatoria con distribución uniforme (no normal) C <- runif(10,1,10) # Una variable construida a partir de la variable anterior. D <- C*10 wilcox.test(c, D, paired = T, alternative = "two.sided") Wilcoxon signed rank test data: C and D V = 0, p-value = alternative hypothesis: true location shift is not equal to 0 56 / 72

57 One-way ANOVA Analiza si los valores de una variable (dependiente) están fuertemente influenciados por los valores de otra variable (independiente). Usualmente una variable clasificadora o de agrupación. La variable dependiente tiene que ser paramétrica, la variable independiente casi nunca lo es. Ejemplos: Evaluación del efecto de 4 distintos tipos de sustrato en el crecimiento de plantas de café. Evaluación del impacto de 5 distintos programas de ejercicio en el crecimiento de masa muscular. 57 / 72

58 One-way ANOVA B <- read.csv("baseballsqc.csv") # Archivo con estadísticas de baseball # Verificar si los promedios de bateo (BA) son diferentes por cada equipo (TEAM) fitb <- aov (BA TEAM, data = B) summary(fitb) Df Sum Sq Mean Sq F value Pr(>F) TEAM e-05 *** Residuals El p-value para la prueba está dado por Pr(>F) que en este caso tiene un valor de 4.19e-05, es decir se rechaza la hipótesis nula: se puede decir con mucha confianza que el promedio de bateo es claramente distinto por equipos, en al menos dos equipos. 58 / 72

59 One-way ANOVA El análisis de varianza (ANOVA) únicamente indica si existe afectación, no provee información más detallada acerca de qué forma tiene dicha afectación. Para describir la afectación se puede usar la prueba de Tukey la cual calcula la diferencia de impacto de cada valor en la variable independiente. TukeyHSD(fitB) Tukey multiple comparisons of means 95 % family-wise confidence level Fit: aov(formula = BA TEAM, data = B) $TEAM diff lwr upr BOS-BAL e-02 CHW-BAL e / 72

60 Multi-way ANOVA Si se cree que la variable dependiente está definida, no por una, sino por múltiples variables independientes interactuando juntas, se puede componer la prueba de ANOVA. fitb <- aov(ba TEAM * YEAR, B) summary(fitb) Df Sum Sq Mean Sq F value Pr(>F) TEAM e-05 *** YEAR TEAM:YEAR e-05 *** Residuals Nótese como YEAR (p = 0.718) no es suficiente para explicar la variable BA, pero TEAM:YEAR juntas (p = 1.51e-05) sí pueden explicarla, incluso mejor que TEAM por sí misma (p = 2.76e-05). 60 / 72

61 Kruskal-Wallis Alternativa no paramétrica a one-way ANOVA. Requiere que las distribuciones de las muestras sean similares así como sus varianzas (cercano a homocedasticidad). # La variable Home Runs (HR) no tiene distribución normal kruskal.test(hr TEAM, B) Kruskal-Wallis rank sum test data: HR by TEAM Kruskal-Wallis chi-squared = 36.08, df = 7, p-value = 7.002e-06 Esta prueba evalúa las medianas en lugar de los promedios (H 0 mediana en las muestras no es significativamente distinta). En caso de que las distribuciones sean distintas, existe una alternativa llamada Welch ANOVA. 61 / 72

62 Kruskal-Wallis Un análisis de los resultados puede realizarse empleando un análogo al Tuckey encontrado en el paquete pgirmess. kruskalmc(b$hr, B$TEAM) Multiple comparison test after Kruskal-Wallis p.value: 0.05 Comparisons obs.dif critical.dif difference BAL-BOS FALSE BAL-CHW FALSE... CHW-NYY TRUE... DET-MIN TRUE / 72

63 Pregunta tipo 2 63 / 72

64 Existe alguna relación entre mis variables? Algunos tests: Paramétricas Correlación de Pearson Regresión simple No paramétricas Chi-cuadrado Correlación de Spearman 64 / 72

65 Existe alguna relación entre mis variables? Fuente: Allison Horst 65 / 72

66 Correlación de Pearson Es una correlación paramétrica, indica si los datos son linealmente proporcionales. Se utiliza para determinar si dos variables están fuertemente relacionadas entre sí. Por ejemplo: El tamaño de la copa de un árbol es proporcional al ancho de su tronco? La estatura de un niño entre 1 y 15 es proporcional a su edad? La aceleración máxima de un automóvil es proporcional a su cilindraje? 66 / 72

67 Correlación de Pearson A <- rnorm(500,5,5) # Una variable aleatoria con distribución normal B <- A * 10 * runif(500,1,5) # Una variable nueva proporcional a la primera C <- rnorm(500,-100,100) # Otra variable con distribución normal cor(a,b) [1] cor(a,c) [1] Entre más cerca esté el resultado a 1, más fuerte es la correlación, en el ejemplo A y B tienen una correlación del 89.5 %. Mientras que A y C, que son ambas variables aleatorias distintas, tienen una correlación muy baja. Si el resultado es cercano a -1, la correlación es fuerte, pero las variables son inversamente proporcionales. 67 / 72

68 Correlación de Pearson Puede observarse como claramente A y B tienen una correlación muy alta, es decir sus valores se ajustan muy bien a una ĺınea de tendencia, tienen una relación lineal fuerte. Mientras que A y C no parecen ajustarse a su ĺınea de tendencia, su relación es muy débil. 68 / 72

69 Correlación de Spearman Muy similar a la correlación de Pearson, la de Spearman no asume que las variables sean paramétricas, de hecho no hace suposiciones respecto a la distribución de los datos. La correlación establece rangos de valores y compara si los rangos crecen o decrecen de forma proporcional en ambas variables. # Comparación del promedio de bateo (BA) con la cantidad de carreras (R) # Nótese que R es una variable NO PARAMÉTRICA # Usando Pearson cor(b$r, B$BA) [1] # Usando Spearman cor(b$r, B$BA, method = "spearman") [1] / 72

70 Regresión lineal Por medio de la regresión lineal se intenta modelar la relación entre una variable dependiente y una o más variables explicativas. Es la variable Y el resultado de una función de la variable X? y = f (x) = a + bx + ɛ El objetivo de la regresión lineal es determinar si la relación existe y encontrar los coeficientes a, b y ɛ f <- faithful # Datos de prueba Faithful disponibles en R m <- lm(eruptions waiting, data = f) # Cálculo de la regresión lineal c <- coefficients(eruption.lm) # Obtención de coeficientes a y b c (Intercept) waiting / 72

71 Regresión lineal Al igual que con las otras pruebas, la regresión lineal tiene un p-value que determina la confianza del ajuste. Adicionalmente provee información de los errores en el cálculo de coeficientes: summary(m) # Mostrar el resumen del modelo calculado Call: lm(formula = eruptions waiting, data = f)... Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <2e-16 *** waiting <2e-16 ***... p-value: < 2.2e / 72

72 Taller de análisis estadístico con R 4. Pruebas estadísticas Rodolfo Mora rmora@cenat.ac.cr Ricardo Román rroman@cenat.ac.cr Julio, 2016

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema

Más detalles

ANÁLISIS ESTADÍSTICO PRUEBA DE HIPOTESIS

ANÁLISIS ESTADÍSTICO PRUEBA DE HIPOTESIS ANÁLISIS ESTADÍSTICO PRUEBA DE HIPOTESIS Jorge Fallas jfallas56@gmail.com 2010 1 Temario Datos experimentales y distribuciones de referencia Una media poblacional Hipótesis nula, alternativa y nivel de

Más detalles

Análisis Estadísticos con R

Análisis Estadísticos con R Análisis Estadísticos con R Ibon Martínez http://fdesnedecor.wordpress.com/ µ ¹ ½ http://fdesnedecor.wordpress.com/, Agosto 2011 p. 1/22 Los datos Vamos a plantear una serie de análisis estadísticos con

Más detalles

Introducción a los contrastes de hipótesis. Límites de confianza y. de confianza y pruebas estadísticas

Introducción a los contrastes de hipótesis. Límites de confianza y. de confianza y pruebas estadísticas Introducción a los contrastes de hipótesis. Límites de confianza y pruebas estadísticas [0011] DEFAD. Métodos de contraste de hipótesis y diseño de experimentos 2017 18 1 Inferencia estadística 2 3 4 5

Más detalles

> t.test (datos_x, datos_y =NULL, alternative = "two.sided", mu = 0, paired =FALSE, var.equal = FALSE, conf.level= 0.95)

> t.test (datos_x, datos_y =NULL, alternative = two.sided, mu = 0, paired =FALSE, var.equal = FALSE, conf.level= 0.95) INTERVALOS DE CONFIANZA Y TEST DE HIPOTESIS CON R Estudiemos ahora la función en el lenguaje R, que nos ofrece tanto estimaciones puntuales y por intervalos de confianza como test de hipótesis, es: > t.test

Más detalles

Introducción a estadística

Introducción a estadística Introducción a estadística Diego Shalom Laboratorio 5 Abril 2016 Medición = Comparar Comparar a veces es fácil, pero no siempre. Estadística descriptiva: valor representativo y ancho de la distribución

Más detalles

Parte de las notas tomadas de: Prof. Edgar Acuña UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ

Parte de las notas tomadas de: Prof. Edgar Acuña  UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ Estadística stica No Paramétrica Parte de las notas tomadas de: Prof. Edgar Acuña http://math.uprm math.uprm/edu/~edgar UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ METODOS ESTADISTICOS

Más detalles

Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial

Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial Programa de Doctorado Formación en la Sociedad del Conocimiento Seminario de doctorado 13 y 14 de marzo de 2014 Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial Dra. Mª José

Más detalles

Relación entre tests de hipótesis bilaterales e intervalos de confianza

Relación entre tests de hipótesis bilaterales e intervalos de confianza Relación entre tests de hipótesis bilaterales e intervalos de confianza Introduciremos esta relación a través de un ejemplo. Sea X 1, X,..., X n una m.a. de una distribución N ( µ, σ ). Sabemos que, cuando

Más detalles

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO Varianzas poblacionales desconocidas y distintas Muestras grandes (n 30) Muestras pequeñas (n

Más detalles

Comparación de dos grupos independientes Solución no paramétrica. En capítulo 12: Métodos no paramétricos

Comparación de dos grupos independientes Solución no paramétrica. En capítulo 12: Métodos no paramétricos Comparación de dos grupos independientes Solución no paramétrica En capítulo 12: Métodos no paramétricos Los métodos que hemos visto hasta ahora, asumen como distribución muestral la distribución Normal,

Más detalles

Nota de los autores... vi

Nota de los autores... vi ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...

Más detalles

Facultad de Ciencias del Mar, Curso 2011/12 Estadística Convocatoria Extraordinaria de Diciembre. 7/12/11

Facultad de Ciencias del Mar, Curso 2011/12 Estadística Convocatoria Extraordinaria de Diciembre. 7/12/11 Facultad de Ciencias del Mar, Curso 2011/12 Estadística Convocatoria Extraordinaria de Diciembre. 7/12/11 1. Una empresa de acuicultura dispone de 8 jaulas flotantes para la cría de doradas. La producción

Más detalles

Ejemplo de Regresión Lineal Simple.

Ejemplo de Regresión Lineal Simple. Ejemplo de Regresión Lineal Simple. El archivo sargos.csv contiene datos morfométricos de una muestra de 200 sargos. Estos datos pueden leerse en R mediante la sintaxis: sargos=read.table(file="http://dl.dropbox.com/u/7610774/sargos.csv",

Más detalles

Taller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO. Juan León Jara Almonte GRADE

Taller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO. Juan León Jara Almonte GRADE Taller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO Juan León Jara Almonte GRADE Por qué hacer análisis descriptivo? Qué hacer con estos datos? ESTADISTICA DESCRIPTIVA

Más detalles

Análisis de la Varianza

Análisis de la Varianza Análisis de la Varianza El Análisis de la Varianza -ANOVA- es una herramienta del área de la inferencia estadística, utilizada en las investigaciones científico-técnicas. Objetivo: probar hipótesis referidas

Más detalles

Pruebas para evaluar diferencias

Pruebas para evaluar diferencias Pruebas para evaluar diferencias Métodos paramétricos vs no paramétricos Mayoría se basaban en el conocimiento de las distribuciones muestrales (t- student, Normal, F): EsFman los parámetros de las poblaciones

Más detalles

Facultad de Ciencias del Mar Examen de Junio. Curso 2010/11 3/6/11

Facultad de Ciencias del Mar Examen de Junio. Curso 2010/11 3/6/11 Facultad de Ciencias del Mar Estadística Examen de Junio. Curso 2010/11 3/6/11 Los misidáceos constituyen un componente importante en la biomasa del zooplancton de estuarios y regiones costeras Jerling

Más detalles

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO Varianzas poblacionales desconocidas y distintas Muestras grandes (n 30) Muestras pequeñas (n

Más detalles

Ajuste de Regresión Lineal Simple

Ajuste de Regresión Lineal Simple Ajuste de Regresión Lineal Simple Hugo Alberto Brango García 1 1 Universidad de Córdoba Estadística II Mayo de 2014 Análisis de Regresión Mayo de 2014 1 / 33 Supuestos sobre los residuales del modelo Normalidad

Más detalles

Convocatoria Ordinaria de Junio, Curso 2011/12 8/6/2012

Convocatoria Ordinaria de Junio, Curso 2011/12 8/6/2012 Grado en Ciencias del Mar Estadística Convocatoria Ordinaria de Junio, Curso 2011/12 8/6/2012 Entre los años 1999 y 2004 se llevaron a cabo diversas campañas para el estudio del anidamiento y éxito reproductivo

Más detalles

ESTADISTICA AVANZADA. Análisis de la Variancia Anova One Way Kruskal-Wallis Bloques (Friedman)

ESTADISTICA AVANZADA. Análisis de la Variancia Anova One Way Kruskal-Wallis Bloques (Friedman) ESTADISTICA AVANZADA Análisis de la Variancia Anova One Way Kruskal-Wallis Bloques (Friedman) Factor Análisis de la Variancia El análisis de varianza One Way es una generalización de la Prueba t para mas

Más detalles

Estadística I Solución Examen Final- 19 de junio de Nombre y Apellido:... Grupo:...

Estadística I Solución Examen Final- 19 de junio de Nombre y Apellido:... Grupo:... Estadística I Examen Final- 19 de junio de 2009 Nombre y Apellido:... Grupo:... (1) La siguiente tabla muestra las distribuciones de frecuencias absolutas de la variable altura (en metros) de n = 500 estudiantes

Más detalles

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Contrastes de hipótesis paramétricos para una y varias muestras: contrastes sobre la media, varianza y una proporción. Contrastes sobre la diferencia

Más detalles

GEOESTADÍSTICA APLICADA

GEOESTADÍSTICA APLICADA UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO GEOESTADÍSTICA APLICADA Tema: Análisis Exploratorio de Datos Instructores: Dr. Martín A. Díaz Viera (mdiazv@imp.mx) Dr. Ricardo Casar González (rcasar@imp.mx) 2009

Más detalles

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B Área de Estadística e Investigación Operativa Licesio J. Rodríguez-Aragón Abril 2010 Contenidos...............................................................

Más detalles

Comparación de dos Muestras - SnapStat

Comparación de dos Muestras - SnapStat Comparación de dos Muestras - SnapStat Resumen La Comparación de Dos Muestras usando SnapStat crea un resumen de una página que compara dos muestras independientes de datos de variables. Calcula estadísticos

Más detalles

Tema 5 - III: Inferencia sobre dos poblaciones: proporciones, varianzas, medias

Tema 5 - III: Inferencia sobre dos poblaciones: proporciones, varianzas, medias Tema 5 - III: Inferencia sobre dos poblaciones: proporciones, varianzas, medias Biología y Biología sanitaria - UAH Marcos Marvá Ruiz Para dos poblaciones Se presentan conjuntamente intervalos y contrastes

Más detalles

peso edad grasas Regresión lineal simple Los datos

peso edad grasas Regresión lineal simple Los datos Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

Objetivo: Que el alumno conozca y aprenda a usar algunos de los métodos no paramétricos mas importantes.

Objetivo: Que el alumno conozca y aprenda a usar algunos de los métodos no paramétricos mas importantes. DEPARTAMENTO DE CIENCIAS BASICAS AREA DE ESTADISTICA DISEÑO DE EXPERIMENTOS PRACTICA DE-3 ESTADISTICA NO PARAMETRICA Objetivo: Que el alumno conozca y aprenda a usar algunos de los métodos no paramétricos

Más detalles

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por

Más detalles

Tema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos

Tema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos 7-1 Tema 7 Contrastes de Hipótesis para una Muestra Introducción Metodología del contraste de hipótesis Métodos no paramétricos Test binomial Test de los signos Test de rango con signos de Wilcoxon Test

Más detalles

2. ESTADÍSTICA DESCRIPTIVA 15 Estadística descriptiva.. Variables aleatorias Descripción de variables cuantitativas

2. ESTADÍSTICA DESCRIPTIVA 15 Estadística descriptiva.. Variables aleatorias Descripción de variables cuantitativas " INDICE PRÓLOGO... XXIII PREFACIO GUÍA DE LECTURA XXV XXIX 1. INTRODUCCIÓN A LA ESTADÍSTICA 1 1.1. Estadística 1 1.2. Historia 3 1.3. Población y muestra 4 1.4. Estadística aplicada 7 1.5. Aplicaciones

Más detalles

INDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres

INDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres INDICE Capitulo uno Introducción y estadísticas descriptiva 1.1. Introducción 1.2. descripción grafica de los datos 3 1.3. medidas numéricas descriptivas 11 Ejercicios 22 Apéndice: sumatorias y otras notaciones

Más detalles

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS ÍNDICE Introducción: Entrene su cerebro para la estadística... 1 La población y la muestra... 3 Estadísticas descriptivas e inferenciales... 4 Alcanzar el objetivo de estadísticas inferenciales: los pasos

Más detalles

Práctica 3: Regresión simple con R

Práctica 3: Regresión simple con R Estadística II Curso 2010/2011 Licenciatura en Matemáticas Práctica 3: Regresión simple con R 1. El fichero de datos Vamos a trabajar con el fichero salinity que se encuentra en el paquete boot. Para cargar

Más detalles

ESTADÍSTICA APLICADA A LA MEDICINA LABORAL

ESTADÍSTICA APLICADA A LA MEDICINA LABORAL ESTADÍSTICA APLICADA A LA MEDICINA LABORAL ---oo--- II Curso 29/ Pedro Femia Marzo Bioestadística - Facultad de Medicina http://www.ugr.es/local/bioest Un esquema general de comparación de medias 2 Asumible

Más detalles

BIOSESTADÍSTICA AMIGABLE

BIOSESTADÍSTICA AMIGABLE BIOSESTADÍSTICA AMIGABLE EJEMPLO: Ficha solicitud Colección Reserva UNIVERSIDAD AUSTRAL DE CHILE SISTEMA DE BIBLIOTECAS Clasificación: 574.015195 MAR 2001 Vol. y/o Copia: Apellido Autor: Título: C. 1 (SEGÚN

Más detalles

TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS

TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS 9.1. Análisis Descriptivo de la Información 9.2. La Tabulación Cruzada 9.3. Contraste de Hipótesis 9.1. Análisis Descriptivo

Más detalles

Grupo 4: BUENAS PRÁCTICAS ESTADÍSTICAS

Grupo 4: BUENAS PRÁCTICAS ESTADÍSTICAS Red ibérica de evaluación de eficacia y efectos secundarios de tratamientos para el control de plagas en el olivar (RIESPO) 2ª Reunión, Madrid 10-11/06/2010 Grupo 4: BUENAS PRÁCTICAS ESTADÍSTICAS ESTADÍSTICA

Más detalles

Estadísticas Pueden ser

Estadísticas Pueden ser Principios Básicos Para iniciar en el curso de Diseño de experimentos, es necesario tener algunos conceptos claros en la parte de probabilidad y estadística. A continuación se presentan los conceptos más

Más detalles

IIC 3633 - Sistemas Recomendadores

IIC 3633 - Sistemas Recomendadores Tests Estadísticos para Comparar Recomendaciones IIC 3633 - Sistemas Recomendadores Denis Parra Profesor Asistente, DCC, PUC CHile Page 1 of 11 TOC En esta clase 1. Significancia Estadistica de los Resultados

Más detalles

Ejemplo resistencias (primera parte)

Ejemplo resistencias (primera parte) Ejemplo resistencias (primera parte) Un proveedor de materiales de enseñanza entrega un conjunto de resistencias eléctricas y afirma que las resistencias de sus productos, medidos en Ohm, se distribuyen

Más detalles

Información general. Fundamentos de Análisis de datos. Obligatoria básica o de fundamentación X. Obligatoria profesional

Información general. Fundamentos de Análisis de datos. Obligatoria básica o de fundamentación X. Obligatoria profesional Guía de asignatura Formato institucional Rev. Abril 2013 Información general Asignatura Fundamentos de Análisis de datos Código Tipo de asignatura Obligatoria X Electiva Tipo de saber Número de créditos

Más detalles

Transformaciones de Potencia

Transformaciones de Potencia Transformaciones de Potencia Resumen El procedimiento Transformaciones de Potencia está diseñado para definir una transformación normalizadora para una columna de observaciones numéricas que no provienen

Más detalles

Asignatura: Metodologías de investigación. Tema 6. Exploración de datos. Exploración de datos

Asignatura: Metodologías de investigación. Tema 6. Exploración de datos. Exploración de datos Asignatura: Metodologías de investigación Tema 6 Etapas de una investigación Análisis : tests estadísticos, ajuste de curvas, análisis multivariante Obtención datos, calibrados, etc. Diseño del experimento

Más detalles

Introducción a la Estadística Aplicada en la Química

Introducción a la Estadística Aplicada en la Química Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00

Más detalles

Pruebas estadís,cas para evaluar relaciones

Pruebas estadís,cas para evaluar relaciones Pruebas estadís,cas para evaluar relaciones Asociación entre dos variables categóricas Hipótesis: frecuencias de ocurrencias en las categorías de una variable son independientes de los frecuencias en la

Más detalles

Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis

Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis VDC Prof. Mª JOSÉ PRIETO CASTELLÓ MÉTODOS ESTADÍSTICOS. TÉCNICAS ESTADÍSTICA DESCRIPTIVA TEORÍA DE LA PROBABILIDAD

Más detalles

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10 Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores

Más detalles

Pero qué hacemos cuando no se cumple la normalidad o tenemos muy pocos datos?

Pero qué hacemos cuando no se cumple la normalidad o tenemos muy pocos datos? Capítulo : Métodos no paramétricos Los métodos presentados en los capítulos anteriores, se basaban en el conocimiento de las distribuciones muestrales de las diferencias de porcentajes o promedios, cuando

Más detalles

Inferencia estadística. Hipótesis estadística Errores! y " BC. Nathalia Navarro Trevisan

Inferencia estadística. Hipótesis estadística Errores! y  BC. Nathalia Navarro Trevisan Inferencia estadística Hipótesis estadística Errores! y " BC. Nathalia Navarro Trevisan ESTADISTICA INFERENCIAL Permite obtener información de la población a través de una muestra Generalización de resultados

Más detalles

Conceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste.

Conceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste. Conceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste. Tema 1 (III) Estadística 2 Curso 08/09 Tema 1 (III) (Estadística 2) Contrastes de bondad de

Más detalles

Ejemplo de análisis de la Varianza (ANOVA).

Ejemplo de análisis de la Varianza (ANOVA). Ejemplo de análisis de la Varianza (ANOVA). temp TVBN temp TVBN temp TVBN 1 18,3 2 11,7 3 16,64 1 15,92 2 12,87 3 17,83 1 18,71 2 11,77 3 19,01 1 17,92 2 12,23 3 17,33 1 15,66 2 13,62 3 17,06 1 17,14 2

Más detalles

Dr. Abner A. Fonseca Livias

Dr. Abner A. Fonseca Livias UNIVERSIDAD NACIONAL HERMILIO VALDIZAN FACULTAD DE ENFERMERÍA Dr. Abner A. Fonseca Livias 3/21/2015 6:17 AM Dr. Abner Fonseca Livias 1 UNIVERSIDAD NACIONAL HERMILIO VALDIZAN ESCUELA DE POST GRADO Dr. Abner

Más detalles

13A. RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS PRUEBAS ESTADÍSTICAS DE CONFORMIDAD

13A. RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS PRUEBAS ESTADÍSTICAS DE CONFORMIDAD 13A. RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS PRUEBAS ESTADÍSTICAS DE CONFORMIDAD RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS Las pruebas estadísticas para analizar la relación entre dos variables cuantitativas,

Más detalles

Estadística I Examen Final - 19 de junio de Nombre:... Grupo:...

Estadística I Examen Final - 19 de junio de Nombre:... Grupo:... Estadística I Examen Final - 19 de junio de 2009 Nombre:... Grupo:... Realizar los cálculos intermedios con 4 decimales y redondear el resultado final a 2 decimales. 1. La siguiente tabla muestra las distribuciones

Más detalles

Estadística Convocatoria de Junio Facultad de Ciencias del Mar. Curso 2009/10 28/06/10

Estadística Convocatoria de Junio Facultad de Ciencias del Mar. Curso 2009/10 28/06/10 1. El Indice Climático Turístico (ICT), definido por Mieczkowski en 1985 es un índice que toma valores en una escala de 0 a 100 y tiene como objetivo valorar la calidad que ofrece el clima de una región

Más detalles

3 ANALISIS DESCRIPTIVO DE LOS DATOS

3 ANALISIS DESCRIPTIVO DE LOS DATOS 3 ANALISIS DESCRIPTIVO DE LOS DATOS 3.1 La tabulación de los datos 3.1.1 Tabla de distribución de frecuencias. 3.1.2 El histograma. 3.2 Medidas de tendencia central 3.2.1 La media. 3.2.2 La mediana. 3.2.3

Más detalles

Distribuciones de Probabilidad Continuas

Distribuciones de Probabilidad Continuas Distribuciones de Probabilidad Continuas En el caso de variables aleatorias continuas, las funciones densidad de probabilidad más comunes y de uso más frecuente en inferencia estadística son: 1. Función

Más detalles

Recordando las medidas de tendencia central, de dispersión y de la forma

Recordando las medidas de tendencia central, de dispersión y de la forma Recordando las medidas de tendencia central, de dispersión y de la forma Autor: M. en G. Alberto Porras Velázquez Introducción Una de las principales tareas de la estadística radica en la descripción de

Más detalles

Práctica 5 Prueba de Hipótesis

Práctica 5 Prueba de Hipótesis 05/08/08 1 Práctica 5 Prueba de Hipótesis PROGRAMA: SPSS ARCHIVOS: Equinos.sav; Temp.xls, Cabras.xls, Car_boer.xls, Malinois.xls. Conocimientos previos: Conocer y utilizar la distribución normal estándar,

Más detalles

Diseño de experimentos - prueba de hipótesis.

Diseño de experimentos - prueba de hipótesis. Diseño de experimentos - prueba de hipótesis http://www.academia.utp.ac.pa/humberto-alvarez/diseno-deexperimentos-y-regresion Inferencia estadística Conjunto de métodos y técnicas que permiten inducir,

Más detalles

7. De acuerdo con la gráfica siguiente, el contraste estadístico es:

7. De acuerdo con la gráfica siguiente, el contraste estadístico es: 1. Un investigador desea saber si los hombres y las mujeres difieren en flexibilidad cognitiva. Para ello, analiza los datos y obtienen los siguientes resultados. Satisfacen los datos el supuesto de homocedasticidad?

Más detalles

UAP PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS

UAP PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS Estas pruebas no se basan en ninguna suposición en cuanto a la distribución de probabilidad a partir de la que fueron obtenidos los datos. Son muy útiles cuando no

Más detalles

Estadística I Solución Examen Final - 28 Mayo de 2009

Estadística I Solución Examen Final - 28 Mayo de 2009 Estadística I Examen Final - 28 Mayo de 2009 (1 (10 puntos A 16 estudiantes de Filosofía se les preguntó cuántas clases de esta asignatura habían perdido durante el cuatrimestre. Las respuestas obtenidas

Más detalles

Ejemplo de análisis de la Varianza (ANOVA).

Ejemplo de análisis de la Varianza (ANOVA). Ejemplo de análisis de la Varianza (ANOVA). temp TVBN 1 18,3 1 15,92 1 18,71 1 17,92 1 15,66 1 17,14 1 15,21 1 19,92 1 17,61 1 13,43 2 11,7 2 12,87 2 11,77 2 12,23 2 13,62 2 13,24 2 14,02 2 13,66 2 12,27

Más detalles

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS FASES EN EL ANÁLISIS DE LOS DATOS DE UNA INVESTIGACIÓN SELECCIÓN HIPÓTESIS DE INVESTIGACIÓN Modelo de Análisis Técnica de Análisis

Más detalles

478 Índice alfabético

478 Índice alfabético Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión

Más detalles

Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto

Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre 2011-1 Profesor: Jaime Soto PRUEBA DE HIPÓTESIS Ejemplo El jefe de la Biblioteca de la URBE manifiesta

Más detalles

Teorema Central del Límite (1)

Teorema Central del Límite (1) Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico

Más detalles

MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN. a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico.

MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN. a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico. MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN 1. Conteste las preguntas siguientes: a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico. 1. 2. 3. 4. b. En

Más detalles

ÍNDICE. Prefacio... xi

ÍNDICE. Prefacio... xi ÍNDICE Prefacio... xi Capítulo 1 Introducción... 1 1.1 Por qué hay que tomar este curso y quién utiliza la estadística?... 2 1.2 Historia... 3 1.3 Subdivisiones de la estadística... 4 1.4 Un enfoque simple

Más detalles

Intervalos de confianza con STATGRAPHICS

Intervalos de confianza con STATGRAPHICS Intervalos de confianza con STATGRAPHICS Ficheros empleados: TiempoaccesoWeb.sf3 ; TiempoBucle.sf3; 1. Ejemplo 1: Tiempo de acceso a una página Web Se desean construir intervalos de confianza para la media

Más detalles

CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN

CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN Antonio Morillas A. Morillas: C. no paramétricos (II) 1 1. Contrastes de aleatoriedad. Contraste de rachas. 2. Contrastes de localización 2.1 Contraste

Más detalles

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables

Más detalles

Análisis de dos muestras

Análisis de dos muestras Análisis de dos muestras Supongamos el siguiente ejemplo. La resistencia a la rotura de un componente eléctrico constituye una característica importante de un cierto proceso. Un fabricante utiliza un material

Más detalles

Análisis computacional Inferencia Estadística: intervalos de confianza y contrastes de hipótesis

Análisis computacional Inferencia Estadística: intervalos de confianza y contrastes de hipótesis Análisis computacional Inferencia Estadística: intervalos de confianza y contrastes de hipótesis omán Salmerón Gómez 29 de abril de 2014 Inferencia Estimación (computacional) mediante intervalos de confianza

Más detalles

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.

Más detalles

Curso. Análisis Estadístico de Datos Climáticos

Curso. Análisis Estadístico de Datos Climáticos Curso I-1 Análisis Estadístico de Datos Climáticos TEMA: Pruebas de Hipótesis Mario Bidegain (FC) Alvaro Diaz (FI) Universidad de la República Montevideo, Uruguay 2011 I-2 PRUEBAS DE HIPÓTESIS Objetivo:

Más detalles

Estadística I Examen Final - 28 Mayo de 2009 Tiempo: 2.5h - Total: 40 puntos. Nombre:... Grupo:...

Estadística I Examen Final - 28 Mayo de 2009 Tiempo: 2.5h - Total: 40 puntos. Nombre:... Grupo:... Estadística I Examen Final - 28 Mayo de 2009 Tiempo: 2.5h - Total: 40 puntos Nombre:... Grupo:... Realizar los cálculos intermedios con 4 decimales y redondear el resultado final a 2 decimales. 1. (10

Más detalles

Longitud = Calcular la media, la mediana, la moda y la desviación estándar de la muestra en Matlab.

Longitud = Calcular la media, la mediana, la moda y la desviación estándar de la muestra en Matlab. LABORATORIO 1 LABORATORIO INFORMÁTICO Un fabricante de hormigón preparado tiene su proceso de producción bajo control. Está interesado en conocer cuál es la distribución de los valores de la resistencia

Más detalles

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de

Más detalles

ANOVA. Análisis de regresión y modelo lineal

ANOVA. Análisis de regresión y modelo lineal . Análisis de regresión y modelo lineal [0011] DEFAD. Métodos de contraste de hipótesis y diseño de experimentos 2014 15. Análisis de regresión y modelo lineal 1 Comparaciones múltiples 2 3. Análisis de

Más detalles

Inferencia estadística: Prueba de Hipótesis. Jhon Jairo Padilla A., PhD.

Inferencia estadística: Prueba de Hipótesis. Jhon Jairo Padilla A., PhD. Inferencia estadística: Prueba de Hipótesis Jhon Jairo Padilla A., PhD. Justificación Es una etapa de análisis de datos de un experimento comparativo: Se compara un parámetro de una v.a. con un valor dado.

Más detalles

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA DIRECCIÓN GENERAL DE ASUNTOS ACADÉMICOS PROGRAMA DE ASIGNATURA POR COMPETENCIAS I. DATOS DE IDENTIFICACIÓN 1. Unidad Académica: Facultad de Ingeniería. Mexicali.

Más detalles

ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS

ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS 3datos 2011 Variables CUANTITATIVAS Números con unidad de medida (con un instrumento, o procedimiento, de medición formal) Ej.: Tasa cardiaca;

Más detalles

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74 Índice 1. Introducción al R 15 1.1. Introducción............................. 15 1.2. El editor de objetos R....................... 18 1.3. Datos en R............................. 19 1.3.1. Vectores...........................

Más detalles

Manual de bolsillo del MegaStat * * MegaStat es un complemento estadístico para el Excel elaborado por el profesor J. B. Orris de Butler University.

Manual de bolsillo del MegaStat * * MegaStat es un complemento estadístico para el Excel elaborado por el profesor J. B. Orris de Butler University. Manual de bolsillo del MegaStat * * MegaStat es un complemento estadístico para el Excel elaborado por el profesor J. B. Orris de Butler University. Estadísticas con MegaStat AgeCat Gender Seconds 1 2

Más detalles

Modelación estadística: La regresión lineal simple

Modelación estadística: La regresión lineal simple Modelación estadística: La regresión lineal simple Gabriel Cavada Ch. 1 1 División de Bioestadística, Escuela de Salud Pública, Universidad de Chile. Statistical modeling: Simple linear regression Cuando

Más detalles

Ejemplo de Regresión Lineal Simple

Ejemplo de Regresión Lineal Simple Ejemplo de Regresión Lineal Simple Países Porcentaje de Inmunización (x) Tasa de mortalidad (y) Bolivia 77 8 Brazil 69 65 Cambodia 3 84 Canada 85 8 China 94 43 Czech_Republic 99 Egypt 89 55 Ethiopia 3

Más detalles

estadística aplicada a la gastronomía

estadística aplicada a la gastronomía estadística aplicada a la gastronomía CONTENIDO 4 6 14 18 30 objetivos unidad 1 unidad 2 unidad 3 unidad 4 OBJETIVOS GENERALES Ser capaz de reflexionar de forma crítica sobre los datos que se le presenten

Más detalles

IIC Sistemas Recomendadores

IIC Sistemas Recomendadores Tests Estadísticos para Comparar Recomendaciones IIC 3633 - Sistemas Recomendadores Denis Parra Profesor Asistente, DCC, PUC CHile Page 1 of 20 TOC En esta clase 1. Significancia Estadistica de los Resultados

Más detalles

9.- Análisis estadísticos con R Commander

9.- Análisis estadísticos con R Commander Tipos de datos - Cuantitativos: se expresan numéricamente. - Discretos: Toman valores numéricos aislados - Continuos: Toman cualquier valor dentro de unos límites dados - Categóricos o Cualitativos: No

Más detalles

Tema 8. Contrastes no paramétricos. 8.1 Introducción

Tema 8. Contrastes no paramétricos. 8.1 Introducción Índice 8 8.1 8.1 Introducción.......................................... 8.1 8.2 Bondad de ajuste....................................... 8.2 8.2.1 Test de Kolmogorov-Smirnov de bondad de ajuste................

Más detalles

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz Análisis de datos y gestión n veterinaria Tema 1 Estadística descriptiva Prof. Dr. José Manuel Perea Muñoz Departamento de Producción Animal Facultad de Veterinaria Universidad de Córdoba Córdoba, de Septiembre

Más detalles

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows. TEMA 9 DESCRIPTIVOS El submenú Estadísticos descriptivos está en el menú Analizar, y ofrece una serie de opciones para analizar datos de una forma sencilla. En este capítulo serán descritos estos procedimientos.

Más detalles

Supuestos y comparaciones múltiples

Supuestos y comparaciones múltiples Supuestos y comparaciones múltiples Diseño de Experimentos Pruebas estadísticas Pruebas de bondad de ajuste Prueba de hipótesis para probar si un conjunto de datos se puede asumir bajo una distribución

Más detalles