Comparación de Varias Muestras
|
|
|
- María Luisa Reyes Soler
- hace 9 años
- Vistas:
Transcripción
1 Comparación de Varias Muestras Resumen El procedimiento de Comparación de Varias Muestras está diseñado para comparar dos o más muestras independientes de datos variables. Se hacen pruebas para determinar si hay o no diferencias significativas entre las medias, varianzas y/o medianas de las poblaciones de las que se tomaron las muestras. Además, se pueden desplegar los datos gráficamente de varias maneras, incluyendo una gráfica de dispersión múltiple, una gráfica ANOM y una gráfica de medias. Los resultados de este procedimiento son idénticos al los del procedimiento ANOVA de una vía. StatFolio Muestra: multiple samples.sgp Datos de Muestra: El archivo pulse rates.sf6 contiene los resultados de un experimento reportado por Milliken y Johnson (1992) en el que 78 trabaadores fueron asignados en seis grupos al azar. A cada grupo se le dio una tarea a realizar y se midieron las tasas de pulsación luego de que cada individuo trabaó por una hora en su tarea asignada. Luego de que varios individuos abandonaron el estudio, los datos finales fueron: Task 1 (Tarea 1) Task 2 (Tarea 2) Task 3 (Tarea 3) Task 4 (Tarea 4) Task 5 (Tarea 5) Task 6 (Tarea 6) Las n = 68 mediciones finales han sido arregladas en q = 6 columnas, una para cada grupo de suetos. Alternativamente, los datos pudieron ser arreglados en una tabla con las tasas de pulsación en una sola columna unto con una columna identificando qué tarea se le dio al sueto. Una porción de tal archivo se muestra abao: 2006 por StatPoint, Inc. Comparación de Varias Muestras - 1
2 Subect (Sueto) Pulse Rate (Tasa de Pulsación) Task (Tarea) Cualquier estructura de datos puede ser analizada por el procedimiento Análisis Multimuestral. Si los mismos datos se usarán en otros procedimientos tales como el procedimiento de Modelos Lineales Generales, estos deben ser estructurados de la segunda manera. Como parte de la opción Guardar Resultados en este procedimiento, puede tomar un conunto de datos que esté estructurado en el formato de múltiples columnas y rearreglarlo como columnas de datos cifrados. Datos de Entrada Cuando el procedimiento Comparación de Datos Múltiples se selecciona en el menú principal, el primer cuadro de diálogo desplegado le pide especificar el formato en el que los datos serán ingresados: 2006 por StatPoint, Inc. Comparación de Varias Muestras - 2
3 Múltiples Columnas de Datos: indica que cada muestra se ha colocado en una columna separada. Columnas de Códigos y Datos: indica que todas las observaciones se han colocado en una sola columna, con una segunda columna indicando a qué muestra pertenece cada observación. Estadísticos Muestrales: indica que las observaciones originales no están disponibles. Sin embargo, los tamaños de muestra, las medias muestrales, y las desviaciones estándar muestrales se han colocado en 3 columnas de la hoa de datos. En este caso, algunas opciones no estarán disponibles. Múltiples Columnas de Datos Si los datos se han colocado en columnas separadas para cada muestra, se deben ingresar los nombres de las columnas en el siguiente cuadro de diálogo. Muestras: dos o más columnas numéricas que contienen las observaciones, una columna para cada muestra por StatPoint, Inc. Comparación de Varias Muestras - 3
4 Seleccionar: subconunto a seleccionar. Columnas Datos y Código Si los datos de todas las muestras se han colocado en una sola columna, entonces ingrese el nombre de esa columna y de la columna que contiene los identificadores de grupo. Datos: columna numérica que contiene observaciones de todas las muestras. Códigos de Nivel: columnas numéricas o no numéricas que contienen un identificador para la muestra correspondiente a cada dato. Seleccionar: subconunto a seleccionar. Estadísticos de Muestra Si las observaciones originales no están disponibles, pero se conocen la media y la desviación estándar de cada muestra, ingrese los estadísticos muestrales en la hoa de datos en columnas separadas. Tarea Tamaño Media Desviación Estándar Luego complete el segundo cuadro de diálogo como se muestra a continuación por StatPoint, Inc. Comparación de Varias Muestras - 4
5 Medias muestrales: columna numérica que contiene las medias de cada muestra. Desviaciones estándar muestrales: columna numérica que contiene las desviaciones estándar de cada muestra. Tamaños de muestra: columna numérica que contiene los tamaños de cada muestra. Etiquetas de la muestra: columna opcional que contiene etiquetas para cada muestra. Seleccionar: subconunto a seleccionar. Resumen del Análisis El Resumen del Análisis muestra el número de observaciones en cada muestra. Comparación de Varias Muestras Muestra 1: tarea 1 Muestra 2: tarea 2 Muestra 3: tarea 3 Muestra 4: tarea 4 Muestra 5: tarea 5 Muestra 6: tarea 6 Muestra 1: 13 valores en el rango de 26.0 a 39.0 Muestra 2: 12 valores en el rango de 24.0 a 40.0 Muestra 3: 10 valores en el rango de 30.0 a 44.0 Muestra 4: 10 valores en el rango de 28.0 a 47.0 Muestra 5: 12 valores en el rango de 20.0 a 41.0 Muestra 6: 11 valores en el rango de 21.0 a 37.0 También se despliegan los valores más alto y más bao por StatPoint, Inc. Comparación de Varias Muestras - 5
6 Gráfico de Dispersión El panel Gráfico de Dispersión grafica datos de cada grupo. STATGRAPHICS Rev. 4/d/yyyy Dispersión según Muestra respuesta Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 Si hay muchos valores comunes, tal vez deseé añadir una pequeña cantidad despacio horizontal a la gráfica, presionando el botón Separar de la barra de herramientas de análisis. Esto fia cada punto al azar en dirección horizontal de tal modo que valores idénticos no se encimen: 2006 por StatPoint, Inc. Comparación de Varias Muestras - 6
7 Dispersión según Muestra respuesta Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 La gráfica de arriba parece sugerir que las tasas de pulsación son de alguna manera más altas en aquellos que realizaron las tareas 3 y 4. Nota: Agregar espacio a la gráfica de dispersión no tiene efecto en ningún cálculo. Estadísticos de Resumen El panel Estadísticos de Resumen calcula diferentes estadísticos que son usados comúnmente para resumir una muestra de datos variables: Resumen Estadístico Recuento Promedio Desviación Estándar Coeficiente de Variación Mínimo Máximo Rango Tarea % Tarea % Tarea % Tarea % Tarea % Tarea % Total % La mayoría de los estadísticos pertenecen a una de las siguientes categorías: 1. medidas de tendencia central estadísticos que caracterizan el centro de los datos. 2. medidas de dispersión estadísticos que miden la dispersión de los datos por StatPoint, Inc. Comparación de Varias Muestras - 7
8 3. medidas de forma estadísticos que miden la forma de los datos con respecto a una distribución normal. Los estadísticos incluidos por defecto en la tabla son controlados por las opciones del panel Estadísticos del cuadro de diálogo Preferencias. Con este procedimiento, la selección puede cambiarse usando el Panel de Opciones. Para una descripción detallada de cada estadístico, vea la documentación Análisis de una Variable. Son de interés particular: 1. Medias muestrales Y : la tasa de pulsación promedio de suetos de cada una de las 6 tareas. 2. Desviaciones estándar muestrales s : las desviaciones estándar de cada grupo. 3. Simetrías y kurtosis estandarizadas: Estos estadísticos deben estar entre 2 y +2 si los datos vienen de distribuciones normales. Para las tasas de pulsación, la tasa promedio fue más alta para el grupo 4, así como la desviación estándar. Todos los estadísticos de simetría y de kurtosis están en el rango esperado para datos que vienen de distribuciones normales. Panel de Opciones Seleccione los estadísticos deseados. Gráfico de Caa y Bigotes Este panel despliega una gráfica de caa y bigotes para cada muestra por StatPoint, Inc. Comparación de Varias Muestras - 8
9 Gráfico Caa y Bigotes Task 1 Task 2 Task 3 Task 4 Task 5 Task respuesta Las gráficas de caa y bigotes se construyen de la siguiente manera: Se dibua una caa que va del cuartil inferior de la muestra hasta el cuartil superior. Este es el intervalo cubierto por 50% de los datos cuando se ordenan de menor a mayor. Se dibua una línea vertical en la mediana (valor medio). Si se requiere, se coloca un signo de más en el lugar de la media muestral. Se dibuan bigotes desde los bordes de la caa hasta los valores más pequeño y más alto, a menos que haya valores inusualmente leos de la caa (los que Tukey llama aberrantes). Los puntos exteriores, que son puntos abao o arriba de la caa más de 1.5 veces el rango intercuartil, se indican con símbolos de punto. Cualquier punto que esté abao o arriba de la caa más de tres veces el rango intercuartil se llama aberrante leano, y se indican por símbolos de punto con signos de suma superimpuestos encima de ellos. Si hay puntos exteriores, los bigotes se dibuan hacia los valores más grande y más pequeño que no sean puntos exteriores. En los datos muestrales, la variabilidad parece ser similar en cada muestra, aunque las locaciones muestran algunas diferencias. No hay puntos exteriores. Panel de Opciones 2006 por StatPoint, Inc. Comparación de Varias Muestras - 9
10 Dirección: la orientación de la gráfica, correspondiente a la dirección de los bigotes. Muesca sobre la Mediana: Si se selecciona, se agrega un corte a la gráfica mostrando el error de estimación asociado a cada mediana. Los cortes se escalan de tal forma que, para muestras de igual tamaño, si no se traslapan, las dos medianas son significativamente diferentes en el nivel de confianza por defecto del sistema (establecido en la pestaña General del cuadro de diálogo Preferencias en el menú Edición). Mostrar aberrantes: si se selecciona, indica la ubicación de los aberrantes. Mostrar Media: si se selecciona, muestra la ubicación de la media muestral así como la mediana. Eemplo Gráfica de caa y bigotes cortada. La siguiente gráfica agrega grietas de mediana a un nivel de confianza del 95% Gráfico Caa y Bigotes respuesta Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 Cada corte cubre el intervalo. z 1.25( IQR ) 1 ± α / n 2 ~ 2 x (1) 2006 por StatPoint, Inc. Comparación de Varias Muestras - 10
11 donde x~ es la mediana de la -ésima muestra, IQR es el rango intercuartil de muestra, n es el tamaño de muestra, y z α/2 es el valor crítico superior (α/2)% de una distribución normal estándar. En aquellos casos en los que el tamaño de muestra es pequeño, el corte puede extenderse más allá de la caa, resultando una apariencia de doblado. Como las muestras varían en tamaño, la regla de traslape no funcionará a la perfección. Sin embargo, los cortes para las tareas 4 y 6 no se traslapan, lo que típicamente indicaría una diferencia significativa entre esas dos medianas a un nivel de significancia del 5% por StatPoint, Inc. Comparación de Varias Muestras - 11
12 Tabla ANOVA Para determinar si las medias de los q grupos son significativamente diferentes entre sí o no, puede realizarse un análisis de varianza de una vía. Los resultados se despliegan en la tabla ANOVA: Tabla ANOVA Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Entre grupos Intra grupos Total (Corr.) La tabla divide la variabilidad total de las n mediciones en dos componentes: 1. Un componente intragrupal, que mide la variabilidad entre tasas de pulsación de individuos a los que se les asignó la misma tarea. 2. Un componente intergrupal, que mide la variabilidad entre tasas de pulsación de individuos con diferentes tareas. El F-radio es de particular importancia, el cual prueba la hipótesis de que la respuesta media para todas las muestras es la misma. Formalmente, prueba la hipótesis nula H 0 : μ 1 = μ 2 =... = μ q contra la hipótesis alternativa H A : no todos los μ iguales Si F es suficientemente grande, la hipótesis nula se rechaza La importancia estadística del F-radio se uzga más fácilmente por su P-valor. Si el P-valor es menor que 0.05, la hipótesis nula de medias iguales se rechaza a un nivel de significancia del 5%, como en este eemplo. Esto no implica que cada media sea significativamente diferente que las otras. Simplemente implica que no todas las medias son la misma. Determinar cuáles medias son significativamente diferentes de cuáles otras requiere pruebas adicionales, como se discute abao por StatPoint, Inc. Comparación de Varias Muestras - 12
13 ANOVA Gráfico El ANOVA Gráfico, desarrollado por Hunter (2005), es una técnica para desplegar gráficamente la importancia de las diferencias entre las muestras. Es una gráfica de los efectos escalados, donde el efecto es igual a la diferencia entre una media muestral y la gran media estimada. Cada efecto es multiplicado por un factor escalador. ν n R ν n T i (2) donde ν R es los grados de libertad residuales, ν T es los grados de libertad entre las diferencias grupales, n i es igual al número de observaciones en el i-ésimo nivel del grupo, y n es el número promedio de observaciones en todos los grupos. Esto escala los efectos de tal manera que la varianza natural de los puntos en el diagrama es comparable a la de los residuales, los cuales se despliegan en la parte baa de la gráfica. La gráfica para los datos de muestra se muestra abao: ANOVA Gráfico para Task 1 Task 6 Task 2 Task 5 Task 1 Grupos Task 3 Task 4 P = Residuos Al lado derecho del display está el P-valor para las diferencias dentro del grupo, tomado de la tabla ANOVA. Comparando la variabilidad entre los efectos en la gráfica de arriba con la de los residuales, es fácil ver que las diferencias son de una mayor magnitud que las que podrían explicarse solamente por el error experimental. Dependiendo de la localización relativa de los efectos, podría también ser posible en algunos casos identificar visualmente cuáles muestras son significativamente diferentes de cuáles otras, lo cual es hecho formalmente por las Pruebas de Rangos Múltiples descritas abao por StatPoint, Inc. Comparación de Varias Muestras - 13
14 Pruebas de Rangos Múltiples Para determinar cuáles medias son significativamente diferentes de cuáles otras, pueden realizarse Pruebas de Rangos Múltiples: Pruebas de Rangos Múltiples Método: 95.0 porcentae LSD Casos Media Grupos Homogéneos Tarea X Tarea X Tarea XX Tarea XX Tarea XX Tarea X Contraste Sig. Diferencia +/- Límites Tarea 1 - Tarea Tarea 1 - Tarea Tarea 1 - Tarea 4 * Tarea 1 - Tarea Tarea 1 - Tarea Tarea 2 - Tarea Tarea 2 - Tarea 4 * Tarea 2 - Tarea Tarea 2 - Tarea Tarea 3 - Tarea Tarea 3 - Tarea 5 * Tarea 3 - Tarea 6 * Tarea 4 - Tarea 5 * Tarea 4 - Tarea 6 * Tarea 5 - Tarea diferencia significativa. * indica una La mitad de arriba de la tabla muestra cada una de las medias muestrales estimadas en un orden de magnitud creciente. Muestra: Casos el número de observaciones n. Media la media muestral estimada Y por StatPoint, Inc. Comparación de Varias Muestras - 14
15 Grupos Homogéneos una ilustración gráfica de cuáles medias son significativamente diferentes de cuáles otras, basada en los contrastes desplegados en la segunda mitad de la tabla. Cada columna de X s indica un grupo de medias en las que no hay diferencias significativas estadísticamente. Por eemplo, la primera columna de la tabla de arriba contiene X para las tareas 1, 2, 5, y 6, indicando que no hay diferencias significativas entre esas cuatro medias. Asimismo, las tareas 1, 2 y 3 no muestran diferencias significativas, como tampoco lo hacen las tareas 3 y 4. Cualesquiera dos tareas que no tengan una X en la misma columna son significativamente diferentes entre sí, tal como las tareas 4 y 6. Diferencia la diferencia entre las dos medias muestrales. $Δ Y Y = (3) Limites - un intervalo estimado de la diferencia, usando el procedimiento de comparaciones múltiples seleccionado recientemente. 1 1 ± + n n (4) $Δ M MS 1 2 within 1 2 donde M es una constante que depende del procedimiento seleccionado. Sig. Se pone un asterisco unto a cualquier diferencia que sea estadísticamente significativamente diferente de 0 al nivel de significancia seleccionado, i.e., cualquier intervalo que no contenga al 0. Para los datos de tasa de pulsación, Tarea 4 tiene una tasa de pulsación media significativamente mayor que cualquier tarea excepto Tarea 3. Además, Tarea 3 es significativamente mayor que Tareas 5 y 6. Panel de Opciones Método: el método usado para hacer comparaciones múltiples por StatPoint, Inc. Comparación de Varias Muestras - 15
16 Nivel de Confianza: el nivel de confianza usado para la comparación múltiple seleccionada. Los métodos disponibles son: LSD - forma un intervalo de confianza para cada par de medias al nivel de confianza seleccionado usando: M = t / 2, n q α (5) donde t representa el valor de la distribución t de Student con n - q grados de libertad deando un área de α/2 en la cola superior de la curva. Este procedimiento se debe a Fisher y es llamado el procedimiento de la Diferencia Menos Significativa, ya que la magnitud de los límites indica la diferencia más pequeña entre cualesquiera dos medias que puedan ser declaradas para representar una diferencia estadísticamente significativa. Esto sólo debe usarse cuando la F-prueba en la tabla ANOVA indique diferencias significativas entre las medias muestrales. La probabilidad de hacer un error Tipo I α aplica a cada par de medias de manera separada. Si se hace más de una comparación, la probabilidad total de llamar al menos a un par de medias significativamente diferentes cuando no lo son puede ser considerablemente mayor que α. Tukey HSD ensancha los intervalos para permitir comparaciones múltiples entre todos los pares de medias, usando M = T α/2,q,n-q (6) que usa la t de Tukey en vez de la t de Student. La t de Tukey es igual a ( 1/ 2) veces el rango de la distribución Studentizada, que es tabulada en algunos libros como en Neter et al. (1996). Tukey llamó a su procedimiento el de Diferencia Honestamente Significativa ya que controla la tasa de error experimental a α. Si todas las medias son iguales, la probabilidad de declarar a cualquiera de los pares como significativamente diferentes en todo el experimento es igual a α. El procedimiento de Tukey es más conservador que el procedimiento LSD de Fisher, pues hace más difícil declarar cualquier par particular de medias como significativamente diferentes. Scheffe diseñado para permitir la estimación de todos los posibles contrastes entre las medias muestrales (no solo en comparaciones por pares). Usa una múltiple relacionada con la distribución F. M ( q ) F, q 1 n q =, 1 α (7) En esta instancia, es probable que el procedimiento sea muy conservador, pues sólo se están estimando pares. Bonferroni diseñado para permitir la estimación de cualquier número preseleccionado de contrastes. En este caso, usa una múltiple igual a 2006 por StatPoint, Inc. Comparación de Varias Muestras - 16
17 M = t /( q( q 1)), n q STATGRAPHICS Rev. 4/d/yyyy α (8) pues q(q-1)/2 se están estimando diferencias por pares. Estos límites son usualmente más anchos que los de Tukey cuando se hacen todas las comparaciones por pares. Student-Newman-Keuls A diferencia de los métodos previos, éste no crea intervalos para las diferencias por pares. En vez de eso, ordena las medias en orden creciente y luego comienza a separarlas en grupos de acuerdo a valores del rango distribución Studentizada. Eventualmente, las medias se separan en grupos homogéneos en los que no hay diferencias significativas. Duncan similar al procedimiento Student-Newman-Keuls, excepto que usa un valor crítico distinto al rango de la distribución Studentizada al definir los grupos homogéneos. Una discusión detallada de los procedimientos de Duncan y de Student-Newman-Keuls la dan Milliken y Johnson (1992). La elección entre un procedimiento LCD y uno de múltiples comparaciones como el HSD de Tukey debe depender del costo relativo de hacer un error Tipo I (llamar diferentes a un par de medias que realmente no lo son) contra el costo de hacer un error Tipo II (no llamar diferentes a un par de medias que sí lo sean). En las primeras etapas de una investigación, tal vez uno no quiera ser tan conservador como cuando ya se han hecho las verificaciones finales. Tabla de Medias Esta tabla despliega cada media muestral unto a un intervalo de incertidumbre: Tabla de Medias con intervalos de confianza del 95.0% Error Est. Casos Media (s agrupada) Límite Inferior Límite Superior Tarea Tarea Tarea Tarea Tarea Tarea Total El tipo de intervalo desplegado depende del Panel de Opciones. Panel de Opciones 2006 por StatPoint, Inc. Comparación de Varias Muestras - 17
18 Intervalos: el método usado para construir los intervalos. Nivel de Confianza: el nivel de confianza asociado a cada intervalo. Los tipos de intervalos que pueden seleccionarse son: Ninguno no se despliega ningún intervalo. Errores Estándar (S agrupada) despliega los errores estándar usando la desviación estándar intramuestral acumulada: MS within Y ± n (9) Errores Estándar (S individual) - despliega los errores estándar usando la desviación estándar de cada muestra separadamente: Y ± s 2 n (10) Intervalos de Confianza (S agrupada) despliega intervalos de confianza para el grupo Medias usando la desviación estándar intramuestral acumulada: Y MS within tα n (11) ± / 2, n q Intervalos de Confianza (S individual) - despliega intervalos de confianza para el grupo Medias usando la desviación estándar de cada grupo separadamente: 2006 por StatPoint, Inc. Comparación de Varias Muestras - 18
19 Y 2 s ± t α / 2, n 1 (12) n Intervalos LSD - diseñados para comparar cualquier para de medias con el nivel de confianza establecido. Los intervalos están dados por: Y M ± 2 2 MS n within (13) donde M se define como en las Pruebas de Rango Múltiple. Esta fórmula también aplica para las tres selecciones de abao. Intervalos Tukey HSD - diseñados para comparar todos los pares de medias. El intervalo de confianza establecido aplica para toda la familia de comparaciones por pares: Intervalos Scheffe - diseñados para comparar todos los contrastes. No son muy relevantes aquí. Intervalos Bonferroni - diseñados para comparar un número seleccionado de contrastes. Los intervalos de Tukey son usualmente más austados. Gráfica de Medias Las medias muestrales pueden ser graficadas unto a los intervalos de incertidumbre: 41 Medias y 95.0% de Fisher LSD 38 Media Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 Los tipos de intervalos que pueden usarse son los mismos que en la Tabla de Medias arriba. Si todos los tamaños de muestra son los mismos (o cercanos), el analista puede determinar cuáles medias son significativamente diferentes de cuáles otras usando los procedimientos LSD, Tukey, Scheffe o Bonferroni simplemente viendo si un par de intervalos se traslapan en dirección vertical o no. Un par de intervalos que no se traslapan indica una diferencia estadísticamente 2006 por StatPoint, Inc. Comparación de Varias Muestras - 19
20 significativa entre las medias al nivel de confianza seleccionado. En este caso, note que el intervalo de la tarea 4 se traslapa solo con el de la tarea 3, indicando que es significativamente diferente de todas las demás tareas. Verificación de Varianza. Una de las suposiciones que respaldan el análisis de varianza es que las varianzas de las poblaciones de donde se tomaron las muestras son las mismas. El panel Verificación de Varianza realiza alguna de varias pruebas para verificar esta suposición. Verificación de Varianza Prueba Valor-P Levene's La hipótesis a probarse será: Hipótesis Nula: todas las σ son iguales Hipótesis Alt.: no todas las σ son iguales Las cuatro pruebas son: 1. Prueba de Cochran: compara la varianza máxima dentro de la muestra con la varianza muestra promedio. Un P-valor menor que 0.05 indica una diferencia significativa entre las desviaciones estándar dentro de la muestra a un nivel de significancia del 5%. La prueba es apropiada sólo si todos los grupos son del mismo tamaño. 2. Prueba de Bartlett: compara un promedio ponderado de las varianzas dentro de la muestra con su media geométrica. Un P-valor menor que 0.05 indica una diferencia significativa entre las desviaciones estándar dentro de la muestra a un nivel de significancia del 5%. La prueba es apropiada tanto para grupos del mismo tamaño como para grupos de tamaño distinto. 3. Prueba de Hartley: calcula el cociente entre la varianza muestral más grande y la más pequeña. Este estadístico debe compararse con una tabla de valores críticos, como la 2006 por StatPoint, Inc. Comparación de Varias Muestras - 20
21 contenida en Neter et al. (1996). Para 6 muestras y 62 grados de libertad para error experimental, H se hubiera excedido aproximadamente 2.1 para ser estadísticamente significativo a un nivel de significancia del 5%. Nota: esta prueba sólo es apropiada si el número de observaciones entre cada nivel de tratamiento es el mismo. 4. Prueba de Levene: realiza un análisis de varianza de una vía en las variables. Z i = yi y (14) El estadístico tabulado es el F estadístico de la tabla ANOVA. Para los datos de tasa de pulsación, no hay razón para rechazar la suposición de que las desviaciones estándar son las mismas para todos los grupos, ya que los P-valores son mayores que Cualquier diferencia aparente entre las desviaciones estándar muestrales no es estadísticamente significativa a un nivel de significancia del 5%. Gráficas de Residuales Como en todo modelo estadístico, es una buena costumbre examinar los residuales. En un análisis de varianza de una vía, los residuales se definen por: e i = yi y (15) i.e., los residuales son las diferencias entre los valores de datos observados y sus respectivas medias grupales. El procedimiento Comparación de Muestras Múltiple crea 3 gráficas de residuales: 1. contra indicador muestral. 2. contra valor predicho. 3. contra número de observación. Residuales contra Muestras Esta gráfica es de ayuda para visualizar cualquier diferencia en la variabilidad de las muestras por StatPoint, Inc. Comparación de Varias Muestras - 21
22 Gráfico de Residuos 12 8 residuos Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 muestra El residual promedio en cada grupo es igual a 0. Residuales contra Predicho Esta gráfica es de ayuda para detectar cualquier heteroescedasticidad en los datos Gráfico de Residuos residuos valor predicho La heteroescedasticidad ocurre cuando la variabilidad de los datos cambia como lo hace la media, y puede necesitarse transformar los datos antes de realizar el ANOVA. Usualmente es evidenciado por un patrón de forma de embudo en la gráfica de residuales. Residuales contra Observación Esta gráfica muestra los residuales contra el número de fila en la hoa de datos: 2006 por StatPoint, Inc. Comparación de Varias Muestras - 22
23 Gráfico de Residuos 12 8 residuos observación Si los datos se arreglan en orden cronológico, cualquier patrón de los datos puede indicar una influencia exterior. No es evidente ningún patrón así en la gráfica de arriba. Gráfica de Análisis de Medias (ANOM) Si el número de muestras está entre 3 y 20, en la Gráfica de Análisis de Medias o Gráfica ANOM, se presenta una aproximación de alguna manera distinta a la comparación de medias: Media Gráfico ANOM Con 95% Límites de Decisión Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 LDS=36.38 LC=32.31 LDI=28.24 Esta gráfica construye una tabla similar a un cuadro de control, donde cada media muestral se grafica unto a una línea central y los límites de decisión superiores e inferiores. La línea central se localiza en el promedio de todas las observaciones Y. Los límites de decisión se localizan en Y ± hn q MS within q 1, 1 α (16) n q 2006 por StatPoint, Inc. Comparación de Varias Muestras - 23
24 donde h es un valor crítico obtenido de una tabla de la distribución t multivariada. El cuadro prueba la hipótesis nula de que todas las medias muestrales son iguales que la media. Cualquier media que caiga fuera de los límites de decisión indica que la media correspondiente difiere significativamente de la media total. La ventaa de la gráfica ANOM es que muestra de un vistazo qué medias son significativamente diferentes que el promedio de todas las muestras. También lo hace usando un tipo de cuadro con el que muchos ingenieros y operadores están familiarizados. Es fácil ver a partir del cuadro de arriba que la tarea 4 tiene una tasa de pulsación significativamente mayor que el promedio, mientras que todas las demás medias caen dentro de los límites de decisión. El procedimiento es exacto si todos los tamaños de muestra son iguales y es aproximado si no difieren mucho. Panel de Opciones Nivel de Confianza: nivel usado para posicionar los límites de decisión. Número de Decimales para Límites: número de decimales mostrados al desplegar los límites de decisión. Pruebas de Wruskal-Wallis y Friedman Una alternativa para el análisis estándar de varianzas que compara medianas de grupo en lugar de medias es la Prueba Kruskal-Wallis. Esta prueba es mucho menos sensible a la presencia de puntos leanos que lo que es una ANOVA de una vía y debe usarse cada vez que la suposición de normalidad dentro de las muestras no sea razonable. Ésta prueba las hipótesis: Hipótesis Nula: todas las medianas de grupo son iguales. Hipótesis Alt.: no todas las medianas de grupo son iguales. La prueba es conducida por: 1. Ordenar todos los n valores del más pequeño al más grande y clasificarlos, asignando rango de 1 al más pequeño y de n al mayor. Si dos observaciones cualesquiera son exactamente iguales, a las observaciones empatadas se les da el mismo rango que al promedio de las posiciones a las que ocurre el empate por StatPoint, Inc. Comparación de Varias Muestras - 24
25 2. Calcular los rangos promedio de las observaciones dentro de cada grupo R. 3. Calcular un estadístico de prueba para comparar las diferencias entre los rangos promedio. 4. Calcular un P-valor para probar las hipótesis. El resultado se muestra abao: Prueba Kruskal-Wallis Tamaño de Muestra Rango Promedio Tarea Estadístico 1 13 = P-Valor= Tarea Tarea Tarea Tarea Tarea P-valores pequeños (menores que 0.05 si se opera a un nivel de significancia del 5%) indica que hay diferencias significativas entre las medianas de grupo, como en el eemplo de arriba. Panel de Opciones Método: procedimiento a usar para comparar las medianas. Kruskal-Wallis es apropiado al comparar q muestras independientes. Friedman es apropiado al analizar un experimento en bloques, i.e., cuando los datos de cada fila corresponden a la misma unidad o bloque experimental. La prueba Friedman es apropiada para un diseño aleatorio de bloques, en el que cada fila de la hoa de datos representa una condición o bloque particular. En este eemplo, esto aplicaría si los mismos 13 suetos hubiesen realizado cada una de las 6 tareas, en lugar de diferentes suetos para cada tarea. El resultado de la prueba Friedman es interpretada de la misma manera que el de la prueba Kruskal-Wallis por StatPoint, Inc. Comparación de Varias Muestras - 25
26 Prueba de la Medianas de Mood La Prueba de la Mediana de Mood es otro método de determinar si las medianas de todos los q grupos son iguales o no. Es menos sensible a puntos leanos que la de Kruskal-Wallace, pero también es menos poderosa cuando los datos vienen de distribuciones como la normal. El resultado se muestra abao. Prueba de la Mediana de Mood Total n = 68 Gran mediana = 31.0 Muestra Tamaño de Muestra n<= n> Mediana LC inferior 95.0% LC superior 95.0% Tarea Tarea Tarea Tarea Tarea Tarea Estadístico = P-Valor= Arriba de la tabla se despliega el número total de observaciones n y la mediana total. Para cada muestra la tabla muestra: 1. Tamaño de Muestra: El número de observaciones en la muestra n. 2. n<=: de las observaciones en la muestra, cuántas son menores o iguales que la mediana total. 3. n>: de las observaciones en la muestra, cuántas son mayores o iguales que la mediana total. 4. Mediana: la mediana muestral. 5. CL: los límites de confianza superior e inferior para la mediana de la población de donde vino la muestra. Abao de la pantalla se muestra un estadístico de prueba y un P-Valor. Tratando los n<= y las n> columnas como columnas de una tabla de contingencia de dos vías, se calcula un estadístico de prueba i-cuadrada. P-Valores pequeños (menores que 0.05 operando a un nivel de significancia del 5%) llevan a la conclusión de que no todas las medianas son iguales, como en este eemplo. Panel de Opciones Nivel de Confianza: nivel usado para los límites de confianza por StatPoint, Inc. Comparación de Varias Muestras - 26
27 Gráfico de Medianas El Gráfico de Medianas despliega los intervalos de confianza para las medianas desplegadas por el panel Prueba de la Mediana de Mood Gráfico de Medianas con Intervalos del 95.0% de Confianza respuesta Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 Panel de Opciones Nivel de Confianza: nivel usado para los límites de confianza. Guardar Resultados Los siguientes resultados pueden guardarse en la hoa de datos: 1. Recuentos los q tamaños de muestra n. 2. Medias las q medias muestrales. 3. Medianas las q medianas muestrales. 4. Desviaciones Estándar las q desviaciones estándar muestrales 5. Errores Estándar los errores estándar de cada media muestral, MS within / n. 6. Etiquetas una etiqueta para cada muestra. 7. Residuales los n residuales. 8. Rangos los q rangos muestrales. 9. Columna de Datos las n observaciones arregladas en una sola columna. 10. Columna Códigos n códigos que identifican la muestra correspondiente a cada observación en la Columna de Datos por StatPoint, Inc. Comparación de Varias Muestras - 27
28 Cálculos Análisis de Varianza Fuente Suma de Cuadrados D.F. Media cuadrática Intergrupa q 2 SS = n Y Y df between q MSbetween l between ( ) = 1 F-Radio SS MS between = F = df MS between between within Intragrupa q n l SS within = ( Yi Y ) = 1 i= 1 2 df within q = 1 ( n ) = 1 MS within SS = df within within q n Total SStotal = ( Yi Y ) = 1 i= 1 2 n-1 Prueba de Cochran El estadístico desplegado se calcula por = 1 ( s ) max 2 A = q s 2 (17) Para probar significancia estadística, A C = ( q 1) 1 A (18) es comparada con una F distribución con (n/q - 1) y (n/q - 1)(q - 1) grados de libertad. Prueba de Bartlett El estadístico desplegado se calcula por q 1 2 B = ( dfe) ln ( MSE) n C ( 1) ln ( s ) (19) = 1 donde 2006 por StatPoint, Inc. Comparación de Varias Muestras - 28
29 C = q 1 ( ) ( n 1) q = dfe STATGRAPHICS Rev. 4/d/yyyy (20) MSE ( n 1) q 1 = dfe = 1 s 2 (21) q ( n ) dfe = 1 = 1 (22) B es comparada con una distribución i-cuadrada con (q-1) grados de libertad. Prueba de Hartley 2 ( s ) 2 ( s ) max H = (23) min Límites de Confianza de Medianas Los límites desplegados son una interpolación no lineal de intervalos de confianza a los niveles de confianza superior e inferior más cercanos que el nivel requiera. Luego de ordenar las observaciones, el intervalo que va de la d-ésima observación más pequeña en la muestra a la d- ésima observación más grande forma un intervalo de confianza para la mediana con un nivel de confianza 1 2 P B (d-1), donde P B representa la distribución binomial con p = 0.5 y n = n por StatPoint, Inc. Comparación de Varias Muestras - 29
Estadísticas por Filas
Estadísticas por s Resumen El procedimiento Estadísticas por s calcula estadísticas para datos en filas de la hoa de datos. Esto contrasta con la mayoría de los procedimientos de STATGRAPHICS que esperan
ANOVA Multifactorial. StatFolio Muestra: anova.sgp
ANOVA Multifactorial Resumen El procedimiento ANOVA Multifactorial está diseñado para construir un modelo estadístico describiendo el impacto de dos o más factores categóricos X j de una variable dependiente
Comparación de dos Muestras - SnapStat
Comparación de dos Muestras - SnapStat Resumen La Comparación de Dos Muestras usando SnapStat crea un resumen de una página que compara dos muestras independientes de datos de variables. Calcula estadísticos
Gráfico Múltiple de Caja y Bigotes
Gráfico Múltiple de Caa y Bigotes Resumen El procedimiento Gráfico Múltiple de Caa y Bigotes crea un gráfico diseñado para ilustrar Características importantes de una columna de datos numéricos cuando
Análisis de Subconjuntos
Análisis de Subconuntos Resumen El procedimiento de Análisis de Subconuntos calculará estadísticos para datos en una simple columna numérica cuando se agrupan en subconuntos definidos por los identificadores
Exactitud y Linearidad del Calibrador
Exactitud y Linearidad del Calibrador Resumen El procedimiento Exactitud y Linearidad del Calibrador fue diseñado para estimar la exactitud del sistema de medición. En contraste con los procedimientos
Análisis de Componentes de la Varianza
Análisis de Componentes de la Varianza Resumen El procedimiento de Análisis de Componentes de Varianza está diseñado para estimar la contribución de múltiples factores a la variabilidad de una variable
Gráficos X-Bar y S. StatFolio de Muestra: xbarschart.sgp
Gráficos X-Bar y S Resumen El procedimiento Gráficos X-Bar y S crea gráficos de control para una simple variable numérica cuando los datos han sido recabados en subgrupos. Crea un Gráfico X-bar para monitorear
Gráfico de Medias Móviles (MA)
Gráfico de Medias Móviles (MA) Resumen El procedimiento Gráfico de Medias Móviles crea cuadros de control para una sola variable numérica donde los datos se han recolectado ya sea individualmente o en
Método del Rango (Estudio del Calibrador Variables)
Método del Rango (Estudio del Calibrador Variables) STATGRAPHICS Rev. 9/14/006 Resumen El Método del Rango calcula una estimación aproximada de la repetibilidad y reproducibilidad combinada para un sistema
Gráfico de Control T-Cuadrada Multivariada
Gráfico de Control T-Cuadrada Multivariada STATGRAPHICS Rev. 25/04/2007 Resumen El procedimiento Gráfico de Control T-Cuadrada Multivariada crea diagramas de control para dos o más variables numéricas.
Método del Rango y Promedio (Estudio del Calibrador - Variables)
STATGRAPHICS Rev. 9/14/006 Método del Rango y Promedio (Estudio del Calibrador - Variables) Resumen El Método del Rango y Promedio estima la repetibilidad y reproducibilidad de un sistema de medición basado
Gráfico de Desgaste de Herramientas
Gráfico de Desgaste de Herramientas Resumen El procedimiento Gráfico de Desgaste de Herramientas crea cuadros de control para una sola variable numérica donde se espera que cambien las cantidades en un
Método ANOVA (Estudio del Calibrador Variables)
Método ANOVA (Estudio del Calibrador Variables) STATGRAPHICS Rev. 9/14/006 Resumen El Método ANOVA estima la repetibilidad y reproducibilidad de un sistema de medición basándose sobre un estudio en el
ANOVA Simple. StatFolio de Ejemplo: oneway.sgp
ANOVA Simple Resumen El procedimiento ANOVA Simple (o de un criterio de clasificación) está diseñado para construir un modelo estadístico que describa el impacto de un solo factor categórico X sobre una
2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS)
2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS) La idea principal en este capitulo es el inicio a planear los diseño experimentales y su correspondiente análisis estadístico. En este caso iniciaremos
Análisis de Capacidad Multivariada
Análisis de Capacidad Multivariada Resumen El procedimiento Análisis de Capacidad Multivariada determina la probabilidad de que los puntos caracterizados por dos o más variables se encuentren establecidos
Diseño de Experimentos Diseños de un Solo Factor Categórico
Diseño de Experimentos Diseños de un Solo Factor Categórico Resumen La selección de Diseños de un Solo Factor Categórico sobre el menú de Crear un Diseño crea diseños experimentales para situaciones donde
Grafico Cusum (Mascara-V)
Grafico Cusum (Mascara-V) Resumen Los gráficos de sumas acumulativas monitorean datos por variables graficando las sumas acumulativas de las desviaciones al valor objetivo. Esto lo hace, incorporando la
Diseño de experimentos Hugo Alexer Pérez Vicente
Diseño de experimentos Hugo Alexer Pérez Vicente Métodos complementarios al análisis de varianza Comparaciones múltiples Comparación o pruebas de rangos múltiples Después de que se rechazó la hipótesis
Selección Diseño de Cribado
Selección Diseño de Cribado Resumen La sección diseño experimental del STATGRAPHICS puede crear una amplia variedad de diseños dirigidos a mostrar los factores más importantes que afectan un proceso. Se
Supuestos y comparaciones múltiples
Supuestos y comparaciones múltiples Diseño de Experimentos Pruebas estadísticas Pruebas de bondad de ajuste Prueba de hipótesis para probar si un conjunto de datos se puede asumir bajo una distribución
Diagrama de Barras Múltiple
Múltiple El procedimiento Múltiple grafica dos o más columnas de totales o frecuencias ya sea utilizando barras horizontales o verticales. Si lo desea, pueden agregarse barras de error para desplegar el
Grafico de Cajas y Bigotes
Grafico de Cajas y Bigotes Resumen El procedimiento del Gráfico de Cajas y Bigotes crea un gráfico diseñado para ilustrar propiedades importantes de una columna de datos numérica. El primero en describirlo
Análisis Probit. StatFolio de Ejemplo: probit.sgp
STATGRAPHICS Rev. 4/25/27 Análisis Probit Resumen El procedimiento Análisis Probit está diseñado para ajustar un modelo de regresión en el cual la variable dependiente Y caracteriza un evento con sólo
Transformaciones de Potencia
Transformaciones de Potencia Resumen El procedimiento Transformaciones de Potencia está diseñado para definir una transformación normalizadora para una columna de observaciones numéricas que no provienen
MPG City (MPG en Ciudad)
Gráfica de Matriz Resumen El procedimiento Gráfica de Matriz crea gráficas de matriz para 3 o más variables numéricas. La diagonal de la matriz contiene gráficas de caja y bigotes para cada variable. Las
Gráfico ARIMA. Ejemplo StatFolio: ARIMA charts.sgp
Gráfico ARIMA Resumen El procedimiento del Gráfico ARIMA (AutoRegressive Integrated Moving Average - Promedio Móvil Integrado Auto-Regresivo) crea gráficos de control para una sola variable numérica donde
Gráfico de Probabilidad Normal
Gráfico de Probabilidad Normal Resumen El Gráfico de Probabilidad Normal se usa para ayudar a juzgar si una muestra de datos numéricos proviene o no de una distribución normal. De no ser el caso, frecuentemente
Este procedimiento prueba hipótesis acerca de cualquiera de los siguientes parámetros:
STATGRAPHICS Re. 4/d/yyyy Pruebas de Hipótesis (Una Muestra) Este procedimiento prueba hipótesis acerca de cualquiera de los siguientes parámetros: 1. la media μ de una distribución normal.. la desiación
Método de Análisis del Riesgo (Estudio del Calibrador Atributos)
Método de Análisis del Riesgo (Estudio del Calibrador Atributos) Resumen El Método de Análisis del Riesgo cuantifica la incertidumbre de un sistema de medición donde las observaciones consisten de atributos
Modelos de Calibración
Modelos de Calibración Resumen El procedimiento Modelos de Calibración esta diseñado para construir un modelo estadístico que describe la relación entre variables, X y Y, donde construir un modelo es construir
Determinación del tamaño de muestra (para una sola muestra)
STATGRAPHICS Rev. 4/5/007 Determinación del tamaño de muestra (para una sola muestra) Este procedimiento determina un tamaño de muestra adecuado para la estimación o la prueba de hipótesis con respecto
Diseño de Experimentos Diseño de Componentes de la Varianza
Diseño de Experimentos Diseño de Componentes de la Varianza Resumen La selección del Diseño de Componentes de la Varianza sobre el menú Crear Diseño construye experimentos diseñados para cuantificar la
Diseño de Experimentos Diseños para Varios Factores Categóricos
Diseño de Experimentos Diseños para Varios Factores Categóricos Resumen La selección de Diseños para Varios Factores Categóricos sobre el menú Crear Diseño construye diseños experimentales para situaciones
Tipo de punta (factor) (bloques)
Ejemplo Diseño Bloques al Azar Ejercicio -6 (Pág. 99 Montgomery) Probeta Tipo de punta (factor) (bloques) 9. 9. 9.6 0.0 9. 9. 9.8 9.9 9. 9. 9.5 9.7 9.7 9.6 0.0 0. ) Representación gráfica de los datos
Tabulación. StatFolio de muestra: tabulation.sgp. Datos del Ejemplo: Captura de Datos. STATGRAPHICS Rev. 4/25/2007
Tabulación El procedimiento de Tabulación está diseñado para resumir una simple columna de datos con atributos. Tabula la frecuencia de ocurrencia de cada valor único dentro de esa columna. Las frecuencias
Pruebas de Hipótesis Multiples
Pruebas de Hipótesis Multiples Cuando queremos hacer comparaciones de mas de dos poblaciones, una alternativa es comparar todos los grupos a la vez con el método de Análisis de Varianza (ANOVA) H o : µ
Transformaciones de Box-Cox
Transformaciones de Box-Cox Resumen El procedimiento para las Transformaciones de Box-Cox es diseñado para determinar una transformación optima para Y mientras se estima un modelo de regresión lineal.
Correlaciones Canónicas
STATGRAPHICS Rev. 9/14/006 Correlaciones Canónicas Resumen El procedimiento Correlaciones Canónicas esta diseñado para ayudar a identificar asociaciones entre dos conjuntos de variables. Esto lo hace encontrando
Estadísticas Pueden ser
Principios Básicos Para iniciar en el curso de Diseño de experimentos, es necesario tener algunos conceptos claros en la parte de probabilidad y estadística. A continuación se presentan los conceptos más
Regresión en Cadena. StatFolio de Ejemplo: ridge reg.sgp
Regresión en Cadena Resumen El procedimiento Regresión en Cadena está diseñado para ajustar un modelo de regresión múltiple cuando las variables independientes exhiben multicolinealidad. Multicolinealidad
Gráficos EWMA. Ejemplo StatFolio: ewmachart.sgp
Gráficos EWMA Resumen El procedimiento del Gráfico EWMA (Exponentially Weighted Moving Average - Promedios Móviles Exponencialmente Ponderados) construye un gráfico de control para una sola variable numérica
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
ÍNDICE Introducción: Entrene su cerebro para la estadística... 1 La población y la muestra... 3 Estadísticas descriptivas e inferenciales... 4 Alcanzar el objetivo de estadísticas inferenciales: los pasos
Estadísticos Aplicados en el SPSS 2008
PRUEBAS ESTADISTICAS QUE SE APLICAN (SPSS 10.0) PARAMÉTRICAS:... 2 Prueba t de Student para una muestra... 2 Prueba t par muestras independientes... 2 ANOVA de una vía (multigrupo)... 2 ANOVA de dos vías
CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...
CONTENIDO Prólogo a la 3. a edición en español ampliada.................................. Prólogo.................................................................. vii xvii 1. Métodos descriptivos................................................
Estas dos clases. ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías
ANOVA I 19-8-2014 Estas dos clases ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías ANOVA II - ANOVA factorial - ANCOVA (análisis
Ejemplo Diseño Completamente aleatorizado (Pág. 470 Montgomery)
Ejemplo Diseño Completamente aleatorizado (Pág. 47 Montgomery) ) Representación gráfica de los datos mediante diagramas de caja Resumen del procesamiento de los casos Tension del papel (psi) Casos Válidos
Método Teoría de la Señal (Estudio del Calibrador Atributos)
Método Teoría de la Señal (Estudio del Calibrador Atributos) Resumen El Método Teoría de la Señal cuantifica la incertidumbre de un sistema de medición donde las observaciones consisten de atributos en
3 ANALISIS DESCRIPTIVO DE LOS DATOS
3 ANALISIS DESCRIPTIVO DE LOS DATOS 3.1 La tabulación de los datos 3.1.1 Tabla de distribución de frecuencias. 3.1.2 El histograma. 3.2 Medidas de tendencia central 3.2.1 La media. 3.2.2 La mediana. 3.2.3
SnapStat: Análisis de Una Muestra
SnapStat: Análisis de Una Muestra Resumen La SnapStat Análisis de Una Muestra crea un resumen en una hoja de una sola columna de datos numéricos. Calcula estadísticas de resumen e intervalos de confianza,
Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico
Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más
Regresión Polinomial. StatFolio de Ejemplo: polynomial reg.sgp
Regresión Polinomial Resumen El procedimiento Regresión Polinomial está diseñado para construir una modelo estadístico que describa el impacto de un solo factor cuantitativo X en una variable dependiente
Parámetros Estadísticos básicos, Resumen y Presentación de datos. Jhon Jairo Padilla, PhD.
Parámetros Estadísticos básicos, Resumen y Presentación de datos Jhon Jairo Padilla, PhD. Motivación Los resúmenes y las representaciones de datos son esenciales porque: Enfocan al ingeniero en características
14 horas. 20 horas
EJERCICIOS PROPUESTOS ANALISIS DE VARIANZA. Se realiza un ANOVA para comparar el tiempo que demora en aliviar el dolor de cabeza de varios tipos de analgésicos. Se obtiene como resultado un test observado
Nota de los autores... vi
ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...
TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD
TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Contrastes de hipótesis paramétricos para una y varias muestras: contrastes sobre la media, varianza y una proporción. Contrastes sobre la diferencia
5. DISEÑO FACTORIALES 2 k
5. DISEÑO FACTORIALES 2 k Los diseños factoriales son ampliamente utilizados en experimentos en los que intervienen varios factores para estudiar el efecto conjunto de éstos sobre una respuesta. Un caso
Método de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
Elaborado por: Pelay, C. y Pérez, J. Prueba t para muestras independientes
Prueba t para muestras independientes 1 El procedimiento Prueba t para muestras independientes compara las medias de dos grupos de casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente
ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO
ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO Varianzas poblacionales desconocidas y distintas Muestras grandes (n 30) Muestras pequeñas (n
PRÁCTICA: ESTADÍSTICA DESCRIPTIVA CON SPSS 1
ESTADÍSTICA CURSO 2012/2013 GRADO EN BIOLOGÍA PRÁCTICA: ESTADÍSTICA DESCRIPTIVA CON SPSS 1 1. Introducción El programa estadístico SPSS está organizado en dos bloques: el editor de datos y el visor de
ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)
ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA) El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hipótesis alternativa de
TEMA 10 COMPARAR MEDIAS
TEMA 10 COMPARAR MEDIAS Los procedimientos incluidos en el menú Comparar medias permiten el cálculo de medias y otros estadísticos, así como la comparación de medias para diferentes tipos de variables,
Estadística Descriptiva en SPSS
Estadística Descriptiva en SPSS Marcelo Rodríguez Ingeniero Estadístico - Magister en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 22 de
DESCRIPCIÓN DE DATOS. Medidas Numéricas
DESCRIPCIÓN DE DATOS Medidas Numéricas MEDIDAS DE TENDENCIA CENTRAL O POSICIÓN MEDIA ARITMÉTICA O PROMEDIO Media poblacional Cualquier característica medible de una población recibe el nombre de parámetro
Estadística Inferencial. Resúmen
Ofimega - Estadística inferencial - 1 Estadística Inferencial. Resúmen Métodos y técnicas que permiten inducir el comportamiento de una población. Muestreo o selección de la muestra: 1. Aleatorio simple:
Teorema Central del Límite (1)
Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico
REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE
UNIDAD 3 REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE Relación entre variables de interés 1 Relación entre variables de interés Muchas decisiones gerenciales se basan en la relación entre 2 o
2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Asimetría Coeficiente de Asimetría de Fisher
Asimetría Si los valores de la serie de datos presenta la misma forma a izquierda y derecha de un valor central (media aritmética) se dice que es simétrica de lo contrario será asimétrica. Para medir el
Diseño de Experimentos
Diseño de Experimentos Mejoramiento Continuo de Deming DOE Sí el análisis expuso una serie de factores de entrada para el proceso que deben ser controlados para maximizar o minimizar un resultado, entonces
Prueba t para muestras independientes
Prueba t para muestras independientes El procedimiento Prueba t para muestras independientes compara las medias de dos grupos de casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente
Ideas básicas del diseño experimental
Ideas básicas del diseño experimental Capítulo 4 de Analysis of Messy Data. Milliken y Johnson (1992) Diseño de experimentos p. 1/23 Ideas básicas del diseño experimental Antes de llevar a cabo un experimento,
Estadística I Solución Examen Final- 19 de junio de Nombre y Apellido:... Grupo:...
Estadística I Examen Final- 19 de junio de 2009 Nombre y Apellido:... Grupo:... (1) La siguiente tabla muestra las distribuciones de frecuencias absolutas de la variable altura (en metros) de n = 500 estudiantes
INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica
INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables
MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN. a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico.
MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN 1. Conteste las preguntas siguientes: a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico. 1. 2. 3. 4. b. En
Comparación de Muestras Pareadas
Comparación de Muestras Pareadas Resumen El procedimiento Comparación de Muestras Pareadas está diseñado para comparar datos en 2 columnas numéricas donde los valores en cada fila están pareados, i.e.,
Histogramas. Ejemplo StatFolio: histogram.sgp
s Resumen El ilustra la distribución de lo valores de una variable numérica agrupando los datos en intervalos y graficando barras en las cuales la altura es proporcional al numero de observaciones en cada
ANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y
Métodos de Diseño y Análisis de Experimentos
1 / 28 Métodos de Diseño y Análisis de Experimentos Patricia Isabel Romero Mares Departamento de Probabilidad y Estadística IIMAS UNAM marzo 2018 Ideas básicas del diseño experimental Capítulo 4 de Analysis
Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0
Ignacio Martín Tamayo 11 Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 ÍNDICE ------------------------------------------------------------- 1. Introducción 2. Frecuencias 3. Descriptivos 4. Explorar
CLAVE Laboratorio 14: Diseño en bloques completos aleatorizados
CLAVE Laboratorio 14: Diseño en bloques completos aleatorizados 1. Digamos que estamos interesados en conducir un experimento para comparar los efectos de tres insecticidas diferentes en habichuela. Pensamos
Distribuciones de muestreo importantes. Jhon Jairo Padilla Aguilar, PhD.
Distribuciones de muestreo importantes Jhon Jairo Padilla Aguilar, PhD. Distribución chi-cuadrado Si z1, z2,z3, zk son distribuciones normales estandarizadas, la variable aleatoria x 2 2 z1 z2... zk Sigue
INDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Tema 3: Estadística Descriptiva
Tema 3: Estadística Descriptiva Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 3: Estadística Descriptiva Curso 2008-2009 1 / 27 Índice
viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos
Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................
ESTADISTICA AVANZADA. Análisis de la Variancia Anova One Way Kruskal-Wallis Bloques (Friedman)
ESTADISTICA AVANZADA Análisis de la Variancia Anova One Way Kruskal-Wallis Bloques (Friedman) Factor Análisis de la Variancia El análisis de varianza One Way es una generalización de la Prueba t para mas
Gráfico de Control de Aceptación
Gráfico de Control de Aceptación Resumen El procedimiento de Gráfico de Control de Aceptación crea gráficos de control con límites de control modificados basándose en la desviación estándar del proceso
ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)
ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com) ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS... 1 DEFINICIONES BÁSICAS... 1 Estadística... 1 Estadística descriptiva... 1 Estadística inferencial...
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente
TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS
TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS 9.1. Análisis Descriptivo de la Información 9.2. La Tabulación Cruzada 9.3. Contraste de Hipótesis 9.1. Análisis Descriptivo
