BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 1 BIOESTADÍSTICA. Posgrado en Ciencias de la Salud. Curso

Documentos relacionados
Tipo de punta (factor) (bloques)

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

478 Índice alfabético

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Estadísticos Descriptivos

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Estadísticos Aplicados en el SPSS 2008

Y accedemos al cuadro de diálogo Descriptivos

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Módulo de Estadística

INDICE. Prólogo a la Segunda Edición

Estadística Inferencial. Estadística Descriptiva

Teorema Central del Límite (1)

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

Repaso Estadística Descriptiva

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

Contrastes de hipótesis. 1: Ideas generales

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

ÍNDICE INTRODUCCIÓN... 21

ESTADÍSTICA CON EXCEL

Tema I. Introducción. Ciro el Grande ( A.C.)

Análisis de la varianza ANOVA

Conceptos del contraste de hipótesis

INDICE Capítulo I: Conceptos Básicos Capitulo II: Estadística Descriptiva del Proceso

Fase 2. Estudio de mercado: ESTADÍSTICA

EJERCICIOS RESUELTOS TEMA 1.

Práctica 5 MÉTODOS DESCRIPTIVOS PARA DETERMINAR LA NORMALIDAD

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

Curso de Estadística Aplicada a las Ciencias Sociales

Contrastes de Hipótesis paramétricos y no-paramétricos.

Estadística descriptiva y métodos diagnósticos

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

MANEJO DE VARIABLES EN INVESTIGACIÓN CLÍNICA Y EXPERIMENTAL

CURSO: Métodos estadísticos de uso frecuente en salud

Los estadísticos descriptivos clásicos (Robustez)

Pruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

Tema 5. Muestreo y distribuciones muestrales

Fundamentos de Estadística y Simulación Básica

DISTRIBUCIONES BIDIMENSIONALES

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

CLASE 10: RESUMEN DEL CURSO

Estadística. Análisis de datos.

Proyecto PropULSA: Estadística y Probabilidad Breviario Académico

Medidas de Tendencia Central.

1.- Test de hipótesis de normalidad. 2.- Test de hipótesis para una proporción 6-1

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Pruebas de Hipótesis. Diseño Estadístico y Herramientas para la Calidad. Pruebas de Hipótesis. Hipótesis

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS

Agrupa los resultados por lotes: Rechazados, revisables y aceptados y:

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

ESTADÍSTICA DESCRIPTIVA

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

POBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

EJERCICIOS DE SELECTIVIDAD

INTRODUCCIÓN A LA ECONOMETRÍA (LE Y LADE, mañana) Prof. Magdalena Cladera APLICACIONES DE INFERENCIA ESTADÍSTICA DE EXCEL Y SPSS

Medidas de tendencia central y dispersión

INFERENCIA ESTADISTICA

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Indicaciones para el lector... xv Prólogo... xvii

CM0244. Suficientable

Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos

ESTADÍSTICA SEMANA 3

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Tema 5. Contraste de hipótesis (I)

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Cómo se hace la Prueba t a mano?

1º CURSO BIOESTADÍSTICA

Tema 7: Estadística y probabilidad

Problemas Prueba de significación de la hipótesis nula Vicente Manzano-Arrondo, 2013

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

Tema 4: Probabilidad y Teoría de Muestras

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

1. Cómo introducir datos en SPSS/PC? - Recordatorio

ESCUELA COMERCIAL CÁMARA DE COMERCIO EXTENSIÓN DE ESTUDIOS PROFESIONALES MAESTRÍA EN ADMINISTRACIÓN

Probabilidad y Estadística

LECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL.

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I)

Práctica 2: Estadística Descriptiva (II)

Tema 6. Estadística Descriptiva e Introducción a la Inferencia Estadística

Tema 6. Variables aleatorias continuas

El ejemplo: Una encuesta de opinión

Probabilidad y Estadística, EIC 311

Transcripción:

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. BIOESTADÍSTICA Posgrado en Ciencias de la Salud Curso 00-0 Bloque I:. Nociones básicas de estadística descriptiva e inferencia.. Comparación de dos poblaciones. Comprobación de normalidad e igualdad de varianzas. 3. Comparación de más de dos poblaciones: análisis de la varianza. 4. Tablas de contingencia y medidas de asociación. 5. Introducción a la estadística multivariable. Técnicas de dependencia y de interdependencia. Anexo: Introducción al paquete estadístico SPSS para windows.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. Tema : NOCIONES BÁSICAS DE ESTADÍSTICA DECRIPTIVA Tipos de datos y variables CUALITATIVA (Categorías, grupos, niveles,...) CUANTITATIVA (Valores numéricos) NOMINAL (Categorías sin orden) Sexo, tratamiento, ORDINAL (Categorías ordenadas) Satisfacción, estudios, DISCRETA (Números enteros, sin decimales) Nº hermanos, Años de tratamiento, CONTINUA (Números reales, con decimales) Tensión, altura, SPSS: Tipo: Numérico o cadena Medida: Nominal SPSS: Tipo:Numérico o cadena Medida: Ordinal SPSS: Tipo: Numérico Medida: Ordinal o Escala SPSS: Tipo: Numérico Medida: Escala Fichero de datos partos.sav Información sobre las variables Variable Etiqueta Valores iniciales Identificador de la madre edad Edad de la madre paridad Paridad = Primípara = Multipara hijos abortos Hijos anteriores Número de abortos previos grupo Grupo sanguineo de la madre 0 = O = A = B 3 = AB rh Rh de la madre 0 = Positivo = Negativo gestacion o sull curva tdilat Días de gestacion Test o sullivan Tipo de curva (glucosa) Tiempo de dilatación 0 = Normal = Intolerante = Patologica 3 = No hecha texpulsv Tiempo de expulsivo tocurg Tocurgia 0 = Espontáneo = Instrumental = Cesárea peso Peso del bebé en gramos sexo Sexo del bebé = Hombre = Mujer apgar apgar5 pha phv Apgar al minuto Apgar a los 5 minutos ph arterial ph venoso

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 3 ESTUDIOS DE ESTADÍSTICA DESCRIPTIVA TIPO DE VARIABLE: Tabla de frecuencias GRÁFICO ADECUADO: ESTADÍSTICOS Cualitativas (nominal y ordinal) SI Diagramas de sectores Moda o Mediana Discreta con pocos valores distintos SI Diagramas de barras Media, Desv.típica, Mínimo y Máximo Discreta con muchos valores posibles Por intervalos Histograma Continua Por intervalos Diagrama de cajas (*) Medidas de posición central y no central, dispersión y forma (*) No es un gráfico de frecuencias. ESTADÍSTICOS: MEDIDAS DE POSICIÓN CENTRALES Valor resumen de los datos Moda = Valor más frecuente. Mediana (Me) = Valor tal que el 50% de los datos es menor o igual a él. n = n Medias: Media aritmética: x x = (x + x +... x ) i= n i + Media geométrica, Media armónica o Media recortada al 5% n MEDIDAS DE POSICIÓN NO CENTRALES Analizar la distribución de los datos Mínimo y Máximo Percentiles = P(%) = valor que deja un porcentaje dado de valores menores o iguales a él. Mediana = P(50) Máximo = P(00) Cuartiles: P(5), P(50) y P(75) N-tiles: dividen la distribución en N partes con igual número de datos. MEDIDAS DE DISPERSIÓN ABSOLUTAS Medir la separación entre los datos Rango = Máximo Mínimo Amplitud Intercuartil = AI = P(75) P(5) Cuasivarianza muestral (Varianza en SPSS) Desviación típica muestral (en SPSS): S S n k x = (x i x) = n j (x j x) n i= n j= n k x = (x i x) = n j (x j x) n i= n j=

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 4 Teorema de Tchebychev y regla empírica: En [ x Sx x + S x ] En [ x S x, x + S x ] [ x 3 S, x + 3 ], se encuentran aproximadamente el 68% de los datos. están al menos el 75% de los datos y aproximad. el 95% de los datos. contiene al menos el 88,9% de los datos y aprox. el 99% de los datos. x S x MEDIDAS DE FORMA Localizar dónde hay mayor separación entre los datos Asimetría respecto de la media (aritmética): Propiedades: Tiene en cuenta todos los datos Sin unidades Referencia 0 (Normal) n 4 ( xi x) n Apuntamiento o curtosis: g i = = 3 4 Sx g = n n i= S i 3 x 3 ( x x) 0 8 6 Frecuencia 4 0 60 70 80 00 0 40 60 80 90 0 30 50 70 NORMAL

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 5 Ejercicio práctico: ESTUDIOS DESCRIPTIVOS Resultados SPSS de estadística descriptiva para variables del fichero partos.sav Análisis previo de los datos: Menú: Analizar Estadísticos Descriptivos Descriptivos Estadísticos descriptivos N Mínimo Máximo Media Desv. típ. Edad de la madre 356 6 43 30,84 4,75 Paridad 356,00,00,496,50063 Hijos anteriores 356 0 5,65,790 Número de abortos previos 356 0 4,9,608 Grupo sanguineo de la madre 349 0 3,63,730 Rh de la madre 35 0,8,384 Días de gestacion 356 33 95 77,7 9,97 Test o sullivan 339 5 5,69 3,08 Tipo de curva (glucosa) 339 0 9,43,95 Tiempo de dilatación 34 5 080 34,6 8,9 Tiempo de expulsivo 34 0 90 56,35 48,959 Tocurgia 356 0,40,63 Peso del bebé en gramos 356 940 485 3343, 448,69 Sexo del bebé 356,45,498 Apgar al minuto 356 0 0 8,5,3 Apgar a los 5 minutos 356 0 0 9,57,783 ph arterial 37 6,97 7,43 7,3,07597 ph venoso 36 7,0 7,53 7,338,07753 N válido (según lista) 69 Información sobre las variables CUALITATIVAS Variable Etiqueta Valores paridad Paridad = Primípara = Multipara grupo Grupo sanguineo de la madre 0 = O = A = B 3 = AB rh Rh de la madre 0 = Positivo = Negativo curva Tipo de curva (glucosa) 0 = Normal = Intolerante = Patologica 3 = No hecha tocurg Tocurgia 0 = Espontáneo = Instrumental = Cesárea sexo Sexo del bebé = Hombre = Mujer Observaciones: La variable Tipo de curva muestra al menos un valor (9) mayor que 3. Declararlo valor perdido. El test de O Sullivan muestra valores ilógicos (Mínimo=). Analizar si se pueden localizar.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 6.- Estudios descriptivos de una variable cualitativa: Tablas de frecuencias y gráficos. Menú: Analizar Estadísticos Descriptivos Frecuencias: Tabla y Gráficos Tabla de frecuencias: Válidos Grupo sanguineo de la madre Frecuencia Porcentaje Porcentaje válido Porcentaje acumulado O 7 48,3 49,3 49,3 A 45 40,7 4,5 90,8 B 6, 6,3 97, AB 0,8,9 00,0 Total 349 98,0 00,0 Perdidos Sistema 7,0 Total 356 00,0 Diagrama de barras: Diagrama de sectores: COMENTARIOS: El grupo sanguíneo más numeroso entre las pacientes es el grupo 0, que supone el 48,3% de ellas, seguido por el grupo A del 40,7% de las pacientes. No se conoce el grupo sanguíneo del % de las pacientes, por lo que el grupo 0 lo tienen el 49,3% de las que sí se conoce su grupo y el grupo A son el 4,5% de las pacientes con grupo sanguíneo. Los grupos menos numerosos, son el grupo B, con poco más del 6% de pacientes, y el grupo AB con menos del 3% de pacientes.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 7.- Estudios descriptivos de una variable cuantitativa discreta: tabla de frecuencias, gráfico y estadísticos. Menú: Analizar Estadísticos Descriptivos Frecuencias: Tabla, Estadísticos y Gráficos Tabla de frecuencias: Válidos Frecuencia Hijos anteriores Porcentaje Porcentaje válido Porcentaje acumulado 0 8 50,8 50,8 50,8 3 36,8 36,8 87,6 36 0, 0, 97,8 3 6,7,7 99,4 4,3,3 99,7 5,3,3 00,0 Total 356 00,0 00,0 Tabla de estadísticos: Estadísticos Hijos anteriores N Válidos 356 Perdidos 0 Media,65 Mediana,00 Moda 0 Desv. típ.,790 Mínimo 0 Máximo 5 Diagrama de barras: COMENTARIOS: La mayoría de las pacientes, el 50,8%, no tienen hijos anteriores, es decir, son primíparas. El 36,8% tienen ya un hijo, y el 0,% tienen, pero solo el,3% tienen más de hijos (3 hijos el,7% y solo una paciente con 4 y otra con 5). El número medio de hijos anteriores por paciente es 0,65 hijos (media) y la mitad de las pacientes no tienen hijos anteriores (mediana) por lo que representan el grupo más numerosos (moda). La desviación media entre el número de hijos de las pacientes es 0,79 siendo 0 como mínimo y 5 como máximo, si bien solo hay pacientes con más de 3 hijos.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 8 3.- Estudios descriptivos de una variable cuantitativa continua: gráficos y estadísticos. Menú: Transformar Calcular: semanas = gestación / 7. Menú: Analizar Estadísticos Descriptivos Frecuencias: Estadísticos y Gráficos COMENTARIOS: El número medio de semanas de gestación de las 356 pacientes ha sido 39,67 semanas. La mitad de las pacientes ha tenido un periodo de gestación de 39,857 semanas o menos. El 5% de pacientes tuvo una gestación no superior a 39 semanas. El 5% de pacientes tuvo una gestación superior a 40,7 semanas. La desviación media entre el número de semanas de gestación es,4438, por lo que más del 75% de las pacientes (aproximadamente el 95%) han tenido una gestación entre 36,8 y 4,4 (4,5) semanas, siendo la menor de 33,9 semanas. La asimetría es negativa (-,05) luego hay mayores diferencias (dispersión) entre los valores bajos de gestación. La curtosis es positiva (,800) luego los valores alrededor de 39,67 semanas están más concentrados (menos dispersos) que en la Normal.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 9 4.- Comparación de variables: cálculo de estadísticos y diagramas de cajas. (Explorar) Menú: Analizar Estadísticos Descriptivos Explorar: Estadísticos (Descriptivos) Gráficos (Diagrama de cajas: dependientes juntas) COMENTARIOS: El ph arterial es menor que el ph venoso en media (7,36<7,38) pero tienen una dispersión similar y bastante baja, como se observa en la desviación típica y en el diagrama de cajas. Ambos ph muestran asimetría negativa, es decir, mayores diferencias en los valores de ph bajos, más destacado en el ph venoso. La curtosis es mayor en ph venoso, luego los valores intermedios se concentran más que en ph arterial.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 0

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 5.- Estudios por grupos: cálculo de estadísticos y diagramas de cajas. (Explorar) Menú: Analizar Estadísticos Descriptivos Explorar: Estadísticos (Descriptivos) Gráficos (Diagrama de cajas) COMENTARIOS: El tiempo medio de expulsivo es mayor en las primíparas que en las multíparas (ver media y mediana). La dispersión en cambio es similar en ambas en conjunto, si bien en las multíparas esto viene causado por la gran variedad de valores altos del 5% de las pacientes (que muestras mayores diferencias que el 75% de las que tienen valores bajos)

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. Ejercicios de repaso: Fichero SPSS: Partos.sav Realizar los siguientes análisis con SPSS y elaborar el correspondiente estudio estadístico pegando los resultados en Microsoft Word y añadiendo los comentarios correspondientes:.- Tabla de frecuencias y gráficos de Tocurgia..- Estadísticos, tabla de frecuencias y gráficos del Test de Apgar al minuto de nacer. 3.- Estadísticos y gráficos del Test de O Sullivan 4.- Estadísticos y gráficos del Peso del bebé por sexo. 5.- Estadísticos y gráficos del Peso del bebé separados por grupos según Tocurgia. RECOMENDACIONES PARA ELABORAR UN ESTUDIO ESTADÍSTICO: Para redactar el trabajo es necesario copiar y pegar los resultados de SPSS en Microsoft Word para ir añadiendo los comentarios correspondientes. Para pegar las tablas de resultados SPSS en Word, hay que seguir los siguientes pasos:.- Hacer clic sobre la tabla a copiar.- Escoger copiar con menú edición o con el botón derecho del ratón 3.- Al pegarlo en Word hay opciones: a.- Pegar: La tabla se inserta en Word y se puede modificar su contenido y sus formatos. Suele resultar aconsejable seleccionar la tabla entera y utilizar el menú tabla autoajustar a la ventana para que se ajuste al tamaño de la hoja. b.- Pegado especial como Imagen (PNG) o imagen(jpeg): la tabla se inserta como imagen y por tanto conserva el aspecto que tenía en el visor de resultados de SPSS. Podéis aumentar o disminuir de tamaño la tabla sin cambiar su forma. Para pegar gráficos es indiferente pegar o pegado especial, porque se pega siempre como una imagen, pero si el tamaño es demasiado grande, es mejor disminuir su tamaño en SPSS antes de copiarlo, porque al disminuirlo en Word la imagen queda menos nítida. NOTA: Si utilizáis una versión de SPSS anterior a la 6, para conservar el aspecto de las tablas, en lugar de copiar y hacer pegado especial, en SPSS utilizar copiar objeto y en Word pegarlo.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 3 Ejercicios de repaso: Fichero SPSS: Infartos_new.sav Información sobre las variables Variable Etiqueta Valores caso infarto edad tension educa coles fumar antefam anteinf altura_m peso_kg Clase_infarto Fumador Cuanto_fuma Número de identificación Primer infarto y tipo Edad Tensión arterial diastólica Años de Educación Nivel de colesterol en MG por DL Nº de cigarrillos al día Antecedentes familiares de infartos Ha sufrido infartos anteriormente Altura en metros Peso en kilogramos Clase del primer infarto Fumador Cantidad que fuma =No infarto =Muerte repentina 3=Infarto leve 5=Infarto agudo 6=Otro tipo de infarto N=NO Y=SI 0=NO =SI =No infarto 3=Infarto leve u otro tipo 5=Muerte repentina, infarto agudo NO SI 0=No fuma =Menos de paquete =Fuma paquete 3=Más de paquete Indicar el tipo del que es cada variable. Realizar algún estudio de estadística descriptiva, como por ejemplo: Estadísticos descriptivos de todas variables en una tabla para ver los valores de las variables. Tabla de frecuencias y diagrama de barras del tipo del infarto. Estadísticos e histograma de la tensión arterial Estadísticos y diagrama de cajas del nivel de colesterol en función de antecedentes de infarto. (Este fichero lo utilizaremos en otras sesiones prácticas con SPSS para la realización de contrastes de hipótesis)

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 4 NOCIONES BÁSICAS DE INFERENCIA ESTADÍSTICA Inferencia: Población Muestra Población (desconocida) Media µ Desviación típica σ Varianza σ Muestra (n datos, conocidos) Media muestral x Desviación típica muestral S Varianza muestral S Estimaciones y contrastes de hipótesis paramétricos Si X es una variable aleatoria normal N(µ,σ) con media y/o varianza poblacional desconocidas de la que se toman los datos de una muestra de n elementos (o varias muestras) para analizarlos y obtener información sobre la población (con cierto margen de error): Estimación puntual: µˆ = x σˆ = S Estimación por intervalos de confianza: Estimación de µ por intervalo de confianza de -α: Varianza conocida: Varianza desconocida (estimada): σ σ S S x z α /, x + z α / x t α /, n, x + t α /, n n n n n σ σ α = P x z α / < µ < x + z α / n n Contraste de Hipótesis: Hipótesis nula (H O : µ=µ O ) frente a una Hipótesis alternativa (H : µ µ O ) Aceptar o rechazar la hipótesis nula con un nivel de significación α. (α = Probabilidad de rechazar la hipótesis nula siendo cierta) El valor del estadístico de contaste basado en la media muestral x µ z = 0 en que región está? σ n α/ α/ Zona de Rechazo - α Zona de Aceptación Zona de Rechazo α/ z α/ = - z -α/ 0 z -α/ Z 0 p/ Si x µ 0 p = P z < z = α se acepta Ho ; sino se rechaza. 0 σ / n

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 5 Contrastes paramétricos: Conclusiones sobre los parámetros de la población Normal: media µ o varianza σ En cada contraste veremos Requisitos: Normalidad, Igualdad de varianzas. Hipótesis: igualdad de medias poblacionales en los grupos Contrastes no paramétricos: Requisitos: no es necesario que los datos procedan de una distribución Normal En cada contraste veremos Hipótesis: comportamiento similar en los grupos Temas Análisis. Nociones básicas de estadística descriptiva e inferencia.. Comparación de dos poblaciones. Comprobación de normalidad e igualdad de varianzas. - Comparación de medias en grupos (P) - en muestras emparejadas - en poblaciones independientes con varianzas iguales o distintas - Comparación de distribución en grupos (NP) - en muestras emparejadas - en poblaciones independientes 3. Comparación de más de dos poblaciones: análisis de la varianza. - Comparación de medias en omás grupos (P) en poblaciones independientes con varianzas iguales - Comparación de distribución en o más grupos (NP) 4. Tablas de contingencia y medidas de asociación. Tablas de frecuencias cruzadas 5. Introducción a la estadística multivariable. Técnicas de dependencia y de interdependencia. Análisis Factorial, Análisis de Componentes Principales, Análisis de Correspondencias, Análisis Discriminante, Análisis Cluster

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 6 Tema : COMPARACIÓN DE DOS POBLACIONES. COMPROBACIÓN DE NORMALIDAD E IGUALDAD DE VARIANZAS - Comparación de medias en grupos (Contraste Paramétrico)..- en muestras emparejadas..- en poblaciones independientes con varianzas iguales o distintas - Comparación de distribución en grupos (Contraste No Paramétrico)..- en muestras emparejadas..- en poblaciones independientes

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 7..- Comparación de medias de poblaciones, muestras emparejadas Datos: X,...,, X X n y Y, Y,..., Yn donde X es la respuesta inicial e Y la respuesta posterior (tras tratamiento, por ejemplo) para los mismos individuos, ambas provenientes de una distribución Normal. Hipótesis nula Valor del estadístico de prueba bajo H 0 H 0 : µ x µ y = 0 H : µ = µ 0 x Hipótesis alternativa H : µ x µ y 0 x y H : µ µ y t x y = S x y Distribución t de Student con g. l. = n n Aceptar H 0 Si tα /, n t t α /, n es decir, si p α x y p = P( tn > t = ) S x y n Criterios de rechazo Rechazar H 0 cuando t tα /, n o t t α /, n es decir: p<α µ x > µ y o bien µ x < µ y : observando los límites del intervalo de confianza para µ x µ y Nivel de significación: α (usualmente α=0,05, y en general 0,0 α 0,0) α/ Rechazo Aceptación Rechazo p/ α/ t(α/,n-) -t t 0 t(-α/,n-)

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 8 Contrastes de normalidad Hipótesis nula: H 0 : la variable sigue una distribución normal contra la alternativa H : la variable sigue otra distribución Estadísticos de Kolmogorv-Smirnov o Shapiro-Wilks Rechazo Rechazo Aceptación p/ α/ -z(α/) -Zvalor 0 Zvalor z(α/) CONCLUSIÓN: Si p valor α se acepta la hipótesis nula. INFERENCIA CON EL PAQUETE ESTADÍSTICO SPSS PARA WINDOWS. Proceso para comparaciones de medias:.- Diagrama de cajas y comprobar normalidad: Menú: Analizar Estadísticos descriptivos Explorar Dependientes X e Y Gráficos: Diagramas de Cajas con dependientes juntas. Gráficos: Gráficos con pruebas de Normalidad a.- Contraste de comparación de medias (datos normales): Menú: Analizar Comparar medias Prueba T para muestras relacionadas Hipótesis nula: las medias son iguales en los dos momentos b.- Contraste de comparación de variables, con datos no normales: Menú: Analizar Pruebas no paramétricas muestras relacionadas Hipótesis nula: las variables se comportan igual en los dos momentos (Wilcoxon)

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 9 Ejemplo : Fichero SPSS PAS.sav Los datos del cuadro siguiente muestran las observaciones de la presión arterial sistólica (PAS) en un grupo de 0 pacientes antes y después de un tratamiento con medicamentos combinados con una dieta especial de bajo sodio: Pas antes PAS después 60 39 55 35 80 75 40 0 50 45 30 40 90 70 9 80 70 49 65 46 Por tanto, en este caso la hipótesis nula de igualdad de medias (o de comportamiento) se traduce en que el tratamiento no produce cambios en la presión arterial sistólica (PAS). Antes de realizar el contraste, deberemos observar los datos y analizar si son Normales: Menú: Analizar Estadísticos descriptivos Explorar Dependientes PAS antes y PAS después Gráficos: Diagramas de Cajas con dependientes juntas. Gráficos: Gráficos con pruebas de Normalidad Explorar 00 80 60 40 0 PAS antes del tratamiento PAS después del tratamiento Parece que la PAS es algo superior al comienzo y que disminuye tras efectuar el tratamiento. La variabilidad de los valores es similar en ambos momentos.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 0 PAS antes del tratamiento PAS después del tratamiento Pruebas de normalidad Kolmogorov-Smirnov a Shapiro-Wilk Estadístico gl Sig. Estadístico gl Sig.,05 0,00*,970 0,893 *. Este es un límite inferior de la significación verdadera. a. Corrección de la significación de Lilliefors,9 0,9,95 0,405 Gráfico Q-Q normal de PAS antes del tratamiento Gráfico Q-Q normal sin tendencias de PAS antes del tratamiento,5,0 0,4 Normal esperado 0,5 0,0-0,5 Desv. de normal 0, 0,0 -,0-0, -,5 30 40 50 60 70 Valor observado 80 90 00 30 40 50 60 70 Valor observado 80 90 00 Gráfico Q-Q normal de PAS después del tratamiento Gráfico Q-Q normal sin tendencias de PAS después del tratamiento,5 0,6,0 0,4 Normal esperado 0,5 0,0-0,5 Desv. de normal 0, 0,0 -,0-0, -,5-0,4 0 30 40 50 Valor observado 60 70 80 0 30 40 50 Valor observado 60 70 80 Se acepta la normalidad tanto en los valores de PAS al comienzo y como en los de PAS tras el tratamiento, ya que Sig.= p 0,00 > α y p 0,9 > α para cualquier nivel de significación habitual (0,0 α 0,0) Por tanto, se debe realizar un contraste paramétrico: Comparar las medias poblacionales de PAS antes y después del tratamiento.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. Menú: Analizar Comparar medias Prueba T para muestras relacionadas Prueba T Estadísticos de muestras relacionadas Par PAS antes del tratamiento PAS después del tratamiento Desviación Error típ. de Media N típ. la media 63,0 0 0,47 6,474 49,90 0 9,86 6,067 Correlaciones de muestras relacionadas Par PAS antes del tratamiento y PAS después del tratamiento N Correlación Sig. 0,865,00 Prueba de muestras relacionadas Par PAS antes del tratamiento - PAS después del tratamiento Media Desviació n típ. Diferencias relacionadas 95% Intervalo de Error típ. de la confianza para la diferencia media Inferior Superior t gl Sig. (bilateral) 3,300 0,37 3,80 5,88 0,79 4,055 9,003 La media muestral de PAS es superior al comienzo y disminuye tras efectuar el tratamiento (3,30 en media), mientras que la desviación típica (variabilidad) es similar en ambos momentos: x = 63,0 > x 49,90 S = 0,47 > S 9, 86 antes despues = antes despues = La correlación entre los valores en ambos momentos es 0,865 bastante alta, lo que refleja una clara relación lineal y además es positiva, luego los pacientes con mayor PAS antes del tratamiento también la tienen más alta después. En cuanto a la diferencia entre las medias, al aplicar el tratamiento la PAS disminuye entre 5,88 y 0,79 con una confianza del 95%. Además en el contraste se obtiene p=sig(bilateral)=0,003 (*), luego se rechaza la igualdad de medias poblacionales con nivel de significación hasta del % (α=0,0) α/ Rechazo Aceptación Rechazo p=0,003/ t(α/,9) 0 t(-α/,9) 4,055 (*) 0,003 = p = P(tn->4,055) CONCLUSIÓN: el tratamiento disminuye la PAS de forma significativa.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. Si no se hubiera aceptado la normalidad de los datos de PAS, deberíamos realizar un contraste no paramétrico, en el que la hipótesis nula sería que la PAS se comporta igual antes y después del tratamiento. El estudio sería el siguiente: Menú: Analizar Pruebas no paramétricas muestras relacionadas (Wilcoxon) Pruebas no paramétricas Estadísticos descriptivos PAS antes del tratamiento PAS después del tratamiento N Desviación Media típica Mínimo Máximo 0 63,0 0,47 30 9 0 49,90 9,86 0 80 Prueba de los rangos con signo de Wilcoxon PAS después del tratamiento - PAS antes del tratamiento Rangos Rangos negativos Rangos positivos Empates Total a. PAS después del tratamiento < PAS antes del tratamiento b. PAS después del tratamiento > PAS antes del tratamiento c. PAS después del tratamiento = PAS antes del tratamiento N Rango Suma de promedio rangos 9 a 5,78 5,00 b 3,00 3,00 0 c 0 Z Sig. asintót. (bilateral) Estadísticos de contraste b a. Basado en los rangos positivos. PAS después del tratamiento - PAS antes del tratamiento -,507 a b. Prueba de los rangos con signo de Wilcoxon,0 En este contraste se obtiene p=sig.asintót.(bilateral)=0,0 < α, luego se rechaza que la PAS se comporta igual antes y después del tratamiento con nivel de significación de 5% (α=0,05) e incluso hasta del % (α=0,0). Observaciones: se puede decir que la PAS es menor después del tratamiento viendo que los rangos negativos son más (9 de 0) y son mayores (rango promedio) con nivel de significación % se aceptaría la hipótesis nula (se comportan igual) CONCLUSIÓN (α=0,05): el tratamiento disminuye la PAS de forma significativa.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 3 Ejemplo : Fichero SPSS dieta.sav Este fichero de datos corresponde a un estudio sobre la dieta de Stillman, consistente en proteínas y grasas animales restringiendo hidratos de carbono. El fichero contiene los datos de triglicéridos (mg/00ml) de 40 participantes, antes de comenzar la dieta y después de seguir la dieta un periodo de tiempo, 0 controlados desde el Hospital y otros 0 desde el Ambulatorio. El interés del estudio es analizar si el cambio en los triglicéridos puede atribuirse a la dieta. Información sobre las variables Variable Etiqueta Antes Triglicéridos antes de la dieta Despues Triglicéridos después de la dieta lugar Lugar de control: = Hospital = Ambulatorio Se trata por tanto de un estudio de muestras emparejadas para comparar el nivel de Triglicéridos antes y después de la dieta. En primer lugar debemos analizar los datos de la muestra y comprobar si los datos provienen de poblaciones normales..- Diagrama de cajas y Comprobar normalidad: Analizar Estadísticos descriptivos Explorar con variables dependientes antes y después Gráficos: diagrama de cajas con dependientes juntas. Gráficos con pruebas de Normalidad Pruebas de normalidad Kolmogorov-Smirnov a Shapiro-Wilk Estadístico gl Sig. Estadístico gl Sig. Triglicéridos antes de la dieta,4 40,00*,958 40,44 Triglicéridos después de la dieta,40 40,046,973 40,450 *. Este es un límite inferior de la significación verdadera. a. Corrección de la significación de Lilliefors Como se puede observar el la tabla anterior y en los gráficos de la página siguiente, los triglicéridos después de la dieta están al límite de cumplir el requisito de normalidad (no se acepta que sean normales si α=0,05=5% pero sí para α=0,04=4% o menor). Dado que hay dos grupos diferentes de pacientes, vamos a analizarlos por separado para ver si cambia la situación.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 4 Gráfico Q-Q normal de Triglicéridos antes de la dieta Gráfico Q-Q normal sin tendencias de Triglicéridos antes de la dieta 0,4 0,3 Normal esperado 0 - Desv. de normal 0, 0, 0,0-0, -0, - -0,3 60 90 0 50 80 0 60 90 0 50 80 0 Valor observado Valor observado Gráfico Q-Q normal de Triglicéridos después de la dieta Gráfico Q-Q normal sin tendencias de Triglicéridos después de la dieta 0,3 0, Normal esperado 0 Desv. de normal 0, 0,0-0, - -0, - -0,3 50 75 00 5 50 75 00 50 75 00 5 50 75 00 Valor observado Valor observado 00 50 00 50 Triglicéridos antes de la dieta Triglicéridos después de la dieta

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 5 Análisis separado de los dos grupos de pacientes: los controlados en el Hospital y los controlados en el Ambulatorio. Menú en SPSS: segmentar el archivo por grupos o seleccionar el grupo necesario y repetir estudio.- Pruebas de normalidad Triglicéridos antes de la dieta Triglicéridos después de la dieta lugar Hospital Ambulatorio Hospital Ambulatorio Kolmogorov-Smirnov a Shapiro-Wilk Estadístico gl Sig. Estadístico gl Sig.,53 0,00*,93 0,63,6 0,00*,970 0,745,4 0,00,88 0,08,47 0,00*,96 0,588 *. Este es un límite inferior de la significación verdadera. a. Corrección de la significación de Lilliefors Triglicéridos antes de la dieta Triglicéridos después de la dieta 00 9 50 00 50 Hospital lugar Ambulato.a- Contraste de comparación de medias (datos normales): Analizar Comparar medias Prueba T para muestras relacionadas.b- Para Contraste de comparación de variables, con datos no normales: Analizar Pruebas no paramétricas muestras relacionadas en Ambulatorio en Hospital

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 6.a.- Prueba T Lugar = Ambulatorio Estadísticos de muestras relacionadas a Par Triglicéridos antes de la dieta Triglicéridos después de la dieta a. lugar = Ambulatorio Media N Desviación típ. Error típ. de la media 4,90 0 9,594 6,67 6,70 0 3,593 7,88 Correlaciones de muestras relacionadas a Par Triglicéridos antes de la dieta y Triglicéridos después de la dieta a. lugar = Ambulatorio N Correlación Sig. 0,99,0 Prueba de muestras relacionadas a Par Triglicéridos antes de la dieta - Triglicéridos después de la dieta a. lugar = Ambulatorio Media Desv. típ. Diferencias relacionadas 95% Intervalo de Error típ. de la confianza para la diferencia media Inferior Superior -,800 36,905 8,5-9,07 5,47 -,8 9,830 t gl Sig. (bilateral) COMENTARIOS (como ejemplo de página ):.- Comparar medias y desviaciones muestrales de las variables..- Significado de la correlación entre las variables. 3.- Comentar la diferencia entre medias muestrales de las variables y en el intervalo de confianza. 4.- Hipótesis del contraste y análisis de si se acepta o se rechaza. 5.- Conclusión del estudio.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 7.b.- Pruebas no paramétricas Lugar = Hospital Triglicéridos antes de la dieta Triglicéridos después de la dieta a. lugar = Hospital N Estadísticos descriptivos a Media Desviación típica Mínimo Máximo 0 30,95 36,096 84 04 0 5,70 3,754 7 94 Prueba de los rangos con signo de Wilcoxon Triglicéridos después de la dieta - Triglicéridos antes de la dieta Rangos d Rangos negativos Rangos positivos Empates Total a. Triglicéridos después de la dieta < Triglicéridos antes de la dieta b. Triglicéridos después de la dieta > Triglicéridos antes de la dieta c. Triglicéridos después de la dieta = Triglicéridos antes de la dieta d. lugar = Hospital N Rango Suma de promedio rangos 4 a 0,8 4,50 6 b,5 67,50 0 c 0 Estadísticos de contraste b,c Triglicéridos después de la dieta - Triglicéridos antes de la dieta Z -,400 a Sig. asintót. (bilateral),6 a. Basado en los rangos positivos. b. Prueba de los rangos con signo de Wilcoxon c. lugar = Hospital COMENTARIOS (como ejemplo de página ):.- Comparar medias y desviaciones muestrales de las variables..- Comentar los signos de los rangos. 3.- Hipótesis del contraste y análisis de si se acepta o se rechaza. 4.- Conclusión del estudio.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 8 Ejemplo 3: Fichero SPSS Partos.sav Utiliza el fichero presentado en la primera clase para realizar el contraste de muestras emparejadas para realizar las siguientes comparaciones: Comparar si el ph arterial y el ph venoso muestran diferencias en los recién nacidos. Comparar las valoraciones del test de Apgar al minuto y a los 5 minutos. Proceso para comparaciones de medias:.- Diagrama de cajas y comprobar normalidad: Menú: Analizar Estadísticos descriptivos Explorar Dependientes X e Y Gráficos: Diagramas de Cajas con dependientes juntas. Gráficos: Gráficos con pruebas de Normalidad a.- Contraste de comparación de medias (datos normales): Menú: Analizar Comparar medias Prueba T para muestras relacionadas Hipótesis nula: las medias son iguales en los dos momentos b.- Contraste de comparación de variables, con datos no normales: Menú: Analizar Pruebas no paramétricas muestras relacionadas Hipótesis nula: las variables se comportan igual en los dos momentos (Wilcoxon) IMPORTANTE: En los comentarios hay que mencionar expresamente los nombres de las variables que se están comparando para que las conclusiones sean claras. Recordar los pasos necesarios para elaborar el estudio estadístico pegando los resultados de SPSS y añadiendo los comentarios (ver pagina ).

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 9..- Comparación de medias de dos poblaciones independientes Datos: Comparación de medias de dos poblaciones independientes con varianzas iguales X, X,..., X n y Y, Y,..., Yny de muestras aleatorias provenientes de dos x distribuciones normales X N( µ x, σ ) y Y N( µ y, σ ) independientes. (Datos: X respuesta con nivel del factor e Y respuesta con nivel del factor.) Hipótesis nula Valor del estadístico de prueba bajo H 0 H 0 : µ x µ y = H : µ = µ 0 x y 0 Hipótesis alternativa H : µ x µ y H : µ µ x y 0 t = s p x y n x + n y s p g. l. = n = ( ) + ( ) n s n s + n x x y y n x + n x y α /, n + n t t α /, n + n Aceptar H 0 Si t x y x y es decir, si p α Criterios de rechazo Rechazar H 0 cuando t t n + n o t t α /, n n α /, es decir: p<α µ x > µ y o bien x µ y intervalo de confianza para Nivel de significación: α (usualmente α 0,0) x y y + µ < : observando los límites del µ x µ y x y α/ Rechazo Aceptación Rechazo p/ α/ t(α/,n x +n y -) -t t 0 t(-α/,n x +n y -)

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 30 REQUISITOS Contraste de normalidad Hipótesis nula: H 0 : la variable sigue una distribución normal contra la alternativa H : la variable sigue otra distribución Estadísticos de Kolmogorv-Smirnov o Shapiro-Wilks Rechazo Rechazo Aceptación p/ α/ -z(α/) -Zvalor 0 Zvalor z(α/) CONCLUSIÓN: Si p valor α se acepta la hipótesis nula. Prueba de homogeneidad de varianzas Hipótesis nula H 0 L k :σ = σ = = σ contra la alternativa H : Las varianzas no son todas iguales Aceptación Rechazo p α 0 F(calculado) F(tabla) Si Si p valor α se acepta igualdad de varianzas Contraste de medias de página anterior p valor < α no se acepta igualdad de varianzas Contraste de medias de página siguiente

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 3 Comparación de medias de dos poblaciones independientes con varianzas distintas Datos: X, X,..., X n y Y, Y,..., Yny de muestras aleatorias provenientes de dos x distribuciones normales X N µ, σ ) y Y N, ) independientes. ( x x µ σ ( y y (Datos: X respuesta con nivel del factor e Y respuesta con nivel del factor.) Hipótesis nula Valor del estadístico de prueba bajo H 0 H : µ = µ 0 x Hipótesis alternativa H : µ µ x y y x * S n x S + n * t Rechazar H 0 cuando p<α µ x > µ y o bien x µ y intervalo de confianza para f Aceptar H 0 si p α Criterios de rechazo (f con aproximación de Welch) µ < : observando los límites del µ x µ y INFERENCIA CON EL PAQUETE ESTADÍSTICO SPSS PARA WINDOWS..- Diagrama de cajas y comprobar normalidad: Analizar Estadísticos descriptivos Explorar Dependientes: X Gráficos: Diagramas de Cajas (con niveles de los factores juntos). Factor: grupo Gráficos: Gráficos con pruebas de Normalidad a.- Contraste de comparación de medias (datos normales): * Analizar Comparar medias Prueba T para muestras independientes (incluye prueba de igualdad de varianzas) b.- Contraste de comparación de grupos, con datos no normales: * Analizar Pruebas no paramétricas muestras independientes (Mann-Whitney)

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 3 Ejemplo : Fichero SPSS IMC.sav - Fichero Excel datoscontrastes.xls Los datos de este ejemplo recogen el Indice de Masa Corporal (IMC) calculado para dos grupos en estudio: 4 pacientes y 8 sujetos como grupo de control. Los datos son: IMC en el grupo de Control IMC en los Pacientes 3,6,3 5,6 5,5,7 0,5,7 7,4,, 5,9,3,7,4 4,3 4,4 0,7, 5, 3,7,0,6 9,6 0,6,8 0,4,3,8 4, 3,3 0, 4,8 El fichero de SPSS IMC.sav contiene los datos de una de las hojas de cálculo del fichero Excel datoscontrastes.xls Muchas veces los datos es más sencillo introducirlos o exportarlos a un fichero Excel. Si en la hoja de cálculo de excel (en el fichero podemos tener varias hojas) ponemos en la primera filas los nombres de las variables, el paso de los datos a SPSS es bastante sencillo. Para importar a SPSS los datos de una hoja de cálculo de Excel basta abrir el fichero desde SPSS como muestra la figura: Y en la ventana siguiente señalar cuál de las hojas contiene los datos y señalar la opción Leer el nombre de las variables de la primera fila de datos :

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 33.- Diagrama de cajas y comprobar normalidad: Analizar Estadísticos descriptivos Explorar Dependientes: IMC Gráficos: Diagramas de Cajas (con niveles de los factores juntos). Factor: grupo Gráficos: Gráficos con pruebas de Normalidad IMC Grupo control paciente Pruebas de normalidad Kolmogorov-Smirnov a Shapiro-Wilk Estadístico gl Sig. Estadístico gl Sig., 8,00*,953 8,478, 4,00*,974 4,99 *. Este es un límite inferior de la significación verdadera. a. Corrección de la significación de Lilliefors 30,0 8,0 6,0 IMC 4,0,0 0,0 control Grupo paciente COMENTARIOS: para un nivel de significación del 5% (α = 0,05) Se acepta la normalidad del IMC tanto en el grupo de control como en el de los pacientes, ya que Sig.= p 0,00 > α= 0,05. Por tanto, se debe realizar un contraste paramétrico: Comparar las medias poblacionales del IMC en el grupo de control y en el de los pacientes: a.- Contraste de comparación de medias (datos normales): * Analizar Comparar medias Prueba T para muestras independientes

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 34 a.- Contraste de comparación de medias (datos normales): * Analizar Comparar medias Prueba T para muestras independientes Prueba T Estadísticos de grupo IMC Grupo control paciente N Desviación Error típ. de Media típ. la media 8,978,336,349 4 4,379,476,646 Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas IMC Se han asumido varianzas iguales F Sig. 3,836,060 IMC Se han asumido varianzas iguales No se han asumido varianzas iguales t Prueba de muestras independientes gl Prueba T para la igualdad de medias Sig. (bilateral) Diferencia de medias 95% Intervalo de Error típ. de la confianza para la diferencia diferencia Inferior Superior -3,579 30,00 -,4008,6709-3,7709 -,0307-3,340 9,087,003 -,4008,788-3,9048 -,8968 COMENTARIOS: para un nivel de significación del 5% (α = 0,05) Prueba de Levene: Las varianzas se pueden considerar iguales (Sig.= p =0,060 > α ) en los dos grupos, aunque las desviaciones típicas muestrales no nos parezcan tan similares a simple vista: S =,336 < S, 476 control paciente = Luego la comparación de medias se hace mirando la fila Se han asumido varianzas iguales. Comparación de medias poblacionales ( H 0 : µ x = µ y ): Las medias muestrales ya mostraban su diferencia x =,978 < x 4, 379 y al hacer el contraste se control paciente = rechaza que las medias poblacionales en los dos grupos sean iguales, ya que p=sig(bilateral)=0,00< α= 0,05 y con una confianza del 95% la diferencia en el IMC oscila entre,0307 y 3,7709 mayor en los pacientes. CONCLUSIÓN: El IMC es significativamente mayor en el grupo de pacientes. Nota: Se realizan 3 contrastes, pero el primero es requisito de normalidad y el segundo de comparación de varianzas. El tercero es nuestro objetivo: comparación de medias.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 35 Ejemplo : Fichero SPSS sindrome.sav Los datos de este ejemplo recogen el peso al nacer de 50 niños que presentan síndrome de dificultad respiratoria idiopático severo (SIRDS severe idiopathic respiratory distress síndrome). Es una condición seria que puede causar la muerte, como ocurrió en el caso de 7 de estos niños. La cuestión de interés acerca de estos datos es analizar si los niños que murieron difieren de los que sobrevivieron en cuanto al peso al nacer. Una variable numérica y un factor Variable Etiqueta Peso Peso al nacer Bebe Estado del bebé: = superviviente = murió.- Diagrama de cajas y comprobar normalidad: Analizar Estadísticos descriptivos Explorar Dependientes: Peso Gráficos: Diagramas de Cajas (con niveles de los factores juntos). Factor: Bebe Gráficos: Gráficos con pruebas de Normalidad Explorar: Peso al nacer Estado del bebé superviviente murió Pruebas de normalidad Kolmogorov-Smirnov a *. Este es un límite inferior de la significación verdadera. a. Corrección de la significación de Lilliefors Shapiro-Wilk Estadístico gl Sig. Estadístico gl Sig.,06 3,00*,977 3,849,77 7,030,99 7,037 4,0 3,5 3,0,5,0 Peso al nacer,5,0,5 N = 3 superviviente 7 murió Estado del bebé

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 36 COMENTARIOS: para un nivel de significación del 5% (α = 0,05) Se acepta la normalidad del peso en el grupo de bebés supervivientes (Sig.=p 0,00>α=0,05), pero no en el otro grupo, ya que Sig.= p=0,030 < α= 0,05. Por tanto, se debe realizar un contraste No paramétrico: Comparar el comportamiento del peso en los dos grupos de bebés: b.- Contraste de comparación de grupos, con datos no normales: * Analizar Pruebas no paramétricas muestras independientes (Mann-Whitney) Pruebas no paramétricas Prueba de Mann-Whitney Rangos Peso al nacer Estado del bebé superviviente murió Total N Rango Suma de promedio rangos 3 3,57 749,00 7 9,48 56,00 50 Estadísticos de contraste a U de Mann-Whitney W de Wilcoxon Z Sig. asintót. (bilateral) Peso al nacer 48,000 56,000-3,63,00 a. Variable de agrupación: Estado del bebé COMENTARIOS: para un nivel de significación del 5% (α = 0,05) Prueba Z: Se rechaza la hipótesis nula (Sig.= p = 0,00<α) luego hay diferencias significativas en el peso al nacer de los bebés que sobrevivieron frente a los que no. Al ser el promedio de rangos mayor para los supervivientes, podemos esperar pesos mayores en los que sobrevivieron (se pueden calcular estadísticos por grupos para compararlas en la muestra, como muestra el cuadro siguiente)

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 37 Ejemplo 3: Fichero SPSS DPE.sav - Fichero Excel datoscontrastes.xls La tabla siguiente muestra las observaciones de densidad de potencia espectral (DPE) calculados sobre los intervalos RR provenientes de 30 minutos de electrocardiograma ECG en reposo, en un grupo de control y en un grupo de pacientes con neuropatía autonómica cardíaca. DPE del grupo de Control DPE del grupo de Pacientes 098 3030 3689 4499 09 45 976 353 08 3375 3783 489 5 530 80 09 46 3038 3457 4739 5 453 000 87 340 307 45 49 08 34 93 399 74 336 430 4494 70 477 097 630 777 304 3707 5698 98 50 0 7 65 374 458 6349 390 66 4 998 388 30 435 6630 480 56 069 339 766 3464 4790 7585 359 764 34 3379 3 3870 4464 883 337 796 309 367.- Diagrama de cajas y comprobar normalidad: Analizar Estadísticos descriptivos Explorar Dependientes: DPE Gráficos: Diagramas de Cajas (con niveles de los factores juntos). Factor: grupo Gráficos: Gráficos con pruebas de Normalidad a.- Contraste de comparación de medias (datos normales): * Analizar Comparar medias Prueba T para muestras independientes (incluye prueba de igualdad de varianzas) b.- Contraste de comparación de grupos, con datos no normales: * Analizar Pruebas no paramétricas muestras independientes (Mann-Whitney) Cuestiones para comentar:.- Comentar el resultado de la prueba de normalidad..- Comentar si se observan diferencias es los grupos en el diagrama de cajas. 3.- Comentar los descriptivos por grupos (si es no paramétrico, obtenerlos después). 4.- Comentar el contraste: hipótesis del estudio, valor p del estadístico y conclusión del estudio (comentando intervalo de confianza si es paramétrico).

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 38 Ejemplo 4: Fichero SPSS colesterol.sav En este estudio del Western Collaborative Group llevado a cabo en California en 960-96 se analizaron 354 hombres de mediana edad con el fin de investigar la relación entre el patrón de comportamiento y el riesgo de enfermedad coronaria. Este fichero recoge los datos de los 40 hombres más pesados (al menos 5 libras, es decir, 8,7 Kg) con su nivel de colesterol (mg por 00ml) y el tipo de comportamiento: tipo A caracterizado por urgencia, agresión y ambición tipo B relajado, no competitivo y más tranquilo. La cuestión de interés es analizar si en los hombres pesados de mediana edad el nivel de colesterol está relacionado con el tipo de comportamiento. Información de las variables Variable colesterol tipo Etiqueta Colesterol en mg por 00 ml Tipo de comportamiento: urgencia, agresión, ambición relajado, no competitivo, tranquilo.- Diagrama de cajas y contraste de normalidad: Analizar Estadísticos descriptivos Explorar con dependiente colesterol y factor tipo; Gráficos: diagrama de cajas (con niveles de los factores juntos) Gráficos con pruebas de Normalidad..- Contraste de comparación de medias (datos normales): Analizar Comparar medias Prueba T para muestras independientes Para Contraste de comparación de grupos, con datos no normales: Analizar Pruebas no paramétricas muestras independientes Repetir los pasos, después de declarar el valor 40 del colesterol como valor perdido. Cuestiones para comentar:.- Comentar el resultado de la prueba de normalidad..- Comentar si se observan diferencias es los grupos en el diagrama de cajas. 3.- Comentar los descriptivos por grupos (si es no paramétrico, obtenerlos después). 4.- Comentar el contraste: hipótesis del estudio, valor p del estadístico y conclusión del estudio (comentando intervalo de confianza si es paramétrico).

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 39 TEMA 3: COMPARACIÓN DE MÁS DE DOS POBLACIONES - Comparación de medias en o más grupos (Contraste Paramétrico) en poblaciones independientes con varianzas iguales Análisis de la varianza - Comparación de distribución en o más grupos (Contraste No Paramétrico)

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 40 ANÁLISIS DE VARIANZA Comparación de medias de dos o más poblaciones independientes con distribución normal y varianzas iguales Hipótesis nula Valor del estadístico de prueba bajo H 0 H 0 : µ = µ =... = µ k Hipótesis alternativa Aceptar H 0 Si p α Criterios de rechazo Halguna µ j distinta Rechazar H 0 cuando p<α Diferencias entre medias. Pruebas Post Hoc Estadístico de contraste: SCInter = SCIntra = SCTotal r i= r SCInter r CMInter = F SCIntra r, n r (F de Snedecor) CMIntra n r n ( x i x) Variación entre los diferentes grupos i * ( n i ) S i Variación dentro de cada grupo i= * = SCInter + SCIntra = ( n ) S Variación total Estadísticos de contraste en tests de hipótesis no paramétricos Dos muestras emparejadas (Wilcoxon): + R n( n + ) n( n + )(n + ) N, 4 4 Dos muestras independientes (Mann-Whitney): U n + + n n ( ), n n n N (Wilcoxon): + Ri n ( n + + + + n ) n ( ), n n n N i Más de dos muestras independientes (Kruskal-Wallis): r H R = i 3( n + ) r n( n + ) i= n χ i

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 4 ANÁLISIS DE VARIANZA (ANOVA) CON EL PAQUETE ESTADÍSTICO SPSS PARA WINDOWS..- Diagrama de cajas y comprobar normalidad: Analizar Estadísticos descriptivos Explorar Dependientes: X Gráficos: Diagramas de Cajas (con niveles de los factores juntos). Factor: grupo Gráficos: Gráficos con pruebas de Normalidad a.- Contraste de comparación de medias (datos normales): - Analizar Comparar medias Anova de un factor Opciones: Descriptivos y Prueba de homogeneidad de varianzas. Post hoc: Tukey y Scheffe. (*) b.- Contraste de comparación de grupos, con datos no normales: - Analizar Pruebas no paramétricas k muestras independientes (Kruskal-Wallis) (*) Hay gran variedad de pruebas post hoc para realizar la comparación de medias de en. Aquí utilizamos dos de los más habituales, cuyas características son: Tukey: Utiliza el estadístico del rango estudentizado para realizar todas las comparaciones por pares entre los grupos. Establece la tasa de error por experimento como la tasa de error para el conjunto de todas las comparaciones por pares. Scheffé: Realiza comparaciones conjuntas simultáneas por pares para todas las posibles parejas de combinaciones de las medidas. Usa la distribución muestral F.

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 4 Ejemplo : Fichero SPSS presion.sav Este ejemplo se corresponde con la investigación de los efectos sobre la hipertensión de diferentes tratamientos: Medicación: droga X, droga Y, droga Z. Biofeed: reacción psicológica presente o ausente Dieta: Si o NO Se observaron 6 sujetos para cada una de las combinaciones de los tratamientos (3xx), midiendo como variable respuesta la presión sanguínea. Información sobre las variables Variable Etiqueta Valores Droga Tipo de medicamento administrado x, y, z Biofeed Biofeed: reacción psicológica B=Si NB=No Dieta Realización de dieta D=Si ND=No Presión Presión arterial Droga_n Tipo de medicamento administrado 3 Biofeed_n Biofeed: reacción psicológica =presente =ausente Dieta_n Realización de dieta =si =no Se trata de realizar un análisis de varianza de diferentes medicamentos sobre la presión sanguínea. (También se pueden analizar las diferencias según el biofeed o según la dieta con contrastes paramétricos T para muestras independientes).- Diagrama de cajas y comprobar normalidad: Analizar Estadísticos descriptivos Explorar Dependientes: presion Factor: droga Gráficos: Diagramas de Cajas (con niveles de los factores juntos). Gráficos: Gráficos con pruebas de Normalidad.a.- Análisis de varianza de factor (datos normales): Analizar Comparar medias Anova de un factor: Presion con factor droga_n. Opciones: Descriptivos y Prueba de homogeneidad de varianzas. Post hoc: Tukey y Scheffe..b.- Si los datos no son normales: Analizar Pruebas no paramétricas k muestras independientes

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 43.- Diagrama de cajas y comprobar normalidad: Analizar Estadísticos descriptivos Explorar Dependientes: presion Gráficos: Diagramas de Cajas (con niveles de los factores juntos). Factor: droga Gráficos: Gráficos con pruebas de Normalidad presion droga_n 3 Pruebas de normalidad Kolmogorov-Smirnov a Shapiro-Wilk Estadístico gl Sig. Estadístico gl Sig.,8 4,00*,956 4,356,7 4,00*,97 4,7,09 4,00*,970 4,673 *. Este es un límite inferior de la significación verdadera. a. Corrección de la significación de Lilliefors Los datos en los 3 grupos cumplen el primer requisito de que la presión sigue una distribución normal con los 3 tipos de medicación, para cualquiera de los niveles de significación habituales. 0 00 presion 80 60 droga_n 3 En el diagrama de cajas parece que tanto la mediana de la presión arterial como la dispersión es menor con la medicación (x) y la dispersión es mayor con la medicación 3 (z). Esto mismo se puede observar en la tabla de descriptivos del Análisis de Varianza (ver página siguiente).

BIOESTADÍSTICA - Posgrado en Ciencias de la Salud pag. 44.a.- Análisis de varianza de factor (datos normales): Analizar Comparar medias Anova de un factor: Presion con factor droga_n. Opciones: Descriptivos y Prueba de homogeneidad de varianzas. Post hoc: Tukey y Scheffe. ANOVA de un factor Descriptivos PRESION 3 Total N Intervalo de confianza para la media al 95% Desviación Límite Media típica Error típico Límite inferior superior Mínimo Máximo 4 74,50 3,39,79 68,88 80, 5 98 4 90,75 7,007 3,47 83,57 97,93 59 9 4 88,5 8,866 3,85 80,8 96, 56 8 7 84,50 7,839,0 80,3 88,69 5 8 En los descriptivos se observa una mayor media muestral y una mayor dispersión para la presión con los medicamentos y 3, y además es similar para ambos. Con el medicamento tanto la media muestral como la desviación de la presión es menor. De hecho, los intervalos de confianza para la media al 95% muestran que la presión con medicamentos y 3 toman valores similares mayores que 80,8, mientras que con medicamento la presión es menor y oscila entre 68,88 y 80,. Prueba de homogeneidad de varianzas PRESION Estadístico de Levene gl gl Sig.,63 69,03 También se cumple la homogeneidad de varianzas (varianzas iguales) que es el segundo requisito para realizar correctamente un análisis de la varianza, porque p=sig.=0,03 es mayor que cualquiera de los niveles de significación habituales. ANOVA PRESION Inter-grupos Intra-grupos Total Suma de Media cuadrados gl cuadrática F Sig. 3675,000 837,500 6,70,00 899,000 69 74,88 594,000 7