1 Ejemplo de análisis descriptivo de un conjunto de datos



Documentos relacionados
9.1.Análisis de tablas de contingencia

(.$263*7.5"4+%#,"8..9$ $.$ # "4< $ 8 $ 7

ESTADÍSTICA DESCRIPTIVA CON SPSS

Estimación de una probabilidad

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

ANÁLISIS DESCRIPTIVO CON SPSS

Indicaciones específicas para los análisis estadísticos.

Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos

Ejercicio de estadística para 3º de la ESO

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS

Aplicaciones de Estadística Descriptiva

MANUAL PARA EL USO DE SPSS

RESUMEN DE PROCEDIMIENTOS EN SPSS. Definición de variables Pestaña Vista de variables Definir cada variable con su nombre, tipo, valores y medida

SESIÓN PRÁCTICA DE BIOESTADÍSTICA: EVALUACIÓN DE CRITERIOS DIAGNÓSTICOS. DISCRIMINACIÓN.

CORRELACIONES CON SPSS

Universidad de Málaga

1 Introducción al SPSS

Tema 2. Análisis gráfico Ejercicios resueltos 1

Test de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n

ESTIMACIÓN. puntual y por intervalo

Las técnicas muestrales, los métodos prospectivos y el diseño de estadísticas en desarrollo local

1.1. Introducción y conceptos básicos

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso

Covarianza y coeficiente de correlación

Fundamentos de Biología Aplicada I Estadística Curso Práctica 6: Regresión Logística I

Capítulo 7: Distribuciones muestrales

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

SOLUCIÓN CASO GESTIÓN DE PERSONAL I

Análisis estadístico con Microsoft Excel

Cálculos con el programa R

Introducir el concepto de comparación de modelos. Ajuste de una recta a varios grupos. Ajuste de una recta a cada grupo. Ajuste de rectas paralelas.

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

1. Análisis de variables cuantitativas (2 a parte)

Otras medidas descriptivas usuales

SPSS: ANOVA de un Factor

CORRELACIÓN Y PREDICIÓN

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

TEMA 4: Introducción al Control Estadístico de Procesos

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL

PRUEBAS NO PARAMÉTRICAS

1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros

MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS

Estudio de casos y controles sobre factores de riesgo en el cáncer colorrectal

Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics-

Tema 3. Comparaciones de dos poblaciones

Estadística: conceptos básicos y definiciones.

CASO PRÁCTICO DISTRIBUCIÓN DE COSTES

Práctica 3. Explorando datos con Statistix

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral

9.2.Ejemplos de análisis de tablas de contingencia

Tema 12: Contrastes Paramétricos

Introducción al SPSS/PC. 1. El editor de datos. Taller de Estadística

ESTADÍSTICA SEMANA 4

Procesamiento de información para la investigación utilizando el programado Excel recopilados. Los participantes rán en

ESTADÍSTICA. Prácticas con Microsoft Excel

Las bebidas Alcohólicas

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso

Medidas de tendencia central o de posición: situación de los valores alrededor

5.- ANÁLISIS DE RIESGO

x y 8000 x + y a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

Práctica 2. Estadística Descriptiva

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.

Análisis y cuantificación del Riesgo

Introducción a la Estadística con Excel

Criterios para decidir qué gráfico usar en cada trabajo estadístico

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales

Práctica 2 ESTADÍSTICA DESCRIPTIVA

Relación entre formación y empleo

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica.

Este documento enumera los diferentes tipos de Diagramas Matriciales y su proceso de construcción.

MERCADOS FINANCIEROS: LOS FONDOS DE INVERSIÓN II

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz

ÍNDICE 1. INTRODUCCIÓN PARTICIPANTES Participantes por sector Participantes por edad... 6

2. Seleccionar Insertar función:

2 VARIABLES ESTADÍSTICAS BIDIMENSIONALES

ANÁLISIS DE DATOS NO NUMERICOS

Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3

PRÁCTICA No. 1 ESTADÍSTICA DESCRIPTIVA PARTE I

UNIVERSIDAD CARLOS III DE MADRID CURSO DE FORMACION ESTADISTICA CHEMO MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS

CUARTA GUÍA DE EJERCICIOS: PRUEBAS DE HIPÓTESIS

TEMA 7: Análisis de la Capacidad del Proceso

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

Introducción a la Econometría (LE y LADE, mañana) Prof. Magdalena Cladera ANÁLISIS DE REGRESIÓN CON EXCEL Y SPSS

EL DESARROLLO DEL JUEGO Y EL USO DEL JUGUETE

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante

Semana de dieta (X) Peso en Kg (Y)

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

Parámetros y estadísticos

Statgraphics Centurión

Capítulo 14. Análisis de varianza de un factor: El procedimiento ANOVA de un factor

CUESTIONES DE AUTOEVALUACIÓN (TEMA 1)

OBTENER DATOS EXTERNOS

Enunciado unidades fraccionarias fracción fracciones equivalentes comparar operaciones aritméticas fracciones propias Qué hacer deslizador vertical

Capítulo 18 Análisis de regresión lineal El procedimiento Regresión lineal

Administración de Empresas. 11 Métodos dinámicos de evaluación de inversiones 11.1

INDICADORES POR ENCUESTA. Cuaderno Práctico -1 -

Transcripción:

1 Ejemplo de análisis descriptivo de un conjunto de datos 1.1 Introducción En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos conceptos básicos y proporcionar un guía de trabajo que sirva de referencia en el análisis descriptivo. A lo largo del ejemplo, se comentaran los procedimientos propios de SPSS y se propondrán algunas cuestiones de interpretación de resultados. 1.2 Base de datos La base de datos para este ejemplo se encuentra en la página: http://www.udl.es/usuaris/q3695988/webcursprimer/ En dicha página, seleccionar la opción Casos Prácticos en la barra izquierda. Una vez en Casos prácticos, seleccionar la base de datos del ejemplo: Factores implicados en la evolución a ciertas intervenciones quirúrgicas. 1.3 Enunciado general del ejemplo En un estudio se quiere evaluar la posible relación entre determinados factores clínicos y la evolución observada en determinados procesos post operatorios relacionados con una patología. Para ello, se han recogido los datos de un conjunto de pacientes sometidos a intervención quirúrgica en el último año. La información recogida es la siguiente: Género: 1 Hombre, 2 Mujer IMC Indice de masa corporal Concentración 1 Concentración 2 Concentración 3 Gravedad al ingreso:,, Ingreso: 1 Programado, 2 Urgencia Evolución,, 1.4 Objetivos Realizar una descriptiva completa del conjunto de datos, justificando en cada caso el método elegido Estimar el rango de normalidad de los metabolitos incluidos en este estudio en función de la evolución de los pacientes. Evaluar la posibilidad de utilizar alguno de estos metabolitos como pronóstico de evolución. Determinar si la evolución está relacionada con la gravedad al ingreso. Qué factores pueden influenciar esta relación? Comparar las concentraciones de los metabolitos entre hombres y mujeres. Estudiar la relación entre los niveles de los metabolitos y la evolución EJEMPLO ANÁLISIS DE DATOS - 1 -

2 Análisis 2.1 Realizar una descriptiva completa del conjunto de datos, justificando en cada caso el método elegido 2.1.1 Variables cualitativas En este conjunto de datos, disponemos de distintas variables cualitativas (género, gravedad al ingreso, ingreso y evolución. Por otra parte, disponemos de distintas variable cuantitativas (imc, y las distintas concentraciones). Empezaremos realizando una descriptiva de las variables cualitativas, teniendo en cuenta las distintas variables de que se dispone y los objetivos del estudio. Para ello, fundamentalmente podemos utilizar gráficos de barras y tablas de porcentajes. En primer lugar, estudiaremos los resultados de la base de datos desde el punto de vista de tablas de porcentajes, relacionando la gravedad al ingreso con la evolución de los pacientes. El procedimiento para obtener esta tabla es: Analizar>Estadisticos descriptivos>tablas de contingencia Seleccionaremos la gravedad al ingreso en las filas y la evolución en las columnas: A continuación, indicaremos en la opción Casillas.. que nos interesan los porcentajes de fila: EJEMPLO ANÁLISIS DE DATOS - 2 -

El resultado que se obtiene es: Tabla de contingencia * 12 23 18 53 22,6% 43,4% 34,0% 100,0% 12 25 7 44 27,3% 56,8% 15,9% 100,0% 41 31 7 79 51,9% 39,2% 8,9% 100,0% 65 79 32 176 36,9% 44,9% 18,2% 100,0% Los porcentajes parecen indicar que la gravedad al ingreso comporta una peor evolución. Para evaluar este punto, podemos calcular los residuales ajustados. En la opción Casillas seleccionaos esta opción: La nueva tabla será: EJEMPLO ANÁLISIS DE DATOS - 3 -

Tabla de contingencia * 12 23 18 53 22,6% 43,4% 34,0% 100,0% -2,6 -,3 3,6 12 25 7 44 27,3% 56,8% 15,9% 100,0% -1,5 1,8 -,5 41 31 7 79 51,9% 39,2% 8,9% 100,0% 3,7-1,4-2,9 65 79 32 176 36,9% 44,9% 18,2% 100,0% Donde puede verse que, efectivamente, podemos concluir que el porcentaje de pacientes con gravedad () al ingreso evoluciona peor () que el resto. EJEMPLO ANÁLISIS DE DATOS - 4 -

Podemos estimar la probabilidad de que un paciente con una gravedad () al ingreso tenga una evolución (). Para ello, recordad que el intervalo de confianza (95%) para una probabilidad π es: π p 0 ± 1.96 p (1 p ) 0 n 0 (1) Utilizando esta expresión podemos calcular, para el grupo de gravedad () al ingreso: π 0.52 ± 1.96 π 0.52 ± 0.11 π (0.41,0.63) 0.52 0.48 79 (2) Este resultado puede compararse con el resultado para los pacientes con gravedad () al ingreso π 0.23 ± 1.96 π 0.23 ± 0.11 π (0.12,0.34) 0.23 0.77 53 (3) Podéis comprobar que ambos intervalos no se solapan, indicando que la probabilidad de evolucionar desfavorablemente es superior en el grupo de mayor gravedad al ingreso. Ejercicio: calcular los intervalos de confianza para todas las probabilidades de la tabla anterior. Discutir los resultados y relacionarlos con la interpretación de los residuales ajustados. Los resultados de una tabla de contingencia pueden representarse mediante una gráfica de barras. Para ello, utilizaremos la opción Gráficos>Barras, seleccionando la opción de Agrupado EJEMPLO ANÁLISIS DE DATOS - 5 -

En el cuadro de diálogo correspondiente, indicaremos: Es importante seleccionar la opción % de casos para que los resultados se expresen según porcentajes. En el eje de categorías situaremos la evolución, y los grupos vendrán definidos por gravedad. El resultado será: 60 50 40 30 20 Porcentaje 10 0 Donde se indican los mismos porcentajes de la tabla anterior. Puede apreciarse que el porcentaje de pacientes con evolución desfavorable () aumenta con la gravedad al ingreso, mientras que la proporción de pacientes con buena evolución () disminuye. Ejercicio: Copia los resultados de la tabla a un fichero de Excel y calcula los intervalos de confianza para cada probabilidad. Incluye unas barras de error que complementen la gráfica de barras. EJEMPLO ANÁLISIS DE DATOS - 6 -

Hasta este punto, hemos relacionado la evolución con la gravedad al ingreso. Seria interesante explorar si esta relación es similar en hombres y mujeres. Para ello, podemos repetir la tabla de contingencia incluyendo la variable género como una capa. Con ello, se realizará una tabla independiente para hombres y mujeres: El resultado que obtendremos será: Tabla de contingencia * * GENERO GENERO Hombre Mujer 6 9 8 23 26,1% 39,1% 34,8% 100,0% -1,4 -,4 2,3 4 7 6 17 23,5% 41,2% 35,3% 100,0% -1,4 -,2 1,9 22 20 2 44 50,0% 45,5% 4,5% 100,0% 2,4,5-3,6 32 36 16 84 38,1% 42,9% 19,0% 100,0% 6 14 10 30 20,0% 46,7% 33,3% 100,0% -2,2,0 2,8 8 18 1 27 29,6% 66,7% 3,7% 100,0% -,8 2,5-2,2 19 11 5 35 54,3% 31,4% 14,3% 100,0% 2,9-2,3 -,6 33 43 16 92 35,9% 46,7% 17,4% 100,0% Puede apreciarse que no la tendencia es similar en ambos casos. Ejercicio: Estima la probabilidad de que una mujer con gravedad () al ingreso evolucione desfavorablemente (). Compara este resultado con el correspondiente para los hombres. Repite este cálculo para el evolución (). EJEMPLO ANÁLISIS DE DATOS - 7 -

Utilizando los mismos procedimientos, exploraremos la posible relación entre el tipo de ingreso y la evolución. Obtenemos: Tabla de contingencia INGRESO * INGRESO Programado Urgencias % de INGRESO % de INGRESO % de INGRESO 24 39 19 82 29,3% 47,6% 23,2% 100,0% -2,0,7 1,6 41 40 13 94 43,6% 42,6% 13,8% 100,0% 2,0 -,7-1,6 65 79 32 176 36,9% 44,9% 18,2% 100,0% De estos resultados, podemos indicar que los pacientes de urgencias presentan una proporción superior de evolución desfavorable, si bien los resultados no son muy significativos. En este caso, seria conveniente considerar la gravedad al ingreso: Tabla de contingencia INGRESO * * INGRESO INGRESO INGRESO Programado Urgencias Programado Urgencias Programado Urgencias % de INGRESO % de INGRESO % de INGRESO % de INGRESO % de INGRESO % de INGRESO % de INGRESO % de INGRESO % de INGRESO 5 14 13 32 15,6% 43,8% 40,6% 100,0% -1,5,1 1,3 7 9 5 21 33,3% 42,9% 23,8% 100,0% 1,5 -,1-1,3 12 23 18 53 22,6% 43,4% 34,0% 100,0% 3 11 3 17 17,6% 64,7% 17,6% 100,0% -1,1,8,3 9 14 4 27 33,3% 51,9% 14,8% 100,0% 1,1 -,8 -,3 12 25 7 44 27,3% 56,8% 15,9% 100,0% 16 14 3 33 48,5% 42,4% 9,1% 100,0% -,5,5,1 25 17 4 46 54,3% 37,0% 8,7% 100,0%,5 -,5 -,1 41 31 7 79 51,9% 39,2% 8,9% 100,0% Ejercicio: Utilizando tablas de frecuencias, explora la relación entre la evolución de los pacientes y su gravedad al ingreso teniendo en cuenta el tipo de ingreso y el género. Discute las limitaciones de los resultados que obtengas. EJEMPLO ANÁLISIS DE DATOS - 8 -

2.1.2 Variables cuantitativas Al realizar una descriptiva de la variables cuantitativas, es conveniente, en primer lugar, comprobar si se comportan como una normal. Para ello, podemos utilizar gráficas P-P. El procedimiento es: Gráficos>P-P: El resultado para conc1 es: 1,0 Normal gráfico P-P de CONC3,8,5 Prob acum esperada,3 0,0 0,0,3,5,8 1,0 Prob acum observada EJEMPLO ANÁLISIS DE DATOS - 9 -

Normal gráfico P-P sin tendencia d,03,02,01 Desviación de Normal 0,00 -,01 -,02 -,2 0,0,2,4,6,8 1,0 1,2 Prob acum observada Puede observase que la gráfica P-P se acerca bastante a la diagonal, sin que la gráfica de desviaciones muestre diferencias importantes respecto a los valores esperados según la distribución normal. Ejercicio: Comprobar la normalidad del resto de variables cuantitativas. Podemos completar este análisis descriptivo de la normalidad mediante histogramas. Para ello, seleccionamos Gráficos>Histograma: EJEMPLO ANÁLISIS DE DATOS - 10 -

El resultado para conc3 es: 50 40 30 20 10 Desv. típ. = 4,48 Media = 42,8 0 N = 176,00 32,6 37,2 41,8 46,4 51,0 CONC3 Ejercicio: Estudia la distribución del resto de variables cuantitativas mediante histogramas Para el estudio descriptivo de variables cuantitativas continuas, es más interesante utilizar diagramas de cajas. Este tipo de gráficas nos permite comparar la distribución de cada variable en función de distintas variables cuantitativas. Así, podemos comparar la distribución de conc3 en función de la gravedad al ingreso. Para ello, seleccionamos: Graficos>Diagramas de Cajas>Simple: EJEMPLO ANÁLISIS DE DATOS - 11 -

Obtenemos: 60 118 50 40 30 39 CONC3 20 N = 53 44 79 Podemos apreciar que no se observan cambios importantes en la distribución de esta variable en los distintos grupos de pacientes según la gravedad al ingreso. Los valores extremos en el caso de gravedad () indican individuos con valores alejados del resto. Estos valores deben validarse para excluir errores en la entrada de datos. Mediante diagramas de cajas, podemos explorar la distribución de una variable en función de dos variables cualitativas. Por ejemplo, podemos verificar si el tipo de ingreso y la gravedad determinan diferencias en la distribución de conc3. Para ello utilizaremos: Graficos>Diagramas de Cajas>Agrupados: EJEMPLO ANÁLISIS DE DATOS - 12 -

60 68 50 40 30 39 INGRESO CONC3 20 N = 32 21 17 27 33 46 Programado Urgencias Podemos observar que no se producen variaciones apreciables. Ejercicio: Determina si la gravedad al ingreso y el género determinan alguna variación importante en la distribución de imc, y de las concentraciones. EJEMPLO ANÁLISIS DE DATOS - 13 -

El análisis exploratorio de estos datos nos indica que existen algunas diferencias importantes en función de la edad: 130 120 110 37 75 100 90 CONC2 80 N = 84 Hombre 92 Mujer GENERO Esta descriptiva puede completarse mediante tablas de medias y desviaciones típicas. Para ello podemos utilizar Analizar>Comparar Medias>Medias: Informe CONC1 GENERO Hombre Mujer Media Desv. típ. N 51,670 2,3444 84 51,748 2,6864 92 51,711 2,5221 176 EJEMPLO ANÁLISIS DE DATOS - 14 -

Podemos completar el análisis, introduciendo distintas capas y pivotando la tabla resultante. Así, podemos comparar las medias en función del género, ingreso y gravedad: Informe CONC1 GENERO Hombre Mujer INGRESO Programado Urgencias Media Desv. típ. N Media Desv. típ. N Media Desv. típ. N 52,9 3,0 12 52,1 1,9 11 52,5 2,5 23 54,2 2,6 6 51,8 1,9 11 52,7 2,4 17 50,7 2,1 17 50,9 1,9 27 50,8 1,9 44 52,1 2,8 35 51,4 1,9 49 51,7 2,3 84 53,6 2,7 20 52,3 2,8 10 53,2 2,7 30 51,1 3,4 11 51,4 1,5 16 51,3 2,4 27 51,3 2,7 16 50,5 2,1 19 50,9 2,4 35 52,3 3,0 47 51,2 2,2 45 51,7 2,7 92 53,3 2,8 32 52,2 2,3 21 52,9 2,6 53 52,2 3,4 17 51,6 1,6 27 51,8 2,5 44 51,0 2,4 33 50,7 2,0 46 50,8 2,1 79 52,2 2,9 82 51,3 2,0 94 51,7 2,5 176 Desde el punto de vista exploratorio, es interesante determinar la posible relación entre variables cuantitativas. Esta descriptiva puede realizarse mediante gráficas de dispersión: Graficos>Dispersión: Obtenemos: EJEMPLO ANÁLISIS DE DATOS - 15 -

120 110 100 90 CONC2 80 44 46 48 50 52 54 56 58 60 CONC1 Puede observarse que no existe una tendencia evidente entre los valores de ambas variables. Ejercicio: Utilizando los procedimientos anteriores, realiza una descriptiva completa de los datos. En función de los resultados, indica una interpretación global de los mismos en función de los objetivos que se han planteado. EJEMPLO ANÁLISIS DE DATOS - 16 -

2.2 Estimar el rango de normalidad de los metabolitos incluidos en este estudio en función de la evolución de los pacientes. Evaluar la posibilidad de utilizar alguno de estos metabolitos como pronóstico de evolución. Si podemos admitir una distribución normal, el intervalo de normalidad al 95% se calcula como: X ±. 96 s 1 (4) Para ello, debemos calcular las medias y desviaciones típicas correspondientes a los casos de interés. Vamos a calcular dichas medias para hombres y mujeres: Informe EDAD IMC CONC1 CONC2 CONC3 Media Desv. típ. Error típ. de la media N Media Desv. típ. Error típ. de la media N Media Desv. típ. Error típ. de la media N Media Desv. típ. Error típ. de la media N Media Desv. típ. Error típ. de la media N GENERO Hombre Mujer 53,64 60,89 57,43 4,949 4,488 5,939,540,468,448 84 92 176 22,51 20,50 21,46,951,955 1,385,104,100,104 84 92 176 51,670 51,748 51,711 2,3444 2,6864 2,5221,2558,2801,1901 84 92 176 104,370 93,932 98,914 6,0601 6,2720 8,0756,6612,6539,6087 84 92 176 45,000 40,880 42,847 4,2134 3,7652 4,4777,4597,3925,3375 84 92 176 En función de estos resultados, los valores normales (que expresan entre que valores esperamos el 95% de los resultados individuales) para conc2 serian, para los hombres: Para las mujeres serian: 104.37 ± 1.96 6.06 (5) 104.37 ± 11.88 (92.49,116.25) 93,93± 1.96 8.07 (6) 93.93 ± 15.82 (78.11,109.75) Puede verse que los resultados esperados se sitúan ligeramente por debajo en hombres que en mujeres. EJEMPLO ANÁLISIS DE DATOS - 17 -

Ejercicio: Calcula los intervalos de referencia para el resto de variables Ejercicio: Calcula los intervalos de referencia de cada variable según el grado de evolución Si estamos interesados en determinar qué variable puede ser utilizada para clasificar a los pacientes para predecir su posible evolución, debemos establecer qué variable presenta diferencias de distribución en función de la evolución. Para ello, podemos empezar utilizando diagramas de barras: 70 60 60 122 157 50 CONC1 40 N = 65 22 79 32 Puede observarse que existe una relación entre la evolución y la conc1. Esta variable podría utilizarse como indicativo de evolución en el diseño de un criterio diagnóstico. Para explorar esta posibilidad, podemos calcular una curva ROC. El procedimiento indica si la variable en cuestión puede discriminar un determinado grupo de pacientes. En este caso, tomaremos como grupo de interés al grupo (). El procedimiento es: Gráficos>Curva COR EJEMPLO ANÁLISIS DE DATOS - 18 -

El resultado que se obtiene es: 1,0 Curva COR,8,5 Sensibilidad,3 0,0 0,0,3,5,8 1,0 1 - Especificidad Los segmentos diagonales son producidos por los empates Podemos apreciar que esta variable discrimina bien entre el grupo de buena evolución () y el resto de grupos. Podemos incluir a las otras variables en la misma gráfica: Curva COR 1,0,8,5 Procedencia de la cu Sensibilidad,3 0,0 CONC3 CONC2 CONC1 0,0,3,5,8 1,0 1 - Especificidad Los segmentos diagonales son producidos por los empates. EJEMPLO ANÁLISIS DE DATOS - 19 -

Podemos apreciar que conc3 no discrimina en absoluto, mientras que conc2 proporciona alguna discriminación pero en menor medida que conc1. 2.3 Determinar si la evolución está relacionada con la gravedad al ingreso. Qué factores pueden influenciar esta relación? Podemos estudiar esta relación mediante tablas de contingencia. En primer lugar, tenemos: Tabla de contingencia * 12 23 18 53 22,6% 43,4% 34,0% 100,0% -2,6 -,3 3,6 12 25 7 44 27,3% 56,8% 15,9% 100,0% -1,5 1,8 -,5 41 31 7 79 51,9% 39,2% 8,9% 100,0% 3,7-1,4-2,9 65 79 32 176 36,9% 44,9% 18,2% 100,0% Pruebas de chi-cuadrado Valor gl Sig. asintótica (bilateral) Chi-cuadrado de Pearson 21,976 a 4,000 Razón de verosimilitud 21,339 4,000 Asociación lineal por lineal 18,551 1,000 N de casos válidos 176 a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 8,00. Por lo tanto, como ya habíamos comentado en el apartado 2.1.1, se observa una relación significativa entre la gravedad al ingreso y la evolución, de manera que la probabilidad de una buena evolución esta asociada a una menor gravedad al ingresos. EJEMPLO ANÁLISIS DE DATOS - 20 -

Si consideramos el tipo de ingreso y el género como posibles factores de confusión encontramos: Tabla de contingencia GENERO Hombre Mujer 6 9 8 23 26,1% 39,1% 34,8% 100,0% -1,4 -,4 2,3 4 7 6 17 23,5% 41,2% 35,3% 100,0% -1,4 -,2 1,9 22 20 2 44 50,0% 45,5% 4,5% 100,0% 2,4,5-3,6 32 36 16 84 38,1% 42,9% 19,0% 100,0% 6 14 10 30 20,0% 46,7% 33,3% 100,0% -2,2,0 2,8 8 18 1 27 29,6% 66,7% 3,7% 100,0% -,8 2,5-2,2 19 11 5 35 54,3% 31,4% 14,3% 100,0% 2,9-2,3 -,6 33 43 16 92 35,9% 46,7% 17,4% 100,0% Tabla de contingencia INGRESO Programado Urgencias 5 14 13 32 15,6% 43,8% 40,6% 100,0% -2,2 -,6 3,0 3 11 3 17 17,6% 64,7% 17,6% 100,0% -1,2 1,6 -,6 16 14 3 33 48,5% 42,4% 9,1% 100,0% 3,1 -,8-2,5 24 39 19 82 29,3% 47,6% 23,2% 100,0% 7 9 5 21 33,3% 42,9% 23,8% 100,0% -1,1,0 1,5 9 14 4 27 33,3% 51,9% 14,8% 100,0% -1,3 1,2,2 25 17 4 46 54,3% 37,0% 8,7% 100,0% 2,1-1,1-1,4 41 40 13 94 43,6% 42,6% 13,8% 100,0% EJEMPLO ANÁLISIS DE DATOS - 21 -

Estos resultados parecen indicar ambos factores no influencian de manera significativa la relación entre la gravedad al ingreso y la evolución. Finalmente, aunque no disponemos de muestra suficiente, podemos considerar todos los factores simultáneamente: Tabla de contingencia * * GENERO * INGRESO INGRESO Programado Urgencias Hombre GENERO Mujer 2 4 6 12 3 10 7 20 16,7% 33,3% 50,0% 100,0% 15,0% 50,0% 35,0% 100,0% -1,6 -,8 2,8-1,4 -,1 1,6 1 3 2 6 2 8 1 11 16,7% 50,0% 33,3% 100,0% 18,2% 72,7% 9,1% 100,0% -1,0,4,7 -,6 1,6-1,3 9 8 0 17 7 6 3 16 52,9% 47,1%,0% 100,0% 43,8% 37,5% 18,8% 100,0% 2,3,5-3,1 2,1-1,3 -,5 12 15 8 35 12 24 11 47 34,3% 42,9% 22,9% 100,0% 25,5% 51,1% 23,4% 100,0% 4 5 2 11 3 4 3 10 36,4% 45,5% 18,2% 100,0% 30,0% 40,0% 30,0% 100,0% -,3,2,2-1,2 -,2 2,2 3 4 4 11 6 10 0 16 27,3% 36,4% 36,4% 100,0% 37,5% 62,5%,0% 100,0% -1,0 -,5 2,0 -,9 2,0-1,8 13 12 2 27 12 5 2 19 48,1% 44,4% 7,4% 100,0% 63,2% 26,3% 10,5% 100,0% 1,2,2-1,9 1,9-1,8 -,1 20 21 8 49 21 19 5 45 40,8% 42,9% 16,3% 100,0% 46,7% 42,2% 11,1% 100,0% EJEMPLO ANÁLISIS DE DATOS - 22 -

INGRESO Programado Urgencias GENERO Hombre Mujer Hombre Mujer Pruebas de chi-cuadrado Chi-cuadrado de Pearson Razón de verosimilitud Asociación lineal por lineal N de casos válidos Chi-cuadrado de Pearson Razón de verosimilitud Asociación lineal por lineal N de casos válidos Chi-cuadrado de Pearson Razón de verosimilitud Asociación lineal por lineal N de casos válidos Chi-cuadrado de Pearson Razón de verosimilitud Asociación lineal por lineal N de casos válidos Sig. asintótica Valor gl (bilateral) 11,792 a 4,019 14,805 4,005 9,501 1,002 35 7,033 b 4,134 6,935 4,139 3,670 1,055 47 5,089 c 4,278 4,774 4,311 1,509 1,219 49 9,694 d 4,046 10,415 4,034 3,683 1,055 a. 6 casillas (66,7%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 1,37. b. 5 casillas (55,6%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 2,57. c. 7 casillas (77,8%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 1,80. d. 5 casillas (55,6%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 1,11. 45 Podemos observar que en algunos casos, la relación deja de ser significativa. Parte de este cambio es debido a la falta de casos, sin descartar totalmente la posibilidad de interacciones significativas que determinen una evolución distinta en cada tipo de paciente. Por lo tanto, seria conveniente diseñar un estudio más completo y utilizar técnicas estadísticas más potentes (multivariantes) para explorar el problema. 2.4 Comparar las concentraciones de los metabolitos entre hombres y mujeres. La comparación descriptiva de las concentraciones entre hombres y mujeres puede hacerse mediante diagramas de cajas. Por ejemplo, para conc2 tenemos: 130 120 110 37 75 100 90 CONC2 80 N = 84 Hombre 92 Mujer GENERO EJEMPLO ANÁLISIS DE DATOS - 23 -

Podemos ver que existen diferencias apreciables. Podemos completar esta descripción mediante el cálculo de índices muestrales: Informe CONC2 GENERO Hombre Mujer Error típ. de Media Desv. típ. la media Mínimo Máximo N 104,4 6,1,7 90,6 118,2 84 93,9 6,3,7 83,5 110,6 92 98,9 8,1,6 83,5 118,2 176 Finalmente, podemos comparar ambos grupos y estimar la diferencia de muestras. Para ello utilizaremos la opción: Analizar>Comparar Medias>Prueba T para dos muestras independientes Debemos definir los códigos de la variable género para definir los grupos que queremos comparar: El resultado es: Prueba de muestras independientes CONC2 Se han asumido varianzas iguales No se han asumido varianzas iguales Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias 95% Intervalo de confianza para la Diferencia Error típ. de diferencia F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior,032,858 11,208 174,000 10,439,9314 8,6004 12,2770 11,225 173,434,000 10,439,9299 8,6033 12,2742 En este punto, debemos recordar que la prueba de Levene para la igualdad de varianzas permite evaluar si las muestras son compatibles con la hipótesis de que las varianzas poblacionales son iguales. En este caso, p=0.858, lo que indica que podemos asumir que las varianzas son iguales. EJEMPLO ANÁLISIS DE DATOS - 24 -

La prueba de T evalúa si las muestras son compatibles con la hipótesis de igualdad de medias poblacionales. En este caso, siguiendo la primera fila puesto que asumimos igualdad de varianzas, p=0.000, lo que indica que las muestras no son compatibles con la hipótesis. La estimación de la diferencia de medias es entre 8.6 y 12,3, indicando que la concentración media en los hombres (grupo 1) es superior a la de las mujeres. Ejercicio: Evaluar la igualdad de medias poblacionales en el resto de variables en función del sexo 2.5 Estudiar la relación entre los niveles de los metabolitos y la evolución La descriptiva de respecto a la evolución de los pacientes proporciona el siguiente resultado: 130 120 110 100 90 CONC2 80 N = 65 79 32 15 Indicando que puede existir una relación significativa entre el nivel de conc2 y la evolución, sin que ello implique necesariamente una relación causa-efecto. Podemos estimar el valor medio de conc2 para cada nivel de evolución. Para ello utilizaremos: Gráficos>Barras de error>simple: EJEMPLO ANÁLISIS DE DATOS - 25 -

120 110 95% IC CONC2 100 90 N = 65 79 32 Puede observarse que el valor medio se incrementa en cada grupo de evolución. A partir de estos resultados, podemos aventurar al interpretación de que las diferencias son significativas, dado que los intervalos no se solapan. Sin embargo, esta interpretación es provisional y deberíamos emplear un procedimiento estadístico que permitiera evaluar esta hipótesis. El procedimiento adecuado en este caso sería el análisis de la varianza (ANOVA). Podemos evaluar el posible efecto de otras variables. Así, por ejemplo, si seleccionamos Graficos>Barras de error>agrupados: EJEMPLO ANÁLISIS DE DATOS - 26 -

Obtenemos: 120 110 100 GENERO 95% IC CONC2 90 80 N = 32 33 36 43 16 16 Hombre Mujer En esta gráfica, podemos observar que la concentración media es superior en hombres a cualquier nivel de evolución y que las diferencias son constantes. Por otra parte, la relación entre la concentración media y la evolución es similar en hombre y mujeres. Por lo tanto, podríamos concluir que la relación entre evolución y concentración es independiente del género. Como en el caso anterior, deberíamos utilizar un procedimiento de ANOVA para verificar esta interpretación. Ejercicio: Determina si la gravedad al ingreso es un factor que modifique la relación entre conc2 y la evolución. EJEMPLO ANÁLISIS DE DATOS - 27 -