EVALUACIÓN DE PRUEBAS DIAGNÓSTICAS



Documentos relacionados
Estimación de una probabilidad

ANÁLISIS DE DATOS NO NUMERICOS

1.1. Introducción y conceptos básicos

Anexo 12-a. Plantillas de lectura crítica del SIGN

EPIDEMIOLOGIA CLINICA

Investigación sobre pruebas diagnósticas

Ensayos Clínicos en Oncología

Covarianza y coeficiente de correlación

ESTIMACIÓN. puntual y por intervalo

Tema 3. Medidas de tendencia central Introducción. Contenido

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones.

DISEÑOS DE INVESTIGACIÓN

TEMA 4: Introducción al Control Estadístico de Procesos

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

Funciones, x, y, gráficos

Cifras significativas e incertidumbre en las mediciones

LA MEDIDA Y SUS ERRORES

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

CONCEPTOS DE LA FUERZA

Nure Investigación Nº 63 Marzo - Abril Lectura crítica de un artículo científico V: La valoración de la relevancia clínica

DATA MINING EN LA BASE DE DATOS DE LA OMS KNOWLEDGE DETECTION (DETECCIÓN DEL CONOCIMIENTO) Q.F.B. JUANA LETICIA RODRÍGUEZ Y BETANCOURT

Importancia de la investigación clínica EN ONCOLOGÍA. ONCOvida. oncovida_20.indd 1 10/10/11 12:53

Indicaciones específicas para los análisis estadísticos.

Análisis de los datos

Calibración y control de calidad de instrumentos de análisis

Otras medidas descriptivas usuales

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE PSICOLOGÍA DIVISIÓN DE ESTUDIOS PROFESIONALES Octubre, 2010.

Sistemas de Gestión de Calidad. Control documental

Preguntas que se hacen con frecuencia sobre los estudios clínicos

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

Validation. Validación Psicométrica. Validation. Central Test. Central Test. Centraltest CENTRAL. L art de l évaluation. El arte de la evaluación

Técnicas de valor presente para calcular el valor en uso

1 Ejemplo de análisis descriptivo de un conjunto de datos

INFORME DE ANÁLISIS DE ENCUESTAS DE SATISFACCIÓN DE USUARIOS PERÍODO

Un problema sobre repetidas apuestas al azar

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz

Es de aplicación a todas aquellas situaciones en las que se necesita desplegar un objetivo para obtener una visión clara de cómo debe ser alcanzado.

CAPÍTULO VI PREPARACIÓN DEL MODELO EN ALGOR. En este capítulo, se hablará acerca de los pasos a seguir para poder realizar el análisis de

proporción de diabetes = = % expresada en porcentaje

Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI

CLASIFICACIONES DE LA OMS SOBRE DISCAPACIDAD

Introducción a la Teoría de Probabilidad

Anexo 11. Valoración de la calidad de los distintos tipos de estudios

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

PRUEBA RAPIDA EN EMBARAZADAS (n=62, Junio 2010) NO REACTIVO n=218 REACTIVO INDETERMINADO. Tabla 9: Resultados Prueba rápida

1.4.- D E S I G U A L D A D E S

Análisis y cuantificación del Riesgo

Capítulo IV. Manejo de Problemas

ESTRATEGIA DE DINAMARCA: INFORME SOBRE EL FUTURO DEL ENTORNO LABORAL

Aproximación local. Plano tangente. Derivadas parciales.

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE

ANÁLISIS DE BONOS. Fuente: Alexander, Sharpe, Bailey; Fundamentos de Inversiones: Teoría y Práctica; Tercera edición, 2003

La Evaluación como Proceso Comparación de Costos y Beneficios. Pedro Misle Benítez / Gustavo Briceño Torres

1. Dominio, simetría, puntos de corte y periodicidad

TEMA 5 ESTUDIOS CORRELACIONALES.

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión

Funcionamiento de la sección Unidades Centinela (UC)

Consideraciones al precio de un warrant. El precio del warrant: la prima. Factores que afectan al precio de un warrant

Tema 2: Muestreo. Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

PROGRAMA DE DETECCIÓN PRENATAL DE ANOMALÍAS CROMOSÓMICAS

- MANUAL DE USUARIO -

Diseño de bases de datos Diapositiva 1

SÍNTESIS Y PERSPECTIVAS

Ejercicio de estadística para 3º de la ESO

Unidad I. 1.1 Sistemas numéricos (Binario, Octal, Decimal, Hexadecimal)

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

Movimiento a través de una. José San Martín

Administración de Empresas. 11 Métodos dinámicos de evaluación de inversiones 11.1

MACROECONOMÍA. Tema 6 El comercio internacional. - MACROECONOMÍA -

Divisibilidad y números primos

Pronósticos. Pronósticos y gráficos Diapositiva 1

MERCADOS FINANCIEROS: LOS FONDOS DE INVERSIÓN II

3. Métodos para la evaluación de proyectos

Capítulo 9. La distribución de las ganancias

TIPOS DE MUESTREO. Jordi Casal 1, Enric Mateu RESUMEN

Tema 5. Aproximación funcional local: Polinomio de Taylor. 5.1 Polinomio de Taylor

SCREENING DEL CARCINOMA DE MAMA

Lección 1-Introducción a los Polinomios y Suma y Resta de Polinomios. Dra. Noemí L. Ruiz Limardo 2009

Capítulo 2 Tratamiento Contable de los Impuestos. 2.1 Normas Internacionales de Contabilidad

El consumo de drogas en México es un gran problema social que se ha introducido

MINISTERIO DE SANIDAD SERVICIOS SOCIALES E IGUALDAD. Qué es la sangre del cordón umbilical y para qué sirve?

5to Año PROFESORES DE 5TO Página 1 de 5

Base de datos en Excel

Las Relaciones Públicas en el Marketing social

Gestión de la Configuración

Donar es recibir. VIVE el trasplante de donante vivo

Las Finanzas Módulo 1

MEDICION DEL TRABAJO

GANTT, PERT y CPM. Figura 5.3: Carta GANTT 3.

by Tim Tran:

Calculadora de Tamaño muestral GRANMO

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

Relación entre formación y empleo

Metodología. del ajuste estacional. Tablero de Indicadores Económicos

La derivada de y respecto a x es lo que varía y por cada unidad que varía x. Ese valor se designa por dy dx.

Transcripción:

EVALUACIÓN DE PRUEBAS DIAGNÓSTICAS Notas Índice. INTRODUCCIÓN 2. CLASIFICACIÓN DE ENFERMEDADES POR DIAGNOSIS 3. CRITERIOS DE CALIDAD DE LAS PRUEBAS DIAGNÓSTICAS 2 4. TIPOS DE PRUEBAS 3 5. PATRÓN ÁUREO 3 5.. Diseño de investigación para evaluar una prueba diagnóstica 3 6. PARÁMETROS DE VALORACIÓN DE LAS PRUEBAS DIAGNÓSTICAS 4 6.. Sensibilidad 5 6.2. Especificidad 5 6.3. Valor predictivo positivo 6 6.4. Valor predictivo negativo 6 6.5. Razones de verosimilitud 7 6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad 8 6.7. Intervalos de confianza para los coeficientes de probabilidad 9 6.8. Variabilidad de las razones de verosimilitud 9 6.9. Valores predictivos y razones de verosimilitud. Interés en la evaluación de las pruebas diagnósticas 5 6.0. Falsos positivos frente a falsos negativos. Criterios 9 6.. Odds ratio diagnóstica 9 6.2. Efectividad de una prueba 20 6.3. Eficiencia diagnóstica de una prueba 20 6.4. El índice de Youden (Y) 20 6.5. El efecto de concentración 2 6.6. Ganancia diagnóstica 22 7. COMENTARIOS 24 8. ETAPAS DE UN ESTUDIO DE EVALUACIÓN DE PRUEBAS DIAGNÓSTICAS 25 9. SESGOS POTENCIALES DE LOS ESTUDIOS SOBRE PRUEBAS DIAGNÓSTICAS25 0. EVALUACIÓN DIAGNÓSTICA: JERARQUIZACIÓN 26 BIBLIOGRAFÍA 26. Introducción Se trata de estudiar aquellos procedimientos estadísticos que permiten evaluar la validez, es decir cuánto se aproxima una medida al valor real que pretende medir. Son procedimientos muy generales, pero aquí se van a tratar al hilo del problema de las pruebas diagnósticas (problema muy importante en la práctica y la investigación clínica): pruebas para determinar si un individuo tiene, o no, una cierta enfermedad (u otra característica). Hay que resaltar (y no siempre se hace) que si bien la validez de una prueba depende exclusivamente de la prueba, las estimaciones numéricas que se obtengan de la misma pueden depender de la prevalencia y de las características clínicas de los pacientes que se hayan estudiado. 2. Clasificación de enfermedades por diagnosis Debe tenerse muy en cuenta el tipo de enfermedad que se está analizando y el grado de avance de la misma en el paciente, porque de acuerdo a ello se deberá puntualizar en ciertos aspectos, más que en otros, como se explicará más adelante. Por ahora, basta con efectuar una primera clasificación de las enfermedades en tres tipos básicos de acuerdo al siguiente esquema:

Tipo I: Son todas aquellas enfermedades donde la peor equivocación que se puede cometer en el diagnóstico es un falso negativo. Tipo II: Son todas aquellas enfermedades donde la peor equivocación que se puede cometer en el diagnóstico es un falso positivo. Tipo III: Son las restantes, donde no se puede clasificar claramente como una de las anteriores. Las enfermedades que se pueden clasificar como Tipo I son: Una enfermedad que es curable si se detecta a tiempo; Una enfermedad que es grave y no puede dejarse pasar inadvertida; Los falsos positivos no traumatizan ni psicológicamente, ni económicamente al paciente, pero los diagnósticos falsos negativos sí lo hacen. Ejemplos: infarto de miocardio, enfermedades venéreas y otras enfermedades infecciosas curables, la fenilcetonuria, el feocromocitoma (curable en el 00% de los casos sí es detectado a tiempo), cáncer de mama o de útero, etc. En cambio, una enfermedad donde para el paciente, un diagnóstico falso positivo es más peligroso que un falso negativo, se considera como del Tipo II, como ser: La enfermedad es grave, pero difícilmente curable o sin remisión; Es muy importante para el paciente o para la población él saberse un verdadero negativo; Los falsos positivos traumatizan seriamente al paciente, en cambio los falsos negativos no; El tratamiento de los falsos positivos ocasiona serios perjuicios al paciente; Ejemplos: estado terminal o sin remisión de la enfermedad, cáncer oculto, esclerosis en placas, tratamientos como radioterapia, quimioterapia, lobectomía, cirugía innecesaria, estadio IV de la sífilis cuando ya no tiene remedio, etc. Cuando la enfermedad no puede ser encasillada en ninguno de los dos casos anteriores, entonces se la considera como del Tipo III, como por ejemplo: lupus eritematoso, ciertas formas de leucemia o linfoma, diabetes, etc. En el caso del SIDA un falso positivo puede ser muy dañino para el paciente, pero un falso negativo sería muy peligroso para la sociedad y como ambos peligros son graves, lo mejor es clasificarla como del Tipo III desde un punto de vista ético. Notar que una misma enfermedad puede ser clasificada de maneras diferentes, de acuerdo al estado de avance que tiene en el paciente. Un cáncer que pueda ser curado si se detecta a tiempo es un claro caso de Tipo I, pero una vez que se produjo una metástasis en el paciente pasa a ser del Tipo II. Lo mismo ocurre con los diferentes estados de la sífilis, que se puede curar si es detectada a tiempo, pero se torna incurable cuando está muy avanzada. 3. Criterios de calidad de las pruebas diagnósticas Capacidad de la prueba para medir efectivamente lo que se quiere medir Identificación de los enfermos/sujetos sanos Enfermo Test positivo Sujeto sano Test negativo Test positivo Enfermo Test negativo Sujeto sano Una prueba diagnóstica es considerada de buena calidad si es capaz de clasificar correctamente a los miembros de la población a la que se aplica, dando resultados positivos en las personas enfermas y negativos en las carentes de la enfermedad de estudio. Es un grave error asumir que el resultado de una prueba diagnóstica es una representación fiel de la situación real de salud de un individuo. Por el contrario, el médico que reconoce las imperfecciones de una prueba se preguntará: a la vista de este resultado, qué grado de seguridad tengo acerca del estado de salud de este paciente? La importancia de una prueba diagnóstica desde el punto de vista de evaluación de tecnologías se basa en varios factores. Al evaluar una prueba diagnóstica, no obstante, no debe tenerse en cuenta la calidad de la prueba aisladamente, sino que se deben valorar también las acciones que se van a poner en práctica cuando el resultado sea anormal. Así, una prueba cuyo resultado no tenga influencia sobre el manejo del paciente ni sobre su estado de salud, tendrá poca importancia en salud pública, y su evaluación no será prioritaria. 2

Otros factores que se deben valorar son el precio de la prueba así como su inocuidad, ya que pueden existir métodos menos invasivos o más económicos para obtener una información suficiente para nuestros propósitos. La calidad de una prueba diagnóstica se mide en términos de validez y seguridad. La validez de una prueba es el grado en que mide lo que se supone debe medir y para determinarla se debe comparar con otra prueba de probada eficacia en la enfermedad de estudio o con el verdadero resultado en el caso de que pueda ser conocido. Estos términos de comparación se denominan patrón áureo, gold standard o criterio de referencia. La validez se mide a través de la sensibilidad y la especificidad de la prueba. La seguridad de una prueba es la capacidad para predecir la presencia o ausencia de enfermedad y se mide en términos de los valores predictivos, positivo y negativo. 4. Tipos de Pruebas Pruebas con respuesta dicotómica (positivo, + ; negativo, ), por ejemplo, la prueba de embarazo; Pruebas con respuesta policotómica, por ejemplo, estadios del cáncer; Pruebas con respuesta cuantitativa, por ejemplo, glucosa/diabetes, troponina/iam. En este caso se presenta el problema de establecer un punto de corte para dicotomizar la respuesta ( + o ). 5. Patrón áureo Para identificar la enfermedad se requiere disponer de un diagnóstico de certeza, una prueba de referencia, lo que se conoce con el nombre de patrón áureo (patrón oro, gold standard ), para poder ver con respecto a este patrón la validez de otras pruebas diagnósticas, su calidad, su capacidad para identificar una enfermedad o para seguir un tratamiento. PATRON DE REFERENCIA POBLACION PACIENTE 3 2 4 PRUEBA DIAGNOSTICA + Pr(POSTPRUEBA) 5 Figura. Esquema de los estudios de evaluación de pruebas diagnósticas. () patrón áureo (gold standard) válido; (2) comparación independiente; (3) espectro de pacientes adecuado; (4) descripción completa de los métodos; (5) presentación correcta de los resultados; (6) repercusión sobre el manejo diagnóstico terapéutico. 5.. Diseño de investigación para evaluar una prueba diagnóstica El modelo apropiado es un diseño descriptivo, en el cual un grupo de participantes con características determinadas acorde a la prueba a probar es sometido a la prueba y concomitantemente al patrón áureo. + Pr(PREPRUEBA) 6 3

Muestra (individuos consecutivos con las características establecidas) A todos se efectúa la prueba y el patrón áureo Enfermedad presente detectada por la prueba Enfermedad presente no detectada por la prueba Enfermedad ausente, la prueba sugirió su presencia Enfermedad ausente, la prueba coincidió Figura 2. De esta manera, al cabo del estudio se dispondrá de los datos necesarios para completar la tabla de contingencia, permitiendo calcular todos los indicadores presentados. Para minimizar los sesgos, se deben considerar algunas premisas claves, a saber:. Selección de la muestra: la muestra debe incluir participantes que representen todas las formas clínicas del daño buscado y respetando la proporción en que la misma se presenta en la práctica cotidiana. Aún pruebas de escasa capacidad detectan aceptablemente los casos graves al compararlas con los sin daño. El mayor problema se presenta al intentar detectar a los casos de gravedad moderada a leve. Por ello, la muestra debe obtenerse desde la presentación consecutiva de casos clínicos que reúnan las características que los haría pasibles de la indicación de la prueba. Entre ellos, habrá casos de todas las formas clínicas e incluso casos sin daño. 2. Comparación: la misma debe establecerse con un patrón de referencia apropiado y confiable. El patrón áureo debe reunir esas características y todos los participantes deben recibir las dos pruebas (la que se está investigando y el patrón áureo). Es frecuente observar que si se seleccionó un patrón áureo invasivo y/o costoso, éste se aplique solamente a los que arrojaron un resultado anormal de la prueba en análisis. Este proceder impide que se completen los datos de la tabla de contingencia, ya que no se dispondría de los necesarios para llenar los casilleros c ni d y, por lo tanto, se hace imposible calcular sensibilidad ni especificidad. A este error de procedimiento (o error sistemático o sesgo) se lo denomina error de verificación ( work-up bias ). 3. Interpretación de los resultados: La lectura del resultado de la prueba analizada debe ser realizada desconociendo el resultado del patrón áureo, para evitar el sesgo hacia una coincidencia espúrea. 6. Parámetros de valoración de las pruebas diagnósticas Imaginemos que queremos evaluar una técnica analítica para el diagnóstico de una enfermedad (infecciosa, por ejemplo). Mediante un procedimiento aleatorio seleccionamos 200 personas que son evaluadas desde el punto de vista clínico, diagnosticándose 33 personas como enfermas. Tras realizar la prueba en todos ellos el resultado es el siguiente: prueba positiva prueba negativa total pacientes enfermos 27 (VP) 6 (FN) 33 (TE) pacientes no enfemos 3 (FP) 64 (VN) 67 (TNE) total 30 (TP) 70 (TN) 200 (T) Tabla Los 27 pacientes que, estando enfermos, dieron positiva la prueba diagnóstica se consideran verdaderos positivos (VP). Los seis pacientes enfermos que dieron negativa la prueba de laboratorio son considerados como falsos negativos (FN). Los tres pacientes no enfermos que dieron positiva la prueba se denominan falsos positivos (FP). Los 64 pacientes no enfermos que no dieron positivo en la prueba son los verdaderos negativos (VN). A continuación se procederá a definir los parámetros de valoración de las pruebas diagnósticas. 4

6.. Sensibilidad Es el porcentaje de resultados positivos en pacientes con una determinada enfermedad. Mide el porcentaje de individuos enfermos correctamente diagnosticados La sensibilidad indica la capacidad de una prueba para detectar a un sujeto enfermo. La sensibilidad es la probabilidad de que la prueba identifique como enfermo a aquel que realmente lo está. La sensibilidad expresa cuán "sensible" es la prueba a la presencia de la enfermedad. Una alta sensibilidad indica un bajo número de falsos negativos. La sensibilidad sería la probabilidad de que un paciente enfermo diese la prueba positiva o el porcentaje de positivos de la prueba en pacientes con la enfermedad, VP 00 Sensibilidad % = En el ejemplo la sensibilidad ( Se ) será: ( ) TE 27 00 Se = = 8,8% 33 Una sensibilidad del 8,8 % indica que solo el 8,8 % de los pacientes enfermos darán positiva la prueba. En este caso habrá un 8,2 % de falsos negativos (pacientes enfermos que han dado negativa la prueba). Cuanto más sensible es una prueba, más probable es que detecte a las personas con enfermedad. Por ello, las pruebas con una sensibilidad muy elevada son muy útiles para descartar la presencia de enfermedad. 6.2. Especificidad Es el porcentaje de resultados negativos en pacientes que no padecen esa enfermedad. Valora la capacidad de una prueba para detectar correctamente individuos sanos. La especificidad es la probabilidad de que un individuo sano tenga un resultado negativo. Una alta especificidad indica una baja frecuencia de falsos positivos. La especificidad sería la probabilidad de que un paciente sano diese la prueba negativa o el porcentaje de negatividad de la prueba diagnóstica en ausencia de enfermedad, o: VN 00 Especificidad (%) = TNE En el ejemplo la especificidad ( Es ) será: 64 00 Es = = 98,2% 67 Una especificidad del 98,2 % indica que el 98,2 % de los individuos sanos darán negativa la prueba. En este caso habrá un,8 % de falsos positivos (pacientes sanos que han dado positiva la prueba). Las pruebas muy específicas se usan para confirmar la presencia de una enfermedad. Si la prueba es muy específica y da positiva, indica la presencia de enfermedad, ya que apenas produce falsos positivos. Aunque la sensibilidad y la especificidad son dos índices de calidad de la prueba, en la práctica clínica las preguntas a las que interesa responder son: cuál es la probabilidad de que esté verdaderamente enfermo si un sujeto ha resultado positivo, Pr ( E+ T + )? y, por el contrario, cuál es la probabilidad de que realmente esté sano si el sujeto resultó negativo en la prueba, Pr ( E T )? Estas dos probabilidades se pueden calcular aplicando el teorema de Bayes, siempre que se conozca la probabilidad de que el sujeto esté enfermo antes de realizar la prueba, o probabilidad preprueba. Si no se dispone de ninguna información adicional sobre el sujeto, dicha probabilidad será la prevalencia de la patología en la población, aplicable sólo en el caso de programas de cribado ("screening") sobre la población general, ya que en la práctica habitual los sujetos candidatos a una prueba diagnóstica lo son por las sospechas deducidas de la anamnesis o por una sintomatología previa, y por tanto la probabilidad de que padezcan la enfermedad bajo sospecha será superior a la prevalencia de ésta en la población general. 5

Denominando P a la probabilidad preprueba de padecer la enfermedad, Se a la sensibilidad de la prueba y Es a su especificidad, las siguientes fórmulas permiten calcular la probabilidad postprueba de que el sujeto esté enfermo cuando resultó positivo o de que esté sano cuando resultó negativo: ( E T ) Pr + + = ( E T ) Pr = Se P Se P + Es P Es P Es P + Se P ( )( ) ( ) ( ) donde la probabilidad condicional se representa de la forma habitual con el símbolo Así Pr ( E T ) + + significa: suceso E + (enfermo) condicionado a que haya ocurrido el suceso T + (resultado positivo en la prueba). Si se calculan estas probabilidades únicamente con los datos de la tabla, la primera de ellas, Pr ( E+ T + ), a la proporción de sujetos que verdaderamente tienen la enfermedad, de entre los que dieron positivo, y se conoce como valor predictivo positivo, VPP: VP VPP = VP + FP Igualmente se puede calcular en la tabla la proporción de sujetos verdaderamente sanos sobre el total de los que dieron negativo, valor predictivo negativo, VPN: VN VPN = VN + FN 6.3. Valor predictivo positivo El valor predictivo positivo es el porcentaje de pacientes enfermos entre todos los pacientes con resultados positivos. Valora la probabilidad de que una prueba positiva diagnostique correctamente a un individuo enfermo. El valor predictivo positivo de una prueba sería la probabilidad de que una prueba positiva correspondiese a un verdadero enfermo o el porcentaje de pacientes enfermos con resultados positivos con respecto al total de resultados positivos, o: VP 00 VPP (%) = TP En el ejemplo, el VPP será: 27 00 VPP = = 90% 30 Un VPP del 90 % indica que de cada 00 pacientes que dan la prueba positiva solo 90 padecen la enfermedad, o lo que es lo mismo: si la prueba da positiva, la probabilidad de padecer la enfermedad es de un 90 %. En este caso habrá un 0 % de individuos sanos diagnosticados incorrectamente como enfermos. Pero esto no significa que haya un 0 % de falsos positivos. 6.4. Valor predictivo negativo El valor predictivo negativo Indica la frecuencia de pacientes no enfermos entre todos los pacientes con resultado negativo. Valora la probabilidad de que una prueba negativa diagnostique correctamente a un individuo sano. El valor predictivo negativo de una prueba será la probabilidad de que una prueba negativa diagnosticase correctamente a un individuo sano o el porcentaje de individuos sanos con resultados negativos con relación al total de resultados negativos, o: VN 00 VPN (%) = TN En el ejemplo, el VPN será: 6

64 00 VPN = = 96,5% 70 Un valor predictivo negativo del 96,5 % indica que de cada 00 pruebas negativas, 96,5 pertenecerán a individuos sanos, o lo que es igual, si la prueba da negativa, la probabilidad de no padecer la enfermedad es del 96.5 %. En este caso hay un 3,5 % de individuos enfermos que serán diagnosticados erróneamente como no enfermos. Esto tampoco significa que haya un 3,5 % de falsos negativos. El intervalo de confianza al 95 % de los valores predictivos se calculan de acuerdo con las siguientes expresiones: donde ε =, 96 VPP VPN ± ± ε ε VPP VPN ( VPP) a + b ( VPN ) c + d Los valores predictivos dependen mucho de la prevalencia de la enfermedad en la población (cociente entre enfermos y población), no así la sensibilidad y la especificidad, que son independientes de la misma. Puesto que esos dos índices VPP y VPN son los que interesan en la práctica clínica, parecería natural utilizarlos como índices de comparación a la hora de evaluar dos métodos diagnósticos diferentes. Sin embargo presentan un grave inconveniente, ya que si se calculan a partir de la tabla dependen de la proporción de enfermos en la muestra estudiada. Por ello para una determinada prueba resulta necesario determinar unos índices de valoración que, respondiendo a las necesidades reales en cuanto a la clasificación de pacientes, sin embargo no dependan de esa proporción de enfermos en la muestra, tales como las razones de verosimilitud 6.5. Razones de verosimilitud Se puede calcular el cociente entre la tasa de verdaderos positivos y la tasa de falsos positivos: Pr ( T + E) CP + = Pr T + NE ( ) Este cociente CP + se conoce como cociente de probabilidad positivo o también como cociente de verosimilitud de una prueba positiva (likelihood ratio of positive test, LR + o L + ), razón de verosimilitud de RV +, razón de verosimilitud de inclusión, potencia (o poder) predictiva de una una prueba positiva ( ) prueba positiva, o índice de eficiencia pronóstica ( IEP ) de un resultado positivo. Valores mayores de CP + indican mejor capacidad para diagnosticar la presencia de enfermedad. De la misma forma, podemos definir un cociente de probabilidad negativo CP Pr ( T E) CP = Pr T NE ( ) Valores de CP menores indican una mejor capacidad diagnóstica de la prueba (mejor capacidad para diagnosticar la ausencia de enfermedad). El cociente de probabilidad negativo también se conoce como cociente de verosimilitud negativo ( LR, λ ), razón de verosimilitud negativa ( RV ), razón de verosimilitud de exclusión, índice de eficiencia pronóstica de una prueba negativa. El inverso de este cociente se llama poder (o potencia) predictiva de una prueba negativa. Se puede determinar unas fórmulas para expresar los cocientes de probabilidad en función de la sensibilidad Se y de la especificidad Es : 7

Se CP + = Es Se CP = Es La ventaja de los cocientes CP + y CP frente a los valores predictivos positivo y negativo de la prueba radica en que, a diferencia de éstos, no dependen de la proporción de enfermos en la muestra, sino tan sólo de la sensibilidad y especificidad de ésta, de ahí su utilidad a la hora de comparar pruebas diagnósticas. Además si se conoce o se puede hacer una estimación de la probabilidad preprueba de que un sujeto padezca la enfermedad, utilizando los cocientes de probabilidad, al realizar la prueba se podrá "corregir" ese valor de acuerdo con el resultado, de tal manera que la probabilidad aumenta o disminuye según que el resultado sea positivo o negativo, aplicando la siguiente fórmula P CP Pr post = + P CP ( ) donde P es la probabilidad preprueba, CP el correspondiente cociente de probabilidad (positivo si deseamos calcular la probabilidad de que padezca la enfermedad, negativo en caso contrario) y Pr post es la probabilidad postprueba. Véase un ejemplo numérico de todo lo anterior: patología enfermo ( E + ) no enfermo ( E ) positiva ( T + ) 72 00 positivos: 72 prueba negativa ( T ) 8 50 negativos: 68 total enfermos: 90 no enfermos: 250 total: 340 Tabla 2 Aplicando las fórmulas anteriores se tiene: valor estimado intervalo de confianza al 95 % sensibilidad 0,80 0,72 0,88 especificidad 0,60 0,54 0,66 CP+ 2,00,66 2,40 CP 0,33 0,22 0,5 Tabla 3 Evidentemente los valores de los diferentes índices son estimaciones realizadas mediante un experimento diseñado al efecto, por lo que es necesario calcular algún indicador de su grado de incertidumbre, como puede ser un intervalo de confianza del 95 %. 6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad 95% 95% ( ) IC Se = Se ±, 96 ( ) donde m es el número de enfermos; y IC Es = Es ±, 96 8 Se Es ( Se) m ( Es) n

n es el número de no enfermos. Para un intervalo de confianza (IC) del 99 % hay que reemplazar,96 por 2,576 y para un IC del 99,9% hay que reemplazar,96 por 3,290 6.7. Intervalos de confianza para los coeficientes de probabilidad Cuán fiables son los coeficientes de probabilidad ( CP ) calculados sobre muestras? Se necesita calcular su intervalo de confianza que no es fácil para cocientes de probabilidades. Hay varios métodos aproximados para muestras grandes. 6.7.. Si el CP es próximo a : método de Miettinen donde CP z α 2 ± 2 2 χ es el estadístico de asociación de la tabla 2 x 2. χ Por ejemplo, para,96 ± 2 0,2 χ = 0, 2, el intervalo de confianza al 95 % es,02 = ( 0,92,,09) 6.7.2. Si el CP no es próximo a : aproximación de primer orden del desarrollo de Taylor [ ]( α ) IC CP + % = e [ ]( α ) ln ln ( CP ) ( CP ) Se Es + ± zα + 2 d c Se Es ± zα + 2 b a IC CP % = e Si se comparan dos pruebas diagnósticas A y B, se calculan sus cocientes de probabilidad positivos, y se observa que CPA +> CPB +, se podrá afirmar que la prueba A es mejor que la B para confirmar la presencia de enfermedad. Si en cuanto a los cocientes de probabilidad negativos se observa que CPA < CPB se podrá afirmar que la prueba A es mejor que la B para confirmar la ausencia de enfermedad. 6.8. Variabilidad de las razones de verosimilitud La incidencia de las razones de verosimilitud sobre los valores predictivos y sobre la utilización diagnóstica de los signos y de las pruebas es tal que resulta útil analizar aunque sea brevemente, el respectivo papel de sus dos componentes, sensibilidad y especificidad. Se Si la especificidad es constante, las razones de verosimilitud positivas L = son función lineal de la Es sensibilidad. Cuando la sensibilidad aumenta, L aumenta en la misma proporción. Es La razón de verosimilitud negativa λ = es igualmente una función lineal de la sensibilidad, pero Se negativa: cuando aumenta la sensibilidad, λ disminuye en la misma proporción (Figura 3) 9

Figura 3. Variación de la razón de verosimilitud en función de la sensibilidad para diferentes pruebas cuya especificidad es igual a 0,90. Cuando Se = Es = 0,, las dos razones de verosimilitud son iguales a la prueba no tiene ningún valor diagnóstico. El valor diagnóstico del resultado positivo o negativo de la prueba crece linealmente cuando la sensibilidad aumenta de 0,0 a,00. Figura 4. Variación de las razones de verosimilitud en función de la especificidad para diferentes pruebas cuya sensibilidad es igual a 0.80 0

Cuando Es = Se = 0,8, las dos razones de verosimilitud son iguales a y por lo tanto en esta situación la prueba carece de utilidad diagnóstica. Se nota que la progresión de L es muy rápida cuando la especificidad es superior a 0,7. La razón de verosimilitud negativa se modifica poco cuando Es crece de 0,50 a,00, mientras que la razón de verosimilitud positiva L se afectada mucho por variaciones mínimas de la especificidad cuando ésta es muy elevada; así, cuando Es crece de 0,90 a 0,95, L pasa de 8 a 6. Si la sensibilidad es constante, las dos razones de verosimilitud son funciones hiperbólicas de la especificidad. La razón de verosimilitud positiva L, en particular, crece muy rápidamente y tiende hacia el infinito cuando la especificidad de una prueba o de un grupo de pruebas tiende hacia. Se dice que la eficacia diagnóstica de una prueba, en la investigación de una enfermedad determinada E, está estrechamente ligada al crecimiento de su especificidad, cualidad que, precisamente, es estable en el caso de los sujetos no afectados por la enfermedad E Comparando los cocientes de probabilidad de dos pruebas diagnósticas existen cuatro posibles resultados que podemos reflejar en una gráfica. En el eje de las Y representamos la sensibilidad, en el eje de las X se representa ( especificidad). El punto representa los valores de sensibilidad y ( especificidad) observados para la prueba A. Se traza una línea desde el origen (0,0) que pase por el punto A y otra desde el valor (,) que también pase por ese punto, quedando dividido el gráfico en cuatro zonas como se ve en la Figura 5, de tal manera que cualquier otra prueba cuyo resultado representemos en esa gráfica estará en alguna de las cuatro zonas Figura 5. Las zonas corresponden a las siguientes situaciones: : en esta región la prueba B es siempre superior a la A, tanto para confirmar presencia como ausencia de enfermedad; 2: aquí la prueba B sólo es superior a la A para confirmar ausencia de enfermedad; 3: en esta zona B siempre es inferior a A; 4: si el resultado de B está en este área, será superior a A para confirmar la presencia de enfermedad. Supóngase ahora que se desea comparar la prueba A con otra prueba B cuya sensibilidad es 0,9 y especificidad 0,5. Representándolo en la Figura 6 se obtiene:

Figura 6. B cae en la zona 2 por lo que es una prueba mejor que A para confirmar la ausencia de enfermedad, como se puede determinar también numéricamente al calcular los correspondientes cocientes de probabilidad CP+ =,8 y CP = 0,2. Todas estas consideraciones se refieren únicamente a la capacidad discriminatoria de una prueba. La decisión sobre qué prueba diagnóstica es más adecuada, siempre es algo más complicada, puesto que intervienen otros aspectos, como son el coste de la prueba, los riesgos que supone para el paciente, valorar las consecuencias que conlleva un falso positivo o un falso negativo... Evidentemente para comparar los parámetros de dos pruebas diagnósticas habrá que considerar que los valores obtenidos sólo son estimaciones y están sometidos por tanto a posibles errores de muestreo, por lo que habrá que efectuar el correspondiente contraste estadístico para determinar si las diferencias encontradas son suficientemente importantes como para no poder ser atribuidas al azar. Si la razón de verosimilitud es igual a, la probabilidad del diagnóstico es la misma antes y después de aplicar la prueba. En este caso la prueba es inútil, no tiene capacidad discriminante. Cuanto más se aleje de el valor de la razón de verosimilitud, mas interés presenta la prueba. CP +> 0 ó CP < 0, Generan cambios amplios y a menudo concluyentes desde una probabilidad preprueba hasta una probabilidad postprueba 5< CP +< 0 y 0,< CP < 0,2 Generan cambios moderados desde la probabilidad preprueba hasta la probabilidad postprueba 2< CP +< 5 y 0,05< CP < 0, 2 Generan cambios pequeños (pero en ocasiones importantes) de la probabilidad < CP +< 2 y 0,5< CP < Alteran la probabilidad en un grado insignificante (y rara vez importante). Tabla 4. Interpretación de los cocientes de probabilidad (según el Evidence-based Medicine Working Group) Ventajas de la razón de verosimilitud Es independiente de la prevalencia; Es un buen reflejo del valor de la prueba cualquiera que sea el grupo al que se aplique; Resumen la información en sólo parámetro; 2

Utilizable para diferentes niveles de resultados de una prueba. Para cada nivel procura una información diferente permitiendo interpretar mejor los resultados de la prueba; Permite calcular de manera individual el interés de realizar la prueba a partir de la probabilidad inicial de la enfermedad del paciente. Los cocientes de probabilidad permiten transformar la probabilidad preprueba en probabilidad postprueba mediante la relación: odds post = CPR odds pre Recuérdese que se denomina odds i al cociente entre la probabilidad de que un evento (en este caso estar enfermo ) ocurra y la probabilidad de que no ocurra, por lo tanto: p odds odds = p = p + odds los subíndices post y pre indican postprueba y preprueba respectivamente y el subíndice R representa el resultado obtenido. En el caso del siguiente ejemplo: ecocardiograma péptido natriurético tipo B (pmol/l) normal ( <8,7) elevado ( 8,7) total normal a 93 b 50 r = a + b 43 disfunción c d s = c + d 2 total t = a + c 94 u = b + d 6 N = a + b + c + d 55 Tabla 5. Resultados de la evaluación del péptido natriurético tipo B Los CP de la prueba del ejemplo son d Se s d r CP + = = = Es b b s r c Se s c r CP = = = Es a a s r d r 43 CP + = = = 2,62 b s 50 2 c r 43 CP = = = 0,3 a s 93 2 supóngase que se le aplica la prueba a un anciano al que por su sintomatología e historia se le estima una probabilidad alta (por ejemplo, 0,7) de padecer disfunción ventricular izquierda cómo se modificaría esta probabilidad si se le midiera la concentración plasmática del péptido y resultara positiva ( 8,7)? A partir 0,7 de la probabilidad preprueba, primero se calcula el odds pre = = 2,33 ; como el resultado es positivo 0,7 6,0 CPR = CP += 2,62, por tanto odds post = 2, 62 2,33= 6,0 y Pr ( post ) = = 0,86 ; si el resultado de 7,0 la prueba hubiera sido negativo CPR = CP = 0,3 y odds post = 0,3 2,33= 0,30 y por lo tanto 0,30 Pr ( post ) = = 0,23., 30 3

Figura 7. Nomograma de Fagan (Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med. 975; 293(5): 257) Fagan (975) describió un nomograma para el teorema de Bayes, basado en la capacidad de convertir el teorema de Bayes en una función sumatoria lineal simple. Con un par de trucos matemáticos se puede conseguir esto. Primero, se necesita la versión de probabilidad del teorema de Bayes: " Odds postprueba" = " Odds preprueba" CP o de forma simbólica: Donde E representa enfermedad; R Pr E E O O( E = ) R R Pr E E representa ausencia de enfermedad; y R es un resultado específico de la prueba. Tomando logaritmos, se convierte en una simple suma: o de forma simbólica: o también: ( Odds postprueba ) = ( Odds preprueba ) + ( CP) log " " log " " log Pr R Pr E E log O log ( O( E) ) log = + R R Pr E ( ) = Pr ( ) ( ) postprueba preprueba x CP ( postprueba ) = ( ( preprueba) ) + ( CP) log Pr log Pr log 4

El nomograma tiene tres columnas: la primera es la probabilidad de tener la enfermedad antes de aplicar la prueba (prevalencia), la segunda es la razón de verosimilitud ( CP ) y la tercera la probabilidad postprueba ( PPP, VPP ). Con una regla se traza una línea entre la probabilidad preprueba y la razón de verosimilitud. La prolongación de esta línea corta en la tercera columna la probabilidad de tener la enfermedad en función del resultado de la prueba, Figura 8. Nomograma de Fagan. Para una prevalencia de 34 % se observa como mejora la probabilidad postprueba de las variables estudiadas 6.9. Valores predictivos y razones de verosimilitud. Interés en la evaluación de las pruebas diagnósticas ( ) Pr M S = VPP = VPP VPN P L = P ( L ) + P = P + ( λ ) P Se P Se + P Es 5 ( )( ) P VPP VPN VPN,0,0 0,00,0 0,95 0,98 0,095 0,905 0,90 0,96 0,8 0,82 0,80 0,92 0,33 0,67 0,70 0,87 0,46 0,54 0,666 0,86 0,50 0,50 0,60 0,82 0,57 0,43 0,50 0,75 0,666 0,33 0,45 0,7 0,7 0,29 0,40 0,67 0,75 0,25 0,30 0,56 0,82 0,8

P VPP VPN VPN 0,25 0,50 0,86 0,4 0,20 0,43 0,89 0, 0,0 0,25 0,95 0,05 0,05 0,4 0,97 0,03 0,0 0,03 0,99 0,0 0,00 0,00,00 0,00 Tabla 5. Variación de los valores predictivos de una misma prueba ( L= 3 y λ = 0,50) cuando P varía de a 0. ( VPN ) es la probabilidad de sufrir una enfermedad en presencia de una prueba negativa. Figura 9. Variación de los valores predictivos de una prueba cuyas cualidades son L= 3 y λ = 0,50, cuando la probabilidad preprueba de la enfermedad varía entre 0 y ( ) Las curvas de los valores predictivos en función de la probabilidad a priori P son hipérbolas. Los puntos destacables de estas tres curvas son: A donde el valor predictivo positivo es igual a 0,50; B donde el valor predictivo negativo es igual a 0,50; C donde VPP = VPN, cuando P = + L λ Para una misma prueba, cuando P disminuye, VPP disminuye y VPN aumenta. Cuando P aumenta, VPP aumenta y VPN disminuye. Se nota que el valor predictivo positivo al principio crece rápidamente cuando la probabilidad preprueba crece entre 0 y 0,50 y después más lentamente. El VPP es inferior a 0,50 cuando la probabilidad a priori o preprueba es inferior a P = + L, en el ejemplo, donde L = 3, cuando P es inferior a =0, 25 (Figura + 3 8). 6

Cuando la probabilidad preprueba de la enfermedad E es inferior a, el VPP o probabilidad + L postprueba de la enfermedad es inferior al 50 %, incluso si la prueba da un resultado positivo. El VPN disminuye cuando crece la probabilidad preprueba de la enfermedad. Es inferior a 0,50 cuando P es inferior a P2 =, en el ejemplo P 2 = = 0,666 (Figura 8). + λ + 0,50 Así, cuando la probabilidad primaria es superior a P2 = incluso si la prueba da un resultado negativo, + λ la probabilidad a posteriori o postprueba de la enfermedad es superior al 50 %. Los dos valores P y P 2 de la probabilidad primaria, tales que: P = + L P2 = + λ determinan lo que se puede definir como el intervalo de seguridad de la prueba. En efecto, cuando la probabilidad primaria se sitúa dentro de este intervalo, un resultado positivo de la prueba da un VPP superior al 50 % y un resultado negativo da una probabilidad secundaria de la enfermedad inferior al 50 %. Este no es el caso cuando P se sitúa fuera de este intervalo: si P es inferior a P, la probabilidad postprueba de la enfermedades inferior a cambio sobre dos, incluso si la prueba da un resultado positivo. Cuando P es superior a P 2, incluso si el resultado de la prueba es negativo, la probabilidad postprueba de la enfermedad es todavía superior a cambio sobre 2 ( > 0,50). Estas consecuencias matemáticas del intervalo de seguridad de la probabilidad primaria, tal como está definido por los límites P y P 2, son de una importancia capital para la conducta del razonamiento y de la decisión diagnóstica. Intervalo de seguridad diagnóstica Figura 0. Comparación de las curvas VPP y VPN de las pruebas y 2 en función de las variaciones de la probabilidad primaria. Las cualidades diagnósticas respectivas de las dos pruebas son: para la prueba : L = 8; λ = 0,05 ; Para la prueba 2 : L = 3; λ = 0,50. Se observa que el intervalo de seguridad diagnóstica para la prueba es mas estrecho que para la prueba 2. 7

La curva del valor predictivo positivo VPP es tanto mayor cuanto más elevada es L, y la curva del valor predictivo negativo VPN es tanto menor cuanto más pequeña es λ. El Intervalo de seguridad diagnóstica es tanto más amplio cuanto más elevada es L y más pequeña λ. Figura. Variaciones de la probabilidad postprueba de la enfermedad E en función de la probabilidad preprueba P y de las cualidades diagnósticas de la prueba (Sox H.C. Ann Inter Med 986;04:60-6). La Figura A representa tres pruebas cuya sensibilidad es idéntica, 0,90, y cuyas especificidades son crecientes, 0,80 para la prueba, 0,90 para la prueba 2 y 0,98 para la prueba 3. En la Figura B, las tres pruebas tienen una especificidad idéntica igual a 0,90, y las sensibilidades son respectivamente 0,60 para la prueba, 0,80 para la prueba 2 y 0,95 para la prueba 3. En la figura A, las tres pruebas tienen una sensibilidad idéntica, igual a 090 y una especificidad creciente, con las cualidades respectivas siguientes: sensibilidad especificidad L λ prueba 0,90 0,80 4,5 0,25 prueba 2 0,90 0,90 9,0 0,0 prueba 3 0,90 0,98 45,0 0,00 Tabla 6 La figura A muestra que para valores bajos de la probabilidad preprueba P, la eficacia diagnóstica del resultado positivo de la prueba medida por el VPP es tanto mas grande cuanto mas elevados son la especificada y la razón de verosimilitud positiva. En contra, las variaciones de la especificidad modifican muy poco la consecuencia del resultado negativo: en este caso el efecto de la probabilidad primaria es predominante. Las conclusiones inversas resultan de la figura B donde las tres pruebas tienen una especificidad idéntica igual a 0,90 y una sensibilidad creciente: sensibilidad especificidad L λ prueba 0,60 0,90 6,0 0,44 prueba 2 0,80 0,90 8,0 0,22 prueba 3 0,95 0,90 9,5 0,055 Tabla 7 Las variaciones de la sensibilidad afectan poco los valores predictivos positivos; en cambio, modifican considerablemente el efecto de un resultado negativo de la prueba, sobre todo cuando la probabilidad preprueba de la enfermedad es superior a 0,50 ó 0,60. En suma, cuando la probabilidad preprueba P es baja, un resultado negativo de la prueba tiene poca incidencia sobre la decisión diagnóstica; el de un resultado positivo de una prueba específica es elevado. Lo 8

inverso ocurre cuando la probabilidad preprueba es elevada: la consecuencias diagnósticas de un resultado negativo de una prueba sensible es considerable, el de un resultado positivo es débil. En una situación diagnóstica dada, la elección de una prueba por el clínico está guiada pues por la probabilidad preprueba de la enfermedad: si el diagnóstico es casi cierto, su confirmación por una prueba específica modifica muy poco su probabilidad; en cambio, el resultado negativo de una prueba sensible impondría una revisión seria de la toma de decisiones. Para optimizar la toma de decisiones, el clínico debe pues elegir una prueba cuya sensibilidad y especificidad sean apropiadas a la probabilidad preprueba de la enfermedad. La incidencia del resultado de la prueba sobre el proceso decisional traduce la eficacia diagnóstica de la prueba. Esta eficacia está medida sobre el efecto de concentración y por la noción de ganancia diagnóstica. Hasta ahora se ha estudiado el caso de un resultado dicotómico, pero en muchas ocasiones las pruebas diagnósticas son cuantitativas, sobre todo cuando corresponden a determinaciones analíticas. Evidentemente, se pueden utilizar todas las consideraciones hechas hasta el momento si se fija un punto de corte, un valor determinado de la prueba, que marque el límite entre sano y enfermo. Pero eso no suele ser una tarea sencilla. Se puede reflejar esquemáticamente en la figura 2: Figura 2 Existe una zona de posibles resultados de la prueba para la que la distribución de sujetos sanos y enfermos se solapan. Si se desea aumentar la probabilidad de detectar pacientes enfermos (en la Figura 2 corresponde a mover el punto de corte hacia la izquierda) se ve como también aumentan el número de falsos positivos. Si se desplaza el punto de corte hacia la derecha, disminuirán los falsos positivos, pero a costa de aumentar el de falsos negativos. Resumiendo, un aumento de la sensibilidad disminuye la especificidad, y viceversa. 6.0. Falsos positivos frente a falsos negativos. Criterios. Gravedad o importancia en salud pública. Si el evento puede ser tratado y detectado evitando complicaciones posteriores han de utilizarse pruebas que minimicen el número de falsos negativos, es decir, se elegirán pruebas con alta sensibilidad; 2. Coste de las distintas pruebas, exámenes y cuidados médicos y de enfermería requeridos. Si el coste de todos ellos es alto han de minimizarse el número de falsos positivos, eligiendo pruebas con alta especificidad; 3. Consecuencias psicosociales. Si la enfermedad diagnosticada conlleva consecuencias al creer que uno está enfermo por ejemplo en el caso de VIH+ han de minimizarse los falsos positivos, eligiendo pruebas de alta especificidad; 4. Prevalencia de la enfermedad. Si es baja se ha de maximizar la especificidad para que aumente la eficiencia del programa. 6.. Odds ratio diagnóstica La odds ratio diagnóstica (DOR) es conocida como un índice estadístico en los estudios epidemiológicos casos/controles representando la fuerza de asociación entre el factor de riesgo y la enfermedad. Aquí podría 9

ser útil para mostrar la fuerza de asociación entre el resultado de una prueba y la enfermedad. Este índice traduce las prestaciones de una prueba con un solo valor que no está influenciado por la prevalencia. Es la razón entre la odds de estar enfermo si la prueba da positivo y la odds de no estar enfermo si la prueba da negativo. VP FN CP + DOR = = = FP CP VN VPP ( VPP) ( VPN ) Los valores de la DOR varían de cero a infinito (cuantos más altos son los valores, mejor es la prueba). El valor DOR = significa que la prueba no es discriminante, es la prueba inútil. Los valores mayores de significan que es más probable que la prueba de positivo en el caso de enfermos que en sanos. 6.2. Efectividad de una prueba VPN La efectividad de la prueba, cuya distribución es aproximadamente normal, se define como 3 Se Es 3 CP + δ = ln + ln = ln π Se Es π CP y que puede interpretarse como la diferencia entre las medias de los resultados entre una población de enfermos y otra de sanos en una escala normalizada. Si δ = la prueba no es efectiva y si δ = 3 es altamente efectiva. 6.3. Eficiencia diagnóstica de una prueba Es el porcentaje de pacientes correctamente clasificados, o la probabilidad de que esa prueba diagnóstica acierte en sus conclusiones: VP + VN Eficiencia = VP + VN + FP + FN Si se tiene en cuenta la prevalencia, la expresión sería: Pr ( M ) Se Eficiencia = Pr M Es ( ( )) En el caso de que la prevalencia de la enfermedad sea 0,50, sería Eficiencia = 0,5 Se + 0,5 Es y entonces se llamaría eficiencia estándar: Se + Es Eficiencia estándard = 2 que también se conoce como valor predictivo global y exactitud diagnóstica 6.4. El índice de Youden (Y) Este índice clínico fue propuesto por Youden (950) para analizar la capacidad del método de diagnóstico, usando un único valor en reemplazo de la forma dual de hacerlo (sensibilidad y especificidad). La idea es mezclar los dos índices anteriores para hacer el estudio de calidad. Se define como: Y = Se+ Es Varía de ( ) a (+). Si es inferior o igual a 0, la prueba no tiene ningún valor informativo. La prueba es tanto de mejor cuanto el índice de Youden se acerca a. Hay una relación lineal entre este índice y la eficiencia estándar, ya que: ( Se + Es) Y = 2 2 20