Bioestadística y uso de software científico TEMA 1 INTRODUCCIÓN. ESTADÍSTICA DESCRIPTIVA

Documentos relacionados
Estadística descriptiva y métodos diagnósticos

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

1. Estadística descriptiva

Estadística Descriptiva

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Estadística. Análisis de datos.

Módulo de Estadística

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Unidad I: Descripción y gráficos estadísticos

Conceptos de Estadística

ESTADÍSTICA UNIDIMENSIONAL

El Método Científico. Metodología de Investigación. Te sifón Parrón

Estadística ESTADÍSTICA

Sumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad...

ÁREAS DE LA ESTADÍSTICA

Tema 3: Estadística Descriptiva

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

Julio Deride Silva. 18 de agosto de 2010

TEMA 1: ESTADISTICA DESCRIPTIVA

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

2. DESCRIPCIÓN ESTADÍSTICA DE UNA VARIABLE. EJEMPLOS Y EJERCICIOS *.

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

1 Resolución de algunos ejemplos y ejercicios del tema 1.

ESTADÍSTICA. Rincón del Maestro:

Estadística Descriptiva I

Bioestadística: Estadística Descriptiva

Estadística Aplicada a los Negocios I

RELACIÓN DE EJERCICIOS TEMA 2

SEMINARIO 2. Introducción a la presentación de resultados científicos

Dispone de 1 hora para resolver las siguientes cuestiones planteadas.

Fase 2. Estudio de mercado: ESTADÍSTICA

478 Índice alfabético

2 Descripción estadística de una variable. Ejemplos y ejercicios.

Dr. Abner A. Fonseca Livias

Estadística. 1. Conceptos de Estadística. 2. Variable estadística. 3. Tablas de estadística. 4. Diagrama de barras y polígonos de frecuencias.

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

PLANIFICACIÓN SEMESTRAL

UNIVERSIDAD MILITAR NUEVA GRANADA

Recopilación: Camerina Laura Ramírez G. ESTADÍSTICA. Recopilación: Camerina Laura Ramírez G.

Estadística Aplicada a la Educación

UNIVERSIDAD MILITAR NUEVA GRANADA

Tema 1: Análisis de datos univariantes

HOJA DE EJERCICIOS EN CLASE. SEMANA 1.

Curso de nivelación Estadística y Matemática

Diagnóstico. Dirección de Cómputo para la Docencia. UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Dirección General de Servicios de Cómputo Académico

Número de árboles Crecimiento (m)

Estadística Inferencial. Estadística Descriptiva

ESTADÍSTICA DESCRIPTIVA

RELACIÓN 1. DESCRIPTIVA

Estadística aplicada a la comunicación

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O.

Estadística Descriptiva y Probabilidad FORMULARIO

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

Estadística I. Profesor de teoría: Profesores de práctica: Andrés M. Alonso

Código: ESA-343. Horas Semanales: 4. Prelaciones: CAL-265

Una vez que tenga la información de la muestra ordenada, se pueden emitir conclusiones finales.

Análisis descriptivo y exploratorio de datos

Perfiles Isométricos Infostat Ejemplo. Universidad Nacional de Colombia. 5 de junio de 2014

ESTADISTICA APLICADA A LA EDUCACIÒN CODIGO: HOC220 EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL, POSICIONAL Y DE DISPERSIÓN

Tema 3. Organización y representación de datos.

68 Bioestadística: Métodos y Aplicaciones. curtosis<0 curtosis=0 curtosis>0. Figura 2.10: Apuntamiento de distribuciones de frecuencias

Título: ESTADISTICA I DESDE UN ENFOQUE POR COMPETENCIAS Primera edición. de esta edición. Fondo Editorial. Universidad San Ignacio de Loyola

ESTADÍSTICA. A su vez, las variables pueden ser :

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Medidas de posición para variables cuantitativas

UNIVERSIDAD MILITAR NUEVA GRANADA FACULTAD DE CIENCIAS BASICAS Y APLICADAS DEPARTAMENTO DE MATEMÁTICAS

PROGRAMA DE ESTADÍSTICA DESCRIPTIVA

Estadística Descriptiva

DESCRIPCIÓN DE DATOS. Medidas Numéricas

2 Pasos en un estudio estadístico.

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Tema 2 Estadística Descriptiva

3 Número de goles marcados por tu equipo favorito en la última temporada.

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

MEDIDAS DE TENDENCIA CENTRAL

Medidas de Tendencia central Medidas de Dispersión Medidas de Asimetría

Tema 2. Organización y representación de datos

Estadística. Conceptos de Estadística. Un individuo o unidad estadística es cada uno de los elementos que componen la población.

3 ANALISIS DESCRIPTIVO DE LOS DATOS

CONTENIDO PROGRAMÁTICO

Repaso Estadística Descriptiva

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

UNIVERSIDAD ABIERTA PARA ADULTOS UAPA CARRERA LICENCIATURA EN ADMINISTRACIÓN DE EMPRESAS PROGRAMA DE LA ASIGNATURA ESTADÍSTICA I

Estadística Descriptiva en SPSS

Classe 1. Tema 1. Anàlisi de relacions. 1. Introducción

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

Grado en Ingeniería Informática Estadística Tema 1: Estadística Descriptiva Ángel Serrano Sánchez de León

CARRERA PROFESIONAL DE ADMINISTRACION Y SISTEMAS

Estadística. Conceptos de Estadística Descriptiva

Exploración de datos

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

EJERCICIOS DE ESTADÍSTICA DESCRIPTIVA

METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES. Unidades de análisis. Base de datos. Variables. Estadística univariada. Gráficos.

Transcripción:

Bioestadística y uso de software científico TEMA 1 INTRODUCCIÓN. ESTADÍSTICA DESCRIPTIVA

Población y muestra Tipos de variable Representación gráfica Medidas que resumen una muestra o una población Medidas de tendencia central Medidas de dispersión Medidas de posición Medidas de forma

Descripción e inferencia Población Inferencia Muestreo Muestra Resultado

Descripción e inferencia Población: Cantabria Inferencia Muestreo Muestra Tensión arterial

Descripción e inferencia Población: La sangre del paciente Inferencia Muestreo Muestra Potasio

Descripción e inferencia Población: 5000 kg de langostinos Inferencia Muestreo Muestra E. coli

Inferencia Una población: Cuál es la frecuencia de cáncer en Cantabria? Qué tensión arterial tiene el paciente X? Dos poblaciones: Es más frecuente el cáncer en varones que en mujeres? Es más eficaz el tratamiento A que el B?

Tipos de variable Variables cualitativas (categóricas) Binarias (dicotómicas) Categóricas no ordenadas (nominales) Categóricas ordenadas (ordinales) Variables cuantitativas Discretas (habitualmente son el resultado de contar) Continuas (habitualmente son el resultado de medir)

Tipos de variable: Binaria Sexo: Varón o mujer Enfermedad: Enfermo / No enfermo Una enfermedad concreta: Infarto / No infarto El resultado de un análisis: VSG>20 / VSG<=20 Asistencia al curso: Asiste / No asiste Resultado del curso: Aprueba / No aprueba Equipo de fútbol: At. Madrid / No At. Madrid

Tipos de variable: Nominal Estado civil: Soltero / Casado / Viudo / Divorciado / Separado Tabaquismo: Fumador / Ex fumador / No fumador Enfermedades: Infarto / Diabetes / Alzheimer /... Equipo de futbol: At. Madrid / Real Madrid / Barcelona / Depor /...

Tipos de variable: Ordinal Enfermedad: IAM / Angina / Nada Criterios de Ramsom Índice ASA Clase funcional NYHA Tabaquismo: No / 1-5 / 6-10 / 11-20 / >20 Edad: 0-14 / 15-24 / 25-44 / 45-64 / 65-74 / 75 Gravedad: Leve / Moderado / Grave / Crítico Tipo de cirugía: Limpia / Limpia-contaminada / Contaminada / Sucia

Tipos de variable: Cuantitativas Discretas: Edad (años cumplidos): 0, 1, 2,... Frecuencia cardíaca Número de hijos Continuas Edad: 20.3 Altura Peso Temperatura

Tipos de variable Cualitativa Binomial y nominal: CLASIFICAR Ordinal: JERARQUIZAR Cuantitativa Discreta: CONTAR Continua: MEDIR

Representación gráfica Una variable Sectores ( tarta ) Diagrama de barras Histograma Tallo y hojas Polígono de frecuencias Caja Dos variables Dispersión Líneas

Sectores Grupo sanguíneo 0 43% A 38% AB 5% B 14%

Sectores Grupo sanguíneo 0 43% A 38% B 14% AB 5%

Sectores B- 2% A- 8% AB- 1% Grupo sanguíneo 0-10% A+ 30% 0+ 34% B+ 11% AB+ 4%

Sectores A- 8% B-AB- 2% 1% 0- Grupo sanguíneo 10% A+ 30% 0+ 34% B+ 11% AB+ 4%

barras 50 40 30 20 10 40 Grupo sanguíneo 15 5 45 0 A B AB 0

barras Grupo sanguíneo 50 40 30 20 10 0 40 45 15 5 A B AB 0

barras Grupo sanguíneo 40 50 20 30 10 0 A B AB 0 60 40 20 0 Grupo sanguíneo A B AB 0

barras Grupo sanguíneo 40 50 20 30 10 0 A B AB 0 Grupo sanguíneo 0 A B AB

barras 50 40 40 Grupo sanguíneo 45 30 20 10 0 15 13 10 5 3 1 A+ B+ AB+ 0+ A- B- AB- 0-

barras 50 40 30 Grupo sanguíneo Grupo sanguíneo B- AB- 0- A- A+ 20 10 0 A+ B+ AB+ 0+ A- B- AB- 0-0+ B+ AB+

histograma 20 40 60 80 100 edad 0 20 Fr requency 40 60 80

Tallo y hojas 7* 0000000000000000000111111111111111111 7t 222222222222222222222222222222333333333333333333333 7f 44444444444444444555555555555555555 7s 666666666666667777777777777 7. 8888888888888888899999999999999999 8* 00000000111111111 8t 222222333333333 8f 4444445555 8s 6677

Diagrama de caja ( Box and whiskers ) 20 40 ed dad 60 80 100

Diagrama de caja ( Box and whiskers ) ed dad 60 80 100 Cuartil 3 Mediana Cuartil 1 20 40

Diagrama de caja ( Box and whiskers ) ed dad 60 80 100 Ls = Q3 + 1,5 IQR 20 40 Li = Q1 1,5 IQR

dispersión 2 3 logpth 4 5 1.5 2 2.5 3 3.5 4 logvitd

Dispersión+línea de tendencia 2 3 4 5 1.5 2 2.5 3 3.5 4 logvitd

Líneas Mortalidad por tuberculosis en España 80 100 ones Tasa de mortalidad en varo 0 20 40 60 60-64 años 45-49 años 75-79 años 85+ años 40 100 ones Tasa de mortalidad en varo 1 2 4 10 20 60-64 años 45-49 años 75-79 años 85+ años 1960 1970 1980 1990 2000 2010 Año de muerte 1960 1970 1980 1990 2000 2010 Año de muerte

Escala aritmética 60 80 100 d en varones Tasa de mortalidad 0 20 40 Intervalos iguales = mismo aumento 60-64 años 75-79 años 85+ años 45-49 años 1960 1970 1980 1990 2000 2010 Año de muerte

Escala logarítmica 20 40 100 ad en varones Tasa de mortalida 1 2 4 10 60-64 años 85+ años 75-79 años 45-49 años Intervalos iguales = mismo % de aumento 1960 1970 1980 1990 2000 2010 Año de muerte

Mortalidad por tuberculosis en España 80 100 ones Tasa de mortalidad en varo 0 20 40 60 60-64 años 45-49 años 75-79 años 85+ años 40 100 ones Tasa de mortalidad en varo 1 2 4 10 20 60-64 años 45-49 años 75-79 años 85+ años 1960 1970 1980 1990 2000 2010 Año de muerte 1960 1970 1980 1990 2000 2010 Año de muerte

Escala aritmética Más fácil de entender Escala logarítmica Ver con lupa algunas zonas del gráfico Líneas paralelas = los dos grupos aumentan o disminuyen en la misma cantidad Líneas paralelas = los dos grupos aumentan o disminuyen en el mismo porcentaje

Diagrama de sectores Sólo para variables binarias o nominales Transmiten muy poca información

Diagrama de barras Variables categóricas Binarias Nominales Ordinales Variables cuantitativas discretas

Histograma y diagrama de cajas Variables cuantitativas Discretas Continuas

Dos variables Relacionar dos variables categóricas Diagrama de barras Relacionar una variable categórica y una cuantitativa Diagrama de barras Histograma Diagrama de caja Relacionar dos variables cuantitativas Diagrama de dispersión Diagrama de líneas

Población española

Mortalidad por cáncer en España Fuente: Cabanes et al, Ann Oncol 2010

Fuente: Autier et al. BMJ 2010 Cáncer de mama, Europa

Fuente: Chirlaque et al. Ann Oncol 2010

Cáncer de esófago en España

Cáncer de estómago en España Fuente: Aragonés et al. Ann Ocol 2010

Cáncer de mama en España Fuente: Pollán et al. Ann Ocol 2010

Cáncer de próstata en España Fuente: Larrañaga et al. Ann Oncol 2010

Cáncer de próstata en España Fuente: Larrañaga et al. Ann Oncol 2010

Cáncer de próstata en España Fuente: Larrañaga et al. Ann Oncol 2010

Cáncer de próstata en España Fuente: Larrañaga et al. Ann Oncol 2010

Tabaquismo en España Fuente: Regidor et al. Ann Oncol 2010

Inactividad física en España Fuente: Regidor et al. Ann Oncol 2010

Obesidad en España Fuente: Regidor et al. Ann Oncol 2010

Bebedores de riesgo en España Fuente: Regidor et al. Ann Oncol 2010

FIGURE 4 Annual Age-Adjusted Cancer Death Rates*Among Males for Selected Cancers, United States, 1930 to 2006 From Jemal, A. et al. CA Cancer J Clin 2010;0:caac.20073v1

FIGURE 5 Annual Age-Adjusted Cancer Death Rates* Among Females for Selected Cancers, United States, 1930 to 2006 From Jemal, A. et al. CA Cancer J Clin 2010;0:caac.20073v1

Riesgo de infección por VIH

Número de muertes semanales en la UE

Incidencia de cáncer en Cantabria

Medidas de una distribución Medidas de tendencia central Medidas de dispersión Medidas de posición Medidas de forma

Medidas de una distribución Medidas en la población: letras griegas µ, σ 2, σ Medidas en la muestra: letras latinas m, s 2, s

Medidas de tendencia central Media n µ = i= 1 n x i Media de 10, 15, 20, 35, 100 10 + 15 + 20 + 35 + 100 µ = = 5 36

Medidas de tendencia central Media de 10, 15, 20, 35, 100 10 + 15 + 20 + 35 + 100 µ = = 5 36 Media de 10, 15, 20, 35 Sensible a valores extremos 10 + 15 + 20 + 35 µ = = 4 20

Distribuciones con diferente media

Medidas de tendencia central Mediana: Valor central de una distribución Mediana de 10, 15, 20, 35, 100 Mediana de 10, 15, 20, 35 Poco sensible a valores extremos 17,5

Medidas de tendencia central Bernal et al, 2010

Medidas de tendencia central Bernal et al, 2010

Medidas de tendencia central Moda El valor más frecuente Moda de 10, 15, 15, 15, 20, 20, 35, 100 15 Moda de 10, 15, 15, 15, 20, 20, 35 15 Poco sensible a valores extremos

Medidas de dispersión

Medidas de dispersión Varianza En la población = n 2 i= 1 σ ( x µ ) 2 i n En la muestra s = n 2 i= 1 ( x m) 2 i n 1

Medidas de dispersión Varianza de 10, 15, 20, 35, 100 ( ) + ( ) + ( ) + ( ) + ( ) 2 2 2 2 2 2 10 36 15 36 20 36 35 36 100 36 σ = = 1367,5 5

Medidas de dispersión Desviación típica (desviación estándar) En la población σ = n i= 1 σ ( x µ ) 2 i n En una muestra s = n i= 1 ( x m) 2 i n 1

Medidas de dispersión Desviación típica de 10, 15, 20, 35, 100 ( 10 36 ) + ( 15 36 ) + ( 20 36 ) + ( 35 36 ) + ( 100 36 ) 2 2 2 2 2 σ = = 36,98 5

Medidas de dispersión Coeficiente de variación CV = σ µ s CV = m

Medidas de posición Percentiles P10: Valor que deja por debajo el 10% de la distribución. Análogamente: P1, P2,..., P99

Percentiles Medidas de posición

Medidas de posición Deciles P10, P20, P30,..., P90. Quintiles P20, P40, P60, P80 Cuartiles P25, P50, P75

Medidas de posición Rango Observación menor - Observación mayor Rango intercuartílico P25 - P75

Diagrama de caja ( Box and whiskers ) 20 40 ed dad 60 80 100

Diagrama de caja ( Box and whiskers ) ed dad 60 80 100 Cuartil 3 Mediana Cuartil 1 20 40

Diagrama de caja ( Box and whiskers ) ed dad 60 80 100 Ls = Q3 + 1,5 IQR 20 40 Li = Q1 1,5 IQR

Diagrama de caja ( Box and whiskers ) Gonzalez-Gay et al, 2005

Medidas de forma Asimetría n ( x µ ) 3 i i= 1 γ 1 = 3 σ n

Medidas de forma Asimetría Figuras con asimetría 0, <0 y >0

Medidas de forma Curtosis o apuntamiento n i n i= 1 g 2 = 3 4 σ ( x µ ) 4

Medidas de forma Curtosis Figuras con curtosis 0, <0, >0