Construcción de una base de datos

Documentos relacionados
Medidas de tendencia central y dispersión

Distribución normal. Resumen. Estadística Aplicada a la Investigación en Salud Medwave. Año XI, No. 5, Mayo Open Access, Creative Commons.

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS

La prueba de ji-cuadrado

Estadística. Análisis de datos.

TEMA 14: ESTADÍSTICA 1. CONCEPTOS ESTADÍSTICOS

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

Estadística Inferencial. Estadística Descriptiva

Gráficos para variables cuantitativas

ESTADÍSTICA UNIDIMENSIONAL

CORPORACION UNIFICADA NACIONAL DE EDUCACION SUPERIOR CUN DEPARTAMENTO DE CIENCIAS BASICAS: MATEMATICAS

ACTIVIDAD N 1. Tipos de frecuencias:

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

2º ESO UNIDAD 14 ESTADÍSTICA Y PROBABILIDAD

Estadistica Aplicada a la Educación CODIGO: HOC220

ORGANIZACIÓN DE DATOS EN DISTRIBUCIONES DE FRECUENCIA

1.5. Representaciones Gráficas

TEMA 7. ESTADÍSTICA. INDIVÍDUO: Es cada uno de los elementos que forman la población o la muestra.

TEMA 1: INTRODUCCIÓN

Unidad 2 TABLAS Y GRÁFICOS ESTADÍSTICOS

TEMA II DISTRIBUCION DE FRECUENCIA

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA 1.- NOCIONES GENERALES

ESTADÍSTICA DESCRIPTIVA

La amplitud del intervalo ( ) se determina considerando un número dado de intervalos ( ) y el rango obtenido, esto es:

Estadística unidimensional

1. Estadística Descriptiva: es la que se utiliza en el análisis y descripción de datos o población.

Tablas de frecuencias con datos agrupados

DISTRIBUCIÓN DE FRECUENCIAS O TABLA DE FRECUENCIAS

ESTADISTICA. Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos:

MÓDULO II. TABULACIÓN Y PRESENTACIÓN DE DATOS TIPOS DE TABLAS ESTADÍSTICAS. Variables - Atributos. Tabla. 26

3 ANALISIS DESCRIPTIVO DE LOS DATOS

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i

Sueldo mensual Estrato Número de hermanos Deporte favorito Tiempo que tardo en hacr una tarea Sexo

Estadística Descriptiva o deductiva Inferencial o inductiva Población: Variable: Variable cualitativa: Variable cuantitativa: Variable discreta

ESTADÍSTICA CON EXCEL

TEMA 1. ORGANIZACION Y REPRESENTACION DE LOS DATOS DE UNA MUESTRA Métodos para datos cualitativos.

1.- Diagrama de barras

Nombre: Curso: Fecha:

Estadística ESTADÍSTICA

Tema 2: Estadísitica descriptiva univariante

RECOLECCIÓN DE DATOS DOCENTES ALUMNOS X ADMINIST. OTROS

Tema 1. Estadística Unidimensional

10/02/2015. Ángel Serrano Sánchez de León

VARIABLE Modalidad 1... Modalidad k Total f 1... f k n

ESTADÍSTICA EN RRLL - CURSO 2010 TURNO NOCTURNO

UNIDAD: ESTADISTICA. La estadística se ocupa de recopilar datos, organizarlos en tablas y gráficos y analizarlos con un determinado objetivo.

Es una herramienta matemática que permite recopilar, organizar, presentar y analizar datos obtenidos de un estudio estadístico.

Estadística Básica 1 Cuatrimestre 2012

Or O g r a g n a i n zac a ión ó y re r p e r p e r s e en e t n a t c a ión ó de d e los o da d t a o t s o TEMA 3.2

Estadística I. 1. Definición. 5. Distribución de Frecuencias. 2. Población. 3. Muestra. 4. Variable Estadística

Tema 1. Tabulación y representación gráfica de los datos

Universidad Diego Portales

Tema 9: Estadística descriptiva

Estadística para el análisis de los Mercados S2_A1.1_LECV1

Apuntes de Estadística

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

Segunda Guía de Estadística Tabla de Frecuencias con Datos Agrupados

Universidad Nacional de Mar del Plata. Facultad de Ingeniería. Estadística Básica COMISIÓN 1. 1 Cuatrimestre 2016

TEMA 11. ESTADÍSTICA

1 POBLACIÓN Y MUESTRA

Estadística. 1. Conceptos de Estadística. 2. Variable estadística. 3. Tablas de estadística. 4. Diagrama de barras y polígonos de frecuencias.

ORGANIZACIÓN Y REPRESENTACIÓN GRÁFICA DE LOS DATOS

Histograma. Diagrama de frecuencia. Diagrama de barras 1, 3. Polígono de frecuencias acumuladas. Diagrama de sectores 1, 3

LICEO "BRICEÑO MENDEZ" COD. S0120DO320 DEPARTAMENTO DE EVALUACION EL TIGRE ESTADO ANZOATEGUI MSc. LIYUAN SUÁREZ REALIZADO POR: FECHA / /

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.

Tema 2: Distribuciones de frecuencia y gráficas para datos categórico y discretos 1.1-1

PROBABILIDAD. Unidad I Ordenamiento de la Información

Distribuciones de frecuencia

Tema 1: Análisis de datos univariantes

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

MEDIDAS DE TENDENCIA CENTRAL

Profesora: Beatriz Ponce Nely TADA- 03

alumnos: 20 = n - 100% - x i son los valores que aparecen en los datos. f i

Unidad 3 Organización y clasificación de los datos

LICEO NAVAL CAPITÁN N DE CORBETA MANUEL CLAVERO ESTADÍSTICA. Jose Gonzales Villanueva Profesor de Matemática.

Unidad VIII: DATOS Y AZAR. CLASE 1: Recordando algunos conceptos previos de Estadística

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

Tema 2. Distribuciones de frecuencias y representaciones gráficas. Tema 2 Distribuciones de frecuencias. Índice

3 Número de goles marcados por tu equipo favorito en la última temporada.

1. Caracteres estadísticos

Descripción de los Datos

HOJA DE EJERCICIOS EN CLASE. SEMANA 1.

TIPOS DE DATOS Y SU TABULACIÓN

ESTADÍSTICA. Prof. Alex Iparraguirre Zavaleta

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

Introducción a la Asignatura

Perfiles Isómetricos Excel Ejemplo. Universidad Nacional de Colombia. Mayo 2014

ESTADÍSTICA. Rincón del Maestro:

2.- Tablas de frecuencias

Práctica 3: DIAGRAMAS DE DATOS UNIVARIANTES

Tema 3. Organización y representación de datos.

Transcripción:

Estadística Aplicada a la Investigación en Salud Medwave. Año XI, No. 2, Febrero 2011. Open Access, Creative Commons. Construcción de una base de datos Autor: Fernando Quevedo Ricardi (1) Filiación: (1) Departamento de Educación en Ciencias de la Salud, Facultad de Medicina, Universidad de Chile Correspondencia: fquevedo@med.uchile.cl doi: 10.5867/medwave.2011.02.4855 Ficha del Artículo Citación: Quevedo F. Construcción de una base de datos. Medwave 2011 Feb;11(2). doi: 10.5867/medwave.2011.02.4855 Fecha de envío: 16/12/2010 Fecha de aceptación: 24/12/2010 Fecha de publicación: 1/2/2011 Origen: solicitado Tipo de revisión: sin revisión por pares Resumen En la sección Series, Medwave publica artículos relacionados con el desarrollo y discusión de herramientas metodológicas para la investigación clínica, la gestión en salud, la gesión de la calidad y otros temas de interés. En esta edición se presentan dos artículos que forman parte del programa de formación en Medicina Basada en Evidencias que se dicta por e-campus de Medwave. El artículo siguiente pertenece a la Serie "Estadística Aplicada a la Investigación en Salud". Presentación de resultados Una vez que los datos han sido recogidos y registrados, comienza el procesamiento de datos. En la actualidad este procesamiento contempla el uso de computador, de Número Nombre Edad Sexo Peso 1 Angelica 25 F 49,50 2 Marcos 18 M 42,12 3 Sonia 12 F 27,09 Tabla 1: Presentación de resultados. manera que el primer paso será disponer los datos en una base de datos. Esto puede hacerse usando el programa excel u otro equivalente, asignando a cada caso una fila en la planilla excel, y a cada variable, una columna. En el ejemplo tenemos una base de datos con 3 casos y 4 variables. Es importante que los códigos y valores asignados a las variables respondan a criterios estables y estén expresados en el mismo formato, porque eso permitirá aplicar los filtros cuando se agrupen los casos. Es decir, que todas las edades estén expresadas en años cumplidos, por ejemplo, que todas las letras que indican el sexo sean mayúsculas, que los valores de peso estén expresados en kilos y siempre con dos decimales, por ejemplo, etc. Resumen de datos: tablas y gráficos Las formas más usadas para presentar los datos son las tablas y los gráficos. Anotaremos algunos conceptos sobre tipos de gráficos que le permitirán, por una parte, evaluar si un gráfico presentado en algún estudio está bien elegido, y por la otra, seleccionar los tipos más adecuado para sus propias investigaciones. Tipos de gráficos El tipo de gráfico a utilizar dependerá principalmente del tipo de la variable y de los objetivos del estudio. Así, para una variable cualitativa o cuantitativa-discreta, se puede utilizar un gráfico de barras simples o un gráfico de sectores. www.medwave.cl 1 Año XI, No. 2, Febrero 2011.

Gráfico 1: Barras Simples Gráfico 4: Polígono de Frecuencia El polígono de frecuencia se construye localizando el punto medio de cada intervalo de clase y marcando un punto a la altura de la frecuencia correspondiente al intervalo. Estos puntos se unen luego con líneas rectas. El polígono de frecuencias es particularmente útil para comparar la distribución de una variable entre muestras distintas. Gráfico 2: Sectores Si se trata de dos variables de tipo cualitativa o cuantitativa-discreta, por ejemplo: estado civil y sexo, entonces es útil un gráfico de barras agrupadas. viudo divorciado soltero casado 0 10 20 30 40 50 Gráfico 3: barras Agrupadas mujer hombre En el caso de una variable cuantitativa en escala continua, se puede utilizar polígono de frecuencia. Tipos de tablas Distribuciones de frecuencia Tanto los datos cualitativos como los cuantitativos pueden resumirse en distribuciones de frecuencia. En el caso de los datos cualitativos la construcción de una tabla de frecuencia es relativamente simple: consiste en asignar a cada categoría de la escala un número (frecuencia) que corresponde a la cantidad de veces que se repite dicha categoría entre las unidades observadas. Ejemplo: La distribución de frecuencia de la variable estado civil, en una muestra de 25 personas se presenta en la siguiente tabla: Estado civil Frecuencia Casado 12 Soltero 8 Viudo 5 Total 25 Tabla 2: Distribución de Frecuencia Para variables discretas tales como el número de camas de un hospital, o el número de caras observadas al lanzar cinco monedas, los valores de clase que se han de utilizar son obvios en general. Así, una tabla de frecuencia del número de caras que se presentan al lanzar cinco monedas 100 veces, sería: Postulantes clasificados según puntaje, separados por sexo. www.medwave.cl 2 Año XI, No. 2, Febrero 2011.

Valor de clase Frecuencia 5 4 4 15 3 29 2 30 1 17 0 5 Total 100 Tabla 3: Variables Discretas Cuando el recorrido de la variable es pequeño y el tamaño de la muestra es grande hay valores de la variable que se repiten, por ejemplo si preguntamos por el número de personas que trabajan en cada familia, en una muestra de 50 familias, tendremos los siguientes resultados: Para tabular los datos del ejemplo en cinco intervalos de clases, debemos considerar que el recorrido de la variable va de 66 a 115 y por lo tanto el rango de variación de la variable es de 50 mil pesos (115 menos 66). Como el objetivo es construir una tabla con 5 intervalos, cada intervalo deberá tener una amplitud de 10 (50/5) Así entonces conseguiremos una tabla como la siguiente (donde LS significa límite superior y LI límite inferior). Intervalos Frecuencia LI - LS 66-76 4 76-86 11 86-96 20 96-106 9 106-115 6 Total 50 Se puede observar que el recorrido de la variable va de 1 a 4, por lo tanto al hacer un conteo de la variable se tiene la siguiente tabla: Personas que trabajan de familias 1 16 2 20 3 9 4 5 Total 50 Cuando el tamaño de la muestra y el recorrido de la variable son grandes, será necesario agrupar en intervalos de clases. Por ejemplo si a un grupo de 50 familias se le consulta por sus ingresos semanales (en miles de pesos). Tipos de frecuencia Uno de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de datos, es decir, recoger la información de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido. Estos números se denominan frecuencias. Así se tienen las frecuencias que se enumeran a continuación. Frecuencia absoluta Esta frecuencia la denotaremos por ni y la definiremos como el número de veces que se repite un determinado valor de la variable. La suma de todas las frecuencias absolutas es igual al tamaño de la muestra. Frecuencia relativa Esta frecuencia la denotaremos por hi y la definiremos como el cuociente entre la frecuencia absoluta y el tamaño de la muestra. Donde n es el tamaño de la muestra y el recorrido de esta frecuencia es: Figura 1. : Frecuencia hi Evidentemente, el recorrido de la variable es grande, por lo tanto necesitamos tabular con intervalos de clases. Para decidir sobre la cantidad de intervalos se debe tener en cuenta las siguientes consideraciones: Al tomar pocos intervalos aumenta la pérdida de información. Normalmente se trabaja con un máximo de 10 intervalos. La frecuencia relativa es un tanto por uno, sin embargo también se puede escribir en tanto por ciento. La suma de todas las frecuencias relativas debe ser igual a uno (1,0) o 100 si se está amplificando tanto por 100. Frecuencia absoluta acumulada (Ni) Para poder calcular este tipo de frecuencia hay que tener en cuenta que la variable ha de ser cuantitativa o cualitativa ordinal. La frecuencia absoluta acumulada es el número de observaciones que hay desde el valor menor www.medwave.cl 3 Año XI, No. 2, Febrero 2011.

de la variable hasta un valor determinado de ella. Esta frecuencia tiene dos propiedades: En este tipo de tablas se pueden identificar tres frecuencias: La primera frecuencia absoluta acumulada es igual a la primera frecuencia absoluta. La última frecuencia absoluta acumulada es igual al tamaño de la muestra. Frecuencia relativa acumulada (Hi) Es la proporción (o porcentaje si se amplifica por 100) de observaciones que hay desde el valor menor de la variable hasta un valor determinado de ella. Esta frecuencia tiene dos propiedades: La primera frecuencia relativa acumulada es igual a la primera frecuencia relativa. La última frecuencia relativa acumulada es igual a uno (1,0) o 100. Esto se entenderá mejor con un ejemplo. Tomaremos los datos de las personas que trabajan en cada familia, cuyas frecuencias absolutas ya anotamos en una tabla: Personas que de familias hi hi % Ni Hi Hi% trabajan (Xi) (ni) 1 16 16/50 = 0,32 32 16 16/50=0,32 32 2 20 20/50 = 0,40 40 36 36/50=0,72 72 3 9 9/50 = 0,18 18 45 45/50=0,90 90 continuación. 4 5 5/50 = 0,10 10 50 50/50=1,00 100 TOTAL 50 1,0 100 Interpretación: para efectos didácticos se interpretarán los valores de la segunda fila: La frecuencia marginal por estado civil (86 casadas, 48 solteras, 30 convivientes). La frecuencia marginal por edad (14, 29, 52, 34 y 35). La frecuencia conjunta (5,2,7,18,6,5,23,17,12,15,15,4,25,8,2). Cada frecuencia tiene su interpretación particular. Así, la frecuencia por estado civil indica que hay 86 casadas, la frecuencia por edad indica que hay 29 mujeres que tienen entre 21 y 25 años y finalmente, la frecuencia conjunta indica que son 18 las mujeres casadas que tienen entre 21 y 25 años. En una tabla de asociación los porcentajes se pueden calcular de acuerdo a tres criterios, que en este ejemplo serían: Usando como referencia los totales por estado civil. Usando como referencia los totales por edad. Usando como referencia el total general. El criterio a utilizar dependerá de la pregunta que se quiera responder. Para ilustrar esto tomemos como ejemplo la frecuencia conjunta 18. Usando este valor se pueden responder tres preguntas que se enumeran a Qué porcentaje de las casadas tiene entre 21 y 25 años? Para responder a esta pregunta usaremos el total por estado civil. Hay 20 familias que tienen 2 personas que trabajan. Un 40% de las familias tiene 2 personas que trabajan. 36 familias tienen 2 personas o menos, que trabajan. El 72% de las familias tiene 2 personas o menos que trabajan. Tabla de asociación En una tabla de asociación los datos están clasificados según dos o más variables o criterios. Ejemplo: La siguiente tabla muestra la asociación entre edad y estado civil. EDAD CASADA SOLTERA CONVIVIENTE TOTAL 17-20 5 2 7 14 21-25 18 6 5 29 26-30 23 17 12 52 31 35 15 15 4 34 36 40 25 8 2 35 TOTAL 86 48 30 164 Respuesta: el 20,9% de las casadas tiene entre 21 y 25 años. Cabe hacer notar que en esta pregunta la condición de casada antecede al hecho de tener entre 21 y 25 años. Qué porcentaje de las mujeres que tienen entre 21 y 25 años, son casadas? En este caso responderemos usando el total por edad. Respuesta: El 62% de las mujeres que tienen entre 21 y 25 años de edad, son casadas. Cabe hacer notar que en esta pregunta la condición de tener entre 21 y 25 años antecede al hecho de ser casada. Qué porcentaje de las mujeres son casadas y tienen entre 21 y 25 años de edad? www.medwave.cl 4 Año XI, No. 2, Febrero 2011.

Ahora, como la pregunta no especifica una condición antes que la otra, sino más bien exige que las dos condiciones se den en forma simultánea, procede entonces utilizar como referencia el total general. Respuesta: El 11% de las mujeres son casadas y tienen entre 21 y 25 años de edad. Esta obra de Medwave está bajo una licencia Creative Commons Atribución-NoComercial 3.0 Unported. Esta licencia permite el uso, distribución y reproducción del artículo en cualquier medio, siempre y cuando se otorgue el crédito correspondiente al autor del artículo y al medio en que se publica, en este caso, Medwave. www.medwave.cl 5 Año XI, No. 2, Febrero 2011.