www.metodo.uab.cat Estudios de postgrado en Metodología de la investigación en Ciencias de la Salud Curso ST2 Proceso avanzado de datos sanitarios con Stata Contenidos UD 0 Presentación del curso The Popularity of Data Analysis Software Presentación de Stata Bibliografía Web y Portal de soporte de Stata Mantener actualizado Stata Documentación y recursos sobre Stata Lista de correo Statalist Búsquedas de un tema Búsquedas en Google sobre contenidos de Stata Características de Stata Convenciones utilizadas en este texto Apéndice 1: Preparación de los ordenadores para este curso Apéndice 3: Símbolo decimal y sintaxis Stata Apéndice 2: Cambiar la carpeta de trabajo de forma permanente. El archivo profile.do Curso ST2: Proceso avanzado de datos sanitarios con Stata Pág. 1 de 6
UD 1 Lectura y creación de datos 1 Lectura de datos en formato texto 1.1 Comando import delimited Lectura de datos texto en formato delimitado 1.2 Lectura de fechas en formato texto 1.3 Comando infix Lectura de datos en formato texto fijo 1.3.1 Ejemplo: archivo ESHSmicrodat.txt 1.3.2 Comando infix Lectura de archivos de texto fijo con un archivo de diccionario 2 Lectura de bases de datos relacionales 2.1 Base de datos relacional relación uno a uno 2.2 Base de datos relacional relación uno a varios 2.3 Comando odbc load Lectura de bases de datos 2.3.1 Ejemplo: limitar la recuperación de datos 2.3.2 La cadena de conexión ODBC 3 Utilidad Value Labels.mde para capturar las etiquetas de los códigos de las variables categóricas 3.1 Capturar etiquetas 3.2 Asignar etiquetas de valor a variables cadena con diccionario 3.3 Convertir en etiquetas los valores de las variables cadena 3.4 Generar etiquetas a partir de los valores de otra variable 4 Generación de datos 5.1 fill egen function 5.1.1 Objetivo 5.1.2 Algoritmo de generación de casos ficticios para realizar predicciones Apéndice 1: insheet Lectura de datos en formato texto delimitado Objetivo Ejemplo: Importación de un archivo de texto delimitado creado a partir de un Excel con los nombres de variable en la primera fila Apéndice 2: Lectura de un archivo de texto fijo en formato ficha (varios registros por caso) Apéndice 3: Solución al problema para leer bases de datos de Access en sistemas de 64 bits Ejercicio 1: Importar un archivo de texto fijo Ejercicio 2: Captura de una base de datos de MS-ACCESS Ejercicio 3: Captura de las etiquetas de valor de una base de datos de MS-ACCESS Ejercicio 4: Generación de datos para realizar predicciones Sintaxis solución de los ejercicios Curso ST2: Proceso avanzado de datos sanitarios con Stata Pág. 2 de 6
UD 2 Fusión de archivos 1 Unión de archivos de datos Stata 1.1 Unión mediante adición de casos: comando append 1.2 Unión mediante adición de variables: comando merge 1.2.1 Relación uno a uno (1:1) 1.2.2 Relación uno a varios : archivos de tipo diccionario (1:m) 2 Comando append - añadir casos a un archivo 2.1 Unión de varios archivos 3 Comando merge - Añadir variables a un archivo 3.1 Relación uno a uno (1:1) 3.2 Relación varios a uno (m:1) 3.3 Actualizaciones (update y replace) 3.4 Algoritmo: Estandarización de tallas 4 Comando erase eliminar archivos del disco duro Ejercicio 1: Predicciones con un modelo de regresión Ejercicio 2: Añadir casos Ejercicio 3: Añadir variables Ejercicio 4: Estandarización de las tallas Sintaxis solución de los ejercicios Curso ST2: Proceso avanzado de datos sanitarios con Stata Pág. 3 de 6
UD 3 Evaluación de la calidad de los datos 1 Etapas del trabajo de investigación 2 Depuración de los datos 3 Secuencia del proceso de depuración 3.1 Presentación de un ejemplo 3.2 Datos correctos 4 Tipos de comprobación sobre los datos 4.1 Identificadores 4.2 Variables 4.3 Implicaciones entre variables (Comprobaciones lógicas) 5 Procedimiento para comprobar las variables 6 Plantillas de sintaxis y comandos para realizar el proceso de depuración 7 Lectura de la matriz de datos sin depurar 8 Fase 0: Inicialización de las variables auxiliares 9 Fase 1: Depuración de los identificadores 9.1 Detección de errores en las variables identificadoras con el comando dr 9.2 Corrección de los identificadores 9.3 Sintaxis del proceso de depuración de los identificadores 10 Fase 2: Detección de errores de rango 10.1 Detección de errores de rango en las variables numéricas y cadena 10.1.1 Detección de errores a partir de una lista de valores con el comando dr 10.2 Detección de errores mediante un archivo diccionario con el comando dr 10.3 Detección de errores de rango en las variables fecha 10.3.1 Fecha de rango expresado mediante un intervalo de fechas 10.3.2 Fecha de rango expresado mediante un intervalo de tiempo transcurrido 11 Informe de incidencias 12 Corrección de incidencias 12.1 Comprobación de datos corregidos 13 Fase 3: Comprobaciones lógicas 13.1 Cómo realizar comprobaciones lógicas en este procedimiento de depuración 13.1.1 Comprobación #10 13.1.2 Comprobaciones #11 y #12 13.1.3 Comprobación #13 13 Informe de incidencias 13.1 Comprobación de datos corregidos 13.2 Grabación de los datos depurados 14 Resumen del procedimiento de depuración Ejercicio 1: Depuración del identificador Ejercicio 2: Depuración de los errores de rango Ejercicio 3: Listado de incidencias y corrección de los errores de rango Ejercicio 4: Depuración de los errores lógicos y grabación del archivo depurado Curso ST2: Proceso avanzado de datos sanitarios con Stata Pág. 4 de 6
UD 4 Gestión de datos con series de valores 1 Creación de un archivo de datos agregados 1.1 Comando collapse agregar casos en un nuevo archivo 1.1.1 Creación de un archivo utilizando las funciones de agregación media, máximo, mínimo y número de casos 1.1.2 Añadir las variables agregadas al archivo de trabajo: comando merge 1.1.3 Añadir variables agregadas al archivo de trabajo con el comando egen 1.2 Comando contract crear un archivo de frecuencias y porcentajes 2 Creación de series de valores en estudios de seguimiento 2.1 Subíndices (Subscripting) 2.2 Retrasos y adelantos 2.3 Diferencias y Suma acumulada 2.4 Subgrupos 3 Generación de variables que realizan cálculos entre seguimientos 3.1 Creación de indicadores para un estudio de reingresos 3.1.1 Estancia media 3.1.2 Número de altas y secuencia de ingresos 3.1.3 Días transcurridos entre alta y reingreso 3.1.4 Matriz de datos con los reingresos 4 Creación de variables que contienen rangos (números de orden) 4.1 Función rank del comando egen 4.1.1 Ejemplo: Creación del rango de una variable con empates 4.1.2 Ejemplo: Creación de la secuencia de ingresos 4.2 Creación del número de orden de una variable cadena 5 Preparación del archivo de análisis con Stata para estudios con seguimientos 5.1 Reestructuración mediante segmentación del archivo 6 Reestructuración del archivo de datos: comando reshape 6.1 Comando reshape wide 6.1.1 Reestructuración de los seguimientos en variables 6.2 Comando reshape long 6.1.1 Reestructuración de variables en seguimientos 6.3 Reestructurar automáticamente 7 Comando xpose Transponer filas por columnas 8 Algoritmo: Velocidad de incremento de CD4 a lo largo de los seguimientos Ejercicio 1: Creación de archivos con datos agregados Ejercicio 2: Creación de una serie de valores Ejercicio 3: Estudio sobre reingresos Ejercicio 4: Crear una variable de secuencia de seguimientos Ejercicio 5: Reestructurar los datos transformando seguimientos en variables Ejercicio 6: Reestructurar los datos trasponiendo los sujetos por variables Sintaxis solución de los ejercicios Curso ST2: Proceso avanzado de datos sanitarios con Stata Pág. 5 de 6
UD 5 Variables macro. Acceso a los resultados guardados. 1 Presentación de las variables macro de Stata 1.1 Macros locales 1.2 Macros globales 2 Manipular variables macro 2.1 Funciones extendidas de macro 3 Acceso a los resultados guardados por los comandos 3.1 Acceder a los resultados de los comandos de estimación 3.2 Grabar los resultados de los comandos de estimación en un conjuntos de datos 3.3 Comando putexcel grabar resultados de los comandos en un archivo de Excel 4 Algoritmo: Creación de un archivo de datos multirrespuesta a partir de una tabla con los tratamientos administrados EJERCICIO Sintaxis solución del ejercicio UD 6 Programación con Stata. Comandos de usuario. 1 Combinar archivos de sintaxis (do-files) 2 Proceso condicional: if 2.1 Ejemplo de control de errores con el comando if 3 Bucles: foreach 3.1 Repetir comandos recorriendo variables 3.2 Repetir comandos recorriendo una lista de números 3.2.1 Obtener las etiquetas de valor de los valores de una serie de variables 3.4 Repetir comandos recorriendo cualquier tipo de dato 4 Escribir programas de Stata: comandos de usuario 4.1 Hola mundo! 4.2 Guardar un programa en un archivo.ado 4.3 Programa para calcular intervalos de confianza 4.4 Creación del comando de usuario calcula_ci 4.5 Archivos de ayuda en línea 4.6 Cuadro de diálogo asociado a un comando Ejercicio 1: Recorrer variables con el comando foreach Ejercicio 2: Generar el comando de usuario sku Sintaxis solución del ejercicio Curso ST2: Proceso avanzado de datos sanitarios con Stata Pág. 6 de 6