Selección de fuentes de datos y calidad de datos

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Selección de fuentes de datos y calidad de datos"

Transcripción

1 Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago

2 . Valores atípicos. Valores faltantes. Valores erróneos. Eliminación. Corrección ó

3 Limpieza: Utilizar algoritmos robustos a datos atípicos o desaparecidos (p.e. árboles de decisión) Filtrar información Reemplazar valores con técnicas de imputación Discretización: transformar datos continuos en discretos Transforma ción: Técnicas de reducción o aumento de las dimensiones Escalado simple y multidimensional

4 Características Puntuación extrema en una variable Produce distorsiones en los análisis Alejados del promedio de observaciones Causas: Errores de procedimiento: codificación, grabación, entrada de datos (Acción: Filtrado, eliminación, recodificación a ausentes ) Observaciones extraordinarias, con explicación (se retienen si no anecdóticas) Observaciones extraordinarias, sin explicación (Eliminación) Observaciones fuera de rango ordinario de valores de la variable (Eliminación) * Los casos atípicos hay que analizarlos desde perspectiva multivariante, considerarse en el conjunto de todas las variables

5 Análisis exploratorio univariante: Gráficos de caja y bigotes. Diagramas de control Detección: Estadisticos robustos de la variable y ver diferencias respecto de no robustos: Media truncada: quita 15% de los valores en cada extremo.media winsorizada: sustituye ese 15% por valores del centro de la distribución. variación media respecto de la mediana desviación típica truncada desviación típica winsorizada ***Si no hay valores atípicos los estadísticos robustos y los normales no difieren mucho. Contraste formal estadístico par detectar valores atípicos: Test de Dixon, Test de Grubs

6 Análisis Bivariante: Gráfico de caja y bigotes múltiple (distintos gráficos de una variable para diferentes niveles de la otra). Gráficos de dispersión por pares de variables. Análisis de Influencia (leverage) de cada observación Análisis Multivariante: D2 (Distancia de Mehalanobis): distancia media cuadrática de cada observación respecto del centro medio de las observaciones. DFITS: influencias de cada observación en caso de ser eliminada del análisis.

7 Características Inexistencia de información para determinadas observaciones y variables Registro defectuoso Causas: Ausencia natural de información Falta de respuesta (total o parcial) Unión o actualización de base de datos

8 Tabla de frecuencias de valores perdidos, para cada variable, para tener idea de su magnitud. Evaluación: Comprobar si se distribuyen aleatoriamente en todo el conjunto de datos (para cada variable en relación a las demás variables). Matriz de correlaciones dicotomizadas

9 Tratamiento 1: Supresión según lista (por defecto): se quitan las filas (casos) con valores faltantes en alguna variable. Inconvenientes: si muchos valores perdidos=reducción drástica de ficheros y análisis no representativos. Supresión de casos según pareja, en análisis bivariante: se suprimen solo los casos con información faltante en cada par de variables en análisis, con independencia de lo que ocurra con otras variables. Se elimina menos información que con anterior.

10 Tratamiento 2: Suprimir casos (filas) o variables (columnas) que peor se comporten respecto de datos ausentes. Balancear lo que se gana o pierde con la supresión. Imputación de la información faltante. Estimación de valores en base a valores válidos de otras variables o casos.

11 Enfoque de disponibilidad completa: Imputación NO de valores, sino de caracteristicas de distribución: desviación típica, correlaciones Sustitución de valores ausentes por estimados: 1. Sustitución del caso: cuando casos con casi o toda la información ausente, se sustituye todo el caso por uno nuevo, ajeno a la muestra.

12 Sustitución de valores ausentes por estimados: 2. Sustitución por la media: los valores ausentes se sustituyen por la media de los valores válidos de la variable correspondiente. Fácil, pero altera correlaciones e invalida estimaciones de la varianza. 3. Sustitución por la mediana: cuando valores más extremos en variable se usa mediana (+robusta) y no media. 4. Sustitución por interpolación de valores adyacentes (media o moda da un cierto nº de valores adyacentes.

13 Sustitución de valores ausentes por estimados: 5. Sustitución por valor constante, derivado de fuentes externas, juicio de expertos o investigación previa. 6. Imputación por regresión: predicción del valor a partr de una ecuación de regresión con otras variables. Originará correlaciones más elevadas con variables de las que proviene. 7. Imputación múltiple: combinación de varios métodos anteriores.

14 Puntos a tratar Detección y tratamiento de valores en las variables cualitativas Detección y tratamiento de valores en variables cuantitativas Tratamientos de valores perdidos

15 Libro de códigos de la base de datos PATIENTS.TXT

16 Puntos a tratar Detección y tratamiento de valores en las variables cualitativas Detección y tratamiento de valores en variables cuantitativas Tratamientos de valores perdidos

17 Detección y tratamiento de valores en las variables cualitativas Exploración de variables El objetivo es detectar valores ausentes y detectar errores en la codificación de las variables Generación de tablas de frecuencias. Buscamos los diferentes valores repetidos en la variable categórica.

18 Detección y tratamiento de valores en las variables cualitativas Solución de problemas Eliminación de valores erróneos. Recodificación de las variables. M -> Male F, f, 2 -> Female X, ausente -> ausente

19 Puntos a tratar Detección y tratamiento de valores en las variables cualitativas Detección y tratamiento de valores en variables cuantitativas Tratamientos de valores perdidos

20 Detección y tratamiento de valores en las variables numéricas Exploración de variables El objetivo es detectar, no solamente valores ausentes, sino también, detectar valores extremos o fuera de rango Utilización de estadísticos descriptivos para detectar esta información

21 Detección y tratamiento de valores en las variables numéricas Graficos

22 Detección y tratamiento de valores en las variables numéricas BOX-PLOT

23 Detección y tratamiento de valores en las variables numéricas Listado de valores fuera de rango Errores de transcripción de la informacion Valores ausentes especiales

24 Detección y tratamiento de valores en las variables numéricas Outlier bivariante

25 Detección y tratamiento de valores en las variables numéricas Descriptivos no afectados por valores extremos

26 Puntos a tratar Detección y tratamiento de valores en las variables cualitativas Detección y tratamiento de valores en variables cuantitativas Tratamiento de valores perdidos

27 Tratamiento de valores perdidos Por qué es importante tratar los valores perdidos? Determinados modelos matemáticos (modelos lineales, como la regresión lineal o la regresión de poison) no permiten la existencia de valores perdidos, produciéndose la perdida del caso entero para el modelo. Pueden inutilizar el poder predictivo de una variable sobre otra.

28 Tratamiento de valores perdidos Forma de tratar los valores perdidos Eliminación de casos con valores perdidos Eliminación de variables con demasiado valores perdidos Imputación de valores Tratamiento de valores de variables cuantitativas por medio de la categorización de la variable, y dejando una categoría mas con todos los valores perdidos.

29 Tratamiento de valores perdidos Imputación a través de valores de la variable A través de los estadísticos de la distribución como la media, la mediana, máximo. Minimo. Inconveniente: Modificamos la variabilidad de la variable. A través de los valores de otras variables Utilización de los valores de otras variables para calcular un modelo predictivo que nos de el valor de la variable en el caso de que esta contenga un valor perdido.

30 Bibliografía recomendada Cody, Ron Cody s Data Cleaning Techniques Using SAS, Second Edition. Cary, NC: SAS Institute Inc.

31 MUCHAS GRACIAS

TEMA II EL ANÁLISIS PRELIMINAR DE LOS DATOS

TEMA II EL ANÁLISIS PRELIMINAR DE LOS DATOS TEMA II EL ANÁLISIS PRELIMINAR DE LOS DATOS LECTURA OBLIGATORIA Capítulo 2: Preparación del Archivo de datos. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en Ciencias de

Más detalles

TEMA II EL ANÁLISIS PRELIMINAR DE LOS DATOS

TEMA II EL ANÁLISIS PRELIMINAR DE LOS DATOS TEMA II EL ANÁLISIS PRELIMINAR DE LOS DATOS LECTURA OBLIGATORIA Capítulo 2: Preparación del Archivo de datos. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en Ciencias de

Más detalles

UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONÓMICAS

UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONÓMICAS INSTITUTO DE INVESTIGACIÓN DE LA FACULTAD DE CIENCIAS ECONÓMICAS INFORME FINAL DEL TEXTO TEXTO: ESTADÍSTICA DESCRIPTIVA APLICADA A LA ECONOMIA

Más detalles

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión

Más detalles

1. Datos Atípicos o Outliers

1. Datos Atípicos o Outliers Francisco M. Ocaña Peinado Técnicas estadísticas en Nutrición y Salud Tratamiento estadístico de outliers y datos faltantes 1. Datos Atípicos o Outliers Se denominan casos atípicos u outliers a aquellas

Más detalles

1 de 12 15/07/ :49

1 de 12 15/07/ :49 1 de 12 15/07/2010 12:49 Saltar a... UPM - TITULACIONES OFICIALES ampliacion_mate2 Cuestionarios Test Estadística Descriptiva Información Resultados Vista previa Editar Visión general Recalificar Calificación

Más detalles

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

Modelado y simulación en Ingeniería Química. Manuel Rodríguez ÍNDICE Modelos de caja gris Calibración de modelos Estimación de parámetros Análisis de la estimación Regresión no lineal 1. Modelos de caja gris Son modelos de un sistema (o proceso), donde: Desarrollados

Más detalles

TEMA 5 Estadística descriptiva. Análisis de datos

TEMA 5 Estadística descriptiva. Análisis de datos TEMA 5 Estadística descriptiva. Análisis de datos Florence Nightingale (1820-1910) 1. Introducción. Modelos matemáticos 2. Métodos numéricos. Resolución de sistemas lineales y ecuaciones no lineales 3.

Más detalles

Lucila Finkel Temario

Lucila Finkel Temario Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión

Más detalles

ANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth

ANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth ANÁLISIS DE DATOS 1 Tipos de Análisis en función de la Naturaleza de los Datos Datos cuantitativos Datos cualitativos Análisis cuantitativos Análisis cuantitativos de datos cuantitativos (Estadística)

Más detalles

ÍNDICE. Introducción... Capítulo 1. Técnicas de minería de datos y herramientas... 1

ÍNDICE. Introducción... Capítulo 1. Técnicas de minería de datos y herramientas... 1 ÍNDICE Introducción... XI Capítulo 1. Técnicas de minería de datos y herramientas... 1 Clasificación de las técnicas de minería de datos y herramientas más comunes... 1 Modelado originado por la teoría

Más detalles

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS Cátedra: TABLA DE CONTENIDOS INTRODUCCIÓN Qué es la Probabilidad? Qué es la Estadística? La evolución histórica de la Estadística Algunos conceptos imprescindibles Fuentes de datos Tipos de datos y escalas

Más detalles

Curso: 2º Créditos ECTS: 6 Tipo de asignatura: Básica Tipo de formación: Teórico-Práctica

Curso: 2º Créditos ECTS: 6 Tipo de asignatura: Básica Tipo de formación: Teórico-Práctica Ficha Técnica Titulación: Plan BOE: Asignatura: Módulo: Grado en Criminología BOE número 75 de 28 de marzo de 2012 / Corrección de errores: BOE número 85 de 9 de abril de 2012 Metodología Curso: 2º Créditos

Más detalles

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables

Más detalles

Sumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad...

Sumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad... ÍNDICE SISTEMÁTICO PÁGINA Sumario... 5 Prólogo... 7 Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares... 9 Objetivos de la Unidad... 11 1. Población y muestra... 12 2. Parámetro

Más detalles

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado. Objetivos / Criterios de evaluación TEMA 14 ESTADÍSTICA O.15.1 Conocer el significado y saber calcular los parámetros de centralización y dispersión O.15.2 Interpretar y utilizar los parámetros de dispersión.

Más detalles

Estadística I. Finanzas y contabilidad

Estadística I. Finanzas y contabilidad Estadística I. Finanzas y contabilidad Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad. Modelos probabilísticos.

Más detalles

GUÍA DE STATGRAPHICS 5.1

GUÍA DE STATGRAPHICS 5.1 UNIVERSIDAD POLITÉCNICA DE MADRID ESCUELA UNIVERSITARIA DE ARQUITECTURA TÉCNICA DEPARTAMENTO DE MATEMÁTICA APLICADA A LA ARQUITECTURA TÉCNICA GUÍA DE STATGRAPHICS 5.1 (Versión castellana) GUÍA DE STATGRAPHICS

Más detalles

Tema 2: Análisis de datos bivariantes

Tema 2: Análisis de datos bivariantes 1 Tema 2: Análisis de datos bivariantes En este tema: Tabla de contingencia, tabla de doble entrada, distribución conjunta. Frecuencias relativas, marginales, condicionadas. Diagrama de dispersión. Tipos

Más detalles

Estadística Aplicada a la Toma de Decisiones

Estadística Aplicada a la Toma de Decisiones Unidad responsable: 310 - EPSEB - Escuela Politécnica Superior de Edificación de Barcelona Unidad que imparte: 732 - OE - Departamento de Organización de Empresas Curso: Titulación: 2016 MÁSTER UNIVERSITARIO

Más detalles

GUIA DOCENTE ESTADISTICA

GUIA DOCENTE ESTADISTICA 1 GUIA DOCENTE ESTADISTICA 1- Datos de identificación Asignatura: Estadística Carácter: Formación básica Titulación: Psicología Ciclo: Grado Curso: 1 Cuatrimestre: Anual Departamento: Metodología de las

Más detalles

Sesión 3: Análisis Exploratorio de Datos Espaciales (AEDE): Técnicas básicas

Sesión 3: Análisis Exploratorio de Datos Espaciales (AEDE): Técnicas básicas Sesión 3: Análisis Exploratorio de Datos Espaciales (AEDE): Técnicas básicas Profesora: Coro Chasco Yrigoyen Universidad Autónoma de Madrid 17 a 21 de mayo, 2010 2010, Coro Chasco Yrigoyen Índice del Curso

Más detalles

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Estadística

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Estadística Ficha Técnica Titulación: Grado en Administración y Dirección de Empresas Plan BOE: BOE número 67 de 19 de marzo de 2014 Asignatura: Módulo: Métodos cuantitativos de la empresa Curso: 1º Créditos ECTS:

Más detalles

TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS

TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS 9.1. Análisis Descriptivo de la Información 9.2. La Tabulación Cruzada 9.3. Contraste de Hipótesis 9.1. Análisis Descriptivo

Más detalles

Técnicas Cuantitativas para el Management y los Negocios

Técnicas Cuantitativas para el Management y los Negocios Técnicas Cuantitativas para el Management y los Negocios Contador Público Módulo I: ESTADÍSTICA DESCRIPTIVA Contenidos Módulo I Unidad 1. Introducción y conceptos básicos Conceptos básicos de Estadística.

Más detalles

Diagnóstico. Dirección de Cómputo para la Docencia. UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Dirección General de Servicios de Cómputo Académico

Diagnóstico. Dirección de Cómputo para la Docencia. UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Dirección General de Servicios de Cómputo Académico TALLER DE APLICACIONES ESTADÍSTICAS CON EXCEL Diagnóstico Elaborado por Mónica Patricia Ballesteros Chávez 1. Es una expresión en Excel que puede incluir operadores, referencias a celdas, valores, funciones

Más detalles

UNIDAD 6 ORDENES ESTADÍSTICA DESCRIPTIVA CON EXCEL

UNIDAD 6 ORDENES ESTADÍSTICA DESCRIPTIVA CON EXCEL UNIDAD 6 Quien hace puede equivocarse, quien no hace ya está equivocado DANIEL KON ORDENES ESTADÍSTICA DESCRIPTIVA CON EXCEL El objetivo de ésta unidad es utilizar los procedimientos estadísticos descriptivos

Más detalles

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS FASES EN EL ANÁLISIS DE LOS DATOS DE UNA INVESTIGACIÓN SELECCIÓN HIPÓTESIS DE INVESTIGACIÓN Modelo de Análisis Técnica de Análisis

Más detalles

Nota de los autores... vi

Nota de los autores... vi ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...

Más detalles

Ejercicios y Talleres. puedes enviarlos a

Ejercicios y Talleres. puedes enviarlos a Ejercicios y Talleres puedes enviarlos a klasesdematematicasymas@gmail.com TRABAJO DE APLICACIÓN La siguiente base de datos se conformó por la información suministrada en la entidad financiera BankAmerica,

Más detalles

El ejemplo: Una encuesta de opinión

El ejemplo: Una encuesta de opinión El ejemplo: Una encuesta de opinión Objetivos Lo más importante a la hora de planificar una encuesta es fijar los objetivos que queremos lograr. Se tiene un cuestionario ya diseñado y se desean analizar

Más detalles

9.- Análisis estadísticos con R Commander

9.- Análisis estadísticos con R Commander Tipos de datos - Cuantitativos: se expresan numéricamente. - Discretos: Toman valores numéricos aislados - Continuos: Toman cualquier valor dentro de unos límites dados - Categóricos o Cualitativos: No

Más detalles

TEMA 1 Introducción 1.1. Concepto y características de la investigación comercial 1.2. La investigación comercial y el proceso de marketing de la

TEMA 1 Introducción 1.1. Concepto y características de la investigación comercial 1.2. La investigación comercial y el proceso de marketing de la TEMA 1 1.1. Concepto y características de la investigación comercial 1.2. La investigación comercial y el proceso de marketing de la empresa 1.2.1. El proceso de marketing en la empresa 1.2.2. La función

Más detalles

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Contenidos Didácticos.

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Contenidos Didácticos. Ficha Técnica Titulación: Grado en Ciencias del Trabajo, Relaciones Laborales y Recursos Humanos Plan BOE: BOE número 108 de 6 de mayo de 2015 Asignatura: Módulo: Técnicas de Investigación Social Curso:

Más detalles

Repaso Estadística Descriptiva

Repaso Estadística Descriptiva Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 13 de octubre de 2010 Índice Descriptiva de una variable 1 Descriptiva de una variable 2 Índice Descriptiva de una variable

Más detalles

Tema 3: Análisis de datos bivariantes

Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta

Más detalles

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento. UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre

Más detalles

Curso: 4 Créditos ECTS: 6 Tipo de asignatura: Optativa Tipo de formación: Teórico-práctica

Curso: 4 Créditos ECTS: 6 Tipo de asignatura: Optativa Tipo de formación: Teórico-práctica Ficha Técnica Titulación: Plan BOE: Asignatura: Módulo: Grado en Criminología BOE número 75 de 28 de marzo de 2012/Correción de errores en BOE número 85 de 9 de abril de 2012 Optativas Curso: 4 Créditos

Más detalles

CM0244. Suficientable

CM0244. Suficientable IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE

Más detalles

INDICE. 81 Operadores lógicos Funciones exponenciales y logarítmicas Funciones trigonométricas

INDICE. 81 Operadores lógicos Funciones exponenciales y logarítmicas Funciones trigonométricas INDICE Introducción XV Capitulo 1. Instalación y primeros pasos en SPSS 10 Instalación de SPSS 10 1 Comenzando con SPSS 10 8 El trabajo de trabajo de SPSS 10 9 Opciones de a barra de menú principal 10

Más detalles

Informática. Gráficos estadísticos univariantes. Álvaro Romero Jiménez

Informática. Gráficos estadísticos univariantes. Álvaro Romero Jiménez Informática Gráficos estadísticos univariantes Álvaro Romero Jiménez Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Próposito de los gráficos estadísticos La

Más detalles

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows. TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente

Más detalles

ESTADÍSTICA 1.- NOCIONES GENERALES

ESTADÍSTICA 1.- NOCIONES GENERALES ESTADÍSTICA 1.- NOCIONES GENERALES : Conjunto de elementos cuyo conocimiento es objeto de estudio. Ejemplo: Jóvenes de Laguna de Duero. : Parte de la población cuyo estudio sirve para inferir características

Más detalles

LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES

LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES ÍNDICE PRÓLOGO... Capítulo 1. INTRODUCCIÓN... 1.1. Definición y clasificación de la Estadística... 1.2. La Estadística oficial en España y Europa... 1.3. Interés de la Estadística para el análisis económico...

Más detalles

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1 Tema 1: Estadística descriptiva Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1 Introducción Objetivo: estudiar una característica o variable en una población. Ejemplos:

Más detalles

Introducción a la Estadística Aplicada en la Química

Introducción a la Estadística Aplicada en la Química Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00

Más detalles

Resumenes numéricas de una muestra de datos. M. Wiper Análisis Estadístico del Delito 1 / 41

Resumenes numéricas de una muestra de datos. M. Wiper Análisis Estadístico del Delito 1 / 41 Resumenes numéricas de una muestra de datos M. Wiper Análisis Estadístico del Delito 1 / 41 M. Wiper Análisis Estadístico del Delito 2 / 41 Objetivo Introducir medidas de localización, dispersión y asimetría

Más detalles

Curso de Estadística Aplicada a las Ciencias Sociales

Curso de Estadística Aplicada a las Ciencias Sociales Curso de Estadística Aplicada a las Ciencias Sociales Tema 6. Descripción numérica (2) Capítulo 5 del manual Tema 6 Descripción numérica (2) Introducción 1. La mediana 2. Los cuartiles 3. El rango y el

Más detalles

Programa del Diploma: Estudios Matemáticos

Programa del Diploma: Estudios Matemáticos Programa del Diploma: Estudios Matemáticos Level: SL Tema Contenido Año 1 Conocimiento presunto Conjuntos numéricos, medición, aproximación, redondeo y estimación,% de error, notación científica. Número

Más detalles

Análisis de los resultados de la evaluación del aprendizaje de procedimientos de análisis descriptivo en ingeniería informática

Análisis de los resultados de la evaluación del aprendizaje de procedimientos de análisis descriptivo en ingeniería informática Análisis de los resultados de la evaluación del aprendizaje de procedimientos de análisis descriptivo en ingeniería informática Apellidos, nombre Capilla Romá, Carmen 1 (ccapilla@eio.upv.es) Departamento

Más detalles

Una vez realizados estos procesos conviene verificar que han aparecido las dos nuevas variables (columnas) en el archivo de datos.

Una vez realizados estos procesos conviene verificar que han aparecido las dos nuevas variables (columnas) en el archivo de datos. ECONOMETRÍA 09 PRACTICA 1: REPASO DE SPSS 1. Cuántas variables hay en el fichero? Y cuántas observaciones? Qué representa cada observación? Distingue entre variables cualitativas y cuantitativas. El fichero

Más detalles

INDICE Capitulo 1. Entorno de Trabajo e SPSS Capitulo 2. Operadores y Funciones. Aplicaciones

INDICE Capitulo 1. Entorno de Trabajo e SPSS Capitulo 2. Operadores y Funciones. Aplicaciones INDICE Introducción XV Capitulo 1. Entorno de Trabajo e SPSS 1 Introducción y manejo de datos en SPSS 1 Lectura e importación de datos SPSS 6 Importación de datos de hoja de cálculo 8 Importación de archivos

Más detalles

y = 2, entonces: a) x es más dispersa que y. b) son igual de dispersas. 9.- Sean dos variables estadísticas x e y con los siguientes valores x = 5, σ

y = 2, entonces: a) x es más dispersa que y. b) son igual de dispersas. 9.- Sean dos variables estadísticas x e y con los siguientes valores x = 5, σ VARIABLES ESTADÍSTICAS 1.- Sea X una variable estadística de media 2 metros y desviación típica 5 metros. Sea Y una variable estadística de media 24 cm y desviación típica 60 centímetros. a) Y es más dispersa

Más detalles

Análisis Exploratorio de Datos

Análisis Exploratorio de Datos Análisis Exploratorio de Datos 10 Qué son los Datos? Una variable es una propiedad o característica de un Individuo Ejemplos: color de ojos de un persona, temperatura, estado civil Una colección de variables

Más detalles

INDICE Prefacio Como usar este libro Capitulo 1. Introducción Capitulo 2. Análisis exploratorio de los datos

INDICE Prefacio Como usar este libro Capitulo 1. Introducción Capitulo 2. Análisis exploratorio de los datos INDICE Prefacio Como usar este libro Capitulo 1. Introducción 1 El comienzo de todo: determinación lo que se debe saber 2 Evaluación numérica de las unidades de observación con la ayuda de las escalas

Más detalles

Descriptiva y Proceso estadístico

Descriptiva y Proceso estadístico Incluimos Descriptiva y Proceso estadístico - Temas 1 Tema 1: Concepto de estadística. Las unidades estadísticas. Variables cualitativas y cuantitativas. Variables discretas y continuas. Distribuciones

Más detalles

Estadística I Tema 2: Análisis de datos univariantes

Estadística I Tema 2: Análisis de datos univariantes Estadística I Tema 2: Análisis de datos univariantes Tema 2: Análisis de datos univariantes Contenidos Gráficas para datos categóricos (diagrama de barras, diagrama de sectores). Gráficas para datos numéricos

Más detalles

CORRELACION Y REGRESION

CORRELACION Y REGRESION CORRELACION Y REGRESION En el siguiente apartado se presenta como calcular diferentes índices de correlación, así como la forma de modelar relaciones lineales mediante los procedimientos de regresión simple

Más detalles

ÁREAS DE LA ESTADÍSTICA

ÁREAS DE LA ESTADÍSTICA QUÉ ES LA ESTADÍSTICA? Es el arte de realizar inferencias y sacar conclusiones a partir de datos imperfectos. ÁREAS DE LA ESTADÍSTICA Diseño: Planeamiento y desarrollo de investigaciones Descripción: Resumen

Más detalles

Estadística Descriptiva. Poblaciones y muestras.

Estadística Descriptiva. Poblaciones y muestras. Estadística Descriptiva. Poblaciones y muestras. fgarcia@cipf.es CIPF s Research Development Programme Indice 1 Introducción 2 3 Análisis Estadístico Población y muestra Software estadístico CIPF s Research

Más detalles

GUÍA DOCENTE ESTADÍSTICA I

GUÍA DOCENTE ESTADÍSTICA I GUÍA DOCENTE 2016-17 ESTADÍSTICA I Mayo 2016 DATOS GENERALES Nombre del curso: ESTADÍSTICA I Código: 801100 (ADE) 801911 (MKCD) Curso: 2016-17 Titulación: Grado en Administración y Dirección de Empresas

Más detalles

Preparación examen PIR Diseños Experimentales, Estadística y Psicometría

Preparación examen PIR Diseños Experimentales, Estadística y Psicometría Preparación examen PIR Diseños Experimentales, Estadística y Psicometría INDICE DISEÑOS EXPERIMENTALES TEMA 1: LA INVESTIGACIÓN CIENTÍFICA EN PSICOLOGÍA... 14 1. INTRODUCCIÓN... 14 1.1. Conocimiento científico...

Más detalles

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k 1. Estadística Definición: La estadística es un ciencia inductiva que permite inferir características cualitativas y cuantitativas de un conjunto mediante los datos contenidos en un subconjunto del mismo.

Más detalles

SILABO DEL CURSO ESTADÍSTICA DESCRIPTIVA 1. DATOS GENERALES

SILABO DEL CURSO ESTADÍSTICA DESCRIPTIVA 1. DATOS GENERALES Facultad de Psicología SILABO DEL CURSO ESTADÍSTICA DESCRIPTIVA 1. DATOS GENERALES 1.1. Facultad : Psicología 1.2. Carrera Profesional : Psicología 1.3. Departamento : Ciencias 1.4. Tipo de Curso : Obligatorio

Más detalles

Tema 9: Estadística descriptiva

Tema 9: Estadística descriptiva Tema 9: Estadística descriptiva Matemáticas específicas para maestros Grado en Educación Primaria Matemáticas específicas para maestros Tema 9: Estadística descriptiva Grado en Educación Primaria 1 / 47

Más detalles

Índice general. Prefacio...5

Índice general. Prefacio...5 Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de

Más detalles

Estadística Aplicada a la Educación

Estadística Aplicada a la Educación Estadística Aplicada a a la la Educación Estadística Aplicada a la Educación Tutor. UNED Madrid-Sur (A.U. Parla) Miguel Ángel Daza 2014/15 migdaza@madridsur.uned.es 1 2014/15 1 2 4 5 6 7 8 9 10 11 12 La

Más detalles

CURSO-TALLER DE ANÁLISIS ESTADÍSTICO BÁSICO CON EXCEL Y SPSS Instructor: Mario Alberto Barajas Malacara

CURSO-TALLER DE ANÁLISIS ESTADÍSTICO BÁSICO CON EXCEL Y SPSS Instructor: Mario Alberto Barajas Malacara CURSO-TALLER DE ANÁLISIS ESTADÍSTICO BÁSICO CON EXCEL Y SPSS Instructor: Mario Alberto Barajas Malacara Descripción: Los temas de estadística propuestos corresponden con los conocimientos mínimos que un

Más detalles

Tema 2: Análisis de datos bivariantes

Tema 2: Análisis de datos bivariantes Tema 2: Análisis de datos bivariantes Los contenidos a desarrollar en este tema son los siguientes: 1. Tablas de doble entrada. 2. Diagramas de dispersión. 3. Covarianza y Correlación. 4. Regresión lineal.

Más detalles

ESTADÍSTICA, SISTEMAS DE INFORMACIÓN Y NUEVAS TECONOLOGÍAS Código de la Asignatura Créditos

ESTADÍSTICA, SISTEMAS DE INFORMACIÓN Y NUEVAS TECONOLOGÍAS Código de la Asignatura Créditos ESTADÍSTICA, SISTEMAS DE INFORMACIÓN Y NUEVAS TECONOLOGÍAS Código de la Asignatura 46497 Créditos 6 ECTS Carácter Básica Rama de Conocimiento Ciencias de la Salud Materia Fisiología Ubicación dentro del

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

Fundamentos de Estadística y Simulación Básica

Fundamentos de Estadística y Simulación Básica Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión

Más detalles

Exploración de datos

Exploración de datos Mathieu Departamento de Matemática Aplicada y Estadística Universidad Politécnica de Cartagena Cartagena, Enero 2010 Guión 1 Introducción 2 Unos cuantos términos 3 Tabulación y representaciones gráficas

Más detalles

Tema 6 Descripción numérica (2) Curso de Estadística Aplicada a las Ciencias Sociales. 1. La mediana. Introducción. Tema 6. Descripción numérica (2)

Tema 6 Descripción numérica (2) Curso de Estadística Aplicada a las Ciencias Sociales. 1. La mediana. Introducción. Tema 6. Descripción numérica (2) Curso de Estadística Aplicada a las Ciencias Sociales Tema 6. Descripción numérica (2) Capítulo 5 del manual Tema 6 Descripción numérica (2) Introducción 1. La mediana 2. Los cuartiles 3. El rango y el

Más detalles

MINICURSO Introducción al análisis multivariado de datos químicos (Quimiometría) Dr. Roberto Pellerano

MINICURSO Introducción al análisis multivariado de datos químicos (Quimiometría) Dr. Roberto Pellerano MINICURSO Introducción al análisis multivariado de datos químicos (Quimiometría) Dr. Roberto Pellerano Descripción breve del curso: El análisis multivariado de datos químicos (Quimiometría) es el conjunto

Más detalles

MÉTODOS DE INVESTIGACIÓN EN EDUCACIÓN. Tema 6. variabilidad

MÉTODOS DE INVESTIGACIÓN EN EDUCACIÓN. Tema 6. variabilidad Métodos de Investigación en Educación 1º Psicopedagogía Grupo Mañana Curso 009-010 010 MÉTODOS DE IVESTIGACIÓ E EDUCACIÓ Tema 6 Medidas de dispersión o variabilidad MÉTODOS DE IVESTIG. E EDUCACIÓ Objetivos

Más detalles

1 Descripción de datos con gráficas 7. 2 Descripción de datos con medidas numéricas 47. Contenido. 2.1 Descripción de un conjunto de datos mediante

1 Descripción de datos con gráficas 7. 2 Descripción de datos con medidas numéricas 47. Contenido. 2.1 Descripción de un conjunto de datos mediante Introducción:Una invitación a la estadística 1 La población y la muestra 3 Estadística descriptiva y estadística inferencial 3. Cómolograrel objetivode la estadísticainferencial: los pasos necesarios 4

Más detalles

UNIVERSIDAD AUTÓNOMA DE TAMAULIPAS FACULTAD DE INGENIERÍA ARTURO NARRO SILLER

UNIVERSIDAD AUTÓNOMA DE TAMAULIPAS FACULTAD DE INGENIERÍA ARTURO NARRO SILLER UNIVERSIDAD AUTÓNOMA DE TAMAULIPAS FACULTAD DE INGENIERÍA ARTURO NARRO SILLER CARTA DESCRIPTIVA Carrera: INGENIERÍA EN SISTEMAS COMPUTACIONALES. Materia:. Titular: Correo electrónico: NUMERO DE UNIDAD:

Más detalles

Asignatura: Metodologías de investigación. Tema 6. Exploración de datos. Exploración de datos

Asignatura: Metodologías de investigación. Tema 6. Exploración de datos. Exploración de datos Asignatura: Metodologías de investigación Tema 6 Etapas de una investigación Análisis : tests estadísticos, ajuste de curvas, análisis multivariante Obtención datos, calibrados, etc. Diseño del experimento

Más detalles

1 POBLACIÓN Y MUESTRA

1 POBLACIÓN Y MUESTRA 1 POBLACIÓN Y MUESTRA Estadística.- es la rama de las matemáticas que se encarga de describir y analizar datos de un estudio, y obtener consecuencias válidas del estudio. Población.- es el conjunto de

Más detalles

Tema 1 Estadística descriptiva: Medidas de posición

Tema 1 Estadística descriptiva: Medidas de posición Tema 1 Estadística descriptiva: Medidas de posición Curso 2017/18 Grados en biología sanitaria Departamento de Física y Matemáticas Marcos Marvá Ruiz Mediana, cuartiles,..., y cuantiles variables cuantitativas

Más detalles

Tema: Análisis de valores faltantes con SPSS

Tema: Análisis de valores faltantes con SPSS Tema: Análisis de valores faltantes con SPSS 1.- Introducción Hemos de comenzar advirtiendo que el Procedimiento Valores perdidos no se incluye en el sistema Base de SPSS, por lo que solo estará disponible

Más detalles

GUÍA DOCENTE ESTADÍSTICA I Julio 2018

GUÍA DOCENTE ESTADÍSTICA I Julio 2018 Julio 2018 DATOS GENERALES Asignatura: Código: 801100 (ADE) 801911 (MKCD) Curso: 2018-19 Titulación: Grado en Administración y Dirección de Empresas Grado en Marketing y Comunicación Digital Nº de créditos

Más detalles

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre

Más detalles

Bachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º ( )

Bachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º ( ) 1 Bachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º (2015-2016) Tema 1: NÚMEROS REALES Conjuntos numéricos. Números naturales. Números enteros. Números racionales. Números

Más detalles

ESTADÍSTICA I. Dr. Favio Murillo García

ESTADÍSTICA I. Dr. Favio Murillo García ESTADÍSTICA I Dr. Favio Murillo García Objetivos generales Formar habilidades para que el estudiante sea capaz de identificar tipos de variables y sistematizar datos para la construcción de bases de información.

Más detalles

Syllabus. Curso:SEXTO. Materia:ESTUDIOS MATEMÁTICOS

Syllabus. Curso:SEXTO. Materia:ESTUDIOS MATEMÁTICOS Syllabus Curso:SEXTO Materia:ESTUDIOS MATEMÁTICOS Descripción del curso: Esta asignatura está destinada a estudiantes con distintas capacidades y niveles de conocimiento, con el objeto de infundir seguridad

Más detalles

Prueba de Evaluación Continua

Prueba de Evaluación Continua Prueba de Evaluación Continua 5-X-6.- En el aeropuerto de Madrid-Barajas se ha recogido una muestra del peso en kilogramos del equipaje de 0 viajeros: 40 0 3 3 6 5 30 3 4 3 4 9 7 39 Construir un diagrama

Más detalles

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS ÍNDICE Introducción: Entrene su cerebro para la estadística... 1 La población y la muestra... 3 Estadísticas descriptivas e inferenciales... 4 Alcanzar el objetivo de estadísticas inferenciales: los pasos

Más detalles

Estadística Estadística descriptiva bivariante

Estadística Estadística descriptiva bivariante Estadística Estadística descriptiva bivariante Vamos a medir dos características (variables) sobre cada individuo. Las variables pueden ser cuantitativas o cualitativas combinadas de todas las formas posibles

Más detalles

Tema 1. Estadística Unidimensional

Tema 1. Estadística Unidimensional Tema 1. Estadística Unidimensional 1. Conceptos Básicos. Gráfcas estadísticas 3. Medidas de centralización y dispersión: media, rango, desviación típica, coefciente de variación 4. Medidas de posición:

Más detalles

Universidad Central del Este UCE Facultad de Ciencias de la Salud Escuela de Medicina

Universidad Central del Este UCE Facultad de Ciencias de la Salud Escuela de Medicina Universidad Central l Este UCE Facultad Ciencias la Salud Escuela Medicina Programa la asignatura: : MED-052 Bioestadística II Código: Semestre: Asignatura electiva Total créditos 3 Teóricos 3 Prácticos

Más detalles

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía VIDEOCLASE: Medidas de Tendencia Central y Variabilidad

Más detalles

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Descriptiva Para Psicólogos (EST-225)

Más detalles

Temario CURSO CON IBM SPSS STATISTICS ONLINE

Temario CURSO CON IBM SPSS STATISTICS ONLINE Centro Analítico Latinoamericano Servicios de capacitación nline Una división de INFÓRMESE Temario CURSO CON IBM SPSS STATISTICS ONLINE Curso: Estadística con IBM SPSS Statistics Duración: 2 Nivel: Medio

Más detalles

Estadística I Ejercicios de los Temas 1 y 2 Curso 2010/11

Estadística I Ejercicios de los Temas 1 y 2 Curso 2010/11 Estadística I Ejercicios de los Temas 1 y 2 Curso 2010/11 1. La siguiente tabla contiene información sobre el número de mujeres activas (en miles) en EEUU, por profesiones y durante 1986. Profesión num.

Más detalles