Jesús García Herrero TÉCNICAS CLÁSICAS DE ANÁLISIS DE DATOS
|
|
- Alejandro José Antonio Quintana Henríquez
- hace 5 años
- Vistas:
Transcripción
1 Jesús García Herrero TÉCNICAS CLÁSICAS DE ANÁLISIS DE DATOS En esta clase se presentan los primeros algoritmos Análisis de Datos para abordar tareas de aprendizaje de modelos descriptivos y predictivos. Por razones históricas y pedagógicas, se comienza por las técnicas estadísticas de modelado de los datos, con un planteamiento formal que permite desarrollar modelos sencillos y calcular sus parámetros para resolver estas tareas con tests bien conocidos. En primer lugar se presenta una revisión del análisis estadístico de variables y principales parámetros descriptivos (momentos, medidas de tendencia, de dispersión, percentiles e histograma), para a continuación abordar el análisis de relaciones entre atributos desde un punto de vista estadístico, que busca relaciones significativas a través de propiedades de las distribuciones de los datos disponibles. Según la naturaleza de los atributos se distinguen tres casos: si todos son numéricos se plantean relaciones de dependencia (lineal o no lineal), si son todos nominales se habla de tablas de contingencia con análisis de frecuencias, y si son mixtos de tests de diferencias de medias y análisis de varianza. En cada análisis se identifican los tests que nos permiten validar la existencia de relaciones buscadas entre atributos. El aspecto común a estas primeras técnicas clásicas de análisis estadístico es que están orientadas a la validación de hipótesis que plantearía un analista a partir de los datos disponibles, frecuentemente tras su visualización. No se contempla la búsqueda automática de modelos o la generalización, aspectos que entran en la disciplina del aprendizaje automático.
2 Técnicas estadísticas de análisis de datos Jesús García Herrero Universidad Carlos III de Madrid
3 Técnicas Estadísticas de Análisis de Datos Descripción de datos. Estadísticos de una variable Distribuciones de probabilidad e intervalos de confianza Contrastes de hipótesis. Tipos Relaciones entre atributos Nominales- Numéricos: Tests de comparación de medias (muestras dependientes e independientes) y análisis de varianza. Numéricos - Numéricos: Análisis de Regresión Nominales-Nominales: Tablas de Contingencia. Tests de independencia y comparación de proporciones. Aplicación de técnicas estadísticas a la clasificación Clasificación mediante regresión numérica Clasificador bayesiano
4 Análisis de una variable (muestra de datos) Estadísticos: resumen (describen) toda la información contenida en una muestra de datos : Variables continuas medidas centrales (media, moda, mediana) medidas de dispersión (rango, varianza, desviación estándar, percentiles) medidas de forma (histograma) Variables nominales frecuencias relativas (probabilidades), moda media y varianza de probabilidad estimada Muestra: y i ; i = n; toma valores en un rango continuo/discreto 3
5 Estadísticos centrales Media (esperanza) muestral: promedio de todos los valores media(y) y y i n i Moda: valor que aparece más veces n Mediana: valor que deja el mismo número de casos a ambos lados mediana (y) yi Nº casos y y Nº casos y y j i k i equivale a ordenar el vector de datos y tomar el valor central menos sensible frente a valores extremos poco probables 4
6 valor Estadísticos de dispersión Recorrido (intervalo, o rango): max(yi)-min(yi) Varianza: promedio de desviaciones con respecto a valor medio n n Var(y) (y - i y) yi - ny n -i n -i Desviación estándar (típica): raíz cuadrada de la varianza desv(y) y Var(y) media, sigma muestra Datos valor medio valor medio+sigma valor medio - sigma 5
7 frecuencia absoluta Histograma Estimación de la distribución de densidad de probabilidad: frecuencia absoluta o relativa de valores de y i por unidad de intervalo histograma normal Nº de casos en intervalo ,4 -,8 -, -0,6 0 0,6,,8,4 3 y intervalos de clase La suma total de frecuencias absolutas es el número de datos La suma de frecuencias relativas es 6
8 Ejemplo: histograma de variable uniforme histograma , 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9 histograma acum ulado acum ulado 7
9 alumnos Cuantiles del histograma Cuantil: valores que dividen el recorrido de datos en k partes de la misma frecuencia (percentiles: 00 partes, cuartiles: 4 partes, etc.) Ejemplo: cuartiles frecuencia Calificación,8 0,6 5 3, 3,9 4,9 0 6,55... porcentaje cuartiles 0,5,4 0,5,75 0,75 4 7,7 Recorrido inter-cuartílico: [.4, 4]: contiene 50% datos Cuartil Cuartil calificación Cuartil 3 Cuartil 4 8
10 Estadísticos de variable nominal y i nominal: toma valores de un conjunto discreto (categorías): {v i,, v iki } Distribución de frecuencias de cada valor n 00( n 00( n 00( n j Moda: valor que aparece más veces p p p ki max (n j j ) k i n j / n)% ki / n)% / n)% 9
11 Media y varianza de frecuencias estimadas Cálculo de cada frecuencia para una categoría dada: m casos de n p=m/n puede verse como asignar: v i = cada ejemplo en la categoría p n v i n i v i =0 en el resto Varianza de p: n Var(p) (vi n i p p( - p) - p) p( - p) caso máxima varianza: p=0.5 0
12 porcentaje porcentaje Ejemplo variable nominal y numérica Edad Sexo 3 M 5 M 8 H 37 M 45 H 6 H 43 M 40 H 60 M 54 H 8 H 8 H 54 M 9 H 4 M 6 M 3 M 4 M 37 M 36 H 53 H M 4 H H 45 M 64 H M 6 M 37 M 66 M H M sexo edad frecuencia acumulada
13 Distribución Normal Curva de gran interés por explicar datos en muchas situaciones Aplicada por primera vez como distribución por A. Quetelet (830) - f (z) exp z distribución simétrica: coincide media y mediana en 0 se dispone del valor de la distribución de probabilidad: área bajo la curva de f Z (z) para cualquier valor: z F Z (z) Tipificar o estandarizar variables: Se mide el desplazamiento respecto a la media en unidades de desviación típica: f(z) 0 z F(z 0 ) z 0 yi - y zi i
14 Distribución Normal e Intervalos de Confianza f(z) F(z 0 ) f(z) F(z 0 ) z 3 Una cola (unilateral) Simétrico dos colas (bilateral) Ej.: se conocen parámetros de una población con distribución normal: media: m= 5; desviación típica:= 0 casos inferiores a 70? z=(70-5)/0, F(z)=0,0 casos superiores a 50? z=(50-5)/0, -F(z)=0,04 en intervalo 90-30? F((30-5)/0)-F((90-5)/0)=0,667 qué intervalos simétrico tienen el 80%, 95% de los casos (intervalos de confianza)? z=f - (a/); y=mz 80%: z 0. =,8; 5 z 0. *0[89.3, 40.6] 95%: z 0.05 =,96; 5 z 0.05 *0[75.8, 54.] 3
15 RELACIONES DE VARIABLES. TEST DE HIPOTESIS ANÁLISIS DE VARIAS VARIABLES Objetivo: analizar la interrelación (dependencia) entre los valores de distintas variables, haciendo uso de los datos disponibles Numéricas (retardo, carga, distancia, ) Nominales (tipo de avión, condición visibilidad, ) Herramienta de análisis: tests de hipótesis Nominales-numéricas: comparación de medias, análisis de varianza Numéricas-numéricas: análisis de regresión y covarianza Nominales-nominales: tablas de contingencia 4
16 ANÁLISIS ESTADÍSTICO DE DATOS ANÁLISIS DE VARIAS VARIABLES - NUMÉRICA-NOMINAL Mide la relación entre variables numéricas y nominales, o nominales y nominales (proporciones) Analiza las diferencias de medias condicionadas a variable nominal: impacto de la variable nominal sobre la continua Dos tipos de análisis: Con dos medias o proporciones: significatividad de la diferencia t- student Más de dos valores distintos: Análisis de Varianza Variación NE Variación E Y Y Y3 Y y 5
17 . Comparación de dos medias Se plantea como un test de hipótesis, dividiendo los datos en dos grupos, cada uno con su media y varianza. Hipótesis sobre diferencia de medias: D y - y H 0 : la diferencia de medias en la población es nula D=0. Hipótesis alternativa A: las medias son distintas: D!=0. Hipótesis alternativa B: la media de es mayor que : Hipótesis alternativa C: la media de es menor que : Situaciones posibles: y y y y Muestras independientes: conjuntos distintos. Muestras dependientes: mismo conjunto, con dos variables a comparar en cada ejemplo. 6
18 Contrastes de dos medias Hipótesis alternativa A a/=0.05 a/= z-.96 z+.96 Hipótesis alternativa B: a= z Cuando las muestras son pequeñas no es válida la hipótesis de normalidad de los estadísticos de medias y t a/, GL
19 . Análisis de varianza (ANOVA) Número total de elementos: Media por nivel: Media total: Niveles Observaciones Y,Y,...Y j,...y n i Y i,y i,...y ij,...y ini I Y I,Y I,...Y Ij,...Y InI Y Y Relación entre cuadrados : n i I n I Y i i ni Yij ii j ij n I n i i Variación No Explicada variación no explicada (residual): variabilidad dentro de los grupos Variación Explicada Y Y Y3 Y variación explicada: variabilidad entre grupos y M ii n i j (Y M ni M ij -Y) (Yij -Y i) + ni(yi - Y) ii j i 8
20 ANÁLISIS ESTADÍSTICO DE DATOS ANÁLISIS DE VARIAS VARIABLES - NUMÉRICA-NUMÉRICA Permite identificar relaciones entre variables numéricas y construir modelos de regresión Se consideran relaciones de una variable de salida (dependiente) con múltiples variables de entrada (independientes) Estimación de una función (Regresión Lineal) que mejor explique los datos {( X, y), (X, y),...,(xn, yn )} X : vectores con M dimensiones g(.) : R X M R ŷ g(x) 9
21 Mínimos Cuadrados Estima vector de coeficientes que minimiza error M t yˆ g (X) a + a x (A )*X i (A) [a i 0 a 0 p a p M ] p t ; X [ Objetivo: dadas N muestras, determinar coeficientes que minimicen el error de predicción global n [g(x j ) - y j] j El método de mínimos cuadrados selecciona, como estimación de la recta de regresión poblacional, aquella para la cual esta suma de cuadrados es menor. Problema clásico de minimización de función cuadrática: solución única 0 x x M ] t
22 Mínimos Cuadrados Solución genérica matricial Solución MC: H*A A x x x x x x ) g(x ) g(x ŷ ŷ ĝ ; y y y N I N I I N N N y H H] [H A t t - [(+M)x] = [(+M)xN] [Nx(+M)] [(+M)xN] [Nx]
23 Ejemplo: regresión lineal de variable Año Renta Consumo consumo E ,75 75,87 683, ,09 986,35 94, ,84 37,9 99, ,06 600, 8, ,6 3550,7 350, ,7 40,7 453, ,0 50,6 506, , , 6335, ,5 7990,3 7785, ,9 9053,5 9090, ,5 0695,4 0479, ,04 093,8 03, ,5 906,7 3836, ,6 570, 544, ,5 7309,7 7038,7636 Estimación Lineal a a ConsumoE a0 + a*renta
24 consumos Ejemplo: regresión lineal de variable 0000 dependencia consumo Consumo consumo E renta 3
25 Ejemplo: regresión lineal de variables x x y Valor Superficie Antigüedad Valor predicho ,87 Euros 09,80 Euros ,784 Euros,83 Euros ,04 Euros 08,993 Euros ,75 Euros 08,8 Euros ,04 Euros 07,6 Euros ,497 Euros 5,5 Euros ,3 Euros 99,800 Euros ,96 Euros 5,469 Euros 494 3,006 Euros 9,33 Euros ,497 Euros 3,58 Euros 540,57 Euros,3 Euros Estimación Lineal a a a Valor a0 + a*superficie + a* Antigüedad 4
26 valor (euros) 540 Ejemplo: regresión lineal de variables valores predichos antigüedad (a) superficie (m) 0 5
27 Evaluación del modelo de regresión Análisis de validez del modelo asumido: Medidas de parecido entre variable de salida estimada y real, influencia de variables de entrada Factor de Correlación Error de predicción Análisis de calidad del modelo Error en coeficientes Hipótesis de significatividad de parámetros: t-student A A,..., F? A A F N(0,) a/
28 Factor de correlación Factor de correlación entre datos y predicciones: Corr(ŷ, y) S ŷ S y n j (ŷ j - ŷ)(y j - y) Cov(ŷ, y) Var(ŷ)Var(y) El factor de correlación varía entre - y. En general, se puede hacer factores de correlación entre cualquier par de variables numéricas: indica el grado de relación lineal existente. -: existe asociación lineal negativa perfecta. positiva perfecta. 0 no hay asociación lineal. 7
29 Matrices de covarianza y correlación Muestra de vectores aleatorios: Matriz de covarianzas: n mˆ X i n i n Ĉ (X - mˆ )(X - mˆ t X i i ) n i La matriz de correlaciones es similar, normalizada X,X,..., Xn var(x) cov(x,x) cov(x,x I) cov(x,x ) var(x) cov(x,x var(xi) ) 8
30 ANÁLISIS ESTADÍSTICO DE DATOS ANÁLISIS DE VARIAS VARIABLES - NOMINAL-NOMINAL Analiza la interrelación entre los valores de variables nominales según distribución de casos Herramienta para dos variables: tabla de contingencia distribución de casos (frecuencias) para las distintas combinaciones de valores de las dos variables variable totales variable valor valor... valor p valor n n... n p t valor n n... n p t valor p n p n p... n pp tp totales t' t'... t'p t Probabilidades marginales: P i =t i /t Casos esperados Probabilidades marginales: E ij =t(t i /t)(t j /t)= t i t j /t Técnicas Clásicas de PAnálisis de Datos 9 j =t j /t
31 Contraste Chi- de variables nominales Es aplicable en análisis bi-variable (normalmente clase vs atributo) Determina si es rechazable la hipótesis de que dos variables son independientes Bajo hipótesis H 0 se determinan los casos en el supuesto de variables independientes. Los valores esperados se determinan con probabilidades marginales de las categorías: E ij =tp i P j (valores esperados). Nuestro contraste de hipótesis nula de no asociación estará basado en las magnitudes de las diferencias entre los valores observados y los esperados bajo la hipótesis nula. El estadístico Chi-cuadrado mide la diferencia entre los valores observados y los valores esperados. p i p j ( O ij - E ij ) / E ij 30
32 Ejemplo 3
33 EJEMPLOS VALIDACIÓN HIPÓTESIS ANÁLISIS DE VARIAS VARIABLES - NOMINAL-NUMÉRICA Hay relación entre tiempo en retardo y: franja horaria (mañana-tarde-noche), tipo de día (diario-finsemana), compañía Mayor grado de relación? 3
34 EJEMPLOS VALIDACIÓN HIPÓTESIS ANÁLISIS DE VARIAS VARIABLES - NOMINAL-NUMÉRICA Hipótesis (análogo a comparación de prestaciones!) Hipótesis nula H 0 : la diferencia de medias según tipo día es nula D=0 Hipótesis alternativa: las medias son distintas: D!=0 a/=0.05 fdp(t_finsemana-t_diario) a/= Mayor grado de relación? Más evidencia estadística para rechazar la hipótesis de independencia 33
35 intervenciones retardo EJEMPLOS VALIDACIÓN HIPÓTESIS ANÁLISIS DE VARIAS VARIABLES - NUMÉRICA-NUMÉRICA Qué variables están más linealmente relacionadas operaciones operaciones 34
36 EJEMPLOS VALIDACIÓN HIPÓTESIS ANÁLISIS DE VARIAS VARIABLES NOMINAL-NOMINAL Dependencia entre grado de retardo y tipo de avión, visibilidad, 35
37 EJEMPLOS VALIDACIÓN HIPÓTESIS ANÁLISIS DE VARIAS VARIABLES NOMINAL-NOMINAL Hipótesis nula H 0 : las variables retardo y categoría son independientes: E ij =t(t i /t)(t j /t) p p (Eij - Oij) / Eij ij a 36
ÍNDICE CAPÍTULO 1. INTRODUCCIÓN
ÍNDICE CAPÍTULO 1. INTRODUCCIÓN 1.1. OBJETO DE LA ESTADÍSTICA... 17 1.2. POBLACIONES... 18 1.3. VARIABLES ALEATORIAS... 19 1.3.1. Concepto... 19 1.3.2. Variables discretas y variables continuas... 20 1.3.3.
Más detallesNota de los autores... vi
ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...
Más detallesINDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica
INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables
Más detallesINDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Más detallesT2. El modelo lineal simple
T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de
Más detallesGEOESTADÍSTICA APLICADA
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO GEOESTADÍSTICA APLICADA Tema: Análisis Exploratorio de Datos Instructores: Dr. Martín A. Díaz Viera (mdiazv@imp.mx) Dr. Ricardo Casar González (rcasar@imp.mx) 2009
Más detallesCátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS
Cátedra: TABLA DE CONTENIDOS INTRODUCCIÓN Qué es la Probabilidad? Qué es la Estadística? La evolución histórica de la Estadística Algunos conceptos imprescindibles Fuentes de datos Tipos de datos y escalas
Más detallesSumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad...
ÍNDICE SISTEMÁTICO PÁGINA Sumario... 5 Prólogo... 7 Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares... 9 Objetivos de la Unidad... 11 1. Población y muestra... 12 2. Parámetro
Más detallesANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y
Más detalles478 Índice alfabético
Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión
Más detallesCentro Universitario de Tonalá
Presentación Este curso de estadística y evaluación de datos se encuentra diseñado para los estudiantes del Doctorado en Agua y Energía del Centro Universitario de Tonalá. Competencias genéricas de la
Más detallesTema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1
Tema 1: Estadística descriptiva Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1 Introducción Objetivo: estudiar una característica o variable en una población. Ejemplos:
Más detallesPrácticas Tema 4: Modelo con variables cualitativas
Prácticas Tema 4: Modelo con variables cualitativas Ana J. López y Rigoberto Pérez Departamento de Economía Aplicada. Universidad de Oviedo PRACTICA 4.1- Se dispone de información sobre 16 familias sobre
Más detallesINDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres
INDICE Capitulo uno Introducción y estadísticas descriptiva 1.1. Introducción 1.2. descripción grafica de los datos 3 1.3. medidas numéricas descriptivas 11 Ejercicios 22 Apéndice: sumatorias y otras notaciones
Más detallesPROGRAMA DE ASIGNATURA. CARÁCTER: Obligatoria CARRERA: Licenciatura en Ciencias de la Computación Profesorado en Física Profesorado en Matemática
PROGRAMA DE ASIGNATURA ASIGNATURA: Probabilidad y Estadística Introducción a la Probabilidad y Estadísitica AÑO: 2012 CARÁCTER: Obligatoria CARRERA: Licenciatura en Ciencias de la Computación Profesorado
Más detallesMétodo de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
Más detallesRESUMEN PROGRAMACIÓN ESTADÍSTICA I. 3. Diseñar tablas estadísticas para coleccionar y ordenar datos.
RESUMEN PROGRAMACIÓN ESTADÍSTICA I OBJETIVOS 1. Conocer los principales conceptos usados en Estadística: población, muestra e individuo. 2. Diferenciar los tres tipos de variables estadísticas: cualitativas,
Más detallesSede Andina, San Carlos de Bariloche. Licenciatura en Administración, Licenciatura en Hotelería, Licenciatura en Turismo y. Licenciatura en Economía.
Sede y localidad Carreras Sede Andina, San Carlos de Bariloche Licenciatura en Administración, Licenciatura en Hotelería, Licenciatura en Turismo y Licenciatura en Economía. Programa Analítico de la asignatura
Más detallesQué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)
Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión
Más detallesPreparación de los datos de entrada
Preparación de los datos de entrada Clase nro. 6 CURSO 2010 Objetivo Modelado de las características estocásticas de los sistemas. Variables aleatorias con su distribución de probabilidad. Por ejemplo:
Más detallesEstadística Descriptiva y Probabilidad FORMULARIO
Estadística Descriptiva y Probabilidad FORMULARIO Departament d Estadística i Investigació Operativa Universitat de València Angel Corberán Francisco Montes 2 3 Capítulo 1 Estadística Descriptiva 1.1.
Más detallesGUÍA DE STATGRAPHICS 5.1
UNIVERSIDAD POLITÉCNICA DE MADRID ESCUELA UNIVERSITARIA DE ARQUITECTURA TÉCNICA DEPARTAMENTO DE MATEMÁTICA APLICADA A LA ARQUITECTURA TÉCNICA GUÍA DE STATGRAPHICS 5.1 (Versión castellana) GUÍA DE STATGRAPHICS
Más detallesDepartamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente
Más detallesFormulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico
Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más
Más detallesCurso: 2º Créditos ECTS: 6 Tipo de asignatura: Básica Tipo de formación: Teórico-Práctica
Ficha Técnica Titulación: Plan BOE: Asignatura: Módulo: Grado en Criminología BOE número 75 de 28 de marzo de 2012 / Corrección de errores: BOE número 85 de 9 de abril de 2012 Metodología Curso: 2º Créditos
Más detallesTema 3: Análisis de datos bivariantes
Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta
Más detallesESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)
ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com) ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS... 1 DEFINICIONES BÁSICAS... 1 Estadística... 1 Estadística descriptiva... 1 Estadística inferencial...
Más detallesINDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas
INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de
Más detallesPrograma Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Estadística
Ficha Técnica Titulación: Grado en Administración y Dirección de Empresas Plan BOE: BOE número 67 de 19 de marzo de 2014 Asignatura: Módulo: Métodos cuantitativos de la empresa Curso: 1º Créditos ECTS:
Más detallesCURSO: ANALISIS ESTADISTICO DE RIESGOS
MANAGEMENT CONSULTORES CURSO: ANALISIS ESTADISTICO DE RIESGOS Cnel. R.L. Falcón 1435 C1406GNC 35 Buenos Aires, Argentina Tel.: 054-11-15-5468-3369 Fax: 054-11-4433-4202 Mail: acaminos@mgmconsultores.com.ar
Más detallesÍNDICE INTRODUCCIÓN... 21
INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...
Más detalles3 ANALISIS DESCRIPTIVO DE LOS DATOS
3 ANALISIS DESCRIPTIVO DE LOS DATOS 3.1 La tabulación de los datos 3.1.1 Tabla de distribución de frecuencias. 3.1.2 El histograma. 3.2 Medidas de tendencia central 3.2.1 La media. 3.2.2 La mediana. 3.2.3
Más detallesviii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos
Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................
Más detallesDiagnóstico. Dirección de Cómputo para la Docencia. UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Dirección General de Servicios de Cómputo Académico
TALLER DE APLICACIONES ESTADÍSTICAS CON EXCEL Diagnóstico Elaborado por Mónica Patricia Ballesteros Chávez 1. Es una expresión en Excel que puede incluir operadores, referencias a celdas, valores, funciones
Más detallesAl nivel de confianza del 95%, las puntuaciones típicas son: 2- La hipótesis alternativa es; A) ; B) ; C).
A continuación se presentan 4 situaciones. Cada situación viene seguida por una serie de preguntas referidas a la misma así como de preguntas teóricas generales. SITUACIÓN 1: La empresa SND's de sondeos
Más detallesAsignatura: Metodologías de investigación. Tema 6. Exploración de datos. Exploración de datos
Asignatura: Metodologías de investigación Tema 6 Etapas de una investigación Análisis : tests estadísticos, ajuste de curvas, análisis multivariante Obtención datos, calibrados, etc. Diseño del experimento
Más detallesRegresión múltiple. Demostraciones. Elisa Mª Molanes López
Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +
Más detallesCurso: 4 Créditos ECTS: 6 Tipo de asignatura: Optativa Tipo de formación: Teórico-práctica
Ficha Técnica Titulación: Plan BOE: Asignatura: Módulo: Grado en Criminología BOE número 75 de 28 de marzo de 2012/Correción de errores en BOE número 85 de 9 de abril de 2012 Optativas Curso: 4 Créditos
Más detallesUniversidad Central del Este UCE Facultad de Ciencias de la Salud Escuela de Medicina
Universidad Central l Este UCE Facultad Ciencias la Salud Escuela Medicina Programa la asignatura: : MED-052 Bioestadística II Código: Semestre: Asignatura electiva Total créditos 3 Teóricos 3 Prácticos
Más detallesPrograma Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Contenidos Didácticos.
Ficha Técnica Titulación: Grado en Ciencias del Trabajo, Relaciones Laborales y Recursos Humanos Plan BOE: BOE número 108 de 6 de mayo de 2015 Asignatura: Módulo: Técnicas de Investigación Social Curso:
Más detallesSyllabus. Curso:SEXTO. Materia:ESTUDIOS MATEMÁTICOS
Syllabus Curso:SEXTO Materia:ESTUDIOS MATEMÁTICOS Descripción del curso: Esta asignatura está destinada a estudiantes con distintas capacidades y niveles de conocimiento, con el objeto de infundir seguridad
Más detallesEconometría 1. Karoll GOMEZ Segundo semestre 2017
Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios
Más detallesMatemáticas Aplicadas I: Ev2 Recuperación febrero 2018
Matemáticas Aplicadas I: Ev2 Recuperación febrero 2018 PARTE 1: ESTADÍSTICA UNIDIMENSIONAL Y BIDIMENSIONAL 1. La siguiente tabla recoge las edades de las personas que han subido a un avión. Edad [0, 18)
Más detallesCorrelación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
Más detallesTema 10: Introducción a los problemas de Asociación y Correlación
Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación
Más detallesPROGRAMA DE ESTADÍSTICA DESCRIPTIVA
PROGRAMA DE ESTADÍSTICA DESCRIPTIVA CONCEPTOS BÁSICOS DE ESTADÍSTICA Definición de Estadística Origen del concepto. Evolución histórica de la Estadística Estadística Descriptiva y Estadística Inferencial
Más detallesCM0244. Suficientable
IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE
Más detallesRegresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística
Regresión lineal Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 01 de enero de 2012
Más detallesTécnicas Cuantitativas para el Management y los Negocios
Técnicas Cuantitativas para el Management y los Negocios Contador Público Módulo I: ESTADÍSTICA DESCRIPTIVA Contenidos Módulo I Unidad 1. Introducción y conceptos básicos Conceptos básicos de Estadística.
Más detallesTEMARIO PRUEBA DE SÍNTESIS MATEMÁTICA NIVEL SÉPTIMO BÁSICO
NIVEL SÉPTIMO BÁSICO Operatoria números naturales Operatoria números decimales Clasificación de números decimales Transformación de decimal a fracción Orden de números enteros Ubicación de números enteros
Más detallesLucila Finkel Temario
Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión
Más detallesEstadística Descriptiva 2da parte
Universidad Nacional de Mar del Plata Facultad de Ingeniería Estadística Descriptiva 2da parte 2 Cuatrimestre 2018 COMISIÓN :1. Prof. Dr. Juan Ignacio Pastore. Qué es la estadística? El contenido de la
Más detallesPrácticas Tema 2: El modelo lineal simple
Prácticas Tema 2: El modelo lineal simple Ana J. López y Rigoberto Pérez Departamento de Economía Aplicada. Universidad de Oviedo PRACTICA 2.1- Se han analizado sobre una muestra de 10 familias las variables
Más detallesEstadística I Tema 2: Análisis de datos univariantes
Estadística I Tema 2: Análisis de datos univariantes Tema 2: Análisis de datos univariantes Contenidos Gráficas para datos categóricos (diagrama de barras, diagrama de sectores). Gráficas para datos numéricos
Más detallesTema 4. Regresión lineal simple
Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias
Más detallesINDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos
INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos
Más detallesMomentos de una variable
Momentos de una variable Momentos respecto del origen Dada una variable aleatoria X con función de probabilidad o densidad f(x) podemos definir una función de X que sea igual a la variable elevada a un
Más detallesEstructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias
Estructura de este tema Tema 4 Regresión lineal simple José R. Berrendero Departamento de Matemáticas Universidad utónoma de Madrid Planteamiento del problema. Ejemplos Recta de regresión de mínimos cuadrados
Más detallesEconometría 1. Karoll GOMEZ Segundo semestre 2017
Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios
Más detallesÍndice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables
Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población
Más detallesUNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONÓMICAS
UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONÓMICAS INSTITUTO DE INVESTIGACIÓN DE LA FACULTAD DE CIENCIAS ECONÓMICAS INFORME FINAL DEL TEXTO TEXTO: ESTADÍSTICA DESCRIPTIVA APLICADA A LA ECONOMIA
Más detallesGUIA DOCENTE ESTADISTICA
1 GUIA DOCENTE ESTADISTICA 1- Datos de identificación Asignatura: Estadística Carácter: Formación básica Titulación: Psicología Ciclo: Grado Curso: 1 Cuatrimestre: Anual Departamento: Metodología de las
Más detallesUNIVERSIDAD AUTÓNOMA DEL PERÚ DEPARTAMENTO DE FORMACIÓN GENERAL
UNIVERSIDAD AUTÓNOMA DEL PERÚ DEPARTAMENTO DE FORMACIÓN GENERAL TEXTO ESTADÍSTICA LIMA-PERÚ TÍTULO DE LA OBRA ESTADÍSTICA AUTORES Mg. Edward F. Huamaní Alhua Mg. Lic. Gilberth Pesantes Calderón Mg. Juan
Más detallesEstadística /Química 2004
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLAN LICENCIATURA EN: QUÍMICA. NOMBRE DE LA ASIGNATURA: ESTADÍSTICA. ÓRGANO INTERNO QUE COORDINA EL PROGRAMA DE LA ASIGNATURA:
Más detallesPrograma del Diploma: Estudios Matemáticos
Programa del Diploma: Estudios Matemáticos Level: SL Tema Contenido Año 1 Conocimiento presunto Conjuntos numéricos, medición, aproximación, redondeo y estimación,% de error, notación científica. Número
Más detallesProfesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.
UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre
Más detallesSe permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.
NORMAS El examen consta de dos partes: 0.0.1. Diez Cuestiones: ( tiempo: 60 minutos) No se permite ningún tipo de material (libros, apuntes, calculadoras,...). No se permite abandonar el aula una vez repartido
Más detallesUNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN INGENIERÍA QUÍMICA
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN INGENIERÍA QUÍMICA PROGRAMA DE LA ASIGNATURA DE: PROBABILIDAD Y ESTADÍSTICA IDENTIFICACIÓN
Más detallesRegresión Lineal Simple y Múltiple Regresión Logística
Regresión Lineal Simple y Múltiple Regresión Logística Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura MUI en Ciencias de la Salud MUI en Ciencias de la Salud (UEx) Regresión
Más detallesSOLUCIONES AL EXAMEN DE SEPTIEMBRE DE ESTADÍSTICA EXAMEN DE MATEMÁTICAS II
SOLUCIONES AL EXAMEN DE SEPTIEMBRE DE 4. ESTADÍSTICA EXAMEN DE MATEMÁTICAS II Estadística (primer parcial). Septiembre de 4.- El coeficiente de determinación R nos determina a) el % de la varianza de Y
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesRELACIÒN ENTRE LOS PROMEDIOS
Capítulo : RELACIÒN ENTRE LOS PROMEDIOS INTRODUCCIÓN La Estadística es una ciencia matemática que se utiliza para describir, analizar e interpretar ciertas características de un conjunto de individuos
Más detallesElaborado por: Pelay, C. y Pérez, J. Prueba t para muestras independientes
Prueba t para muestras independientes 1 El procedimiento Prueba t para muestras independientes compara las medias de dos grupos de casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente
Más detallesPrueba de Evaluación Continua
Prueba de Evaluación Continua 5-X-6.- En el aeropuerto de Madrid-Barajas se ha recogido una muestra del peso en kilogramos del equipaje de 0 viajeros: 40 0 3 3 6 5 30 3 4 3 4 9 7 39 Construir un diagrama
Más detallesANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE
ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por
Más detallesDESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
ÍNDICE Introducción: Entrene su cerebro para la estadística... 1 La población y la muestra... 3 Estadísticas descriptivas e inferenciales... 4 Alcanzar el objetivo de estadísticas inferenciales: los pasos
Más detallesFACULTAD DE RECURSOS NATURALES INGENIERÍA ZOOTECNISTA PROGRAMA DE ESTADÍSTICA Y BIOMETRÍA AÑO 2017
FACULTAD DE RECURSOS NATURALES INGENIERÍA ZOOTECNISTA PROGRAMA DE ESTADÍSTICA Y BIOMETRÍA AÑO 2017 Titular: Ing Inés González de Rubiano (gonrubi@arnet.com.ar) JTP: Lic. Gladis Mazza (gladismazza@gmail.com)
Más detallesTEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS
TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS 9.1. Análisis Descriptivo de la Información 9.2. La Tabulación Cruzada 9.3. Contraste de Hipótesis 9.1. Análisis Descriptivo
Más detallesEstadística II Ejercicios Tema 5
Estadística II Ejercicios Tema 5 1. Considera los cuatro conjuntos de datos dados en las transparencias del Tema 5 (sección 5.1) (a) Comprueba que los cuatro conjuntos de datos dan lugar a la misma recta
Más detallesEl análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE)
El análisis de correspondencias Ana María López Jiménez Dept. Psicología Experimental (USE) 4. El análisis de correspondencias 4.. Introducción 4.2. Tabla de correspondencias 4.3. Dependencia e independencia
Más detalles2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Más detallesUnidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15
Unidad Temática 3: Estadística Analítica Unidad 9 Regresión Lineal Simple Tema 15 Estadística Analítica CORRELACIÓN LINEAL SIMPLE Indica la fuerza y la dirección de una relación lineal proporcional entre
Más detallesPrueba t para muestras independientes
Prueba t para muestras independientes El procedimiento Prueba t para muestras independientes compara las medias de dos grupos de casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente
Más detallesBIOSESTADÍSTICA AMIGABLE
BIOSESTADÍSTICA AMIGABLE EJEMPLO: Ficha solicitud Colección Reserva UNIVERSIDAD AUSTRAL DE CHILE SISTEMA DE BIBLIOTECAS Clasificación: 574.015195 MAR 2001 Vol. y/o Copia: Apellido Autor: Título: C. 1 (SEGÚN
Más detallesInformación general. Fundamentos de Análisis de datos. Obligatoria básica o de fundamentación X. Obligatoria profesional
Guía de asignatura Formato institucional Rev. Abril 2013 Información general Asignatura Fundamentos de Análisis de datos Código Tipo de asignatura Obligatoria X Electiva Tipo de saber Número de créditos
Más detallesCUERPO TÉCNICO, OPCION ESTADISTICA
CUERPO TÉCNICO, OPCION ESTADISTICA ESTADÍSTICA TEÓRICA BÁSICA TEMA 1. Fenómenos aleatorios. Conceptos de probabilidad. Axiomas. Teoremas de probabilidad. Sucesos independientes. Teorema de Bayes. TEMA
Más detallesEstimación de Parámetros.
Estimación de Parámetros. Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona información sobre el valor del parámetro. Por ejemplo la media muestral es un
Más detallesTaller de Capacitación 1 - Nivelación SISCA - BPS. Juan José Goyeneche Andrés Castrillejo Junio de 2012
Taller de Capacitación 1 - Nivelación SISCA - BPS Juan José Goyeneche Andrés Castrillejo Junio de 2012 Conceptos Generales Qué es la estadística? Qué usos o aplicaciones potenciales tiene? Qué es la Inferencia
Más detalles1 de 12 15/07/ :49
1 de 12 15/07/2010 12:49 Saltar a... UPM - TITULACIONES OFICIALES ampliacion_mate2 Cuestionarios Test Estadística Descriptiva Información Resultados Vista previa Editar Visión general Recalificar Calificación
Más detallesTEMA 5 Estadística descriptiva. Análisis de datos
TEMA 5 Estadística descriptiva. Análisis de datos Florence Nightingale (1820-1910) 1. Introducción. Modelos matemáticos 2. Métodos numéricos. Resolución de sistemas lineales y ecuaciones no lineales 3.
Más detallesPrograma Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Fundamentos de Estadística
Ficha Técnica Titulación: Grado en Ingeniería de Organización Industrial Plan BOE: BOE número 75 de 28 de marzo de 2012 Asignatura: Módulo: Fundamentos de Matemáticas Curso: 2º Créditos ECTS: 6 Tipo de
Más detallesTema 9: Estadística descriptiva
Tema 9: Estadística descriptiva Matemáticas específicas para maestros Grado en Educación Primaria Matemáticas específicas para maestros Tema 9: Estadística descriptiva Grado en Educación Primaria 1 / 47
Más detallesmatemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4
PS0401 - Probabilidad y Estadística DES: Ingeniería Programa(s) Educativo(s): Ingeniería de Software Tipo de materia: Obligatoria Clave de la materia: PS0401 Cuatrimestre: 4 UNIVERSIDAD AUTÓNOMA DE Área
Más detallesTema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos
7-1 Tema 7 Contrastes de Hipótesis para una Muestra Introducción Metodología del contraste de hipótesis Métodos no paramétricos Test binomial Test de los signos Test de rango con signos de Wilcoxon Test
Más detallesEstadística para las Ciencias Agropecuarias
Estadística para las Ciencias Agropecuarias Séptima Edición Di Rienzo, Julio Alejandro Casanoves, Fernando Gonzalez, Laura Alicia Tablada, Elena Margot Díaz, María del Pilar Robledo, Carlos Walter Balzarini,
Más detallesEXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos)
EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos) PROBLEMA 1 Se quiere comparar la cantidad de energía necesaria para realizar 3 ejercicios o actividades: andar, correr y montar en bici.
Más detallesTema 3 Normalidad multivariante
Aurea Grané Máster en Estadística Universidade Pedagógica Aurea Grané Máster en Estadística Universidade Pedagógica Tema 3 Normalidad multivariante 3 Normalidad multivariante Distribuciones de probabilidad
Más detalles