Introducción a las técnicas de. Análisis multivariante
|
|
- Domingo Silva Coronel
- hace 5 años
- Vistas:
Transcripción
1 Introducción a las técnicas de Análisis Multivariante Fco. Javier Burguillo Universidad de Salamanca
2 Objetivo: estudio de varias variables simultáneamente: X X X3 X4 X5 Objeto Objeto Objeto Métodos con variable dependiente Hay una variable que depende de otras que se miden como independientes o predictoras.tienen un interés predictivo. Métodos con sólo variables independientes No se distingue entre variables dependientes e independientes. Tienen un interés descriptivo en el sentido de clasificar objetos en función de las variables.
3 Métodos con variable dependiente y X X X X4 Objeto Objeto Objeto Regresión lineal múltiple Regresión lineal generalizada Regresión logística binaria Regresión logit
4 Métodos con sólo variables independientes a) No se conocen los grupos de los objetos Objeto X X 34 X3 6 X4 0. X5 0.7 Análisis de clusters Jerárquicos K-medias Objeto Objeto Análisis de componentes principales Métodos biplot b) Sí que se conocen los grupos de los objetos Objeto Objeto Objeto 3 Grupo X X X X MANOVA Análisis en variables canónicas Análisis discriminante Objeto
5 Regresión lineal múltiple por mínimos cuadrados La regresión lineal simple Sólo una variable independiente : por ejemplo línea recta y = C + Bx SSQ = (y i ( a + bx )) i Ahora: la regresión lineal múltiple Más de una variable independiente : y = C + B x + Bx + B3 x3 ( SSQ) a ( SSQ) b = = = = 0 0 a b = =. Tratamiento matemático análogo a regresión lineal simple. Se puede explicitar cada parámetro, solución única, método exacto Se puede explicitar cada parámetro, solución única, método exacto
6 Ejemplo de regresión n lineal múltiplem La aplicación importante es estimar Masa tumoral para un caso nuevo
7 Regresión n logística binaria y(i) =vivo 0=muerto variables: X, X, X 3, p() = probabilidad de que y = p() log = L = a ax + ax + a 3.. p() X 0 + La aplicación importante es estimar p() para un caso nuevo: p() = + e L (ej: p() = 0.73 de sobrevivir)
8 Análisis de clusters X X X3 Xm Objeto Objeto Objeto Objeto n Dada una serie de n objetos y m variables X, X,, X m, el propósito es clasificar los objetos en grupos (clusters) según la similitud (menor distancias) entre ellos: Aglomerativos o divisivos Procedimientos: Jerárquicos Supervisados (k-medias)
9 Análisis jerárquico rquico de clusters (Ejemplo) Análisis de 0 pacientes X X X3 Paciente 34 6 Objeto Objeto Transformar variables? Sin transformar Métrica distancia entre objetos d ij = m k= x ik Algoritmo de unión de clusters d x jk ( ) d =min, i, jk ij d ik Los 0 pacientes se agrupan (dendrograma) 4 grupos CML ALL AML RCML
10 Etapas de un análisis jerárquico de clusters (variables cuantitativas) ) Estandarizar las variables si fuera necesario. ) Elegir una medida de distancia entre objetos. 3) Elegir un algoritmo para unir (fusionar) grupos. 4) Decidir el número final de clusters e interpretarlos.
11 ) Transformación de variables para uniformar sus escalas (sólo variables cuantitativas) ) No transformar si las variables están medidas en las mismas unidades. ) Normalizar variables a media = 0 y desviación estándar = : x x s ) Aplicar raíz cuadrada a las variables. ) Hacer el logaritmo de las variables. x =
12 a) Elegir una medida de distancia entre objetos Distancia ciudad (city block): D Distancia Euclidia : ij = m Dij = k= m k = x / ( ) ( x x ) ik ik x jk jk x i x j x i variables (plano) x j variables (plano) Distancia Euclidia al cuadrado. Disimilaridad de Bray-Curtis (en %).
13 b) Calcular la matriz de distancias X X X3 X4 X5 Objeto Objeto Objeto Objeto d d d d d d d d d d d d d d d d Matriz de distancias d d d d Objeto Matriz de distancias
14 3) Algoritmos de unión (fusión) de clusters El primer cluster consiste en n clusters de objeto cada uno, el algoritmo los va fusionando por pasos hasta llegar a un último cluster que contiene los n objetos. Qué criterio se sigue para ir fusionando los clusters? Cluster Por centroides Vecino más próximo (single link) Cluster 3 Cluster Vecino más lejano (complete link)
15 Ejemplo del algoritmo vecino más próximo Matriz distancias Objeto Dendrograma (árbol) Distancia Cluster,,3,4,5 (, ), 3, 4, 5 (, ), 3, (4, 5) (, ), (3, 4, 5) (,, 3, 4, 5) Distancia entre 4 y 5 (rama)
16 Algoritmos de unión (fusión) de clusters (cont.) Método del promedio del grupo Cluster A Cluster B Cluster C D + D4 + D5 + D3 + D4 + D AB = 6 Y análogamente: 3 D5 D + D7 + D8 + D6 + D7 + D AC = 6 etc 6 D8
17 Ejemplo del algoritmo promedio de grupo Objeto Distance matrix 5 Dendrograma (árbol) Distancia Cluster,,3,4,5 (, ), 3, 4, 5 (, ), 3, (4, 5) (, ), (3, 4, 5) (,, 3, 4, 5)
18 Por donde cortar el dendrograma? o el problema del número n de grupos Análisis de 0 pacientes Paciente Paciente Paciente 3 X 4 0. Transformar variables? Sin transformar Métrica distancia entre objetos distancia X ciudad 40 Algoritmo de unión de clusters vecino más próximo 5 X Los 0 pacientes se agrupan (dendrograma) grupos 3 grupos 4 grupos CML ALL AML RCML
19 Ojo: el dendrograma depende de la transformación de los datos, tipo de distancia y algoritmo elegidos Sin transformar, distancia euclidia, vecino más próximo Estandarizados, distancia euclidia, vecino más próximo Estandarizados, distancia ciudad, promedio de grupo
20 Análisis de clusters por K medias (ejemplo) Es un análisis de clusters de tipo supervisado (no jerárquico). El número de clusters que se desea tiene que decidirse a priori. Análisis de 0 pacientes Caso X X X3 X X Análisis con 3 clusters CML ALL Se deciden k centroides (3 por ej.) AML centroide X X X3 X4 X
21 Fundamento de Clusters por K-medias ) Imaginemos n objetos a clasificar en base a m variables ) Elegimos un procedimiento para decidir las estimas iniciales de los k centroides (semillas): El investigador elige los k centroides. Seleccionar k objetos al azar k primeros objetos Semilla 3 Semilla Semilla 3) Elegir un algoritmo para reasignar los objetos a los clusters hasta alcanzar un criterio de convergencia.
22 Análisis por Componentes Principales (Ejemplo) 6 pacientes 5 variables autoperimetría laser (campo visual) Caso X 4.. X CP CP X = = X a X X X3. X5 6 Reducir las 5 variables a X X + + a a X X a a m X m m X m 3-4 componentes principales Caso CP 4.. CP CP CP m m m = a X + a X Estas CP i explicarán la mayor variabilidad de las variables originales - Las CP i presentan incorrelación entre ellas a mm X m
23 Extracción n de las componentes principales Transformación = Untransformed Tipo de matriz = Correlation matrix Tipo de puntuación = Standardised scores Eigenvalores Proporción Acumulativa CP 6.833E CP 3.74E CP3.3E CP4.055E CP E CP6.69E CP7.968E CP E CP9 4.89E CP E CP.53E CP 6.593E CP E CP4.308E CP5.5E CP CP CP3 CP4 Se extraen 4 componentes: CP, CP, CP3 y CP4
24 Contribución n de las variables originales a CP y CP Las 5 variables originales
25 Representación n de los casos bajo CP y CP (puntuaciones o scores en CP y CP) Los 6 pacientes
26 Representación Biplot: Cómo surge? Imaginemos variables medidas sobre n sujetos, se pueden representar a la vez variables y sujetos? : Sujeto Sujeto X 4 X Si X (Peso) Sujeto X (Talla)
27 Cómo generalizarlo?: La representación Biplot Cómo representar simultáneamente m variables y n sujetos? Sujeto Sujeto Sujeto 3 Sujeto n X X X X m ) No es posible representar, tal cual están, más de 3 variables (3D). ) Se recurre a extraer la información mediante o 3 componentes o ejes ficticios (Biplot D o 3D), obtenidos por descomposición de la matriz original en valores singulares (SVD). Sujeto 4 Var Sujeto 3 Var 3 Sujeto Var 5 Sujeto 6 Sujeto Var 4 Sujeto 5 Var
28 Representación Biplot (Interpretación) A partir del gráfico Biplot se puede reconocer: Sujeto 4 Var Sujeto 3 Var 3 Sujeto Var 5 Sujeto 6 Sujeto Var 4 Sujeto 5 Var La variabilidad en las variables (desviación estándar), ya que a mayor longitud del vector mayor error en la variable. La correlación entre variables, ya que vectores formando ángulo pequeño se interpretan como variables bien correlacionadas. Vectores perpendiculares se refieren a variables con correlación nula y vectores contrarios a variables correlacionadas negativamente. Agrupaciones de casos: casos próximos tiene valores parecidos de las variables.
29 Ejemplo: Biplot para variedades de lirios Fisher estudió 50 muestras de lirios del campo y a todos les medió la longitud y la anchura del sépalo y la longitud y anchura del pétalo.
30 Biplot para los datos de lirios de Fisher
31 Biplot (fundamento matemático) ) Se tiene una matriz X de n filas por m columnas: ) Se hace una descomposición en valores singulares (SVD): X = UΣV T X = 3) Nos quedamos con la aproximación dada por los primeros valores singulares: 4) Esta aproximación se puede escribir de 3 formas: Biplot simétrico Biplot con énfasis en filas Biplot con énfasis en columnas
32 Métodos con sólo variables independientes ( b. Cuando se conocen los grupos de los objetos) Objetivo: Estudiar las diferencias entre grupos y predecir el grupo de nuevas muestras. Objeto Objeto Objeto 3 Grupo X X X X MANOVA Análisis en variables canónicas Análisis discriminante Objeto
33 MANOVA (ANOVA de varias variables) Imaginemos que se miden 4 variables en 3 grupos: Objeto Objeto Objeto 3 Objeto 4 Objeto 5 Objeto 6 Grupo Grupo Grupo Grupo Grupo Grupo Grupo X X X X H 0 : No hay diferencia entre los vectores de medias de las 4 variables en los 3 grupos: x x x 3 x x x 3 x x x x x x Objeto 7 Objeto 8 Objeto 9 Grupo 3 Grupo 3 Grupo H : al menos hay vectores de medias que difieren significativamente de un grupo a otro.
34 MANOVA (Ejemplo: datos de lirios de Fisher ) VARIABLE VARIABLE VARIABLE 3 VARIABLE 4 GROUP E E E E-0 GROUP E E E E+00 GROUP E E E E+00 POOLED MEAN E E E E+00 Hay diferencias entre estos vectores de medias?
35 MANOVA (datos de lirios de Fisher (cont.) ) VARIABLE VARIABLE VARIABLE 3 VARIABLE 4 GROUP E E E E-0 GROUP E E E E+00 GROUP E E E E+00 POOLED MEAN E E E E+00 Hay diferencias entre estos vectores de medias? Para decidirlo se hacen diferentes tests estadísticos: Statistic Value Transform deg.free. p Wilks lambda.344e E Reject H0 Roys largest root 3.9E+0 Lawley-Hotelling T 3.48E E Reject H0 Pillais trace.9e+00 Como p < 0.0 se concluye que al menos vectores de medias si difieren
36 MANOVA: Hay igualdad de perfiles? MANOVA H0: selected group profiles are equal Hotelling T^ =.03E+03 Test statistic S = 6.63E+0 Numerator DOF = 3 Denominator DOF = 96 P(F >= S) = Reject H0 at % sig.level
37 Análisis por variables canónicas Grupo X X X3 X4 Imaginemos: Se han medido varias variables en diferentes objetos de grupos. Objeto Objeto. Objeto Objeto Objetivos: Para discriminar entre los grupos todo lo posible se busca una combinación lineal de las variables que maximice la la relación de la variabilidad entre grupos respecto a la variabilidad intra grupos. x x x Esquema para variables: x x Dirección de máxima separación Y + = ax ax x
38 Análisis por variables canónicas (Ejemplo: Lirios de Fisher) Grupo variables Muestras a asignar? ? ?
39 Análisis por variables canónicas (Fundamento matemático) CV CV = a = a X X + + a a X X + + a a 3 3 X 3 X a 4 a 4 X 4 X 4 Correlations Eigenvalues Proportions Chi-sq. NDOF p Canonical variate means E+00.5E-0.85E E E E-0 Canonical coefficients -8.94E-0.40E E+00.65E+00.0E E-0.80E E+00 CV CV
40 Asignación de objetos a grupos por Análisis Discriminante Grupo variables Muestras a asignar? y? ? y m = = a a x m x + + a + + p a x mp p x + p a + 0 a m0
41 Asignación de objetos a grupos por Análisis Discriminante (ej: Lirios de Fisher) Serie de entrenamiento Grupo LongSep AnchSep LongPet AnchPet Muestras a asignar a grupos Distancias de Mahalanobis entre grupos Distancias de Mahalanobis muestras- grupos Muestra Muestra Muestra
42 Aplicación del en las investigaciones con Chips de ADN
43
44 Los 0 Genes principales asociados a la respuesta a Imatinib Usando la prueba t de student #genename t-statistic pvalue R H AA AA R A AI AA T AA
45 Exploración de datos en la serie de entrenamiento (3 pacientes y 0 genes predictores)
46 Cluster jerárquico de los 3 pacientes
47 Componentes principales
48 ANALISIS DISCRIMINANTE Distancia de Mahalanobis al cuadrado
Introducción a las técnicas de Análisis Multivariante
Introducción a las técnicas de Análisis Multivariante Dagoberto Salgado Horta Universidad del Tolima Dagoberto Salgado Horta 1 Análisis multivariante Objetivo: estudio de varias variables simultáneamente:
Más detallesRECONOCIMIENTO DE PAUTAS. ANÁLISIS DE CONGLOMERADOS (Cluster Analysis)
RECONOCIMIENTO DE PAUTAS ANÁLISIS DE CONGLOMERADOS (Cluster Analysis) Análisis de conglomerados los análisis exploratorios de datos (como PCA) determinan relaciones generales entre datos en ocasiones no
Más detallesAnálisis de Correlación Canónica y Análisis discriminante
Análisis de Correlación Canónica y Análisis discriminante Análisis de Regresión Múltiple TÉCNICAS DE DEPENDENCIA Variable/s Dependiente/s Variable/s Independiente/s Técnica 1 Nivel de medición Continuo
Más detallesIntroducción Clustering jerárquico Clustering particional Clustering probabilista Conclusiones. Clustering. Clasificación no supervisada
Clustering Clasificación no supervisada Javier G. Sogo 10 de marzo de 2015 1 Introducción 2 Clustering jerárquico 3 Clustering particional 4 Clustering probabilista 5 Conclusiones Introducción Objetivos
Más detallesOrdenación contrastante o directo. Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas?
Ordenación contrastante o directo Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas? Ordenación contrastante o directa De análisis de gradiente indirecto a directo
Más detallesCaso 17. Análisis multivariante: reducción de datos por componentes principales.
Caso 17: reducción por componentes principales 115 Caso 17. Análisis multivariante: reducción de datos por componentes principales. (JESÚS LÓPEZ FIDALGO, UCLM) CASO PRÁCTICO Se dispone de 15 variables
Más detallesCLASIFICACIÓN PROBLEMA SOLUCIÓN
Capítulo 7 Análisis Cluster CLASIFICACIÓN Asignar objetos en su lugar correspondiente dentro de un conjunto de categorías establecidas o no. PROBLEMA Dado un conjunto de m objetos (animales, plantas, minerales...),
Más detallesAnálisis de agrupamiento (Cluster nmds)
Análisis de agrupamiento (Cluster nmds) Agregación (Cluster) Conjunto de técnicas que intentan organizar la información de las unidades de muestreo (UM) en clases o grupos discretos Crea agrupaciones sobre
Más detallesCapítulo 8. Análisis Discriminante
Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables
Más detallesMáster en Ordenación y Gestión del Desarrollo Territorial y Local. Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL
ANÁLISIS CLUSTERS C U R S O TÉCNICAS MULTIVARIANTES Prof. Dr. Ángel Luís LUCENDO MONEDERO 1 http://www.geografia.us.es/ Tema 2. INTRODUCCIÓN N AL ANÁLISIS CLUSTER 2.1 Consideraciones generales. Clasificación
Más detallesANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE
ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por
Más detallesEstadística II Tema 1: Distribución normal multivariante
Estadística II Tema 1: Distribución normal multivariante José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Algunas propiedades de los vectores aleatorios Sea X = (X 1,..., X
Más detallesCARACTERÍSTICAS GRALES.
Las técnicas estadísticas multivariadas permiten establecer, a partir de numerosos datos y variables, ciertas relaciones, investigar estructuras latentes y ensayar diversas maneras de organizar dichos
Más detallesAnálisis multivariante II
Análisis multivariante II Tema 1: Introducción Pedro Galeano Departamento de Estadística Universidad Carlos III de Madrid pedro.galeano@uc3m.es Curso 2016/2017 Grado en Estadística y Empresa Pedro Galeano
Más detallesIntroducción al Análisis Multivariante
al Análisis Multivariante Vectores aleatorios, técnicas de análisis multivariante, distancias estadísticas Curso 2011-2012 Considero que el cerebro de cada cual es como una pequeña pieza vacía que vamos
Más detallesMinería de Datos Web. Cursada 2018
Minería de Datos Web Cursada 2018 Proceso de Minería de Texto Clustering de Documentos Clasificación de Documentos Es un método supervisado para dividir documentos en base a categorías predefinidas Los
Más detallesINTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS
INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS Datos multivariantes Métodos modernos de análisis automático (métodos espectroscópicos o cromatográficos) permiten reunir grandes cantidades
Más detallesAnálisis Estadístico de Datos Climáticos. Análisis de agrupamiento (o clusters)
Análisis Estadístico de Datos Climáticos Análisis de agrupamiento (o clusters) A. Díaz - M. Bidegain M. Barreiro Facultad de Ciencias Facultad de Ingeniería 2011 Objetivo Idear una clasificación o esquema
Más detallesMASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO
MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN 2009 Nombre de asignatura: ESTADÍSTICA ACTUARIAL III: ANÁLISIS MULTIVARIANTE DE DATOS Código: 603377 Materia: ESTADÍSTICA ACTUARIAL Módulo: ANÁLISIS DEL
Más detallesANÁLISIS DISCRIMINANTE
DEFINICIÓN: Cómo técnica de análisis de dependencia: Pone en marcha un modelo de causalidad en el que la variable endógena es una variable NO MÉTRICA y las independientes métricas. Cómo técnica de análisis
Más detallesTema 9. Análisis factorial discriminante
Máster en Técnicas Estadísticas Análisis Multivariante. Año 2008 2009. Profesor: César Sánchez Sellero. 9.1. Introducción. Tema 9. Análisis factorial discriminante Supongamos que están denidos I grupos,
Más detallesAnálisis discriminante.
Análisis discriminante. INTRODUCCIÓN Las técnicas de análisis discriminante se proponen la determinación de un criterio que nos permita decidir a qué grupo pertenece un cierto individuo, a partir de la
Más detallesAprendizaje No Supervisado
Aprendizaje Automático Segundo Cuatrimestre de 2015 Aprendizaje No Supervisado Supervisado vs. No Supervisado Aprendizaje Supervisado Clasificación y regresión. Requiere instancias etiquetadas para entrenamiento.
Más detallesANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA
ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos
Más detallesCurso de Postgrado en Herramientas Estadísticas Avanzadas: AGROPECUARIOS. Prof. Dr. José Perea Dpto. Producción Animal
Curso de Postgrado en Herramientas Estadísticas Avanzadas: ANÁLISIS MULTIVARIANTE PARA INVESTIGACIÓN EN SISTEMAS AGROPECUARIOS ANÁLISIS CLUSTER Prof. Dr. José Perea Dpto. Producción Animal ANÁLISIS DE
Más detallesTema 2 Datos multivariantes
Aurea Grané Máster en Estadística Universidade Pedagógica 1 Aurea Grané Máster en Estadística Universidade Pedagógica 2 Tema 2 Datos multivariantes 1 Matrices de datos 2 Datos multivariantes 2 Medias,
Más detallesAnálisis de Conglomerados
Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis de Conglomerados (Cluster analysis) Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid Antecedente histórico Las
Más detallesMINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE MODELIZACIÓN TÉCNICAS DE MINERÍA DE DATOS TÉCNICAS DE MINERÍA DE DATOS TÉCNICAS DE MINERÍA DE DATOS
MINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE TÉCNICAS DE MINERÍA DE DATOS TÉCNICAS DE MINERÍA DE DATOS..... MINERÍA DE DATOS - TÉCNICAS PREDICTIVAS DE 1 MINERÍA DE DATOS - TÉCNICAS PREDICTIVAS DE 2 TÉCNICAS
Más detallesDiscriminación entre grupos
Discriminación entre grupos Discriminación entre grupos Son los grupos significativamente diferentes? Multivariate Analysis of Variance (MANOVA) Multi-Response Permutation Procedures (MRPP) Analysis of
Más detallesCLUSTERING. Bases de Datos Masivas
1 CLUSTERING Bases de Datos Masivas 2 Temas Qué es clustering? K-Means Clustering Hierarchical Clustering QUÉ ES CLUSTERING? 3 Aprendizaje Supervisado vs. No Supervisado 4 Aprendizaje Supervisado: tanto
Más detallesLECCIÓN PÚBLICA. Tema 6 Descripción Multivariante de Datos. Profa. María Fátima Dos Santos
LECCIÓN PÚBLICA Tema 6 Descripción Multivariante de Datos Profa. María Fátima Dos Santos 1 TEMARIO Análisis Multivariados. Clasificación ACP. Organización de los Datos ACP. Componentes, variabilidad explicada
Más detallesProf. Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada
Clustering Análisis de segmentación Prof. Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International
Más detalles1. Análisis de Conglomerados
1. Análisis de Conglomerados El objetivo de este análisis es formar grupos de observaciones, de manera que todas las unidades en un grupo sean similares entre ellas pero que sean diferentes a aquellas
Más detallesTÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE
TEMA 8 TÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 8.1.La inferencia estadística: del análisis univariante al análisis multivariante. 8.2.La reducción de la dimensionalidad: el análisis
Más detallesANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS)
ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS) AGRUPAMIENTOS Cuál agrupamiento es mejor? MÉTODOS DE AGRUPACIÓN Métodos jerárquicos: Los objetos se agrupan (dividen) i por partes hasta clasificar todos los
Más detallesGUIÓN TEMA 2. PROPIEDADES DE LOS ESTIMADORES MCO 2.1 PROPIEDADES ESTADÍSTICAS DEL ES- TIMADOR MCO DE.
ECONOMETRIA I. Departamento de Fundamentos del Análisis Económico Universidad de Alicante. Curso 011/1 GUIÓN TEMA. PROPIEDADES DE LOS ESTIMADORES MCO Bibliografía apartados.1,. y.3: Greene, 6.6.1, 6.6.3
Más detallesSistemas de Percepción Visión por Computador
Nota: Algunas de las imágenes que aparecen en esta presentación provienen del libro: Visión por Computador: fundamentos y métodos. Arturo de la Escalera Hueso. Prentice Hall. Sistemas de Percepción Visión
Más detalles5.3. Análisis discriminante Cuándo tenemos que utilizar el análisis discriminante
FUOC P01/71039/00748 119 Investigación descriptiva: análisis de información 5.3. Análisis discriminante 5.3.1. Cuándo tenemos que utilizar el análisis discriminante Para resolver muchos problemas de marketing,
Más detallesINDICE Capitulo 1. Entorno de Trabajo e SPSS Capitulo 2. Operadores y Funciones. Aplicaciones
INDICE Introducción XV Capitulo 1. Entorno de Trabajo e SPSS 1 Introducción y manejo de datos en SPSS 1 Lectura e importación de datos SPSS 6 Importación de datos de hoja de cálculo 8 Importación de archivos
Más detallesIndice
Índice Prólogo.... 15 Capítulo 1. Preliminares... 17 1.1. Introducción............................. 17 1.2. Nombres nuevos para conocidos métodos clásicos........ 17 1.3. *Algunos elementos matemáticos
Más detallesTema 3: Análisis multivariante para la agrupación. Objetivo: Encontrar los grupos naturales en los que se divide la población.
Tema 3: Análisis multivariante para la agrupación Objetivo: Encontrar los grupos naturales en los que se divide la población. Ejemplo canónico en Biologia: Taxonomía Rosa doméstica Reino: Plantae (Plantas)
Más detallesPlan de análisis de datos para la investigación cuantitativa
Plan de análisis de datos para la investigación cuantitativa Oscar Federico Nave Herrera Coordinador del Programa de Asesoría Estadística para Investigación Explicación tentativa del fenómeno a investigar
Más detallesANÁLISIS DE COMPONENTES PRINCIPALES
ANÁLISIS DE COMPONENTES PRINCIPALES INTRODUCCIÓN El objetivo principal de la mayoría de las técnicas numéricas de análisis multivariado, es reducir la dimensión de nuestros datos. Por supuesto, si esta
Más detallesCorrelación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
Más detallesLa práctica del análisis de correspondencias
La práctica del análisis de correspondencias MICHAEL GREENACRE Catedrático de Estadística en la Universidad Pompeu Fabra Separata del apéndice D Glosario de términos Primera edición: julio 2008 ISBN: 978-84-96515-71-0
Más detallesClasicación Automática de Documentos
Clasicación Automática de Documentos Carlos G. Figuerola, José Luis Alonso Berrocal, Angel F. Zazo Universidad de Salamanca Grupo REINA http://reina.usal.es Carlos G. Figuerola (Grupo REINA) Clasicación
Más detallesANÁLISIS DISCRIMINANTE (AD)
discrim_predictivo.doc 30//05 vgg ANÁLISIS DISCRIMINANTE (AD) Regresión con respuesta categórica Y Cómo depende Y de las variables X, X,... X p? cualitativa cuantitativas Planteamiento Predictivo del AD:
Más detallesTÉCNICAS MULTIVARIANTES
Máster en Ordenación y Gestión del Desarrollo Territorial y Local Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL CURSO TÉCNICAS MULTIVARIANTES Prof. Dr. Rosa Jordá Borrell
Más detallesESTADÍSTICA CÁTEDRA I. Unidad 7
ESTADÍSTICA CÁTEDRA I Unidad 7 UNIDAD 7: La relación entre variables. Contenidos Distribución conjunta de dos variables. Diagrama de dispersión. Distribuciones marginales y condicionales. Correlación.
Más detallesClustering: Algoritmos
Clustering: Algoritmos Clasificación no supervisada Javier G. Sogo 10 de marzo de 2015 1 Introducción 2 Algoritmo: K-medias 3 Algoritmo: BFR 4 Algoritmo: CURE Introducción Acotar el problema Complejidad
Más detallesTEMA I CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES
TEMA I CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES LECTURA OBLIGATORIA Algunas cuestiones previas. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en
Más detallesTaller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO. Juan León Jara Almonte GRADE
Taller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO Juan León Jara Almonte GRADE Por qué hacer análisis descriptivo? Qué hacer con estos datos? ESTADISTICA DESCRIPTIVA
Más detallesINDICE. 81 Operadores lógicos Funciones exponenciales y logarítmicas Funciones trigonométricas
INDICE Introducción XV Capitulo 1. Instalación y primeros pasos en SPSS 10 Instalación de SPSS 10 1 Comenzando con SPSS 10 8 El trabajo de trabajo de SPSS 10 9 Opciones de a barra de menú principal 10
Más detallesGuía docente 2007/2008
Guía docente 2007/2008 Plan 247 Lic.Investigación y Tec.Mercado Asignatura 43579 METODOS CUANTITATIVOS PARA LA INVESTIGACION DE MERCADOS Grupo 1 Presentación Métodos y técnicas cuantitativas de investigación
Más detallesAPLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU. Luis Azaña Bocanegra
APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU Luis Azaña Bocanegra TEMARIO CONCEPTOS DEFINICION DE MINERIA DE DATOS USOS DE LA MINERIA DE DATOS TECNICAS DE MINERIA DE DATOS ETAPAS DE UN PROYECTO DE
Más detallesBLOQUE III. ANÁLISIS MULTIVARIANTE
BLOQUE III. ANÁLISIS MULTIVARIANTE CAPÍTULO 7 Teoría sobre análisis multivariante. El análisis multivariante engloba un grupo de técnicas o métodos estadísticos cuya finalidad es analizar simultáneamente
Más detalles(PCA) Análisis de Componentes Principales
PCA Pricipal Component Analysis Técnica multivariante que trata de reducir el número de variables originales (X1, X2,...,Xn) a un número menor de variables (CP1, CP2,...,CPp), denominadas componentes principales
Más detallesAnálisis de Correspondencias Simple
1 Capítulo 4 Análisis de Correspondencias Simple 41 INTRODUCCIÓN El Análisis de Correspondencias Simple permite describir las relaciones entre dos variables categóricas dispuestas en una tabla de contingencia
Más detallesCaso 102 : Explorando presiones arteriales en pacientes
Caso 102 : Comparando presiones arteriales en pacientes 1 Caso 102 : Explorando presiones arteriales en pacientes (Exploración de datos: Análisis exhaustivo de una matriz )(F.J. Burguillo, USAL) Caso práctico
Más detallesEspacios Vectoriales Euclídeos. Métodos de los mínimos cuadrados
Capítulo 5 Espacios Vectoriales Euclídeos. Métodos de los mínimos cuadrados En este tema iniciamos el estudio de los conceptos geométricos de distancia y perpendicularidad en K n. Empezaremos con las definiciones
Más detallesPROCESO DE PREPARACIÓN DE DATOS
Partes incompletas Funcionamiento de los cuestionarios Incomprensión Entrega tardía Persona incorrecta PROCESO DE PREPARACIÓN DE DATOS FUENTE: Malhotra, N pag. 426 y sgtes Edición Codificación Trascripción
Más detallesTema 2: Análisis Discriminante
Tema 2: Análisis Discriminante P 1 P 2 Problema de clasificación: Ténemos observaciones que corresponden a 2 grupos P_1, P_2. Si nos dan uno nuevo x_0 a que grupo pertenece? Guión 1. Motivación 2. Clasificación
Más detallesNOTAS DE ESTUDIO DE ÁLGEBRA LINEAL M.C. MARCOS CAMPOS NAVA TEC DE ATITALAQUIA
Hasta ahora se han discutido algunas de las propiedades de objetos matemáticos llamados matrices. Un caso de especial interés son las matrices cuadradas, por ejemplo: Se sabe que esta matriz es invertible
Más detallesLucila Finkel Temario
Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión
Más detallesFigura 4.1. Fases en el método hipotético-deductivo
NIVEL EMPÍRICO NIVEL TEÓRICO OBSERVACIÓN ORGANIZACIÓN DE DATOS INDUCCIÓN DEDUCCIÓN VERIFICACIÓN DE HIPÓTESIS ELABORACIÓN DE LEYES Y TEORÍAS Figura 4.1. Fases en el método hipotético-deductivo Técnica Q
Más detallesINTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS
INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS Individuals vary, but percentages remain constant. So says the statistician. Sherlock Holmes en The Sign of Four Datos multivariantes Métodos
Más detallesComponentes principales (II)
Componentes principales (II) Eliseo Martínez Herrera 1. Propiedades de los componentes Los componentes principales tienen las siguientes propiedades: 1 La suma de las varianzas de los componentes es igual
Más detallesAsignatura: Metodologías de investigación. Tema 6. Exploración de datos. Exploración de datos
Asignatura: Metodologías de investigación Tema 6 Etapas de una investigación Análisis : tests estadísticos, ajuste de curvas, análisis multivariante Obtención datos, calibrados, etc. Diseño del experimento
Más detallesMatrices y Sistemas de Ecuaciones lineales
Matrices y Sistemas de Ecuaciones lineales Llamaremos M m n (K) al conjunto de las matrices A = (a ij ) (i = 1, 2,..., m; j = 1, 2,..., n) donde los elementos a ij pertenecen a un cuerpo K. Las matrices,
Más detallesItinerario del Curso. Análisis de Datos Multivariados para Ciencias Ambientales. Semana 1. Lunes 23 de mayo de Miércoles 25 de mayo de 2016
Semana 1 Lunes 23 de mayo de 2016 8:30am - 9:00am 9:00am - 10:30am Bienvenida / Introducción Medidas de asociación para muestras biológicos-ambientales con estructura multivariada 11:15am - 12:45pm Laboratorio:
Más detalles1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos
TEMA 10 (curso anterior): REGRESIÓN Y CORRELACIÓN 1 Conceptos de Regresión y Correlación 2 Variables aleatorias bidimensionales 3 Ajuste de una recta a una nube de puntos 4 El modelo de la correlación
Más detallesPRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI
PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI 2014 Para qué es útil la estadística inferencial? Se utiliza para probar hipótesis y generalizar los resultados obtenidos en la muestra a la población o universo.
Más detallesDiseño de experimentos
Diseño de experimentos Quimiometría Por qué diseñar experimentos? Exploración: cuáles factores son importantes para realizar exitosamente un proceso Optimización: cómo mejorar un proceso Ahorro de tiempo:
Más detallesPrueba de Septiembre 2012/13
Contenidos 1º Bach. Matemáticas Aplicadas a las C. Sociales I Prueba de Septiembre 2012/13 Aritmética y Álgebra. - El número real. La recta real. - El número irracional. Ejemplos de especial interés, 2,.
Más detallesRepaso de conceptos de álgebra lineal
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Repaso
Más detallesRegresión múltiple. Demostraciones. Elisa Mª Molanes López
Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +
Más detallesRECONOCIMIENTO DE PAUTAS
RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes
Más detallesAnálisis Global y Local. UCR ECCI CI-2414 Recuperación de Información Prof. Kryscia Daviana Ramírez Benavides
UCR ECCI CI-2414 Recuperación de Información Prof. Kryscia Daiana Ramírez Benaides Análisis Global Realiza la expansión basado en la construcción de tesauros utilizando la colección completa de documentos
Más detallesAnálisis multivariante II
Análisis multivariante II Tema 2: Análisis de conglomerados Pedro Galeano Departamento de Estadística Universidad Carlos III de Madrid pedro.galeano@uc3m.es Curso 2016/2017 Grado en Estadística y Empresa
Más detallesProf. Dra. Silvia Schiaffino ISISTAN
Clustering ISISTAN sschia@ea.unicen.edu.ar Clustering: Concepto Cluster: un número de cosas o personas similares o cercanas, agrupadas Clustering: es el proceso de particionar un conjunto de objetos (datos)
Más detallesPráctica 3: Regresión simple con R
Estadística II Curso 2010/2011 Licenciatura en Matemáticas Práctica 3: Regresión simple con R 1. El fichero de datos Vamos a trabajar con el fichero salinity que se encuentra en el paquete boot. Para cargar
Más detallesAprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur Aprendizaje de distancias Kilian Q. Weinberger, Lawrence K. Saul: Distance Metric Learning for Large Margin
Más detallesAMD - Análisis Multivariante de Datos
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2016 200 - FME - Facultad de Matemáticas y Estadística 1004 - UB - Universitat de Barcelona 715 - EIO - Departamento de Estadística
Más detallesTALLER DE ANÁLISIS MULTIVARIABLE TÉCNICA DE COMPONENTES PRINCIPALES SEPTIEMBRE DE 2012
TALLER DE ANÁLISIS MULTIVARIABLE TÉCNICA DE COMPONENTES PRINCIPALES SEPTIEMBRE DE 2012 INSTITUTO DE INFORMACIÓN E INVESTIGACIÓN GEOGRÁFICA, ESTADÍSTICA Y CATASTRAL DEL ESTADO DE MÉXICO ANÁLISIS MULTIVARIABLE
Más detallesEcología de Paisaje y Regiones Tema 16. Principios de estadística multivariada y su aplicación a ecología del paisaje.
Ecología de Paisaje y Regiones Tema 16. Principios de estadística multivariada y su aplicación a ecología del paisaje. Mercedes Rougès 16.1.Principios de estadística multivariada La estadística multivariada
Más detallesMétodos Estadísticos Multivariados
Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 34 Álgebra matricial y vectores aleatorios Una matriz es un arreglo
Más detallesMODELO VAR ARGENTINA
MODELO VAR ARGENTINA 1.-INTRODUCCIÓN Argentina es una de las economías más grandes de América Latina. En los últimos años, Argentina priorizó promover un desarrollo económico con inclusión social. El país
Más detallesObjetivo. variables factores F Principios básicos. Parsimonia Interpretabilidad
ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los factores 5. Puntuaciones factoriales 6. Caso práctico Introducció Objetivo. Resumir
Más detallesReconocimiento de Formas
Reconocimiento de Formas Técnicas no Supervisadas: clustering José Martínez Sotoca Objetivo: Estudio de la estructura de un conjunto de datos, división en agrupaciones. Características: Homogeneidad o
Más detallesTÉCNICAS INTELIGENTES EN BIOINFORMÁTICA CLUSTERING
TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA CLUSTERING Mario de J. Pérez Jiménez Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla
Más detallesMINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE MODELIZACIÓN
MINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE MODELIZACIÓN TÉCNICAS DE MINERÍA DE DATOS. TÉCNICAS PREDICTIVAS PARA LA MODELIZACIÓN. MODELO DE REGRESIÓN MÚLTIPLE. MODELOS DE ELECCIÓN DISCRETA. CLASIFICACIÓN
Más detallesALN - SVD. In. Co. Facultad de Ingeniería Universidad de la República
ALN - SVD In. Co. Facultad de Ingeniería Universidad de la República Índice Definición Propiedades de SVD Ejemplo de SVD Métodos para calcular SVD Aplicaciones de SVD Repaso de matrices: m xm Una matriz
Más detallesTEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA
TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA LECTURA OBLIGATORIA Regresión Logística. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en Ciencias de la Salud. Coruña: Netbiblo. Páginas
Más detallesClase 8 Matrices Álgebra Lineal
Clase 8 Matrices Álgebra Lineal Código Escuela de Matemáticas - Facultad de Ciencias Universidad Nacional de Colombia Matrices Definición Una matriz es un arreglo rectangular de números denominados entradas
Más detallesTema 3 Normalidad multivariante
Aurea Grané Máster en Estadística Universidade Pedagógica Aurea Grané Máster en Estadística Universidade Pedagógica Tema 3 Normalidad multivariante 3 Normalidad multivariante Distribuciones de probabilidad
Más detallesCaso 201 : Recta de calibrado para análisis de fosfato (Regresión lineal sin pesos estadísticos) (F. J. Burguillo, USAL)
Caso 201: Recta de Calibrado para fosfato 1 Caso 201 : Recta de calibrado para análisis de fosfato (Regresión lineal sin pesos estadísticos) (F. J. Burguillo, USAL) CASO PRÁCTICO Uno de los procedimientos
Más detallesIntroducción al Procesamiento de Imágenes Satelitales con Software Libre. Módulo 03
Introducción al Procesamiento de Imágenes Satelitales con Software Libre Módulo 03 Dirección de Formación de Capital Humano Especializado en el Campo Espacial Agencia Espacial Mexicana www.gob.mx/aem Plan
Más detallesMODELADO CALIBRACIÓN MULTIVARIADA
MODELADO CALIBRACIÓN MULTIVARIADA Calibración multivariada aproximaciones multivariadas para crear una curva de calibración: regresión clásica u ordinaria (classical/ordinary least squares, CLS) regresión
Más detallesProfesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.
UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre
Más detallesANÁLISIS DE COMPONENTES PRINCIPALES
ANÁLISIS DE COMPONENTES PRINCIPALES INTRODUCCIÓN El objetivo principal de la mayoría de las técnicas numéricas de análisis multivariado, es reducir la dimensión de nuestros datos. Por supuesto, si esta
Más detalles