Introducción a las técnicas de. Análisis multivariante

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Introducción a las técnicas de. Análisis multivariante"

Transcripción

1 Introducción a las técnicas de Análisis Multivariante Fco. Javier Burguillo Universidad de Salamanca

2 Objetivo: estudio de varias variables simultáneamente: X X X3 X4 X5 Objeto Objeto Objeto Métodos con variable dependiente Hay una variable que depende de otras que se miden como independientes o predictoras.tienen un interés predictivo. Métodos con sólo variables independientes No se distingue entre variables dependientes e independientes. Tienen un interés descriptivo en el sentido de clasificar objetos en función de las variables.

3 Métodos con variable dependiente y X X X X4 Objeto Objeto Objeto Regresión lineal múltiple Regresión lineal generalizada Regresión logística binaria Regresión logit

4 Métodos con sólo variables independientes a) No se conocen los grupos de los objetos Objeto X X 34 X3 6 X4 0. X5 0.7 Análisis de clusters Jerárquicos K-medias Objeto Objeto Análisis de componentes principales Métodos biplot b) Sí que se conocen los grupos de los objetos Objeto Objeto Objeto 3 Grupo X X X X MANOVA Análisis en variables canónicas Análisis discriminante Objeto

5 Regresión lineal múltiple por mínimos cuadrados La regresión lineal simple Sólo una variable independiente : por ejemplo línea recta y = C + Bx SSQ = (y i ( a + bx )) i Ahora: la regresión lineal múltiple Más de una variable independiente : y = C + B x + Bx + B3 x3 ( SSQ) a ( SSQ) b = = = = 0 0 a b = =. Tratamiento matemático análogo a regresión lineal simple. Se puede explicitar cada parámetro, solución única, método exacto Se puede explicitar cada parámetro, solución única, método exacto

6 Ejemplo de regresión n lineal múltiplem La aplicación importante es estimar Masa tumoral para un caso nuevo

7 Regresión n logística binaria y(i) =vivo 0=muerto variables: X, X, X 3, p() = probabilidad de que y = p() log = L = a ax + ax + a 3.. p() X 0 + La aplicación importante es estimar p() para un caso nuevo: p() = + e L (ej: p() = 0.73 de sobrevivir)

8 Análisis de clusters X X X3 Xm Objeto Objeto Objeto Objeto n Dada una serie de n objetos y m variables X, X,, X m, el propósito es clasificar los objetos en grupos (clusters) según la similitud (menor distancias) entre ellos: Aglomerativos o divisivos Procedimientos: Jerárquicos Supervisados (k-medias)

9 Análisis jerárquico rquico de clusters (Ejemplo) Análisis de 0 pacientes X X X3 Paciente 34 6 Objeto Objeto Transformar variables? Sin transformar Métrica distancia entre objetos d ij = m k= x ik Algoritmo de unión de clusters d x jk ( ) d =min, i, jk ij d ik Los 0 pacientes se agrupan (dendrograma) 4 grupos CML ALL AML RCML

10 Etapas de un análisis jerárquico de clusters (variables cuantitativas) ) Estandarizar las variables si fuera necesario. ) Elegir una medida de distancia entre objetos. 3) Elegir un algoritmo para unir (fusionar) grupos. 4) Decidir el número final de clusters e interpretarlos.

11 ) Transformación de variables para uniformar sus escalas (sólo variables cuantitativas) ) No transformar si las variables están medidas en las mismas unidades. ) Normalizar variables a media = 0 y desviación estándar = : x x s ) Aplicar raíz cuadrada a las variables. ) Hacer el logaritmo de las variables. x =

12 a) Elegir una medida de distancia entre objetos Distancia ciudad (city block): D Distancia Euclidia : ij = m Dij = k= m k = x / ( ) ( x x ) ik ik x jk jk x i x j x i variables (plano) x j variables (plano) Distancia Euclidia al cuadrado. Disimilaridad de Bray-Curtis (en %).

13 b) Calcular la matriz de distancias X X X3 X4 X5 Objeto Objeto Objeto Objeto d d d d d d d d d d d d d d d d Matriz de distancias d d d d Objeto Matriz de distancias

14 3) Algoritmos de unión (fusión) de clusters El primer cluster consiste en n clusters de objeto cada uno, el algoritmo los va fusionando por pasos hasta llegar a un último cluster que contiene los n objetos. Qué criterio se sigue para ir fusionando los clusters? Cluster Por centroides Vecino más próximo (single link) Cluster 3 Cluster Vecino más lejano (complete link)

15 Ejemplo del algoritmo vecino más próximo Matriz distancias Objeto Dendrograma (árbol) Distancia Cluster,,3,4,5 (, ), 3, 4, 5 (, ), 3, (4, 5) (, ), (3, 4, 5) (,, 3, 4, 5) Distancia entre 4 y 5 (rama)

16 Algoritmos de unión (fusión) de clusters (cont.) Método del promedio del grupo Cluster A Cluster B Cluster C D + D4 + D5 + D3 + D4 + D AB = 6 Y análogamente: 3 D5 D + D7 + D8 + D6 + D7 + D AC = 6 etc 6 D8

17 Ejemplo del algoritmo promedio de grupo Objeto Distance matrix 5 Dendrograma (árbol) Distancia Cluster,,3,4,5 (, ), 3, 4, 5 (, ), 3, (4, 5) (, ), (3, 4, 5) (,, 3, 4, 5)

18 Por donde cortar el dendrograma? o el problema del número n de grupos Análisis de 0 pacientes Paciente Paciente Paciente 3 X 4 0. Transformar variables? Sin transformar Métrica distancia entre objetos distancia X ciudad 40 Algoritmo de unión de clusters vecino más próximo 5 X Los 0 pacientes se agrupan (dendrograma) grupos 3 grupos 4 grupos CML ALL AML RCML

19 Ojo: el dendrograma depende de la transformación de los datos, tipo de distancia y algoritmo elegidos Sin transformar, distancia euclidia, vecino más próximo Estandarizados, distancia euclidia, vecino más próximo Estandarizados, distancia ciudad, promedio de grupo

20 Análisis de clusters por K medias (ejemplo) Es un análisis de clusters de tipo supervisado (no jerárquico). El número de clusters que se desea tiene que decidirse a priori. Análisis de 0 pacientes Caso X X X3 X X Análisis con 3 clusters CML ALL Se deciden k centroides (3 por ej.) AML centroide X X X3 X4 X

21 Fundamento de Clusters por K-medias ) Imaginemos n objetos a clasificar en base a m variables ) Elegimos un procedimiento para decidir las estimas iniciales de los k centroides (semillas): El investigador elige los k centroides. Seleccionar k objetos al azar k primeros objetos Semilla 3 Semilla Semilla 3) Elegir un algoritmo para reasignar los objetos a los clusters hasta alcanzar un criterio de convergencia.

22 Análisis por Componentes Principales (Ejemplo) 6 pacientes 5 variables autoperimetría laser (campo visual) Caso X 4.. X CP CP X = = X a X X X3. X5 6 Reducir las 5 variables a X X + + a a X X a a m X m m X m 3-4 componentes principales Caso CP 4.. CP CP CP m m m = a X + a X Estas CP i explicarán la mayor variabilidad de las variables originales - Las CP i presentan incorrelación entre ellas a mm X m

23 Extracción n de las componentes principales Transformación = Untransformed Tipo de matriz = Correlation matrix Tipo de puntuación = Standardised scores Eigenvalores Proporción Acumulativa CP 6.833E CP 3.74E CP3.3E CP4.055E CP E CP6.69E CP7.968E CP E CP9 4.89E CP E CP.53E CP 6.593E CP E CP4.308E CP5.5E CP CP CP3 CP4 Se extraen 4 componentes: CP, CP, CP3 y CP4

24 Contribución n de las variables originales a CP y CP Las 5 variables originales

25 Representación n de los casos bajo CP y CP (puntuaciones o scores en CP y CP) Los 6 pacientes

26 Representación Biplot: Cómo surge? Imaginemos variables medidas sobre n sujetos, se pueden representar a la vez variables y sujetos? : Sujeto Sujeto X 4 X Si X (Peso) Sujeto X (Talla)

27 Cómo generalizarlo?: La representación Biplot Cómo representar simultáneamente m variables y n sujetos? Sujeto Sujeto Sujeto 3 Sujeto n X X X X m ) No es posible representar, tal cual están, más de 3 variables (3D). ) Se recurre a extraer la información mediante o 3 componentes o ejes ficticios (Biplot D o 3D), obtenidos por descomposición de la matriz original en valores singulares (SVD). Sujeto 4 Var Sujeto 3 Var 3 Sujeto Var 5 Sujeto 6 Sujeto Var 4 Sujeto 5 Var

28 Representación Biplot (Interpretación) A partir del gráfico Biplot se puede reconocer: Sujeto 4 Var Sujeto 3 Var 3 Sujeto Var 5 Sujeto 6 Sujeto Var 4 Sujeto 5 Var La variabilidad en las variables (desviación estándar), ya que a mayor longitud del vector mayor error en la variable. La correlación entre variables, ya que vectores formando ángulo pequeño se interpretan como variables bien correlacionadas. Vectores perpendiculares se refieren a variables con correlación nula y vectores contrarios a variables correlacionadas negativamente. Agrupaciones de casos: casos próximos tiene valores parecidos de las variables.

29 Ejemplo: Biplot para variedades de lirios Fisher estudió 50 muestras de lirios del campo y a todos les medió la longitud y la anchura del sépalo y la longitud y anchura del pétalo.

30 Biplot para los datos de lirios de Fisher

31 Biplot (fundamento matemático) ) Se tiene una matriz X de n filas por m columnas: ) Se hace una descomposición en valores singulares (SVD): X = UΣV T X = 3) Nos quedamos con la aproximación dada por los primeros valores singulares: 4) Esta aproximación se puede escribir de 3 formas: Biplot simétrico Biplot con énfasis en filas Biplot con énfasis en columnas

32 Métodos con sólo variables independientes ( b. Cuando se conocen los grupos de los objetos) Objetivo: Estudiar las diferencias entre grupos y predecir el grupo de nuevas muestras. Objeto Objeto Objeto 3 Grupo X X X X MANOVA Análisis en variables canónicas Análisis discriminante Objeto

33 MANOVA (ANOVA de varias variables) Imaginemos que se miden 4 variables en 3 grupos: Objeto Objeto Objeto 3 Objeto 4 Objeto 5 Objeto 6 Grupo Grupo Grupo Grupo Grupo Grupo Grupo X X X X H 0 : No hay diferencia entre los vectores de medias de las 4 variables en los 3 grupos: x x x 3 x x x 3 x x x x x x Objeto 7 Objeto 8 Objeto 9 Grupo 3 Grupo 3 Grupo H : al menos hay vectores de medias que difieren significativamente de un grupo a otro.

34 MANOVA (Ejemplo: datos de lirios de Fisher ) VARIABLE VARIABLE VARIABLE 3 VARIABLE 4 GROUP E E E E-0 GROUP E E E E+00 GROUP E E E E+00 POOLED MEAN E E E E+00 Hay diferencias entre estos vectores de medias?

35 MANOVA (datos de lirios de Fisher (cont.) ) VARIABLE VARIABLE VARIABLE 3 VARIABLE 4 GROUP E E E E-0 GROUP E E E E+00 GROUP E E E E+00 POOLED MEAN E E E E+00 Hay diferencias entre estos vectores de medias? Para decidirlo se hacen diferentes tests estadísticos: Statistic Value Transform deg.free. p Wilks lambda.344e E Reject H0 Roys largest root 3.9E+0 Lawley-Hotelling T 3.48E E Reject H0 Pillais trace.9e+00 Como p < 0.0 se concluye que al menos vectores de medias si difieren

36 MANOVA: Hay igualdad de perfiles? MANOVA H0: selected group profiles are equal Hotelling T^ =.03E+03 Test statistic S = 6.63E+0 Numerator DOF = 3 Denominator DOF = 96 P(F >= S) = Reject H0 at % sig.level

37 Análisis por variables canónicas Grupo X X X3 X4 Imaginemos: Se han medido varias variables en diferentes objetos de grupos. Objeto Objeto. Objeto Objeto Objetivos: Para discriminar entre los grupos todo lo posible se busca una combinación lineal de las variables que maximice la la relación de la variabilidad entre grupos respecto a la variabilidad intra grupos. x x x Esquema para variables: x x Dirección de máxima separación Y + = ax ax x

38 Análisis por variables canónicas (Ejemplo: Lirios de Fisher) Grupo variables Muestras a asignar? ? ?

39 Análisis por variables canónicas (Fundamento matemático) CV CV = a = a X X + + a a X X + + a a 3 3 X 3 X a 4 a 4 X 4 X 4 Correlations Eigenvalues Proportions Chi-sq. NDOF p Canonical variate means E+00.5E-0.85E E E E-0 Canonical coefficients -8.94E-0.40E E+00.65E+00.0E E-0.80E E+00 CV CV

40 Asignación de objetos a grupos por Análisis Discriminante Grupo variables Muestras a asignar? y? ? y m = = a a x m x + + a + + p a x mp p x + p a + 0 a m0

41 Asignación de objetos a grupos por Análisis Discriminante (ej: Lirios de Fisher) Serie de entrenamiento Grupo LongSep AnchSep LongPet AnchPet Muestras a asignar a grupos Distancias de Mahalanobis entre grupos Distancias de Mahalanobis muestras- grupos Muestra Muestra Muestra

42 Aplicación del en las investigaciones con Chips de ADN

43

44 Los 0 Genes principales asociados a la respuesta a Imatinib Usando la prueba t de student #genename t-statistic pvalue R H AA AA R A AI AA T AA

45 Exploración de datos en la serie de entrenamiento (3 pacientes y 0 genes predictores)

46 Cluster jerárquico de los 3 pacientes

47 Componentes principales

48 ANALISIS DISCRIMINANTE Distancia de Mahalanobis al cuadrado

Introducción a las técnicas de Análisis Multivariante

Introducción a las técnicas de Análisis Multivariante Introducción a las técnicas de Análisis Multivariante Dagoberto Salgado Horta Universidad del Tolima Dagoberto Salgado Horta 1 Análisis multivariante Objetivo: estudio de varias variables simultáneamente:

Más detalles

RECONOCIMIENTO DE PAUTAS. ANÁLISIS DE CONGLOMERADOS (Cluster Analysis)

RECONOCIMIENTO DE PAUTAS. ANÁLISIS DE CONGLOMERADOS (Cluster Analysis) RECONOCIMIENTO DE PAUTAS ANÁLISIS DE CONGLOMERADOS (Cluster Analysis) Análisis de conglomerados los análisis exploratorios de datos (como PCA) determinan relaciones generales entre datos en ocasiones no

Más detalles

Análisis de Correlación Canónica y Análisis discriminante

Análisis de Correlación Canónica y Análisis discriminante Análisis de Correlación Canónica y Análisis discriminante Análisis de Regresión Múltiple TÉCNICAS DE DEPENDENCIA Variable/s Dependiente/s Variable/s Independiente/s Técnica 1 Nivel de medición Continuo

Más detalles

Introducción Clustering jerárquico Clustering particional Clustering probabilista Conclusiones. Clustering. Clasificación no supervisada

Introducción Clustering jerárquico Clustering particional Clustering probabilista Conclusiones. Clustering. Clasificación no supervisada Clustering Clasificación no supervisada Javier G. Sogo 10 de marzo de 2015 1 Introducción 2 Clustering jerárquico 3 Clustering particional 4 Clustering probabilista 5 Conclusiones Introducción Objetivos

Más detalles

Ordenación contrastante o directo. Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas?

Ordenación contrastante o directo. Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas? Ordenación contrastante o directo Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas? Ordenación contrastante o directa De análisis de gradiente indirecto a directo

Más detalles

Caso 17. Análisis multivariante: reducción de datos por componentes principales.

Caso 17. Análisis multivariante: reducción de datos por componentes principales. Caso 17: reducción por componentes principales 115 Caso 17. Análisis multivariante: reducción de datos por componentes principales. (JESÚS LÓPEZ FIDALGO, UCLM) CASO PRÁCTICO Se dispone de 15 variables

Más detalles

CLASIFICACIÓN PROBLEMA SOLUCIÓN

CLASIFICACIÓN PROBLEMA SOLUCIÓN Capítulo 7 Análisis Cluster CLASIFICACIÓN Asignar objetos en su lugar correspondiente dentro de un conjunto de categorías establecidas o no. PROBLEMA Dado un conjunto de m objetos (animales, plantas, minerales...),

Más detalles

Análisis de agrupamiento (Cluster nmds)

Análisis de agrupamiento (Cluster nmds) Análisis de agrupamiento (Cluster nmds) Agregación (Cluster) Conjunto de técnicas que intentan organizar la información de las unidades de muestreo (UM) en clases o grupos discretos Crea agrupaciones sobre

Más detalles

Capítulo 8. Análisis Discriminante

Capítulo 8. Análisis Discriminante Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables

Más detalles

Máster en Ordenación y Gestión del Desarrollo Territorial y Local. Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL

Máster en Ordenación y Gestión del Desarrollo Territorial y Local. Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL ANÁLISIS CLUSTERS C U R S O TÉCNICAS MULTIVARIANTES Prof. Dr. Ángel Luís LUCENDO MONEDERO 1 http://www.geografia.us.es/ Tema 2. INTRODUCCIÓN N AL ANÁLISIS CLUSTER 2.1 Consideraciones generales. Clasificación

Más detalles

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por

Más detalles

Estadística II Tema 1: Distribución normal multivariante

Estadística II Tema 1: Distribución normal multivariante Estadística II Tema 1: Distribución normal multivariante José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Algunas propiedades de los vectores aleatorios Sea X = (X 1,..., X

Más detalles

CARACTERÍSTICAS GRALES.

CARACTERÍSTICAS GRALES. Las técnicas estadísticas multivariadas permiten establecer, a partir de numerosos datos y variables, ciertas relaciones, investigar estructuras latentes y ensayar diversas maneras de organizar dichos

Más detalles

Análisis multivariante II

Análisis multivariante II Análisis multivariante II Tema 1: Introducción Pedro Galeano Departamento de Estadística Universidad Carlos III de Madrid pedro.galeano@uc3m.es Curso 2016/2017 Grado en Estadística y Empresa Pedro Galeano

Más detalles

Introducción al Análisis Multivariante

Introducción al Análisis Multivariante al Análisis Multivariante Vectores aleatorios, técnicas de análisis multivariante, distancias estadísticas Curso 2011-2012 Considero que el cerebro de cada cual es como una pequeña pieza vacía que vamos

Más detalles

Minería de Datos Web. Cursada 2018

Minería de Datos Web. Cursada 2018 Minería de Datos Web Cursada 2018 Proceso de Minería de Texto Clustering de Documentos Clasificación de Documentos Es un método supervisado para dividir documentos en base a categorías predefinidas Los

Más detalles

INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS

INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS Datos multivariantes Métodos modernos de análisis automático (métodos espectroscópicos o cromatográficos) permiten reunir grandes cantidades

Más detalles

Análisis Estadístico de Datos Climáticos. Análisis de agrupamiento (o clusters)

Análisis Estadístico de Datos Climáticos. Análisis de agrupamiento (o clusters) Análisis Estadístico de Datos Climáticos Análisis de agrupamiento (o clusters) A. Díaz - M. Bidegain M. Barreiro Facultad de Ciencias Facultad de Ingeniería 2011 Objetivo Idear una clasificación o esquema

Más detalles

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN 2009 Nombre de asignatura: ESTADÍSTICA ACTUARIAL III: ANÁLISIS MULTIVARIANTE DE DATOS Código: 603377 Materia: ESTADÍSTICA ACTUARIAL Módulo: ANÁLISIS DEL

Más detalles

ANÁLISIS DISCRIMINANTE

ANÁLISIS DISCRIMINANTE DEFINICIÓN: Cómo técnica de análisis de dependencia: Pone en marcha un modelo de causalidad en el que la variable endógena es una variable NO MÉTRICA y las independientes métricas. Cómo técnica de análisis

Más detalles

Tema 9. Análisis factorial discriminante

Tema 9. Análisis factorial discriminante Máster en Técnicas Estadísticas Análisis Multivariante. Año 2008 2009. Profesor: César Sánchez Sellero. 9.1. Introducción. Tema 9. Análisis factorial discriminante Supongamos que están denidos I grupos,

Más detalles

Análisis discriminante.

Análisis discriminante. Análisis discriminante. INTRODUCCIÓN Las técnicas de análisis discriminante se proponen la determinación de un criterio que nos permita decidir a qué grupo pertenece un cierto individuo, a partir de la

Más detalles

Aprendizaje No Supervisado

Aprendizaje No Supervisado Aprendizaje Automático Segundo Cuatrimestre de 2015 Aprendizaje No Supervisado Supervisado vs. No Supervisado Aprendizaje Supervisado Clasificación y regresión. Requiere instancias etiquetadas para entrenamiento.

Más detalles

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos

Más detalles

Curso de Postgrado en Herramientas Estadísticas Avanzadas: AGROPECUARIOS. Prof. Dr. José Perea Dpto. Producción Animal

Curso de Postgrado en Herramientas Estadísticas Avanzadas: AGROPECUARIOS. Prof. Dr. José Perea Dpto. Producción Animal Curso de Postgrado en Herramientas Estadísticas Avanzadas: ANÁLISIS MULTIVARIANTE PARA INVESTIGACIÓN EN SISTEMAS AGROPECUARIOS ANÁLISIS CLUSTER Prof. Dr. José Perea Dpto. Producción Animal ANÁLISIS DE

Más detalles

Tema 2 Datos multivariantes

Tema 2 Datos multivariantes Aurea Grané Máster en Estadística Universidade Pedagógica 1 Aurea Grané Máster en Estadística Universidade Pedagógica 2 Tema 2 Datos multivariantes 1 Matrices de datos 2 Datos multivariantes 2 Medias,

Más detalles

Análisis de Conglomerados

Análisis de Conglomerados Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis de Conglomerados (Cluster analysis) Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid Antecedente histórico Las

Más detalles

MINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE MODELIZACIÓN TÉCNICAS DE MINERÍA DE DATOS TÉCNICAS DE MINERÍA DE DATOS TÉCNICAS DE MINERÍA DE DATOS

MINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE MODELIZACIÓN TÉCNICAS DE MINERÍA DE DATOS TÉCNICAS DE MINERÍA DE DATOS TÉCNICAS DE MINERÍA DE DATOS MINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE TÉCNICAS DE MINERÍA DE DATOS TÉCNICAS DE MINERÍA DE DATOS..... MINERÍA DE DATOS - TÉCNICAS PREDICTIVAS DE 1 MINERÍA DE DATOS - TÉCNICAS PREDICTIVAS DE 2 TÉCNICAS

Más detalles

Discriminación entre grupos

Discriminación entre grupos Discriminación entre grupos Discriminación entre grupos Son los grupos significativamente diferentes? Multivariate Analysis of Variance (MANOVA) Multi-Response Permutation Procedures (MRPP) Analysis of

Más detalles

CLUSTERING. Bases de Datos Masivas

CLUSTERING. Bases de Datos Masivas 1 CLUSTERING Bases de Datos Masivas 2 Temas Qué es clustering? K-Means Clustering Hierarchical Clustering QUÉ ES CLUSTERING? 3 Aprendizaje Supervisado vs. No Supervisado 4 Aprendizaje Supervisado: tanto

Más detalles

LECCIÓN PÚBLICA. Tema 6 Descripción Multivariante de Datos. Profa. María Fátima Dos Santos

LECCIÓN PÚBLICA. Tema 6 Descripción Multivariante de Datos. Profa. María Fátima Dos Santos LECCIÓN PÚBLICA Tema 6 Descripción Multivariante de Datos Profa. María Fátima Dos Santos 1 TEMARIO Análisis Multivariados. Clasificación ACP. Organización de los Datos ACP. Componentes, variabilidad explicada

Más detalles

Prof. Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada

Prof. Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Clustering Análisis de segmentación Prof. Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International

Más detalles

1. Análisis de Conglomerados

1. Análisis de Conglomerados 1. Análisis de Conglomerados El objetivo de este análisis es formar grupos de observaciones, de manera que todas las unidades en un grupo sean similares entre ellas pero que sean diferentes a aquellas

Más detalles

TÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE

TÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE TEMA 8 TÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 8.1.La inferencia estadística: del análisis univariante al análisis multivariante. 8.2.La reducción de la dimensionalidad: el análisis

Más detalles

ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS)

ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS) ANÁLISIS DE CONGLOMERADOS (CLUSTER ANALYSIS) AGRUPAMIENTOS Cuál agrupamiento es mejor? MÉTODOS DE AGRUPACIÓN Métodos jerárquicos: Los objetos se agrupan (dividen) i por partes hasta clasificar todos los

Más detalles

GUIÓN TEMA 2. PROPIEDADES DE LOS ESTIMADORES MCO 2.1 PROPIEDADES ESTADÍSTICAS DEL ES- TIMADOR MCO DE.

GUIÓN TEMA 2. PROPIEDADES DE LOS ESTIMADORES MCO 2.1 PROPIEDADES ESTADÍSTICAS DEL ES- TIMADOR MCO DE. ECONOMETRIA I. Departamento de Fundamentos del Análisis Económico Universidad de Alicante. Curso 011/1 GUIÓN TEMA. PROPIEDADES DE LOS ESTIMADORES MCO Bibliografía apartados.1,. y.3: Greene, 6.6.1, 6.6.3

Más detalles

Sistemas de Percepción Visión por Computador

Sistemas de Percepción Visión por Computador Nota: Algunas de las imágenes que aparecen en esta presentación provienen del libro: Visión por Computador: fundamentos y métodos. Arturo de la Escalera Hueso. Prentice Hall. Sistemas de Percepción Visión

Más detalles

5.3. Análisis discriminante Cuándo tenemos que utilizar el análisis discriminante

5.3. Análisis discriminante Cuándo tenemos que utilizar el análisis discriminante FUOC P01/71039/00748 119 Investigación descriptiva: análisis de información 5.3. Análisis discriminante 5.3.1. Cuándo tenemos que utilizar el análisis discriminante Para resolver muchos problemas de marketing,

Más detalles

INDICE Capitulo 1. Entorno de Trabajo e SPSS Capitulo 2. Operadores y Funciones. Aplicaciones

INDICE Capitulo 1. Entorno de Trabajo e SPSS Capitulo 2. Operadores y Funciones. Aplicaciones INDICE Introducción XV Capitulo 1. Entorno de Trabajo e SPSS 1 Introducción y manejo de datos en SPSS 1 Lectura e importación de datos SPSS 6 Importación de datos de hoja de cálculo 8 Importación de archivos

Más detalles

Indice

Indice Índice Prólogo.... 15 Capítulo 1. Preliminares... 17 1.1. Introducción............................. 17 1.2. Nombres nuevos para conocidos métodos clásicos........ 17 1.3. *Algunos elementos matemáticos

Más detalles

Tema 3: Análisis multivariante para la agrupación. Objetivo: Encontrar los grupos naturales en los que se divide la población.

Tema 3: Análisis multivariante para la agrupación. Objetivo: Encontrar los grupos naturales en los que se divide la población. Tema 3: Análisis multivariante para la agrupación Objetivo: Encontrar los grupos naturales en los que se divide la población. Ejemplo canónico en Biologia: Taxonomía Rosa doméstica Reino: Plantae (Plantas)

Más detalles

Plan de análisis de datos para la investigación cuantitativa

Plan de análisis de datos para la investigación cuantitativa Plan de análisis de datos para la investigación cuantitativa Oscar Federico Nave Herrera Coordinador del Programa de Asesoría Estadística para Investigación Explicación tentativa del fenómeno a investigar

Más detalles

ANÁLISIS DE COMPONENTES PRINCIPALES

ANÁLISIS DE COMPONENTES PRINCIPALES ANÁLISIS DE COMPONENTES PRINCIPALES INTRODUCCIÓN El objetivo principal de la mayoría de las técnicas numéricas de análisis multivariado, es reducir la dimensión de nuestros datos. Por supuesto, si esta

Más detalles

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre

Más detalles

La práctica del análisis de correspondencias

La práctica del análisis de correspondencias La práctica del análisis de correspondencias MICHAEL GREENACRE Catedrático de Estadística en la Universidad Pompeu Fabra Separata del apéndice D Glosario de términos Primera edición: julio 2008 ISBN: 978-84-96515-71-0

Más detalles

Clasicación Automática de Documentos

Clasicación Automática de Documentos Clasicación Automática de Documentos Carlos G. Figuerola, José Luis Alonso Berrocal, Angel F. Zazo Universidad de Salamanca Grupo REINA http://reina.usal.es Carlos G. Figuerola (Grupo REINA) Clasicación

Más detalles

ANÁLISIS DISCRIMINANTE (AD)

ANÁLISIS DISCRIMINANTE (AD) discrim_predictivo.doc 30//05 vgg ANÁLISIS DISCRIMINANTE (AD) Regresión con respuesta categórica Y Cómo depende Y de las variables X, X,... X p? cualitativa cuantitativas Planteamiento Predictivo del AD:

Más detalles

TÉCNICAS MULTIVARIANTES

TÉCNICAS MULTIVARIANTES Máster en Ordenación y Gestión del Desarrollo Territorial y Local Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL CURSO TÉCNICAS MULTIVARIANTES Prof. Dr. Rosa Jordá Borrell

Más detalles

ESTADÍSTICA CÁTEDRA I. Unidad 7

ESTADÍSTICA CÁTEDRA I. Unidad 7 ESTADÍSTICA CÁTEDRA I Unidad 7 UNIDAD 7: La relación entre variables. Contenidos Distribución conjunta de dos variables. Diagrama de dispersión. Distribuciones marginales y condicionales. Correlación.

Más detalles

Clustering: Algoritmos

Clustering: Algoritmos Clustering: Algoritmos Clasificación no supervisada Javier G. Sogo 10 de marzo de 2015 1 Introducción 2 Algoritmo: K-medias 3 Algoritmo: BFR 4 Algoritmo: CURE Introducción Acotar el problema Complejidad

Más detalles

TEMA I CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES

TEMA I CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES TEMA I CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES LECTURA OBLIGATORIA Algunas cuestiones previas. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en

Más detalles

Taller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO. Juan León Jara Almonte GRADE

Taller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO. Juan León Jara Almonte GRADE Taller Metodológico: CONCEPTOS Y FUNDAMENTOS BÁSICOS EN ANÁLISIS ESTADÍSTICO DESCRIPTIVO Juan León Jara Almonte GRADE Por qué hacer análisis descriptivo? Qué hacer con estos datos? ESTADISTICA DESCRIPTIVA

Más detalles

INDICE. 81 Operadores lógicos Funciones exponenciales y logarítmicas Funciones trigonométricas

INDICE. 81 Operadores lógicos Funciones exponenciales y logarítmicas Funciones trigonométricas INDICE Introducción XV Capitulo 1. Instalación y primeros pasos en SPSS 10 Instalación de SPSS 10 1 Comenzando con SPSS 10 8 El trabajo de trabajo de SPSS 10 9 Opciones de a barra de menú principal 10

Más detalles

Guía docente 2007/2008

Guía docente 2007/2008 Guía docente 2007/2008 Plan 247 Lic.Investigación y Tec.Mercado Asignatura 43579 METODOS CUANTITATIVOS PARA LA INVESTIGACION DE MERCADOS Grupo 1 Presentación Métodos y técnicas cuantitativas de investigación

Más detalles

APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU. Luis Azaña Bocanegra

APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU. Luis Azaña Bocanegra APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU Luis Azaña Bocanegra TEMARIO CONCEPTOS DEFINICION DE MINERIA DE DATOS USOS DE LA MINERIA DE DATOS TECNICAS DE MINERIA DE DATOS ETAPAS DE UN PROYECTO DE

Más detalles

BLOQUE III. ANÁLISIS MULTIVARIANTE

BLOQUE III. ANÁLISIS MULTIVARIANTE BLOQUE III. ANÁLISIS MULTIVARIANTE CAPÍTULO 7 Teoría sobre análisis multivariante. El análisis multivariante engloba un grupo de técnicas o métodos estadísticos cuya finalidad es analizar simultáneamente

Más detalles

(PCA) Análisis de Componentes Principales

(PCA) Análisis de Componentes Principales PCA Pricipal Component Analysis Técnica multivariante que trata de reducir el número de variables originales (X1, X2,...,Xn) a un número menor de variables (CP1, CP2,...,CPp), denominadas componentes principales

Más detalles

Análisis de Correspondencias Simple

Análisis de Correspondencias Simple 1 Capítulo 4 Análisis de Correspondencias Simple 41 INTRODUCCIÓN El Análisis de Correspondencias Simple permite describir las relaciones entre dos variables categóricas dispuestas en una tabla de contingencia

Más detalles

Caso 102 : Explorando presiones arteriales en pacientes

Caso 102 : Explorando presiones arteriales en pacientes Caso 102 : Comparando presiones arteriales en pacientes 1 Caso 102 : Explorando presiones arteriales en pacientes (Exploración de datos: Análisis exhaustivo de una matriz )(F.J. Burguillo, USAL) Caso práctico

Más detalles

Espacios Vectoriales Euclídeos. Métodos de los mínimos cuadrados

Espacios Vectoriales Euclídeos. Métodos de los mínimos cuadrados Capítulo 5 Espacios Vectoriales Euclídeos. Métodos de los mínimos cuadrados En este tema iniciamos el estudio de los conceptos geométricos de distancia y perpendicularidad en K n. Empezaremos con las definiciones

Más detalles

PROCESO DE PREPARACIÓN DE DATOS

PROCESO DE PREPARACIÓN DE DATOS Partes incompletas Funcionamiento de los cuestionarios Incomprensión Entrega tardía Persona incorrecta PROCESO DE PREPARACIÓN DE DATOS FUENTE: Malhotra, N pag. 426 y sgtes Edición Codificación Trascripción

Más detalles

Tema 2: Análisis Discriminante

Tema 2: Análisis Discriminante Tema 2: Análisis Discriminante P 1 P 2 Problema de clasificación: Ténemos observaciones que corresponden a 2 grupos P_1, P_2. Si nos dan uno nuevo x_0 a que grupo pertenece? Guión 1. Motivación 2. Clasificación

Más detalles

NOTAS DE ESTUDIO DE ÁLGEBRA LINEAL M.C. MARCOS CAMPOS NAVA TEC DE ATITALAQUIA

NOTAS DE ESTUDIO DE ÁLGEBRA LINEAL M.C. MARCOS CAMPOS NAVA TEC DE ATITALAQUIA Hasta ahora se han discutido algunas de las propiedades de objetos matemáticos llamados matrices. Un caso de especial interés son las matrices cuadradas, por ejemplo: Se sabe que esta matriz es invertible

Más detalles

Lucila Finkel Temario

Lucila Finkel Temario Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión

Más detalles

Figura 4.1. Fases en el método hipotético-deductivo

Figura 4.1. Fases en el método hipotético-deductivo NIVEL EMPÍRICO NIVEL TEÓRICO OBSERVACIÓN ORGANIZACIÓN DE DATOS INDUCCIÓN DEDUCCIÓN VERIFICACIÓN DE HIPÓTESIS ELABORACIÓN DE LEYES Y TEORÍAS Figura 4.1. Fases en el método hipotético-deductivo Técnica Q

Más detalles

INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS

INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO RECONOCIMIENTO DE PAUTAS Individuals vary, but percentages remain constant. So says the statistician. Sherlock Holmes en The Sign of Four Datos multivariantes Métodos

Más detalles

Componentes principales (II)

Componentes principales (II) Componentes principales (II) Eliseo Martínez Herrera 1. Propiedades de los componentes Los componentes principales tienen las siguientes propiedades: 1 La suma de las varianzas de los componentes es igual

Más detalles

Asignatura: Metodologías de investigación. Tema 6. Exploración de datos. Exploración de datos

Asignatura: Metodologías de investigación. Tema 6. Exploración de datos. Exploración de datos Asignatura: Metodologías de investigación Tema 6 Etapas de una investigación Análisis : tests estadísticos, ajuste de curvas, análisis multivariante Obtención datos, calibrados, etc. Diseño del experimento

Más detalles

Matrices y Sistemas de Ecuaciones lineales

Matrices y Sistemas de Ecuaciones lineales Matrices y Sistemas de Ecuaciones lineales Llamaremos M m n (K) al conjunto de las matrices A = (a ij ) (i = 1, 2,..., m; j = 1, 2,..., n) donde los elementos a ij pertenecen a un cuerpo K. Las matrices,

Más detalles

Itinerario del Curso. Análisis de Datos Multivariados para Ciencias Ambientales. Semana 1. Lunes 23 de mayo de Miércoles 25 de mayo de 2016

Itinerario del Curso. Análisis de Datos Multivariados para Ciencias Ambientales. Semana 1. Lunes 23 de mayo de Miércoles 25 de mayo de 2016 Semana 1 Lunes 23 de mayo de 2016 8:30am - 9:00am 9:00am - 10:30am Bienvenida / Introducción Medidas de asociación para muestras biológicos-ambientales con estructura multivariada 11:15am - 12:45pm Laboratorio:

Más detalles

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos TEMA 10 (curso anterior): REGRESIÓN Y CORRELACIÓN 1 Conceptos de Regresión y Correlación 2 Variables aleatorias bidimensionales 3 Ajuste de una recta a una nube de puntos 4 El modelo de la correlación

Más detalles

PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI

PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI 2014 Para qué es útil la estadística inferencial? Se utiliza para probar hipótesis y generalizar los resultados obtenidos en la muestra a la población o universo.

Más detalles

Diseño de experimentos

Diseño de experimentos Diseño de experimentos Quimiometría Por qué diseñar experimentos? Exploración: cuáles factores son importantes para realizar exitosamente un proceso Optimización: cómo mejorar un proceso Ahorro de tiempo:

Más detalles

Prueba de Septiembre 2012/13

Prueba de Septiembre 2012/13 Contenidos 1º Bach. Matemáticas Aplicadas a las C. Sociales I Prueba de Septiembre 2012/13 Aritmética y Álgebra. - El número real. La recta real. - El número irracional. Ejemplos de especial interés, 2,.

Más detalles

Repaso de conceptos de álgebra lineal

Repaso de conceptos de álgebra lineal MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Repaso

Más detalles

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Regresión múltiple. Demostraciones. Elisa Mª Molanes López Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +

Más detalles

RECONOCIMIENTO DE PAUTAS

RECONOCIMIENTO DE PAUTAS RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes

Más detalles

Análisis Global y Local. UCR ECCI CI-2414 Recuperación de Información Prof. Kryscia Daviana Ramírez Benavides

Análisis Global y Local. UCR ECCI CI-2414 Recuperación de Información Prof. Kryscia Daviana Ramírez Benavides UCR ECCI CI-2414 Recuperación de Información Prof. Kryscia Daiana Ramírez Benaides Análisis Global Realiza la expansión basado en la construcción de tesauros utilizando la colección completa de documentos

Más detalles

Análisis multivariante II

Análisis multivariante II Análisis multivariante II Tema 2: Análisis de conglomerados Pedro Galeano Departamento de Estadística Universidad Carlos III de Madrid pedro.galeano@uc3m.es Curso 2016/2017 Grado en Estadística y Empresa

Más detalles

Prof. Dra. Silvia Schiaffino ISISTAN

Prof. Dra. Silvia Schiaffino ISISTAN Clustering ISISTAN sschia@ea.unicen.edu.ar Clustering: Concepto Cluster: un número de cosas o personas similares o cercanas, agrupadas Clustering: es el proceso de particionar un conjunto de objetos (datos)

Más detalles

Práctica 3: Regresión simple con R

Práctica 3: Regresión simple con R Estadística II Curso 2010/2011 Licenciatura en Matemáticas Práctica 3: Regresión simple con R 1. El fichero de datos Vamos a trabajar con el fichero salinity que se encuentra en el paquete boot. Para cargar

Más detalles

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur

Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur Aprendizaje de distancias Kilian Q. Weinberger, Lawrence K. Saul: Distance Metric Learning for Large Margin

Más detalles

AMD - Análisis Multivariante de Datos

AMD - Análisis Multivariante de Datos Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2016 200 - FME - Facultad de Matemáticas y Estadística 1004 - UB - Universitat de Barcelona 715 - EIO - Departamento de Estadística

Más detalles

TALLER DE ANÁLISIS MULTIVARIABLE TÉCNICA DE COMPONENTES PRINCIPALES SEPTIEMBRE DE 2012

TALLER DE ANÁLISIS MULTIVARIABLE TÉCNICA DE COMPONENTES PRINCIPALES SEPTIEMBRE DE 2012 TALLER DE ANÁLISIS MULTIVARIABLE TÉCNICA DE COMPONENTES PRINCIPALES SEPTIEMBRE DE 2012 INSTITUTO DE INFORMACIÓN E INVESTIGACIÓN GEOGRÁFICA, ESTADÍSTICA Y CATASTRAL DEL ESTADO DE MÉXICO ANÁLISIS MULTIVARIABLE

Más detalles

Ecología de Paisaje y Regiones Tema 16. Principios de estadística multivariada y su aplicación a ecología del paisaje.

Ecología de Paisaje y Regiones Tema 16. Principios de estadística multivariada y su aplicación a ecología del paisaje. Ecología de Paisaje y Regiones Tema 16. Principios de estadística multivariada y su aplicación a ecología del paisaje. Mercedes Rougès 16.1.Principios de estadística multivariada La estadística multivariada

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 34 Álgebra matricial y vectores aleatorios Una matriz es un arreglo

Más detalles

MODELO VAR ARGENTINA

MODELO VAR ARGENTINA MODELO VAR ARGENTINA 1.-INTRODUCCIÓN Argentina es una de las economías más grandes de América Latina. En los últimos años, Argentina priorizó promover un desarrollo económico con inclusión social. El país

Más detalles

Objetivo. variables factores F Principios básicos. Parsimonia Interpretabilidad

Objetivo. variables factores F Principios básicos. Parsimonia Interpretabilidad ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los factores 5. Puntuaciones factoriales 6. Caso práctico Introducció Objetivo. Resumir

Más detalles

Reconocimiento de Formas

Reconocimiento de Formas Reconocimiento de Formas Técnicas no Supervisadas: clustering José Martínez Sotoca Objetivo: Estudio de la estructura de un conjunto de datos, división en agrupaciones. Características: Homogeneidad o

Más detalles

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA CLUSTERING

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA CLUSTERING TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA CLUSTERING Mario de J. Pérez Jiménez Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Más detalles

MINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE MODELIZACIÓN

MINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE MODELIZACIÓN MINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE MODELIZACIÓN TÉCNICAS DE MINERÍA DE DATOS. TÉCNICAS PREDICTIVAS PARA LA MODELIZACIÓN. MODELO DE REGRESIÓN MÚLTIPLE. MODELOS DE ELECCIÓN DISCRETA. CLASIFICACIÓN

Más detalles

ALN - SVD. In. Co. Facultad de Ingeniería Universidad de la República

ALN - SVD. In. Co. Facultad de Ingeniería Universidad de la República ALN - SVD In. Co. Facultad de Ingeniería Universidad de la República Índice Definición Propiedades de SVD Ejemplo de SVD Métodos para calcular SVD Aplicaciones de SVD Repaso de matrices: m xm Una matriz

Más detalles

TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA

TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA LECTURA OBLIGATORIA Regresión Logística. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en Ciencias de la Salud. Coruña: Netbiblo. Páginas

Más detalles

Clase 8 Matrices Álgebra Lineal

Clase 8 Matrices Álgebra Lineal Clase 8 Matrices Álgebra Lineal Código Escuela de Matemáticas - Facultad de Ciencias Universidad Nacional de Colombia Matrices Definición Una matriz es un arreglo rectangular de números denominados entradas

Más detalles

Tema 3 Normalidad multivariante

Tema 3 Normalidad multivariante Aurea Grané Máster en Estadística Universidade Pedagógica Aurea Grané Máster en Estadística Universidade Pedagógica Tema 3 Normalidad multivariante 3 Normalidad multivariante Distribuciones de probabilidad

Más detalles

Caso 201 : Recta de calibrado para análisis de fosfato (Regresión lineal sin pesos estadísticos) (F. J. Burguillo, USAL)

Caso 201 : Recta de calibrado para análisis de fosfato (Regresión lineal sin pesos estadísticos) (F. J. Burguillo, USAL) Caso 201: Recta de Calibrado para fosfato 1 Caso 201 : Recta de calibrado para análisis de fosfato (Regresión lineal sin pesos estadísticos) (F. J. Burguillo, USAL) CASO PRÁCTICO Uno de los procedimientos

Más detalles

Introducción al Procesamiento de Imágenes Satelitales con Software Libre. Módulo 03

Introducción al Procesamiento de Imágenes Satelitales con Software Libre. Módulo 03 Introducción al Procesamiento de Imágenes Satelitales con Software Libre Módulo 03 Dirección de Formación de Capital Humano Especializado en el Campo Espacial Agencia Espacial Mexicana www.gob.mx/aem Plan

Más detalles

MODELADO CALIBRACIÓN MULTIVARIADA

MODELADO CALIBRACIÓN MULTIVARIADA MODELADO CALIBRACIÓN MULTIVARIADA Calibración multivariada aproximaciones multivariadas para crear una curva de calibración: regresión clásica u ordinaria (classical/ordinary least squares, CLS) regresión

Más detalles

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento. UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre

Más detalles

ANÁLISIS DE COMPONENTES PRINCIPALES

ANÁLISIS DE COMPONENTES PRINCIPALES ANÁLISIS DE COMPONENTES PRINCIPALES INTRODUCCIÓN El objetivo principal de la mayoría de las técnicas numéricas de análisis multivariado, es reducir la dimensión de nuestros datos. Por supuesto, si esta

Más detalles