Discriminación entre grupos
|
|
- María Concepción Morales Cruz
- hace 5 años
- Vistas:
Transcripción
1 Discriminación entre grupos
2 Discriminación entre grupos Son los grupos significativamente diferentes? Multivariate Analysis of Variance (MANOVA) Multi-Response Permutation Procedures (MRPP) Analysis of Group Similarities (ANOSIM) Mantel s Test (MANTEL) Cómo diferenciar los grupos? Cuáles variables distinguen mejor a los grupos? Análisis Discriminante (AD) Classification and Regression Trees (CART) Regresión logística (RL) Análisis de especies indicadora (ISA)
3 Ejemplo 1: En un estudio del estadístico y genetista Sir Ronald A. Fisher se utilizaron cuatro características de los sépalos y pétalos para identificar 150 lirios de las especies iris setosa, iris versicolor e iris virginica. En este problema encontramos que hay tres grupos, lo que dificulta la utilización del método de Fisher. Tendremos que combinar dos reglas para clasificar la especie de nuevos ejemplares de lirios
4 Ejemplo 2. esclerosis múltiple:
5 Características importantes del análisis discriminante Opera sobre conjuntos de datos para los cuales hay grupos datos predefinidos Se evalúan relaciones dependientes entre un conjunto de variables discriminantes y una variable agrupadora para intentar definir la relación entre variables independientes y dependientes. Predice la pertenencia de grupo en muestras futuras, muestras de grupos desconocidos sobre la base de las características de clasificación.
6 Características importantes del análisis discriminante Extrae gradientes subyacentes dominantes de variación (funciones canónicas) entre grupos de entidades muestreales (ej, especies, sitios, observaciones) de una cjto de observaciones multivariadas, tal que la variación entre grupos es maximizada y variación dentro grupos es minimizada a lo largo del gradiente. Reduce la dimensionalidad de cjto de datos multivariados de las variables originales en un cjto menor de dimensiones compuestas (funciones canónicas) con mínima pérdida de información.
7 Analogía con regresión y ANAVA Extensión de regresión: Una combinación lineal de medidas de dos o más variables independientes (y usualmente continuas) que se utiliza para describir o predecir el comportamiento de una variable dependiente categórica simple. la situación de investigación define las categorías de grupo como dependientes sobre las variables discriminantes. Las muestras representan una muestra aleatoria simple (N) de una mezcla de dos o más poblaciones distintivas (por ej, grupos). Una muestra simple es graficada en la cual el miembro grupal es desconocido a priori al muestrear.
8 Analogía con regresión y ANAVA Extensión ANAVA: La variable independiente es categórica y define a los miembros del grupo (típicamente controlado por el diseño experimental) y poblaciones (por ej., grupos) son comparados al vector de medidas de dos o más variables dependientes (y usualmente continuas). Cada situación de investigación define las variables discriminantes que dependen de los grupos. Las muestras representan muestras aleatorias separadas independientes (N1, N2,..., NG) de dos o más poblaciones distintivas (por ej, grupos). Cada miembro grupal es conocido a priori al muestrear y las muestras están graficadas para cada población separadamente.
9 Análisis canónico de discriminación (ACD) ACD testea y describe las relaciones entre dos o más grupos de entidades basadas sobre un cjto de dos o más variables discriminativas (identificar los bordes entre grupos de entidades). ACD involucra derivar combinaciones lineales (funciones canónicas) de dos o más variables discrminativas que discriminen mejor entre los grupos definidos a priori (maximizar el cociente F). Cada entidad de muestreo tiene una puntuación canónica compuesta sobre cada eje y los centroides grupales que indican la mayor localización típica de cada entidad de un grupo particular. Se espera la separación significativa de grupos y maximizar la interpretación ecológica de los ejes..
10 Análisis discriminante El proceso analítico Conjunto de datos Supuestos Requerimientos de tamaño de la muestra derivación de las funciones canónicas Evaluación de la importancia de las funciones canónicas. Interpretación de las funciones canónicas. Validación de las funciones canónicas.
11 Análisis discriminante: cjto de los datos Una variable agrupadora categórica y dos o más variables discriminantes de conteo y /o categóricas, contínuas. Variables de conteo, categóricas, contínua (preferentemente todas contínuas). Grupos de muestras deberían ser mutuamente excluyentes. Sin datos perdidos. Tamaño muestreal grupal necesita ser el mismo. Mínimo de dos muestras por grupo y al menos dos o más muestras que la cantidad de variables.
12 Análisis discriminante: Conjunto de datos Datos ecológicos en dos vías: Especies por ambiente Presencia/ausencia de especies por ambiente. Comportamiento por ambiente estado de vida/sexo por ambiente/comportamiento grupos de suelo por ambiente. Demos de cría por morfología.
13 Clasificación en Discriminante Métodos Paramétricos: Criterio de validación cuando cada grupo es normal multivariado Fisher s linear discriminant functions: Deriva una combinación lineal de las variables originales para cada grupo y clasifica la muestra en un grupo con mayor puntuación. Distancia Mahalanobis (Quadratic discriminant analysis): Medida de distancia en un espacio multidimensional de cada entidad a cada grupo de centroide y clasifica cada entidad en el grupo más cerrado. distancia Canonica: Computa las puntuaciones para cada entidad primero y luego clasifica cda entidad dentro del grupo con más cerrado puntuación canónica (centroide).
14 Visión geométrica del análisis discriminante Los ejes canónicos son derivados para maximizar la separación de los tres grupos.
15 Análisis discriminante Dos lados del mismo punto Análisis canónico de discriminación: Provee un test (MANAVA) de diferencias grupales y simultáneamente describe como los grupos difieren, esto es, cuales variables mejor cuantifican las diferencias grupales. Clasíficación Provee una clasificación de muestras en grupos, la cual vuelve a describir como está bien clasificado el miembro del grupo y pueda ser predicho. La función de clasificación puede ser usada para predecir miembros grupales de muestras adicionales para la cual el miembro del grupo es desconocido.
16 ENFOQUE DE FISHER: encontrar una buena función discriminante que sea una combinación lineal de las variables originales. Cuando aplicamos la función a un dato nuevo nos dice a que grupo pertenece. Geométricamente: Se busca una buena dirección sobre la que proyectar los datos de los grupos conocidos y de los que queremos clasificar. Se clasifica en función de qué grupo está más cerca en esa dirección. Una buena dirección tiene que: Separar bien las medias Teniendo en cuenta la variabilidad El nuevo dato se clasifica dentro del grupo con la media más próxima en la proyección
17
18 REGLA DE FISHER para Dos grupos con matrices de covarianzas iguales (Σ1=Σ2) Buscamos una buena función/combinación lineal de las variables originales/dirección sobre la que proyectar los datos: f(x)=a 1 x 1 + +a p x p al proyectar los datos Maximizar la variabilidad entre grupos Minimizar la variabilidad dentro del grupo Encontrar la solución a Función canónica discriminante
19
20
21 Ejemplo de esclerosis múltiple:
22 Regla de clasificación: clasificamos a xo como individuo sano si:
23
24 Ejemplo: esclerosis múltiple Función canónica discriminante
25 Ejemplo: esclerosis múltiple Puntuación canónica discriminante
26 Ejemplo: esclerosis múltiple
27 Cómo evaluar si la clasificación es buena? La clasificación será buena si: 1. Aplicamos una buena regla 2. Las variables son buenas, separan claramente a los individuos de los distintos grupos
28 Diremos que una REGLA DE CLASIFICACIÓN es ÓPTIMA cuando comete el menor número de errores posibles en la clasificación El método de clasificación de FISHER es ÓPTIMO cuando: 1. La distribución de los datos es NORMAL 2. Las matrices de covarianzas son iguales en los dos grupos
29 Tasa de error aparente: Se aplica la regla para clasificar todos los datos de la muestra de entrenamiento y se cuentan los casos en los que la clasificación es errónea. Tasa de error aparente = Datos mal clasificados/ Tamaño de la muestra Con la muestra de entrenamiento hemos construido la regla de clasificación y ahora comprobamos cuantos datos de la muestra de entrenamiento se clasifican mal. El 95,7% de los SANOS (PACIENTE=0) se clasifica correctamente, 66 de 69 El 75,9% de los ENFERMOS (PACIENTE=1) se clasifican correctamente, 22 de 29 Tasa de error aparente = (3+7) / 98 = 10 2%
30 Tasa de frecuencia relativa de error: Se divide la muestra de entrenamiento en dos partes, con una se construye la regla y con la otra se calcula la tasa como la proporción de estos datos que están mal clasificados (no la calcula el SPSS). Se pierde mucha información en el cálculo de la regla. Es INEFICIENTE Tasa de error por validación cruzada (jackknife): Se lleva al extremo la idea de la tasa de frecuencia relativa de error. Dato a dato: 1. Se excluye el dato 2. Se construye la regla con los restantes 3. Se clasifica el que hemos dejado fuera La probabilidad de error se estima como la proporción de veces que al excluir un dato, éste se clasifica mal. Es menos optimista que la tasa de error aparente y más eficiente que la tasa de frecuencia relativa de error.
31 Tasa de error aparente = (3+7) / 98 = 10,2% Tasa de error por validación cruzada = (5+8) / 98 = 13 26%
32 AD: supuestos Uso descriptivo de AD no requiere supuestos. Sin embargo, la eficacia de AD depende sobre que bien ciertos supuestos. Uso inferencial de AD requiere de supuestos: Evidencia de que algunos de aquellos supuestos pueden ser violados sin grandes cambios en los correctos resultados de clasificación. Cuanto más grande es el tamaño muestreal más robusto el análisis de los supuestos.
33 AD: supuestos 1. Matrices de igualdad de varianza/covarianza (homogeneidad) El AD asume que los grupos tienen igual dispersión (por ej., la estructura dentro del grupo de varianza/covarianza es la misma para todos los grupos. Varianzas de las variables discriminantes debería ser la misma en las poblaciones respectivas.
34 AD: supuestos Consecuencias de las distribuciones multivariadas no normales (asociada a heterogeneidad de varianzas) Tests de significancia inválidos Distorsiona las probabilidades a posteriori de miembro grupal (no necesariamente minimiza la cantidad de mal clasificados). EN múltiple CAD, segundo y subsecuente ejes canónicos no son estrictamente independientes (ortogonal). Las últimas funciones canónicas ( asociadas con eigenvalues más pequeños) a menudo se parecerán a las funciones anteriores pero con cargas canónicas más pequeñas.
35 AD: supuestos Diagnosis multicolinealidad correlaciones de a pares DA es afectada por multicolinealidad, que se refiere a dependencias múltiples lineales (altas correlaciones) entre variables del cjto de datos. Luego de calcular todas las correlaciones de a pares los valores r>0.7 sugieren potenciales problemas de multicolinealidad y es necesario extraer una del par de variables.
36 AD: supuestos Linealidad Variables cambian linealmente a lo largo de gradientes subyacentes y sus relaciones se combinan en una forma lineal para crear las funciones canónicas.
37 AD: supuestos Consecuencias de la nolinealidad Patrones no lineales reales no serán detectados a menos que se hagan transformaciones no lineales que pueden ser aplicados al modelo tales que las relaciones tengan una rutina computacional lineal.
38 AD: supuestos Diagnosis de linealidad diagramas de dispersión de variables discrminantes. Luego diagramas de dispersión de funciones canónicas.
39 AD: consideraciones acerca de tamaño de muestra Reglas generales Mínimo de al menos dos o más muestras (filas) que variables (columnas) Mínimo de las menos dos muestras (filas) por grupo. Las muestras para cada grupo deben asegurarse de tal manera que se estimen con precisión las medias y dispersiones. Cada grupo, n (3 *P)
40 Derivando las funciones canónicas Stepwise Criteria Wilks s Lambda El procedimiento de Wilks's Lambda selecciona la variable a cada paso que minimice el estadístico total Wilks' lamda dado con un criterio de F. Wilks Lambda (estadìstico de diferenciación). Lambda se aproxima a cero si dos grupos están bien separados.
41 Derivación de las funciones canónicas Eigenvalues y Eigenvectors Perspectiva geométrica: Eigenvalues igual al cociente entre las desviaciones estándar entre y dentro del grupo sobre las variables discriminantes lineales las cuales son definidas como eigenvectors
42 Limitaciones del análisis discriminante Supuestos parámetricos (normalidad multivariada, igualdad de matrices covarianza) y supuesto de linealidad son particulares y si no se cumplen se reduce la efectividad de AD cuando la estructura de los datos grupales es compleja. Otros procedimientos (por ej. CART) pueden mejorar bajo aquellas condiciones..
43 Salida de Infostat
44 Salida de infostat. Archivo IRIS
45 Salida de infostat. Archivo IRIS
Análisis de Gradiente Ambiental: Ordenación sin contrastar
Análisis de Gradiente Ambiental: Ordenación sin contrastar Ordenación sin contrastar Características importantes de las técnicas ordenación no contrastantes Una familia de técnicas con objetivos similares.
Más detallesTema 2: Análisis Discriminante
Tema 2: Análisis Discriminante P 1 P 2 Problema de clasificación: Ténemos observaciones que corresponden a 2 grupos P_1, P_2. Si nos dan uno nuevo x_0 a que grupo pertenece? Guión 1. Motivación 2. Clasificación
Más detallesAnálisis de Correlación Canónica y Análisis discriminante
Análisis de Correlación Canónica y Análisis discriminante Análisis de Regresión Múltiple TÉCNICAS DE DEPENDENCIA Variable/s Dependiente/s Variable/s Independiente/s Técnica 1 Nivel de medición Continuo
Más detallesOrdenación contrastante o directo. Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas?
Ordenación contrastante o directo Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas? Ordenación contrastante o directa De análisis de gradiente indirecto a directo
Más detallesPruebas estadís,cas para evaluar relaciones
Pruebas estadís,cas para evaluar relaciones Asociación entre dos variables categóricas Hipótesis: frecuencias de ocurrencias en las categorías de una variable son independientes de los frecuencias en la
Más detallesRECONOCIMIENTO DE PAUTAS
RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes
Más detallesCapítulo 8. Análisis Discriminante
Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables
Más detallesMÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría
Más detallesUniversidad Autónoma de Sinaloa
Séptima Edición del Diplomado en Estadística Mc. José V. Jiménez Ramírez Director de la Escuela de Ciencias Fisico-Matemáticas Tel. : 7 16 11 54 vidaljr@uas.uasnet.mx Dr. René Castro Montoya Coordinador
Más detallesConjunto de datos multivariados Matriz de datos de doble entrada
Conjunto de datos multivariados Matriz de datos de doble entrada Fuentes - Applied Multivariate Statistics for Ecology and Conservation Course website: http://www.umass.edu/landeco/teaching/multivariate/multivariate.html
Más detallesEstadística II Tema 1: Distribución normal multivariante
Estadística II Tema 1: Distribución normal multivariante José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Algunas propiedades de los vectores aleatorios Sea X = (X 1,..., X
Más detallesAnálisis discriminante.
Análisis discriminante. INTRODUCCIÓN Las técnicas de análisis discriminante se proponen la determinación de un criterio que nos permita decidir a qué grupo pertenece un cierto individuo, a partir de la
Más detallesTareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja
Más detallesANÁLISIS DISCRIMINANTE (AD)
discrim_predictivo.doc 30//05 vgg ANÁLISIS DISCRIMINANTE (AD) Regresión con respuesta categórica Y Cómo depende Y de las variables X, X,... X p? cualitativa cuantitativas Planteamiento Predictivo del AD:
Más detallesANÁLISIS DISCRIMINANTE
DEFINICIÓN: Cómo técnica de análisis de dependencia: Pone en marcha un modelo de causalidad en el que la variable endógena es una variable NO MÉTRICA y las independientes métricas. Cómo técnica de análisis
Más detallesUniversidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
Más detallesAnálisis de Datos Curso 2009/2010 Licenciatura en Biología. Análisis exploratorio de datos multivariantes
Análisis de Datos Curso 2009/2010 Licenciatura en Biología Análisis exploratorio de datos multivariantes 1. Para el conjunto de datos que se presenta en la siguente tabla: (a) Escribir la matriz de datos
Más detallesLECCIÓN PÚBLICA. Tema 6 Descripción Multivariante de Datos. Profa. María Fátima Dos Santos
LECCIÓN PÚBLICA Tema 6 Descripción Multivariante de Datos Profa. María Fátima Dos Santos 1 TEMARIO Análisis Multivariados. Clasificación ACP. Organización de los Datos ACP. Componentes, variabilidad explicada
Más detallesItinerario del Curso. Análisis de Datos Multivariados para Ciencias Ambientales. Semana 1. Lunes 23 de mayo de Miércoles 25 de mayo de 2016
Semana 1 Lunes 23 de mayo de 2016 8:30am - 9:00am 9:00am - 10:30am Bienvenida / Introducción Medidas de asociación para muestras biológicos-ambientales con estructura multivariada 11:15am - 12:45pm Laboratorio:
Más detallesIntroducción a la Estadística Aplicada en la Química
Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00
Más detalles5.3. Análisis discriminante Cuándo tenemos que utilizar el análisis discriminante
FUOC P01/71039/00748 119 Investigación descriptiva: análisis de información 5.3. Análisis discriminante 5.3.1. Cuándo tenemos que utilizar el análisis discriminante Para resolver muchos problemas de marketing,
Más detallesTema 9. Análisis factorial discriminante
Máster en Técnicas Estadísticas Análisis Multivariante. Año 2008 2009. Profesor: César Sánchez Sellero. 9.1. Introducción. Tema 9. Análisis factorial discriminante Supongamos que están denidos I grupos,
Más detallesUniversidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL
Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL OBJETIVO Analizar las Diferentes formas de Describir la Relación entre dos variables numéricas Trazar un diagrama de dispersión
Más detalles2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Más detallesNota de los autores... vi
ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...
Más detallesDISEÑO ESTADÍSTICO DE EXPERIMENTOS
DISEÑO ESTADÍSTICO DE EXPERIMENTOS UNA PRUEBA O SERIE DE PRUEBAS EN LAS CUALES SE INTRODUCEN CAMBIOS DELIBERADOS EN LAS VARI- ABLESDEENTRADAQUEFORMANELPROCESO,DE MANERA QUE SEA POSIBLE OBSERVAR E IDENTIFICAR
Más detallesBLOQUE III. ANÁLISIS MULTIVARIANTE
BLOQUE III. ANÁLISIS MULTIVARIANTE CAPÍTULO 7 Teoría sobre análisis multivariante. El análisis multivariante engloba un grupo de técnicas o métodos estadísticos cuya finalidad es analizar simultáneamente
Más detallesClasificación Supervisada
Clasificación Supervisada Ricardo Fraiman 26 de abril de 2010 Resumen Reglas de Clasificación Resumen Reglas de Clasificación Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y
Más detallesCátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS
Cátedra: TABLA DE CONTENIDOS INTRODUCCIÓN Qué es la Probabilidad? Qué es la Estadística? La evolución histórica de la Estadística Algunos conceptos imprescindibles Fuentes de datos Tipos de datos y escalas
Más detallesDepartamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente
Más detallesAnálisis multivariante II
Análisis multivariante II Tema 1: Introducción Pedro Galeano Departamento de Estadística Universidad Carlos III de Madrid pedro.galeano@uc3m.es Curso 2016/2017 Grado en Estadística y Empresa Pedro Galeano
Más detallesTÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE
TEMA 8 TÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 8.1.La inferencia estadística: del análisis univariante al análisis multivariante. 8.2.La reducción de la dimensionalidad: el análisis
Más detallesIntroducción. Existen dos aproximaciones para resolver el problema de clasificación: Aproximación Generativa (vista en el Tema 3) Basada en:
Introducción Eisten dos aproimaciones para resolver el problema de clasificación: Aproimación Generativa (vista en el Tema 3) Basada en: Modelar p(,w)=p( w)p(w) p( w) es la distribución condicional de
Más detallesTEMA 1: INTRODUCCIÓN N AL PROCESADO Y ANÁLISIS DE DATOS
Procesado y Análisis de Datos Ambientales. Curso 2009-2010. José D. Martín, Emilio Soria, Antonio J. Serrano TEMA 1: INTRODUCCIÓN N AL PROCESADO Y ANÁLISIS DE DATOS ÍNDICE Introducción. Selección de variables.
Más detallesModelado y simulación en Ingeniería Química. Manuel Rodríguez
ÍNDICE Modelos de caja gris Calibración de modelos Estimación de parámetros Análisis de la estimación Regresión no lineal 1. Modelos de caja gris Son modelos de un sistema (o proceso), donde: Desarrollados
Más detallesINDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica
INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables
Más detallesClasificación. Aurea Grané. Análisis Discriminante
Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis discriminante Análisis Discriminante y Clasificación Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid Supongamos
Más detallesMINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE MODELIZACIÓN TÉCNICAS DE MINERÍA DE DATOS TÉCNICAS DE MINERÍA DE DATOS TÉCNICAS DE MINERÍA DE DATOS
MINERÍA DE DATOS TÉCNICAS PREDICTIVAS DE TÉCNICAS DE MINERÍA DE DATOS TÉCNICAS DE MINERÍA DE DATOS..... MINERÍA DE DATOS - TÉCNICAS PREDICTIVAS DE 1 MINERÍA DE DATOS - TÉCNICAS PREDICTIVAS DE 2 TÉCNICAS
Más detallesCorrelación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
Más detallesINDICE. Introducción Capitulo uno. La idea nace un proyecto de investigación Como se originan las investigaciones? 2 Resumen Conceptos básicos
INDICE Introducción Capitulo uno. La idea nace un proyecto de investigación 1 1.1. Como se originan las investigaciones? 2 Resumen 6 Ejemplo 7 Capitulo dos. El planteamiento del problema objetivos, preguntas
Más detalles7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE
ESCUELA UNIVERSITARIA DE ENFERMERIA DE TERUEL 1 er CURSO DE GRADO DE ENFERMERIA Estadística en Ciencias de la Salud 7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE PROFESOR Dr. Santiago
Más detallesEstadística II Tema 4. Regresión lineal simple. Curso 2009/10
Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
Más detallesINTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4)
OBJETIVOS DE APRENDIZAJE: TEMA Nº ANÁLISIS CONJUNTO DE DOS VARIABLES Distinguir entre variables cualitativas y cuantitativas, y saber elegir los métodos en cada caso. Conocer métodos gráficos y cuantitativos
Más detallesque represente lo mejor posible la relación entre valores X e Y permitiéndonos inferir un valor a partir del otro.
Regresió n josé a. mañas 8.2.2017 1 Introducción El objetivo de las técnicas de regresión es identificar una función que permita estimar una variable Y en función de la otra X. Es decir, averiguar una
Más detallesÍNDICE INTRODUCCIÓN... 21
INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...
Más detallesESTADISTICA PARA LA CALIBRACIÓN Y VALIDACIÓN DE METODOLOGÍAS ANALÍTICAS
ESTADISTICA PARA LA CALIBRACIÓN Y VALIDACIÓN DE METODOLOGÍAS ANALÍTICAS QUÍMICA ANALÍTICA EXPERIMENTAL III SILVIA CITLALLI GAMA GONZÁLEZ PROBLEMA Cuando la cantidad de materia del analito que se encuentra
Más detallesTÉCNICAS MULTIVARIANTES
Máster en Ordenación y Gestión del Desarrollo Territorial y Local Módulo I MÉTODO Y TÉCNICAS ESTADÍSTICAS PARA EL DESARROLLO TERRITORIAL Y LOCAL CURSO TÉCNICAS MULTIVARIANTES Prof. Dr. Rosa Jordá Borrell
Más detallesINDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Más detallesBIOSESTADÍSTICA AMIGABLE
BIOSESTADÍSTICA AMIGABLE EJEMPLO: Ficha solicitud Colección Reserva UNIVERSIDAD AUSTRAL DE CHILE SISTEMA DE BIBLIOTECAS Clasificación: 574.015195 MAR 2001 Vol. y/o Copia: Apellido Autor: Título: C. 1 (SEGÚN
Más detallesTEMA-1 CONCEPTOS BÁSICOS Y ORGANIZACIÓN DE DATOS INTRODUCCIÓN:
TEMA-1 CONCEPTOS BÁSICOS Y ORGANIZACIÓN DE DATOS INTRODUCCIÓN: Debemos diferenciar dos tipos de estadística: Estadística teórica que se ocupa de aspectos formales y educativos. Estadística aplicada que
Más detallesTareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR
Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos
Más detallesEstas dos clases. ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías
ANOVA I 19-8-2014 Estas dos clases ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías ANOVA II - ANOVA factorial - ANCOVA (análisis
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesIntroducción a las técnicas de. Análisis multivariante
Introducción a las técnicas de Análisis Multivariante Fco. Javier Burguillo Universidad de Salamanca Objetivo: estudio de varias variables simultáneamente: X X X3 X4 X5 Objeto 34 6 0. 0.7 Objeto 4 36 3
Más detallesDiseño Muestreo y Experimental -->fundamental para análisis estadísticos. Escogencia de factores (V. independientes), niveles de factores,
Diseño Muestreo y Experimental -->fundamental para análisis estadísticos Escogencia de factores (V. independientes), niveles de factores, (tratamientos), Unidades de repuesta (replicas), Unidades de muestreo
Más detallesReconocimiento automático de rostros
Reconocimiento automático de rostros Ponente: Dr. Wilfrido Gómez Flores Investigador CINVESTAV wgomez@tamps.cinvestav.mx Ciudad Victoria,, 7 de junio de 2017 1 Introducción 2 Reconocimiento de rostros
Más detallesEcología de Paisaje y Regiones Tema 16. Principios de estadística multivariada y su aplicación a ecología del paisaje.
Ecología de Paisaje y Regiones Tema 16. Principios de estadística multivariada y su aplicación a ecología del paisaje. Mercedes Rougès 16.1.Principios de estadística multivariada La estadística multivariada
Más detallesDISEÑOS EXPERIMENTALES DE DOS GRUPOS Y MULTIGRUPO
TEMA II ESQUEMA GENERAL Diseño experimental de dos grupos: definición y clasificación Formatos del diseño y prueba de hipótesis Diseño experimental multigrupo: definición Formato del diseño multigrupo
Más detallesDISEÑO EXPERIMENTAL Biología, 2º Ciclo Profesores: Mauro Santos y Hafid Laayouni PROGRAMA TEÓRICO
DISEÑO EXPERIMENTAL Biología, 2º Ciclo 2005-2006 Profesores: Mauro Santos y Hafid Laayouni PROGRAMA TEÓRICO Tema 1 Introducción Diseño experimental e inferencia estadística: las dos caras de una misma
Más detallesPerceptrón simple y perceptrón multicapa
UNL - FICH - Departamento de Informática - Ingeniería Informática Inteligencia Computacional Guía de trabajos prácticos Perceptrón simple y perceptrón multicapa. Objetivos Aplicar diferentes arquitecturas
Más detallesWenceslao González Manteiga.
ANÁLISIS MULTIVARIANTE Wenceslao.gonzalez@usc.es ÍNDICE 0. MOTIVACIÓN HISTÓRICA 1. ANÁLISIS EXPLORATORIO DE DATOS 2. REVISIÓN DE LAS DISTRIBUCIONES NOTABLES MULTIDIMENSIONALES RELACIONADAS CON LA NORMAL
Más detallesDESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
ÍNDICE Introducción: Entrene su cerebro para la estadística... 1 La población y la muestra... 3 Estadísticas descriptivas e inferenciales... 4 Alcanzar el objetivo de estadísticas inferenciales: los pasos
Más detallesMATEMÁTICAS APLICADAS A CCSS I
MATEMÁTICAS APLICADAS A CCSS I CONTENIDOS TEMA 1: EL NÚMERO REAL. Números racionales e irracionales. Aproximaciones. Potencias y radicales. Logaritmos. Notación científica. Matemática financiera: aumentos
Más detallesClasificación y regresión logística
Clasificación y regresión logística José R. Berrendero Universidad Autónoma de Madrid Contenidos Planteamiento del problema de clasificación supervisada Regla lineal de Fisher Regresión logística Optimalidad:
Más detallesSistemas de Percepción Visión por Computador
Nota: Algunas de las imágenes que aparecen en esta presentación provienen del libro: Visión por Computador: fundamentos y métodos. Arturo de la Escalera Hueso. Prentice Hall. Sistemas de Percepción Visión
Más detallesPROCESO DE PREPARACIÓN DE DATOS
Partes incompletas Funcionamiento de los cuestionarios Incomprensión Entrega tardía Persona incorrecta PROCESO DE PREPARACIÓN DE DATOS FUENTE: Malhotra, N pag. 426 y sgtes Edición Codificación Trascripción
Más detallesINTRODUCTION TO MACHINE LEARNING ISABELLE GUYON
INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos
Más detallesAnálisis de Datos y Métodos Cuantitativos para la D.T. VI versión MGM
Universidad Católica del Norte Escuela de Negocios Mineros Magister en Gestión Minera Análisis de Datos y Métodos Cuantitativos para la D.T. VI versión MGM Antofagasta, Junio de 2013 Profesor: Fernando
Más detallesINDICE. 81 Operadores lógicos Funciones exponenciales y logarítmicas Funciones trigonométricas
INDICE Introducción XV Capitulo 1. Instalación y primeros pasos en SPSS 10 Instalación de SPSS 10 1 Comenzando con SPSS 10 8 El trabajo de trabajo de SPSS 10 9 Opciones de a barra de menú principal 10
Más detallesMODELADO CALIBRACIÓN MULTIVARIADA
MODELADO CALIBRACIÓN MULTIVARIADA Calibración multivariada aproximaciones multivariadas para crear una curva de calibración: regresión clásica u ordinaria (classical/ordinary least squares, CLS) regresión
Más detallesTaller de Capacitación 1 - Nivelación SISCA - BPS. Juan José Goyeneche Andrés Castrillejo Junio de 2012
Taller de Capacitación 1 - Nivelación SISCA - BPS Juan José Goyeneche Andrés Castrillejo Junio de 2012 Conceptos Generales Qué es la estadística? Qué usos o aplicaciones potenciales tiene? Qué es la Inferencia
Más detallesGUIA DOCENTE ESTADISTICA
1 GUIA DOCENTE ESTADISTICA 1- Datos de identificación Asignatura: Estadística Carácter: Formación básica Titulación: Psicología Ciclo: Grado Curso: 1 Cuatrimestre: Anual Departamento: Metodología de las
Más detallesPsicometría Tema 8 ANÁLISIS DE LA CALIDAD MÉTRICA DE LOS ÍTEMS
Psicometría Tema 8 ANÁLISIS DE LA CALIDAD MÉTRICA DE LOS ÍTEMS Psicometría Mª Isabel García Barbero, UNED. Universidad Nacional de Educación a Distancia, 2006 1 La evaluación de la calidad métrica de los
Más detallesPRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI
PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI 2014 Para qué es útil la estadística inferencial? Se utiliza para probar hipótesis y generalizar los resultados obtenidos en la muestra a la población o universo.
Más detallesAnálisis Discriminante mediante SPSS
Universitat de Barcelona. Institut de Ciències de l Educació Análisis Discriminante mediante SPSS Mercedes Torrado-Fonseca, Vanesa Berlanga-Silvente Fecha de presentación: 23/02/2013 Fecha de
Más detalles3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS
1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias
Más detallesSumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad...
ÍNDICE SISTEMÁTICO PÁGINA Sumario... 5 Prólogo... 7 Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares... 9 Objetivos de la Unidad... 11 1. Población y muestra... 12 2. Parámetro
Más detallesANÁLISIS DE COMPONENTES PRINCIPALES
CAPÍTULO 4 ANÁLISIS DE COMPONENTES PRINCIPALES 4.1 Introducción Al investigar un fenómeno desconocido se pretende abordarlo con muestras de diferentes variables, en las cuales muchas veces existe una fuerte
Más detallesFACULTAD DE MEDICINA Y CIENCIAS DE LA SALUD ESCUELA PROFESIONAL DE TECNOLOGÍA MÉDICA
FACULTAD DE MEDICINA Y CIENCIAS DE LA SALUD ESCUELA PROFESIONAL DE TECNOLOGÍA MÉDICA I. INFORMACIÓN GENERAL 1.1 Asignatura : BIOESTADÍSTICA 1.2 Código : 2602-26109 1.3 Área : Estudios Generales 1.4 Requisitos
Más detallesINDICE Capitulo 1. Entorno de Trabajo e SPSS Capitulo 2. Operadores y Funciones. Aplicaciones
INDICE Introducción XV Capitulo 1. Entorno de Trabajo e SPSS 1 Introducción y manejo de datos en SPSS 1 Lectura e importación de datos SPSS 6 Importación de datos de hoja de cálculo 8 Importación de archivos
Más detallesIntroducción al Análisis Multivariante
al Análisis Multivariante Vectores aleatorios, técnicas de análisis multivariante, distancias estadísticas Curso 2011-2012 Considero que el cerebro de cada cual es como una pequeña pieza vacía que vamos
Más detallesDiplomado en Estadística Aplicada
Diplomado en Estadística Aplicada Con el propósito de mejorar las habilidades para la toma de decisiones, la División de Estudios de Posgrado de la Facultad de Economía ha conjuntado a profesores con especialidad
Más detallesINFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS
. Metodología en Salud Pública INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS Autor: Clara Laguna 7.1 INTRODUCCIÓN Los datos categóricos o variables cualitativas son muy frecuentes en
Más detallesAnálisis de Datos. Análisis lineal discriminante. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Análisis lineal discriminante Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Para reducir el error de clasificación algunas veces es necesario identificar el subconjunto de características
Más detallesINGENIERÍA EN TECNOLOGÍAS DE LA INFORMACIÓN Y COMUNICACIÓN EN COMPETENCIAS PROFESIONALES ASIGNATURA DE ESTADÍSTICA APLICADA
INGENIERÍA EN TECNOLOGÍAS DE LA INFORMACIÓN Y COMUNICACIÓN EN COMPETENCIAS PROFESIONALES ASIGNATURA DE ESTADÍSTICA APLICADA UNIDADES DE APRENDIZAJE 1. Competencias Dirigir proyectos de tecnologías de información
Más detallesAnálisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,
Más detallesEigenvalores y eigenvectores
Eigenvalores y eigenvectores Los dos problemas principales del álgebra lineal son: resolver sistemas lineales de la forma Ax = b y resolver el problema de eigenvalores. En general, una matriz actúa sobre
Más detallesCapítulo 1 Probabilidades y Estadística
Capítulo 1 Probabilidades y Estadística 1 S E B A S T I Á N M A L D O N A D O A S I G N A T U R A : I N 3 4 0 1 S E M E S T R E O T O Ñ O, 2 0 1 0 Conceptos Preliminares Estadística 2 Estadística: ciencia
Más detallesEstadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1)
Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 24 de octubre de 2016 M.Bourel
Más detallesANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Estadistica para la investigacion experimental. CURSO ACADÉMICO - SEMESTRE Primer semestre
ANX-PR/CL/001-01 GUÍA DE APRENDIZAJE ASIGNATURA Estadistica para la investigacion experimental CURSO ACADÉMICO - SEMESTRE 2016-17 - Primer semestre GA_12AC_123000674_1S_2016-17 Datos Descriptivos Nombre
Más detallesTÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD
TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Contrastes de hipótesis paramétricos para una y varias muestras: contrastes sobre la media, varianza y una proporción. Contrastes sobre la diferencia
Más detallesAgro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Más detallesTEMA 5 Estadística descriptiva. Análisis de datos
TEMA 5 Estadística descriptiva. Análisis de datos Florence Nightingale (1820-1910) 1. Introducción. Modelos matemáticos 2. Métodos numéricos. Resolución de sistemas lineales y ecuaciones no lineales 3.
Más detallesINGENIERÍA EN TECNOLOGÍAS DE LA INFORMACIÓN
INGENIERÍA HOJA DE ASIGNATURA CON DESGLOSE DE UNIDADES TEMÁTICAS 1. Nombre de la asignatura Estadística Aplicada 2. Competencias Dirigir proyectos de tecnologías de información (T.I.) para contribuir a
Más detallesTema 2 Primeros Modelos Computacionales
Universidad Carlos III de Madrid OpenCourseWare Redes de Neuronas Artificiales Inés M. Galván - José Mª Valls Tema 2 Primeros Modelos Computacionales 1 Primeros Modelos Computacionales Perceptron simple
Más detallesCARACTERÍSTICAS GRALES.
Las técnicas estadísticas multivariadas permiten establecer, a partir de numerosos datos y variables, ciertas relaciones, investigar estructuras latentes y ensayar diversas maneras de organizar dichos
Más detallesMétodos cuantitativos de las ciencias sociales aplicados a los estudios urbanos y regionales André Lemelin
Métodos cuantitativos de las ciencias sociales aplicados a los estudios urbanos y regionales André Lemelin INDICE PREFACIO... 15 PRIMERA PARTE INTRODUCCIÓN A LA PRIMERA PARTE... 19 CAPÍTULO 1-1 EL ENFOQUE
Más detalles