Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ]

Documentos relacionados
Análisis Exploratorio de Datos

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA

INDICADORES DE GESTIÓN: UNA HERRAMIENTA PARA EL ANÁLISIS DE LAS COMUNIDADES DE REGANTES UNIVERSIDAD DE CÓRDOBA

Método k-medias. [ U n a i n t r o d u c c i ó n ]

Maribel Martínez y Ginés Ciudad-Real Fichas para mejorar la atención MATRIZ DE LETRAS

Estadística: Conceptos Básicos, Tablas y Gráficas. Dra. Noemí L. Ruiz Limardo Revisado 2011 Derechos de Autor Reservados

FACTORIAL DE CORRESPONDENCIAS SIMPLES Y MÚLTIPLES CRIVISQ

CLASIFICACIÓN DE ESTABLECIMIENTOS Y SEDES. Diciembre 2014

Métodos Predictivos en Minería de Datos

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO

partición óptima: el algoritmo de fisher

Matrices, Determinantes y Sistemas Lineales.

Fila: Es un conjunto de varias celdas dispuestas en sentido horizontal.

Curso de Estadística Aplicada a las Ciencias Sociales

Tema 11. Clustering. X 1... X i... X n O 1 x x 1 i... x 1 n... O j x j 1... x j i... x j n... O N x N 1... x N i... x N n

MÓDULO HOJAS DE CÁLCULO

Tema 1: Introducción

T I T U L O I N O R M A S G E N E R A L E S 1/21

Ejercicios sobre probabilidades y entropías

Análisis de imágenes digitales

Informática y Computación III Guía de Estudio (50 reactivos)

CAPITULO V ANALISIS E INTERPRETACION DE RESULTADOS RESULTADOS GENERALES DEL TEST MATRICES PROGRESIVAS DE RAVEN ESCALA GENERAL Cuadro No.

PREMIO CALENDARIO MATEMÁTICO CURSO

Proyectos: Formulación y evaluación

Universidad Autónoma de Sinaloa

Capítulo 8. Análisis Discriminante

Minería de Datos. Índice. Raquel M. Crespo García. Julio Villena Román. Definición y conceptos Técnicas y modelos

1. INTERNACIONALIZACIÓN DESDE LA PERSPECTIVA ECONÓMICA

CUADRES Y RELACIONES DE LOS ESTADOS CLASIFICACIÓN POR PLAZOS REMANENTES DEL ACTIVO Y DEL PASIVO EN EUROS

Institución Educativa Técnica de Mongui CÓDIGO: PGA-FR-03 PROCESO DE GESTIÓN ACADÉMICA FECHA: 25/01/2016 PLAN DE AULA VERSIÓN: 4

GESTIÓN DE CALIFICACIONES

DEFINICION DE TABLAS DE ESPECIFICACIONES Y PERFIL DE REFERENCIA (Diseño de instrumentos de evaluación).

Sistemas de ecuaciones lineales

Problema de las N Reinas. Resolución paralela

Que es nombre adjetivo?

SISTEMAS DE ECUACIONES LINEALES ECUACIONES LINEALES

Lección 21: Pirámides de edades

MÉTODOS CUANTITATIVOS Y CUALITATIVOS PARA LA INVESTIGACIÓN Y DOCENCIA EN CIENCIAS SOCIALES (I EDICIÓN)

IMPRESIÓN Y CONECTIVIDAD

Cómo hacer Valoración de Cargos

PROGRAMA DE RECUPERACIÓN PEDAGÓGICA

A continuación se presenta la información de la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes.

DETERMINANTES Profesor: Fernando Ureña Portero

5. Clasificación de las formas del relieve. Modelización y análisis del terreno

TEMA III. REPRESENTACION GRAFlCA

Educación Inclusiva en nuestras aulas

Qué es una rúbrica? Segundo Congreso de Educación Formando Formadores «Hay Talento 2010»

Construcción de Gráficas en forma manual y con programados

MQ1 - Métodos Cuantitativos 1

DESCRIPCIÓN DE ELECTIVOS

Diplomado Planeación y Control Financiero con Excel

INDICE 1.1. Objetivos 1.2. Introducción 1.3. Contenidos 1.4. Bibliografía recomendada 1.1. OBJETIVOS

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Universidad del Perú, Decana de América

CNCA. Colaboratorio Nacional de Computación Avanzada Centro Nacional de Alta Tecnología. Proyectos de uso de la e-infraestructura en RedCLARA

Métodos de la Minería de Datos

Guía 1: GRÁFICO DE BARRAS SIMPLES

Diplomado Planeación y Control Financiero con Excel

Soporte de Decisiones Operacionales en Marketing y Ventas Alineadas a la Cadena de Suministro

Gestión de la tabla de calificaciones:

TUTORIAL SOBRE HOJAS DE CALCULO

Computación Aplicada. Universidad de Las Américas. Aula virtual de Computación Aplicada. Módulo de Excel 2013 LIBRO 8

CONTENIDO PREFACIO... MERCADO Y PROBLEMAS FUNDAMENTA- LES... 1

Análisis Multivariante de Datos en Psicología. Ana María López Curso

Clasificación de establecimientos y sedes

Uso de las bases de datos SABER 11

Guía de Trabajo final de Planificación de transporte IV año de Ing. Civil. Junio 2011 Prof. Ing. Sergio Navarro Hudiel

UNIVERSIDAD AUTÓNOMA DE ZACATECAS PLAN ANALÍTICO

1. JUSTIFICACIÓN DE LA UNIDAD DE ESTUDIO 2. COMPETENCIAS A DESARROLLAR EN LA UNIDAD DE ESTUDIO 3. CONTENIDO

Queridos estudiantes:

CURSO: EXCEL BÁSICO INICIA EL 17 DE ENERO. Objetivo:

PRESENTACIÓN SOFTWARE. Área de Recursos Educativos Digitales ENLACES

NOMBRE: Elaboración: Lic. Mónica Sánchez Medina. Fecha: 10 de junio de 2014

SISTEMAS DE ECUACIONES LINEALES. Método de reducción o de Gauss. 1º DE BACHILLERATO DPTO DE MATEMÁTICAS COLEGIO MARAVILLAS AUTORA: Teresa González.

SEGMENTACIÓN AUTOMÁTICA DE TEJIDOS CEREBRALES EN MRI MULTIESPECTRALES MEDIANTE CLASIFICACIÓN POR MÍNIMA DISTANCIA EUCLÍDEA

CONOCIMIENTO DE SÍ MISMO Y AUTONOMÍA PERSONAL

Introducción a las Redes Neuronales

INSTITUCIÓN EDUCATIVA JOSÉ EUSEBIO CARO ÁREA DE TECNOLOGÍA E INFORMÁTICA 2016 DOCENTE JESÚS EDUARDO MADROÑERO RUALES GRADO OCTAVO TEMA

Interpretación geométrica de la derivada

Casos especiales Plan de clase (1/4) Escuela: Fecha: Profesor (a):

Contenido. Prefacio... Acerca de los autores...

LICEO SALAZAR Y HERRERA DIRECCIÓN ACADÉMICA CIRCULAR IMPORTANTE PRUEBA DE ESTADO DE LA EDUCACIÓN MEDIA ICFES SABER 11º

Medidas de Tendencia Central. Dra. Noemí L. Ruiz Limardo Derechos de Autor Reservados Revisado 2010

ESTADOS FINANCIEROS BÁSICOS BAJO NIC-NIIF

GUIA DE APRENDIZAJE No.01 Actividades Ejercicio No.1 Ingrese a Microsoft Excel y guarde el archivo con el nombre de EVIDENCIA 1.

SECUENCIA DIDÁCTICA GEOMETRÍA RAZONES TRIGONOMÉTRICAS

Operaciones básicas con hojas de cálculo

JOSÉ FRANCISCO MARTÍNEZ LICONA / PERLA PATRICIA RUBIO GARCÍA. conocimiento.

Bloque 12. Función Raíz Cuadrada: dominio y contradominio

COORDINACIÓN DE FORMACIÓN BASICA PROGRAMA DE UNIDAD DE APRENDIZAJ E POR COMPETENCIAS

CENTRO DE ESTUDIOS DE BACHILLERATO 4/2 LIC. JESÚS REYES HEROLES

Programa de estudios por competencias Métodos Matemáticos II. Fecha elaboración/modificación: Julio 2015 Clave de la asignatura:

CUADERNO Nº 6 NOMBRE:

2).- Nombre de función. Para obtener una lista de funciones disponibles, haga clic en una celda y presione MAYÚSC+F3.

CURSO EXCEL BÁSICO INTERMEDIO

RESUMEN EJECUTIVO. Aplicación de la metodología para establecer Puntajes de Corte en. las pruebas SIMCE 4 Básico de: Lectura. Educación Matemática

Julio Deride Silva. 27 de agosto de 2010

Curso Superior de Creación de Modelos de Simulación con Vensim

7 Código: MAT 2 Duración del Ciclo en Semanas: 2 Duración /Hora Clase: 50 Académico:

Repaso Estadística Descriptiva

General. Herramientas de computación. Programa Educativo: PROGRAMA DE ESTUDIO. Área de Formación :

Transcripción:

Clasificación Jerárquica Ascendente Presentación #1 [ U n a i n t r o d u c c i ó n ]

Clasificación Jerárquica

Clasificación Automática La clasificación automática tiene por objetivo reconocer grupos de individuos homogéneos, de tal forma que los grupos queden bien separados y bien diferenciados. Estos individuos pueden estar descritos por una tabla de datos de individuos por variables, con variables cuantitativas o cualitativas, o por una tabla de proximidades.

Tareas de la Minería de Datos Clustering : (clasificación no supervisada, aprendizaje no supervizado): Es similar a la clasificación (discriminación), excepto que los grupos no son predefinidos. El objetivo es particionar o segmentar un conjunto de datos o individuos en grupos que pueden ser disjuntos o no. Los grupos se forman basados en la similaridad de los datos o individuos en ciertas variables. Como los grupos no son dados a priori el experto debe dar una interpretación de los grupos que se forman. Métodos: Clasificación Jerárquica (grupos disjuntos). Nubes Dinámicas o k-means (grupos disjuntos). Clasificación Piramidal (grupos NO disjuntos).

Cluster Analysis

Clasificación Jerárquica

Ejemplo: Tabla Notas Escolares Matemáticas Ciencias Español Historia EdFísica Lucía 7.0 6.5 9.2 8.6 8.0 Pedro 7.5 9.4 7.3 7.0 7.0 Inés 7.6 9.2 8.0 8.0 7.5 Luis 5.0 6.5 6.5 7.0 9.0 Andrés 6.0 6.0 7.8 8.9 7.3 Ana 7.8 9.6 7.7 8.0 6.5 Carlos 6.3 6.4 8.2 9.0 7.2 José 7.9 9.7 7.5 8.0 6.0 Sonia 6.0 6.0 6.5 5.5 8.7 María 6.8 7.2 8.7 9.0 7.0

Ejemplo: Distancias Notas Escolares

Ejemplo en Excel Notas Escolares ver NotasEscolaresExcelCJ.xlsx Tabla de Datos Matemáticas Ciencias Español Historia EdFísica Lucía 7 6.5 9.2 8.6 8 Pedro 7.5 9.4 7.3 7 7 Inés 7.6 9.2 8 8 7.5 Luis 5 6.5 6.5 7 9 Andrés 6 6 7.8 8.9 7.3 Ana 7.8 9.6 7.7 8 6.5 Carlos 6.3 6.4 8.2 9 7.2 José 7.9 9.7 7.5 8 6 Sonía 6 6 6.5 5.5 8.7 María 6.8 7.2 8.7 9 7 Distancia Lucía-Pedro 0.25 8.41 3.61 2.56 1 3.9787

Matriz de Distancias Una tabla o matriz de distancias: es aquella que se calcula a partir de una tabla de datos individuos-variables y que en la entrada (i,j) tiene la distancia calculada entre el individuo i-ésimo (fila i) y el individuo j-ésimo (fila j), denotada d(x i,x j ). Ejemplo en Excel Notas Escolares verejemploestudiantescj.xlsx Matriz de Distancias Lucía Pedro Inés Luis Andrés Ana Carlos José Sonía María Lucía 0 3.98 3.11 3.85 1.947 3.89 1.517 4.28 4.32 1.39 Pedro 0 4.39 4.39 4.214 1.24 3.91 1.51 4.43 3.36 Inés 0 4.42 3.7 1.14 3.265 1.69 4.77 2.53 Luis 0 3.072 1.89 3.439 5.45 1.89 4.07 Andrés 0 4.2 0.656 4.46 3.9 1.73 Ana 0 3.772 0.56 5.36 3 Carlos 0 4.05 4.2 1.09 José 0 5.64 3.3 Sonía 0 4.7 María 0

Cómo se construye el árbol? C1 C2 C3

Ejemplos

Agregación de Ward

Ejemplos

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo

Interpretación Análisis de los Clústeres Matemáticas Ciencias Español Historia EdFísica Lucía 7 6.5 9.2 8.6 8 Pedro 7.5 9.4 7.3 7 7 Inés 7.6 9.2 8 8 7.5 Luis 5 6.5 6.5 7 9 Andrés 6 6 7.8 8.9 7.3 Ana 7.8 9.6 7.7 8 6.5 Carlos 6.3 6.4 8.2 9 7.2 José 7.9 9.7 7.5 8 6 Sonía 6 6 6.5 5.5 8.7 María 6.8 7.2 8.7 9 7 Centro Gravedad C1={Pedro,Inés,Ana,José} Matemáticas Ciencias Español Historia EdFísica 7.7 9.475 7.625 7.75 6.75 Centro Gravedad C2={Luis,Sonia} Matemáticas Ciencias Español Historia EdFísica 5.5 6.25 6.5 6.25 8.85 Centro Gravedad C3={Lucía,Andrés,Carlos,María} Matemáticas Ciencias Español Historia EdFísica 6.525 6.525 8.475 8.875 7.375 C1 C2 C3

Interpretación Horizontal Centro Gravedad C1={Pedro,Inés,Ana,José}: Son los estudiantes buenos en Ciencias, Matemáticas y promedio en las demás materias. 10 9 8 7 6 5 4 3 2 1 0 Matemáticas Ciencias Español Historia EdFísica

Interpretación Horizontal Centro Gravedad C2={Luis,Sonia}: Son los estudiantes buenos en Educación Física y estudiantes de regulares a malos en las demás materias. 10 9 8 7 6 5 4 3 2 1 0 Matemáticas Ciencias Español Historia EdFísica

Interpretación Horizontal Centro Gravedad C3={Lucía,Andrés,Carlos,María}. Son los estudiantes buenos en letras, es decir, Español e Historia, además son estudiantes promedio en las demás materias. 10 8 6 4 2 0

Interpretación Vertical El clúster C1 es el mejor en Matemática

Interpretación Vertical El clúster C1 es el mejor en Ciencias

Interpretación Vertical El clúster C3 es el mejor en Español

Interpretación Vertical El clúster C3 es el mejor en Historia

Interpretación Vertical El clúster C2 es el mejor en Educación Física

Interpretación Horizontal-Vertical

Comparación entre ACP y CJ C3 C1 C2 C1 C2 C3

Ejemplo H={{x 1 },{x 2 },{x 3 },{x 4 },{x 5 },{x 3,x 4 },{x 1,x 5 },{x 3,x 4,x 1,x 5 }, {x 3,x 4,x 1,x 5,x 2 }}

Algoritmo

Ejemplo

Ejemplo

Ejemplo

Ejemplos con el software: RComander

Ejemplo: Servicio al Cliente

Resumen de Resultados

Centros de Gravedad

Centros de Gravedad en Excel

Centros de Gravedad en Excel

C1 C1 C2

Dónde obtener más información?

Gracias.