Clasificación Jerárquica Ascendente Presentación #1. [ U n a i n t r o d u c c i ó n ]

Documentos relacionados
Análisis Exploratorio de Datos

Maribel Martínez y Ginés Ciudad-Real Fichas para mejorar la atención MATRIZ DE LETRAS

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA

Estadística: Conceptos Básicos, Tablas y Gráficas. Dra. Noemí L. Ruiz Limardo Revisado 2011 Derechos de Autor Reservados

FACTORIAL DE CORRESPONDENCIAS SIMPLES Y MÚLTIPLES CRIVISQ

INDICADORES DE GESTIÓN: UNA HERRAMIENTA PARA EL ANÁLISIS DE LAS COMUNIDADES DE REGANTES UNIVERSIDAD DE CÓRDOBA

CLASIFICACIÓN DE ESTABLECIMIENTOS Y SEDES. Diciembre 2014

Método k-medias. [ U n a i n t r o d u c c i ó n ]

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO

Métodos Predictivos en Minería de Datos

Matrices, Determinantes y Sistemas Lineales.

Fila: Es un conjunto de varias celdas dispuestas en sentido horizontal.

Curso de Estadística Aplicada a las Ciencias Sociales

MÓDULO HOJAS DE CÁLCULO

partición óptima: el algoritmo de fisher

Tema 1: Introducción

T I T U L O I N O R M A S G E N E R A L E S 1/21

Tema 11. Clustering. X 1... X i... X n O 1 x x 1 i... x 1 n... O j x j 1... x j i... x j n... O N x N 1... x N i... x N n

CAPITULO V ANALISIS E INTERPRETACION DE RESULTADOS RESULTADOS GENERALES DEL TEST MATRICES PROGRESIVAS DE RAVEN ESCALA GENERAL Cuadro No.

PREMIO CALENDARIO MATEMÁTICO CURSO

Proyectos: Formulación y evaluación

Capítulo 8. Análisis Discriminante

1. INTERNACIONALIZACIÓN DESDE LA PERSPECTIVA ECONÓMICA

CUADRES Y RELACIONES DE LOS ESTADOS CLASIFICACIÓN POR PLAZOS REMANENTES DEL ACTIVO Y DEL PASIVO EN EUROS

Análisis de imágenes digitales

Institución Educativa Técnica de Mongui CÓDIGO: PGA-FR-03 PROCESO DE GESTIÓN ACADÉMICA FECHA: 25/01/2016 PLAN DE AULA VERSIÓN: 4

GESTIÓN DE CALIFICACIONES

DEFINICION DE TABLAS DE ESPECIFICACIONES Y PERFIL DE REFERENCIA (Diseño de instrumentos de evaluación).

Sistemas de ecuaciones lineales

Problema de las N Reinas. Resolución paralela

Que es nombre adjetivo?

Lección 21: Pirámides de edades

MÉTODOS CUANTITATIVOS Y CUALITATIVOS PARA LA INVESTIGACIÓN Y DOCENCIA EN CIENCIAS SOCIALES (I EDICIÓN)

Informática y Computación III Guía de Estudio (50 reactivos)

IMPRESIÓN Y CONECTIVIDAD

Cómo hacer Valoración de Cargos

A continuación se presenta la información de la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes.

5. Clasificación de las formas del relieve. Modelización y análisis del terreno

DETERMINANTES Profesor: Fernando Ureña Portero

TEMA III. REPRESENTACION GRAFlCA

Educación Inclusiva en nuestras aulas

Qué es una rúbrica? Segundo Congreso de Educación Formando Formadores «Hay Talento 2010»

Construcción de Gráficas en forma manual y con programados

DESCRIPCIÓN DE ELECTIVOS

Diplomado Planeación y Control Financiero con Excel

Minería de Datos. Índice. Raquel M. Crespo García. Julio Villena Román. Definición y conceptos Técnicas y modelos

INDICE 1.1. Objetivos 1.2. Introducción 1.3. Contenidos 1.4. Bibliografía recomendada 1.1. OBJETIVOS

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Universidad del Perú, Decana de América

Guía 1: GRÁFICO DE BARRAS SIMPLES

Diplomado Planeación y Control Financiero con Excel

Soporte de Decisiones Operacionales en Marketing y Ventas Alineadas a la Cadena de Suministro

Gestión de la tabla de calificaciones:

TUTORIAL SOBRE HOJAS DE CALCULO

Computación Aplicada. Universidad de Las Américas. Aula virtual de Computación Aplicada. Módulo de Excel 2013 LIBRO 8

CONTENIDO PREFACIO... MERCADO Y PROBLEMAS FUNDAMENTA- LES... 1

Análisis Multivariante de Datos en Psicología. Ana María López Curso

Clasificación de establecimientos y sedes

Uso de las bases de datos SABER 11

UNIVERSIDAD AUTÓNOMA DE ZACATECAS PLAN ANALÍTICO

Universidad Autónoma de Sinaloa

Queridos estudiantes:

CURSO: EXCEL BÁSICO INICIA EL 17 DE ENERO. Objetivo:

Ejercicios sobre probabilidades y entropías

SISTEMAS DE ECUACIONES LINEALES ECUACIONES LINEALES

NOMBRE: Elaboración: Lic. Mónica Sánchez Medina. Fecha: 10 de junio de 2014

SISTEMAS DE ECUACIONES LINEALES. Método de reducción o de Gauss. 1º DE BACHILLERATO DPTO DE MATEMÁTICAS COLEGIO MARAVILLAS AUTORA: Teresa González.

CONOCIMIENTO DE SÍ MISMO Y AUTONOMÍA PERSONAL

INSTITUCIÓN EDUCATIVA JOSÉ EUSEBIO CARO ÁREA DE TECNOLOGÍA E INFORMÁTICA 2016 DOCENTE JESÚS EDUARDO MADROÑERO RUALES GRADO OCTAVO TEMA

Interpretación geométrica de la derivada

Casos especiales Plan de clase (1/4) Escuela: Fecha: Profesor (a):

LICEO SALAZAR Y HERRERA DIRECCIÓN ACADÉMICA CIRCULAR IMPORTANTE PRUEBA DE ESTADO DE LA EDUCACIÓN MEDIA ICFES SABER 11º

Medidas de Tendencia Central. Dra. Noemí L. Ruiz Limardo Derechos de Autor Reservados Revisado 2010

ESTADOS FINANCIEROS BÁSICOS BAJO NIC-NIIF

GUIA DE APRENDIZAJE No.01 Actividades Ejercicio No.1 Ingrese a Microsoft Excel y guarde el archivo con el nombre de EVIDENCIA 1.

SECUENCIA DIDÁCTICA GEOMETRÍA RAZONES TRIGONOMÉTRICAS

Operaciones básicas con hojas de cálculo

JOSÉ FRANCISCO MARTÍNEZ LICONA / PERLA PATRICIA RUBIO GARCÍA. conocimiento.

Bloque 12. Función Raíz Cuadrada: dominio y contradominio

COORDINACIÓN DE FORMACIÓN BASICA PROGRAMA DE UNIDAD DE APRENDIZAJ E POR COMPETENCIAS

Programa de estudios por competencias Métodos Matemáticos II. Fecha elaboración/modificación: Julio 2015 Clave de la asignatura:

CUADERNO Nº 6 NOMBRE:

2).- Nombre de función. Para obtener una lista de funciones disponibles, haga clic en una celda y presione MAYÚSC+F3.

CURSO EXCEL BÁSICO INTERMEDIO

RESUMEN EJECUTIVO. Aplicación de la metodología para establecer Puntajes de Corte en. las pruebas SIMCE 4 Básico de: Lectura. Educación Matemática

Julio Deride Silva. 27 de agosto de 2010

Curso Superior de Creación de Modelos de Simulación con Vensim

7 Código: MAT 2 Duración del Ciclo en Semanas: 2 Duración /Hora Clase: 50 Académico:

Repaso Estadística Descriptiva

General. Herramientas de computación. Programa Educativo: PROGRAMA DE ESTUDIO. Área de Formación :

Dos matrices son iguales cuando tienen la misma dimensión y los elementos que ocupan el mismo lugar en ambas son iguales

SISTEMAS DE ECUACIONES LINEALES. MÉTODO DE GAUSS.

MICROSOFT EXCEL 2010

ESTRUCTURA DEL INFORME FINAL DE PROYECTO DE INVESTIGACIÓN PARA ESTUDIANTES DE TERCER AÑO.

Departamento Ingeniería en Sistemas de Información

EL ANÁLISIS DE LOS DATOS EN EL SISTEMA DE INFORMACIÓN GEOGRÁFICA DE CUBA

Cómo se utiliza la tabla de Distribución de frecuencias?

CNCA. Colaboratorio Nacional de Computación Avanzada Centro Nacional de Alta Tecnología. Proyectos de uso de la e-infraestructura en RedCLARA

ESCUELA INES MARIA MENDOZA PROGRAMA DE MATEMATICAS : ½ CREDITO : 1 SEMESTRE

Tipos de estrategias de Enseñanza Aprendizaje

MQ1 - Métodos Cuantitativos 1

Transcripción:

Clasificación Jerárquica Ascendente Presentación #1 [ U n a i n t r o d u c c i ó n ]

Clasificación Jerárquica

Clasificación Automática La clasificación automática tiene por objetivo reconocer grupos de individuos homogéneos, de tal forma que los grupos queden bien separados y bien diferenciados. Estos individuos pueden estar descritos por una tabla de datos de individuos por variables, con variables cuantitativas o cualitativas, o por una tabla de proximidades.

Tareas de la Minería de Datos Clustering : (clasificación no supervisada, aprendizaje no supervizado): Es similar a la clasificación (discriminación), excepto que los grupos no son predefinidos. El objetivo es particionar o segmentar un conjunto de datos o individuos en grupos que pueden ser disjuntos o no. Los grupos se forman basados en la similaridad de los datos o individuos en ciertas variables. Como los grupos no son dados a priori el experto debe dar una interpretación de los grupos que se forman. Métodos: Clasificación Jerárquica (grupos disjuntos). Nubes Dinámicas o k-means (grupos disjuntos). Clasificación Piramidal (grupos NO disjuntos).

Cluster Analysis

Clasificación Jerárquica

Ejemplo: Tabla Notas Escolares Matemáticas Ciencias Español Historia EdFísica Lucía 7.0 6.5 9.2 8.6 8.0 Pedro 7.5 9.4 7.3 7.0 7.0 Inés 7.6 9.2 8.0 8.0 7.5 Luis 5.0 6.5 6.5 7.0 9.0 Andrés 6.0 6.0 7.8 8.9 7.3 Ana 7.8 9.6 7.7 8.0 6.5 Carlos 6.3 6.4 8.2 9.0 7.2 José 7.9 9.7 7.5 8.0 6.0 Sonia 6.0 6.0 6.5 5.5 8.7 María 6.8 7.2 8.7 9.0 7.0

Ejemplo: Distancias Notas Escolares

Ejemplo en Excel Notas Escolares ver NotasEscolaresExcelCJ.xlsx Tabla de Datos Matemáticas Ciencias Español Historia EdFísica Lucía 7 6.5 9.2 8.6 8 Pedro 7.5 9.4 7.3 7 7 Inés 7.6 9.2 8 8 7.5 Luis 5 6.5 6.5 7 9 Andrés 6 6 7.8 8.9 7.3 Ana 7.8 9.6 7.7 8 6.5 Carlos 6.3 6.4 8.2 9 7.2 José 7.9 9.7 7.5 8 6 Sonía 6 6 6.5 5.5 8.7 María 6.8 7.2 8.7 9 7 Distancia Lucía-Pedro 0.25 8.41 3.61 2.56 1 3.9787

Matriz de Distancias Una tabla o matriz de distancias: es aquella que se calcula a partir de una tabla de datos individuos-variables y que en la entrada (i,j) tiene la distancia calculada entre el individuo i-ésimo (fila i) y el individuo j-ésimo (fila j), denotada d(x i,x j ). Ejemplo en Excel Notas Escolares verejemploestudiantescj.xlsx Matriz de Distancias Lucía Pedro Inés Luis Andrés Ana Carlos José Sonía María Lucía 0 3.98 3.11 3.85 1.947 3.89 1.517 4.28 4.32 1.39 Pedro 0 4.39 4.39 4.214 1.24 3.91 1.51 4.43 3.36 Inés 0 4.42 3.7 1.14 3.265 1.69 4.77 2.53 Luis 0 3.072 1.89 3.439 5.45 1.89 4.07 Andrés 0 4.2 0.656 4.46 3.9 1.73 Ana 0 3.772 0.56 5.36 3 Carlos 0 4.05 4.2 1.09 José 0 5.64 3.3 Sonía 0 4.7 María 0

Cómo se construye el árbol? C1 C2 C3

Ejemplos

Agregación de Ward

Ejemplos

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo completo a pie

Ejemplo

Interpretación Análisis de los Clústeres Matemáticas Ciencias Español Historia EdFísica Lucía 7 6.5 9.2 8.6 8 Pedro 7.5 9.4 7.3 7 7 Inés 7.6 9.2 8 8 7.5 Luis 5 6.5 6.5 7 9 Andrés 6 6 7.8 8.9 7.3 Ana 7.8 9.6 7.7 8 6.5 Carlos 6.3 6.4 8.2 9 7.2 José 7.9 9.7 7.5 8 6 Sonía 6 6 6.5 5.5 8.7 María 6.8 7.2 8.7 9 7 Centro Gravedad C1={Pedro,Inés,Ana,José} Matemáticas Ciencias Español Historia EdFísica 7.7 9.475 7.625 7.75 6.75 Centro Gravedad C2={Luis,Sonia} Matemáticas Ciencias Español Historia EdFísica 5.5 6.25 6.5 6.25 8.85 Centro Gravedad C3={Lucía,Andrés,Carlos,María} Matemáticas Ciencias Español Historia EdFísica 6.525 6.525 8.475 8.875 7.375 C1 C2 C3

Interpretación Horizontal Centro Gravedad C1={Pedro,Inés,Ana,José}: Son los estudiantes buenos en Ciencias, Matemáticas y promedio en las demás materias. 10 9 8 7 6 5 4 3 2 1 0 Matemáticas Ciencias Español Historia EdFísica

Interpretación Horizontal Centro Gravedad C2={Luis,Sonia}: Son los estudiantes buenos en Educación Física y estudiantes de regulares a malos en las demás materias. 10 9 8 7 6 5 4 3 2 1 0 Matemáticas Ciencias Español Historia EdFísica

Interpretación Horizontal Centro Gravedad C3={Lucía,Andrés,Carlos,María}. Son los estudiantes buenos en letras, es decir, Español e Historia, además son estudiantes promedio en las demás materias. 10 8 6 4 2 0

Interpretación Vertical El clúster C1 es el mejor en Matemática

Interpretación Vertical El clúster C1 es el mejor en Ciencias

Interpretación Vertical El clúster C3 es el mejor en Español

Interpretación Vertical El clúster C3 es el mejor en Historia

Interpretación Vertical El clúster C2 es el mejor en Educación Física

Interpretación Horizontal-Vertical

Comparación entre ACP y CJ C3 C1 C2 C1 C2 C3

Ejemplos con el software: RComander

Ejemplo: Servicio al Cliente

Resumen de Resultados

Centros de Gravedad

Centros de Gravedad en Excel

Centros de Gravedad en Excel

C1 C1 C2

Dónde obtener más información?

Gracias.