Introducción a SPSS Árboles de Clasificación. Jorge Del Río L. Consultor Estadístico

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Introducción a SPSS Árboles de Clasificación. Jorge Del Río L. Consultor Estadístico"

Transcripción

1 Introducción a SPSS Árboles de Clasificación Jorge Del Río L. Consultor Estadístico

2 Introducción Es un módulo que contiene diferentes procedimientos para resolver problemas de predicción y clasificación utilizando análisis de árboles de decisión. Es capaz de combinar a través de un conjunto de variables independientes y sucesivamente particionando la data en subgrupos de mejorar la predicción o clasificación de una variable objetivo. Es una técnica valiosa cuando deseamos construir modelos con gran cantidad de variables independientes o con poca teoría previa que sirva de guía.

3 Análisis basado en árboles Los procedimientos tradicionales implican el ajuste de un modelo (regresión por ejemplo) según el comportamiento de los datos. Los árboles de decisión dividen los datos sucesivamente con base a algún criterio que implique relaciones entre las variables predictoras y la variable objetivo.

4 Análisis basado en árboles Cuando se tiene éxito, el árbol que resulta indica qué variables predictoras están relacionadas con mayor fuerza con la variable objetivo. Los nodos terminales muestran los grupos que pueden tener una mayor concentración de casos con la característica deseada.

5 Usos Generales de los Árboles de Decisión Segmentación. Identificar personas son probablemente miembros de un grupo. Estratificación. Asignación de casos a categorías. Predicción. Creación de reglas para predecir eventos futuros. Reducción de datos y filtro de variables. Seleccionar un subconjunto de variables para contruir un modelo paramétrico. Identificación de interacciones. Identificar relaciones que pertenezcan a subgrupos específicos. Fusión de categorías. Colapsar variables contínuas en categorías discretas.

6 Aplicaciones de los Árboles de Decisión Correo directo. Determinar grupos demográficos con alta tasa de respuesta. Credit Scoring. Usar historial crediticio para tomar decisiones de crédito. Recursos Humanos. Entender las reglas de pasadas de contratación para afinar el proceso. Análisis de mercado. Determinación de variables geográficas, precios, características del consumidor y otras

7 Aplicaciones de los Árboles de Decisión Control de calidad. Determinación de productos defectuosos. Estudio de políticas. Generar reglas de decisión en las políticas de contratación. Salud. Descubrir variables que contribuyan a mejores resultados de salud.

8 Ventajas y desventajas sobre modelos tradicionales Diseñados para trabajar con un número elevado de variables (CHAID vs loglineal) Como métodos no paramétricos capturan relaciones que los modelos lineales no pueden capturar (relaciones no lineales e interacciones complejas). No genera una ecuación general que exprese el modelo.

9 Por qué cuatro métodos? Diferentes métodos pueden manejar diferentes tipos medida en las variables. Uso o no de criterios estadísticos al momento de escoger y partir variables. Si se incorporan o no costos de clasificación errónea y probabilidades a priori. Esfuerzo computacional de la máquina.

10 Comparación Característica CHAID CHAID Exahustivo C&RT QUEST Tipo de Partición Múltiple Múltiple Binaria Binaria Dependiente Continua Sí Sí Sí No Predictoras Continuas Si (*) Si (*) Sí Sí Coste de Mala Clasificación (Crecimiento del Arbol) Pruebas Estadísticas (Selección del Predictor) Pruebas Estadísticas (Particionar) No No Sí Sí Sí Sí No Sí Sí Sí No No Velocidad Moderada Moderada Lento Moderada/Lento Utiliza A priori? No No Sí Sí Valores Faltantes para los Predictores Usados? Si, como una categoría Si, como una categoría No, Sustitutos usados para partición No, Sustitutos usados para partición

11 Recomendaciones El análisis de datos requiere de una participación humana atenta. Siempre mire los datos en bruto. Conozca las características en sus datos antes de emprender un proyecto grande. Limpie los datos o esté conciente de cualquier irregularidad en ellos. Valide sus resultados con nuevos datos o con una muestra de prueba. Si es posible utilice modelos estadísticos tradicionales para extender y verificar lo aprendido.

12 Tabla de Ganancia de Nodos Nodo. Número del nodo. Nodo N. Número de casos dentro de un nodo. Nodo Porcentaje. Porcentaje de personas en el nodo contra la muestra completa. Ganancia N. N de casos en el nodo que caen dentro de la categoría objetivo. Ganancia Porcentaje. Porcentaje de personas en la categoría objetivo contra el N total de la categoría objetivo. Respuesta. Tasa de respuesta en el nodo para la categoría objetivo. Índice. Radio del nodo de respuesta versus la respuesta de la muestra total.

13 CHAID y CHAID Exhaustivo

14 Qué es CHAID? Chi-square Automatic Interaction Detector (Detector Automático de Interacción Chi-cuadrado). El modelo CHAID es un método exploratorio del análisis de datos usado para estudiar las relaciones entre una variable dependiente y una serie grande de variables predictoras. CHAID selecciona un sistema de predictores y de sus interacciones que predicen óptimamente la medida de la variable dependiente.

15 Qué es CHAID? El modelo desarrolla un árbol de clasificación con los perfiles más importantes formados por las variables independientes diferenciado los criterios de una variable dependiente. CHAIS es puede proveer información relevante sobre una variable dependiente, donde modelos formales tienen dificultades (como muchas variables categóricas o un limitado tamaño de muestra).

16 Principios y Consideraciones CHAID tiende a crear árboles amplios más que los métodos binarios. Funciona con todo tipo de variables (cualitativas y cuantitativas) CHAID comienza su análisis seleccionando la variable independiente más significativa (menor p-value). Si la variable independiente tiene más de 2 categorías, CHAID las compara y une las categorías que no muestren diferencias en el resultado. Para variables nominales, cualquier categoría puede ser unida, mientras que para ordinales solo categorías contiguas. Por lo tanto, CHAID divide la data sistemáticamente en subgrupos que muestren diferencias significativas.

17 Lectura de un Diagrama CHAID Los diagramas CHAID se deben pensar como el "tronco de un árbol" con particiones progresivas en "ramas más pequeñas. El "tronco inicial del árbol" son todos los participantes en el estudio. Las variables predictoras conducen a una discriminación estadísticamente significativa. El "más significativo" define la primera partición de la muestra, o la primera ramificación del árbol.

18 Lectura de un Diagrama CHAID Entonces, cada uno de los nuevos grupos formados, son particionados por otra de las variables predictoras, etc. El resultado al final del proceso es un árbol que presenta una serie de grupos con diferencias máximas sobre la variable dependiente. En cada paso, las pruebas estadísticas se hacen para determinar si una partición es significativa y puede ser hecha.

19 Ventajas El nivel de medida para la variable dependiente y las variables predictoras pueden ser nominal, ordinal o intervalo. No todas las variables predictoras necesitan ser medidas en el mismo nivel. Los valores faltantes se pueden tratar como una "categoría flotante" para poder utilizar los datos parciales, siempre que sea posible dentro del árbol. Un sistema apropiadamente conservador de criterios estadísticos se utiliza, y los modelos que resultan acentúan los resultados más fuertes.

20 Opciones Técnicas Ajuste del.05 de Bonferroni sobre las probabilidades Un tamaño mínimo del nodo padre de 10 Un tamaño mínimo del nodo hijo de 5. La capacidad de partir o combinar continuamente las categorías de las variables predictoras. En algunos casos, estas opciones técnicas se ajustan según el tamaño de muestra o se basan en conocimiento anterior sobre las variables.

21 Notas sobre CHAID Es un método útil para resumir datos, y puede mostrar divisiones naturales importantes sobre los clientes. Los modelos presentados se deben considerar como sugestivos, pero no absolutamente definitivos, se pueden complementar con modelos estadísticos tradicionales.

22 CHAID y Regresión Logística CHAID: diseñado para detectar interacciones Reg. Logística: Detección puede ser dirigida a incluir interacciones. R. Logística acepta variables continuas mientras que CHAID necesita discretizarlas. Si tiene muchas variables continuas cuya interacción se sospecha no esta relacionada con salida. R. Logística Si tiene muchas variables categóricas cuyas interacciones se relacionan con la v. objetivo. CHAID

23 Extensión CHAID y Características Adicionales

24 Introducción Se estudiará la importancia de la validación del modelo. Dificultad del procedimiento: Es más probable que el modelo se ajuste a la data. Se recomienda evaluar el modelo aplicado a otra data. El Statistics maneja 2 tipos de validación: Partición. Validación cruzada.

25 Introducción Adicionalmente se analizarán la incorporación de beneficios y perdidas. Por defecto CHAID asume que la clasificación errónea es igualmente costosa aunque esto no siempre es así. Podemos proveer valores para el costo de una mala clasificación.

26 Validación Los modelos tienden a modelar bien la data con la que fueron realizados pero no en otras muestras. Dividir los datos en 2 muestras, una para entrenamiento y otra para prueba es la solución más sugerida por los estadísticos. El investigador define la cantidad de casos que incluirá cada muestra. No hay regla para la cantidad de datos 50% a 90% de data para entrenamiento

27 Validación Cuando no se tiene el tamaño de muestra necesario para realizar una partición de los datos, se recurre a la Validación Cruzada. Muestra pequeña: Validación Cruzada Divide la muestra en subgrupos iguales Promedio de los errores: Tabla de riesgo Los árboles son generados, excluyendo data de cada subgrupo A tener en cuenta: Procesamiento Muestras relacionadas Se recomienda utilizar la validación cruzada para muestras menores a 1000 casos. De lo contrario utilizar la partición de la muestra.

28 Incorporando Ganancias Incorpora valores de rentabilidad para la categoría de respuesta Direct mail o Marketing de Base de Datos No afectan al crecimiento del árbol Ejemplo: Aceptar o rechazar una nueva tarjeta Estimar la ganancia por tarjeta aceptada

29 Costo de Clasificación Errónea Diferente del concepto de rentabilidad, esta no proviene de errores. Pueden influir en el crecimiento del árbol y asignación de casos (CRT) Permite asignar a una categoría específica un costo de clasificación errónea. CHAID incorpora estos costos una vez que es árbol ha sido elaborado. En resumen, la incorporación de costos, afecta la de designación de nodos para evitar el error más costoso.

30 Árboles de Clasificación y Regresión (C&RT) Classification and Regression Trees

31 El Método C&RT Breiman, Friedman, Olshen y Stone (1984) C&RT hace separaciones binarias sucesivas en los datos guiándose por un criterio, no una prueba estadística como lo hace CHAID. En cada nodo, la variable predictora que mejore más el criterio, se usa para hacer la siguiente partición. Los árboles creados con este criterio se dejan crecer ampliamente y después son podados: podar minimizando el costo complejo.

32 Impureza Es el nombre del criterio para crecer el árbol con una variable objetivo nominal. Captura el grado en el que los casos dentro de un nodo están concentrados en una sola categoría. Un nodo puro es aquel en que todos los casos están en una sola categoría. El mayor grado de impureza se da cuando todas las categorías de una variable predictora contienen la misma cantidad de casos, es decir todas las categorías o clases aparecen en igual proporción, siendo este nodo nada util.

33 Impureza Medidas de Impureza Gini: Si P(t)i es la proporción de casos en el nodo t de la categoría i, la medida de dispersión es: g( t) 1 i 2 p i La impureza no solo se mide para un sólo nodo: El promedio ponderado de los valores de impureza de cada nodo, es la medida de impureza de toda la rama. C&RT parte el árbol con el predictor que más disminuye la impureza. En el diagrama del árbol se muestra la MEJORA.

34 Costo Complejo Crecer un árbol indefinidamente, casi siempre reduce la impureza. La medida de costo complejo aumenta en la medida en que el árbol es más grande. CostoCompl ex R( T) a* T R(T): medida de riesgo de clasificacion erronea del árbol o rama a: coeficiente de penalidad T : número de nodos terminales del árbol o rama. Para mejorar la medida de costos complejo, el componente de sustitución de riesgo debe disminuir más que la penalidad.

35 Costo complejo y poda La medida de costo complejo funciona bien si se deja crecer el árbol bastante, y luego se poda utilizando este criterio. El método consiste en podar ramas de manera sucesiva con base a la máxima reducción de la medida de costo complejo. De los árboles, se escoge el árbol más pequeño, cuyo riesgo (probabilidad de clasificar erróneamente) esté dentro de un rango de un error estándar del menor riesgo encontrado durante el crecimiento del árbol.

36 Cómo se hacen las particiones? Para predictoras continuos u ordinales: Se ordenan los datos dentro de los nodos por los valores de las categorías de la variable predictora. Se calcula la disminución en impureza para todos los posibles puntos de corte. Se determina la mejor partición.

37 Cómo se hacen las particiones? Para predictoras nominales Todas las posibles combinaciones de sus categorías son evaluadas, y la partición se hace cuando se encuentra la mayor reducción en impureza. Esto hace que un misma variable predictora pueda aparecer muchas veces dentro de una rama.

38 Valores perdidos y Sustitutos En CHAID los valores perdidos se tratan como una categoría diferente. En C&RT estos casos se utilizan en el análisis reemplazándolos con una estimación que depende de la clasificación según la mejor variable predictora disponible.

39 C&RT, CHAID y Regresión Logística CHAID y regresión logística son más rápidas y están basadas en pruebas estadísticas. CHAID junta categorías de las variables predictoras continuas en categorías ordinales antes del análisis.c&rt crea particiones durante el análisis.

40 Árboles de Regresión La parte RT de C&RT es la que nos permite predecir variables objetivo que sean continuas. Es una alternativa atractiva puesto que puede capturar, de manera nativa, relaciones no lineales entre variables, además de efectos de interacción. Una opción óptima es correr un RT que identifique variables relevantes y posibles interacciones y relaciones no lineales para luego correr la regresión

41 El método de regresión Puesto que la variable objetivo es continua, el criterio es minimizar la varianza dentro de cada nodo, obteniendo así los nodos más homogéneos sobre la variable objetivo. De la misma manera de CT, el crecimiento del árbol seguido de la poda es la base de RT

42 C&RT, CHAID y Regresión Logística Si existen relaciones cuasi lineales entre una predictora y la proporción de la variable objetivo, C&RT tratará de capturar esta relación con particiones binarias sucesivas, CHAID con una partición multicategórica y ninguna será tan eficiente como RL. Sin embargo CHAID y C&RT pueden capturar relaciones no lineales e interacciones complejas.

43 Impureza El criterio de impureza se mantiene pero se mide de acuerdo a la varianza al interior del nodo. Captura el grado en el que las respuestas dentro de un nodo están concentradas alrededor de un solo valor. La impureza de una rama es el promedio ponderado de las varianzas de los nodos terminales.

44 Costos y probabilidades a priori Para una variable objetivo continua, no hay categorías a las cuales asignarle beneficios o probabilidades. Si los costos se consideran relevantes, estarían asociados a la distancia entre el valor pronosticado y el verdadero, que está implícito en la varianza.

45 QUEST Analysis Quick Unbiased Efficient Statistical Tree

46 Dos razones para desarrollar QUEST Reducir el tiempo de procesamiento que tenía C&RT. Reducir la tendencia de CHAID de favorecer variables continuas o aquellas con muchas categorías (corrección de Bonferroni)

47 Complejidad computacional. Una variable ordinal con n valores en un nodo conlleva (n-1) divisiones, por lo que el numero de cálculos en cada nota aumenta de forma proporcional al numero de valores. Sesgos en la selección de variables. Pero un problema mas serio desde el punto de vista interpretativo y de generalización, de resultados es que los métodos exhaustivo tienen a seleccionar aquellas variables que cuentan con un mayor numero de categorías. El proceso se repite de forma recursiva hasta que salta alguna de las reglas de Parada, gracias a este procedimiento de cálculo, Quest: *Apenas muestra sesgos de respuesta *Muestra una mayor simplicidad de calculo *Permite incluir métodos de validación mediante poda *Permite incorporar combinaciones lineales de variables Comparando Quest con métodos exhaustivos se han comprobado que cuando se utilizan divisiones univariadas, no existe un ganador claro.

48 El método Quest Sea X Se calcula niv. Sig: Chi-cuadrado o ANOVA se selecciona al menor SI Es menor que alfa preestablecido? NO Se selecciona Para división SI Se usa Levene Su niv.sig es menor a alfa? NO Seleccionar la variable para dividir Seleccionar la var con el menor niv.sig para dividir el nodo

49 Como lo hace? SI Es X ordinal o continua? NO SI Tiene Y dos categorías? NO Transfomar X en dummys y calcular la mayor coordenada discriminante de Z Aplicar el Análisis Discriminante Cuadrático para determinar el punto de división Calcular la media de X para cada categoría de Y y aplicar un cluster de 2 medias a esas medias

50 Otras características equivalentes a C&RT Costo Complejo Poda del árbol Valores perdidos reemplazados utilizando otras variables predictoras

51 Recomendaciones A pesar de ser una herramienta para minería de datos, es importante sacar variables que sean simples medidas alternativas a la variable objetivo, y aquellas que no tengan porque tener relación con ella (cédula) Para muestras menores a 1000, reduzca el tamaño mínimo de nodo padre y filial, para muestras mayores a 10000, auméntelo (a menos que esté corriendo C&RT o QUEST)

52 Trucos Tenga en consideración si hace falta tener todas la categorías de la variable objetivo. Reducirlo a las relevantes arrojará un mejor resultado. Si necesita definir sus propias particiones dentro de una variable predictora, hágalo.

53 Eficiencia Si hay variables nominales con muchas categorías, el esfuerzo computacional es considerable: 10 categorías: 511 combinaciones; 30 categorías : 536,870,911!!! Tenga en cuenta esto para decidir en que computador va a correr su análisis.

54 Tiempos N Datos Método 10 Predictores 50 Predictores CHAID 0:00:01 0:00:02 CHAID Exhaustivo 0:00:01 0:00: C&RT 0:00:02 0:00:09 QUEST 0:00:04 0:00:16 C&RT (Variable Continua) 0:00:03 0:00:14 CHAID 0:00:04 0:00:08 CHAID Exhaustivo 0:00:06 0:00: C&RT 0:08:45 0:50:00 QUEST 0:08:04 A C&RT (Variable Continua) 6:05: CHAID 0:00:10 0:00:30 CHAID Exhaustivo 0:00:15 0:00: C&RT 0:07:50 1:13:00 QUEST 0:14:45 A C&RT (Variable Continua)

ÍNDICE. Introducción... Capítulo 1. Técnicas de minería de datos y herramientas... 1

ÍNDICE. Introducción... Capítulo 1. Técnicas de minería de datos y herramientas... 1 ÍNDICE Introducción... XI Capítulo 1. Técnicas de minería de datos y herramientas... 1 Clasificación de las técnicas de minería de datos y herramientas más comunes... 1 Modelado originado por la teoría

Más detalles

Universidad Autónoma de Sinaloa

Universidad Autónoma de Sinaloa Séptima Edición del Diplomado en Estadística Mc. José V. Jiménez Ramírez Director de la Escuela de Ciencias Fisico-Matemáticas Tel. : 7 16 11 54 vidaljr@uas.uasnet.mx Dr. René Castro Montoya Coordinador

Más detalles

ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN

ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN Los árboles de clasificación y regresión (CART=Classification and Regression Trees) son una alternativa al análisis tradicional de clasificación/discriminación o a

Más detalles

Carteras minoristas. árbol de decisión. Ejemplo: Construcción de un scoring de concesión basado en un DIRECCIÓN GENERAL DE SUPERVISIÓN

Carteras minoristas. árbol de decisión. Ejemplo: Construcción de un scoring de concesión basado en un DIRECCIÓN GENERAL DE SUPERVISIÓN Carteras minoristas Ejemplo: Construcción de un scoring de concesión basado en un árbol de decisión Grupo de Tesorería y Modelos de Gestión de Riesgos Sergio Gavilá II Seminario sobre Basilea II Validación

Más detalles

Clustering: Auto-associative Multivariate Regression Tree (AAMRT)

Clustering: Auto-associative Multivariate Regression Tree (AAMRT) Introducción Tipos Validación AAMRT Clustering: Auto-associative Multivariate Regression Tree (AAMRT) Miguel Bernal C Quantil 12 de diciembre de 2013 Miguel Bernal C Quantil Matemáticas Aplicadas Contenido

Más detalles

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables

Más detalles

Nota de los autores... vi

Nota de los autores... vi ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...

Más detalles

Taller Minería de datos aplicados a la educación

Taller Minería de datos aplicados a la educación Taller Minería de datos aplicados a la educación 2ª parte Presentación del software PASW Modeler 27 de junio de 2011 Mercedes Torrado Departamento Métodos de Investigación y Diagnóstico en Educación (MIDE)

Más detalles

IBM SPSS Decision Trees 19

IBM SPSS Decision Trees 19 IBM SPSS Decision Trees 19 Note: Before using this information and the product it supports, read the general information under Notices el p. 114. This document contains proprietary information of SPSS

Más detalles

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema

Más detalles

Curso online de Supervivencia y Regresión Lineal, Logística y de Cox 2018

Curso online de Supervivencia y Regresión Lineal, Logística y de Cox 2018 MANUAL DE IDENTIDAD VSUAL CORPORATIVA PROGRAMA: Curso online de Supervivencia y Regresión Lineal, Logística y de Cox 2018 Departamento de Formación Médica Continuada (ICOMEM) SUPERVIVENCIA Y REGRESIÓN

Más detalles

Aprendizaje Supervisado Árboles de Decisión

Aprendizaje Supervisado Árboles de Decisión Aprendizaje Supervisado Árboles de Decisión 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No Soltero 70K No

Más detalles

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre

Más detalles

Complementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística

Complementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística ampliación de la currícula Maestría en Generación y Análisis de Información Estadística Programa abierto de ampliación de la currícula Maestría en Generación y Análisis de Información Estadística La Maestría

Más detalles

Universidad de Sonora Unidad Regional Centro División de Ciencias Biológicas y de la Salud Departamento que imparte la materia: Matemáticas

Universidad de Sonora Unidad Regional Centro División de Ciencias Biológicas y de la Salud Departamento que imparte la materia: Matemáticas Materia: Bioestadística I Universidad de Sonora Unidad Regional Centro División de Ciencias Biológicas y de la Salud Departamento que imparte la materia: Matemáticas Eje de Formación: Básica Carácter:

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL

Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL En esta clase se presenta un método de inducción de modelos numéricos de regresión a partir de datos. En el tema de técnicas clásicas se presentó la

Más detalles

Universidad Nacional Autónoma de México Facultad de Psicología

Universidad Nacional Autónoma de México Facultad de Psicología Universidad Nacional Autónoma de México Facultad de Psicología PROGRAMA DE ASIGNATURA Nombre de la asignatura Clave Semestre Estadística Inferencial 0186 4 Número de créditos 8 Horas teoría 4 Horas práctica

Más detalles

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja

Más detalles

Introducción a la minería de datos

Introducción a la minería de datos Introducción a la minería de datos 1 Temario Qué es minería de datos? Quién usa minería de datos? Por qué de la minería de datos? Ciclo virtuoso de la minería de datos 2 Definición de minería de datos

Más detalles

VIII Jornadas de Usuarios de R

VIII Jornadas de Usuarios de R VIII Jornadas de Usuarios de R Análisis del Abandono en el Sector Bancario Predicción del abandono de clientes Albacete, 17 de Noviembre de 2016 I. INDICE : Modelo Abandonos I. COMPRENSIÓN DEL NEGOCIO

Más detalles

Métodos de Remuestreo en Aprendizaje Automático

Métodos de Remuestreo en Aprendizaje Automático Métodos de Remuestreo en Aprendizaje Automático en datos, en hipótesis, y algunos otros trucos: Cross-validation, Bootstrap, Bagging, Boosting, Random Subspaces Lo que sabemos hasta ahora: Hemos visto

Más detalles

Aux 6. Introducción a la Minería de Datos

Aux 6. Introducción a la Minería de Datos Aux 6. Introducción a la Minería de Datos Gastón L Huillier 1,2, Richard Weber 2 glhuilli@dcc.uchile.cl 1 Departamento de Ciencias de la Computación Universidad de Chile 2 Departamento de Ingeniería Industrial

Más detalles

CAPÍTULO I. 1. Planteamiento del Problema

CAPÍTULO I. 1. Planteamiento del Problema CAPÍTULO I 1. Planteamiento del Problema Una empresa ecuatoriana exportadora de balsa requiere analizar los procesos inmersos en el aserrado de la madera en sus haciendas, con el objetivo de reducir el

Más detalles

U.N.P.S.J.B. FACULTAD DE INGENIERÍA Cátedra de ESTADÍSTICA Cátedra ESTADISTICA

U.N.P.S.J.B. FACULTAD DE INGENIERÍA Cátedra de ESTADÍSTICA Cátedra ESTADISTICA U.N.P.S.J.B. FACULTAD DE INGENIERÍA Cátedra de ESTADÍSTICA Cátedra ESTADISTICA TRABAJOS PRÁCTICOS Facultad de Ingeniería Universidad Nacional de La Patagonia S. J. B. Comodoro Rivadavia TEMA Nº.. REGRESIÓN

Más detalles

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos

Más detalles

Aprendizaje Automático

Aprendizaje Automático id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje

Más detalles

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Contrastes de hipótesis paramétricos para una y varias muestras: contrastes sobre la media, varianza y una proporción. Contrastes sobre la diferencia

Más detalles

MÉTODOS DE PRONÓSTICO TEMA 1: ANÁLISIS DE SERIES DE TIEMPO Y ELABORACIÓN DE PRONÓSTICOS

MÉTODOS DE PRONÓSTICO TEMA 1: ANÁLISIS DE SERIES DE TIEMPO Y ELABORACIÓN DE PRONÓSTICOS UNIDAD 4 MÉTODOS DE PRONÓSTICO TEMA 1: ANÁLISIS DE SERIES DE TIEMPO Y ELABORACIÓN DE PRONÓSTICOS Predicción de lo que sucederá en el futuro. 1 Predicción de lo que sucederá en el futuro. Los métodos de

Más detalles

Estadística con R. Clasificadores

Estadística con R. Clasificadores Estadística con R Clasificadores Análisis discriminante lineal (estadístico) Árbol de decisión (aprendizaje automático) Máquina soporte vector (aprendizaje automático) Análisis discriminante lineal (AD)

Más detalles

Capítulo 8. Selección de variables Introducción

Capítulo 8. Selección de variables Introducción Capítulo 8 Selección de variables 8.1. Introducción En muchos problemas de regresión es posible considerar un número importante de variables predictoras. Un empresario podría estudiar los factores que

Más detalles

Técnicas Multivariadas Avanzadas

Técnicas Multivariadas Avanzadas Métodos basados en árboles Universidad Nacional Agraria La Molina 2014-2 Introducción Introducción Se describen métodos basados en árboles para regresión y clasicación. Estos métodos requieren estraticar

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Entrada: Objetos caracterizables mediante propiedades. Salida: En árboles de decisión: una decisión (sí o no). En árboles de clasificación:

Más detalles

Clasificación Supervisada. Métodos jerárquicos. CART

Clasificación Supervisada. Métodos jerárquicos. CART Clasificación Supervisada. Métodos jerárquicos. CART Ricardo Fraiman 2 de abril de 2010 Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y n ) E {1,..., m}. Típicamente E = R d.

Más detalles

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 Ignacio Martín Tamayo 11 Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 ÍNDICE ------------------------------------------------------------- 1. Introducción 2. Frecuencias 3. Descriptivos 4. Explorar

Más detalles

Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1)

Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 24 de octubre de 2016 M.Bourel

Más detalles

Tema: Análisis de valores faltantes con SPSS

Tema: Análisis de valores faltantes con SPSS Tema: Análisis de valores faltantes con SPSS 1.- Introducción Hemos de comenzar advirtiendo que el Procedimiento Valores perdidos no se incluye en el sistema Base de SPSS, por lo que solo estará disponible

Más detalles

UNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad Gómez. Facultad Nacional de Salud Pública Héctor Abad Gómez

UNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad Gómez. Facultad Nacional de Salud Pública Héctor Abad Gómez UNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad Gómez Facultad Nacional de Salud Pública Héctor Abad Gómez La Regresión es una técnica estadística utilizadas para estimar (interpolar)

Más detalles

Guía docente 2007/2008

Guía docente 2007/2008 Guía docente 2007/2008 Plan 247 Lic.Investigación y Tec.Mercado Asignatura 43579 METODOS CUANTITATIVOS PARA LA INVESTIGACION DE MERCADOS Grupo 1 Presentación Métodos y técnicas cuantitativas de investigación

Más detalles

EVALUACIÓN EN APRENDIZAJE. Eduardo Morales y Jesús González

EVALUACIÓN EN APRENDIZAJE. Eduardo Morales y Jesús González EVALUACIÓN EN APRENDIZAJE Eduardo Morales y Jesús González Significancia Estadística 2 En estadística, se dice que un resultado es estadísticamente significante, cuando no es posible que se presente por

Más detalles

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por

Más detalles

Análisis de la evolución y tendencia de las tasas de hepatitis A en Chile desde a 2002

Análisis de la evolución y tendencia de las tasas de hepatitis A en Chile desde a 2002 Rev Chil Salud Pública CIFRAS DE HOY Análisis de la evolución y tendencia de las tasas de hepatitis A en Chile desde 197 5 a 2002 GABRIEL CA V ADAOJ, ROSA MONT AÑOOJ, SERGIO AL V ARADOOl, MARÍA TERESA

Más detalles

Temario. SEMANA 1 3 al 7 de Febrero. Expositor: Dr. C. Rodrigo E. Elizondo Omaña

Temario. SEMANA 1 3 al 7 de Febrero. Expositor: Dr. C. Rodrigo E. Elizondo Omaña Temario SEMANA 1 3 al 7 de Febrero Expositor: Dr. C. Rodrigo E. Elizondo Omaña 1. Bienvenida 2. Presentación del GIA 3. Líneas de investigación existentes 4. La investigación científica en el Departamento

Más detalles

Introducción a la Estadística Aplicada en la Química

Introducción a la Estadística Aplicada en la Química Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00

Más detalles

Universidad de Puerto Rico Recinto de Río Piedras Facultad de Educación Escuela Secundaria. Prontuario del Curso Estadística y Probabilidad

Universidad de Puerto Rico Recinto de Río Piedras Facultad de Educación Escuela Secundaria. Prontuario del Curso Estadística y Probabilidad Universidad de Puerto Rico Recinto de Río Piedras Facultad de Educación Escuela Secundaria Prontuario del Curso Estadística y Probabilidad Preparado por:, Ed.D. I. Curso: Probabilidad y estadística, Codificación:

Más detalles

SPSS Classification Trees 13.0

SPSS Classification Trees 13.0 SPSS Classification Trees 13.0 Si desea obtener más información sobre los productos de software de SPSS, visite nuestra página Web en http://www.spss.com o póngase en contacto con SPSS Inc. 233 South Wacker

Más detalles

DIRECCIÓN Y ADMINISTRACIÓN DE PEQUEÑAS EMPRESAS

DIRECCIÓN Y ADMINISTRACIÓN DE PEQUEÑAS EMPRESAS DIRECCIÓN Y ADMINISTRACIÓN DE PEQUEÑAS EMPRESAS Modulo tercero (integración). Clave de asignatura LC 735 PROFESOR: C.P. DAVID ARREDONDO ALCANTAR 1.- PRONOSTICOS 1.3.- Tipos de pronósticos. Los pronósticos

Más detalles

Lingüística computacional

Lingüística computacional Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje

Más detalles

IBM SPSS - Árboles de decisiones 25 IBM

IBM SPSS - Árboles de decisiones 25 IBM IBM SPSS - Árboles de decisiones 25 IBM Nota Antes de utilizar esta información y el producto al que da soporte, lea la información del apartado Aisos en la página 23. Product Information Esta edición

Más detalles

2. Rentabilidad y riesgo

2. Rentabilidad y riesgo 2. Rentabilidad y riesgo INSTITUTO TECNOLOGICO DE LA LAGUNA ADMINISTRACIÓN FINANCIERA II Dra. Diana Margarita Vázquez Peña TEMA DOS No existe inversión sin riesgo, aunque algunos productos tienen más riesgo

Más detalles

Métodos de Clasificación sin Métrica. Reconocimiento de Patrones- 2013

Métodos de Clasificación sin Métrica. Reconocimiento de Patrones- 2013 Métodos de Clasificación sin Métrica Reconocimiento de Patrones- 03 Métodos de Clasificación sin Métrica Datos nominales sin noción de similitud o distancia (sin orden). Escala nominal: conjunto de categorías

Más detalles

PRACTICUM 3: Finanzas y Contabilidad Pública

PRACTICUM 3: Finanzas y Contabilidad Pública PRACTICUM 3: Finanzas y Contabilidad Pública archivo 11 Investigación de mercados Causal Christian Cruz Castro 1. Recapitulación aportación 1 2 3 Lean Startup Customer = CANVAS + + Development Produccción

Más detalles

Aprendizaje Automatizado. Árboles de Clasificación

Aprendizaje Automatizado. Árboles de Clasificación Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles

Más detalles

ANÁLISIS DE REGRESIÓN

ANÁLISIS DE REGRESIÓN ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y

Más detalles

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos

Más detalles

SISTEMAS INTELIGENTES

SISTEMAS INTELIGENTES SISTEMAS INTELIGENTES T9: Árboles de Decisión www.aic.uniovi.es/ssii Sistemas Inteligentes T9: Árboles de decisión Índice Árboles de decisión para clasificación Mecanismo de inducción: divide y vencerás

Más detalles

N T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA

N T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA N T E N.. IDO PREFACIO xiv CAPíTULO I LA IMAGINACiÓN ESTADíSTICA Introducción La imaginación estadística 3 Enlace de la imaginación estadística con la imaginación sociológica 4 Normas estadísticas y normas

Más detalles

> plot(salmon[,- 1],col=as.factor(salmon[,1]))

> plot(salmon[,- 1],col=as.factor(salmon[,1])) ANÁLISIS DISCRIMINANTE El análisis discriminante, se utiliza para identificar las características que permiten diferenciar a dos o más grupos de sujetos; además para clasificar nuevos casos como pertenecientes

Más detalles

CASO 5-3 MILAN FOOD COOPERATIVE (B)

CASO 5-3 MILAN FOOD COOPERATIVE (B) CASO 5-3 MILAN FOOD COOPERATIVE (B) INTRODUCCIÓN Éste es una continuación del caso Milan Food Cooperative (A), de la parte 4 del texto. Aquí se presentan los resultados del análisis de correlación y regresión

Más detalles

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Introducción a la minería de datos CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Minería de datos Detección, interpretación y predicción de patrones cuantitativos y cualitativos

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 11 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Resolución manual de clasificación bayesiana

Más detalles

Ejercicios y Talleres. puedes enviarlos a

Ejercicios y Talleres. puedes enviarlos a Ejercicios y Talleres puedes enviarlos a klasesdematematicasymas@gmail.com TRABAJO DE APLICACIÓN La siguiente base de datos se conformó por la información suministrada en la entidad financiera BankAmerica,

Más detalles

Métodos de Diseño y Análisis de Experimentos

Métodos de Diseño y Análisis de Experimentos 1 / 28 Métodos de Diseño y Análisis de Experimentos Patricia Isabel Romero Mares Departamento de Probabilidad y Estadística IIMAS UNAM marzo 2018 Ideas básicas del diseño experimental Capítulo 4 de Analysis

Más detalles

INDICE Capitulo 1. Nociones Básicos sobre el SPSS/PC+ Capitulo 2. Nociones Básicos sobre Probabilidad

INDICE Capitulo 1. Nociones Básicos sobre el SPSS/PC+ Capitulo 2. Nociones Básicos sobre Probabilidad INDICE Prólogo XIX Introducción XXIII Capitulo 1. Nociones Básicos sobre el SPSS/PC+ 1 1. Qué es y para qué sirve el SPSS/PC+ 1 2. funcionamiento general 1 A. Módulos, comandos y subcomandos 1 B. Estilos

Más detalles

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos

Más detalles

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 7) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 7) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 7) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía VIDEOCLASE: La Correlación. https://www.intecca.uned.es/portalavip/grabacion.php?id_grabacion=56932&id_sala=605

Más detalles

Ideas básicas del diseño experimental

Ideas básicas del diseño experimental Ideas básicas del diseño experimental Capítulo 4 de Analysis of Messy Data. Milliken y Johnson (1992) Diseño de experimentos p. 1/23 Ideas básicas del diseño experimental Antes de llevar a cabo un experimento,

Más detalles

Lucila Finkel Temario

Lucila Finkel Temario Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión

Más detalles

Minería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria

Minería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego

Más detalles

Minería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria

Minería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego

Más detalles

TABLA DE CONTENIDO. Resumen Introducción Entorno relevante asociado al proyecto Contexto de la Industria...

TABLA DE CONTENIDO. Resumen Introducción Entorno relevante asociado al proyecto Contexto de la Industria... TABLA DE CONTENIDO Resumen... 2 1 Introducción... 15 2 Entorno relevante asociado al proyecto... 16 2.1 Contexto de la Industria... 16 2.1.1 Mercado de metales en el mundo... 16 2.1.2 Industria Minera

Más detalles

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos

Más detalles

Método de cuadrados mínimos

Método de cuadrados mínimos REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,

Más detalles

Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN

Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN 165 ENCUESTA DE COMPORTAMIENTOS Y TIPOLOGÍAS DE VISITANTES EN EUSKADI 166 ANEXO I. CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN

Más detalles

ESTADISTICA PARA LA CALIBRACIÓN Y VALIDACIÓN DE METODOLOGÍAS ANALÍTICAS

ESTADISTICA PARA LA CALIBRACIÓN Y VALIDACIÓN DE METODOLOGÍAS ANALÍTICAS ESTADISTICA PARA LA CALIBRACIÓN Y VALIDACIÓN DE METODOLOGÍAS ANALÍTICAS QUÍMICA ANALÍTICA EXPERIMENTAL III SILVIA CITLALLI GAMA GONZÁLEZ PROBLEMA Cuando la cantidad de materia del analito que se encuentra

Más detalles

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS ÍNDICE Introducción: Entrene su cerebro para la estadística... 1 La población y la muestra... 3 Estadísticas descriptivas e inferenciales... 4 Alcanzar el objetivo de estadísticas inferenciales: los pasos

Más detalles

Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis

Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis VDC Prof. Mª JOSÉ PRIETO CASTELLÓ MÉTODOS ESTADÍSTICOS. TÉCNICAS ESTADÍSTICA DESCRIPTIVA TEORÍA DE LA PROBABILIDAD

Más detalles

ÍNDICE. Capítulo 1. Técnicas de segmentación. Conceptos y clasificación... 1

ÍNDICE. Capítulo 1. Técnicas de segmentación. Conceptos y clasificación... 1 ÍNDICE Capítulo 1. Técnicas de segmentación. Conceptos y clasificación... 1 Conceptos básicos... 1 Clasificación de las técnicas de segmentación... 1 Técnicas predictivas y descriptivas... 1 Técnicas Ad-Hoc

Más detalles

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.

Más detalles

2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores. Inducción de árboles de clasificación. Aprendizaje UPM UPM

2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores. Inducción de árboles de clasificación. Aprendizaje UPM UPM 1. Preliminares Aprendizaje 2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores 4. Inducción de reglas 5. Minería de datos c 2010 DIT-ETSIT- Aprendizaje: árboles transp. 1

Más detalles

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de

Más detalles

CONTROL ESTADISTICO DE LA CALIDAD

CONTROL ESTADISTICO DE LA CALIDAD CICLO 2012-II Módulo: Unidad: 4 Semana: 4 CONTROL ESTADISTICO DE LA CALIDAD Ing. Enrique Montenegro Marcelo GRAFICOS DE CONTROL ORIENTACIONES Al finalizar este capitulo el alumno deberá poder construir

Más detalles

MODELADO CALIBRACIÓN MULTIVARIADA

MODELADO CALIBRACIÓN MULTIVARIADA MODELADO CALIBRACIÓN MULTIVARIADA Calibración multivariada un método multivariado implica que: existe una dependencia múltiple de la variable x (independiente) y múltiples variables y (dependiente) el

Más detalles

Segmentación de clientes. Dra. Adriana Amigo

Segmentación de clientes. Dra. Adriana Amigo Dra. Adriana Amigo Objetivos de su tratamiento Temario Actividades propuestas para la mejor comprensión del tema. Objetivos de su tratamiento Conceptualizar el proceso de segmentación de clientes. Interrelacionar

Más detalles

Análisis Probit. StatFolio de Ejemplo: probit.sgp

Análisis Probit. StatFolio de Ejemplo: probit.sgp STATGRAPHICS Rev. 4/25/27 Análisis Probit Resumen El procedimiento Análisis Probit está diseñado para ajustar un modelo de regresión en el cual la variable dependiente Y caracteriza un evento con sólo

Más detalles

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10 Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores

Más detalles

DISEÑOS EXPERIMENTALES DE DOS GRUPOS Y MULTIGRUPO

DISEÑOS EXPERIMENTALES DE DOS GRUPOS Y MULTIGRUPO TEMA II ESQUEMA GENERAL Diseño experimental de dos grupos: definición y clasificación Formatos del diseño y prueba de hipótesis Diseño experimental multigrupo: definición Formato del diseño multigrupo

Más detalles

ANALIZAR Comparar medias

ANALIZAR Comparar medias Diseño entre-grupos univariado unifactorial con A>2. Contraste de hipótesis específicas Dolores Frías-Navarro Universidad de Valencia http://www.uv.es/friasnav/ Hasta ahora hemos ido desarrollando las

Más detalles

Ejemplo Diseño Completamente aleatorizado (Pág. 470 Montgomery)

Ejemplo Diseño Completamente aleatorizado (Pág. 470 Montgomery) Ejemplo Diseño Completamente aleatorizado (Pág. 47 Montgomery) ) Representación gráfica de los datos mediante diagramas de caja Resumen del procesamiento de los casos Tension del papel (psi) Casos Válidos

Más detalles

Inteligencia Artificial: Su uso para la investigación

Inteligencia Artificial: Su uso para la investigación Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas helena.adorno@iimas.unam.mx 1 Introducción

Más detalles

ÍNDICE. Prefacio... xi

ÍNDICE. Prefacio... xi ÍNDICE Prefacio... xi Capítulo 1 Introducción... 1 1.1 Por qué hay que tomar este curso y quién utiliza la estadística?... 2 1.2 Historia... 3 1.3 Subdivisiones de la estadística... 4 1.4 Un enfoque simple

Más detalles

Curso: 4 Créditos ECTS: 6 Tipo de asignatura: Optativa Tipo de formación: Teórico-práctica

Curso: 4 Créditos ECTS: 6 Tipo de asignatura: Optativa Tipo de formación: Teórico-práctica Ficha Técnica Titulación: Plan BOE: Asignatura: Módulo: Grado en Criminología BOE número 75 de 28 de marzo de 2012/Correción de errores en BOE número 85 de 9 de abril de 2012 Optativas Curso: 4 Créditos

Más detalles

Proyecto PropULSA: Estadística y Probabilidad Breviario Académico

Proyecto PropULSA:  Estadística y Probabilidad Breviario Académico Estadística y Probabilidad Breviario Académico Estadística: Es la ciencia que tiene por objetivo recolectar, escribir e interpretar datos, con la finalidad de efectuar una adecuada toma de decisiones en

Más detalles

Selección de fuentes de datos y calidad de datos

Selección de fuentes de datos y calidad de datos Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago . Valores atípicos. Valores faltantes.

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON

INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos

Más detalles

TEMA I CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES

TEMA I CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES TEMA I CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES LECTURA OBLIGATORIA Algunas cuestiones previas. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en

Más detalles

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows. TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente

Más detalles