Introducción a SPSS Árboles de Clasificación. Jorge Del Río L. Consultor Estadístico
|
|
- Ana Navarrete Torres
- hace 7 años
- Vistas:
Transcripción
1 Introducción a SPSS Árboles de Clasificación Jorge Del Río L. Consultor Estadístico
2 Introducción Es un módulo que contiene diferentes procedimientos para resolver problemas de predicción y clasificación utilizando análisis de árboles de decisión. Es capaz de combinar a través de un conjunto de variables independientes y sucesivamente particionando la data en subgrupos de mejorar la predicción o clasificación de una variable objetivo. Es una técnica valiosa cuando deseamos construir modelos con gran cantidad de variables independientes o con poca teoría previa que sirva de guía.
3 Análisis basado en árboles Los procedimientos tradicionales implican el ajuste de un modelo (regresión por ejemplo) según el comportamiento de los datos. Los árboles de decisión dividen los datos sucesivamente con base a algún criterio que implique relaciones entre las variables predictoras y la variable objetivo.
4 Análisis basado en árboles Cuando se tiene éxito, el árbol que resulta indica qué variables predictoras están relacionadas con mayor fuerza con la variable objetivo. Los nodos terminales muestran los grupos que pueden tener una mayor concentración de casos con la característica deseada.
5 Usos Generales de los Árboles de Decisión Segmentación. Identificar personas son probablemente miembros de un grupo. Estratificación. Asignación de casos a categorías. Predicción. Creación de reglas para predecir eventos futuros. Reducción de datos y filtro de variables. Seleccionar un subconjunto de variables para contruir un modelo paramétrico. Identificación de interacciones. Identificar relaciones que pertenezcan a subgrupos específicos. Fusión de categorías. Colapsar variables contínuas en categorías discretas.
6 Aplicaciones de los Árboles de Decisión Correo directo. Determinar grupos demográficos con alta tasa de respuesta. Credit Scoring. Usar historial crediticio para tomar decisiones de crédito. Recursos Humanos. Entender las reglas de pasadas de contratación para afinar el proceso. Análisis de mercado. Determinación de variables geográficas, precios, características del consumidor y otras
7 Aplicaciones de los Árboles de Decisión Control de calidad. Determinación de productos defectuosos. Estudio de políticas. Generar reglas de decisión en las políticas de contratación. Salud. Descubrir variables que contribuyan a mejores resultados de salud.
8 Ventajas y desventajas sobre modelos tradicionales Diseñados para trabajar con un número elevado de variables (CHAID vs loglineal) Como métodos no paramétricos capturan relaciones que los modelos lineales no pueden capturar (relaciones no lineales e interacciones complejas). No genera una ecuación general que exprese el modelo.
9 Por qué cuatro métodos? Diferentes métodos pueden manejar diferentes tipos medida en las variables. Uso o no de criterios estadísticos al momento de escoger y partir variables. Si se incorporan o no costos de clasificación errónea y probabilidades a priori. Esfuerzo computacional de la máquina.
10 Comparación Característica CHAID CHAID Exahustivo C&RT QUEST Tipo de Partición Múltiple Múltiple Binaria Binaria Dependiente Continua Sí Sí Sí No Predictoras Continuas Si (*) Si (*) Sí Sí Coste de Mala Clasificación (Crecimiento del Arbol) Pruebas Estadísticas (Selección del Predictor) Pruebas Estadísticas (Particionar) No No Sí Sí Sí Sí No Sí Sí Sí No No Velocidad Moderada Moderada Lento Moderada/Lento Utiliza A priori? No No Sí Sí Valores Faltantes para los Predictores Usados? Si, como una categoría Si, como una categoría No, Sustitutos usados para partición No, Sustitutos usados para partición
11 Recomendaciones El análisis de datos requiere de una participación humana atenta. Siempre mire los datos en bruto. Conozca las características en sus datos antes de emprender un proyecto grande. Limpie los datos o esté conciente de cualquier irregularidad en ellos. Valide sus resultados con nuevos datos o con una muestra de prueba. Si es posible utilice modelos estadísticos tradicionales para extender y verificar lo aprendido.
12 Tabla de Ganancia de Nodos Nodo. Número del nodo. Nodo N. Número de casos dentro de un nodo. Nodo Porcentaje. Porcentaje de personas en el nodo contra la muestra completa. Ganancia N. N de casos en el nodo que caen dentro de la categoría objetivo. Ganancia Porcentaje. Porcentaje de personas en la categoría objetivo contra el N total de la categoría objetivo. Respuesta. Tasa de respuesta en el nodo para la categoría objetivo. Índice. Radio del nodo de respuesta versus la respuesta de la muestra total.
13 CHAID y CHAID Exhaustivo
14 Qué es CHAID? Chi-square Automatic Interaction Detector (Detector Automático de Interacción Chi-cuadrado). El modelo CHAID es un método exploratorio del análisis de datos usado para estudiar las relaciones entre una variable dependiente y una serie grande de variables predictoras. CHAID selecciona un sistema de predictores y de sus interacciones que predicen óptimamente la medida de la variable dependiente.
15 Qué es CHAID? El modelo desarrolla un árbol de clasificación con los perfiles más importantes formados por las variables independientes diferenciado los criterios de una variable dependiente. CHAIS es puede proveer información relevante sobre una variable dependiente, donde modelos formales tienen dificultades (como muchas variables categóricas o un limitado tamaño de muestra).
16 Principios y Consideraciones CHAID tiende a crear árboles amplios más que los métodos binarios. Funciona con todo tipo de variables (cualitativas y cuantitativas) CHAID comienza su análisis seleccionando la variable independiente más significativa (menor p-value). Si la variable independiente tiene más de 2 categorías, CHAID las compara y une las categorías que no muestren diferencias en el resultado. Para variables nominales, cualquier categoría puede ser unida, mientras que para ordinales solo categorías contiguas. Por lo tanto, CHAID divide la data sistemáticamente en subgrupos que muestren diferencias significativas.
17 Lectura de un Diagrama CHAID Los diagramas CHAID se deben pensar como el "tronco de un árbol" con particiones progresivas en "ramas más pequeñas. El "tronco inicial del árbol" son todos los participantes en el estudio. Las variables predictoras conducen a una discriminación estadísticamente significativa. El "más significativo" define la primera partición de la muestra, o la primera ramificación del árbol.
18 Lectura de un Diagrama CHAID Entonces, cada uno de los nuevos grupos formados, son particionados por otra de las variables predictoras, etc. El resultado al final del proceso es un árbol que presenta una serie de grupos con diferencias máximas sobre la variable dependiente. En cada paso, las pruebas estadísticas se hacen para determinar si una partición es significativa y puede ser hecha.
19 Ventajas El nivel de medida para la variable dependiente y las variables predictoras pueden ser nominal, ordinal o intervalo. No todas las variables predictoras necesitan ser medidas en el mismo nivel. Los valores faltantes se pueden tratar como una "categoría flotante" para poder utilizar los datos parciales, siempre que sea posible dentro del árbol. Un sistema apropiadamente conservador de criterios estadísticos se utiliza, y los modelos que resultan acentúan los resultados más fuertes.
20 Opciones Técnicas Ajuste del.05 de Bonferroni sobre las probabilidades Un tamaño mínimo del nodo padre de 10 Un tamaño mínimo del nodo hijo de 5. La capacidad de partir o combinar continuamente las categorías de las variables predictoras. En algunos casos, estas opciones técnicas se ajustan según el tamaño de muestra o se basan en conocimiento anterior sobre las variables.
21 Notas sobre CHAID Es un método útil para resumir datos, y puede mostrar divisiones naturales importantes sobre los clientes. Los modelos presentados se deben considerar como sugestivos, pero no absolutamente definitivos, se pueden complementar con modelos estadísticos tradicionales.
22 CHAID y Regresión Logística CHAID: diseñado para detectar interacciones Reg. Logística: Detección puede ser dirigida a incluir interacciones. R. Logística acepta variables continuas mientras que CHAID necesita discretizarlas. Si tiene muchas variables continuas cuya interacción se sospecha no esta relacionada con salida. R. Logística Si tiene muchas variables categóricas cuyas interacciones se relacionan con la v. objetivo. CHAID
23 Extensión CHAID y Características Adicionales
24 Introducción Se estudiará la importancia de la validación del modelo. Dificultad del procedimiento: Es más probable que el modelo se ajuste a la data. Se recomienda evaluar el modelo aplicado a otra data. El Statistics maneja 2 tipos de validación: Partición. Validación cruzada.
25 Introducción Adicionalmente se analizarán la incorporación de beneficios y perdidas. Por defecto CHAID asume que la clasificación errónea es igualmente costosa aunque esto no siempre es así. Podemos proveer valores para el costo de una mala clasificación.
26 Validación Los modelos tienden a modelar bien la data con la que fueron realizados pero no en otras muestras. Dividir los datos en 2 muestras, una para entrenamiento y otra para prueba es la solución más sugerida por los estadísticos. El investigador define la cantidad de casos que incluirá cada muestra. No hay regla para la cantidad de datos 50% a 90% de data para entrenamiento
27 Validación Cuando no se tiene el tamaño de muestra necesario para realizar una partición de los datos, se recurre a la Validación Cruzada. Muestra pequeña: Validación Cruzada Divide la muestra en subgrupos iguales Promedio de los errores: Tabla de riesgo Los árboles son generados, excluyendo data de cada subgrupo A tener en cuenta: Procesamiento Muestras relacionadas Se recomienda utilizar la validación cruzada para muestras menores a 1000 casos. De lo contrario utilizar la partición de la muestra.
28 Incorporando Ganancias Incorpora valores de rentabilidad para la categoría de respuesta Direct mail o Marketing de Base de Datos No afectan al crecimiento del árbol Ejemplo: Aceptar o rechazar una nueva tarjeta Estimar la ganancia por tarjeta aceptada
29 Costo de Clasificación Errónea Diferente del concepto de rentabilidad, esta no proviene de errores. Pueden influir en el crecimiento del árbol y asignación de casos (CRT) Permite asignar a una categoría específica un costo de clasificación errónea. CHAID incorpora estos costos una vez que es árbol ha sido elaborado. En resumen, la incorporación de costos, afecta la de designación de nodos para evitar el error más costoso.
30 Árboles de Clasificación y Regresión (C&RT) Classification and Regression Trees
31 El Método C&RT Breiman, Friedman, Olshen y Stone (1984) C&RT hace separaciones binarias sucesivas en los datos guiándose por un criterio, no una prueba estadística como lo hace CHAID. En cada nodo, la variable predictora que mejore más el criterio, se usa para hacer la siguiente partición. Los árboles creados con este criterio se dejan crecer ampliamente y después son podados: podar minimizando el costo complejo.
32 Impureza Es el nombre del criterio para crecer el árbol con una variable objetivo nominal. Captura el grado en el que los casos dentro de un nodo están concentrados en una sola categoría. Un nodo puro es aquel en que todos los casos están en una sola categoría. El mayor grado de impureza se da cuando todas las categorías de una variable predictora contienen la misma cantidad de casos, es decir todas las categorías o clases aparecen en igual proporción, siendo este nodo nada util.
33 Impureza Medidas de Impureza Gini: Si P(t)i es la proporción de casos en el nodo t de la categoría i, la medida de dispersión es: g( t) 1 i 2 p i La impureza no solo se mide para un sólo nodo: El promedio ponderado de los valores de impureza de cada nodo, es la medida de impureza de toda la rama. C&RT parte el árbol con el predictor que más disminuye la impureza. En el diagrama del árbol se muestra la MEJORA.
34 Costo Complejo Crecer un árbol indefinidamente, casi siempre reduce la impureza. La medida de costo complejo aumenta en la medida en que el árbol es más grande. CostoCompl ex R( T) a* T R(T): medida de riesgo de clasificacion erronea del árbol o rama a: coeficiente de penalidad T : número de nodos terminales del árbol o rama. Para mejorar la medida de costos complejo, el componente de sustitución de riesgo debe disminuir más que la penalidad.
35 Costo complejo y poda La medida de costo complejo funciona bien si se deja crecer el árbol bastante, y luego se poda utilizando este criterio. El método consiste en podar ramas de manera sucesiva con base a la máxima reducción de la medida de costo complejo. De los árboles, se escoge el árbol más pequeño, cuyo riesgo (probabilidad de clasificar erróneamente) esté dentro de un rango de un error estándar del menor riesgo encontrado durante el crecimiento del árbol.
36 Cómo se hacen las particiones? Para predictoras continuos u ordinales: Se ordenan los datos dentro de los nodos por los valores de las categorías de la variable predictora. Se calcula la disminución en impureza para todos los posibles puntos de corte. Se determina la mejor partición.
37 Cómo se hacen las particiones? Para predictoras nominales Todas las posibles combinaciones de sus categorías son evaluadas, y la partición se hace cuando se encuentra la mayor reducción en impureza. Esto hace que un misma variable predictora pueda aparecer muchas veces dentro de una rama.
38 Valores perdidos y Sustitutos En CHAID los valores perdidos se tratan como una categoría diferente. En C&RT estos casos se utilizan en el análisis reemplazándolos con una estimación que depende de la clasificación según la mejor variable predictora disponible.
39 C&RT, CHAID y Regresión Logística CHAID y regresión logística son más rápidas y están basadas en pruebas estadísticas. CHAID junta categorías de las variables predictoras continuas en categorías ordinales antes del análisis.c&rt crea particiones durante el análisis.
40 Árboles de Regresión La parte RT de C&RT es la que nos permite predecir variables objetivo que sean continuas. Es una alternativa atractiva puesto que puede capturar, de manera nativa, relaciones no lineales entre variables, además de efectos de interacción. Una opción óptima es correr un RT que identifique variables relevantes y posibles interacciones y relaciones no lineales para luego correr la regresión
41 El método de regresión Puesto que la variable objetivo es continua, el criterio es minimizar la varianza dentro de cada nodo, obteniendo así los nodos más homogéneos sobre la variable objetivo. De la misma manera de CT, el crecimiento del árbol seguido de la poda es la base de RT
42 C&RT, CHAID y Regresión Logística Si existen relaciones cuasi lineales entre una predictora y la proporción de la variable objetivo, C&RT tratará de capturar esta relación con particiones binarias sucesivas, CHAID con una partición multicategórica y ninguna será tan eficiente como RL. Sin embargo CHAID y C&RT pueden capturar relaciones no lineales e interacciones complejas.
43 Impureza El criterio de impureza se mantiene pero se mide de acuerdo a la varianza al interior del nodo. Captura el grado en el que las respuestas dentro de un nodo están concentradas alrededor de un solo valor. La impureza de una rama es el promedio ponderado de las varianzas de los nodos terminales.
44 Costos y probabilidades a priori Para una variable objetivo continua, no hay categorías a las cuales asignarle beneficios o probabilidades. Si los costos se consideran relevantes, estarían asociados a la distancia entre el valor pronosticado y el verdadero, que está implícito en la varianza.
45 QUEST Analysis Quick Unbiased Efficient Statistical Tree
46 Dos razones para desarrollar QUEST Reducir el tiempo de procesamiento que tenía C&RT. Reducir la tendencia de CHAID de favorecer variables continuas o aquellas con muchas categorías (corrección de Bonferroni)
47 Complejidad computacional. Una variable ordinal con n valores en un nodo conlleva (n-1) divisiones, por lo que el numero de cálculos en cada nota aumenta de forma proporcional al numero de valores. Sesgos en la selección de variables. Pero un problema mas serio desde el punto de vista interpretativo y de generalización, de resultados es que los métodos exhaustivo tienen a seleccionar aquellas variables que cuentan con un mayor numero de categorías. El proceso se repite de forma recursiva hasta que salta alguna de las reglas de Parada, gracias a este procedimiento de cálculo, Quest: *Apenas muestra sesgos de respuesta *Muestra una mayor simplicidad de calculo *Permite incluir métodos de validación mediante poda *Permite incorporar combinaciones lineales de variables Comparando Quest con métodos exhaustivos se han comprobado que cuando se utilizan divisiones univariadas, no existe un ganador claro.
48 El método Quest Sea X Se calcula niv. Sig: Chi-cuadrado o ANOVA se selecciona al menor SI Es menor que alfa preestablecido? NO Se selecciona Para división SI Se usa Levene Su niv.sig es menor a alfa? NO Seleccionar la variable para dividir Seleccionar la var con el menor niv.sig para dividir el nodo
49 Como lo hace? SI Es X ordinal o continua? NO SI Tiene Y dos categorías? NO Transfomar X en dummys y calcular la mayor coordenada discriminante de Z Aplicar el Análisis Discriminante Cuadrático para determinar el punto de división Calcular la media de X para cada categoría de Y y aplicar un cluster de 2 medias a esas medias
50 Otras características equivalentes a C&RT Costo Complejo Poda del árbol Valores perdidos reemplazados utilizando otras variables predictoras
51 Recomendaciones A pesar de ser una herramienta para minería de datos, es importante sacar variables que sean simples medidas alternativas a la variable objetivo, y aquellas que no tengan porque tener relación con ella (cédula) Para muestras menores a 1000, reduzca el tamaño mínimo de nodo padre y filial, para muestras mayores a 10000, auméntelo (a menos que esté corriendo C&RT o QUEST)
52 Trucos Tenga en consideración si hace falta tener todas la categorías de la variable objetivo. Reducirlo a las relevantes arrojará un mejor resultado. Si necesita definir sus propias particiones dentro de una variable predictora, hágalo.
53 Eficiencia Si hay variables nominales con muchas categorías, el esfuerzo computacional es considerable: 10 categorías: 511 combinaciones; 30 categorías : 536,870,911!!! Tenga en cuenta esto para decidir en que computador va a correr su análisis.
54 Tiempos N Datos Método 10 Predictores 50 Predictores CHAID 0:00:01 0:00:02 CHAID Exhaustivo 0:00:01 0:00: C&RT 0:00:02 0:00:09 QUEST 0:00:04 0:00:16 C&RT (Variable Continua) 0:00:03 0:00:14 CHAID 0:00:04 0:00:08 CHAID Exhaustivo 0:00:06 0:00: C&RT 0:08:45 0:50:00 QUEST 0:08:04 A C&RT (Variable Continua) 6:05: CHAID 0:00:10 0:00:30 CHAID Exhaustivo 0:00:15 0:00: C&RT 0:07:50 1:13:00 QUEST 0:14:45 A C&RT (Variable Continua)
ÍNDICE. Introducción... Capítulo 1. Técnicas de minería de datos y herramientas... 1
ÍNDICE Introducción... XI Capítulo 1. Técnicas de minería de datos y herramientas... 1 Clasificación de las técnicas de minería de datos y herramientas más comunes... 1 Modelado originado por la teoría
Más detallesUniversidad Autónoma de Sinaloa
Séptima Edición del Diplomado en Estadística Mc. José V. Jiménez Ramírez Director de la Escuela de Ciencias Fisico-Matemáticas Tel. : 7 16 11 54 vidaljr@uas.uasnet.mx Dr. René Castro Montoya Coordinador
Más detallesÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN
ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN Los árboles de clasificación y regresión (CART=Classification and Regression Trees) son una alternativa al análisis tradicional de clasificación/discriminación o a
Más detallesCarteras minoristas. árbol de decisión. Ejemplo: Construcción de un scoring de concesión basado en un DIRECCIÓN GENERAL DE SUPERVISIÓN
Carteras minoristas Ejemplo: Construcción de un scoring de concesión basado en un árbol de decisión Grupo de Tesorería y Modelos de Gestión de Riesgos Sergio Gavilá II Seminario sobre Basilea II Validación
Más detallesClustering: Auto-associative Multivariate Regression Tree (AAMRT)
Introducción Tipos Validación AAMRT Clustering: Auto-associative Multivariate Regression Tree (AAMRT) Miguel Bernal C Quantil 12 de diciembre de 2013 Miguel Bernal C Quantil Matemáticas Aplicadas Contenido
Más detallesINDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica
INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables
Más detallesNota de los autores... vi
ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...
Más detallesTaller Minería de datos aplicados a la educación
Taller Minería de datos aplicados a la educación 2ª parte Presentación del software PASW Modeler 27 de junio de 2011 Mercedes Torrado Departamento Métodos de Investigación y Diagnóstico en Educación (MIDE)
Más detallesIBM SPSS Decision Trees 19
IBM SPSS Decision Trees 19 Note: Before using this information and the product it supports, read the general information under Notices el p. 114. This document contains proprietary information of SPSS
Más detallesMétodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández
Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema
Más detallesCurso online de Supervivencia y Regresión Lineal, Logística y de Cox 2018
MANUAL DE IDENTIDAD VSUAL CORPORATIVA PROGRAMA: Curso online de Supervivencia y Regresión Lineal, Logística y de Cox 2018 Departamento de Formación Médica Continuada (ICOMEM) SUPERVIVENCIA Y REGRESIÓN
Más detallesAprendizaje Supervisado Árboles de Decisión
Aprendizaje Supervisado Árboles de Decisión 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No Soltero 70K No
Más detallesCorrelación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
Más detallesComplementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística
ampliación de la currícula Maestría en Generación y Análisis de Información Estadística Programa abierto de ampliación de la currícula Maestría en Generación y Análisis de Información Estadística La Maestría
Más detallesUniversidad de Sonora Unidad Regional Centro División de Ciencias Biológicas y de la Salud Departamento que imparte la materia: Matemáticas
Materia: Bioestadística I Universidad de Sonora Unidad Regional Centro División de Ciencias Biológicas y de la Salud Departamento que imparte la materia: Matemáticas Eje de Formación: Básica Carácter:
Más detallesINDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Más detallesJesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL
Jesús García Herrero TÉCNICAS DE REGRESIÓN NO LINEAL En esta clase se presenta un método de inducción de modelos numéricos de regresión a partir de datos. En el tema de técnicas clásicas se presentó la
Más detallesUniversidad Nacional Autónoma de México Facultad de Psicología
Universidad Nacional Autónoma de México Facultad de Psicología PROGRAMA DE ASIGNATURA Nombre de la asignatura Clave Semestre Estadística Inferencial 0186 4 Número de créditos 8 Horas teoría 4 Horas práctica
Más detallesTareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja
Más detallesIntroducción a la minería de datos
Introducción a la minería de datos 1 Temario Qué es minería de datos? Quién usa minería de datos? Por qué de la minería de datos? Ciclo virtuoso de la minería de datos 2 Definición de minería de datos
Más detallesVIII Jornadas de Usuarios de R
VIII Jornadas de Usuarios de R Análisis del Abandono en el Sector Bancario Predicción del abandono de clientes Albacete, 17 de Noviembre de 2016 I. INDICE : Modelo Abandonos I. COMPRENSIÓN DEL NEGOCIO
Más detallesMétodos de Remuestreo en Aprendizaje Automático
Métodos de Remuestreo en Aprendizaje Automático en datos, en hipótesis, y algunos otros trucos: Cross-validation, Bootstrap, Bagging, Boosting, Random Subspaces Lo que sabemos hasta ahora: Hemos visto
Más detallesAux 6. Introducción a la Minería de Datos
Aux 6. Introducción a la Minería de Datos Gastón L Huillier 1,2, Richard Weber 2 glhuilli@dcc.uchile.cl 1 Departamento de Ciencias de la Computación Universidad de Chile 2 Departamento de Ingeniería Industrial
Más detallesCAPÍTULO I. 1. Planteamiento del Problema
CAPÍTULO I 1. Planteamiento del Problema Una empresa ecuatoriana exportadora de balsa requiere analizar los procesos inmersos en el aserrado de la madera en sus haciendas, con el objetivo de reducir el
Más detallesU.N.P.S.J.B. FACULTAD DE INGENIERÍA Cátedra de ESTADÍSTICA Cátedra ESTADISTICA
U.N.P.S.J.B. FACULTAD DE INGENIERÍA Cátedra de ESTADÍSTICA Cátedra ESTADISTICA TRABAJOS PRÁCTICOS Facultad de Ingeniería Universidad Nacional de La Patagonia S. J. B. Comodoro Rivadavia TEMA Nº.. REGRESIÓN
Más detallesTareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR
Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos
Más detallesAprendizaje Automático
id3 id3 como búsqueda Cuestiones Adicionales Regresión Lineal. Árboles y Reglas de Regresión Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje
Más detallesTÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD
TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Contrastes de hipótesis paramétricos para una y varias muestras: contrastes sobre la media, varianza y una proporción. Contrastes sobre la diferencia
Más detallesMÉTODOS DE PRONÓSTICO TEMA 1: ANÁLISIS DE SERIES DE TIEMPO Y ELABORACIÓN DE PRONÓSTICOS
UNIDAD 4 MÉTODOS DE PRONÓSTICO TEMA 1: ANÁLISIS DE SERIES DE TIEMPO Y ELABORACIÓN DE PRONÓSTICOS Predicción de lo que sucederá en el futuro. 1 Predicción de lo que sucederá en el futuro. Los métodos de
Más detallesEstadística con R. Clasificadores
Estadística con R Clasificadores Análisis discriminante lineal (estadístico) Árbol de decisión (aprendizaje automático) Máquina soporte vector (aprendizaje automático) Análisis discriminante lineal (AD)
Más detallesCapítulo 8. Selección de variables Introducción
Capítulo 8 Selección de variables 8.1. Introducción En muchos problemas de regresión es posible considerar un número importante de variables predictoras. Un empresario podría estudiar los factores que
Más detallesTécnicas Multivariadas Avanzadas
Métodos basados en árboles Universidad Nacional Agraria La Molina 2014-2 Introducción Introducción Se describen métodos basados en árboles para regresión y clasicación. Estos métodos requieren estraticar
Más detallesAprendizaje Automatizado. Árboles de Clasificación
Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Entrada: Objetos caracterizables mediante propiedades. Salida: En árboles de decisión: una decisión (sí o no). En árboles de clasificación:
Más detallesClasificación Supervisada. Métodos jerárquicos. CART
Clasificación Supervisada. Métodos jerárquicos. CART Ricardo Fraiman 2 de abril de 2010 Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y n ) E {1,..., m}. Típicamente E = R d.
Más detallesTema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0
Ignacio Martín Tamayo 11 Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 ÍNDICE ------------------------------------------------------------- 1. Introducción 2. Frecuencias 3. Descriptivos 4. Explorar
Más detallesEstadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1)
Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 24 de octubre de 2016 M.Bourel
Más detallesTema: Análisis de valores faltantes con SPSS
Tema: Análisis de valores faltantes con SPSS 1.- Introducción Hemos de comenzar advirtiendo que el Procedimiento Valores perdidos no se incluye en el sistema Base de SPSS, por lo que solo estará disponible
Más detallesUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad Gómez. Facultad Nacional de Salud Pública Héctor Abad Gómez
UNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad Gómez Facultad Nacional de Salud Pública Héctor Abad Gómez La Regresión es una técnica estadística utilizadas para estimar (interpolar)
Más detallesGuía docente 2007/2008
Guía docente 2007/2008 Plan 247 Lic.Investigación y Tec.Mercado Asignatura 43579 METODOS CUANTITATIVOS PARA LA INVESTIGACION DE MERCADOS Grupo 1 Presentación Métodos y técnicas cuantitativas de investigación
Más detallesEVALUACIÓN EN APRENDIZAJE. Eduardo Morales y Jesús González
EVALUACIÓN EN APRENDIZAJE Eduardo Morales y Jesús González Significancia Estadística 2 En estadística, se dice que un resultado es estadísticamente significante, cuando no es posible que se presente por
Más detallesANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE
ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por
Más detallesAnálisis de la evolución y tendencia de las tasas de hepatitis A en Chile desde a 2002
Rev Chil Salud Pública CIFRAS DE HOY Análisis de la evolución y tendencia de las tasas de hepatitis A en Chile desde 197 5 a 2002 GABRIEL CA V ADAOJ, ROSA MONT AÑOOJ, SERGIO AL V ARADOOl, MARÍA TERESA
Más detallesTemario. SEMANA 1 3 al 7 de Febrero. Expositor: Dr. C. Rodrigo E. Elizondo Omaña
Temario SEMANA 1 3 al 7 de Febrero Expositor: Dr. C. Rodrigo E. Elizondo Omaña 1. Bienvenida 2. Presentación del GIA 3. Líneas de investigación existentes 4. La investigación científica en el Departamento
Más detallesIntroducción a la Estadística Aplicada en la Química
Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00
Más detallesUniversidad de Puerto Rico Recinto de Río Piedras Facultad de Educación Escuela Secundaria. Prontuario del Curso Estadística y Probabilidad
Universidad de Puerto Rico Recinto de Río Piedras Facultad de Educación Escuela Secundaria Prontuario del Curso Estadística y Probabilidad Preparado por:, Ed.D. I. Curso: Probabilidad y estadística, Codificación:
Más detallesSPSS Classification Trees 13.0
SPSS Classification Trees 13.0 Si desea obtener más información sobre los productos de software de SPSS, visite nuestra página Web en http://www.spss.com o póngase en contacto con SPSS Inc. 233 South Wacker
Más detallesDIRECCIÓN Y ADMINISTRACIÓN DE PEQUEÑAS EMPRESAS
DIRECCIÓN Y ADMINISTRACIÓN DE PEQUEÑAS EMPRESAS Modulo tercero (integración). Clave de asignatura LC 735 PROFESOR: C.P. DAVID ARREDONDO ALCANTAR 1.- PRONOSTICOS 1.3.- Tipos de pronósticos. Los pronósticos
Más detallesLingüística computacional
Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje
Más detallesIBM SPSS - Árboles de decisiones 25 IBM
IBM SPSS - Árboles de decisiones 25 IBM Nota Antes de utilizar esta información y el producto al que da soporte, lea la información del apartado Aisos en la página 23. Product Information Esta edición
Más detalles2. Rentabilidad y riesgo
2. Rentabilidad y riesgo INSTITUTO TECNOLOGICO DE LA LAGUNA ADMINISTRACIÓN FINANCIERA II Dra. Diana Margarita Vázquez Peña TEMA DOS No existe inversión sin riesgo, aunque algunos productos tienen más riesgo
Más detallesMétodos de Clasificación sin Métrica. Reconocimiento de Patrones- 2013
Métodos de Clasificación sin Métrica Reconocimiento de Patrones- 03 Métodos de Clasificación sin Métrica Datos nominales sin noción de similitud o distancia (sin orden). Escala nominal: conjunto de categorías
Más detallesPRACTICUM 3: Finanzas y Contabilidad Pública
PRACTICUM 3: Finanzas y Contabilidad Pública archivo 11 Investigación de mercados Causal Christian Cruz Castro 1. Recapitulación aportación 1 2 3 Lean Startup Customer = CANVAS + + Development Produccción
Más detallesAprendizaje Automatizado. Árboles de Clasificación
Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles
Más detallesANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y
Más detallesINDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos
INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos
Más detallesSISTEMAS INTELIGENTES
SISTEMAS INTELIGENTES T9: Árboles de Decisión www.aic.uniovi.es/ssii Sistemas Inteligentes T9: Árboles de decisión Índice Árboles de decisión para clasificación Mecanismo de inducción: divide y vencerás
Más detallesN T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA
N T E N.. IDO PREFACIO xiv CAPíTULO I LA IMAGINACiÓN ESTADíSTICA Introducción La imaginación estadística 3 Enlace de la imaginación estadística con la imaginación sociológica 4 Normas estadísticas y normas
Más detalles> plot(salmon[,- 1],col=as.factor(salmon[,1]))
ANÁLISIS DISCRIMINANTE El análisis discriminante, se utiliza para identificar las características que permiten diferenciar a dos o más grupos de sujetos; además para clasificar nuevos casos como pertenecientes
Más detallesCASO 5-3 MILAN FOOD COOPERATIVE (B)
CASO 5-3 MILAN FOOD COOPERATIVE (B) INTRODUCCIÓN Éste es una continuación del caso Milan Food Cooperative (A), de la parte 4 del texto. Aquí se presentan los resultados del análisis de correlación y regresión
Más detallesIntroducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Introducción a la minería de datos CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Minería de datos Detección, interpretación y predicción de patrones cuantitativos y cualitativos
Más detallesFundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 -
Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 11 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Resolución manual de clasificación bayesiana
Más detallesEjercicios y Talleres. puedes enviarlos a
Ejercicios y Talleres puedes enviarlos a klasesdematematicasymas@gmail.com TRABAJO DE APLICACIÓN La siguiente base de datos se conformó por la información suministrada en la entidad financiera BankAmerica,
Más detallesMétodos de Diseño y Análisis de Experimentos
1 / 28 Métodos de Diseño y Análisis de Experimentos Patricia Isabel Romero Mares Departamento de Probabilidad y Estadística IIMAS UNAM marzo 2018 Ideas básicas del diseño experimental Capítulo 4 de Analysis
Más detallesINDICE Capitulo 1. Nociones Básicos sobre el SPSS/PC+ Capitulo 2. Nociones Básicos sobre Probabilidad
INDICE Prólogo XIX Introducción XXIII Capitulo 1. Nociones Básicos sobre el SPSS/PC+ 1 1. Qué es y para qué sirve el SPSS/PC+ 1 2. funcionamiento general 1 A. Módulos, comandos y subcomandos 1 B. Estilos
Más detallesAnálisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos
Más detallesESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 7) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía
ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 7) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía VIDEOCLASE: La Correlación. https://www.intecca.uned.es/portalavip/grabacion.php?id_grabacion=56932&id_sala=605
Más detallesIdeas básicas del diseño experimental
Ideas básicas del diseño experimental Capítulo 4 de Analysis of Messy Data. Milliken y Johnson (1992) Diseño de experimentos p. 1/23 Ideas básicas del diseño experimental Antes de llevar a cabo un experimento,
Más detallesLucila Finkel Temario
Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión
Más detallesMinería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria
Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego
Más detallesMinería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria
Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego
Más detallesTABLA DE CONTENIDO. Resumen Introducción Entorno relevante asociado al proyecto Contexto de la Industria...
TABLA DE CONTENIDO Resumen... 2 1 Introducción... 15 2 Entorno relevante asociado al proyecto... 16 2.1 Contexto de la Industria... 16 2.1.1 Mercado de metales en el mundo... 16 2.1.2 Industria Minera
Más detallesANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA
ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos
Más detallesMétodo de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
Más detallesAnexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN
Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN 165 ENCUESTA DE COMPORTAMIENTOS Y TIPOLOGÍAS DE VISITANTES EN EUSKADI 166 ANEXO I. CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN
Más detallesESTADISTICA PARA LA CALIBRACIÓN Y VALIDACIÓN DE METODOLOGÍAS ANALÍTICAS
ESTADISTICA PARA LA CALIBRACIÓN Y VALIDACIÓN DE METODOLOGÍAS ANALÍTICAS QUÍMICA ANALÍTICA EXPERIMENTAL III SILVIA CITLALLI GAMA GONZÁLEZ PROBLEMA Cuando la cantidad de materia del analito que se encuentra
Más detallesDESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
ÍNDICE Introducción: Entrene su cerebro para la estadística... 1 La población y la muestra... 3 Estadísticas descriptivas e inferenciales... 4 Alcanzar el objetivo de estadísticas inferenciales: los pasos
Más detallesEstrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis
Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis VDC Prof. Mª JOSÉ PRIETO CASTELLÓ MÉTODOS ESTADÍSTICOS. TÉCNICAS ESTADÍSTICA DESCRIPTIVA TEORÍA DE LA PROBABILIDAD
Más detallesÍNDICE. Capítulo 1. Técnicas de segmentación. Conceptos y clasificación... 1
ÍNDICE Capítulo 1. Técnicas de segmentación. Conceptos y clasificación... 1 Conceptos básicos... 1 Clasificación de las técnicas de segmentación... 1 Técnicas predictivas y descriptivas... 1 Técnicas Ad-Hoc
Más detallesUniversidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
Más detalles2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores. Inducción de árboles de clasificación. Aprendizaje UPM UPM
1. Preliminares Aprendizaje 2. Algoritmos genéticos y redes neuronales 3. Inducción de árboles clasificadores 4. Inducción de reglas 5. Minería de datos c 2010 DIT-ETSIT- Aprendizaje: árboles transp. 1
Más detallesINDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas
INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de
Más detallesCONTROL ESTADISTICO DE LA CALIDAD
CICLO 2012-II Módulo: Unidad: 4 Semana: 4 CONTROL ESTADISTICO DE LA CALIDAD Ing. Enrique Montenegro Marcelo GRAFICOS DE CONTROL ORIENTACIONES Al finalizar este capitulo el alumno deberá poder construir
Más detallesMODELADO CALIBRACIÓN MULTIVARIADA
MODELADO CALIBRACIÓN MULTIVARIADA Calibración multivariada un método multivariado implica que: existe una dependencia múltiple de la variable x (independiente) y múltiples variables y (dependiente) el
Más detallesSegmentación de clientes. Dra. Adriana Amigo
Dra. Adriana Amigo Objetivos de su tratamiento Temario Actividades propuestas para la mejor comprensión del tema. Objetivos de su tratamiento Conceptualizar el proceso de segmentación de clientes. Interrelacionar
Más detallesAnálisis Probit. StatFolio de Ejemplo: probit.sgp
STATGRAPHICS Rev. 4/25/27 Análisis Probit Resumen El procedimiento Análisis Probit está diseñado para ajustar un modelo de regresión en el cual la variable dependiente Y caracteriza un evento con sólo
Más detallesEstadística II Tema 4. Regresión lineal simple. Curso 2009/10
Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
Más detallesDISEÑOS EXPERIMENTALES DE DOS GRUPOS Y MULTIGRUPO
TEMA II ESQUEMA GENERAL Diseño experimental de dos grupos: definición y clasificación Formatos del diseño y prueba de hipótesis Diseño experimental multigrupo: definición Formato del diseño multigrupo
Más detallesANALIZAR Comparar medias
Diseño entre-grupos univariado unifactorial con A>2. Contraste de hipótesis específicas Dolores Frías-Navarro Universidad de Valencia http://www.uv.es/friasnav/ Hasta ahora hemos ido desarrollando las
Más detallesEjemplo Diseño Completamente aleatorizado (Pág. 470 Montgomery)
Ejemplo Diseño Completamente aleatorizado (Pág. 47 Montgomery) ) Representación gráfica de los datos mediante diagramas de caja Resumen del procesamiento de los casos Tension del papel (psi) Casos Válidos
Más detallesInteligencia Artificial: Su uso para la investigación
Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas helena.adorno@iimas.unam.mx 1 Introducción
Más detallesÍNDICE. Prefacio... xi
ÍNDICE Prefacio... xi Capítulo 1 Introducción... 1 1.1 Por qué hay que tomar este curso y quién utiliza la estadística?... 2 1.2 Historia... 3 1.3 Subdivisiones de la estadística... 4 1.4 Un enfoque simple
Más detallesCurso: 4 Créditos ECTS: 6 Tipo de asignatura: Optativa Tipo de formación: Teórico-práctica
Ficha Técnica Titulación: Plan BOE: Asignatura: Módulo: Grado en Criminología BOE número 75 de 28 de marzo de 2012/Correción de errores en BOE número 85 de 9 de abril de 2012 Optativas Curso: 4 Créditos
Más detallesProyecto PropULSA: Estadística y Probabilidad Breviario Académico
Estadística y Probabilidad Breviario Académico Estadística: Es la ciencia que tiene por objetivo recolectar, escribir e interpretar datos, con la finalidad de efectuar una adecuada toma de decisiones en
Más detallesSelección de fuentes de datos y calidad de datos
Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago . Valores atípicos. Valores faltantes.
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesINTRODUCTION TO MACHINE LEARNING ISABELLE GUYON
INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos
Más detallesTEMA I CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES
TEMA I CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES LECTURA OBLIGATORIA Algunas cuestiones previas. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en
Más detallesDepartamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente
Más detalles