RECONOCIMIENTO DE VINOS POR CULTIVOS CLASIFICACION
|
|
- María Dolores Consuelo Montero Maestre
- hace 6 años
- Vistas:
Transcripción
1 RECONOCIMIENTO DE VINOS POR CULTIVOS CLASIFICACION Miguel Caballero Sierra Guillermo Rubio Escuela Colombiana de Ingeniería Julio Garavito Ingeniería Industrial, Minería de Datos RESUMEN Los modelos de clasificación utilizadas en minería de datos derivan principalmente de dos disciplinas, la inteligencia artificia y la estadística, estos modelos consisten en lineamientos para categorizar los problemas en problemas generales ya determinados; los modelos de clasificación tiene como objetivo asignar una etiqueta de clase correcta a objetos antes no vistos y sin etiqueta. Los modelos clasificación en minería datos es utilizada mayoritariamente en predicciones, apoyado en diversas técnicas, algunas de las más empleadas son: análisis de discriminante, árboles de decisión y redes neuronales. PALABRAS CLAVES Clasificación de vinos, Modelo de clasificación, Técnicas de minería de datos INTRODUCCION De una misma región de Italia se da un mismo tipo de vino procedente de tres cultivos diferentes, un análisis químico para muestra distintas de cada uno de los cultivos proporciona información de trece características diferentes: alcohol, acido málico, Ceniza, Alcalinidad de las cenizas, magnesio, fenoles, flavonoides, fenoles sin flavonoides, proantocianinas, intensidad del color, Hue, OD280/OD315 diluido en el vino. Se desarrollara un modelo clasificador que utilice las 13 características como atributos, para predecir o clasificar a que cultivo de la región pertenece nuevos vinos sin clasificar.
2 PLANTIAMIENTO Dado un conjunto nuevo de datos de esta región de Italia, determinar por medio de técnicas de minería de datos y modelos de clasificación, a cuál de los tres cultivos de la región pertenece cada uno de los nuevos datos. INFORMACIÓN DE LA BASE DE DATOS Base de datos: Vino Área: Física y química Aplicación a: Minería de datos Tabla 1 Número de Casos 178 Número de atributos 3 Valores Faltante 0 Datos Totales 534 Tipos de Datos Int, Dou, String Tarea Asociada Clasificacion Número de casos cultivo 1: 59 Número de casos cultivo 2: 71 Número de casos cultivo 3: 48 SOLUCIÓN La metodología seguida para resolución del problema son basadas en las fases de la Metodología CRISPDM 1.0 (Cross Industry Standard Process for data mining) y en lineamientos propios. La solución del problema se lleva a cabo de la mana del software libre KNIME (Para ver el Flujo de trabajo en Knime ver Anexo A). I. DATOS DE ENTRENAMIENTO Y PRUEBA Se construyen los datos de entrenamiento y de prueba tomando aleatoriamente 126 casos para entrenamiento y 52 casos para prueba de los 178 casos totales que contiene la base de datos. 70% de los datos totales aproximadamente para entrenamiento y 30% aproximadamente para prueba. La partición se llevó acabo en VBA (Visual Basic for Applications) de Excel 14.0 (2010) de manera aleatoria y de tal forma que la base de datos quedara balanceada Tabla 2 (Se distribuyen los datos de manera aleatoria y estratégica para que la base de entrenamiento quede balanceada) Datos de entrenamiento Casos con cultivo 1 42 Casos con cultivo 2 42 Casos con cultivo 3 42 Total Casos 126 Tabla 3 Datos de prueba Casos con cultivo 7 Casos con cultivo 9 Casos con cultivo 3 6 Total Casos 52 II. LIMPIEZA DE DATOS Se mejora la calidad de los datos verificando su exactitud, integridad, entereza, validez, consistencia, uniformidad y unicidad, todas estas características son bastantes altas y buenas para la base de datos, su principal falencia se encuentra en la densidad, porque no hay una cantidad considerable de ellos. III. ENTENDIMEINTO DE LOS DATOS Se utiliza estadística descriptiva, gráficas de frecuencia y correlaciones
3 para familiarizarse con cada uno de los atributos. De la correlación lineal de Pearson aplicada a los datos, se encuentra que la relación positiva más alta es de 0.87 entre fenoles totales y flavonoides, de igual forma la relación negativa más alta es de 0.87 entre cultivos y flavonoides, la segunda relación positiva más alta de 0.77 entre hue y flavonoides. Esto arroja luz acerca de que técnica de minería de datos utilizar: árboles de decisión. III. VERIFICACIÓN DE LOS DATOS: ANÁLISIS DE RUIDO Se genera de una matriz de dispersión para observar donde puede detectarse ruido, se aplica Jitter a toda la matriz para detectarlos con mayor facilidad. Los atributos con probabilidad de ruido se les genera un gráfica de dispersión aparte, para una observación más detallada e igualmente se aplica Jitter para mayor visualización. Para la base de datos Vino, se detectó ruido entre los atributos cultivo y alcohol (ver gráfica 1). Gráfica 1 (Gráfico de dispersión entre los atributos cultivo y alcohol. Elaborado en Knime 2.4.5) Se seleccionan los puntos que distorsionan, confunden o están por fuera de rango de la señal, posteriormente se aplica hitter a la selección, para luego filtrar los datos que no contienen hitter (datos que generan la señal más clara), quedando la base de datos aislada de algunas imperfecciones de ruido proporcionando una señal más limpia. La base de datos queda con los siguientes casos (Ver Tabla 4). Tabla 4 Base de Entrenamiento Casos con cultivo 1 40 Casos con cultivo 9 Casos con cultivo 3 41 Total Casos 110 La base de entrenamiento queda con problema de Overfitting. IV. BALANCEO DE LA BASE DE ENTRENAMIENTO. Se aplica un balance a la base de datos, con clase minoritaria y los 5 vecinos más cercanos. La técnica utilizada es SMOTE (Synthetic Minority Over-sampling Technique). La base de datos de entrenamiento nueva queda con 41 casos para cada cultivo (Ver Tabla 5). Tabla 5 Base de Entrenamiento Casos con cultivo 1 41 Casos con cultivo 2 41 Casos con cultivo 3 41 Total Casos 123
4 V. APLICACIÓN TÉCNICA DE CLASIFICACIÓN: ÁRBOLES DE DECISIÓN Se aplican los datos de entrenamientos ya procesados y trabajados para que el computador o en este caso específico para que el nodo de knime Decision tree learner aprenda a clasificar, posteriormente se aplica el clasificador y la base de prueba para predecir a que cultivo pertenece cada dato (Ver Tabla 6). Árbol de decisión (Vista simple) (Vista horizontal proporcionado por Knime del árbol de decisión) Figura 1 Tabla 6 (La columna izquierda muestra lo predicho por el clasificador, mientras que columna derecha muestra al cultivo real al cual pertenece). Predictive Cultivars El árbol de decisión ordenada y de visualización amigable se puede consultar en el Anexo II. VI. EVALUACIÓN DEL MODELO Dos tipos de análisis se llevan a cabo para evaluar el modelo, el primero de ellos es el análisis a partir de la matriz de confusión y el segundo análisis de la curva ROC (Receiver Operating Characteristic).
5 VI.I ANÁLISIS A PATIR DE LA MATRIZ DE CONFUSIÓN Tabla 7 (Matriz de Confusión) Cultivo 1 Cultivo 2 Cultivo 3 Cultivo Cultivo Cultivo Tabla 8 (Tabla de precisión, las casillas en blanco indican que no se puede calcular dicha medida) VP FP VN FN Recall Precisión Sen. Spec F A Total VP= Verdaderos positivos FP= Falsos Positivos VN= Verdaderos Negativos FN= Falsos Negativos Sen = Sensitivity Spec = Specifity F = F-Measure A = Accuracy De la tabla 8 se puede ver la fracción de valores acertados globalmente que tiene el clasificador o dicho de otro modo hay un error para el clasificador del 7.7%; otra medida de la porción de casos totales que fueron correctos es la medida F-measure, para cada clase tenemos según la medida F que para el cultivo uno hay un error del 9%, para el cultivo 2 un error de 8% y para el cultivo 3 un error del 8%. La medida Specifity también proporciona errores bajos de: 8%, 0% y 2.2% para el cultivo 1,2 y 3 respectivamente y la medida sensitivity muestra errores del 0%, 14% y 0%. Todas estas medidas brindan confiabilidad al clasificador porque odas oscilan en valores similares. Para efectos de clasificación de los vinos hay una precisión suficiente proporcionada por las distintas medidas de precisión. VI.II ANÁLISIS DE LA CURVA ROC (RECEIVER OPERATING CHARACTERISTIC) Tabla 9 Área bajo la curva ROC Hue Flavonoide Proline Intesidad del color Cultivo Cultivo Cultivo Recuerde que mientras mayor sea el área bajo la curva ROC mejor es el clasificador. De la Tabla 9 se observa distintas medidas con diferentes atributos o umbrales. Se ve la gran variación que hay según los distintos atributos como por ejemplo el clasificador es bastante bueno para Flavonoide con los cultivos 1 y 2 pero para el cultivo 3 el área bajo la curva es cero, este mismo comportamiento se ve para el resto de los atributos, dando a conocer cómo se producen los errores de clasificación por el sesgo que hay a recorrer el árbol. Las gráficas del área bajo la curva de los distintos atributos se muestran en la gráfica 2. NOTA: análisis de las medidas de entropía para el modelo de clasificación se pueden llevar acabo. En el flujo de trabajo se muestran lo nodos en Knime Ver Anexo I.
6 Gráfica 2 (Gráfico ROC de los atributos seleccionados por el árbol de decisión. Flavonoide, Hue, Intensidad del color Elaborado en Knime 2.4.5). REFERENCIAS [1] Ian H. Witten Data Mining: Practical machine learning tool and techniques [2] Pang Pingn Tan Irtoduction to data mining [3] [4] [5] Azul: Intensidad del color Rosado: Proline Gris: Linea de discriminación Verde: Hue Rojo: Flavonoide CONCLUSIONES Modelo de clasificación elaborado por árboles de decisión clasifica perfectamente para casos que pertenezcan al cultivo 1 y para el cultivo 3, pero para el cultivos 2 no es muy bueno clasificando, esto se debe a cantidad de datos que proporciona la base de datos Densidad que ya suponía un problema desde le fase de mejorar la calidad de los datos. Los atributos que realmente aportan a la clasificación son esencialmente: Hue Flavonoide Hue Total Fenoles Esto se veía reflejado desde un principio en la correlación del distinto tipo de atributos y en la medida de dispersión de los mismos.
7 ANEXO I. (Flujo KNIME 2.4.5) Nodos Utilizados CSV Reader Decision Tree Predictor Histogram Nomber To String Scorer CSV Writer Decison Tree To Image Histogram (Interactive) ROC Curve SMOTE Coulme Filter Entropy Scorer Joiner Scatter Matriz Statistics Decision Tree Learner Hitlite Filter Linear Correlation Scatter Plot Value Counter
8 ANEXO II. (ÁRBOL DE DECISIÓN) Proporcionado por el nodo Decison Tree To Image de KNIME 2.4.5
Aprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Más detallesCRITERIOS DE SELECCIÓN DE MODELOS
Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesCapítulo 8. Análisis Discriminante
Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables
Más detallesADMINISTRACION DE OPERACIONES
Sesión4: Métodos cuantitativos ADMINISTRACION DE OPERACIONES Objetivo específico 1: El alumno conocerá y aplicara adecuadamente los métodos de pronóstico de la demanda para planear la actividad futura
Más detallesMétodos Predictivos en Minería de Datos
Métodos Predictivos en Minería de Datos Tutor: El curso será impartido por Dr. Oldemar Rodríguez graduado de la Universidad de París IX y con un postdoctorado de la Universidad de Stanford. Duración: Cuatro
Más detallesAprendizaje Supervisado K - Vecinos más cercanos Knn-Method
Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No
Más detallesEstadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1
Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1 Relación entre dos variables Al estudiar conjuntos de variables con más de una variable, una pregunta
Más detallesDr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental
Universidad de Puerto Rico Recinto de Aguadilla Programa CeCiMat Elemental Definición de conceptos fundamentales de la Estadística y la Probabilidad y su aportación al mundo moderno Dr. Richard Mercado
Más detallesUNIVERSIDAD ALAS PERUANAS FACULTAD DE CIENCIAS DE LA COMUNICACIÓN SILABO POR COMPETENCIA
UNIVERSIDAD ALAS PERUANAS FACULTAD DE CIENCIAS DE LA COMUNICACIÓN SILABO POR COMPETENCIA I. DATOS INFORMATIVOS 1.1 Asignatura : Estadística para el Comunicador Social 1.2 Código : 1001-1023 1.3 Pre-requisito
Más detallesModelo Predictivo del Crimen para la Región Metropolitana
Análisis Espacial de la Criminalidad basado en Georeferenciación de Denuncias José Miguel Benavente PhD Departamento de Economía. Departamento de Ingeniería Industrial. Universidad de Chile. Carabineros
Más detallesCLASIFICACIÓN DE LA IMAGEN. Escuela de Ingeniería Civil y Geomática Francisco Luis Hernández Torres
CLASIFICACIÓN DE LA IMAGEN TÉCNICA QUE PERMITE LA IDENTIFICACIÓN DE LOS DIFERENTES OBJETOS O GRUPOS PRESENTES EN UNA IMAGEN MULTI-ESPECTRAL. MÉTODO NO SUPERVISADO MÉTODO SUPERVISADO El Desarrollo De Las
Más detallesTema 2. Regresión Lineal
Tema 2. Regresión Lineal 3.2.1. Definición Mientras que en el apartado anterior se desarrolló una forma de medir la relación existente entre dos variables; en éste, se trata de esta técnica que permite
Más detallesEJERCICIOS RESUELTOS TEMA 1.
EJERCICIOS RESUELTOS TEMA 1. 1.1. El proceso por el cual se asignan números a objetos o características según determinadas reglas se denomina: A) muestreo; B) estadística; C) medición. 1.2. Mediante la
Más detallesINTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)
TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de
Más detallesEpidemiología. 4. Validez y confiabilidad de las pruebas diagnósticas.
Epidemiología 4. Validez y confiabilidad de las pruebas diagnósticas. Pruebas diagnósticas. Variación biológica de la población. Variación biológica de la población. sanos enfermos resultado de la prueba
Más detallesPRUEBAS. Sandra Convers-Páez, M.D. Instituto de Investigaciones Médicas Facultad de Medicina 2009
PRUEBAS DIAGNÓSTICAS Sandra Convers-Páez, M.D. Instituto de Investigaciones Médicas Facultad de Medicina 2009 PRUEBAS DIAGNÓSTICAS Generalmente, pruebas realizadas en un laboratorio (también historia y
Más detallesTema 3. Relación entre dos variables cuantitativas
Tema 3. Relación entre dos variables cuantitativas Resumen del tema 3.1. Diagrama de dispersión Cuando sobre cada individuo de una población se observan simultáneamente dos características cuantitativas
Más detallesConstrucción de Gráficas en forma manual y con programados
Universidad de Puerto Rico en Aguadilla División de Educación Continua y Estudios Profesionales Proyecto CeCiMaT Segunda Generación Tercer Año Título II-B, Mathematics and Science Partnerships Construcción
Más detallesAprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Más detallesContenido. Introducción Usando di Monitoring como un usuario normal Uso de di Monitoring como un operador de entrada de datos...
1 Contenido Introducción... 3 Características principales... 3 Los niveles de usuario... 4 El aprendizaje de di Monitoring... 4 Usando di Monitoring como un usuario normal... 5 Acceso a di Monitoring...
Más detallesMinería Multimedia Minería de datos NO estructurados (Textos, Imágenes, Audios y Videos)
Minería Multimedia Minería de datos NO estructurados (Tetos, Imágenes, Audios y Videos) Ana Isabel Oviedo Docente Universidad Pontificia Bolivariana ana.oviedo@upb.edu.co Medellín, noviembre 13 de 2014
Más detallesSelección de fuentes de datos y calidad de datos
Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago . Valores atípicos. Valores faltantes.
Más detallesTema 8. Análisis de dos variables Ejercicios resueltos 1
Tema 8. Análisis de dos variables Ejercicios resueltos 1 Ejercicio resuelto 8.1 La siguiente tabla muestra la distribución del gasto mensual en libros y el gasto mensual en audiovisual en euros en los
Más detallesmatemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4
PS0401 - Probabilidad y Estadística DES: Ingeniería Programa(s) Educativo(s): Ingeniería de Software Tipo de materia: Obligatoria Clave de la materia: PS0401 Cuatrimestre: 4 UNIVERSIDAD AUTÓNOMA DE Área
Más detallesUNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE INGENIERÍA. práctica, Total: 85 Horas a la semana: 5 teoría: 4 prácticas: 1 Créditos:
UNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE INGENIERÍA Probabilidad y Estadística 18/01/10 Clave: 214 Semestre: 1 Duración del curso: semanas: 17 horas: 68 de teoría y 17 de práctica, Total: 85 Horas
Más detallesMinería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria
Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego
Más detalles1. La Distribución Normal
1. La Distribución Normal Los espacios muestrales continuos y las variables aleatorias continuas se presentan siempre que se manejan cantidades que se miden en una escala continua; por ejemplo, cuando
Más detallesDIPLOMADO EN ESTADÍSTICA APLICADA
DIPLOMADO EN ESTADÍSTICA APLICADA DIPLOMADO EN ESTADÍSTICA APLICADA FUNDAMENTACIÓN El Diplomado en Estadística Aplicada posibilitará la actualización profesional y el desarrollo de competencias específicas
Más detallesACTIVIDAD 2: La distribución Normal
Actividad 2: La distribución Normal ACTIVIDAD 2: La distribución Normal CASO 2-1: CLASE DE BIOLOGÍA El Dr. Saigí es profesor de Biología en una prestigiosa universidad. Está preparando una clase en la
Más detallesDistribución normal estándar. Juan José Hernández Ocaña
Distribución normal estándar Juan José Hernández Ocaña Tipos de variables jujo386@hotmail.com Tipos de variables Cualitativas Son las variables que expresan distintas cualidades, características o modalidades.
Más detallesESCUELA SUPERIOR POLITECNICA DEL LITORAL
Sistemas de Toma de Decisiones UNIDAD ACADÉMICA: CARRERA: ESPECIALIZACIÓN: ÁREA: TIPO DE MATERIA: EJE DE FORMACIÓN: Facultad de Ingeniería en Electricidad y Computación Ingeniería en Ciencias Computacionales
Más detallesINSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016
ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una
Más detallesU N I V E R S I D A D A L A S P E R U A N A S FACULTAD DE INGENIERÍAS Y ARQUITECTURA ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA INDUSTRIAL
U N I V E R S I D A D A L A S P E R U A N A S FACULTAD DE INGENIERÍAS Y ARQUITECTURA ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA INDUSTRIAL CONTROL ESTADÍSTICO DE LA CALIDAD SILABO I. DATOS GENERALES CARRERA
Más detallesProyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial.
Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Funcionamiento: Se realiza un test en cada nodo interno del árbol, a medida que
Más detallesCAPÍTULO 4 TÉCNICA PERT
54 CAPÍTULO 4 TÉCNICA PERT Como ya se mencionó en capítulos anteriores, la técnica CPM considera las duraciones de las actividades como determinísticas, esto es, hay el supuesto de que se realizarán con
Más detallesINDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Más detallesEstadística para la toma de decisiones
Estadística para la toma de decisiones ESTADÍSTICA PARA LA TOMA DE DECISIONES. 1 Sesión No. 7 Nombre: Distribuciones de probabilidad para variables continúas. Objetivo Al término de la sesión el estudiante
Más detallesTÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS. Adela del Carpio Rivera Doctor en medicina
TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS Adela del Carpio Rivera Doctor en medicina METODO Es el medio o camino a través del cual se establece la relación entre el investigador y el consultado para
Más detallesUNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS
I. IDENTIFICACIÓN DE LA ASIGNATURA ESTADÍSTICA I CÓDIGO DE LA ASIGNATURA 33102106 ÁREA CIENCIAS BASICAS DE INGENIERIA SEMESTRE SEGUNDO PLAN DE ESTUDIOS 1996 AJUSTE 2002 HORAS TOTALES POR SEMESTRE 64 HORAS
Más detallesAprendizaje: Boosting y Adaboost
Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo
Más detallesM ÉTODO DE MUESTREO DE GEOSINTÉTICOS PARA ENSAYOS I.N.V. E
M ÉTODO DE MUESTREO DE GEOSINTÉTICOS PARA ENSAYOS I.N.V. E 908 07 1. OBJETO 1.1 Esta práctica cubre dos procedimientos para el muestreo de geosintéticos para ser ensayados. Se requiere que las instrucciones
Más detalles3.1. Administración de la medición y de la información estratégica:
Unidad III Aspectos Generales Sobre la Gestión de la Calidad 3.1. Administración de la medición y de la información estratégica: Los siguientes criterios corresponden a la administración de la medición
Más detallesESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Más detallesOBJETIVO ESPECIFICO. Identificar peligros asociados a cada fase o etapa del trabajo y la posterior evaluación de los riesgos.
ANALISIS DE RIESGO OBJETIVO ESPECIFICO Identificar peligros asociados a cada fase o etapa del trabajo y la posterior evaluación de los riesgos. ADMINISTRACIÓN DEL RIESGO = PREVENCIÓN CONTROL DE ACCIDENTES/
Más detallesUNIVERSIDAD DEL NORTE
UNIVERSIDAD DEL NORTE 1. IDENTIFICACIÓN DIVISIÓN ACADÉMICA DIVISIÓN DE CIENCIAS BÁSICAS DEPARTAMENTO MATEMÁTICAS Y ESATADÍSTICA. PROGRAMA ACADÉMICO ESTADÍSTICA I-AD CÓDIGO DE LA ASIGNATURA EST 1022 PRE-REQUISITO
Más detallesFundamentos de Estadística y Simulación Básica
Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión
Más detallesCurso de Estadística Básica
Curso de SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez Objetivo Conocer y calcular las medidas de tendencia central y medidas de dispersión
Más detallesProbabilidad y Estadística
Probabilidad y Estadística Tema 13 Inferencia en una población Objetivo de aprendizaje del tema Al finalizar el tema serás capaz de: Explicar el procedimiento de pruebas en la inferencia estadística. Aplicar
Más detallesEstadística Inferencial. Estadística Descriptiva
INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y
Más detalles6.4. APLICACIÓN DE REDES NEURONALES EN EL CÁLCULO DE LA TASA DE CONTORNEAMIENTOS Velocidad de retorno del rayo con distribución uniforme
Aplicación de redes neuronales en el cálculo de sobretensiones y tasa de contorneamientos 233 6.4. APLICACIÓN DE REDES NEURONALES EN EL CÁLCULO DE LA TASA DE CONTORNEAMIENTOS 6.4.1. Introducción Como ya
Más detallesESTADÍSTICA SEMANA 3
ESTADÍSTICA SEMANA 3 ÍNDICE MEDIDAS DESCRIPTIVAS... 3 APRENDIZAJES ESPERADOS... 3 DEFINICIÓN MEDIDA DESCRIPTIVA... 3 MEDIDAS DE POSICIÓN... 3 MEDIDAS DE TENDENCIA CENTRAL... 4 MEDIA ARITMÉTICA O PROMEDIO...
Más detallesBloque 1. Contenidos comunes. (Total: 3 sesiones)
4º E.S.O. OPCIÓN A 1.1.1 Contenidos 1.1.1.1 Bloque 1. Contenidos comunes. (Total: 3 sesiones) Planificación y utilización de procesos de razonamiento y estrategias de resolución de problemas, tales como
Más detallesESCUELA COMERCIAL CÁMARA DE COMERCIO EXTENSIÓN DE ESTUDIOS PROFESIONALES MAESTRÍA EN ADMINISTRACIÓN
CICLO, ÁREA O MÓDULO: TERCER CUATRIMESTRE OBJETIVO GENERAL DE LA ASIGNATURA: Al termino del curso el alumno efectuara el análisis ordenado y sistemático de la Información, a través del uso de las técnicas
Más detallesTipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE
Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE Objetivos 2 Identificar los tipos de gráficas. Definir los conceptos tablas y cuadros Reconocer las partes de una gráfica. Construir
Más detallesMedición clínica Diagnóstico Sensibilidad y especificidad
Medición clínica Diagnóstico Sensibilidad y especificidad La práctica de la medicina necesita evidencias sobre tres tipos básicos de conocimiento profesional Diagnóstico : Probabilidad El diagnóstico perfecto
Más detallesNOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012
NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012 Matilde Ungerovich- mungerovich@fisica.edu.uy DEFINICIÓN PREVIA: Distribución: función que nos dice cuál es la probabilidad de que cada suceso
Más detallesEstadística aplicada a la comunicación
Estadística aplicada a la comunicación Tema 5: Análisis de datos cuantitativos I: estadística descriptiva b. Análisis bivariante OpenCourseWare UPV/EHU Unai Martín Roncero Departamento de Sociología 2
Más detallesLECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL.
LECTURA 1: LA DISTRIBUCIÓN NORMAL GENERAL LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I) TEMA 1: LA DISTRIBUCION NORMAL GENERAL PROPIEDADES 1 INTRODUCCION La distribución de probabilidad continua más importante
Más detallesCM0244. Suficientable
IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE
Más detallesINSPECCIONES DE SEGURIDAD
INSPECCIONES DE SEGURIDAD OBJETIVOS Conocer los fundamentos básicos y la metodología en la realización de Visitas de Inspección. Facilitar la identificación de los factores de riesgo y seguir medidas de
Más detallesMODULO VIII. Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL.
MODULO VIII Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL Esquema de Proyecto SNIP INDICE INTRODUCCION I. ASPECTOS GENERALES II. IDENTIFICACION III. FORMULACION IV. EVALUACION
Más detallesEscuela de Ciencias Básicas Tecnología e Ingeniería CIENCIAS BÁSICAS. UNIDAD: Conceptos Preliminares e Investigación Descriptiva
AREA: ESTADÍSTICA Escuela de Ciencias Básicas Tecnología e Ingeniería CIENCIAS BÁSICAS CURSO: UNIDAD: Conceptos Preliminares e Investigación Descriptiva TEMA: Diagramas Estadísticos Presentación de la
Más detalles2. METODOLOGÍA. Los tipos fundamentales de Estudios de Investigación, como nos recuerda Bavaresco, son cuatro:
2. METODOLOGÍA Para llevar a cabo este estudio es necesario utilizar una metodología de investigación, debido a que el no contar con los métodos y técnicas necesarias que nos guíen a través de una investigación
Más detallesCONTABILIDAD GERENCIAL
CONTABILIDAD GERENCIAL CONTABILIDAD GERENCIAL 1 Sesión No. 1 Nombre: La Naturaleza de la Información Financiera Al finalizar esta sesión el participante será capaz de: Identificar conceptos básicos de
Más detallesGUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)
GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior
Más detallesESCUELA DE INFORMÁTICA
TÉCNICO EN SISTEMAS LABORAL SUBMODULO TEMA 1 (Visual Basic for Application) Microsoft VBA (Visual Basic for Applications) es el lenguaje de macros de Microsoft Visual Basic que se utiliza para programar
Más detallesI UNIDAD METODOLOGÍA: RECOLECCIÓN DE DATOS
UNIVERSIDAD CATÓLICA LOS ÁNGELES DE CHIMBOTE FACULTAD DE DERECHO Y CIENCIAS POLÍTICAS ESCUELA POSGRADO DE DERECHO TESIS I I UNIDAD METODOLOGÍA: RECOLECCIÓN DE DATOS Mg. Rosina M. Gonzales Napurí RECOLECCIÓN
Más detallesNOMBRE: Elaboración: Lic. Mónica Sánchez Medina. Fecha: 10 de junio de 2014
NOMBRE: 1 RECONOCIENDO MIS COMPETENCIAS. EVALUACIÓN DE MIS CONOCIMIENTOS. TIC IV BLOQUE I PROCESADOR DE PALABRAS GRUPO: NOMBRE DEL ALUMNO FECHA PUNTAJE Subraya la respuesta correcta. a. Es una lista de
Más detalles13. Utilizar la fórmula del término general y de la suma de n términos consecutivos
Contenidos mínimos 3º ESO. 1. Contenidos. Bloque I: Aritmética y álgebra. 1. Utilizar las reglas de jerarquía de paréntesis y operaciones, para efectuar cálculos con números racionales, expresados en forma
Más detallesCOSTES ASOCIADOS AL USO DE CONCENTRADO DE LIMÓN GUÍA PARA EL EMPLEO DE ZUMO DE LIMÓN COMO ACIDULANTE EN SUSTITUCIÓN DE E-330
COSTES ASOCIADOS AL USO DE CONCENTRADO DE LIMÓN GUÍA PARA EL EMPLEO DE ZUMO DE LIMÓN COMO ACIDULANTE EN SUSTITUCIÓN DE E-330 02 2.1 OBJETIVOS OBJETIVO GENERAL Obtención de costes asociados, al uso en los
Más detallesCORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña
CORRELACIÓN Y REGRESIÓN Juan José Hernández Ocaña CORRELACIÓN Muchas veces en Estadística necesitamos saber si existe una relación entre datos apareados y tratamos de buscar una posible relación entre
Más detallesUNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLÓGICOS TÉCNICO EN CONTROL DE LA CALIDAD
UNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLÓGICOS TÉCNICO EN CONTROL DE LA CALIDAD CICLO: I-2015 GUIA DE LABORATORIO # 1 Nombre de la Práctica: Control Estadístico parte I Entorno Lugar de Ejecución:
Más detallesLABORATORIO Nº 8 FILTROS EN EXCEL
OBJETIVO Mejorar el nivel de comprensión y el manejo de las destrezas del estudiante para utilizar filtros en Microsoft Excel. 1) FILTRAR INFORMACIÓN Para agregar un filtro a una tabla se debe seleccionar
Más detallesCurso de Estadística Aplicada a las Ciencias Sociales
Curso de Estadística Aplicada a las Ciencias Sociales Tema 6. Descripción numérica (2) Capítulo 5 del manual Tema 6 Descripción numérica (2) Introducción 1. La mediana 2. Los cuartiles 3. El rango y el
Más detallesAnálisis de resultados de los modelos
Anexo 5 PONTIFICIA UNIVERSIDAD JAVERIANA Análisis de resultados de los modelos Alex Arias 2014-I 1. Introducción En el presente documento se muestran los patrones y tendencias obtenidas por los modelos
Más detallesUn modelo predictivo para reducir la tasa de ausentismo en atenciones médicas programadas
Un modelo predictivo para reducir la tasa de ausentismo en atenciones médicas programadas Ing. Juan Miguel Moine Ing. Cristian Germán Bigatti Ing. Guillermo Leale Est. Graciela Carnevali Est. Esther Francheli
Más detallesOpen Office Calc. Elaboración de una tabla de valores de las áreas de la distribución normal
Open Office Calc. Elaboración de una tabla de valores de las áreas de la distribución normal Objetivo: Conocer y calcular los valores de las áreas de la distribución normal mediante OpenOffice Calc. Conocimiento
Más detallesUNIVERSIDAD CENTROCCIDENTAL LISANDRO ALVARADO DECANATO DE INGENIERIA CIVIL ESTADISTICA. CARÁCTER: Obligatoria DENSIDAD HORARIA HT HP HS UCS THS/SEM
UNIVERSIDAD CENTROCCIDENTAL LISANDRO ALVARADO DECANATO DE INGENIERIA CIVIL ESTADISTICA CARÁCTER: Obligatoria PROGRAMA: Ingeniería Civil DEPARTAMENTO: Ciencias Básicas CODIGO SEMESTRE DENSIDAD HORARIA HT
Más detallesCOMPLEMENTARIO: SISTEMAS DE INFORMACIÓN GEOGRÁFICA APLICADOS A LA AGRICULTURA DE PRECISIÓN OBJETIVO GENERAL
COMPLEMENTARIO: SISTEMAS DE INFORMACIÓN GEOGRÁFICA APLICADOS A LA AGRICULTURA DE PRECISIÓN OBJETIVO GENERAL PPROPORCIONAR A LOS APRENDICES DEL CURSO LOS FUNDAMENTOS TEÓRICOS Y PRÁCTICOS SOBRE LAS TECNOLOGÍAS
Más detallesAPRENDIZAJE DE LAS HERRAMIENTAS DE DESARROLLO DESARROLLO DE LA BASE DE DATOS DESARROLLO DEL INTERFAZ DE USUARIO Y DEL CÓDIGO VBA
4.- PLAN DE TRABAJO Llegados a este punto, vamos a establecer el siguiente plan de trabajo para dar solución a la problemática presentada y con ello alcanzar los objetivos que nos hemos marcado: FASE I
Más detallesAprendizaje Supervisado Árboles de Decisión
Aprendizaje Supervisado Árboles de Decisión 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No Soltero 70K No
Más detallesCORPORACIÓN UNIFICADA NACIONAL DE EDUCACIÓN SUPERIOR FACULTAD DE INGENIERIAS LINEA INFORMÁTICA GUIA TABLAS DINÁMICAS
TABLAS DINÁMICAS Es una herramienta de presentación de datos. Una Tabla Dinámica combina lo mejor de la consolidación y de los subtotales y va más allá de esas dos herramientas para proporcionar una mayor
Más detallesCÁLCULO DE PROBABILIDADES
CÁLCULO DE PROBABILIDADES Tipo de asignatura: Troncal Anual. Créditos ECTS: 15 I.- INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES. (16 horas presenciales) Tema 1.- La naturaleza del cálculo de probabilidades.
Más detalles4. Regresión Lineal Simple
1 4. Regresión Lineal Simple Introducción Una vez conociendo las medidas que se utilizan para expresar la fuerza y la dirección de la relación lineal entre dos variables, se tienen elementos base para
Más detallesClasificador Jerárquico de Imágenes utilizando Naive Bayes
Clasificador Jerárquico de Imágenes utilizando Naive Bayes Hernandez Torres Julio Noe, Marin Castro Maribel Angelica Instituto Nacional de Astrofísica Óptica y Electrónica {julio.hernandez.t, mmarinc}
Más detallesUniversidad Nacional de Mar del Plata. Facultad de Ingeniería. Estadística Básica COMISIÓN 1. 1 Cuatrimestre 2016
Universidad Nacional de Mar del Plata Facultad de Ingeniería Estadística Básica COMISIÓN 1 1 Cuatrimestre 2016 s. La palabra Estadística procede del vocablo Estado, pues era función principal de los Gobiernos
Más detallesAnálisis de regresión lineal simple
Análisis de regresión lineal simple El propósito de un análisis de regresión es la predicción Su objetivo es desarrollar un modelo estadístico que se pueda usar para predecir los valores de una variable
Más detallesCriterios de evaluación 3º de ESO. Matemáticas Orientadas a las Enseñanzas Aplicadas
CONCRECCIÓN de los CRITERIOS de EVALUACIÓN MATEMÁTICAS APLICADAS º ESO Teniendo en cuenta los criterios de evaluación correspondientes a esta materia, se realizan a continuación una concreción de dichos
Más detallesFase 2. Estudio de mercado: ESTADÍSTICA
1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.
Más detallesLas Herramientas de la Calidad
Universidad de Puerto Rico Recinto Universitario de Mayagüez Departamento de Ingeniería Industrial Las Herramientas de la Calidad Laboratorio #1 ININ 4078 Control Estadístico de Calidad Preparado: Joymariel
Más detallesCómo se usa Data Mining hoy?
Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta
Más detallesBIOESTADISTICA ( ) Evaluación de pruebas diagnósticas. 1) Características del diseño en un estudio para evaluar pruebas diagnósticas.
Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55-10536) Evaluación de pruebas diagnósticas CONCEPTOS CLAVE 1) Características del diseño en un estudio para evaluar pruebas
Más detallesProbabilidad y Estadística, EIC 311
Probabilidad y Estadística, EIC 311 Medida de resumen 1er Semestre 2016 1 / 105 , mediana y moda para datos no Una medida muy útil es la media aritmética de la muestra = Promedio. 2 / 105 , mediana y moda
Más detallesMedidas de Tendencia Central.
Medidas de Tendencia Central www.jmontenegro.wordpress.com MEDIDAS DE RESUMEN MDR MEDIDAS DE TENDENCIA CENTRAL MEDIA MEDIANA MODA CUARTILES,ETC. MEDIDAS DE DISPERSIÓN RANGO DESVÍO EST. VARIANZA COEFIC.
Más detallesLECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA: DEFINICION Y CLASIFICACION
LECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA: DEFINICION Y CLASIFICACION 1. DEFINICION La estadística es una ciencia que proporciona un conjunto métodos
Más detallesPontificia Universidad Católica de Chile Facultad de Física. Estática
Pontificia Universidad Católica de Chile Facultad de Física Estática La estática es una rama de la Mecánica Clásica que estudia los sistemas mecánicos que están en equilibrio debido a la acción de distintas
Más detallesANEXO USO DEL PROGRAMA GIVE-WIN Y PC-GIVE
ANEXO USO DEL PROGRAMA GIVE-WIN Y PC-GIVE Para la realización de la presente tesis se utilizó una versión demostrativa del paquete computacional llamado Versión 2.10 de febrero del año 2002. Este software
Más detallesPROGRAMA INSTRUCCIONAL ESTADÍSTICA
UNIVERSIDAD FERMIN TORO VICE RECTORADO ACADEMICO FACULTAD DE INGENIERIA ESCUELA DE MANTENIMIENTO MECÁNICO ESCUELA DE TELECOMUNICACIONES ESCUELA DE COMPUTACIÓN ESCUELA DE ELÉCTRICA PROGRAMA INSTRUCCIONAL
Más detallesFACULTAD DE INGENIERÍA
FACULTAD DE INGENIERÍA II JORNADAS DE DATA MINING CONFERENCIA 7.- " CASO SNOOP CONSULTING-ORACLE Fernando Das Neves Gerente de I+D de Snoop Consulting-Oracle Data Mining Technologies IAE - Pilar, 7 y 8
Más detalles