CAPÍTULO I. 1. Planteamiento del Problema
|
|
- Julio Flores Fernández
- hace 5 años
- Vistas:
Transcripción
1 CAPÍTULO I 1. Planteamiento del Problema Una empresa ecuatoriana exportadora de balsa requiere analizar los procesos inmersos en el aserrado de la madera en sus haciendas, con el objetivo de reducir el nivel de deterioro. 1.1 Descripción del proceso 1 La empresa objeto de este estudio se dedica al tratamiento de madera de balsa, desde plantaciones (haciendas) hasta obtener el producto final; diferentes presentaciones para exportación según requerimiento del comprador. Posee plantaciones (haciendas) que se encargan del proceso de sembrar los árboles de madera de balsa. Cuando están listos para la cosecha pasan a ser cortados, proceso que es denominado tumba del árbol. A cada árbol tumbado se le retiran las hojas quedando únicamente el tronco, el cual es llamado troza. Cada troza es pintada en sus extremos de un color de acuerdo al día de la semana. Figura 1.1 Hacienda de madera de balsa Figura Tomado de: Manual de procedimientos de la empresa
2 Figura 1.2 Hacienda de madera de balsa con parte cosechada Posteriormente cada árbol tumbado, pasa a la siguiente fase (proceso de aserrado). Dicho proceso consiste en cortar el árbol en pequeñas piezas que pueden tener tres medidas: 4, 5 ó 6 pies de largo; así mismo, pueden ser de diferente espesor o ancho. Figura 1.3 Piezas de balsa, pueden tener diferentes espesor y ancho Un conjunto de 70 piezas aproximadamente es reunido para formar un bulto. A cada bulto se lo sella con la fecha en que fue realizado este proceso
3 Figura 1.4 Armado de bultos Estos bultos son distribuidos a las fábricas de madera denominadas satélites, que prestan servicios de procesamiento de madera de balsa para la empresa en estudio
4 1.1.1 Flujo del Proceso 2 Gráfico 1.1 Flujo del proceso Plantaciones (Haciendas) Aserrado de Madera Calificación de la madera verde Satélites Control de tiempo de ingreso a secadora Corporación Balsa Exporta Madera 2 Tomado de: Manual de procedimiento de la empresa
5 La distribución de los bultos es por camiones que transportan 80 bultos aproximadamente. Los bultos son recibidos por las satélites, se registra la fecha de recepción y se realiza un muestreo de cada camionada que llega, para determinar y registrar los defectos encontrados en los bultos muestreados. La muestra es el 5% del total de bultos en la camionada. Figura 1.5 Muestra como se realiza la distribución en camiones Cada satélite recibe la madera verde y la debe ingresar a las máquinas de secado. Dependiendo de la capacidad y la cantidad de secadoras que tengan las satélites deben organizar el ingreso de la balsa sin exceder de un lapso mayor a 21 días. Este tiempo ha sido hasta la actualidad determinado empíricamente, y transcurre desde la fecha de tumba del árbol hasta el momento que la madera ingresa a las secadoras. Si se excede este lapso la madera puede deteriorarse; lo que ocasionaría grandes pérdidas a la empresa
6 Para prever que las satélites tengan mayor cantidad de madera verde a la que pueden secar, la empresa está realizando actualmente un control semanal de distribución para secado de la madera verde. Tabla I Previsión de secado Fuente: Satélites Elaborado por: Jefe planta La Tabla I muestra el formato utilizado para coordinar los días que tarda cada satélite en secar la madera de acuerdo a la cantidad y capacidad con que cuenta cada secadora. Esta información es enviada semanalmente y de acuerdo a ella se distribuye las camionadas de madera
7 Una vez que es secada la madera verde pasa a los talleres de las satélites o de la empresa, para ser procesada y convertida en el producto final - paneles de balsa que son exportados y se utilizan en los pisos de los barcos y otros. 1.2 Antecedentes La empresa está atravesando serios problemas con la calidad del producto; en Septiembre del 2009 iniciaron reclamos por parte de sus clientes, por esta razón ha tomado acciones correctivas y preventivas para evitar reclamos posteriores. Realizando un análisis se determinó el problema ha tratar en este proyecto. Se sabe que uno de los factores que producen el problema, son las diferentes formas que es aserrada la madera en cada una de las haciendas; otro factor es la forma como se califica y procesa la madera en las satélites, por ejemplo hay defectos que son calificados como madera correcta, ocasionando que dicha madera inconforme sea aceptada en los siguientes procesos llegando hasta el producto listo de exportación. Finalmente, un factor que influye también es el tiempo en exceso que tiene que esperar la madera verde en los patios de las satélites, produciendo así uno de los mayores defectos que causa pérdidas a la empresa es el deterioro. A finales del año 2008, la empresa en mención tomó la decisión de cerrar una de las fábricas que les secaba madera, siendo ésta la que mayor capacidad de secado tenía. Sin preveer el invierno y las consecuencias futuras, esta decisión ocasionó que haya un sobre-stock en las otras satélites y que gran cantidad de madera verde no ingresara a tiempo a las secadoras. Sin embargo, aún cuando el tiempo había sido excedido, se realizó el proceso de secado dicha madera, fue procesada y calificada, presentando muchos rechazos por deterioro; además hubo madera verde que tenía en su interior podredumbre que no fue detectaba y - 7 -
8 continuó en el proceso hasta el producto final y fue exportada; los clientes al revisar la calidad del producto detectaron el problema, devolvieron los contenedores y fue un impacto económico grande para la empresa balsera. Actualmente, con la reapertura de la fábrica se espera disminuir el grado del problema. 1.3 Definición del Problema Necesidad de mejorar los procesos de control establecidos, desde las haciendas hasta que la madera sea ingresada a secadoras. Estimar el nivel de deterioro de la madera a fin de reducirlo para que la madera cumpla con los estándares establecidos por la empresa exportadora. Tabla II Nombres de las Haciendas de la empresa Códigos Nombre de la Hacienda FC01 Finca 01 FC1A Finca 1A MS08 Maseca 08 MS09 Maseca 09 PB08 Plantabal 08 PB21 Plantabal 21 PB26 Plantabal 26 RD01 Redonda 01 Fuente: Empresa - 8 -
9 Gráfico 1.2 Nivel de Deterioro Porcentaje de deterioro Haciendas En el Gráfico 1.2 se observa el nivel o porcentaje de deterioro de la madera de acuerdo a la hacienda donde procede. Como se muestra en este mismo gráfico, las haciendas son conocidas y están representadas por códigos. Sin embargo para esta investigación, se muestra en la Tabla II, los nombres exactos de las haciendas para conocer el significado de los códigos mostradas en el Gráfico
10 1600 Gráfico 1.3 Histograma de días en espera de secado Número de bultos Frecuencia # de días antes de entrar a la secadora Revisado el nivel de deterioro, se puede observar en el Gráfico 1.3 el número de días que las satélites tardan en ingresar la madera de las haciendas a las secadoras. Cabe mencionar que la madera está organizada en bultos, por lo cual el Gráfico 1.3 muestra el número de días que determinada cantidad de bultos espera hasta ingresar al proceso de secado. Si el lapso que espera la madera en las satélites, sobrepasa los días establecidos por los estándares de la empresa, puede ocurrir que esto afecte la calidad de la balsa y se produzcan problemas en el producto final
11 1.4 Propuesta de Soluciones Una vez definido el problema se considera que las soluciones más viables para la empresa son: Aplicación de una de las técnicas de Minería de Datos como son los Árboles de decisiones, a fin de obtener información confiable para las tomas de decisiones con respecto a los niveles aceptables de defectos encontrados en la madera. Realización de un Data Marts para el Departamento que controla las satélites, con el objetivo que puedan tener acceso a esta información las diversas partes involucradas: haciendas, satélites, Dpto. de Control y otros. 1.5 Objetivo General Estimar el nivel de deterioro promedio controlando que la madera que llega de las plantaciones ha sido procesada bajo los estándares establecidos por la empresa exportadora. 1.6 Objetivos Específicos Realización de Data Mart para las satélites. Utilizando la información contenida en el Data Mart, aplicar modelamiento de árbol de decisión para la toma de decisiones y mejora de resultados
12 CAPÍTULO II 2. Definiciones técnicas A partir de la aplicación de una técnica de Minería de Datos como los árboles de decisión se pretende estimar el nivel de deterioro en madera de balsa, basado en las relaciones que se establecen entre el centro de procedencia de la madera, llegada a las satélites, y tiempo de espera entre tumba y secado. Estos resultados pueden mejorar el proceso de envío, recepción y elevar la calidad de la madera en la empresa en estudio. 2.1 Data Warehouse 3 Un Data Warehouse es una solución que permite centralizar en un solo punto, toda la información definida por la compañía como relevante para la gestión de su negocio y la toma de decisiones. La distribución de la información se realiza a través de herramientas que permiten a los usuarios finales construir sus propios informes de forma autónoma. Figura Tomado de: estion/data.htm
13 2.2 DataMart 4 Un DataMart es una solución, que compartiendo tecnología con el Data Warehouse (pero con contenidos específicos, volumen de datos más limitado y un alcance histórico menor), permite dar soporte a una empresa pequeña, o un departamento o área de negocio de una empresa grande. Son subconjuntos de datos con el propósito de ayudar a que un área específica dentro de la compañía para que pueda tomar mejores decisiones. Los datos existentes en este contexto pueden ser agrupados, explorados y propagados de múltiples formas para que diversos grupos de usuarios realicen la explotación de los mismos de la forma más conveniente según sus necesidades. En síntesis, se puede decir que los Data Marts son pequeños Data Warehouse centrados en un tema o área dentro de una organización. Figura 2.2 Database - Data Mart 4 Tomado de: estion/data.htm
14 2.3 Modelo Estrella Figura 2.3 Data Mart (Modelo Estrella) Este es el Data Mart de donde se obtendrá la información para aplicar la técnica de minería de datos, Árboles de decisión, para la estimación del deterioro en las haciendas de la empresa balsera
15 2.4 Descripción de las Tablas Lo siguiente es el diccionario de datos del modelo estrella (ver Sección 2.3). Tabla haciendas, esta tabla contiene los datos de cada hacienda destacando como campos importantes: Nombre, es la identificación que se le ha dado a la hacienda hace algunos años. Ubicación, es donde se encuentra localizada geográficamente. Tamaño, nos indica el número de hectáreas que tiene la hacienda. Producción, indica la producción estimada de la hacienda en BFT que es la medida en volumen de la madera de balsa. Tabla Satélites, esta tabla contiene los datos de cada hacienda destacando como campos importantes: Nombre, es la denominación de la satélite asignada por los dueños de las mismas. Localidad, es la ubicación geográfica. Capc_producción, capacidad mensual de producción. Capc_secado, capacidad de secado de madera del total de sus secadoras
16 Tabla Producto, esta tabla contiene los datos del producto que llega a las satélites y del cual se toma las muestras para establecer el nivel de deterioro. Largo_muestreado, es el largo de la pieza de balsa que pertenece a la muestra que se obtiene y que se revisa para determinar si tiene o no deterioro y estimar el total de defectos en toda la camionada. Espesor_muestreado, es el espesor de la pieza de balsa que se toma como muestra de la camionada y se revisa el nivel de deterioro. Tabla Tiempo, esta tabla contiene los datos referentes al tiempo que sean necesarios. Fecha, campo que determina el día, mes y año en que son registrados los datos
17 CAPÍTULO III 3. Árbol de decisiones 5 Se define un árbol de decisión como una estructura en forma de árbol en la que las ramas representan conjuntos de decisiones. Estas decisiones generan sucesivas reglas para la clasificación de un conjunto de datos en subgrupos disjuntos y exhaustivos. Las ramificaciones se realizan de forma recursiva hasta que se cumplen ciertos criterios de parada. El objetivo de estos métodos es obtener individuos más homogéneos con respecto a la variable que se desea discriminar dentro de cada subgrupo y heterogéneos entre los subgrupos. Para la construcción del árbol se requiere información de variables explicativas a partir de las cuales se va a realizar la discriminación de la población en subgrupos. El programa AID (Automatic Interaction Detection) de Sonquist, Baker y Morgan (1.971), representa uno de los primeros métodos de ajuste de los datos basados en modelos de árboles de clasificación. AID esta basado en un algoritmo recursivo con sucesivas particiones de los datos originales en otros subgrupos menores y más homogéneos mediante secuencias binarias de particiones. Posteriormente surgió un sistema recursivo binario similar denominado CART (Classification And Regression Tree, Árboles de Clasificación y Regresión) desarrollado por Breiman en Un algoritmo recursivo de clasificación no binario, denominado CHAID (Chi Square Automatic Interaction Detection, Detección de Interacción Automática de Chi Cuadrado) fue desarrollado por 5 Tomado de:
18 Kass en Dentro de los métodos basados en árboles se pueden distinguir dos tipos dependiendo de tipo de variable a discriminar: Árboles de clasificación. Este tipo de árboles se emplea para variables categóricas, tanto nominales como ordinales. Árboles de regresión. Este tipo de discriminación se aplica a variables continuas. Teniendo en cuenta el tipo de variable con que estamos trabajando se calcula distintas medidas para el estudio de la homogeneidad. En todos los casos las variables explicativas son tratadas como variables categóricas. En particular en el caso de tener una variable explicativa continua, salvo que haya sido categorizada previamente, será tratada como una variable categórica con el número de clases igual al número de valores distintos de la variable en el fichero de datos. Dependiendo de la estructura del árbol, del número de ramas que se permiten generar a partir de un nodo, se distinguen dos tipos: Árboles basados en la metodología CART: Técnica de árbol de decisión que permite generar únicamente dos ramas a partir de un nodo. Árboles basados en la metodología CHAID: genera distinto número de ramas a partir de un nodo. Figura 3.1 Ejemplo de Árboles de decisiones
19 3.1 Software utilizado para la elaboración del árbol de decisiones 6 SPSS AnswerTree es una herramienta para la creación de sistemas de clasificación en forma de árbol de decisión, lo cual nos ofrece una fácil interpretación de los resultados. Permite crear perfiles, describir segmentos, observar tendencias ocultas y segmentar bases de datos, sus aplicaciones son muy variadas: mejora de los resultados de campañas de marketing directo, investigación médica, detección de operaciones fraudulentas, análisis de venta cruzada, identificación de clientes potenciales, etc. Nos ofrece la posibilidad de usar cuatro potentes algoritmos de segmentación. Los resultados son sencillos de interpretar y comprender en la estructura de árbol que posee. CHAID - es un rápido algoritmo de árbol estadístico de múltiples variables que explora eficazmente los datos. CHAID exhaustivo - es un completo algoritmo de árbol estadístico de múltiples variables que permite una exploración exhaustiva de los datos. C&RT - Árbol de clasificación y regresión - es un completo algoritmo de árbol binario para dividirlos datos y generar subconjuntos homogéneos precisos. QUEST - es un algoritmo estadístico para seleccionar variables sin sesgos y crear rápida y eficientemente un preciso modelo de árbol binario. 6 Tomado de:
20 3.2 Conocimientos aplicados en Árboles de decisiones Prueba de Bondad de Ajuste Con mucha frecuencia no se conoce la distribución de probabilidad de la variable aleatoria en estudio, digamos X, y se desea probar la hipótesis de que X sigue una distribución de probabilidad particular. Existen dos procedimientos para realizar pruebas de bondad de ajuste que son los más conocidos. El primero se basa en una técnica gráfica muy útil llamada gráfica de probabilidad y el segundo procedimiento se basa en la distribución Chi-cuadrada. En este estudio se aplicará la distribución Chi-cuadrada la que describimos a continuación Prueba de bondad de ajuste de la Chi-cuadrada El procedimiento de prueba de la Chi-cuadrada es un método analítico, requiere una muestra aleatoria de tamaño n de la variable aleatoria X. Estas n observaciones se arreglan en histogramas de frecuencias, teniendo k intervalos de clase (donde k = n ). Sea n i la frecuencia observada en el i-ésimo intervalo de clase. De la distribución de probabilidad hipotética, se calcula la frecuencia esperada en el i-ésimo intervalo de clase, identificada como p i. H : La distribución es F ( ) (Distribución Teórica dada) 0 0 X H : La distribución no puede ser F ( ) a EP: χ k 2 2 ( i i ) = i= 1 n np np i 0 X RR: 2 χ χ 2 > α, k r 1 gl 7 Tomado de:
21 Grados de Libertad 8 es un estimador del número de categorías independientes en una prueba particular o experimento estadístico. Se encuentran mediante la fórmula k r, donde k=número de grupos, cuando se realizan operaciones con grupos y r es el número de sujetos o grupos estadísticamente dependientes. 3.3 Aplicación de Árboles de Decisiones para estimar el nivel de deterioro de las haciendas. Para la realización de los árboles de decisión, en este estudio se han utilizado tres de los algoritmos que presenta el software, las variables utilizadas para este estudio son las siguientes: Variable dependiente: id_hacienda Variables predictoras o explicativas: total_de_pies_rechazados total_de_pies_muestreados id_satelites 8 Tomado de:
22 Algoritmo C&RT 9 El algoritmo de Árboles de Clasificación y Regresión, más conocido por sus siglas en inglés C&RT (Classification And Regression Tree), es un algoritmo de regresión y clasificación jerárquica que constituye un método parecido al algoritmo AID que dicotomiza la muestra según el modelo de Breiman y genera árboles de decisiones binarios. El propósito es realizar una partición de los datos en subconjuntos que sean homogéneos con respecto de la variable dependiente, a cada partición de los datos se selecciona la mejor variable independiente predictora (explicativa) que presentará la mejor dicotomización (para variables independientes continuas) o el mejor ajuste de categorías (para variables nominales u ordinales) en base a la mayor reducción de impurezas, es decir se crean dos nodos con el mejor predictor. El proceso se repetirá hasta que se alcancen los parámetros de paro. En la Figura 3.2 se puede observar que ha existido una mejora del 9.63% para la variable predictora Total de pies muestreados, de donde se puede verificar que la balsa que se ha muestreado en las satélites proviene en un 47.06% de la hacienda PB08, cuando el total de pies muestreados es inferior o igual a 250. Sin embargo si los pies muestreados son mayores a 250, la plantación donde proviene la mayor cantidad de pies que intervienen en la muestra es la hacienda denominada MS09 con un 74.29%, como se observa en el nodo 2. 9 Tomado de: ting&meta=&aq=o&aqi=&aql=&oq=&gs_rfai=
23 Así mismo, se puede verificar que al incluir la variable predictora Total de pies rechazados, la mejora obtenida con el algoritmo C&RT es de 1.64% y clasifica a los nodos 3 y 4 en total de pies rechazados menores o iguales a y mayores a respectivamente. Determinando así que cuando los pies rechazados son menores iguales a la madera de balsa proviene principalmente de la hacienda MS09 en un 32.67% de los casos. Sin embargo si al muestrear los pies rechazados superan 33.75, la probabilidad que la madera de balsa provenga de la hacienda PB08 es de En el nodo 3 se puede confirmar que el 22.66% de las observaciones presentaron un deterioro en la balsa menor o igual a Podemos concluir el análisis de este árbol de decisión con este algoritmo mencionando que aún cuando la hacienda MS09 es la que tiene mayor cantidad de pies muestreados, no es ésta la que tiene mayor deterioro en la balsa, sino la plantación PB
24 Figura 3.2 Árbol de decisiones Algoritmo C&RT ID_HACIE Node 0 Category % n MS09 57, PB21 1,51 10 PB08 20, FC1A 3,32 22 MS08 0,15 1 RD01 6,04 40 PB26 2,42 16 FC01 2,57 17 PB23 1,06 7 PB01 5,29 35 PB10 0,15 1 Total (100,00) 662 TOTAL_MU Improvement=0,0963 <=260 Node 1 Category % n MS09 26,89 64 PB21 0,42 1 PB08 47, FC1A 0,84 2 MS08 0,00 0 RD01 5,46 13 PB26 1,68 4 FC01 2,94 7 PB23 1,26 3 PB01 13,45 32 PB10 0,00 0 Total (35,95) 238 >260 Node 2 Category % n MS09 74, PB21 2,12 9 PB08 5,19 22 FC1A 4,72 20 MS08 0,24 1 RD01 6,37 27 PB26 2,83 12 FC01 2,36 10 PB23 0,94 4 PB01 0,71 3 PB10 0,24 1 Total (64,05) 424 TOTAL_RE Improvement=0,0164 <=33,75 Node 3 Category % n MS09 32,67 49 PB21 0,67 1 PB08 32,67 49 FC1A 1,33 2 MS08 0,00 0 RD01 7,33 11 PB26 1,33 2 FC01 4,00 6 PB23 2,00 3 PB01 18,00 27 PB10 0,00 0 Total (22,66) 150 >33,75 Node 4 Category % n MS09 17,05 15 PB21 0,00 0 PB08 71,59 63 FC1A 0,00 0 MS08 0,00 0 RD01 2,27 2 PB26 2,27 2 FC01 1,14 1 PB23 0,00 0 PB01 5,68 5 PB10 0,00 0 Total (13,29)
25 Algoritmo CHAID 10 El algoritmo Detección de Interacción Automática de Chi Cuadrado más conocido por sus siglas en inglés CHAID (Chi Square Automatic Interaction Detection), contrariamente al algoritmo CRT éste actúa por iteración politómica de las categorías o clases. De manera general permite descomponer una base de datos en varios grupos en base al mejor predictor de la variable dependiente (en función de la prueba de la Chi-Cuadrada más significativa). CHAID permite determinar la mejor partición de cada nodo y aparejar clases o categorías de las variables dependientes o predictoras si no existen diferencias estadísticamente significativas de las clases en relación con la variable dependiente. Se repite el proceso hasta que no queden más parejas significativas. Seguidamente se vuelve a seleccionar en nuevo mejor predictor y el grupo (nodo) será dividido en dos o más clases. Se repetirá el proceso hasta que se llegue a la regla de fin. Observando la Figura 3.3, se puede verificar que el algoritmo CHAID clasifica a la variable Total de pies rechazados en seis intervalos (nodos) desde menores o iguales a 29.5 hasta mayores a 64 pies rechazados. De esta manera se obtiene con este algoritmo que la hacienda con mayores niveles de deterioro es la hacienda MS09, como se observa en la mayoría de los nodos; diferenciándose el nodo 3 que muestra que cuando los pies rechazados se encuentran en el intervalo (33,5-35,5] la plantación PB08 es de donde proviene esa madera con deterioro. 10 Tomado de: ting&meta=&aq=o&aqi=&aql=&oq=&gs_rfai=
26 Incluyendo en este análisis la variable Satélites como predictora, se puede verificar que independientemente de la Satélite donde se haya realizado el muestreo y de la clasificación realizada, la hacienda con mayores niveles de deterioro en la balsa es la hacienda MS09, como se observa en los nodos 9 y 10, tomados por el nivel de significancia menor (0.0071) con respecto a los nodos 7 y 8. Así también se observa que en la satélite Inmahar ingresa el 11.33% de la balsa que proviene de la hacienda MS09 que tiene niveles de deterioro mayores a 64 pies, mientras que en las otras satélites reciben el 9.06%. De los 11.33% que clasifica Inmahar con más de 64 pies rechazados el 90.67% corresponde a MS09. Y de los 9.06% que clasifican Madera Export y las otras satélites que prestan servicios a la empresa, el 73.83% proviene de MS09 y el 11.67% de PB
27 - 27 -
28 Algoritmo CHAID exhaustivo 11 A diferencia del algoritmo CHAID que no garantiza la partición óptima de cada grupo (en cada nodo), el algoritmo CHAID Exhaustive (Biggs, 1991) realiza una investigación exhaustiva de todos los grupos posibles hasta que quede el grupo más significativo. Este algoritmo actúa de la misma manera que el CHAID pero de manera recursiva. Similar al algoritmo CHAID, el exhaustive realiza particiones de los datos en intervalos que van desde menores o iguales a 29.5 pies rechazados o deteriorados, hasta mayores a A diferencia del CHAID, este algoritmo ha clasificado los pies rechazados en más nodos que en el caso anterior, y como se observa en este análisis los nodos resultantes son diez; en los que se puede verificar que la los intervalos resultantes, la mayoría de ellos la hacienda donde proviene la mayor cantidad de balsa con deterioro es la MS09, sin embargo cuando los pies rechazados se encuentran en el intervalo (33,5-35,5] la plantación PB08 presenta un 67.19% del 9.67% de los pies rechazados que se presentan en el nodo Tomado de: ting&meta=&aq=o&aqi=&aql=&oq=&gs_rfai=
29 - 29 -
ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Instituto de Ciencias Matemáticas
ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Instituto de Ciencias Matemáticas Ingeniería en Estadística Informática Estimación del nivel de deterioro en la madera de las haciendas de una compañía balsera
ÍNDICE. Introducción... Capítulo 1. Técnicas de minería de datos y herramientas... 1
ÍNDICE Introducción... XI Capítulo 1. Técnicas de minería de datos y herramientas... 1 Clasificación de las técnicas de minería de datos y herramientas más comunes... 1 Modelado originado por la teoría
Introducción a SPSS Árboles de Clasificación. Jorge Del Río L. Consultor Estadístico
Introducción a SPSS Árboles de Clasificación Jorge Del Río L. Consultor Estadístico Introducción Es un módulo que contiene diferentes procedimientos para resolver problemas de predicción y clasificación
Distribuciones de parámetros conocidos
10.3. CONTRASTE DE BONDAD DE AJUSTE PARA DISTRIBUCIONES265 350 300 observaciones esperado(x) 250 Frecuencias esperadas 200 150 100 Frecuencias observadas 50 0 55 60 65 70 75 80 85 90 Figura 10.2: En los
Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández
Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema
PRUEBA DE BONDAD DE AJUSTE O PRUEBA CHI - CUADRADO
O PRUEBA CHI - CUADRADO Hasta ahora se han mencionado formas de probar lo que se puede llamar hipótesis paramétricas con relación a una variable aleatoria, o sea que se ha supuesto que se conoce la ley
INTRODUCCION A LA SIMULACION DE MODELOS. Simulación es la descripción de un sistema a través de modelos que se pueden aplicar a varias disciplinas.
Tema N 1 Definiciones INTRODUCCION A LA SIMULACION DE MODELOS Simulación es la descripción de un sistema a través de modelos que se pueden aplicar a varias disciplinas. La simulación esencialmente es una
Simulación a Eventos Discretos. Clase 8: Análisis de resultados
Simulación a Eventos Discretos Clase 8: Análisis de resultados Muestras independientes Los resultados de una corrida de una simulación estocástica (denominados respuestas), son muestras de alguna distribución.
MODELOS DE SIMULACIÓN ESTADÍSTICOS CLASE 4: DISTRIBUCIÓN t, CHI-CUADRADA y EXPONENCIAL PROFESOR: OSCAR SAAVEDRA ANDRÉS DURANGO.
DISTRIBUCIÓN t Con frecuencia intentamos estimar la media de una población cuando se desconoce la varianza, en estos casos utilizamos la distribución de t de Student. Si el tamaño de la muestra es suficientemente
Carteras minoristas. árbol de decisión. Ejemplo: Construcción de un scoring de concesión basado en un DIRECCIÓN GENERAL DE SUPERVISIÓN
Carteras minoristas Ejemplo: Construcción de un scoring de concesión basado en un árbol de decisión Grupo de Tesorería y Modelos de Gestión de Riesgos Sergio Gavilá II Seminario sobre Basilea II Validación
Inferencia Estadística
Inferencia Estadística 2do C. 2018 Mg. Stella Figueroa Clase Nº10 Población y Muestra- Parámetro y Estimación puntual Población: Es el conjunto de todos los elementos o unidades elementales con características
ESTADÍSTICA INFERENCIAL
ESTADÍSTICA INFERENCIAL ESTADÍSTICA INFERENCIAL 1 Sesión No. 10 Nombre: Pruebas de hipótesis referentes al valor de la media de la población Contextualización En estadística existen dos métodos para la
Folleto de Estadísticas. Teoría del 2do Parcial
Folleto de Estadísticas Teoría del 2do Parcial 2012 Variables aleatorias conjuntas continuas: Sean X y Y dos variables aleatorias continuas con ellas se asocia una función denominada función de densidad
Estimación de Parámetros.
Estimación de Parámetros. Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona información sobre el valor del parámetro. Por ejemplo la media muestral es un
Intervalos de Confianza
Intervalos de Confianza Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Intervalo de Confianza Se puede hacer una estimación puntual de
PRUEBAS DE BONDAD DE AJUSTE
PRUEBAS DE BONDAD DE AJUSTE Las pruebas de bondad de ajuste son pruebas de hipótesis para verificar si los datos observados en una muestra aleatoria se ajustan con algún nivel de significancia a determinada
EVALUACIÓN EN APRENDIZAJE. Eduardo Morales y Jesús González
EVALUACIÓN EN APRENDIZAJE Eduardo Morales y Jesús González Significancia Estadística 2 En estadística, se dice que un resultado es estadísticamente significante, cuando no es posible que se presente por
ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN
ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN Los árboles de clasificación y regresión (CART=Classification and Regression Trees) son una alternativa al análisis tradicional de clasificación/discriminación o a
Econometría 1. Karoll GOMEZ Segundo semestre 2017
Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 I. Introducción Motivación I Econometría: Rama de la disciplina económica que concierne con la estimación
1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA
MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse
Pruebas estadís,cas para evaluar relaciones
Pruebas estadís,cas para evaluar relaciones Asociación entre dos variables categóricas Hipótesis: frecuencias de ocurrencias en las categorías de una variable son independientes de los frecuencias en la
5. Descripción teórica de los modelos econométricos. La naturaleza del estudio que esta tesis pretende realizar nos lleva a enfrentarnos
5. Descripción teórica de los modelos econométricos El problema de la auto-selección La naturaleza del estudio que esta tesis pretende realizar nos lleva a enfrentarnos inevitablemente a un problema de
Pruebas de hipótesis
Pruebas de hipótesis Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Prueba de hipótesis Uno de los objetivos de la estadística es hacer
UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA
UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA DIRECCIÓN GENERAL DE ASUNTOS ACADÉMICOS PROGRAMA DE ASIGNATURA POR COMPETENCIAS I. DATOS DE IDENTIFICACIÓN 1. Unidad Académica: Facultad de Ingeniería. Mexicali.
TABLAS DE CONTINGENCIA
Tablas de contingencia 1 TABLAS DE CONTINGENCIA En SPSS, el procedimiento de Tablas de Contingencia crea tablas de clasificación doble y múltiple y, además, proporciona una serie de pruebas y medidas de
Estadística I Tema 5: Introducción a la inferencia estadística
Estadística I Tema 5: Introducción a la inferencia estadística Tema 5. Introducción a la inferencia estadística Contenidos Objetivos. Estimación puntual. Bondad de ajuste a una distribución. Distribución
Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico
Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más
Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con
Hasta ahora hemos supuesto que conocemos o podemos calcular la función/densidad de probabilidad (distribución) de las variables aleatorias. En general, esto no es así. Más bien se tiene una muestra experimental
INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016
ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una
Tema 12: Introducción a la Estadística.
MOLEDO GUGLIOTTA VICTOR Tratamiento de los datos Tema 12: Introducción a la Estadística. Al intentar interpretar la realidad a través de las herramientas que nos aporta la Estadística, lo primero que se
Distribuciones Fundamentales de Muestreo. UCR ECCI CI-0115 Probabilidad y Estadística Prof. Kryscia Daviana Ramírez Benavides
Distribuciones Fundamentales de Muestreo UCR ECCI CI-0115 Probabilidad y Estadística Prof. Kryscia Daviana Ramírez Benavides Distribuciones Muestrales La distribución de probabilidad de un estadístico
Conceptos Básicos de Inferencia
Conceptos Básicos de Inferencia Intervalos de confianza Álvaro José Flórez 1 Escuela de Estadística Facultad de Ingenierías Febrero - Junio 2012 Inferencia Estadística Cuando obtenemos una muestra, conocemos
4. MODELO DE REGRESIÓN LINEAL. En muchos problemas hay dos o más variables relacionadas, y el interés se centra en
4. MODELO DE REGRESIÓN LINEAL 4.1 INTRODUCCIÓN En muchos problemas hay dos o más variables relacionadas, y el interés se centra en modelar y explorar esta relación. Por ejemplo, en un proceso químico el
Análisis estadístico de los factores de riesgo que influyen en la enfermedad Angina de Pecho. Flores Manrique, Luz CAPÍTULO IV ANALISIS DE LOS DATOS
CAPÍTULO IV ANALISIS DE LOS DATOS 4.1 DESCRIPCIÓN DE LOS DATOS Como ya se mencionó anteriormente, el tamaño de la población con la que se está trabajando es de 149 observaciones, 69 de ellas presentan
APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU. Luis Azaña Bocanegra
APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU Luis Azaña Bocanegra TEMARIO CONCEPTOS DEFINICION DE MINERIA DE DATOS USOS DE LA MINERIA DE DATOS TECNICAS DE MINERIA DE DATOS ETAPAS DE UN PROYECTO DE
Estadística II Tema 4. Regresión lineal simple. Curso 2009/10
Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
Inferencia estadística: Prueba de Hipótesis. Jhon Jairo Padilla A., PhD.
Inferencia estadística: Prueba de Hipótesis Jhon Jairo Padilla A., PhD. Justificación Es una etapa de análisis de datos de un experimento comparativo: Se compara un parámetro de una v.a. con un valor dado.
1. Ejercicios. 2 a parte
1. Ejercicios. 2 a parte Ejercicio 1 Calcule 1. P (χ 2 9 3 33) 2. P (χ 2 15 7 26). 3. P (15 51 χ 2 8 22). 4. P (χ 2 70 82). Ejercicio 2 Si X χ 2 26, obtenga un intervalo [a, b] que contenga un 95 % de
Conceptos Básicos de Inferencia
Conceptos Básicos de Inferencia Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Inferencia Estadística Cuando obtenemos una muestra, conocemos
Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )
Test de Hipótesis II Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ conocida: Suponga que X, X,, X n, es una m.a.(n) desde N( µ, σ ) Estadística de Prueba X - μ Z 0 = σ / n ~ N(0,)
UNIVERSIDAD AUTÓNOMA DE TAMAULIPAS FACULTAD DE INGENIERÍA ARTURO NARRO SILLER
UNIVERSIDAD AUTÓNOMA DE TAMAULIPAS FACULTAD DE INGENIERÍA ARTURO NARRO SILLER CARTA DESCRIPTIVA Carrera: INGENIERÍA EN SISTEMAS COMPUTACIONALES. Materia:. Titular: Correo electrónico: NUMERO DE UNIDAD:
Tema 4. Regresión lineal simple
Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias
UNIDAD V: ESTIMACIÓN DE PARÁMETROS Y PRUEBAS DE HIPOTESIS.
UNIDAD V: ESTIMACIÓN DE PARÁMETROS Y PRUEBAS DE HIPOTESIS. 5.1 INTERVALOS DE CONFIANZA. CONTENIDOS: OBJETIVOS: 5.1.1. Intervalo de confianza y tamaño de muestra para una media. 5.1. Intervalo de confianza
TEMA 1 INTRODUCCIÓN AL MODELADO Y LA SIMULACIÓN
TEMA 1 INTRODUCCIÓN AL MODELADO Y LA SIMULACIÓN 1.1. Introducción 1.2. Conceptos fundamentales 1.3. Modelado y simulación de tiempo discreto 1.4. Modelado y simulación de eventos discretos 1.5. Pasos en
UNIVERSIDAD MARÍA AUXILIADORA - UMA
UNIVERSIDAD MARÍA AUXILIADORA - UMA ESCUELA ACADÉMICA PROFESIONAL DE MARKETING EMPRESARIAL SILABO DE LA ASIGNATURA DE ESTADÍSTICA I. DATOS GENERALES: Nombre del curso : Estadística Semestre Académico :
Variables aleatorias
Variables aleatorias Un poco más general: si ahora S n está dada por la suma de variables independientes de la forma: S n =c 1 X 1 +... +c n X n, entonces la función generatriz viene dada por: Variables
un valor de prueba conocido y sea X y SX
5. PRUEBAS DE HIPÓTESIS PARAMÉTRICAS CONTENIDOS: OBJETIVOS: 5... Prueba de hipótesis para una media. 5.. Prueba de hipótesis para una proporción. 5..3 Prueba de hipótesis para la varianza. 5..4 Prueba
Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:
Modelos de probabilidad Modelos de probabilidad Distribución de Bernoulli Distribución Binomial Distribución de Poisson Distribución Exponencial Objetivos del tema: Al final del tema el alumno será capaz
REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE
UNIDAD 3 REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE Relación entre variables de interés 1 Relación entre variables de interés Muchas decisiones gerenciales se basan en la relación entre 2 o
Vocabulario de la Unión Internacional de Química pura y aplicada IUPAC 1990
Muestreo Vocabulario de la Unión Internacional de Química pura y aplicada IUPAC 1990 2.1 Términos generales 2.1.1 Muestra: Parte del material seleccionado de una mayor cantidad de material. 2.1.2 Plan
VIII Jornadas de Usuarios de R
VIII Jornadas de Usuarios de R Análisis del Abandono en el Sector Bancario Predicción del abandono de clientes Albacete, 17 de Noviembre de 2016 I. INDICE : Modelo Abandonos I. COMPRENSIÓN DEL NEGOCIO
Análisis de Datos Categóricos
Análisis de Datos Categóricos En el análisis de datos, a menudo nos encontramos con mediciones de respuestas que son de naturaleza categórica. Éstas respuestas reflejan información de categorías más que
Estimación de Parámetros. Jhon Jairo Padilla A., PhD.
Estimación de Parámetros Jhon Jairo Padilla A., PhD. Inferencia Estadística La inferencia estadística puede dividirse en dos áreas principales: Estimación de Parámetros Prueba de Hipótesis Estimación de
Estimación de Parámetros. Jhon Jairo Padilla A., PhD.
Estimación de Parámetros Jhon Jairo Padilla A., PhD. Inferencia Estadística La inferencia estadística puede dividirse en dos áreas principales: Estimación de Parámetros Prueba de Hipótesis Estimación de
INTERVALOS DE CONFIANZA
INTERVALOS DE CONFIANZA INTERVALOS DE CONFIANZA Dado que los estimadores puntuales pocas veces serán iguales a los parámetros que se desean estimar, es posible darse mayor libertad utilizando estimadores
Métodos Cuantitativos
Presenta: Olán Inferencia estadística Parámetros y estadísticos Una población o universo es una colección o totalidad de posibles individuos, objetos o medidas de interés sobre lo que se hace un estudio.
PRUEBA CHI-CUADRADO. Para realizar un contraste Chi-cuadrado la secuencia es:
PRUEBA CHI-CUADRADO Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de la prueba Chi-cuadrado postula una distribución de probabilidad totalmente especificada
TEMA 4 Regresión logística
TEMA 4 Regresión logística José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Variable respuesta dicotómica. Ejemplo. El
Distribución Exponencial
Distribución Exponencial Hay dos casos especiales importantes de la distribución gamma, que resultan de restricciones particulares sobre los parámetros α y β. El primero es cuando se tiene α = 1, entonces
Pruebas de bondad de ajuste
Pruebas de bondad de ajuste Área Académica: Licenciatura en Ingeniería Industrial Profesor(a): Mtra. Ma. Guadalupe Vera Correa Periodo: Julio - diciembre 2017 Pruebas de bondad de ajuste RESUMEN En esta
PROYECTO DE CARRERA: INGENIERÍA INDUSTRIAL ASIGNATURA: ESTADÍSTICAS II GUÍA DE EJERCICIOS N 2
PROYECTO DE CARRERA: INGENIERÍA INDUSTRIAL ASIGNATURA: ESTADÍSTICAS II GUÍA DE EJERCICIOS N 2 UNIDAD II: DISTRIBUCIONES MUESTRALES OBJ. 2.1 2.2 2.3 2.4 1.- Un plan de muestreo para aceptar un lote, para
Tema 8. Contrastes no paramétricos. 8.1 Introducción
Índice 8 8.1 8.1 Introducción.......................................... 8.1 8.2 Bondad de ajuste....................................... 8.2 8.2.1 Test de Kolmogorov-Smirnov de bondad de ajuste................
Estimación. Diseño Estadístico y Herramientas para la Calidad. Estimación. Estimación. Inferencia Estadística
Diseño Estadístico y Herramientas para la Calidad Estimación Epositor: Dr. Juan José Flores Romero juanf@umich.m http://lsc.fie.umich.m/~juan M. en Calidad Total y Competitividad Estimación Inferencia
INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas
INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de
INFERENCIA ESTADISTICA
1 INFERENCIA ESTADISTICA Es una rama de la Estadística que se ocupa de los procedimientos que nos permiten analizar y extraer conclusiones de una población a partir de los datos de una muestra aleatoria,
Análisis de datos Categóricos
Regresión logística Universidad Nacional Agraria La Molina 2016-1 Regresión logística simple Interpretación de parámetros Inferencia Para una variable aleatoria respuesta Y y una variable explicativa X,
Técnicas Multivariadas Avanzadas
Métodos basados en árboles Universidad Nacional Agraria La Molina 2014-2 Introducción Introducción Se describen métodos basados en árboles para regresión y clasicación. Estos métodos requieren estraticar
DISTRIBUCION "F" FISHER
Imprimir INSTITUTO TECNOLOGICO DE CHIHUAHUA > DISTRIBUCION "F" FISHER La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones es evidente a partir
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMÁTICAS E.A.P. DE ESTADÍSTICA Desnutrición crónica estudio de las características, conocimientos y aptitudes de la madre sobre nutrición
DISTRIBUCIÓN CHI-CUADRADO O JI-CUADRADO X 2 CONCEPTO BÁSICO Frecuencia: es el número de datos que caen en cada celda. Frecuencias Observadas (fo):
DISTRIBUCIÓN CHI-CUADRADO O JI-CUADRADO X CONCEPTO BÁSICO Frecuencia: es el número de datos que caen en cada celda. Frecuencias Observadas (fo): son aquellas que representan los valores muestrales observados
PROYECTO GRUPAL. GUIA DE LA ACTIVIDAD DE TRABAJO COLABORATIVO Muestreo y Estimación de Parámetros METODOLOGÍA. Procedimiento:
PROYECTO GRUPAL GUIA DE LA ACTIVIDAD DE TRABAJO COLABORATIVO Muestreo y Estimación de Parámetros Respetados Estudiantes, A continuación se dan las instrucciones necesarias para su participación en la actividad
Tests de hipótesis. Técnicas de validación estadística Bondad de ajuste. Pruebas de bondad de ajuste. Procedimiento en una prueba de hipótesis
Tests de hipótesis Técnicas de validación estadística Bondad de ajuste Patricia Kisbye FaMAF 27 de mayo, 2008 Test - Prueba - Contraste. Se utilizan para contrastar el valor de un parámetro. Ejemplo: la
Taller Minería de datos aplicados a la educación
Taller Minería de datos aplicados a la educación 2ª parte Presentación del software PASW Modeler 27 de junio de 2011 Mercedes Torrado Departamento Métodos de Investigación y Diagnóstico en Educación (MIDE)
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Aplicación de la simulación regenerativa y la técnica bootstrap, para mejorar la calidad del estimador.
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMATICAS E.A.P. DE..INVESTIGACIÓN OPERATIVA Aplicación de la simulación regenerativa y la técnica bootstrap, para mejorar la calidad del
Regresión ponderada y falta de ajuste
Capítulo 4 Regresión ponderada y falta de ajuste 4.1. Introducción En este capítulo se presentan la regresión ponderada y la prueba de falta de ajuste como un conjunto adicional de herramientas usadas
Estadística. Para el caso de dos variables aleatorias X e Y, se puede mostrar que. Pero y son desconocidos. Entonces. covarianza muestral
Para el caso de dos variables aleatorias X e Y, se puede mostrar que Pero y son desconocidos. Entonces donde covarianza muestral Estimación de intervalos de confianza Cuál es el intervalo (de confianza)
Ing. MSc. Luis Fernando Restrepo Gómez
Ing. MSc. Luis Fernando Restrepo Gómez Introducción a la Valuación Masiva METODOLOGÍA VALUATORIA Sigue los pasos de la metodología científica, y se apoya en el análisis estadístico de datos comparables.
DISTRIBUCION JI-CUADRADA (X 2 )
DISTRIBUCION JI-CUADRADA (X 2 ) En realidad la distribución ji-cuadrada es la distribución muestral de s 2. O sea que si se extraen todas las muestras posibles de una población normal y a cada muestra
viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos
Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................
Clasificadores Débiles - AdaBoost
Capítulo 3 Clasificadores Débiles - AdaBoost El término boosting hace referencia a un tipo de algoritmos cuya finalidad es encontrar una hipótesis fuerte a partir de utilizar hipótesis simples y débiles.
MANTENIMIENTO CENTRADO EN CONFIABILIDAD (MCC) DR. JORGE ACUÑA 1
MANTENIMIENTO CENTRADO EN CONFIABILIDAD (MCC) 1 ADMINISTRACION DEL news MANTENIMIENTO ( QUE ES? Mantenimiento: operación mediante la cual los sistemas están sometidos a rutinas de revisión, reparación
10.5. Contraste de independencia de variables cualitativas
272 Bioestadística: Métodos y Aplicaciones H 0 : La variable X se distribuye igualmente en ambas poblaciones H 1 : La distribución no es homogénea Para ello escribimos la que sería la distribución de frecuencias
Tema 5: SEGMENTACIÓN (II) I N G E N I E R Í A I N F O R M Á T I C A
Tema 5: SEGMENTACIÓN (II) 1 I N G E N I E R Í A I N F O R M Á T I C A Tema 5: Segmentación Los algoritmos de segmentación se basan en propiedades básicas de los valores del nivel de gris: 2 - Discontinuidad:
4.2. Metodología de muestreo
En este capítulo se presenta de manera general, la metodología utilizada para la medición de las propiedades físicas de las hojas de Aloe vera y los resultados obtenidos en esta medición. 4.2. Metodología
Tema 1.- Correlación Lineal
Tema 1.- Correlación Lineal 3.1.1. Definición El término correlación literalmente significa relación mutua; de este modo, el análisis de correlación mide e indica el grado en el que los valores de una
Estadística Inferencial. Resúmen
Ofimega - Estadística inferencial - 1 Estadística Inferencial. Resúmen Métodos y técnicas que permiten inducir el comportamiento de una población. Muestreo o selección de la muestra: 1. Aleatorio simple:
Escuela Nacional de Estadística e Informática ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA
ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA Lima Perú 2013 DISEÑO COMPLETAMENTE ALEATORIZADO Es el diseño más simple y sencillo de realizar, en el cual los tratamientos
Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis
Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis VDC Prof. Mª JOSÉ PRIETO CASTELLÓ MÉTODOS ESTADÍSTICOS. TÉCNICAS ESTADÍSTICA DESCRIPTIVA TEORÍA DE LA PROBABILIDAD
Nombre de la asignatura: Probabilidad y Estadística. Créditos: Aportación al perfil
Nombre de la asignatura: Probabilidad y Estadística Créditos: 3-2-5 Aportación al perfil Seleccionar y aplicar herramientas matemáticas para el modelado, diseño y desarrollo de tecnología computacional.
UNIVERSIDAD CARLOS III DE MADRID Grado en Ingeniería Industrial Estadística 15 de mayo de 2013
UNIVERSIDAD CARLOS III DE MADRID Grado en Ingeniería Industrial Estadística 15 de mayo de 2013 Apellidos Nombre N o lista Grupo El fichero datos 15m.sgd contiene información sobre las siguientes variables:
Tema 5: SEGMENTACIÓN (II) I N G E N I E R Í A I N F O R M Á T I C A
Tema 5: SEGMENTACIÓN (II) 1 I N G E N I E R Í A I N F O R M Á T I C A Tema 5: Segmentación Los algoritmos de segmentación se basan en propiedades básicas de los valores del nivel de gris: 2 - Discontinuidad:
En el pasado, en la realización de experimentos que envolvían más de un factor, y cada
Capitulo 4. Planeamiento Factorial (Convencionales) 4.1 Introducción. En el pasado, en la realización de experimentos que envolvían más de un factor, y cada factor con más de una variable, se adoptaba
Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple
Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción
Estadísticas Pueden ser
Principios Básicos Para iniciar en el curso de Diseño de experimentos, es necesario tener algunos conceptos claros en la parte de probabilidad y estadística. A continuación se presentan los conceptos más
estadística aplicada a la gastronomía
estadística aplicada a la gastronomía CONTENIDO 4 6 14 18 30 objetivos unidad 1 unidad 2 unidad 3 unidad 4 OBJETIVOS GENERALES Ser capaz de reflexionar de forma crítica sobre los datos que se le presenten
Page 1 of 5 Departamento: Dpto Matematica Nombre del curso: PROBABILIDAD Y ESTADÍSTICA Clave: 003872 Academia a la que pertenece: Probabilidad y Estadística Requisitos: Requisito de Probabilidad y Estad