Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
|
|
- Tomás Castro Castellanos
- hace 6 años
- Vistas:
Transcripción
1 Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1
2 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente, por ejemplo: El número de vecinos en el clasificador knn. Los valoresc y γ de la SVM. El número de neuronas ocultas en la RBFN. Se deben abordar dos problemas: Selección del modelo: Cómo seleccionar los parámetros óptimos para un problema de clasificación? Validación: Una vez seleccionado el modelo, cómo estimar su error verdadero? Si se tuviera acceso a un número ilimitado de patrones, estas preguntas se responden directamente: Seleccionar el modelo con el menor error sobre la población entera. El error encontrado corresponde con el error verdadero. 2
3 Introducción Sin embargo, en situaciones reales solo se tiene un conjunto finito de patrones disponibles. Usar el conjunto completo de datos para seleccionar el modelo óptimo y después estimar el error con el mismo conjunto de entrenamiento tiene dos problemas fundamentales: El modelo final está sobreentrenado, es decir, no es capaz de generalizar nuevos patrones. El error estimado es muy optimista, es decir, menor al error verdadero. Se deben considerar técnicas para el entrenamiento, selección del modelo y estimación del desempeño de clasificación. 3
4 Bias y varianza El error de clasificación está definido por la suma de bias (desvío) y varianza: Bias es el desvío con respecto al error verdadero. Un desvío alto indica que la distribución verdadera de los datos no se modela adecuadamente y no depende del número de muestras de entrenamiento. Un desvío alto indica subentrenamiento. Varianza es la variabilidad que presenta el clasificador para diferentes muestras. A mayor número de muestras de entrenamiento la varianza disminuye. Una varianza alta indica sobreentrenamiento. Desvío bajo Desvío alto Varianza 4
5 Método hold-out Se divide aleatoriamente el conjunto de datos en dos grupos, preservando las probabilidades a priori de cada clase: Conjunto de entrenamiento: usado para entrenar el clasificador Conjunto de prueba: usado para estimar el error de clasificación Número total de patrones Conjunto de entrenamiento Conjunto de prueba Se ejecuta un sólo experimento de entrenamiento-prueba, de modo que el error estimado podría ser muy alto si se genera una desafortunada división de los datos. Esta desventaja puede superarse con diferentes métodos de remuestreo como validación cruzada (submuestreo aleatorio, K- dobleces, dejando-uno-fuera) y bootstrap. 5
6 Submuestreo aleatorio El submuestreo aleatorio ejecuta K divisiones del conjunto de datos completo: En cada división se selecciona aleatoriamente un número fijo de muestras sin reemplazo. La muestras seleccionadas se usan para entrenar el clasificador y el restante para estimar el error de clasificación. Experimento 1 Experimento 2 Número total de patrones Patrón de prueba Experimento K El error estimado se obtiene promediando los errores de los K experimentos. 6
7 Validación cruzada con K-dobleces Divide aleatoriamente el conjunto de datos en K conjuntos, para cada uno de los K experimentos, usar K 1 conjuntos para entrenar y el restante para estimar el error. Preservar las probabilidades a priori de cada clase en los K conjuntos. K=4 Número total de patrones Experimento 1 Experimento 2 Experimento 3 Experimento 4 Patrones de prueba Todos los datos eventualmente se usan para entrenar y probar el clasificador. El error estimado se obtiene promediando los K errores de todos los experimentos. 7
8 Validación cruzada dejando-uno-fuera La validación cruzada dejando uno fuera es un caso particular de la validación cruzada con K-dobleces, donde K es igual al número total de patrones disponibles. Para un conjunto de datos con N muestras, se ejecutan N experimentos. En cada experimento se usan N 1 muestras para entrenar y la restante para probar. Número total de patrones Experimento 1 Experimento 2 Experimento 3 Patrón de prueba Experimento N El error estimado se obtiene promediando los N errores de todos los experimentos. 8
9 Número de dobleces Con un número grande de dobleces: El desvío del error verdadero será pequeño, es decir, el estimador es muy exacto. La varianza del error verdadero será grande. El tiempo de cómputo será muy grande debido a que se ejecutan muchos experimentos. Con un número pequeño de dobleces: El número de experimentos es pequeño y, por tanto, se reduce el tiempo de cómputo. La varianza del estimador será pequeña. El desvío del estimador será grande. En la práctica, la selección del valor de K depende del conjunto de datos: Para conjuntos de datos grandes se suelen usar pocos dobleces. Para conjuntos de datos dispersos se recomienda usar K=N. Valores típicos son K=5 y K=10. 9
10 El método bootstrap El método bootstrap es una técnica de remuestreo con reemplazo: Para un conjunto de datos con N muestras: - Seleccionar aleatoriamente N muestras con reemplazo, las cuales formarán el conjunto de entrenamiento. - La muestras restantes que no fueron seleccionadas constituyen el conjunto de prueba. Este proceso de división se repite K veces. El error estimado es el promedio de los K experimentos. Conjunto original Experimento 1 Experimento 2 Experimento 3 x 3 x 4 x 5 x 3 x 3 x 3 x 5 x 5 x 5 x 3 x 5 x 5 x 4 x 4 x 3 x 4 Experimento K x 4 x 4 x 4 x 4 x 3 x 5 Entrenamiento Prueba 10
11 El método bootstrap Comparado en el método de validación cruzada, el método bootstrap incrementa la varianza que ocurre en cada conjunto de entrenamiento. Esta es una propiedad deseable, ya que es una simulación realista del experimento en la vida real a partir del cual se obtuvieron los patrones. Debido al muestreo con reemplazo, se preservan las probabilidades a priori de las clases a través del proceso de selección aleatoria. 11
12 Separación de datos en tres direcciones Si la selección del modelo y el error verdadero deben ser calculados simultáneamente, el conjunto de datos se divide en tres conjuntos disjuntos: Conjunto de entrenamiento: se usa para ajustar los parámetros del clasificador, por ejemplo, los pesos de una RNA. Conjunto de validación: se usa para seleccionar un clasificador de entre varios que han sido entrenados, por ejemplo, encontrar el número óptimo de neuronas ocultas de una RNA. Conjunto de prueba: se usa solamente para evaluar el desempeño de clasificación final de un clasificador completamente entrenado. 12
13 Separación de datos en tres direcciones Procedimiento de entrenamiento y prueba de un clasificador: 1. Dividir el conjunto de datos disponibles en entrenamiento, validación y prueba. 2. Seleccionar un clasificador y sus parámetros de entrenamiento. 3. Entrenar el modelo usando el conjunto de entrenamiento. 4. Evaluar el modelo usando el conjunto de validación. 5. Repetir los pasos 2 al 4 usando diferentes parámetros de entrenamiento. 6. Seleccionar el mejor modelo y entrenarlo usando los datos de los conjuntos de entrenamiento y validación. 7. Evaluar el desempeño final del modelo usando el conjunto de prueba. Si se usa validación cruzada o bootstrap, los pasos 3 y 4 se repiten de acuerdo al número K de conjuntos de entrenamiento. 13
14 Índices de desempeño Un índice de desempeño es una función que provee una medida de calidad de un clasificador y generalmente se calculan a partir de la matriz de confusión. Dado un problema con c clases {1,,c}, la correspondiente matriz de confusión C es una matriz cuadrada de tamaño c c cuya ij-ésima entrada C ij es el número de elementos de la clase verdadera i que fueron asignados por el clasificador a la clase j: C = a 11 e 12! e 1c e 21 a 22! e 2c!! "! e c1 e c2! a cc donde a ii es un acierto para la clase i y e ij es un error donde el clasificador confundió la clase i con la clase j. (1) 14
15 Índices de desempeño En el caso particular de una matriz de confusión para un problema de dos clases { 1,1}: donde: C = TP FP FN TN (2) Verdaderos positivos (TP) es el número de aciertos para la clase positiva. Verdaderos negativos (TN) es el número de aciertos para la clase negativa. Falsos positivos (FP) es el número de errores resultado de asignar la clase negativa a la clase positiva. Falso negativos (FN) es el número de errores resultado de asignar la clase positiva a la clase negativa. 15
16 Índices de desempeño Índices típicos de clasificación binaria: Índice Ecuación Evaluación Rango Exactitud Precisión TP + TN TP + FP + TN + FN TP TP + FP Efectividad global de un clasificador. No se recomienda para clases muy desbalanceadas. Concordancia entre las etiquetas de clase con las etiquetas positivas dadas por el clasificador. [0,1] [0,1] Sensibilidad TP TP + FN Efectividad del clasificador para identificar la clase positiva. [0,1] Especificidad TN TN + FP Efectividad del clasificador para identificar la clase negativa. [0,1] Área bajo la curva 1 2 TP TP + FN + TN TN + FP Capacidad del clasificador para evitar falsas clasificaciones. [0,1] Coeficiente de correlación de Matthews TP TN FP FN (TP + FP)(TP + FN)(TN + FP)(TN + FN) Efectividad global de un clasificador recomendado para clases desbalanceadas. [ 1,1] 16
17 Índices de desempeño Evaluación de un clasificador que diagnóstica alguna enfermedad. Enfermo Sano c c + φ Índice Valor Exactitud Presición Sensibilidad Especificidad Area bajo la curva MCC Predicción c + c Total Real c + c Total
18 Índices de desempeño Algunos índices de clasificación binaria pueden extenderse al caso multiclase tomando como casos positivos a todos los elementos de la i-ésima clase y como casos negativos las clases restantes (one-versus-all). φ c 2 φ Clase 2 c 3 c 1 Predicción Clases 1 y 3 Matriz de confusión para la clase 2 c + c Total Clase 1 Clase 2 Clase 3 c + c Real c + c Total
19 Índices de desempeño Índices clasificación multiclase: Índice Ecuación Evaluación Rango Exactitud 1 c c i=1 TP i + TN i TP i + FP i + TN i + FN i Efectividad promedio del clasificador por cada clase. [0,1] 1 c c Tasa de error Error promedio del clasificador. [0,1] i=1 FP i + FN i TP i + FP i + TN i + FN i Precisión 1 c c i=1 TP i TP i + FP i Promedio de la concordancia por clase de las etiquetas verdaderas con aquellas asignadas por el clasificador. [0,1] Sensibilidad 1 c c i=1 TP i TP i + FN i Efectividad promedio del clasificador por cada clase para identificar las etiquetas de clase verdaderas. [0,1] 19
20 Índices de desempeño El coeficiente de correlación de Matthews también está generalizado para el clase multiclase como: MCC = N 2 N tr(c) kl C k C l C k (C T ) l N 2 (C T ) k C l kl kl (3) donde N es el número de patrones, C k es el k-ésimo renglón de C, C l es la l-ésima columna de C, C T es la transpuesta de C, y tr(c) denota la traza de C. El rango de MCC está entre [ 1,1] y debe tender a la unidad para indicar buena clasificación. 20
II. 2. Análisis manual de imágenes médicas: Análisis de la curva ROC (Receiver Operating Characteristic).
II. 2. Análisis manual de imágenes médicas: Análisis de la curva ROC (Receiver Operating Characteristic). Psicofísica: calidad física de una imagen médica y calidad del diagnóstico El análisis de la curva
Más detallesTema 2. Regresión Lineal
Tema 2. Regresión Lineal 3.2.1. Definición Mientras que en el apartado anterior se desarrolló una forma de medir la relación existente entre dos variables; en éste, se trata de esta técnica que permite
Más detallesIdeas básicas del diseño experimental
Ideas básicas del diseño experimental Capítulo 4 de Analysis of Messy Data. Milliken y Johnson (1992) Diseño de experimentos p. 1/23 Ideas básicas del diseño experimental Antes de llevar a cabo un experimento,
Más detallesAprendizaje: Boosting y Adaboost
Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo
Más detallesAgro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Más detallesINDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Más detalles1. (F, +) es un grupo abeliano, denominado el grupo aditivo del campo.
Capítulo 5 Campos finitos 5.1. Introducción Presentaremos algunos conceptos básicos de la teoría de los campos finitos. Para mayor información, consultar el texto de McEliece [61] o el de Lidl y Niederreiter
Más detallesTema 10: Introducción a los problemas de Asociación y Correlación
Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación
Más detallesEstadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR
Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.
Más detallesMODULO VIII. Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL.
MODULO VIII Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL Esquema de Proyecto SNIP INDICE INTRODUCCION I. ASPECTOS GENERALES II. IDENTIFICACION III. FORMULACION IV. EVALUACION
Más detallesAplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.
Capítulo 5 Evaluación En muchas ocasiones requerimos hacer una evaluación muy precisa de nuestros algoritmos de aprendizaje computacional porque los vamos a utilizar en algún tipo de aplicación que así
Más detallesValidación Cruzada (cross-validation) y Remuestreo (bootstrapping)
Validación Cruzada (cross-validation) y Remuestreo (bootstrapping) Padres de cross-validation y el bootstrapping Bradley Efron y Rob Tibshirani Bradley Efron Rob Tibshirani Enfoque: tabla de aprendizaje
Más detallesINSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016
ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una
Más detallesÍndice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables
Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesRegresión Lineal Múltiple
Universidad Nacional Agraria La Molina 2011-2 Efectos de Diagnósticos de Dos predictores X 1 y X 2 son exactamente colineales si existe una relación lineal tal que C 1 X 1 + C 2 X 2 = C 0 para algunas
Más detallesDeterminación del tamaño de muestra (para una sola muestra)
STATGRAPHICS Rev. 4/5/007 Determinación del tamaño de muestra (para una sola muestra) Este procedimiento determina un tamaño de muestra adecuado para la estimación o la prueba de hipótesis con respecto
Más detallesDiplomado en Estadística Aplicada
Diplomado en Estadística Aplicada Con el propósito de mejorar las habilidades para la toma de decisiones, la División de Estudios de Posgrado de la Facultad de Economía ha conjuntado a profesores con especialidad
Más detallesTécnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO
Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar
Más detallesExactitud y Linearidad del Calibrador
Exactitud y Linearidad del Calibrador Resumen El procedimiento Exactitud y Linearidad del Calibrador fue diseñado para estimar la exactitud del sistema de medición. En contraste con los procedimientos
Más detallesESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso
ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 22 - Diciembre - 2.006 Primera Parte - Test Apellidos y Nombre:... D.N.I. :... Nota : En la realización de este examen sólo esta permitido utilizar calculadoras
Más detallesAlgunas Distribuciones Discretas de Probabilidad. UCR ECCI CI-1352 Investigación de Operaciones I Prof. M.Sc. Kryscia Daviana Ramírez Benavides
Algunas Distribuciones Discretas de Probabilidad UCR ECCI CI-1352 Investigación de Operaciones I Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción El comportamiento de una variable aleatoria queda
Más detallesCapítulo 8. Análisis Discriminante
Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables
Más detallesEpidemiología. 4. Validez y confiabilidad de las pruebas diagnósticas.
Epidemiología 4. Validez y confiabilidad de las pruebas diagnósticas. Pruebas diagnósticas. Variación biológica de la población. Variación biológica de la población. sanos enfermos resultado de la prueba
Más detallesMÉTODO DE ENSAYO PARA MEDIR EL DETERIORO DE GEOTEXTILES A LA EXPOSICIÓN DE LUZ ULTRAVIOLETA Y AGUA, (APARATO DEL TIPO ARCO XENON). I.N.V.
MÉTODO DE ENSAYO PARA MEDIR EL DETERIORO DE GEOTEXTILES A LA EXPOSICIÓN DE LUZ ULTRAVIOLETA Y AGUA, (APARATO DEL TIPO ARCO XENON). I.N.V. E 910 07 1. OBJETO 1.1 Esta norma de ensayo se puede utilizar para
Más detallesINDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas
INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de
Más detallesDistribuciones de muestreo fundamentales y descripciones de datos Muestreo aleatorio
Distribuciones de muestreo fundamentales y descripciones de datos Muestreo aleatorio En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población),
Más detallesTeorema Central del Límite (1)
Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico
Más detallesTema 5. Muestreo y distribuciones muestrales
1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución
Más detallesTaller de Validación de Métodos Verificación de Procedimientos de Medidas Cualitativos: Enfermedades Infecciosas. PONENTE: Gabriel A.
Taller de Validación de Métodos Verificación de Procedimientos de Medidas Cualitativos: Enfermedades Infecciosas PONENTE: Gabriel A. Migliarino Agenda Introducción Evaluación de Procedimientos de Medida
Más detallesCurso de Estadística Básica
Curso de SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez Objetivo Conocer y calcular las medidas de tendencia central y medidas de dispersión
Más detallesLABORATORIO No. 0. Cálculo de errores en las mediciones. 0.1 Introducción
LABORATORIO No. 0 Cálculo de errores en las mediciones 0.1 Introducción Es bien sabido que la especificación de una magnitud físicamente medible requiere cuando menos de dos elementos: Un número y una
Más detallesRegresión en Cadena. StatFolio de Ejemplo: ridge reg.sgp
Regresión en Cadena Resumen El procedimiento Regresión en Cadena está diseñado para ajustar un modelo de regresión múltiple cuando las variables independientes exhiben multicolinealidad. Multicolinealidad
Más detallesDefinición Una hipótesis es una afirmación acerca de un parámetro.
Capítulo 8 Prueba de hipótesis Existen dos áreas de interés en el proceso de inferencia estadística: la estimación puntual y las pruebas de hipótesis. En este capítulo se presentan algunos métodos para
Más detalles07 Estimación puntual e introducción a la estadística inferencial
07 Estimación puntual e introducción a la estadística inferencial Diego Andrés Alvarez Marín Profesor Asistente Universidad Nacional de Colombia Sede Manizales 1 Contenido Qué es la estadística inferencial?
Más detallesTema 3: Análisis de datos bivariantes
Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta
Más detallesESTADÍSTICA II Código: 8314
ESTADÍSTICA II Código: 8314 Departamento : Metodología Especialidad : Ciclo Básico Prelación : 8219 Tipo de Asignatura : Obligatoria Teórica y Práctica Número de Créditos : 3 Número de horas semanales
Más detallesMANUAL DE USO PROGRAMA SENSIBAR
MANUAL DE USO PROGRAMA SENSIBAR ANALSIS DE SENSIBILIDAD Y SIMULACION DE MONTECARLO JOSE FUENTES VALDES FACEA - UNIVERSIDAD DE CONCEPCION Facultad de Economía Universidad de Concepción 1 SensiBar. ANALSIS
Más detallesJUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas
JUEGO DE BASKETBALL Repaso de Distribuciones de Probabilidad Discretas y Continuas PREGUNTA #1 Qué es una variable aleatoria uniforme discreta? Cómo es su distribución? Qué es una variable aleatoria uniforme
Más detallesAnálisis Probit. StatFolio de Ejemplo: probit.sgp
STATGRAPHICS Rev. 4/25/27 Análisis Probit Resumen El procedimiento Análisis Probit está diseñado para ajustar un modelo de regresión en el cual la variable dependiente Y caracteriza un evento con sólo
Más detallesviii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos
Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................
Más detallesPRÁCTICA I. Ejercicios Teóricos
PRÁCTICA I TEORÍA DE LA DECISIÓN BAYESIANA Ejercicios Teóricos Ejercicio. En el caso de dos categorías, en la regla de decisión de Bayes el error condicional está dado por la ecuación (7). Incluso si las
Más detallesEstimación MC2E, MVIL en Modelos de Ecuaciones Simultáneas
Estimación MC2E, MVIL en Modelos de Ecuaciones Simultáneas Economía Aplicada III (UPV/EHU) OCW 2013 Contents 1 Mínimos Cuadrados en 2 Etapas 2 Mínimos Cuadrados en 2 Etapas El método de Mínimos Cuadrados
Más detallesEstadística Espacial en Ecología del Paisaje
Estadística Espacial en Ecología del Paisaje Introducción H. Jaime Hernández P. Facultad de Ciencias Forestales U. de Chile Tipos de datos en análisis espacial Patrones espaciales puntuales Muestras geoestadísticas
Más detallesPOBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN
POBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN Adela del Carpio Rivera Doctor en Medicina UNIVERSO Conjunto de individuos u objetos de los que se desea conocer algo en una investigación Población o universo
Más detallesEscuela Nacional de Estadística e Informática ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA
ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA Lima Perú 2013 DISEÑO COMPLETAMENTE ALEATORIZADO Es el diseño más simple y sencillo de realizar, en el cual los tratamientos
Más detallesPRUEBAS. Sandra Convers-Páez, M.D. Instituto de Investigaciones Médicas Facultad de Medicina 2009
PRUEBAS DIAGNÓSTICAS Sandra Convers-Páez, M.D. Instituto de Investigaciones Médicas Facultad de Medicina 2009 PRUEBAS DIAGNÓSTICAS Generalmente, pruebas realizadas en un laboratorio (también historia y
Más detallesAnálisis de imágenes digitales
Análisis de imágenes digitales SEGMENTACIÓN DE LA IMAGEN Segmentación basada en texturas INTRODUCCIÓN La textura provee información sobre la distribución espacio-local del color o niveles de intensidades
Más detallesPronósticos Automáticos
Pronósticos Automáticos Resumen El procedimiento de Pronósticos Automáticos esta diseñado para pronosticar valores futuros en datos de una serie de tiempo. Una serie de tiempo consiste en un conjunto de
Más detallesDiseño de Bloques al azar. Diseño de experimentos p. 1/25
Diseño de Bloques al azar Diseño de experimentos p. 1/25 Introducción En cualquier experimento, la variabilidad proveniente de un factor de ruido puede afectar los resultados. Un factor de ruido es un
Más detallesIncertidumbre, Validación y Trazabilidad en el Laboratorio de Análisis Clínicos. Cómo cumplir con requisitos de la ISO 15189
Incertidumbre, Validación y Trazabilidad en el Laboratorio de Análisis Clínicos Cómo cumplir con requisitos de la ISO 15189 Calidad en mediciones químicas Validación de métodos Estoy midiendo lo que intentaba
Más detallesOptimizar recursos y asegurar cumplimiento metrológico Buenos Aires 23 de Octubre de 2015
Optimizar recursos y asegurar cumplimiento metrológico Buenos Aires 23 de Octubre de 2015 Operación que establece, una relación entre los valores y sus incertidumbres de medida asociadas obtenidas a partir
Más detallesRADICACIÓN EN LOS REALES
RADICACIÓN EN LOS REALES La raíz n ésima de un número real es otro número real tal que: n a b si y solo si b n Donde el signo se llama radical, n es el índice, a es el radicando y b es la raíz. En la radicación
Más detallesINTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)
INTERVALOS DE CONFIANZA La estadística en cómic (L. Gonick y W. Smith) EJEMPLO: Será elegido el senador Astuto? 2 tamaño muestral Estimador de p variable aleatoria poblacional? proporción de personas que
Más detallesDesempeño de Medidas de Riesgo sobre Distribuciones de Valores Extremos
Desempeño de Medidas de Riesgo sobre Distribuciones de Valores Extremos Resumen Ejecutivo Antecedentes El riesgo es un concepto ampliamente estudiado, con diversas definiciones que dependen del contexto
Más detalles1.Restricciones de Desigualdad 2.Procedimiento algebraico
Universidad Nacional de Colombia Sede Medellín 1. Restricciones de Desigualdad Clase # 6 EL MÉTODO M SIMPLEX El método m simplex es un procedimiento algebraico: las soluciones se obtienen al resolver un
Más detallesMatemática. Desafío. GUÍA DE EJERCITACIÓN AVANZADA Cálculo de medidas de dispersión y muestreo GUICEN041MT22-A16V1
GUÍA DE EJERCITACIÓN AVANZADA Cálculo de medidas de dispersión y muestreo Desafío Una población estadística está compuesta de cuatro números enteros consecutivos, siendo n el menor de ellos. La desviación
Más detallesModelos mixtos. Diseño de experimentos p. 1/26
Modelos mixtos Diseño de experimentos p. 1/26 Introducción Cuando en la estructura de tratamientos de un experimento se tienen tanto factores fijos como aleatorios, el modelo que describe tales experimentos
Más detallesProbabilidad Condicional
Probabilidad Condicional Algunas veces la ocurrencia de un evento A puede afectar la ocurrencia posterior de otro evento B; por lo tanto, la probabilidad del evento B se verá afectada por el hecho de que
Más detallesDr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental
Universidad de Puerto Rico Recinto de Aguadilla Programa CeCiMat Elemental Definición de conceptos fundamentales de la Estadística y la Probabilidad y su aportación al mundo moderno Dr. Richard Mercado
Más detallesDiseños Factoriales. Diseño de experimentos p. 1/18
Diseños Factoriales Diseño de experimentos p. 1/18 Introducción El término experimento factorial o arreglo factorial se refiere a la constitución de los tratamientos que se quieren comparar. Diseño de
Más detalles2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS)
2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS) La idea principal en este capitulo es el inicio a planear los diseño experimentales y su correspondiente análisis estadístico. En este caso iniciaremos
Más detallesCAPÍTULO 4 TÉCNICA PERT
54 CAPÍTULO 4 TÉCNICA PERT Como ya se mencionó en capítulos anteriores, la técnica CPM considera las duraciones de las actividades como determinísticas, esto es, hay el supuesto de que se realizarán con
Más detallesPruebas de Hipótesis Multiples
Pruebas de Hipótesis Multiples Cuando queremos hacer comparaciones de mas de dos poblaciones, una alternativa es comparar todos los grupos a la vez con el método de Análisis de Varianza (ANOVA) H o : µ
Más detallesPrácticas de Ecología Curso 3 Práctica 1: Muestreo
PRÁCTICA 1: MUESTREO Introducción La investigación ecológica se basa en la medición de parámetros de los organismos y del medio en el que viven. Este proceso de toma de datos se denomina muestreo. En la
Más detallesUniversidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto
Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre 2011-1 Profesor: Jaime Soto PRUEBA DE HIPÓTESIS Ejemplo El jefe de la Biblioteca de la URBE manifiesta
Más detallesLA ESTADÍSTICA APLICADA AL ANÁLISIS ECONÓMICO. Introducción 1
LA ESTADÍSTICA APLICADA AL ANÁLISIS ECONÓMICO ÍNDICE CONCEPTO Página Introducción 1 I Generalidades... 3 I.1 Definiciones de Estadística... 4 I.2 Diferentes clases de Estadística... 8 II La Estadística
Más detallesESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Más detallesADMINISTRACION DE OPERACIONES
Sesión4: Métodos cuantitativos ADMINISTRACION DE OPERACIONES Objetivo específico 1: El alumno conocerá y aplicara adecuadamente los métodos de pronóstico de la demanda para planear la actividad futura
Más detallesFACULTAD DE CIENCIAS ECONOMICAS LIC. EN ADMINISTRACION CONTADOR PUBLICO ESTADISTICA
FACULTAD DE CIENCIAS ECONOMICAS LIC. EN ADMINISTRACION CONTADOR PUBLICO Programa ESTADISTICA Profesores: Titular: DI BENEDETTO OSVALDO H Adjunto: DI LAUDO SERGIO H. 2016 FACULTAD DE CIENCIAS ECONOMICAS
Más detallesAYUDANTÍA 2: RIESGO EN PROYECTOS
AYUDANTÍA 2: RIESGO EN PROYECTOS ICC2302 INGENIERÍA DE CONSTRUCCIÓN 1 2008 TEMARIO Estimación de Costos de Proyectos Estimación Preliminar Estimación Conceptual Estimación Detallada Estimación Definitiva
Más detallesDiplomatura en Ciencias Empresariales X Y 10 10000 100 1000 1000 100 10000 10
DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA Diplomatura en Ciencias Empresariales ESTADÍSTICA II Relación Tema 10: Regresión y correlación simple. 1. Ajustar una función potencial a los siguientes
Más detallesANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.
ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos
Más detallesDISEÑOS MULTIFACTORIALES CON RESTRICCIONES DE ALEATORIZACIÓN. Diseños en bloques completos aleatorizados con dos tratamientos
DISEÑOS MULTIFACTORIALES CON RESTRICCIONES DE ALEATORIZACIÓN Los diseños en bloques utilizan una restricción en la aleatorización. Los cuadrados latinos utilizan dos restricciones en la aleatorización.
Más detallesINDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica
INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables
Más detallesSimulación I. Investigación Operativa, Grado en Estadística y Empresa, 2011/12
Simulación I Prof. José Niño Mora Investigación Operativa, Grado en Estadística y Empresa, 2011/12 Esquema Modelos de simulación y el método de Montecarlo Ejemplo: estimación de un área Ejemplo: estimación
Más detallesÁlgebra Lineal Ma1010
Álgebra Lineal Ma1010 Métodos Iterativos para Resolver Sistemas Lineales Departamento de Matemáticas ITESM Métodos Iterativos para Resolver Sistemas Lineales Álgebra Lineal - p. 1/30 En esta lectura veremos
Más detallesAprendizaje Supervisado K - Vecinos más cercanos Knn-Method
Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No
Más detallesEvaluación de Proyectos de Inversión
Evaluación de Proyectos de Inversión Sesión #10: Estudio financiero (7) Periodo de recuperación de la inversión y Evaluación del riesgo del proyecto de inversión Contextualización Con la evaluación económica
Más detallesUTILIZACIÓN DE LA CAPACIDAD INSTALADA EN LA INDUSTRIA MANUFACTURERA - SEGUNDO TRIMESTRE DE
Montevideo, 28 de octubre de 2009. UTILIZACIÓN DE LA EN LA INDUSTRIA MANUFACTURERA - SEGUNDO TRIMESTRE DE 2009 - ANÁLISIS DE LOS PRINCIPALES INDICADORES El grado de utilización de la Capacidad Instalada
Más detallesINFORME TAREA N 4 CLUSTERING
Universidad de Chile Facultad de Ciencias Físicas y Matemáticas Departamento de Ingeniería Eléctrica EL4106 Inteligencia Computacional INFORME TAREA N 4 CLUSTERING Nombre Alumno : Profesor : Profesor Auxiliar
Más detallesCDEE. Cuestiones 3er Ejercicio. 0 si x 1. k(x + 1) + x2 1. k(x + 1) x si x > 1
CUESTIÓN 1: El tiempo de retraso, medido en minutos, del AVE Madrid-Sevilla sigue una variable aleatoria continua con función de distribución: 0 si x 1 F (x) = k(x + 1) + x2 1 2 si 1 < x 0 k(x + 1) x2
Más detallesAnálisis de datos Categóricos
Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores
Más detallesEstadísticas Pueden ser
Principios Básicos Para iniciar en el curso de Diseño de experimentos, es necesario tener algunos conceptos claros en la parte de probabilidad y estadística. A continuación se presentan los conceptos más
Más detallesINFERENCIA ESTADISTICA
INFERENCIA ESTADISTICA ESTIMACION 2 maneras de estimar: Estimaciones puntuales x s 2 Estimaciones por intervalo 2 ESTIMACION Estimaciones por intervalo Limites de Confianza LCI
Más detallesComplejidad de los Algoritmos
Que es un Algoritmo? Complejidad de los Algoritmos Webster: cualquier método especial para resolver cierta clase de problemas. Horowitz: método preciso utilizable en una computadora para la solución de
Más detalles1. VALORES FALTANTES 2. MECANISMOS DE PÉRDIDA
1. VALORES FALTANTES Los valores faltantes son observaciones que en un se tenía la intención de hacerlas, pero por distintas razones no se obtuvieron. Puede ser que no se encuentre a un encuestado, entonces
Más detallesMínimos Cuadrados Parciales
Mínimos Cuadrados Parciales Resumen El procedimiento Mínimos Cuadrados Parciales (PLS Partial Least Squares) está diseñado para construir un modelo estadístico que relaciona múltiples variables independientes
Más detallesCONSIDERACIONES GENERALES SOBRE ESTÁTICA
CONSIDERACIONES GENERALES SOBRE ESTÁTICA Índice 1. CONCEPTOS ÚTILES 2 1.1. Configuración geométrica de un sistema....................... 2 1.2. Ligaduras....................................... 2 1.3. Coordenadas
Más detallesMétodo de Análisis del Riesgo (Estudio del Calibrador Atributos)
Método de Análisis del Riesgo (Estudio del Calibrador Atributos) Resumen El Método de Análisis del Riesgo cuantifica la incertidumbre de un sistema de medición donde las observaciones consisten de atributos
Más detallesTécnicas de Minería de Datos
Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.
Más detallesCualitativos Caso de Aplicación
Validación n de Métodos M Cualitativos Caso de Aplicación Agenda Introducción Definiciones Clasificación Validación Evaluación de Métodos Cualitativos Caso de Aplicación Conclusiones Introducción La validación
Más detallesANÁLI L S I I S S I S D E E D ATOS
Muestreo Definición: Es la operación para tomar una muestra del Universo. El objetivo del muestreo es contar con los datos necesarios para estimar parámetros en la población, es decir, poder hacer una
Más detallesUNIDAD IV PROBABILIDAD
UNIDAD IV PROBABILIDAD Probabilidad de un evento M. en C. Mario Arturo Vilchis Rodríguez EXPERIMENTOS, RESULTADOS Y CONJUNTOS La probabilidad es la posibilidad numérica de que ocurra un evento. La probabilidad
Más detalles3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.
3. ANÁLISIS DE DATOS DE PRECIPITACIÓN. Teniendo en cuenta que la mayoría de procesos estadísticos se comportan de forma totalmente aleatoria, es decir, un evento dado no está influenciado por los demás,
Más detallesINDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos
INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos
Más detallesConceptos básicos de metrología
Conceptos básicos de metrología Definiciones, características y estimación de incertidumbres. Lic. Francisco Sequeira Castro 05 de Noviembre, 2014 Qué es la metrología? La metrología es la ciencia de las
Más detallesContenido. 2 Probabilidad 9. Prefacio. 1 Introducci6n a la estadfstica y al an;!llisis de datos
Contenido Prefacio ix 1 Introducci6n a la estadfstica y al an;!llisis de datos 1 1.1 1.2 1.3 1.4 1.5 1.6 Repaso 1 EI papel de la probabilidad 2 Medidas de posici6n: media de una muestra 4 Medidas de variabilidad
Más detallesEstadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR
Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis Facultad de Ciencias Sociales, UdelaR Índice 1. Introducción: hipótesis estadística, tipos de hipótesis, prueba de hipótesis 2.
Más detalles