Introducción a Aprendizaje no Supervisado
|
|
- Felipe Carrasco Ojeda
- hace 6 años
- Vistas:
Transcripción
1
2 Introducción a Aprendizaje no Supervisado Felipe Suárez, Álvaro Riascos 25 de abril de / 33
3 Contenido 1. Motivación 2. k-medias Algoritmos Implementación 3. Definición 4. Motivación 5. Aproximación 6. Implementación 3 / 33
4 Problema Considere la siguiente imagen médica. 4 / 33
5 Problema Considere la siguiente imagen médica. 4 / 33
6 Problema Considere la siguiente imagen médica. 4 / 33
7 Historia Hugo Steinhaus, / 33
8 Historia Hugo Steinhaus, / 33
9 Definición El método de agrupamiento (clustering) k medias es un procedimiento de clasificación no supervisado basado en centroides. Las observaciones x 1,..., x n son asignadas a la clase del centroide más cercano µ 1,..., µ k a él. 6 / 33
10 Definición El método de agrupamiento (clustering) k medias es un procedimiento de clasificación no supervisado basado en centroides. Las observaciones x 1,..., x n son asignadas a la clase del centroide más cercano µ 1,..., µ k a él. 6 / 33
11 Definición El método de agrupamiento (clustering) k medias es un procedimiento de clasificación no supervisado basado en centroides. Las observaciones x 1,..., x n son asignadas a la clase del centroide más cercano µ 1,..., µ k a él. 6 / 33
12 Definición Definition Sea X = {x 1,..., x n} R d un conjunto de n observaciones numéricas. El agrupamiento por k medias consiste de particionar X en k subconjuntos X = S 1 S k por medio de k centroides µ 1,..., µ k que minimizan la varianza: k x µ i 2, donde µ i = 1 x. S i=1 x S i i x S i 7 / 33
13 Definición Definition Sea X = {x 1,..., x n} R d un conjunto de n observaciones numéricas. El agrupamiento por k medias consiste de particionar X en k subconjuntos X = S 1 S k por medio de k centroides µ 1,..., µ k que minimizan la varianza: Propiedades k x µ i 2, donde µ i = 1 x. S i=1 x S i i x S i Estimación de grupos con simetría esférica. Las variables tienen la misma varianza. Se asume apriori que todos los grupos son de igual tamaño. 7 / 33
14 Ejemplos 8 / 33
15 Ejemplos 8 / 33
16 Estado del Arte Quién lo utiliza? Todavía se investiga? 9 / 33
17 Algoritmo El problema de optimización no es computacionalmente fácil de resolver: es NP-Dificil! Existen heurísticas que aproximan la solución a un mínimo local muy rápido. 10 / 33
18 Algoritmo El problema de optimización no es computacionalmente fácil de resolver: es NP-Dificil! Existen heurísticas que aproximan la solución a un mínimo local muy rápido. Definition Input: Datos numéricos X = {x 1,..., x n} R d, Número de grupos k > 0. Output: Subgrupos (x 1, y 1),..., (x n, y n), con y i {1,..., k}. Algoritmo: 1. Inicialice los centros µ 1,..., µ k aleatoriamente. 2. Repita 2.1 Calcula el subgrupo de cada observación: 2.2 Actualiza los centros: y i = arg min x i µ j j µ i = 1 S i x S i x. 10 / 33
19 Ejemplo 11 / 33
20 Ejemplo 12 / 33
21 Ejemplo 13 / 33
22 Ejemplo 14 / 33
23 Ejemplo 15 / 33
24 Casos Problemáticos 16 / 33
25 Casos Problemáticos 17 / 33
26 Casos Problemáticos 18 / 33
27 Alternativas Existen alternativas al algoritmo heurístico. Las alternativas ayudan a evitar la agrupación discontinua y la simetría esférica. 1. Estandarizar variables para evitar sesgos de escala. 19 / 33
28 Alternativas Existen alternativas al algoritmo heurístico. Las alternativas ayudan a evitar la agrupación discontinua y la simetría esférica. 1. Estandarizar variables para evitar sesgos de escala. 2. Fuzzy k-means: f(x, S) = k i=1 x S i u i(x) x µ i 2, u i(x) = 2/r x µi x µi 2/r i 19 / 33
29 Alternativas Existen alternativas al algoritmo heurístico. Las alternativas ayudan a evitar la agrupación discontinua y la simetría esférica. 1. Estandarizar variables para evitar sesgos de escala. 2. Fuzzy k-means: f(x, S) = k i=1 x S i u i(x) x µ i 2, u i(x) = 2/r x µi x µi 2/r i 3. Mixturas Gaussianas: Se asume que la muestra es una suma de normales y se actualizan µ, σ por subgrupos ponderado por probabilidad P(x i µ j, σ j). 19 / 33
30 Alternativas Existen alternativas al algoritmo heurístico. Las alternativas ayudan a evitar la agrupación discontinua y la simetría esférica. 1. Estandarizar variables para evitar sesgos de escala. 2. Fuzzy k-means: f(x, S) = k i=1 x S i u i(x) x µ i 2, u i(x) = 2/r x µi x µi 2/r i 3. Mixturas Gaussianas: Se asume que la muestra es una suma de normales y se actualizan µ, σ por subgrupos ponderado por probabilidad P(x i µ j, σ j). 4. Kernel k-medias: Se utiliza una función de kernel k(x i µ j, x i µ j) a cambio de x i µ j / 33
31 Alternativas Existen alternativas al algoritmo heurístico. Las alternativas ayudan a evitar la agrupación discontinua y la simetría esférica. 1. Estandarizar variables para evitar sesgos de escala. 2. Fuzzy k-means: f(x, S) = k i=1 x S i u i(x) x µ i 2, u i(x) = 2/r x µi x µi 2/r i 3. Mixturas Gaussianas: Se asume que la muestra es una suma de normales y se actualizan µ, σ por subgrupos ponderado por probabilidad P(x i µ j, σ j). 4. Kernel k-medias: Se utiliza una función de kernel k(x i µ j, x i µ j) a cambio de x i µ j Metricas no euclidianas: l 1, l, l p. 19 / 33
32 Garantías 1. Complejidad? NP-Difícil, pero las heurísticas son O(nd). 20 / 33
33 Garantías 1. Complejidad? NP-Difícil, pero las heurísticas son O(nd). 2. Convergencia? El algortimo heurístico converge rápidamente a un óptimo local. 20 / 33
34 Garantías 1. Complejidad? NP-Difícil, pero las heurísticas son O(nd). 2. Convergencia? El algortimo heurístico converge rápidamente a un óptimo local. 3. Robustez? No. De hecho es muy fácil que el algoritmo falle: 20 / 33
35 Garantías 1. Complejidad? NP-Difícil, pero las heurísticas son O(nd). 2. Convergencia? El algortimo heurístico converge rápidamente a un óptimo local. 3. Robustez? No. De hecho es muy fácil que el algoritmo falle: 3.1 Muestra desbalanceada 20 / 33
36 Garantías 1. Complejidad? NP-Difícil, pero las heurísticas son O(nd). 2. Convergencia? El algortimo heurístico converge rápidamente a un óptimo local. 3. Robustez? No. De hecho es muy fácil que el algoritmo falle: 3.1 Muestra desbalanceada 3.2 Sensible a escala 20 / 33
37 Garantías 1. Complejidad? NP-Difícil, pero las heurísticas son O(nd). 2. Convergencia? El algortimo heurístico converge rápidamente a un óptimo local. 3. Robustez? No. De hecho es muy fácil que el algoritmo falle: 3.1 Muestra desbalanceada 3.2 Sensible a escala 3.3 No acepta datos categórticos 20 / 33
38 Garantías 1. Complejidad? NP-Difícil, pero las heurísticas son O(nd). 2. Convergencia? El algortimo heurístico converge rápidamente a un óptimo local. 3. Robustez? No. De hecho es muy fácil que el algoritmo falle: 3.1 Muestra desbalanceada 3.2 Sensible a escala 3.3 No acepta datos categórticos 3.4 Qué pasa en dimensiones altas (d > n)? 20 / 33
39 Garantías 1. Complejidad? NP-Difícil, pero las heurísticas son O(nd). 2. Convergencia? El algortimo heurístico converge rápidamente a un óptimo local. 3. Robustez? No. De hecho es muy fácil que el algoritmo falle: 3.1 Muestra desbalanceada 3.2 Sensible a escala 3.3 No acepta datos categórticos 3.4 Qué pasa en dimensiones altas (d > n)? 3.5 Convergencia a óptimo local 20 / 33
40 Garantías 1. Complejidad? NP-Difícil, pero las heurísticas son O(nd). 2. Convergencia? El algortimo heurístico converge rápidamente a un óptimo local. 3. Robustez? No. De hecho es muy fácil que el algoritmo falle: 3.1 Muestra desbalanceada 3.2 Sensible a escala 3.3 No acepta datos categórticos 3.4 Qué pasa en dimensiones altas (d > n)? 3.5 Convergencia a óptimo local 20 / 33
41 Reglas de Asociación 21 / 33
42 Motivación Las reglas de asociación son muy usadas en bases de datos comerciales. Tenemos canastas de bienes que son vectores (muy grandes) Podemos encontrar bienes que sean comprados juntos con mucha frecuencia? Para qué podría servir algo así? 22 / 33
43 Motivación Un almacén puede organizar mejor sus repisas para mejorar sus ingresos. Hacer mercadeo cruzado de ciertas promociones que tengan que ver la una con la otra. Segmentar clientes de acuerdo a sus patrones de consumo. Diseñar experiencias para usuarios en páginas web. Recomendar películas en Netflix? Productos en Amazon? 23 / 33
44 Motivación 24 / 33
45 Aproximación al problema Quisiéramos encontrar algunas canastas v 1,..., v n tales que su densidad de probabilidad P r(v i) sea alta. Este problema se llama Mode Finding o Bump Hunting. Sin embargo hay muchísimas canastas posibles ( Cuántos productos tiene Éxito en sus repisas?) Una estimación de la densidad de estas canastas siempre dará algo muy pequeño como para ser confiable. Además calcular esas densidades es incomputable! Cuántas canastas hay? 25 / 33
46 Cuántos productos vende Amazon? 26 / 33
47 Simplificar Podemos dejar de buscar canastas prototipos y buscar regiones en el consumo. Probablemente sea mucho más interesante y fácil de interpretar una relación entre dos o pocos productos. Podríamos agrupar tipos de productos en una sola variable dummy. Podemos pensar en la probabilidad de todas las canastas que contienen el artículo ω. 27 / 33
48 Con variables dummy Considerando un elemento de cada clase (posiblemente binaria) la ecuación se simplifica [ ] P [ k K (z k = 1)] = P z k = 1 = T (K) Esto implica segmentar variables continuas que pueda haber en el análisis. El conjunto K se conoce como conjunto de bienes o item set. k K 28 / 33
49 Algoritmo Crecimiento de Árbol de patrones Queremos encontrar reglas X Y con buenas garantía probabilísticas (confianza). Estimamos las probabilidades de las canatas con la frecuencia en las base de transacciones: supp(x) := T (X) T supp(x y Y ), conf(x Y ) =. supp(x) Queremos tener en cuenta solo aquellas transacciones con un soporte mínimimo t y confianza mínima s. El algoritmo del árbol busca reglas aprovechando: 1. X Y y X Z implican X Y Z 2. X Y implica supp(x) supp(y ) 29 / 33
50 Algoritmo Crecimiento de Árbol de patrones Queremos encontrar reglas X Y con buenas garantía probabilísticas (confianza). Estimamos las probabilidades de las canatas con la frecuencia en las base de transacciones: supp(x) := T (X) T supp(x y Y ), conf(x Y ) =. supp(x) Queremos tener en cuenta solo aquellas transacciones con un soporte mínimimo t y confianza mínima s. El algoritmo del árbol busca reglas aprovechando: 1. X Y y X Z implican X Y Z 2. X Y implica supp(x) supp(y ) El algoritmo realiza: 1. Saca las items con soporte < t. 2. Ordena los items descendientemente por soporte. 3. Orden las transacciones descendientemente por tamaño. 4. Construye un árbol con pesos en el que cada camino hacia la raíz es una transacción. 5. Para cada hoja del árbol, Y, la rama que la contiene es el antecedente que la implica X. 29 / 33
51 Ejemplo Se buscan reglas de asociación entre 9409 cuestionarios de compradores de un Mall en San Francisco. Se buscan relaciones entre las variables demográficas. Se parten las variables ordinales como Dummies por la mediana. El algoritmo encuentra 6288 reglas de asociación (difícil de interpretar) con soporte mayor a 10 % 30 / 33
52 Ejemplo 31 / 33
53 Limitaciones Está sesgado hacia observaciones más frecuentes que otras. Nunca encontraría Vodka Caviar. A pesar de tener un lift alto. Esto es porque intrínsicamente se está comparando con una distribución de referencia uniforme. Esto se puede solucionar en conjuntos pequeños con una estimación de la densidad basada en una distribución de referencia acorde a las probabilidades marginales. Se usa aprendizaje supervisado para ajustar una densidad relativa a esa distribución (por ejemplo una logística). 32 / 33
54
OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA. Tema 4 Optimización no Lineal
OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA Tema 4 Optimización no Lineal ORGANIZACIÓN DEL TEMA Sesiones: El caso sin restricciones: formulación, ejemplos Condiciones de optimalidad, métodos Caso con restricciones:
Más detallesAnálisis de imágenes digitales
Análisis de imágenes digitales SEGMENTACIÓN DE LA IMAGEN Segmentación basada en texturas INTRODUCCIÓN La textura provee información sobre la distribución espacio-local del color o niveles de intensidades
Más detallesLocalización. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides
M.Sc. Kryscia Ramírez Benavides Problemas de Navegación de los Robots Dónde estoy?. Dónde he estado? Mapa de decisiones. A dónde voy? Planificación de misiones. Cuál es la mejor manera de llegar? Planificación
Más detalles1. La Distribución Normal
1. La Distribución Normal Los espacios muestrales continuos y las variables aleatorias continuas se presentan siempre que se manejan cantidades que se miden en una escala continua; por ejemplo, cuando
Más detallesTema 5. Muestreo y distribuciones muestrales
1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución
Más detallesTécnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO
Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar
Más detallesDISTRIBUCIÓN N BINOMIAL
DISTRIBUCIÓN N BINOMIAL COMBINACIONES En muchos problemas de probabilidad es necesario conocer el número de maneras en que r objetos pueden seleccionarse de un conjunto de n objetos. A esto se le denomina
Más detallesIntroducción a las RdP. Optimización basada en redes de Petri. Redes de Petri. Son objeto de estudio: RdP. Ejemplos:
Seminario sobre toma de decisiones en logística y cadenas de suministro Introducción a las RdP Optimización basada en redes de Petri https://belenus.unirioja.es/~emjimene/optimizacion/transparencias.pdf
Más detallesFase 2. Estudio de mercado: ESTADÍSTICA
1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.
Más detallesAlgunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides
Algunas Distribuciones Continuas de Probabilidad UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción El comportamiento de una variable aleatoria queda
Más detallesINSTITUTO CHAPULTEPEC MIDDLE SCHOOL
MATEMÁTICAS VII. (1er BIMESTRE) INSTITUTO CHAPULTEPEC MIDDLE SCHOOL. 2009-2010 1) SIGNIFICADO Y USO DE LOS NÚMEROS a) Lectura y escritura de números naturales. - Operaciones con números naturales. - Problemas
Más detallesHerramientas computacionales para la matemática MATLAB: Análisis de datos.
Herramientas computacionales para la matemática MATLAB:. Verónica Borja Macías Junio 2012 1 Analizar datos estadísticos en MATLAB es sencillo. Máximo y mínimo max(x) si x es vector encuentra el valor más
Más detallesSimulación I. Investigación Operativa, Grado en Estadística y Empresa, 2011/12
Simulación I Prof. José Niño Mora Investigación Operativa, Grado en Estadística y Empresa, 2011/12 Esquema Modelos de simulación y el método de Montecarlo Ejemplo: estimación de un área Ejemplo: estimación
Más detallesEstimación por métodos Geoestadísticos
Estimación por métodos Geoestadísticos Métodos de Estimación de Recursos Mineros Estimación global Estimación local La media aritmética Los polígonos El método del inverso de la distancia Geoestadística
Más detallesPOBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN
POBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN Adela del Carpio Rivera Doctor en Medicina UNIVERSO Conjunto de individuos u objetos de los que se desea conocer algo en una investigación Población o universo
Más detallesConceptos Básicos de Inferencia
Conceptos Básicos de Inferencia Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Inferencia Estadística Cuando obtenemos una muestra, conocemos
Más detallesDistribución normal estándar. Juan José Hernández Ocaña
Distribución normal estándar Juan José Hernández Ocaña Tipos de variables jujo386@hotmail.com Tipos de variables Cualitativas Son las variables que expresan distintas cualidades, características o modalidades.
Más detallesINTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)
TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de
Más detallesHistograma del puntaje de vocabulario y la aproximación por una curva gaussiana.
35 Curvas de densidad Existe alguna manera de describir una distribución completa mediante una única expresión? un diagrama tallo-hoja no es práctico pues se trata de demasiados datos un histograma elimina
Más detallesEL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)
EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento
Más detallesESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua
ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:
Más detallesANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.
ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos
Más detallesDistribuciones de probabilidad
Distribuciones de probabilidad Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Inferencia estadística: Parte de la estadística que estudia grandes colectivos a partir
Más detallesPATRONES DE DISTRIBUCIÓN ESPACIAL
PATRONES DE DISTRIBUCIÓN ESPACIAL Tipos de arreglos espaciales Al azar Regular o Uniforme Agrupada Hipótesis Ecológicas Disposición al Azar Todos los puntos en el espacio tienen la misma posibilidad de
Más detallesProbabilidad y Estadística Descripción de Datos
Descripción de Datos Arturo Vega González a.vega@ugto.mx Division de Ciencias e Ingenierías Universidad de Guanajuato Campus León Universidad de Guanajuato, DCI, Campus León 1 / 28 Contenido 1 Probabilidad
Más detallesTRATAMIENTO DE LA INFORMACION
INSTITUTO EDUCACIONAL JUAN XXIII SECUENCIACION DE CONTENIDOS - MATEMATICA TRATAMIENTO DE LA INFORMACION Clasificar diferentes elementos del entorno por diferentes atributos. Describir objetos del entorno.
Más detalles1: INTRODUCCIÓN AL USO DE LA HOJA DE CALCULO EXCEL COMO HERRAMIENTA PARA DESARROLLAR PROBLEMAS EN INGENIERÍA. SOLVER, REGRESION LINEAL MULTIPLE
Practica 1: INTRODUCCIÓN AL USO DE LA HOJA DE CALCULO EXCEL COMO HERRAMIENTA PARA DESARROLLAR PROBLEMAS EN INGENIERÍA. SOLVER, REGRESION LINEAL MULTIPLE I. INTRODUCCION Las planillas de cálculo se han
Más detallesSOLUCIÓN NUMÉRICA DE ECUACIONES ALGEBRAICAS Y TRASCENDENTES
SOLUCIÓN NUMÉRICA DE ECUACIONES ALGEBRAICAS Y TRASCENDENTES EL PROBLEMA DE OBTENER LOS CEROS O RAÍCES DE UNA ECUACIÓN ALGEBRAICA O TRASCENDENTE, ES UNO DE LOS REQUERIDOS MAS FRECUENTEMENTE, DEBIDO A ELLO
Más detallesIntroducción. Alfonso Cubillos. Programa de Ing. Mecánica Universidad de Ibagué. Aplicaciones computacionales de la Mecánica de Materiales
Programa de Ing. Mecánica Universidad de Ibagué Aplicaciones computacionales de la Mecánica de Materiales Agosto 2007 Cuál es la definición de Mecánica? Cuál es la definición de Mecánica? La mecánica es
Más detallesUnidad 1: Espacio de Probabilidad
Unidad 1: Espacio de Probabilidad 1.1 Espacios de Probabilidad. (1) Breve introducción histórica de las probabilidades (2) Diferencial entre modelos matemáticos deterministicos y probabilísticos (3) Identificar
Más detallesAplicaciones empresariales
KDD y Data Minig Descubrimiento de Conocimiento en Bases de Datos Se define como la extracción no trivial de información implícita, desconocida, y potencialmente útil de los datos. La palabra descubrimiento
Más detallesESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA Medidas de tendencia central y de dispersión Giorgina Piani Zuleika Ferre 1. Tendencia Central Son un conjunto de medidas estadísticas que determinan un único valor que define el
Más detallesModelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:
Modelos de probabilidad Modelos de probabilidad Distribución de Bernoulli Distribución Binomial Distribución de Poisson Distribución Exponencial Objetivos del tema: Al final del tema el alumno será capaz
Más detallesLECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL.
LECTURA 1: LA DISTRIBUCIÓN NORMAL GENERAL LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I) TEMA 1: LA DISTRIBUCION NORMAL GENERAL PROPIEDADES 1 INTRODUCCION La distribución de probabilidad continua más importante
Más detallesPROBABILIDAD Y ESTADÍSTICA
FACULTAD DE INGENIERÍA U N A M PROBABILIDAD Y ESTADÍSTICA Irene Patricia Valdez y Alfaro irenev@unam.mx T E M A S DEL CURSO 1. Análisis Estadístico de datos muestrales. 2. Fundamentos de la Teoría de la
Más detallesModelos Estadísticos de Crimen
Universidad de los Andes Modelos Estadísticos de Crimen 27 de Mayo de 2015 Motivacion Conocer la densidad de probabilidad del crimen sobre una ciudad, a distintas horas del día, permite Modelos Estadísticos
Más detallesÁrboles Filogenéticos. BT7412, CC5702 Bioinformática Diego Arroyuelo. 2 de noviembre de 2010
Unidad 6: Árboles Filogenéticos BT7412, CC5702 Bioinformática Diego Arroyuelo 2 de noviembre de 2010 Temario (Introduction to Computational Molecular Biology Setubal y Meidanis Capítulo 6) 1. Introducción
Más detallesText Mining Introducción a Minería de Datos
Text Mining Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 12 de Marzo de 2008 qué es la minería de datos? A technique using software tools
Más detallesMÉTODO SINGAPUR. Para la enseñanza de Matemáticas
MÉTODO SINGAPUR Para la enseñanza de Matemáticas ÍNDICE Introducción El marco del currículo Conceptos Habilidades Procesos Metacognición Actitudes Más Información INTRODUCCIÓN El método Singapur es una
Más detalles478 Índice alfabético
Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión
Más detallesACTIVIDAD 2: La distribución Normal
Actividad 2: La distribución Normal ACTIVIDAD 2: La distribución Normal CASO 2-1: CLASE DE BIOLOGÍA El Dr. Saigí es profesor de Biología en una prestigiosa universidad. Está preparando una clase en la
Más detallesProgramación Dinámica 1
Programación Dinámica 1 El método de programación dinámica sirve para resolver problemas combinando las soluciones de subproblemas. Normalmente es usada para resolver problemas de optimización. Al construir
Más detallesFormulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico
Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más
Más detallesEl Algoritmo E-M. José Antonio Camarena Ibarrola
El Algoritmo E-M José Antonio Camarena Ibarrola Introducción Método para encontrar una estimación de máima verosimilitud para un parámetro ѳ de una distribución Ejemplo simple 24 Si tiene las temperaturas
Más detallesClase 9 Programación No Lineal
Pontificia Universidad Católica Escuela de Ingeniería Departamento de Ingeniería Industrial y de Sistemas Clase 9 Programación No Lineal ICS 110 Optimización Profesor : Claudio Seebach Apuntes de Clases
Más detallesProbabilidad y Estadística
Probabilidad y Estadística Tema 9 Experimentación y presentación de datos Objetivo de aprendizaje del tema Al finalizar el tema serás capaz de: Describir los conceptos de experimentación y determinación
Más detallesTema 6. Variables aleatorias continuas
Tema 6. Variables aleatorias continuas Resumen del tema 6.1. Definición de variable aleatoria continua Identificación de una variable aleatoria continua X: es preciso conocer su función de densidad, f(x),
Más detallesCÁLCULO DE PROBABILIDADES
CÁLCULO DE PROBABILIDADES Tipo de asignatura: Troncal Anual. Créditos ECTS: 15 I.- INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES. (16 horas presenciales) Tema 1.- La naturaleza del cálculo de probabilidades.
Más detallesLas medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.
CONTENIDO: MEDIDAS DE DISPERSIÓN INDICADOR DE LOGRO: Determinarás y aplicarás, con perseverancia las medidas de dispersión para datos no agrupados y agrupados Guía de trabajo: Las medidas de dispersión
Más detallesTEOREMA DEL LÍMITE CENTRAL
Material de clase n 2 Domingo 13 Junio TEOREMA DEL LÍMITE CENTRAL A medida que n se vuelve más grande, la distribución de las medias muestrales se aproxima a una distribución normal con una media x = µ
Más detallesEstadística Inferencial. Estadística Descriptiva
INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y
Más detallesMedidas de dispersión
Medidas de dispersión Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Las medidas de dispersión son: Rango o recorrido El rango es la diferencia
Más detallesTema 4: Probabilidad y Teoría de Muestras
Tema 4: Probabilidad y Teoría de Muestras Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009
Más detallesCálculo de Probabilidades II Preguntas Tema 1
Cálculo de Probabilidades II Preguntas Tema 1 1. Suponga que un experimento consiste en lanzar un par de dados, Sea X El número máximo de los puntos obtenidos y Y Suma de los puntos obtenidos. Obtenga
Más detallesI. Complejidad de Problemas
I. Complejidad de Problemas 1. Complejidad de Problemas Tópicos Clasificación de Problemas Clasificación por su Naturaleza Clasificación por su Tratabilidad Clasificación por el tipo de Respuesta 1.1 Clasificación
Más detallesINDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Más detallesUniversidad de Santiago de Chile Facultad de Ciencia Departamento de Matemática y Ciencias de la Computación
Universidad de Santiago de Chile Facultad de Ciencia Departamento de Matemática y Ciencias de la Computación EJERCICIOS RESUELTOS DE ECUACIONES NO LINEALES Profesor: Jaime Álvarez Maldonado Ayudante: Rodrigo
Más detallesLa prueba extraordinaria de septiembre está descrita en los criterios y procedimientos de evaluación.
La prueba extraordinaria de septiembre está descrita en los criterios y procedimientos de evaluación. Los contenidos mínimos de la materia son los que aparecen con un * UNIDAD 1: LOS NÚMEROS NATURALES
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesNOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012
NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012 Matilde Ungerovich- mungerovich@fisica.edu.uy DEFINICIÓN PREVIA: Distribución: función que nos dice cuál es la probabilidad de que cada suceso
Más detallesTema 2: Magnitudes aleatorias
Facultad de Economía y Empresa 1 Prácticas Tema.- Magnitudes aleatorias Tema : Magnitudes aleatorias DEMANDA La demanda de cierto artículo es una variable aleatoria con la siguiente distribución: Número
Más detallesUNIVERSIDAD AUTONOMA DE SANTO DOMINGO
UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Industrial (EST-121) NUMERO DE CREDITOS
Más detallesEl Juego como Problema de Búsqueda
El Juego como Problema de Búsqueda En este algoritmo identificamos dos jugadores: max y min. El objetivo es encontrar la mejor movida para max. Supondremos que max mueve inicialmente y que luego se turnan
Más detallesINSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016
ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una
Más detalles4. NÚMEROS PSEUDOALEATORIOS.
4. NÚMEROS PSEUDOALEATORIOS. En los experimentos de simulación es necesario generar valores para las variables aleatorias representadas estas por medio de distribuciones de probabilidad. Para poder generar
Más detallesFundamentos de Estadística y Simulación Básica
Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión
Más detallesEstadística Descriptiva
M. en C. Juan Carlos Gutiérrez Matus Instituto Politécnico Nacional 2004 IPN UPIICSA c 2004 Juan C. Gutiérrez Matus Desde la segunda mitad del siglo anterior, el milagro industrial sucedido en Japón, hizo
Más detallesAgro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Más detallesTeorema Central del Límite (1)
Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico
Más detalles5. DISTRIBUCIOES COTIUAS DE PROBABILIDAD
Distribución normal 5. DISTRIBUCIOES COTIUAS DE PROBABILIDAD La distribución continua de probabilidad más importante en todo el campo de la estadística es la distribución normal. Su grafica, que se denomina
Más detallesComplejidad de la Comunicación
Complejidad de la Comunicación Juan Sebastian Navarro 08 de Mayo de 2012 1 / 50 Introducción Complejidad de la Comunicación Determinística Determinación de Cotas Complejidad de la Comunicación No Determinística
Más detallesEconometría de series de tiempo aplicada a macroeconomía y finanzas
Econometría de series de tiempo aplicada a macroeconomía y finanzas Series de Tiempo no Estacionarias Carlos Capistrán Carmona ITAM Tendencias Una tendencia es un movimiento persistente de largo plazo
Más detallesRESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO
RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO 1 rojo 1 2 3 4 5 6 Supongamos que tenemos dos dados, uno rojo y otro verde, cada uno de los cuales toma valores entre
Más detallesTema 4: Probabilidad y Teoría de Muestras
Tema 4: Probabilidad y Teoría de Muestras Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009
Más detallesAnálisis Probit. StatFolio de Ejemplo: probit.sgp
STATGRAPHICS Rev. 4/25/27 Análisis Probit Resumen El procedimiento Análisis Probit está diseñado para ajustar un modelo de regresión en el cual la variable dependiente Y caracteriza un evento con sólo
Más detallesC a l ses P P y y NP C a l se P C a l se N P N P [No N n o -De D te t rmin i i n s i ti t c i Polynomial-tim i e]
Análisis y Diseño de Algoritmos Introducción Análisis y Diseño de Algoritmos Concepto de algoritmo Resolución de problemas Clasificación de problemas Algorítmica Análisis de la eficiencia de los algoritmos
Más detallesDescripciones de los niveles de logro modificados (ALD, siglas en inglés) de la prueba de evaluación MCA en matemáticas Grados 5 a 8
Descripciones de los niveles de logro modificados (ALD, siglas en inglés) de la prueba de evaluación MCA en matemáticas Grados 5 a 8 Grado 5 No cumple los estándares de logro modificados (Grado 5) Los
Más detallesContraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste
1 Contraste de hipótesis Tema 3 1. Pasos del contraste de hipótesis 1.1 Hipótesis estadísticas: nula y alternativa 1.2 Supuestos 1.3 Estadístico de contraste 1.4 Regla de decisión: zona de aceptación y
Más detallesALGUNAS CUESTIONES DESTACABLES EN INFERENCIA ESTADÍSTICA
ALGUNAS CUESTIONES DESTACABLES EN INFERENCIA ESTADÍSTICA Las encuestas sociológicas suelen trabajar con muestras. Sería demasiado costoso entrevistar al total de la población española adulta, que suele
Más detallesINDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos
INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos
Más detallesGLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.
GLOSARIO ESTADÍSTICO Fuente: Murray R. Spiegel, Estadística, McGraw Hill. CONCEPTOS Y DEFINICIONES ESPECIALES Es el estudio científico de los métodos para recoger, organizar, resumir y analizar los datos
Más detalles1. VALORES FALTANTES 2. MECANISMOS DE PÉRDIDA
1. VALORES FALTANTES Los valores faltantes son observaciones que en un se tenía la intención de hacerlas, pero por distintas razones no se obtuvieron. Puede ser que no se encuentre a un encuestado, entonces
Más detallesAnejo 1. Teoría de Airy. Solución lineal de la ecuación de ondas.
Anejo 1. Teoría de Airy. Solución lineal de la ecuación de ondas. Introducción y ecuaciones que rigen la propagación del oleaje. La propagación de oleaje en un fluido es un proceso no lineal. Podemos tratar
Más detallesECUACIONES. Ecuaciones. Indicadores. Contenido ECUACIÓN
Indicadores ECUACIONES Determina el conjunto solución de una ecuación. Resuelve ecuaciones de primer y segundo grado, así como sistemas de ecuaciones Contenido Ecuaciones De primer grado Sistemas de ecuaciones
Más detallesAnálisis Estadístico de Datos Climáticos. Distribuciones paramétricas de probabilidad (Wilks, cap. 4)
Análisis Estadístico de Datos Climáticos Distribuciones paramétricas de probabilidad (Wilks, cap. 4) 2013 Variables aleatorias Una variable aleatoria es aquella que toma un conjunto de valores numéricos
Más detallesOPTIMIZACIÓN VECTORIAL
OPTIMIZACIÓN VECTORIAL Métodos de Búsqueda Directa Utilizan sólo valores de la función Métodos del Gradiente Métodos de Segundo Orden Requieren valores aproimados de la primera derivada de f) Además de
Más detallesUNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO CENTRO UNIVERSITARIO UAEM ZUMPANGO LICENCIATURA EN TURISMO UNIDAD DE APRENDIZAJE: ESTADISTICA TEMA 1.5 : ESTADISTICA DESCRIPTIVA M. EN C. LUIS ENRIQUE KU MOO FECHA:
Más detallesCuando se enumeran todos los elementos que componen el conjunto. A = { 1, 2, 3, 4, 5 }
LOS NÚMEROS REALES TEMA 1 IDEAS SOBRE CONJUNTOS Partiremos de la idea natural de conjunto y del conocimiento de si un elemento pertenece (* ) o no pertenece (* ) a un conjunto. Los conjuntos se pueden
Más detallesINSTITUTO POLITÉCNICO NACIONAL SECRETARIA ACADEMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS
ESCUELA: UPIICSA CARRERA: INGENIERÍA EN TRANSPORTE ESPECIALIDAD: COORDINACIÓN: ACADEMIAS DE MATEMÁTICAS DEPARTAMENTO: CIENCIAS BÁSICAS PROGRAMA DE ESTUDIO ASIGNATURA: ESTADÍSTICA APLICADA CLAVE: TMPE SEMESTRE:
Más detallesCRITERIOS DE SELECCIÓN DE MODELOS
Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,
Más detallesMétodos de Investigación en Psicología (10) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández
Métodos de Investigación en Psicología (10) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema
Más detallesAnálisis de Componentes de la Varianza
Análisis de Componentes de la Varianza Resumen El procedimiento de Análisis de Componentes de Varianza está diseñado para estimar la contribución de múltiples factores a la variabilidad de una variable
Más detallesINTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)
INTERVALOS DE CONFIANZA La estadística en cómic (L. Gonick y W. Smith) EJEMPLO: Será elegido el senador Astuto? 2 tamaño muestral Estimador de p variable aleatoria poblacional? proporción de personas que
Más detalles2º ESO UNIDAD 14 ESTADÍSTICA Y PROBABILIDAD
º ESO UNIDAD 1 ESTADÍSTICA Y PROBABILIDAD 1 1.- CONCEPTOS BÁSICOS Estadística.- Es la ciencia que estudia conjuntos de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas, gráficas
Más detallesSistemas de ayuda a la decisión Modelización de la incertidumbre Tema 2. Incertidumbre y Probabilidad
Sistemas de ayuda a la decisión Modelización de la incertidumbre Tema 2. Incertidumbre y Probabilidad Indice 1) Sucesos aleatorios. Espacio muestral. 2) Operaciones con sucesos. 3) Enfoques de la Probabilidad.
Más detallesDerivada de una función en un punto. Función derivada. Diferencial de una función en un punto. dy = f (x) dx. Derivada de la función inversa
Derivada de una función en un punto Las tres expresiones son equivalentes. En definitiva, la derivada de una función en un punto se obtiene como el límite del cociente incremental: el incremento del valor
Más detallesGeneración de variables aleatorias continuas Método de la transformada inversa
Generación de variables aleatorias continuas Método de la transformada inversa Georgina Flesia FaMAF 16 de abril, 2013 Generación de v.a. discretas Existen diversos métodos para generar v.a. discretas:
Más detallesProyecto PropULSA: Estadística y Probabilidad Breviario Académico
Estadística y Probabilidad Breviario Académico Estadística: Es la ciencia que tiene por objetivo recolectar, escribir e interpretar datos, con la finalidad de efectuar una adecuada toma de decisiones en
Más detalles4ta. Práctica. Búsqueda en árbol con contrincante: MiniMax con poda Alfa-Beta. Inteligencia Artificial Prácticas 2004/2005
4ta. Práctica Búsqueda en árbol con contrincante: MiniMax con poda Alfa-Beta Inteligencia Artificial Prácticas 2004/2005 Decisiones Perfectas en Juegos de DOS Participantes Definición de Juego Estado Inicial:
Más detalles