Otros aspectos. Procesado de la entrada Procesado de la salida. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Otros aspectos. Procesado de la entrada Procesado de la salida. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid"

Transcripción

1 Otros aspectos Procesado de la entrada Procesado de la salida Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

2 Contenido 1. Procesado de la entrada 1. Motivación y tareas 2. Limpieza de datos 3. Transformación de datos 4. Reducción de datos 5. Discretización de atributos 6. Selección de atributos 2. Procesado de la salida 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging 4. Boosting 5. Stacking Otros Aspectos 2

3 1.1 Motivación y tareas Se dispone de numerosos algoritmos de aprendizaje que se pueden aplicar de forma efectiva a la solución de problemas prácticos Los problemas de aprendizaje o minería de datos no se resuelven solamente aplicando distintos algoritmos y estimando su tasa de error Es preciso conocer en detalle el problema de aplicación y la naturaleza de los datos Hay que garantizar una cierta calidad en los datos Hay que adaptar los datos al algoritmo seleccionado Otros Aspectos 3

4 Preprocesado de la entrada Limpieza de datos Transformación de datos Reducción de datos Discretización de atributos Selección de atributos Otros Aspectos 4

5 1.2 Limpieza de datos Es una de las primeras fases del preprocesado de los datos de entrada. Pretende eliminar las redundancias, inconsistencias, ruido, identificar outliers... El proceso involucra varias fases: Valores ausentes Datos con ruido Outliers Otros Aspectos 5

6 Valores ausentes Ignorar instancias Poco efectivo salvo si hay pocos atributos con valores perdidos Rellenar manualmente Muy costoso (tiempo) Uso de constante global Constante unknown Poco recomendable Uso de la media, mediana, moda del atributo Mejor por clase Uso del valor más probable Regresión, Inferencia, Árboles de decisión Por ejemplo construir un árbol de decisión utilizando los restantes atributos, incluso la clase, para predecir el valor Tener en cuenta que los tres últimos modifican el conjunto de datos Otros Aspectos 6

7 Datos con ruido Reducir el ruido: controvertido En general Ruido en los atributos: puede ser mejor dejarlo Nunca entrenar con datos sin ruido si se va a utilizar en un entorno con ruido Ruido en la clase Sistemático: mejor dejarlo Asistemático: intentar eliminarlo Otros Aspectos 7

8 Reducción de ruido Filtros dinámicos: puede modificar la dinámica, particularmente los transitorios Suavizado local Ventana fija/deslizante Suavizado por medias Mejor con ventana deslizante Suavizado por fronteras: máximo/mínimo Ejemplo: 4, 8, 15, 21, 21, 24, 25, 28, 34 Ventana fija, suavizado por máximo, mínimo Ventanas <4, 8, 15>, <21, 21, 24>, <25, 28, 34> Resultado: 4, 4, 15, 21, 21, 24, 25, 25, 34 Otros Aspectos 8

9 Detección de outliers (y anomalías) Inspección visual (también para el ruido asistemático e inconsistencias) Clustering Regresión robusta Remover outliers Por ejemplo, 10% puntos más alejados del plano de regresión Minimizar error absoluto en vez de cuadrático Minimizar mediana en vez de media (outliers en dirección x e y) Otros Aspectos 9

10 Ejemplo: mínima mediana de los cuadrados Nº de llamadas internacionales desde Bélgica, 1950, 1973 Otros Aspectos 10

11 1.3 Transformación de datos Normalización Importante en muchos métodos numéricos, para dar igual importancia a cada atributo Escalar al intervalo [0, 1] Estandarizar a media 0 y desviación 1 Construcción de atributos Añadir nuevos atributos para introducir conceptos relevantes Alto, ancho área Facilita clasificación, pero aumenta la dimensionalidad Otros Aspectos 11

12 1.4 Reducción de datos Técnicas de compresión También clustering Técnicas de muestreo (numerosity) Aleatorio con/sin reemplazamiento Estratificado Series temporales Múltiplos del periodo base (si periódica) Mejor sin filtrar Puede ser interesante suavizado por fronteras Reducción de la dimensionalidad Análisis de componentes principales Proyección aleatoria Otros Aspectos 12

13 Análisis de componentes principales (PAC) Método clásico para detectar las direcciones principales de los datos Uso: reducir dimensionalidad, visualización Se basa en que la varianza total es invariante ante la rotación de ejes ortogonales Componentes principales: ejes de máxima varianza Puede rotar los datos en el sistema de coordenada (reducido) de los componentes principales Otros Aspectos 13

14 Rotación componentes principales Otros Aspectos 14

15 Obtención componentes principales Método intuitivo: 1. Normalizar 2. Encontrar dirección de máxima varianza 3. Repetir 4. Buscar eje ortogonal al anterior de máxima varianza 4. Hasta % varianza deseado Método computacional Buscar autovectores matriz de covarianza Ordenar por autovalores Otros Aspectos 15

16 Ejemplo: datos dimensión 10 Otros Aspectos 16

17 Proyección aleatoria PAC tiene un coste elevado, O(a 3 ) Alternativa: proyectar sobre ejes aleatorios, de dimensión deseada En media, conserva bien las relaciones de distancias En principio, peor que PAC Introduce variabilidad en las hipótesis Otros Aspectos 17

18 1.5 Discretización de atributos Necesario para algunos algoritmos Útil para otros Por ejemplo, la extensión de Naïve Bayes a atributos continuos requiere distribución normal Algunos métodos son más rápidos con atributos nominales que con numéricos Útil para la aplicación Por ejemplo, temperatura fiebre Dos familias No supervisado Supervisado Otros Aspectos 18

19 Discretización no supervisada División por intervalos Dividir el rango en número predeterminado de intervalos de igual longitud Puede distribuir las instancias de forma poco uniforme División por frecuencias Dividir el rango en número predeterminado de intervalos de distinta amplitud, con igual nº de instancias Buenos resultados con Naïve Bayes, eligiendo nº de intervalos D 1/2 Clustering K-medias Otros Aspectos 19

20 Discretización supervisada En general, el proceso de discretización mejora si se usa información de la clase Manual: basada en conocimiento Automática: preferir métodos basados en la entropía (ganancia de información) frente al error Discretización local: árbol de decisión Discretización global Extender el método de la ganancia de información a los valores de los atributos de todas las instancias Criterio de parada Otros Aspectos 20

21 Discretización basada en 1R Error de clasificación Ordenar los valores del atributo Límites de los intervalos: cambio de clase Restricción: tiene que haber un número mínimo de instancias (6) de la clase mayoritaria Método global Otros Aspectos 21

22 Ejemplo discretización 1R Otros Aspectos 22

23 Discretización local Discretizar mediante árbol de decisión Habitualmente nodos binarios El mismo atributo puede discretizarse de modo diferente en distintos nodos Según se desciende en el árbol, las decisiones están basadas cada vez en menos ejemplos: Menos fiable Otros Aspectos 23

24 Discretización global basada en entropía Aplicar criterio de la ganancia de información al atributo a discretizar de todas las instancias Crear árbol de decisión utilizando sólo el atributo a discretizar Considerar como candidatos los valores en que cambia la clase Repetir para cada subintervalo Criterio de parada: Principio de Mínima Longitud de Descripción (MDL) Otros Aspectos 24

25 Ejemplo: atributo temperatura!sin criterio de parada! Otros Aspectos 25

26 Criterio de parada: MDL Usar MDL para decidir si se introduce una partición N instancias Conjunto original: k-clases, entropía E 1 er intervalo, k 1, E 1 2º intervalo, k 2, E 2 Dividir si ganancia Con este criterio,!no se introduce ninguna partición en el atributo temperatura! Eliminar el atributo Otros Aspectos 26

27 1.6 Selección de atributos Los atributos irrelevantes dificultan el proceso de aprendizaje Crítico en basado en instancias y clustering Incluso algoritmos como C4.5 empeoran En general, todos los métodos que subdividen el conjunto de datos: con pocos datos pueden recurrir a atributos irrelevantes Naïve Bayes los ignora, pero le afectan los atributos redundantes Además con más atributos, Se precisan más instancias Aumenta riesgo de sobreajuste Dificulta la comprensión del concepto Otros Aspectos 27

28 Métodos de selección de atributos Manual En base a la comprensión del problema En muchos casos, el mejor Automática (semi-) Métodos filtro Selección independiente del algoritmo de aprendizaje Métodos envoltorio El propio algoritmo de aprendizaje interviene en la selección de atributos Otros Aspectos 28

29 Métodos de filtro Independientes del algoritmo de aprendizaje Se basan en características generales de los datos Conjunto de Atributos de Entrada Selección de un Subconjunto de Atributos Algoritmo de Aprendizaje Algunos métodos Utilizar otro algoritmo de aprendizaje para la selección, por ejemplo, C4.5, SVM Mejor SVM: eliminar recursivamente los atributos con menores coeficientes: SVM- RFE (Recursive Feature Elimination) Correlacción Ente atributos: redundancia Atributos clase: eliminar los de menor correlación Incertidumbre simétrica (SU) Otros Aspectos 29

30 Selección basada en la correlación (I) Correlación entre dos atributos nominales: Incertidumbre simétrica (SU) H es la entropía, H(A,B) es la entropía conjunta de A y B Todas las combinaciones de valores de A y B 0 <= SU(A, B) <= 1 SU(A, B)=1 indica que A y B están totalmente correlacionados Otros Aspectos 30

31 Selección basada en la correlación (II) Adecuación de un conjunto de atributos: C es la clase, i, j iteran sobre los atributos Si todos los atributos se correlacionan perfectamente con la clase y ente ellos, el valor es 1 (el mínimo es 0) No es ideal, pues no elimina los redundantes Cualquier subconjunto de estos atributos también tiene valor 1 Resolver empates a favor del subconjunto más pequeño Otros Aspectos 31

32 Selección individual de mejores atributos Utilizar alguna medida para evaluar el atributo: Ganancia información, SU(A i,c), ReliefF, Entropía Ranking: seleccionar los mejores Fijando umbral Fijando nº atributos Otros Aspectos 32

33 Búsqueda en el retículo de atributos Cielo Temperatura Humedad Viento Cielo Temperatura Cielo Humedad Temperatura Humedad Cielo Viento Temperatura Viento Humedad Viento Cielo Temperatura Humedad Cielo Temperatura Viento Cielo Humedad Viento Temperatura Humedad Viento Cielo Temperatura Humedad Viento Otros Aspectos 33

34 Aproximaciones básicas Selección hacia delante (forward selection) Se comienza por Búsqueda voraz añadiendo una atributo en cada paso Eliminación hacia atrás (backward elimination) Se comienza con todos los atributos Búsqueda voraz eliminando un atributo en cada paso Comportamiento similar Eliminación hacia atrás genera subconjuntos más grandes y clasificadores más precisos Selección hacia delante tiende a generara menos atributos y facilita la comprensión del concepto Otros Aspectos 34

35 Otros métodos de búsqueda Búsqueda primero el mejor Mantiene lista de subconjuntos evaluados, ordenada por rendimiento Criterio de parada para no recorrer todo el espacio Búsqueda en haz Similar, limitando el número de subconjuntos evaluados Algoritmos genéticos Otros Aspectos 35

36 Métodos de envoltorio (I) Los métodos de envoltorio realizan una búsqueda en el espacio de atributos para seleccionar el mejor subconjunto de atributos Debido al tamaño del espacio de atributos, se suele utilizar un método de búsqueda voraz El comportamiento de cada subconjunto de atributos considerado se evalúa estimando el comportamiento del clasificador inducido con dichos atributos Típicamente error y validación cruzada Otros Aspectos 36

37 Métodos de envoltorio (II) Computacionalmente costoso: Con forward selection o backward elimination se multiplica el tiempo de procesamiento por k 2, con k el número de atributos. En general, no compensa utilizar métodos de búsqueda más complejos Propenso al sobreajuste al utilizar el método de aprendizaje como evaluador Es difícil predecir en que condiciones se justifica su uso Prueba y error Otros Aspectos 37

38 Ejemplo selección atributos Datos originales: 20 atributos Otros Aspectos 38

39 Todos los atributos Método: Alternating Decision Trees. Tasa de acierto: 76% Otros Aspectos 39

40 Filtro Selección hacia delante, bpm Atributos seleccionados: 10 atributos. Tasa acierto: 80,6 Otros Aspectos 40

41 Envoltorio Selección hacia adelante Atributos seleccionados: 5 atributos. Tasa acierto: 87,7 Otros Aspectos 41

42 Discusión En general, mejores resultados lo métodos que evalúan subconjuntos de atributos (filtro o envoltorio) pero Coste computacional Con k atributos, puede ser necesario considerar hasta k 2 subconjuntos Si envoltorio y validación cruzara repetida... Suponiendo validación cruzada con 10 particiones, sin repetir Si 100 atributos: 10 5 clasificadores! Buenos resultados en algunos conjuntos de datos En muchos empeora ligeramente la tasa de error, pero mayor eficacia computacional Curiosidad: Naïve Bayes Selectivo Naïve Bayes utilizando como medida el error de resubstitución; mejora su comportamiento en los conjuntos de datos donde se comporta peor, sin empeora los resultados donde NB se comporta bien. Otros Aspectos 42

43 2 Procesado de la salida 2.1 Combinación de modelos En general, la toma de decisiones mejora cuando se contrastan opiniones diversas Símil en aprendizaje Generar diversos modelos Combinar su salida Ventajas Generalmente, aumento importante precisión Inconveniente Modelos difíciles de comprender Otros Aspectos 43

44 2.2 Descomposición bias-varianza Análisis teórico origen del error de una hipótesis Suponer infinitos clasificadores, generados con infinitos conjuntos de entrenamiento independientes, de un tamaño dado infinitos conjuntos de prueba, independientes, de un tamaño dado Se identifican dos fuentes de error Bias: valor medio del error esperado. Está asociado al método de aprendizaje Varianza: valor medio del error debido al conjunto de entrenamiento usado en un escenario real Otros Aspectos 44

45 Descomposición bias-varianza Descomposición bias-varianza: el error esperado total de un clasificador es la suma de bias y varianza La combinación de clasificadores puede disminuir la componente varianza Dificultad práctica: generalmente no se dispone más que de un conjunto de entrenamiento Alternativa: manipular el conjunto de entrenamiento para generar distintas hipótesis Otros Aspectos 45

46 2.3 Bagging Combina distintas hipótesis por mayoría (media si regresión) Método más simple Todas las hipótesis igual peso Método ideal Obtener varios conjuntos de datos de tamaño n, independientes, aleatoriamente Construir un clasificador con cada conjunto Combinar las predicciones de los clasificadores Otros Aspectos 46

47 Bagging Bagging funciona porque reduce la componente varianza mediante voto Dificultad: en muchos casos sólo se dispone de un conjunto de entrenamiento Solución: generar distintos conjuntos de tamaño n muestreando con reemplazo Otros Aspectos 47

48 Esquema Bagging Conjunto Entrenamiento 1 Hipótesis 1 Predicción 1 Conjunto Entrenamiento Inicial Conjunto Entrenamiento 2 Algoritmo Aprendizaje Hipótesis 2 Predicción 2 Vot o Predicción Final Conjunto Entrenamiento k Hipótesis k Predicción k Otros Aspectos 48

49 Algoritmo Bagging Generación de modelos N número de instancias del conjunto de entrenamiento. Para cada cjto auxiliar a crear Obtener aleatoriamente N instancias con reemplazo del cjto de entrenamiento Aplicar el algoritmo de aprendizaje a dichas instancias Almacenar el modelo del resultado. Clasificación Para cada modelo generado: Predecir la clase de instancia usando el modelo Devolver la clase que aparece con más frecuencia Otros Aspectos 49

50 Discusión Bagging Particularmente efectivo con métodos inestables Pequeñas modificaciones del conjunto de datos provocan cambios importantes en la hipótesis (ej: árboles de decisión) Puede mejorar haciendo más inestable el método (ej: eliminando la poda) Ligera mejora si las hipótesis tienen asociada alguna medida de certeza: voto ponderado Generalmente, la tasa de error decrece con el nº de clasificadores, que puede llegar a ser muy grande (miles) En algunos casos patológicos, el error pueda aumentar No suele aumentar sobreajuste Puede ayudar con el ruido Otros Aspectos 50

51 Modelos estables Intuitivamente: la combinación de hipótesis funciona mejor si estas son diferentes Bagging: métodos inestables Alternativa: forzar la búsqueda de modelos que se complementen Boosting: buscar nuevos modelos para las instancias mal clasificadas por los anteriores Otros Aspectos 51

52 2.4 Boosting Combina múltiples hipótesis generadas con el mismo algoritmo de aprendizaje Asigna un peso a las hipótesis según su calidad Utiliza voto ponderado Método iterativo Los nuevos modelos se ven influenciados por el comportamiento de los anteriores Fuerza al algoritmo a centrarse en los ejemplos mal clasificados por las hipótesis anteriores Justificación: modelos complementarios Otros Aspectos 52

53 AdaBoost.M1 Asumir algoritmo aprendizaje puede manejar ejemplos ponderados Error: suma pesos ejemplos mal clasificados normalizado por peso todas las instancias Inicialmente, asignar igual peso a todas las instancias Crear hipótesis y calcular error resubstitución, e, 0 e 1. Si e 0, e<0,5 Modificar pesos ejemplos bien clasificados peso peso * e/(1-e) Normalizar Clasificación Peso hipótesis: -log [e/(1-e)] Sumar peso asignado a cada clase Otros Aspectos 53

54 Esquema Boosting Error Conjunto Inicial Peso i Conjunto Entrenamiento Algoritmo Aprendizaje Hipótesis i i Predicción(i) Predicción Final Otros Aspectos 54

55 Algoritmo AdaBoost.M1 Generación de modelos Para cada instancia i del conjunto de aprendizaje Asignar Pi Peso (mismo valor para todas) Para cada iteración t Aplicar el Algoritmo de aprendizaje al conjunto de aprendizaje ponderado Almacenar el resultado Calcular error e del modelo y almacenarlo Si (e == 0) or (e >= 0.5) Terminar la generación de modelos Para cada instancia i del conjunto de aprendizaje Si (i bien clasificada) e Pi = P i (1 e) Para cada instancia i del conjunto de aprendizaje Normalizar Pi Otros Aspectos 55

56 Algoritmo AdaBoost.M1 Generación de modelos Para cada instancia i del conjunto de aprendizaje Asignar Pi Peso (mismo valor para todas) Para cada iteración t Aplicar el Algoritmo de aprendizaje al conjunto de aprendizaje ponderado Almacenar el resultado Calcular error e del modelo y almacenarlo Si (e == 0) or (e >= 0.5) Terminar la generación de modelos Para cada instancia i del conjunto de aprendizaje Si (i bien clasificada) e Pi = P i (1 e) Para cada instancia i del conjunto de aprendizaje Normalizar Pi Otros Aspectos 56

57 Algoritmo AdaBoost.M1 Clasificación Para cada clase c Asignar peso Pc=0 Para cada modelo t Sumar -log [e/(1-e)] al peso de la clase predicha por el modelo Devolver la clase con el mayor peso Otros Aspectos 57

58 Discusión Boosting Necesita pesos Adaptar algoritmo de aprendizaje Muestreo con reemplazo según pesos Teóricamente: Error resubstitución decrece exponencialmente con ejemplos de entrenamiento Error verdadero disminuye si Clasificadores individuales no muy complejos Su error resubstitución no aumenta muy rápidamente Puede sobreajustar Otros Aspectos 58

59 Boosting y clasificadores base Clasificador base: clasificador que se construye en cada iteración Boosting funciona particularmente bien si los clasificadores base son simples Requisito clasificador base Error resubstitución < 50% También denominados clasificadores débiles Ejemplo paradigmático Boosting de stumps Otros Aspectos 59

60 Métodos híbridos Métodos homogéneos: combinan el mismo tipo de modelo Bagging, boosting Combinación: voto (ponderado) Métodos híbridos Combinan clasificadores de distinto tipo Reemplazan el mecanismo de voto Stacking, Cascading Otros Aspectos 60

61 2.5 Stacking Introduce el concepto de meta-aprendizaje para reemplazar el mecanismo de voto Meta-Aprendizaje: Nivel 0: Predicciones de los modelos base Nivel 1: Proporciona predicción final a partir de niveles 0 Nivel 0 Nivel 1 Algoritmo 1 Clasificador 1 Predicción 1 Fuente de Datos Algoritmo 2 Clasificador 2 Predicción 2 Algoritmo (Meta) Aprendizaje Predicción Final Predicción k Algoritmo k Clasificador k Otros Aspectos 61

62 Entrenamiento Stacking No se pueden usar las predicciones del nivel 0 para generar datos para entrenar nivel 1 Reservar datos para entrenamiento nivel 0, entrenamiento meta aprendiz, prueba Entrenar algoritmos nivel 0 con datos entrenamiento nivel 0 Clasificar con ellos las instancias de entrenamiento meta aprendiz y añadir clase: conjunto de entrenamiento nivel 1 Unir conjuntos entrenamiento 0 y meta aprendiz y generar nuevos clasificadores base -ligera mejora- Entrenar meta aprendiz con conjunto de nivel 1 Método habitual: validación cruzada (interna) Validación cruzada cada algoritmo nivel 0 Crear instancias nivel 1 con cada instancia de cada partición Permite al nivel-1 usar todos los ejemplos de entrenamiento Otros Aspectos 62

63 Discusión Stacking Algoritmos Nivel 0; cualquiera Nivel uno: modelos globales, suaves David Wolpert- Nivel 0 casi todo el trabajo, nivel 1 árbitro Justificación: reduce riesgos sobreajuste Modelos lineales: perceptrón, árboles con modelos lineales en los nodos hojas Pero: Naïve Bayes puede ir bien Menos popular que boosting, bagging Dificultad de análisis teórico: caja negra Múltiples variantes Se puede interpretar como una mejora (generalización) del método de votación Si los clasificadores base pueden generar medidas de certeza, suele funcionar mejor Otros Aspectos 63

64 Biboiografía Ethem Alpaydin. Introduction to Machine Learning. The MIT Press, 2004 Jiawei Hand and Micheline Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2nd edition, Pang-Ning Tan, Michael Steinbach, and Vipin Kumar. Introduction to Data Mining. Addison Wesley, I. H. Witten and E. Frank. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, 2nd edition, Otros Aspectos 64

PREPROCESADO DE DATOS PARA MINERIA DE DATOS

PREPROCESADO DE DATOS PARA MINERIA DE DATOS Ó 10.1007/978-3-319-02738-8-2. PREPROCESADO DE DATOS PARA MINERIA DE DATOS Miguel Cárdenas-Montes Frecuentemente las actividades de minería de datos suelen prestar poca atención a las actividades de procesado

Más detalles

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Introducción a los sistemas Multiclasificadores. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Introducción a los sistemas Multiclasificadores Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Combinación de modelos 2. Descomposición bias-varianza 3. Bagging

Más detalles

Análisis de Datos. Práctica de métodos predicción de en WEKA

Análisis de Datos. Práctica de métodos predicción de en WEKA SOLUCION 1. Características de los datos y filtros Una vez cargados los datos, aparece un cuadro resumen, Current relation, con el nombre de la relación que se indica en el fichero (en la línea @relation

Más detalles

Capítulo 12: Indexación y asociación

Capítulo 12: Indexación y asociación Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz Control Estadístico del Proceso Ing. Claudia Salguero Ing. Alvaro Díaz Control Estadístico del Proceso Es un conjunto de herramientas estadísticas que permiten recopilar, estudiar y analizar la información

Más detalles

Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones.

Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones. Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones. 2.1 Revisión sistema reconocimiento caracteres [9]: Un sistema de reconocimiento típicamente esta conformado por

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

Análisis y cuantificación del Riesgo

Análisis y cuantificación del Riesgo Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Parte I: Introducción

Parte I: Introducción Parte I: Introducción Introducción al Data Mining: su Aplicación a la Empresa Cursada 2007 POR QUÉ? Las empresas de todos los tamaños necesitan aprender de sus datos para crear una relación one-to-one

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

Análisis de componentes principales

Análisis de componentes principales Capítulo 2 Análisis de componentes principales 2.1. INTRODUCCIÓN El Análisis de componentes principales trata de describir las características principales de un conjunto de datos multivariantes, en los

Más detalles

Ingeniería en Informática

Ingeniería en Informática Departamento de Informática Universidad Carlos III de Madrid Ingeniería en Informática Aprendizaje Automático Junio 2007 Normas generales del examen El tiempo para realizar el examen es de 3 horas No se

Más detalles

TEMA 7: Análisis de la Capacidad del Proceso

TEMA 7: Análisis de la Capacidad del Proceso TEMA 7: Análisis de la Capacidad del Proceso 1 Introducción Índices de capacidad 3 Herramientas estadísticas para el análisis de la capacidad 4 Límites de tolerancia naturales 1 Introducción La capacidad

Más detalles

La calidad de los datos ha mejorado, se ha avanzado en la construcción de reglas de integridad.

La calidad de los datos ha mejorado, se ha avanzado en la construcción de reglas de integridad. MINERIA DE DATOS PREPROCESAMIENTO: LIMPIEZA Y TRANSFORMACIÓN El éxito de un proceso de minería de datos depende no sólo de tener todos los datos necesarios (una buena recopilación) sino de que éstos estén

Más detalles

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68. Departamento de Economía Aplicada: UDI de Estadística. Universidad Autónoma de Madrid Notas sobre el manejo de Excel para el análisis descriptivo y exploratorio de datos. (Descriptiva) 1 1 Introducción

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

MUESTREO TIPOS DE MUESTREO

MUESTREO TIPOS DE MUESTREO MUESTREO En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de

Más detalles

8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión...

8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión... Tema 8 Análisis de dos variables: dependencia estadística y regresión Contenido 8.1. Introducción............................. 1 8.2. Dependencia/independencia estadística.............. 2 8.3. Representación

Más detalles

SISTEMAS INTELIGENTES

SISTEMAS INTELIGENTES SISTEMAS INTELIGENTES T11: Métodos Kernel: Máquinas de vectores soporte {jdiez, juanjo} @ aic.uniovi.es Índice Funciones y métodos kernel Concepto: representación de datos Características y ventajas Funciones

Más detalles

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales Elkin García, Germán Mancera, Jorge Pacheco Presentación Los autores han desarrollado un método de clasificación de música a

Más detalles

7. Conclusiones. 7.1 Resultados

7. Conclusiones. 7.1 Resultados 7. Conclusiones Una de las preguntas iniciales de este proyecto fue : Cuál es la importancia de resolver problemas NP-Completos?. Puede concluirse que el PAV como problema NP- Completo permite comprobar

Más detalles

Sistemas de Recuperación de Información

Sistemas de Recuperación de Información Sistemas de Recuperación de Información Los SRI permiten el almacenamiento óptimo de grandes volúmenes de información y la recuperación eficiente de la información ante las consultas de los usuarios. La

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

CLASIFICACIÓN NO SUPERVISADA

CLASIFICACIÓN NO SUPERVISADA CLASIFICACIÓN NO SUPERVISADA CLASIFICACION IMPORTANCIA PROPÓSITO METODOLOGÍAS EXTRACTORES DE CARACTERÍSTICAS TIPOS DE CLASIFICACIÓN IMPORTANCIA CLASIFICAR HA SIDO, Y ES HOY DÍA, UN PROBLEMA FUNDAMENTAL

Más detalles

Metodología. del ajuste estacional. Tablero de Indicadores Económicos

Metodología. del ajuste estacional. Tablero de Indicadores Económicos Metodología del ajuste estacional Tablero de Indicadores Económicos Metodología del ajuste estacional Componentes de una serie de tiempo Las series de tiempo están constituidas por varios componentes que,

Más detalles

5.1. Redes de aprendizaje supervisado basadas en la cuantificación vectorial. Curso de doctoramiento Técnicas de Computación Flexíbeis

5.1. Redes de aprendizaje supervisado basadas en la cuantificación vectorial. Curso de doctoramiento Técnicas de Computación Flexíbeis 5.1. Redes de aprendizaje supervisado basadas en la cuantificación vectorial Curso de doctoramiento Técnicas de Computación Flexíbeis Learning Vector Quantization (LVQ) Versión supervisada de SOM (SOM

Más detalles

Covarianza y coeficiente de correlación

Covarianza y coeficiente de correlación Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también

Más detalles

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) VARIABLES Variable: característica de cada sujeto (cada caso) de una base de datos. Se denomina variable precisamente porque varía de sujeto a sujeto. Cada sujeto tiene un valor para cada variable. El

Más detalles

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de CAPITULO 4 JUSTIFICACION DEL ESTUDIO En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de estudios previos y los alcances que justifican el presente estudio. 4.1. Justificación.

Más detalles

Medidas de tendencia central o de posición: situación de los valores alrededor

Medidas de tendencia central o de posición: situación de los valores alrededor Tema 10: Medidas de posición y dispersión Una vez agrupados los datos en distribuciones de frecuencias, se calculan unos valores que sintetizan la información. Estudiaremos dos grandes secciones: Medidas

Más detalles

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid SVM: Máquinas de Vectores Soporte Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Clasificación lineal con modelos lineales 2. Regresión

Más detalles

LA MEDIDA Y SUS ERRORES

LA MEDIDA Y SUS ERRORES LA MEDIDA Y SUS ERRORES Magnitud, unidad y medida. Magnitud es todo aquello que se puede medir y que se puede representar por un número. Para obtener el número que representa a la magnitud debemos escoger

Más detalles

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas de Asociación Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas Proposicionales: Reglas de Clasificación Descripción de instancias:

Más detalles

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II BASE DE DATOS Comenzar presentación Base de datos Una base de datos (BD) o banco de datos es un conjunto

Más detalles

Algoritmos de minería de datos incluidos en SQL Server 2008 1. Algoritmo de árboles de decisión de Microsoft [MIC2009a] Cómo funciona el algoritmo

Algoritmos de minería de datos incluidos en SQL Server 2008 1. Algoritmo de árboles de decisión de Microsoft [MIC2009a] Cómo funciona el algoritmo 1 Algoritmos de minería de datos incluidos en SQL Server 2008 Los algoritmos que aquí se presentan son: Árboles de decisión de Microsoft, Bayes naive de Microsoft, Clústeres de Microsoft, Serie temporal

Más detalles

1.1. Introducción y conceptos básicos

1.1. Introducción y conceptos básicos Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................

Más detalles

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de

Más detalles

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones.

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones. TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones. La herramienta que nos indica si el proceso está o no controlado o Estado de Control son

Más detalles

Otras medidas descriptivas usuales

Otras medidas descriptivas usuales Tema 7 Otras medidas descriptivas usuales Contenido 7.1. Introducción............................. 1 7.2. Medidas robustas.......................... 2 7.2.1. Media recortada....................... 2 7.2.2.

Más detalles

Aplicaciones de Estadística Descriptiva

Aplicaciones de Estadística Descriptiva Aplicaciones de Estadística Descriptiva Contenidos de la presentación Funciones estadísticas en Excel. Gráficos. El módulo de análisis de datos y las tablas dinámicas de Excel. Información Intentaremos

Más detalles

CAPÍTULO 6 SIMULACIONES Y RESULTADOS

CAPÍTULO 6 SIMULACIONES Y RESULTADOS CAPÍTULO 6 SIMULACIONES Y RESULTADOS 6.1 Proceso de Simulación Las simulaciones fueros llevadas a cabo empleando como herramienta la Versión 6.5 Release 13 de Matlab. Para lo cual fue empleado un banco

Más detalles

Portafolios Eficientes para agentes con perspectiva Pesos

Portafolios Eficientes para agentes con perspectiva Pesos RenMax Sociedad de Bolsa S.A www.renmax.com.uy Publicado Diciembre 2005 Portafolios Eficientes para agentes con perspectiva Pesos Este artículo muestra que para un agente residente en Uruguay que consume

Más detalles

Análisis Estadístico de Datos Climáticos

Análisis Estadístico de Datos Climáticos Análisis Estadístico de Datos Climáticos Análisis de agrupamiento (o clusters) (Wilks, Cap. 14) Facultad de Ciencias Facultad de Ingeniería 2013 Objetivo Idear una clasificación o esquema de agrupación

Más detalles

Regulador PID con convertidores de frecuencia DF5, DV5, DF6, DV6. Página 1 de 10 A Regulador PID

Regulador PID con convertidores de frecuencia DF5, DV5, DF6, DV6. Página 1 de 10 A Regulador PID A Página 1 de 10 A Regulador PID INDICE 1. Regulador PID 3 2. Componente proporcional : P 4 3. Componente integral : I 4 4. Componente derivativa : D 4 5. Control PID 4 6. Configuración de parámetros del

Más detalles

Movimiento a través de una. José San Martín

Movimiento a través de una. José San Martín Movimiento a través de una curva José San Martín 1. Introducción Una vez definida la curva sobre la cual queremos movernos, el siguiente paso es definir ese movimiento. Este movimiento se realiza mediante

Más detalles

Minería de Datos. Preprocesamiento: Reducción de Datos - Discretización

Minería de Datos. Preprocesamiento: Reducción de Datos - Discretización Minería de Datos Preprocesamiento: Reducción de Datos - Discretización Dr. Edgar Acuña Departamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez E-mail: edgar.acuna@upr.edu, eacunaf@gmail.com

Más detalles

Random Forests. Felipe Parra

Random Forests. Felipe Parra Applied Mathematics Random Forests Abril 2014 Felipe Parra Por que Arboles para Clasificación PERFIL DE RIESGO: definir con qué nivel de aversión al riesgo se toman decisiones Interpretación intuitiva

Más detalles

Programación Genética

Programación Genética Programación Genética Programación Genética consiste en la evolución automática de programas usando ideas basadas en la selección natural (Darwin). No sólo se ha utilizado para generar programas, sino

Más detalles

Diagrama de Gantt en Excel

Diagrama de Gantt en Excel Diagrama de Gantt en Excel Si pensabas que crear un Diagrama de Gantt en Excel es complicado, en este artículo te mostramos que puede ser muy sencillo en realidad. Tan sólo necesitarás un par de trucos

Más detalles

Matemáticas 2º BTO Aplicadas a las Ciencias Sociales

Matemáticas 2º BTO Aplicadas a las Ciencias Sociales Matemáticas 2º BTO Aplicadas a las Ciencias Sociales CONVOCATORIA EXTRAORDINARIA DE JUNIO 2014 MÍNIMOS: No son contenidos mínimos los señalados como de ampliación. I. PROBABILIDAD Y ESTADÍSTICA UNIDAD

Más detalles

ANALISIS MULTIVARIANTE

ANALISIS MULTIVARIANTE ANALISIS MULTIVARIANTE Es un conjunto de técnicas que se utilizan cuando se trabaja sobre colecciones de datos en las cuáles hay muchas variables implicadas. Los principales problemas, en este contexto,

Más detalles

IDENTIFICACIÓN DE SISTEMAS ASPECTOS PRÁCTICOS EN IDENTIFICACIÓN

IDENTIFICACIÓN DE SISTEMAS ASPECTOS PRÁCTICOS EN IDENTIFICACIÓN IDENTIFICACIÓN DE SISTEMAS ASPECTOS PRÁCTICOS EN IDENTIFICACIÓN Ing. Fredy Ruiz Ph.D. ruizf@javeriana.edu.co Maestría en Ingeniería Electrónica Pontificia Universidad Javeriana 2013 CONSIDERACIONES PRÁCTICAS

Más detalles

Comunicaciones Digitales - Ejercicios Tema 3

Comunicaciones Digitales - Ejercicios Tema 3 Comunicaciones Digitales - Ejercicios Tema 3 007. 1. Considere el diagrama de rejilla para un canal discreto equivalente genérico con 4 coeficientes no nulos (memoria K p = 3) y una constelación -PAM.

Más detalles

La relación entre la altura de caída y el tiempo que tarda en rebotar 6 veces una pelota

La relación entre la altura de caída y el tiempo que tarda en rebotar 6 veces una pelota La relación entre la altura de caída y el tiempo que tarda en rebotar 6 veces una pelota INTRODUCCIÓN En este experimento voy a relacionar el tiempo que tarda una pelota en rebotar 6 veces desde distintas

Más detalles

Integración de Monte Carlo Técnicas Avanzadas de Gráficos en 3D

Integración de Monte Carlo Técnicas Avanzadas de Gráficos en 3D Integración de Monte Carlo Técnicas Avanzadas de Gráficos en 3D Miguel Ángel Otaduy 26 Abril 2010 Contexto Cálculo de la integral de radiancia reflejada en la ecuación de rendering Cálculo de la integral

Más detalles

CATÁLOGO DE INFERENCIAS

CATÁLOGO DE INFERENCIAS Las inferencias son los elementos claves en los modelos de conocimiento o Son los elementos constitutivos de los procesos de razonamiento No existe ningún estándar CommonKADS ofrece un catálogo que cubre

Más detalles

CARTAS DE CONTROL. FeGoSa

CARTAS DE CONTROL. FeGoSa Las empresas en general, ante la apertura comercial han venido reaccionando ante los cambios y situaciones adversas, reaccionan por ejemplo ante: Disminución de ventas Cancelación de pedidos Deterioro

Más detalles

Procesamiento Digital de Imágenes. Compresión de imágenes

Procesamiento Digital de Imágenes. Compresión de imágenes FICH, UNL - Departamento de Informática - Ingeniería Informática Procesamiento Digital de Imágenes Guía de Trabajos Prácticos 8 Compresión de imágenes 2010 1. Objetivos Analizar las características y el

Más detalles

TEMA 4: Introducción al Control Estadístico de Procesos

TEMA 4: Introducción al Control Estadístico de Procesos TEMA 4: Introducción al Control Estadístico de Procesos 1 Introducción 2 Base estadística del diagrama de control 3 Muestreo y agrupación de datos 4 Análisis de patrones en diagramas de control 1. Introducción

Más detalles

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido Tema 3 Medidas de tendencia central Contenido 31 Introducción 1 32 Media aritmética 2 33 Media ponderada 3 34 Media geométrica 4 35 Mediana 5 351 Cálculo de la mediana para datos agrupados 5 36 Moda 6

Más detalles

EJEMPLO DE REPORTE DE LIBERTAD FINANCIERA

EJEMPLO DE REPORTE DE LIBERTAD FINANCIERA EJEMPLO DE REPORTE DE LIBERTAD FINANCIERA 1. Introduccio n El propósito de este reporte es describir de manera detallada un diagnóstico de su habilidad para generar ingresos pasivos, es decir, ingresos

Más detalles

Redes de Kohonen y la Determinación Genética de las Clases

Redes de Kohonen y la Determinación Genética de las Clases Redes de Kohonen y la Determinación Genética de las Clases Angel Kuri Instituto Tecnológico Autónomo de México Octubre de 2001 Redes Neuronales de Kohonen Las Redes de Kohonen, también llamadas Mapas Auto-Organizados

Más detalles

Aprendizaje Computacional. Eduardo Morales y Jesús González

Aprendizaje Computacional. Eduardo Morales y Jesús González Aprendizaje Computacional Eduardo Morales y Jesús González Objetivo General La capacidad de aprender se considera como una de los atributos distintivos del ser humano y ha sido una de las principales áreas

Más detalles

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología La metodología para el desarrollo de software es un modo sistemático de realizar, gestionar y administrar un proyecto

Más detalles

Técnicas de valor presente para calcular el valor en uso

Técnicas de valor presente para calcular el valor en uso Normas Internacionales de Información Financiera NIC - NIIF Guía NIC - NIIF NIC 36 Fundación NIC-NIIF Técnicas de valor presente para calcular el valor en uso Este documento proporciona una guía para utilizar

Más detalles

2. LOS SISTEMAS DE COSTOS

2. LOS SISTEMAS DE COSTOS 2. LOS SISTEMAS DE COSTOS En el actual desarrollo de las técnicas y sistemas de costos se persiguen tres importantes objetivos: La medición de los costos, la más correcta y precisa asignación de costos

Más detalles

Introducción general a la compresión de datos multimedia

Introducción general a la compresión de datos multimedia Introducción general a la compresión de datos multimedia Necesidad de la compresión La mayoría de las aplicaciones multimedia requieren volúmenes importantes de almacenamiento y transmisión. CD-ROM 640

Más detalles

Prácticas PGSI. Práctica 4. Gestión de las Cargas de Trabajo de los Recursos y Delimitaciones de Tareas

Prácticas PGSI. Práctica 4. Gestión de las Cargas de Trabajo de los Recursos y Delimitaciones de Tareas Prácticas PGSI Práctica 4. Gestión de las Cargas de Trabajo de los Recursos y Delimitaciones de Tareas Introducción a la Programación con Recursos A medida que avanza la planificación se realizan ajustes

Más detalles

ANEXO IV ESTRUCTURA DEL SECTOR Y ACCESIBILIDAD A LA COMPETENCIA DEL SECTOR ELÉCTRICO. MEDICIÓN DE LA CONCENTRACIÓN

ANEXO IV ESTRUCTURA DEL SECTOR Y ACCESIBILIDAD A LA COMPETENCIA DEL SECTOR ELÉCTRICO. MEDICIÓN DE LA CONCENTRACIÓN ANEXO IV ESTRUCTURA DEL SECTOR Y ACCESIBILIDAD A LA COMPETENCIA DEL SECTOR ELÉCTRICO. MEDICIÓN DE LA CONCENTRACIÓN Informe sobre el proyecto de concentración consistente en la fusión de ENDESA, S.A. e

Más detalles

BREVE MANUAL DE SOLVER

BREVE MANUAL DE SOLVER BREVE MANUAL DE SOLVER PROFESOR: DAVID LAHOZ ARNEDO PROGRAMACIÓN LINEAL Definición: Un problema se define de programación lineal si se busca calcular el máximo o el mínimo de una función lineal, la relación

Más detalles

Excel 2010 Representación gráfica de datos

Excel 2010 Representación gráfica de datos Excel 2010 Representación gráfica de datos Contenido CONTENIDO... 1 CONCEPTO DE GRÁFICO... 2 CREACIÓN DE GRÁFICOS... 3 CREAR UN GRÁFICO EN EXCEL WEB APP... 13 ESTABLECER FORMATOS AL GRÁFICO... 16 1 Concepto

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE

CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE Capítulo 4 Algoritmos de Aprendizaje 26 CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE En este capítulo se proporcionan las descripciones matemáticas de los principales algoritmos de aprendizaje para redes neuronales:

Más detalles

Inteligencia de Negocio

Inteligencia de Negocio UNIVERSIDAD DE GRANADA E.T.S. de Ingenierías Informática y de Telecomunicación Departamento de Ciencias de la Computación e Inteligencia Artificial Inteligencia de Negocio Guión de Prácticas Práctica 1:

Más detalles

VI. TASA DE RETORNO REQUERIDA

VI. TASA DE RETORNO REQUERIDA VI. TASA DE RETORNO REQUERIDA 1. IMPORTANCIA 2. DEFINICIÓN Mínimo rendimiento aceptable de la inversión. Referencia para los administradores vs. los propietarios de la firma. La TRR de una inversión es

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

CONTROLADORES PID AJUSTE EMPÍRICO

CONTROLADORES PID AJUSTE EMPÍRICO CONTROLADORES PID AJUSTE EMPÍRICO Fernando Morilla García Dpto. de Informática y Automática ETSI de Informática, UNED Madrid 16 de febrero de 006 Contenido INTRODUCCIÓN AJUSTE POR PRUEBA Y ERROR AJUSTE

Más detalles

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/ Minería de Datos Web 1 er Cuatrimestre 2015 Página Web http://www.exa.unicen.edu.ar/catedras/ageinweb/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs. As., Argentina http://www.exa.unicen.edu.ar/~dgodoy

Más detalles

Métodos evolutivos de Optimización. Prof. Cesar de Prada Dpto. Ingeneiria de Sitemas y Automática Universidad de Valladolid

Métodos evolutivos de Optimización. Prof. Cesar de Prada Dpto. Ingeneiria de Sitemas y Automática Universidad de Valladolid Métodos evolutivos de Optimización Prof. Cesar de Prada Dpto. Ingeneiria de Sitemas y Automática Universidad de Valladolid Indice Introducción Método de Montecarlo Algoritmos genéticos Tabú Search Simulated

Más detalles

Ejercicio de estadística para 3º de la ESO

Ejercicio de estadística para 3º de la ESO Ejercicio de estadística para 3º de la ESO Unibelia La estadística es una disciplina técnica que se apoya en las matemáticas y que tiene como objetivo la interpretación de la realidad de una población

Más detalles

TRANSMISION DIGITAL. PCM, Modulación por Codificación de Pulsos

TRANSMISION DIGITAL. PCM, Modulación por Codificación de Pulsos MODULACIÓN TRANSMISION DIGITAL La amplia naturaleza de las señales analógicas es evidente, cualquier forma de onda está disponible con toda seguridad en el ámbito analógico, nos encontramos con una onda

Más detalles

ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES

ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES DE BÁSICA PRIMARIA EN LA CIUDAD DE PEREIRA José R. Bedoya Universidad Tecnológica de Pereira Pereira, Colombia La formación estadística en la ciudadanía,

Más detalles

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Amaro Camargo Erika, Reyes García Carlos A. Instituto Nacional de Astrofísica, Óptica

Más detalles

Media vs mediana vs moda Cual medida de tendencia central es mas adecuada? MEDIA conveniencias:

Media vs mediana vs moda Cual medida de tendencia central es mas adecuada? MEDIA conveniencias: Iniciar con las interpretaciones de las medidas MEDIA VS MEDIANA VS MODA CUAL ES LA MEDIDA ADECUADA TAREA MEDIA PONDERADA Actividad de Medidas de Localización Problema 1. El problema de las tasas de delito.

Más detalles

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

IAP 1005 - CONSIDERACIONES PARTICULARES SOBRE LA AUDITORÍA DE LAS EMPRESAS DE REDUCIDA DIMENSIÓN

IAP 1005 - CONSIDERACIONES PARTICULARES SOBRE LA AUDITORÍA DE LAS EMPRESAS DE REDUCIDA DIMENSIÓN IAP 1005 - CONSIDERACIONES PARTICULARES SOBRE LA AUDITORÍA DE LAS EMPRESAS DE REDUCIDA DIMENSIÓN Introducción 1. Las Normas Internacionales de Auditoría (NIA) se aplican a la auditoría de la información

Más detalles

REGRESION simple. Correlación Lineal:

REGRESION simple. Correlación Lineal: REGRESION simple Correlación Lineal: Dadas dos variable numéricas continuas X e Y, decimos que están correlacionadas si entre ambas variables hay cierta relación, de modo que puede predecirse (aproximadamente)

Más detalles

código Java Solicitudes Reportes AJI resultados API

código Java Solicitudes Reportes AJI resultados API Analizador Java Inteligente Agüero Martin Jorge, miembro IT-Lab de la Universidad de Palermo, agüero.marin@gmail.com López De Luise María Daniela, miembro IT-Lab de la Universidad de Palermo, mlopez74@palermo.edu

Más detalles

SAQQARA. Correlación avanzada y seguridad colaborativa_

SAQQARA. Correlación avanzada y seguridad colaborativa_ SAQQARA Correlación avanzada y seguridad colaborativa_ Tiene su seguridad 100% garantizada con su SIEM?_ Los SIEMs nos ayudan, pero su dependencia de los eventos y tecnologías, su reducida flexibilidad

Más detalles

Modelos estadísticos aplicados en administración de negocios que generan ventajas competitivas

Modelos estadísticos aplicados en administración de negocios que generan ventajas competitivas Modelos estadísticos aplicados en administración de negocios que generan ventajas competitivas Videoconferencias semana de estadística Universidad Latina, Campus Heredia Costa Rica Universidad del Valle

Más detalles

de la empresa Al finalizar la unidad, el alumno:

de la empresa Al finalizar la unidad, el alumno: de la empresa Al finalizar la unidad, el alumno: Identificará el concepto de rentabilidad. Identificará cómo afecta a una empresa la rentabilidad. Evaluará la rentabilidad de una empresa, mediante la aplicación

Más detalles

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas. El primer paso en el diseño de una base de datos es la producción del esquema conceptual. Normalmente, se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los

Más detalles

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL Objetivo terminal: Calcular e interpretar medidas de tendencia central para un conjunto de datos estadísticos. Objetivos específicos: 1. Mencionar las características

Más detalles

CAPÍTULO II MARCO TEÓRICO ADMNISTRACIÓN DE PROYECTOS CON CPM

CAPÍTULO II MARCO TEÓRICO ADMNISTRACIÓN DE PROYECTOS CON CPM CAPÍTULO II MARCO TEÓRICO ADMNISTRACIÓN DE PROYECTOS CON CPM 10 2.1 Introducción La dirección de un proyecto de gran magnitud no es una tarea fácil. Para los administradores este es uno de los trabajos

Más detalles

Aula Banca Privada. La importancia de la diversificación

Aula Banca Privada. La importancia de la diversificación Aula Banca Privada La importancia de la diversificación La importancia de la diversificación La diversificación de carteras es el principio básico de la operativa en mercados financieros, según el cual

Más detalles

MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL

MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL Las medias de tendencia central o posición nos indican donde se sitúa un dato dentro de una distribución de datos. Las medidas de dispersión, variabilidad o variación

Más detalles