EN SELECCIÓN GENÓMICA.

Tamaño: px
Comenzar la demostración a partir de la página:

Download "EN SELECCIÓN GENÓMICA. gonzalez.oscar@inia.es"

Transcripción

1 MACHINE LEARNING EN SELECCIÓN GENÓMICA Oscar González-Recio Oscar González Recio

2 COLABORADORES y AGRADECIMIENTOS. Broman D. Gianola C. Engelman.A. Weigel G.J.M. Rosa P. Van Raden N. Long. Van Tassell p G. Wiggans S. Avendaño T. Vega A. ranis G. de los Campos H. Naya E. López de Maturana

3 ÍNDICE Introducción Diseño de un sistema de aprendizaje Teoría de la información Regresiones no-paramétricas Regresion no-paramétrica simple RHS Ensemble methods ( Algoritmos de conjunto )

4 Aprendizaje Automático INTRODUCCIÓN Pueden pensar yaprender las máquinas? Aprendizaje = a) realizar cambios útiles en nuestra mente b) cambios en un sistema que nos permiten realizar una determinada tarea de forma más eficiente la próxima vez

5 Aprendizaje automático INTRODUCCIÓN Algoritmos eficientes en ciertas tareas de aprendizaje Ej: Reconocimiento de voz, juegos de estrategia (ajedrez), tratamiento de imágenes, búsquedas web, clasificación de constelaciones, o es, predicción meteorológica, o conducción automática de vehículos. DATA MINING aplicadas a grandes bases de datos (bancarios, financieros, médicos, bio-estadísticos) No va en contra del state of Nature Sí puede ser Bayesiano

6 Aprendizaje automático Campo multidisciplinar INTRODUCCIÓN Aplicado a genética animal, incluye Bio-Informática Estadística Genética cuantitativa Genética molecular Producción animal colaboración

7 Aprendizaje automático INTRODUCCIÓN Evita modelos paramétricos, rígidos yestrictos que puedan estar alejados de la realidad de las observaciones

8 INTRODUCCIÓN Aprendizaje automático (Mitchell) E (datos) T (algoritmo) P (comportamiento) Hay aprendizaje si T mejora P al observar E

9 INTRODUCCIÓN Aprendizaje automático (Elementos básicos) Experiencias o ejemplos (Features or instances) Tarea Medida de comportamiento E (datos) T (algoritmo) P (comportamiento)

10 INTRODUCCIÓN Dado: Una colección de Ejemplos de un concepto, clase, categoría ( ) Producir: Una descripción ió o ecuación (T) que cubra todos, o la mayoría de los ejemplos y que Prediga el valor, clase o categoría de futuros ejemplos

11 ÍNDICE Introducción Diseño de un sistema de aprendizaje Teoría de la información Regresiones no-paramétricas Regresion no-paramétrica simple RHS Ensemble methods ( Algoritmos de conjunto )

12 DISEÑO DE UN SISTEMA DE APRENDIZAJE Training/tunning/testing Datos (E) Validación cruzada tradicional (3-fold CV)

13 DISEÑO DE UN SISTEMA DE APRENDIZAJE Training/tuning/testing Datos (E) TRAINING SET TESTING SET TRAINING SET E (training set) tu uning set TESTING SET T (algoritmo) P (comportamiento en testing set) El tuning set realiza tareas de optimización de variables y parámetros del algoritmo necesarios para realizar las predicciones

14 DISEÑO DE UN SISTEMA DE APRENDIZAJE Antes de empezar: Preguntarnos que queremos responder Que situación cabe esperar Diseñar el training y el testing set en consecuencia

15 DISEÑO DE UN SISTEMA DE APRENDIZAJE Ejemplo (Weigel et al., JDS2009): Vacuno de leche. Generaciones solapadas. Objetivo actual de la selección genómica: PREDECIR EL VALOR GENÉTICO DE ANIMALES JÓVENES A REPRODUCTORES CON MAYOR FIABILIDAD 4703 toros genotipados ( ) 2002) con Illumina bovine 50 beadchip.

16 DISEÑO DE UN SISTEMA DE APRENDIZAJE Ejemplo (Weigel et al., JDS2009): E(3304 toros P(1398 toros nacidos antes T (algoritmo) nacidos despues de 1998) de 1999) 86% hijos de training set 71% nietos del training set La disponibilidad de fenotipos ygenotipos es continua (no se plantea número de generaciones sin fenotipar en las que la selección genómica es válida). Se usa información ió de todas las generaciones (o las más cercana) disponibles para estimar GBV-PTA.

17 DISEÑO DE UN SISTEMA DE APRENDIZAJE Ejemplo (Weigel et al., JDS2009): Predicción del PTA futuro ( y, yˆ), en baja densidad de marcadores (Utilizando Lasso Bayesiano-BL). Selección de 300, 500, 750, 1000, 1250, 1500 y 2000 SNP a) Equidistantes b) Mayor efecto en valor absoluto (media posterior de la estima del coeficiente de regresión) en un análisis previo usando BL con los SNPs. BL con SNPs como referencia

18 DISEÑO DE UN SISTEMA DE APRENDIZAJE Ejemplo (Weigel et al., JDS2009): Altas fiabilidades incluso a lo largo de varias generaciones (fuerte LD, o estructuras genómicas familiares que se mantienen a lo largo de varias generaciones).

19 ÍNDICE Introducción Diseño de un sistema de aprendizaje Teoría de la información Regresiones no-paramétricas Regresion no-paramétrica simple RHS Ensemble methods ( Algoritmos de conjunto )

20 Entropía Teoría de la información Medida de incertidumbre asociada a variables aleatorias (C.E. Shannon, 1948) H(Pr(Y)) = y A Pr(y)log 2 Pr(y) Ver también Long et al. (2007)

21 Teoría de la información Ganancia de información ió Diferencia en entropia de una distribución de probabilidad antes y después de observar los genotipos (i.e. cuanta incertidumbre de la distribucion ib i de los fenotipos se reduce al observar los genotipos de un SNP). N + y N - son el numero de individuos en cada categoria (casos/controles; mejores/peores; mejores/medios/peores)

22 EJEMPLO: Teoría de la información Análisis de asociación con genoma completo en artritis reumatoide en humanos (Gonzalez-Recio et al., 2009) Datos del Consorcio Norteamericano para la Artritis Reumatoide (Plenge et al., 2007). 868 casos y controles Individuos genotipados con el chip 500 Illumina ( SNPs). Objetivo: Reducción de dimensionalidad i d del genotipado para posterior analísis de interacción gen x gen ( x10 6 interacciones potenciales)

23 Teoría de la información Análisis de asociación con genoma completo en artritis reumatoide en humanos (Gonzalez-Recio et al., 2009)

24 Teoría de la información 100 SNPs fuera del HLA (Percentile 99.65) En HLA seleccionamos SNPs (de 1.323) usando wrapper Wrapper: Realiza una selección de SNPs (Ejemplos, covariables) realizando una búsqueda para un set óptimo de SNPs para la clasificación de la variable dependiente (Clasificador Naïve Bayes ) (Long et al., 2007). Ejemplo: Análisis i de asociación ió con genoma completo en artritis reumatoide en humanos (González-Recio et al., 2009)

25 Teoría de la información Ejemplo: Análisis de asociación con genoma completo en artritis reumatoide en humanos (Gonzalez-Recio et al., 2009)

26 Teoría de la información 100 SNPs fuera del HLA (Percentile 99.65) 6 HLA-SNPs seleccionados por el wrapper (de 1.323) Lasso Umbral Bayesiano: Efectos mayores de los 106 SNPs e Interacciones HLA-nonHLA (2.560 efectos) Ejemplo: Análisis de asociación con genoma completo en artritis reumatoide en humanos (Gonzalez-Recio et al., 2009)

27 Teoría de la información Ejemplo: Análisis i de asociación ió con genoma completo en artritis reumatoide en humanos (Gonzalez-Recio et al., 2009)

28 Teoría de la información Ejemplo 2: Predicción de la eficacia de transformación de alimento en broilers (González- Recio et al., 2009). Animales genotipados para 4505 SNPs Selección de 400 SNPs utilizando ganancia de información. FCR Clasificación de individuos según 2 o 3 clases y diferentes percentiles. α= {0.025, , 0.125, 0.15, 0.175, 0.20} Clase media: α= ( )

29 Teoría de la información Ejemplo 2: Eficacia de transformación de alimento en broilers (González-Recio et al., 2009)

30 Limitaciones Teoría de la información Se considera únicamente la información de un SNP, sin tener en cuenta el resto. Se pueden inferir haplotipos (Chanda et al., 2009; Schulz et al., 2009) Necesario clasificar fenotipos. A veces no es fácil el diagnostico.

31 ÍNDICE Introducción Diseño de un sistema de aprendizaje Teoría de la información Regresiones no-paramétricas Regresion no-paramétrica simple RHS Ensemble methods ( Algoritmos de conjunto )

32 Ejemplo: Regresión no-paramétrica simple regresion no paramétrica -4-2 y x

33 Regresión no-paramétrica simple ernel regression y = g( x ) + e i (1,..., n) i i i x i codificación del genotipo del animal i e = e } { i residuos g( x i ) función desconocida que relaciona la variable x (genotipo) del animal i, que representa el valor fenotípico esperado de los animales con dicho genotipo 33

34 Regresión no-paramétrica simple ernel regression y = g( x ) + e i (1,..., n) i i i Nadaraya-Watson estimator (Nadaraya, 1964; Watson, 1964) g( x i ) = g(x) =conditional expectation function. g ( x ) = n 1 yp ( xi, y) ) dy y j h ( X x j ) q nh j= 1 n 1 p (x i ) h ( X x j ) q nh j= 1 yp( x, y) dy p( x)

35 ERNELs. El otro lado... Son funciones que miden similitud ili entre dos ejemplos (x i, x j ) Determina distancias no lineales en el espacio de las características feature space Se pueden formular como el producto escalar en un determinado espacio.

36 Partes básicas de un kernel: ERNELs. h ( x i, x j ) = f ( h 1 dist( x i, x j )) f es una determinada función dist(x( i,x j ) es la distancia i o similitud ili entre los ejemplos x i y x j (genotipos) h es un parámetro optimizable tuneable que regulariza la medida de similitud

37 Ejemplos de kernel: ernel gaussiano ernel triangular ERNELs. h h ( x i, x j ) = exp( h 1 ( x i x ( xi, x j ) = h (1 xi x j )1 j ) 2 x i x j ) ernel Epanechnikov h( xi, x j ) (1 h ( xi x j ) ) 1{( x i x ) 1} = j La regresion es lineal en los kernels, pero puede no ser lineal en el espacio original si el kernel es una función NO lineal (Representación dual; ver Gianola y Van aam, 2008; Wahba 1990,1999). 1999) 4

38 ERNELs. Optimización del parámetro h: ernel gaussiano 2 ( xi x j ) ( x, x ) = exp( ) h= 0.01 h= 100 h i j h Frequency Frequency 4e+04 8e Frequency h= e Individuos emparentados, valor próximo a 1. Individuos no emparentados valor próximo a 0

39 y Frequency Regresión no-paramétrica simple Optimización del parámetro h h= 0.01 Over fitting h= 100 Over smooth quency Freq 04 8e+04 0e+00 4e Frequency h= 3 Parámetro á t h optimizado i

40 Regresión NO-Paramétrica. RADIAL BASIS FUNCTIONS (RBF) Long et al. (2009) Función de kernel radial, no lineal Regresión sobre mega-snps (clusters) Diferente (RBF I) o igual (RBF II) peso (parámetro h) para el kernel de cada mega-snp.

41 REPRODUCING ERNEL HILBERT SPACES (Gianola et al., 2006; Gianola and Van aam, 2008; González-Recio et al., 2008) Espacios de Hilbert con núcleo reproducible. RHS J 1 1 λ 2 [ g( x) λ ] = 2[ y Xβ g( x)] R [ y Xβ g( x)] + 2 g( x) H λ añade variablidad. 2 g( x) H Es una norma en

42 RHS ) ( )] ( [ )] ( [ ] ) ( [ H g g g g J x x X β y R x X β y x 1 λ λ + = α α k k X h h h g ) ( ) ( ) ( 1 M ],...,, [ 1 0 = q α α α α α α k k X h j h h h g = = ) ( ) ( ) ( M =... ), (... ), ( ), ( ), ( j i h n h j h h h x x x x x x x x k q h ) ( ), ( ), ( ), ( ), ( 1 n n h j n h n h j i h h x x x x x x ) (0, ~, 1 1 λ λ h N h α ~ υ α α υ α χ λ s ) (0, ~ R e N ~ e e e e s υ χ υ σ

43 RHS Expresado en forma matricial X' R hr y = µ 1 + Xβ + α + e ' ˆ β αˆ X X X R h λ,hh = 1 1 X 1 1 hr h + 1 λ h λ,h X' R hr y y =matriz de kernels que mide similitud genómica entre individuos en un espacio no Euclideano α =vector de coeficientes no paramétricos λ -1 es la varianza de los coeficientes no paramétricos

44 RHS Matriz de ernels () Individuos (1,t) (1,n) viduos Indiv debe ser semidefinida positiva h ( xi, x j )

45 RHS Equivalencia (reparametrización) (De los Campos et al., 2009) α u GEBV ˆ ˆ = = (1) (2) = + y Z X y u Z Z X Z X Z X X ' ˆ ˆ ' ' λ,h λ,h h e β λ σ = + y R y X R α R X R X R X X R 1 1 h λ,h λ,h h h h h h ' ˆ ˆ ' ' β λ (1) (2) Por conveniencia se usa (1), ya que invertir puede no ser trivial

46 Capacidad predictiva en el carácter mortalidad en broilers (González-Recio et al., GENETICS2008) Predicción del caracter mortalidad en broilers bajo condiciones sanitarias suboptimas. 24 SNPs seleccionados por Long et al. (2007) Métodos BLUP Bayesiano (E-BLUP) Regresión sobre marcadores (LR) ernel regression (kernel trinomial) RHS (kernel exponencial similitud de secuencias) Regresión Bayesiana 5-fold CV en la misma población

47 Capacidad predictiva en el carácter mortalidad en broilers (González-Recio et al., GENETICS2008) 24 SNPs seleccionados por Long et al. (2007) 5-fold CV en la misma población Mejor capacidad predictiva con RHS 200% mayor fiabilidad que BLUP 300% mayor fiabilidad que LR En general, los métodos noparamétricos mejor comportamiento que la regresión lineal Resultados más estables con la regresión Bayesiana.

48 Capacidad predictiva en el carácter FCR en broilers (González-Recio et al., GSE2009) Ejemplo 2: Predicción de la eficacia de transformación de alimento en broilers (González- Recio et al., 2009). Animales genotipados para 4505 SNPs Predicción en futuras generaciones (2-fold CV) Métodos Índice de pedigrí Bayes A RHS

49 Capacidad predictiva en el carácter FCR en broilers (González-Recio et al., GSE2009) Ejemplo 2: Predicción de la eficacia de transformación de alimento en broilers (González-Recio et al., 2009). Animales genotipados para 4505 SNPs Selección de 400 SNPs utilizando ganancia de información. 2-fold CV en generaciones diferentes

50 ÍNDICE Introducción Diseño de un sistema de aprendizaje Teoría de la información Regresiones no-paramétricas Regresion no-paramétrica simple RHS Ensemble methods ( Algoritmos de conjunto )

51 Algoritmos de conjunto (Ensemble methods) Combinación ió de modelos (generalmente sencillos). Forman un comité. Juntos poseen mayor capacidad predictiva que por separado. Poseen propiedades estadísticas conocidas. No son cajas negras. Más usados: Bagging (Breiman, 1996) Boosting (Freund and Schapire 1995, 1996)

52 Algoritmos de conjunto (Ensemble methods) Bagging (Breiman, 1996) Bootstrap aggregating Set de datos Ψ = (y, y X ) 1. Realizamos B muestreos con reposición, generando B nuevos sets de datos. Ψ (b) b=(1,,b) 2. Aplicamos el método de elección sobre los B sets. 3. Promediamos las soluciones.

53 BAGGING Reduce los errores de predicción en un factor 1/B al promediar errores Limitación: i ió se asume independencia d i entre los residuos.

54 BAGGING. Ejemplo. Vida productiva (PL PTA) en vacuno de leche E(3304 toros P(1398 toros nacidos antes T (algoritmo) nacidos despues de 1998) de 1999) 86% hijos de training set 71% nietos del training set LASSO Bayesiano utilizando 500, 1000, 1500 o 2000 SNPs seleccionados por ganancia de información. Predicción en futuras generaciones Bagging sobre LASSO Bayesiano

55 BAGGING Correlación de Pearson ( y, yˆ) en testing set

56 BAGGING Ofrece mayores ventajas cuanto más ruido hay en los datos (reducido número de datos, baja densidad de marcadores,,poblaciones pequeñas, ). Puede mejorar, dificilmente empeorar las predicciones.

57 Algoritmos de conjunto (Ensemble methods) Boosting (Freund and Schapire, 1995, 1996) Las predicciones se realizan a través de un conjunto de predictores o learners que aprenden del comportamiento de los anteriores Originalmente se usó en problemas de clasificación (AdaBoost). Friedman lo extendió a problemas de regresión en 2001.

58 Algoritmos de conjunto (Ensemble methods) Boosting (Freund and Schapire, 1995, 1996) Es uno de los métodos más potentes introducido en el campo del machine learning en los últimos 20 años. Utiliza regresores débiles weak learners, que son aquellos cuyo comportamiento es algo mejor que la asignación aleatoria.

59 BOOSTING Como funciona en problemas de regresión: E (datos) g (x) x 0 r 1 (residuos) g 1 ( x) r 2 (residuos) g ( ) 2 x g m (x) Weak learner i = r m+1 (residuos) yˆ = m i 1 w g i Variable de contracción i ( x) En problemas de clasificación los residuos se sustituyen por una ponderación de las observaciones

60 BOOSTING De gran utilidad para problemas de p>>n. Bühlmann y Yu (2003), con función L2 de pérdidas y realizando selección de covariables Se pueden interpretar como técnicas de descenso de gradiente y también como secuencias de espacios de Hilbert.

61 BOOSTING Como funciona en problemas de gran dimensionalidad (Selección Genómica): 1Iiili 1. Inicialización. ió m=0. 0Dd Dado y, asignamos r m =y 2. Incrementamos m en 1 unidad. Ajustamos el weak learner a r m con cada uno de los SNPs por separado r m =g m (x p )+e 3. Búsqueda unidimensional del SNP p que mejor ajusta los datos (mejor predictor), donde n p = arg min ( r i m x i= 1 2, i, p ) 4. Actualizamos r m+1 = r m -g m (x p ), y se repiten los pasos 2-4 hasta alcanzar un criterio de convergencia.

62 BOOSTING (González-Recio et al., en revisión) Vida productiva (PTA) en vacuno de leche E(3304 toros P(1398 toros nacidos antes T (algoritmo) nacidos despues de 1998) de 1999) Bayesian LASSO vs L 2 -Boosting 86% hijos de training set 71% nietos del training set

63 BOOSTING (González-Recio et al., en revisión) MSE en training set (Inferencia)

64 MSE en testing set BOOSTING (González-Recio et al., en revisión)

65 BOOSTING (González-Recio et al., en revisión) MSE en testing set (Predicción)

66 BOOSTING (González-Recio et al., en revisión) Correlación de Pearson ( y, yˆ ) cor ( y, y ˆ) BL (32611) 0.66 OLS-Boost(1330) 0.63 BL (1330) NP-Boost (92) 0.45 BL (92) 0.39

67 BOOSTING Gran capacidad predictiva Prometedor método en estudios de asociación con genoma completo y selección genómica Eficiente en la selección de SNPs y reducción de la dimensionalidad del problema

68 RESUMEN A tener en cuenta

69 Machine Learning Puede usarse en GWAS y en selección genómica. Permite tratar grandes cantidades de genotipos de manera más flexible, sin tener que hacer asunciones alejadas de la realidad. Alta capacidad predictiva para el comportamiento de futuras generaciones. O. Gonzalez-Recio Machine Learning en selección genómica.

70 Machine Learning en SELECCIÓN GENÓMICA Centrarse en el comportamiento de los métodos: capacidad predictiva. Importancia del diseño del sistema de aprendizaje Validación cruzada. Diseño que se ajuste a la realidad y al problema que queremos resolver. Importancia de usar fenotipos y genotipos de nuestras poblaciones. Conclusiones sacadas de problemas y sistemas biológicos que nos ocupan. O. Gonzalez-Recio Machine Learning en selección genómica.

71 SELECCIÓN GENÓMICA Genotipado de una población es caro. Diseño de genotipado que optimice recursos. Genotipado secuencial. Enfásis en el diseño del primer genotipado (uso del chip más caro). Mucho por hacer (investigación y aplicación). Genotipar poblaciones y aprender de ellas (colaboración y uniónde recursos). <1% del conocimiento? --> Necesitario seguir investigando para mejorar el conocimiento i de los sistemas genéticos y las posibilidades d de la selección genómica. O. Gonzalez-Recio Machine Learning en selección genómica.

72 FUTURO Prometedor Nutrigenómica Proteómica Epigenética Medicina personalizada SELECCIÓN GENÓMICA Acoplamientos genómicos Genomica aplicada a sistemas productivos Otras nuevas tecnologías o conocimientos en unos años Nuevas eras Nuevos métodos Nuevas estrategias avanzar O. Gonzalez-Recio Machine Learning en selección genómica.

73 Bibliografía Breiman, L, 1996 Bagging predictors. Machine Learning 24: Bühlmann, P, B. Yu, 2003 Boosting with the L2 loss: regression and classification. J. Amer. Statist. Assoc. 98: Freund, Y., R. E. Schapire, 1996 Experiments with a new boosting algorithm. In L Saitta (Ed.) Thirteen International conference on Machine Learning, pp Morgan aufmann. Gianola, D., R.L. Fernando, A. Stella, 2006 Genomic-assisted prediction of genetic value with semiparametric procedures. Genetics 173: Gonzalez-Recio O., D. Gianola, N. Long,.A. Weigel, G.J.M. Rosa, S. Avendaño, 2008 Nonparametric methods for incorporating genomic information into genetic evaluations: An application to mortality in broilers. Genetics 178: Gonzalez-Recio O., D. Gianola, G.J.M. Rosa,.A. Weigel, A. ranis, 2009 Genome-assisted prediction of a quantitative trait measured in parents and progeny: application to food conversion rate in chickens. Genetics Selection Evolution 41: 3. Gonzalez-Recio O.,.A. Weigel, D. Gianola, H. Naya, G.J.M. Rosa, en revision L2 Boosting to reduce dimensionality in genomic selection. Genetics. González-Recio O., E. Lopez de Maturana, T. Vega,. Broman, C. Engelman, 2009 Detecting SNP by SNP interactions in rheumatoid arthritis using a two step approach with Machine learning and a Bayesian Threshold LASSO model. BMC GENETICS, (Aceptado) Long, N., D. Gianola, GJM. Rosa, A. Weigel, S. Avendaño, 2007 Machine learning classification procedure for selecting SNPs in genomic selection: Application i to early mortality in broilers. J. Anim. Breed. Genet. 124 (6): Long N, D. Gianola, GJM. Rosa, A. Weigel, A. ranis, O. Gonzalez-Recio. Radial basis function regression methods for predicting quantitative traits using SNP markers.(accepted) Nadaraya, E.A., 1964 On estimating regression. Theor. Probab. Appl. 9: Watson, G. S., 1964 Smooth regression analysis. Sankhya A 26: Weigel,. A., G. de los Campos, O. González-Recio, H. Naya, X. L. Wu, N. Long, G.J.M. Rosa, D. Gianola, 2009 Predictive ability of genomic breeding values computed from selected subsets of single nucleotide polymorphism markers for lifetime net merit in Holstein cattle. J. Dairy Sci. 92:

74 Bibliografía Libros: Bishop Mitchell Hastie,Tibshirani&Friedman

MÁQUINA DE VECTORES DE SOPORTE

MÁQUINA DE VECTORES DE SOPORTE MÁQUINA DE VECTORES DE SOPORTE La teoría de las (SVM por su nombre en inglés Support Vector Machine) fue desarrollada por Vapnik basado en la idea de minimización del riesgo estructural (SRM). Algunas

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

ANÁLISIS DISCRIMINANTE

ANÁLISIS DISCRIMINANTE ANÁLISIS DISCRIMINANTE ANÁLISIS DISCRIMINANTE 1. Introducción 2. Etapas 3. Caso práctico Análisis de dependencias introducción varias relaciones una relación 1 variable dependiente > 1 variable dependiente

Más detalles

Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos

Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos I. Barbona - Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos Comparison among

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

Técnicas Multivariadas Avanzadas

Técnicas Multivariadas Avanzadas Regresión lineal Universidad Nacional Agraria La Molina 2014-2 Regresión lineal Regresión lineal simple Estimando los coecientes Evaluando la precisión de los coecientes estimados Evaluando la precisión

Más detalles

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid SVM: Máquinas de Vectores Soporte Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Clasificación lineal con modelos lineales 2. Regresión

Más detalles

Técnicas Cuantitativas para el Management y los Negocios

Técnicas Cuantitativas para el Management y los Negocios Segundo cuatrimestre - 4 Técnicas Cuantitativas para el Management y los Negocios Mag. María del Carmen Romero 4 romero@econ.unicen.edu.ar Módulo III: APLICACIONES Contenidos Módulo III Unidad 9. Análisis

Más detalles

Selección Genómica: Una Nueva Era para la Producción Porcina

Selección Genómica: Una Nueva Era para la Producción Porcina Selección Genómica: Una Nueva Era para la Producción Porcina Dr. Armand Sánchez. Director de Vetgenomics S.L. Universidad Autónoma de Barcelona 1-3 octubre 2013 - Isla de A Toxa - España El futuro de las

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Clasificación Bayesiana de textos y páginas web

Clasificación Bayesiana de textos y páginas web Clasificación Bayesiana de textos y páginas web Curso de doctorado: Ingeniería Lingüística aplicada al Procesamiento de Documentos Víctor Fresno Fernández Introducción Enorme cantidad de información en

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

SISTEMAS INTELIGENTES

SISTEMAS INTELIGENTES SISTEMAS INTELIGENTES T11: Métodos Kernel: Máquinas de vectores soporte {jdiez, juanjo} @ aic.uniovi.es Índice Funciones y métodos kernel Concepto: representación de datos Características y ventajas Funciones

Más detalles

EL FILTRO DE KALMAN. Resumen

EL FILTRO DE KALMAN. Resumen EL FILTRO DE KALMAN Carlos Pillajo Universidad Politécnica Salesiana - Ecuador cpillajo@ups.edu.ec Javier E. Sierra Universidad Pontificia Bolivariana Colombia javier.sierra@upb.edu.co Resumen El filtro

Más detalles

EPD Genómico: El próximo Salto Tecnológico

EPD Genómico: El próximo Salto Tecnológico EPD Genómico: El próximo Salto Tecnológico Ing. Agr. Olga Ravagnolo, Ing. Agr. Ignacio Aguilar, Ing. Agr. Gabriel Ciappesoni, Ing. Agr. Fabio Montossi Programa Nacional de Carne y Lana, INIA Introducción

Más detalles

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Amaro Camargo Erika, Reyes García Carlos A. Instituto Nacional de Astrofísica, Óptica

Más detalles

Métodos de agregación de modelos y aplicaciones

Métodos de agregación de modelos y aplicaciones Métodos de agregación de modelos y aplicaciones Model aggregation methods and applications Mathias Bourel 1 Recibido: Mayo 2012 Aprobado: Agosto 2012 Resumen.- Los métodos de agregación de modelos en aprendizaje

Más detalles

CURSO ESTADÍSTICA APLICADA CON R

CURSO ESTADÍSTICA APLICADA CON R CURSO ESTADÍSTICA APLICADA CON R Organizado por: Instituto IMDEA Alimentación Facultad de Ciencias de la Universidad Autónoma de Madrid MADRID, de Septiembre a Diciembre de 2015 Estadística Aplicada con

Más detalles

Línea de trabajo: Control de los Procesos de Manufactura Optimización de los Procesos de Manufactura 48 20 100 168-6

Línea de trabajo: Control de los Procesos de Manufactura Optimización de los Procesos de Manufactura 48 20 100 168-6 Nombre de la asignatura: ESTADISTICA MULTIVARIADA Línea de trabajo: Control de los Procesos de Manufactura Optimización de los Procesos de Manufactura 48 20 100 168-6 DOC: Docencia; TIS: Trabajo Independiente

Más detalles

ESTADÍSTICA. [análisis regresivo]

ESTADÍSTICA. [análisis regresivo] ESTADÍSTICA wikipedia.com la estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo

Más detalles

Aprendizaje Computacional. Eduardo Morales y Jesús González

Aprendizaje Computacional. Eduardo Morales y Jesús González Aprendizaje Computacional Eduardo Morales y Jesús González Objetivo General La capacidad de aprender se considera como una de los atributos distintivos del ser humano y ha sido una de las principales áreas

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Desarrollo de un nuevo algoritmo para resolver programas lineales enteros y su aplicación práctica en el desarrollo económico.

Desarrollo de un nuevo algoritmo para resolver programas lineales enteros y su aplicación práctica en el desarrollo económico. Desarrollo de un nuevo algoritmo para resolver programas lineales enteros y su aplicación práctica en el desarrollo económico. 7071 Febrero, 2014 Resumen Es importante señalar que en un entorno social

Más detalles

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013 VivaMéxico sin PRI Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres Facultad de Ciencias de la Computación Benemérita Universidad Autónoma de Puebla Otoño 2013 IMAGENESpemexmorena Adquisición

Más detalles

Minería de datos (Introducción a la minería de datos)

Minería de datos (Introducción a la minería de datos) Minería de datos (Introducción a la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 14-I. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 24

Más detalles

Random Forests. Felipe Parra

Random Forests. Felipe Parra Applied Mathematics Random Forests Abril 2014 Felipe Parra Por que Arboles para Clasificación PERFIL DE RIESGO: definir con qué nivel de aversión al riesgo se toman decisiones Interpretación intuitiva

Más detalles

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3 Capítulo 3 1. Introducción El análisis de regresión lineal, en general, nos permite obtener una función lineal de una o más variables independientes o predictoras (X1, X2,... XK) a partir de la cual explicar

Más detalles

Universidad del CEMA Master en Finanzas 2006

Universidad del CEMA Master en Finanzas 2006 Universidad del CEMA Master en Finanzas 2006 La Simulación como una herramienta para el manejo de la incertidumbre Fabián Fiorito ffiorito@invertironline.com Tel.: 4000-1400 Hoy en día la simulación es

Más detalles

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11 Tema 5 Análisis de regresión (segunda parte) Estadística II, 2010/11 Contenidos 5.1: Diagnóstico: Análisis de los residuos 5.2: La descomposición ANOVA (ANalysis Of VAriance) 5.3: Relaciones no lineales

Más detalles

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión.

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión. TEMA 9 TÉCNICAS DE INTELIGENCIA ARTIFICIAL PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de

Más detalles

Modelos predictivos de producción de energías renovables

Modelos predictivos de producción de energías renovables Modelos predictivos de producción de energías renovables José R. Dorronsoro, IIC-UAM IIC 2012 www.iic.uam.es 1 Misión Centro de Investigación + Desarrollo + innovación. Creado en 1989 por ADIC (Asociación

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

Otros aspectos. Procesado de la entrada Procesado de la salida. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Otros aspectos. Procesado de la entrada Procesado de la salida. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Otros aspectos Procesado de la entrada Procesado de la salida Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Procesado de la entrada 1. Motivación y tareas

Más detalles

Tema 5. Reconocimiento de patrones

Tema 5. Reconocimiento de patrones Tema 5. Reconocimiento de patrones Introducción al reconocimiento de patrones y a la clasificación de formas Un modelo de general de clasificador Características discriminantes Tipos de clasificación Clasificadores

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 2 - Juan Alfonso Lara Torralbo 1 Índice de contenidos (I) Introducción a Data Mining Actividad. Tipos

Más detalles

Redes de Kohonen y la Determinación Genética de las Clases

Redes de Kohonen y la Determinación Genética de las Clases Redes de Kohonen y la Determinación Genética de las Clases Angel Kuri Instituto Tecnológico Autónomo de México Octubre de 2001 Redes Neuronales de Kohonen Las Redes de Kohonen, también llamadas Mapas Auto-Organizados

Más detalles

Decidir cuándo autenticar en dispositivos móviles a partir de modelos de machine learning 1

Decidir cuándo autenticar en dispositivos móviles a partir de modelos de machine learning 1 Decidir cuándo autenticar en dispositivos móviles a partir de modelos de machine learning 1 En los dispositivos móviles como tablets o teléfonos celulares se tiene la opción de implementar o no un sistemas

Más detalles

Text Mining Introducción a Minería de Datos

Text Mining Introducción a Minería de Datos Text Mining Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 12 de Marzo de 2008 qué es la minería de datos? A technique using software tools

Más detalles

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1 ÍNDICE Introducción... XV Capítulo 1. El concepto de Data Mining... 1 Introducción... 1 Una definición de Data Mining... 3 El proceso de Data Mining... 6 Selección de objetivos... 8 La preparación de los

Más detalles

El Análisis de la Regresión a través de SPSS

El Análisis de la Regresión a través de SPSS El Análisis de la Regresión a través de SPSS M. D olores M artínez M iranda Profesora del D pto. E stadística e I.O. U niversidad de G ranada Referencias bibliográficas. Hair, J.F., Anderson, R.E., Tatham,

Más detalles

Análisis de Regresión y Correlación con MINITAB

Análisis de Regresión y Correlación con MINITAB Análisis de Regresión y Correlación con MINITAB Primeras definiciones y conceptos de la regresión El análisis de la regresión es una técnica estadística que se utiliza para estudiar la relación entre variables

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Escuela de Medicina Veterinaria, Universidad Nacional

Escuela de Medicina Veterinaria, Universidad Nacional Ph.D Bernardo Vargas Leitón, Escuela de Medicina Veterinaria, Universidad Nacional Formación y Especialización de razas Selección empírica del ganado Nace la Genética Clásica (Leyes de Mendel) Primeras

Más detalles

NOMBRE DE LA ASIGNATURA: Métodos Computacionales en Bioinformática

NOMBRE DE LA ASIGNATURA: Métodos Computacionales en Bioinformática NOMBRE DE LA ASIGNATURA: Métodos Computacionales en Bioinformática CLAVE DE LA ASIGNATURA: 9310 RESPONSABLE DE LA ASIGNATURA: Dr. Ricardo Vázquez Juárez Suplente: Dr. Joaquín Gutiérrez Jagüey PARTICIPANTES:

Más detalles

Redes Bayesianas para predecir riesgo de plomo en sangre de puérperas y neonatos

Redes Bayesianas para predecir riesgo de plomo en sangre de puérperas y neonatos Redes Bayesianas para predecir riesgo de plomo en sangre de puérperas y neonatos Autores A.M. Sancho 1,2 ; V. Messina 3 ; M. Cuevas 4 ; I. Sattolo 2 ; R.Dante 1 ; A. Ricca 1, y L. De Oto 2 RESUMEN Las

Más detalles

MEMORIA-RESUMEN DE TRABAJOS REALIZADOS

MEMORIA-RESUMEN DE TRABAJOS REALIZADOS MEMORIA-RESUMEN DE TRABAJOS REALIZADOS Alumno: Tutor: Tesis: IBRAHIM ESPINO MARTÍN FRANCISCO MARIO HERNÁNDEZ TEJERA Integración de técnicas estadísticas, numéricas y de inteligencia artificial para la

Más detalles

CUANTIFICANDO LA CLASE MEDIA EN MÉXICO: UN EJERCICIO EXPLORATORIO

CUANTIFICANDO LA CLASE MEDIA EN MÉXICO: UN EJERCICIO EXPLORATORIO CUANTIFICANDO LA CLASE MEDIA EN MÉXICO: UN EJERCICIO EXPLORATORIO Nota Técnica 2 Introducción El análisis de agrupamiento o clustering es una herramienta estadística que tiene como objetivo identificar

Más detalles

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009 Índice general 6. Regresión Múltiple 3 6.1. Descomposición de la variabilidad y contrastes de hipótesis................. 4 6.2. Coeficiente de determinación.................................. 5 6.3. Hipótesis

Más detalles

EVALUACIÓN GENÉTICA NACIONAL DEL VACUNO FRISÓN ESPAÑOL

EVALUACIÓN GENÉTICA NACIONAL DEL VACUNO FRISÓN ESPAÑOL Noviembre 2015 EVALUACIÓN GENÉTICA NACIONAL DEL VACUNO FRISÓN ESPAÑOL Las evaluaciones genéticas nacionales del vacuno frisón español son calculadas íntegramente en CONAFE mediante el método BLUP Modelo

Más detalles

Clasificación Automática de Textos de Desastres Naturales en México

Clasificación Automática de Textos de Desastres Naturales en México Clasificación Automática de Textos de Desastres Naturales en México Alberto Téllez-Valero, Manuel Montes-y-Gómez, Olac Fuentes-Chávez, Luis Villaseñor-Pineda Instituto Nacional de Astrofísica, Óptica y

Más detalles

Estimar, descomponer y comparar el error de mala clasificación

Estimar, descomponer y comparar el error de mala clasificación Estimar, descomponer y comparar el error de mala clasificación Evaluando y analizando el comportamiento de algoritmos de inducción de clasificadores Aritz Pérez, Pedro Larrañaga e Iñaki Inza Intelligent

Más detalles

Regresión simbólica con slp s.

Regresión simbólica con slp s. Regresión simbólica con slp s. Cruz Enrique Borges Hernández y José Luis Montaña 1 2 Departamento de Matemáticas, Estadística y Computación Universidad de Cantabria 7 de abril de 2011 This work is licensed

Más detalles

Implicancias en Salud Pública del Análisis Genómico de cepas de Mycobacterium tuberculosis sensible, MDR y XDR

Implicancias en Salud Pública del Análisis Genómico de cepas de Mycobacterium tuberculosis sensible, MDR y XDR Implicancias en Salud Pública del Análisis Genómico de cepas de Mycobacterium tuberculosis sensible, MDR y XDR Blgo. Víctor Borda Laboratorio de Biotecnología y Biología Molecular Instituto Nacional de

Más detalles

Introducción. Qué es machine learning? Algunos Tipos de Machine Learning. Generalización & Exploración. Ejemplos de aplicaciones en Machine Learning

Introducción. Qué es machine learning? Algunos Tipos de Machine Learning. Generalización & Exploración. Ejemplos de aplicaciones en Machine Learning Introducción Qué es aprendizaje automatizado e inferencia inductiva"? Para qué sirve? (ejemplos/aplicaciones) Tareas de aprendizaje Representación de datos Enfoques usados Concept learning: algoritmos

Más detalles

TEMA 1. Introducción al análisis empírico de variables económicas.

TEMA 1. Introducción al análisis empírico de variables económicas. TEMA 1. Introducción al análisis empírico de variables económicas. Profesor: Pedro Albarrán Pérez Universidad de Alicante. Curso 2010/2011. Contenido 1 Datos Económicos Introducción Tipos de Datos. Tratamiento

Más detalles

Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas

Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas Manuel Baena García, Rafael Morales Bueno y Carlos Cotta Porras Workshop MOISES Septiembre 2004 1/15 Contenido Inducción

Más detalles

Calidad de Canal y Carne. Calidad de Leche. Registros Fenotípicos. Registros Moleculares

Calidad de Canal y Carne. Calidad de Leche. Registros Fenotípicos. Registros Moleculares MEJORAMIENTO GENÉTICO BOVINO PARA CALIDAD DE CARNE Y LECHE M. A. Elzo Universidad de Florida Calidad de Canal y Carne Madurez del Animal (2.5 a 3.5 años) Porcentaje de Cortes de Venta (Yield Grade) Aspecto

Más detalles

Support Vector Machines

Support Vector Machines Support Vector Machines Separadores lineales Clasificacion binaria puede ser vista como la tarea de separar clases en el espacio de caracteristicas w T x + b > 0 w T x + b = 0 w T x + b < 0 f(x) = sign(w

Más detalles

PREPROCESADO DE DATOS PARA MINERIA DE DATOS

PREPROCESADO DE DATOS PARA MINERIA DE DATOS Ó 10.1007/978-3-319-02738-8-2. PREPROCESADO DE DATOS PARA MINERIA DE DATOS Miguel Cárdenas-Montes Frecuentemente las actividades de minería de datos suelen prestar poca atención a las actividades de procesado

Más detalles

DESCRIPCIÓN ESPECÍFICA

DESCRIPCIÓN ESPECÍFICA DESCRIPCIÓN ESPECÍFICA NÚCLEO: COMERCIO Y SERVICIO SUBSECTOR: PRODUCCION Y SALUD OCUPACIONAL Nombre del Módulo: Análisis estadístico de datos. total: 45 HORAS. Objetivo General: Analizar la conformidad

Más detalles

METODOS ESTADISTICOS.

METODOS ESTADISTICOS. AREA DE ESTADISTICA E INVESTIGACION DE OPERACIONES PROGRAMA: METODOS ESTADISTICOS. PROYECTO: SERVICIO DE CONSULTORIA ESTADISTICA. SERVICIO DE CONSULTORIA ESTADISTICA. Diseño con propósitos de un posterior

Más detalles

1. DATOS DE LA ASIGNATURA

1. DATOS DE LA ASIGNATURA 1. DATOS DE LA ASIGNATURA Nombre de la asignatura: Curso Avanzado de Estadística Titulación: Máster en Matemáticas y aplicaciones Código Breve Descripción: El curso está centrado en dos temas relativamente

Más detalles

Las Matemáticas En Ingeniería

Las Matemáticas En Ingeniería Las Matemáticas En Ingeniería 1.1. Referentes Nacionales A nivel nacional se considera que el conocimiento matemático y de ciencias naturales, sus conceptos y estructuras, constituyen una herramienta para

Más detalles

Ejemplo de Aplicación con Neural Connection

Ejemplo de Aplicación con Neural Connection Ejemplo de Aplicación con Neural Connection El marketing directo es un área donde las redes neuronales han tenido un considerable éxito. En este tipo de marketing, se vende un producto o un servicio, enviando

Más detalles

Repaso de conceptos. Tipos de RNA más utilizados. Técnicas de Clasificación con RNA. Contenido

Repaso de conceptos. Tipos de RNA más utilizados. Técnicas de Clasificación con RNA. Contenido Contenido Introducción al Diseño de Experimentos para el Reconocimiento de Patrones Capítulo 3: Redes Neuronales Artificiales Curso de doctorado impartido por Dr. Quiliano Isaac Moro Dra. Aranzazu Simón

Más detalles

MODELO PREDICTIVO DE DESERCIÓN ESTUDIANTIL

MODELO PREDICTIVO DE DESERCIÓN ESTUDIANTIL MODELO PREDICTIVO DE DESERCIÓN ESTUDIANTIL APLICACIÓN DE TÉCNICAS DE MINERÍA DE DATOS Yegny Amaya, Edwin Barrientos, Universidad Francisco de Paula Santander, Colombia Diana Heredia Vizcaíno, Universidad

Más detalles

código Java Solicitudes Reportes AJI resultados API

código Java Solicitudes Reportes AJI resultados API Analizador Java Inteligente López De Luise María Daniela, miembro IT-Lab de la Universidad de Palermo, mlopez74@palermo.edu Agüero Martín Jorge, miembro IT-Lab de la Universidad de Palermo, agüero.martin@gmail.com

Más detalles

código Java Solicitudes Reportes AJI resultados API

código Java Solicitudes Reportes AJI resultados API Analizador Java Inteligente Agüero Martin Jorge, miembro IT-Lab de la Universidad de Palermo, agüero.marin@gmail.com López De Luise María Daniela, miembro IT-Lab de la Universidad de Palermo, mlopez74@palermo.edu

Más detalles

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09 Introducción a los Algoritmos Genéticos Tomás Arredondo Vidal 17/4/09 Esta charla trata de lo siguiente: Introducción a algunos aspectos de los algoritmos genéticos. Introducción a algunas aplicaciones

Más detalles

Análisis de expansión de redes de telefonía móvil basándose en indicadores claves de desempeño, utilizando Procesos Gaussianos

Análisis de expansión de redes de telefonía móvil basándose en indicadores claves de desempeño, utilizando Procesos Gaussianos Análisis de expansión de redes de telefonía móvil basándose en indicadores claves de desempeño, utilizando Procesos Gaussianos Jhouben Janyk Cuesta Ramírez. Director: PhD. Mauricio Alexander Álvarez. Facultad

Más detalles

Arquitectura de un Sistema Recomendador

Arquitectura de un Sistema Recomendador DCIC SR: Situación de Aplicabilidad Sistemas de Recomendación y Personalización Necesito información de películas, pero... por dónde empiezo?? Hay tanta información!! Hey! Yo te puedo recomendar:... Viviana

Más detalles

CURSO DE POSTGRADO. Métodos de Análisis Estadístico I. N o m b r e C u r s o

CURSO DE POSTGRADO. Métodos de Análisis Estadístico I. N o m b r e C u r s o UNIVERSIDAD DE CHILE FACULTAD DE MEDICINA ESCUELA DE POSTGRADO CURSO DE POSTGRADO Métodos de Análisis Estadístico I N o m b r e C u r s o SEMESTRE 1º AÑO 2015 PROF. ENCARGADO / Mauricio Cerda 13.672.064-3

Más detalles

METODOLOGIA DE SUPERFICIES DE RESPUESTA. Esto se logra al determinar las condiciones óptimas de operación del sistema.

METODOLOGIA DE SUPERFICIES DE RESPUESTA. Esto se logra al determinar las condiciones óptimas de operación del sistema. 37 CAPITULO METODOLOGIA DE SUPERFICIES DE RESPUESTA En este capítulo hablaremos de qué es la Metodología de Superficies de Respuesta, su representación gráfica, el procedimiento a seguir hasta encontrar

Más detalles

Enfoque propuesto para la detección del humo de señales de video.

Enfoque propuesto para la detección del humo de señales de video. Capítulo 3 Enfoque propuesto para la detección del humo de señales de video. 3.1 Comportamiento del enfoque propuesto. Una visión general del método propuesto se muestra en la figura 2. El método genera

Más detalles

Introducción al Data Mining Clases 5. Cluster Analysis. Ricardo Fraiman Centro de Matemática, Udelar y Universidad de San Andrés, Argentina

Introducción al Data Mining Clases 5. Cluster Analysis. Ricardo Fraiman Centro de Matemática, Udelar y Universidad de San Andrés, Argentina Introducción al Data Mining Clases 5 Cluster Analysis Ricardo Fraiman Centro de Matemática, Udelar y Universidad de San Andrés, Argentina Cluster Análisis 1 El término cluster analysis (usado por primera

Más detalles

Tema AA 1: Introducción a al Aprendizaje Automático

Tema AA 1: Introducción a al Aprendizaje Automático Razonamiento Automático Curso 200 2002 Tema AA : Introducción a al Aprendizaje Automático José A. Alonso Jiménez Miguel A. Gutiérrez Naranjo Dpto. de Ciencias de la Computación e Inteligencia Artificial

Más detalles

GUÍA DOCENTE. Curso Académico 2015/16. Técnicas de Análisis Estadístico basado en Inteligencia

GUÍA DOCENTE. Curso Académico 2015/16. Técnicas de Análisis Estadístico basado en Inteligencia GUÍA DOCENTE Curso Académico 2015/16 1. Técnicas de Análisis Estadístico basado en Inteligencia Artificial 1.1. Datos de la asignatura Tipo de estudios Titulación Nombre de la asignatura Carácter de la

Más detalles

Pablo Martínez-Camblor Subdirección de Salud de Guipuzcoa, Donosti.

Pablo Martínez-Camblor Subdirección de Salud de Guipuzcoa, Donosti. Métodos Estadísticos sticos para Diagnósticos MédicosM Barcelona, uno de marzo de 2008 Pablo Martínez-Camblor Subdirección de Salud de Guipuzcoa, Donosti. MODULO: Diseño de proyectos y análisis estadístico

Más detalles

Presentación. Introducción a las técnicas de reconocimiento de patrones. Materia de doctorado en ingeniería/informática

Presentación. Introducción a las técnicas de reconocimiento de patrones. Materia de doctorado en ingeniería/informática Presentación Introducción a las técnicas de reconocimiento de patrones Materia de doctorado en ingeniería/informática Tópicos de minería de datos Materia optativa de LCC Docente: Pablo M. Granitto Horarios:

Más detalles

Control Automático. Introducción al filtro de Kalman. Ing. Gabriela Ortiz León

Control Automático. Introducción al filtro de Kalman. Ing. Gabriela Ortiz León Control Automático Introducción al filtro de Kalman 1 Contenido Principio de funcionamiento Ecuaciones de predicción y actualización Proceso Ejemplo 2 Filtro Kalman Es un algoritmo desarrollado por Rupert

Más detalles

Cómo obtener un Modelo de Regresión Logística Binaria con SPSS

Cómo obtener un Modelo de Regresión Logística Binaria con SPSS Universitat de de Barcelona. Institut de de Ciències de de l Educació Cómo obtener un Modelo de Regresión Logística Binaria con SPSS Vanesa Berlanga-Silvente y Ruth Vilà-Baños Fecha de presentación:

Más detalles

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA 5.1 Introducción En este capítulo nos ocuparemos de la estimación de caracteristicas de la población a partir de datos. Las caracteristicas poblacionales

Más detalles

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez Curso de Análisis de investigaciones con programas Informáticos 1 UNIVERSIDAD DE JAÉN Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos

Más detalles

Centro Nacional Genotipado

Centro Nacional Genotipado Centro Nacional Genotipado Anna Gonzalez-Neira Centro Nacional de Investigaciones Oncológicas (CNIO) Qué es el CeGen? El CeGen es una plataforma tecnológica, iniciativa de GENOMA ESPAÑA, que tiene por

Más detalles

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Álvaro J. Méndez Services Engagement Manager IBM SPSS / Profesor Econometría UAM Jecas, 22 Oct 2010 Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Business Analytics software Agenda Minería

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

T R A B A J O D E I N V E S T I G A C I O N D E O P E R A C I O N E S I

T R A B A J O D E I N V E S T I G A C I O N D E O P E R A C I O N E S I UNIVERSIDAD SAN MARTIN DE PORRES FACULTAD DE INGENIERIA Y ARQUITECTURA T R A B A J O D E I N V E S T I G A C I O N D E O P E R A C I O N E S I A N A L I S I S D E P R O N Ó S T I C O S F O R E C A S T

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA Enrique Puertas epuertas@uem.es Francisco Carrero fcarrero@uem.es José María Gómez Hidalgo jmgomez@uem.es Manuel de Buenaga buenga@uem.es

Más detalles

Métodos de promedios. Diplomado en Gestión Estratégica de las Finanzas Públicas MÉTODOS ESTADÍSTICOS PARA LA ESTIMACIÓN DE INGRESOS

Métodos de promedios. Diplomado en Gestión Estratégica de las Finanzas Públicas MÉTODOS ESTADÍSTICOS PARA LA ESTIMACIÓN DE INGRESOS MÉTODOS ESTADÍSTICOS PARA LA ESTIMACIÓN DE INGRESOS La estimación o proyección de ingresos futuros puede llevarse a cabo mediante diferentes métodos estadísticos de extrapolación, entre ellos: sistema

Más detalles

Frontera de Eficiencia de Futuros de Energía

Frontera de Eficiencia de Futuros de Energía La Aproximación Bayesiana a la Estadística El modelo de Black y Litterman con Reducción de Dimensión Un modelo de factores semiparamétrico (Borak - Weron 2008) CP usando muchos predictores (Stock y Watson

Más detalles

Alvaro J. Riascos Villegas Universidad de los Andes y Quantil. Marzo 14 de 2012

Alvaro J. Riascos Villegas Universidad de los Andes y Quantil. Marzo 14 de 2012 Contenido Motivación Métodos computacionales Integración de Montecarlo Muestreo de Gibbs Rejection Muestreo Importante Metropolis - Hasting Markov Chain Montecarlo Method Complemento ejemplos libro: Bayesian

Más detalles

MODELADO MATEMATICO PARA ISOTERMAS DE ADSORCION EN ALIMENTOS USANDO REDES NEURONALES ARTIFICIALES

MODELADO MATEMATICO PARA ISOTERMAS DE ADSORCION EN ALIMENTOS USANDO REDES NEURONALES ARTIFICIALES MODELOS BIOESTADISTICOS EN LA INGENIERÍA EN ALIMENTOS MODELADO MATEMATICO PARA ISOTERMAS DE ADSORCION EN ALIMENTOS USANDO REDES NEURONALES ARTIFICIALES CONTENIDO: Glosario de Términos Introducción Objetivos

Más detalles

Análisis genético de formas no mendelianas de enfermedades comunes.

Análisis genético de formas no mendelianas de enfermedades comunes. 3º Curso de Genética Humana Análisis genético de formas no mendelianas de enfermedades comunes. Jordi Pérez-Tur Unitat de Genètica Molecular CIBERNED Institut de Biomedicina de València-CSIC The Human

Más detalles

Conceptos Fundamentales. Curso de Estadística TAE, 2005 J.J. Gómez-Cadenas

Conceptos Fundamentales. Curso de Estadística TAE, 2005 J.J. Gómez-Cadenas Conceptos Fundamentales Curso de Estadística TAE, 2005 J.J. Gómez-Cadenas Análisis de datos en física de partículas Experimento en física de partículas: Observación de n sucesos de un cierto tipo (colisiones

Más detalles

Métricas de complejidad para la transformación del problema de detección de cáncer basado en

Métricas de complejidad para la transformación del problema de detección de cáncer basado en Índice para la transformación del problema de detección de cáncer basado en mamografías Alumna: Núria Macià Antoĺınez Asesora: Ester Bernadó Mansilla Núria Macià Antoĺınez PFC: 1/49 Índice 1 Planteamiento

Más detalles

DESARROLLO DE UNA APLICACIÓN INTELIGENTE BASADA EN RECONOCIMIENTO FACIAL PARA CONTROLAR EL ACCESO A LA BIBLIOTECA DANIEL RODRÍGUEZ HOYLE

DESARROLLO DE UNA APLICACIÓN INTELIGENTE BASADA EN RECONOCIMIENTO FACIAL PARA CONTROLAR EL ACCESO A LA BIBLIOTECA DANIEL RODRÍGUEZ HOYLE DESARROLLO DE UNA APLICACIÓN INTELIGENTE BASADA EN RECONOCIMIENTO FACIAL PARA CONTROLAR EL ACCESO A LA BIBLIOTECA DANIEL RODRÍGUEZ HOYLE Development of a smart application based on face recognition to

Más detalles

REGRESION simple. Correlación Lineal:

REGRESION simple. Correlación Lineal: REGRESION simple Correlación Lineal: Dadas dos variable numéricas continuas X e Y, decimos que están correlacionadas si entre ambas variables hay cierta relación, de modo que puede predecirse (aproximadamente)

Más detalles

Visión. Sesión 4: Búsqueda y tracking de modelos 2D en imágenes. Departamento CCIA http://www.jtech.ua.es/vision/2011/

Visión. Sesión 4: Búsqueda y tracking de modelos 2D en imágenes. Departamento CCIA http://www.jtech.ua.es/vision/2011/ Visión Sesión 4: Búsqueda y tracking de modelos 2D en imágenes Departamento CCIA http://www.jtech.ua.es/vision/2011/ Hoy Detección de aristas Transformada de Hough Componentes conectadas Alineación de

Más detalles