Problema: interpretación de grandes conjuntos de datos

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Problema: interpretación de grandes conjuntos de datos"

Transcripción

1 Problema: interpretación de grandes conjuntos de datos En biología molecular: tecnologías de alto rendimiento (todas las -ómicas), análisis globales (e.g. de escala genómica, de evolución, etc.) Trabajo práctico Data Mining Tarea: identificar clusters de genes con el mismo patrón de expresión, a partir de datos reales de transcriptómica (microarrays y RNA-seq). Realizar anotación funcional de grupos de genes identificados

2 Diagrama del TP ) Grandes conjuntos de datos biológicos. Ejemplo: series temporales de expresión génica (microarrays y NGS) Actividad: examinar archivos, reconocer formatos 2) Introducción al software / lenguaje R. Actividad : Ejercicios en la consola de R 3) Clustering, reducción de dimensionalidad y visualización. Actividad I (opcional): Para un conjunto de datos de juguete, cálculo a mano de matriz de distancia euclídea entre genes, clustering jerárquico y confección de dendograma. Actividad II: identificar patrones de expresión / clusters de genes a partir de datos de transcriptómica. Evaluación y visualización de resultados. ) Introducción al análisis de enriquecimiento funcional (vías metabólicas y otros procesos celulares, funciones moleculares, localización sub-celular, etc.). Evaluación estadística del enriquecimiento. Actividad: Detectar anotaciones funcionales enriquecidas en los clusters de genes identificados previamente, utilizando las herramientas web DAVID.

3 Trabajos seminales de transcriptómica con microarrays de ADN: * Exploring the Metabolic and Genetic Control of Gene Expression on a Genomic Scale. Joseph L. DeRisi, Vishwanath R. Iyer, Patrick O. Brown. Science (997) Serie temporal de expresión de genes de Saccharomyces cerevisiae (~6K) en 7 momentos durante el salto metabólico de fermentación a respiración * The Transcriptional Program in the Response of Human Fibroblasts to Serum, Iyer V et al. Science (999) Serie temporal de expresión génica de fibroblastos humanos (~8.6K) en respuesta al suero ( momentos)

4 Trabajos seminales de transcriptómica con microarrays de ADN: * Exploring the Metabolic and Genetic Control of Gene Expression on a Genomic Scale. Joseph L. DeRisi, Vishwanath R. Iyer, Patrick O. Brown. Science (997) Serie temporal de expresión de genes de Saccharomyces cerevisiae (~6K) en 7 momentos durante el salto metabólico de fermentación a respiración * The Transcriptional Program in the Response of Human Fibroblasts to Serum, Iyer V et al. Science (999) Serie temporal de expresión génica de fibroblastos humanos (~8.6K) en respuesta al suero ( momentos) Trabajos recienes de transcriptómica por RNA-seq (secuenciación masiva de transcriptomas) * The developmental dynamics of the maize leaf transcriptome, Pinghua Li et al. Nature Genetics (2) 2K genes (~8% del transcriptoma anotado) expresados en la hoja en desarrollo, medidos en zonas de hoja desde la base a la punta. Trabajaremos con el conjunto de 6K genes con expresión diferencial.

5 * Examinar archivos en editor de texto o planilla de cálculo * Determinar número de variables (condiciones/experimentos), de registros o filas (genes), tipos de datos (identificadores, descriptores, medidas de nivel de expresión: fold-change, log2(fold-change), z-score, RPKM, percentilos, etc.). * Análisis descriptivo mediante estadísticos y gráficos para caracterizar cada variable por separado (distribuciones, dispersión, presencia de valores faltantes y atípicos, etc.) y tomadas de a pares (matriz de correlaciones, diagramas de dispersión) NAMES YGR38C YPR6C YOR23W YAL8C YBR287W YCL7W col geneid GRMZM2G8227 GRMZM2G688 GRMZM2G3963 GRMZM2G29 GRMZM2G99 GRMZM2G7897 col col3 col col col6 col description CHY, putative, expressed delta3,-delta2,-dienoyl-coa L-asparaginase 3 precursor, adenosylhomocysteinase, putat adenosylhomocysteinase, putat O-succinylhomoserine sulfhydr RPKM-base RPKM-cm RPKM+ cm RPKMtip

6 2) introducción al lenguaje R Presentación software / lenguaje, qué es R? por qué usar R? ayuda?? Operaciones básicas con números, vectores Data frames e Importación de datos Manipulación de datos: extracción y filtrado de datos, estandarización / transformaciones, reformateo y fusión de tablas. Estadísticas descriptivas y Gráficos Exportación de datos Extendiendo la funcionalidad mediante la instalación de paquetes: lattice (visualización de datos multivariados) y cluster (clustering)

7 2) introducción al lenguaje R Qué es R? R es software de análisis de datos: analistas, estadísticos, científicos que necesitan darle sentido a los datos usan R para hacer análisis estadísticos, visualización, modelado, etc. R es un lenguaje de programación: uno analiza datos escribiendo scripts y funciones en el lenguaje R. Es un lenguaje completo, interactivo, orientado a objetos diseñado por estadísticos, para estadísticos. El lenguaje provee objetos, operadores y funciones que hacen natural el proceso de exploración, modelado y visualización de datos. Frecuentemente pueden representarse analisis de datos completos con unas pocas líneas de código. R es un entorno para analisis estadístico: en R están disponibles funciones para prácticamente cualquier manipulación, modelo estadístico o gráfico que uno podría necesitar. Ya que la mayor parte de la investigación en estadística y modelado se hace en R, usualmente las técnicas más novedosas están disponibles primero en R. (entorno: sistema planeado y coherente vs. acumulación de herramientas altamente específicas e inflexibles) R es un proyecto de software open-source: podés descargar y usar R gratuitamente y el código fuente está disponible para ser inspeccionado y modificado. Como otros proyectos open-source (Linux, MySQL, etc.), R se ha beneficiado por más de años del trabajo de una comunidad en mejorar el código, logrando un estándar de calidad y precisión numérica extremadamente altos. Además, como otros sistemas opensource, R tiene interfaces abiertas lo que permite ser fácilmente integrado en otras aplicaciones y sistemas (eg. Software como SAS, SPSS, Infostat. Lenguajes: Python, Perl, Java, etc.) R es una comunidad. Fue creado por Ross Ihaka y Robert Gentleman en la Universidad de Auckland en 993, y desde entonces el liderazgo del proyecto creció para incorporar mas de 2 estadísticos e informáticos de diferentes partes del mundo (R development core-team, incluyendo a Chambers, el creador de S, antecesor comercial de R). Además otros cientos han contribuido al lenguaje con funcionalidad adicional creando paquetes que se usan por 2 millones de usuarios en todo el mundo. Como resultado, hay una fuerte y activa comunidad on-line de usuarios de R, con un conjunto de recursos mantenidos por la comunidad para usuarios de todos los niveles.

8 Hay mucho software disponible para analizar datos Qué hace a R diferente? R es gratuito y de código abierto: chau suscripciones, licencias, límites de usuarios, software ilegal emparchado y con errores, etc. (multiplataforma!) R es un lenguaje. Se trabaja escribiendo funciones y scripts, no haciendo clicks. La curva de aprendizaje es más pronunciada, pero una vez familiarizado permite una enorme flexibilidad. Al ser interactivo, facilita y promueve la experimentación. Un script documenta el trabajo desde el acceso a los datos hasta el reporting, permitiendo la re-ejecución inmediatamente (es más fácil detectar y corregir errores, actualizar los resultados cuando los datos cambian, etc.). Gráficos y Visualización: uno de los principios de diseño de R fue que la visualización de los datos mediante gráficos es parte esencial del proceso de análisis. Como resultado existen excelentes herramientas para crear gráficos. Un entorno muy flexible. Todas las herramientas de análisis están escritas en lenguaje R, desde el acceso a los datos en diversos formatos, manipulación de datos (transformaciones, uniones, combinaciones de tablas) hasta los modelos estadísticos tradiciones y modernos (regresión, ANOVA, GLM, árboles, etc.). Todos ellos en un framework orientado a objetos que facilita extraer y combinar programáticamente la información que uno necesita de los resultados, mas que tener que andar copiando y pegando información de reportes estáticos. Acceso a herramientas de análisis cutting-edge. La mayoría de los investigadores en la academia usan R para desarrollar los últimos métodos en estadística, aprendizaje automático, modelado predictivo, etc. Existen más de 2 paquetes para extender R en cada dominio de conocimiento (eg con gran crecimiento en finanzas y bioinformática) disponibles gratuitamente, y en constante expansión. La activa comunidad. Con cientos de contribuyentes de código y más de 2M usuarios en el mundo, ante una duda, alguien va a responder. Cantidad enorme de recursos (tutoriales, foros, etc.) en la web, para cada dominio.

9 Recursos útiles R-project.org noticias oficiales del proyecto, links a documentación (muchos buenos tutoriales), mailing lists, FAQs, etc. The Comprehensive R Archive Network R-Reference Card Quick-R Repositorio de Gráficos StackOverflow Alguna pregunta sobre R? Seguro que alguien ya preguntó lo mismo y le respondieron (buscar r tag) R bloggers Flujo constante de noticias, tips y artículos relativos a R CRAN Task View La lista de 2+ paquetes puede ser intimidante. Esta clasificación agrupa los más importantes por áreas específicas (eg Finanzas, Ensayos clínicos, Machine Learning). Crantastic.org. Búsqueda y review comunitario de paquetes Rseek R stuff search engine

10 Programando en R Basic R GUI: R GUI/Console, R Commander R IDE: R Studio (http://rstudio.org/) Editores de Texto: Vim + vim-r, Emacs + ESS ( Interactivo (en consola R): $ R >rnorm(,mean=,sd=) [] [8] vs. Scripting ( $ echo rnorm(,mean=,sd=) > mi_script.r ) desde consola R: >source( mi_script.r ) O bien por línea de comando: shell>r vanilla < mi_script.r

11 data(iris) head(iris) str(iris) : secuencia = : c(,2,3) iris[,:] iris[:,] iris$sepal.length iris$sepal.length> iris[iris$sepal.length >,] mean(iris$sepal.length) var(iris$sepal.length) summary(iris) mean(iris$sepal.length[iris$species == setosa ])

12 Gráficos univariados hist(iris$sepal.length) hist(iris$sepal.length[iris$species == setosa ]) hist(iris$sepal.length[iris$species == setosa ]) hist(scale(iris$sepal.length[iris$species == setosa ]) boxplot(iris[,-]) iris.std = scale(iris[,-]) summary(iris.std) boxplot(iris.std) Exportando a PDF pdf( salida.pdf ) boxplot(iris[,-],col= gray ) dev.off() Gráficos bivariados plot(iris$sepal.length,iris$sepal.width) with(iris,plot(sepal.length,sepal.width)) plot(iris$sepal.length,iris$sepal.width,col=ifelse(iri s$sepal.length >, blue, brown )) cor(x,y); cor(iris[,-]); cor.test(x,y)

13 Gráficos multivariados library(lattice) heatmap(as.matrix(iris[,-]) #se ven clusters? with(iris,parallel(~iris[:] Species)) Importando datos read.table("diauxic.txt",nrows=2) diauxic <- read.table("diauxic.txt",sep= \t )

14 Ayuda, historial, Woring Dir, Paquetes help(rnorm) # ayuda, idem?rnorm,??distribution Getwd() # muestra directorio de trabajo setwd("directoryname"). # cambiarlo R guarda todos los comandos ejecutados en un historial history(), loadhistory(.rhistory ), savehistory( HistorialBK ) CTRL+R # búsqueda en el historial ls() ls.str() str(objeto) Paquetes: expandiendo la funcionalidad R puede hacer muuchos tipos de análisis. Éstos se organizan en paquetes o bibliotecas (packages/libraries). Con la instalación estandar se instalan los paquetes más comunes. : >library() # listar paquetes instalados >library(cluster) # cargar paquete cluster >install.packages("rgl") # instalar paquete rgl >library(rgl) # cargar paquete rgl >plot3d(x,x+rnorm(),x+rnorm(), col="red", size=3) # función del paquete recién instalado

15 3) Introducción a Clustering, reducción de dimensionalidad y visualización de datos multivariados Analisis de clusters / clustering: agrupamiento de entidades u objetos de manera tal que las entidades pertenecientes a un mismo grupo o cluster sean mas parecidas entre si que a entidades pertenecientes a otros clusters.

16 3) Introducción a Clustering, reducción de dimensionalidad y visualización de datos multivariados Analisis de clusters / clustering: agrupamiento de entidades u objetos de manera tal que las entidades pertenecientes a un mismo grupo o cluster sean mas parecidas entre si que a entidades pertenecientes a otros clusters. Definir parecido! * Para entidades descriptas por presencia o ausencia de caracteres: típicamente índices o coeficientes de similitud, por ejemplo, en botánica el índice de Sørensen-Dice para comparar muestras. QS=2C/A+B A:#especies en muestra A, B: #especies en muestra B, C: #especies en común. Varía entre y

17 3) Introducción a Clustering, reducción de dimensionalidad y visualización de datos multivariados Definir parecido! * Para entidades descriptas por variables contínuas: Se habla de la distancia que las separa en algún espacio geométrico. Ejemplos: * la distancia euclídea * la distancia de Manhattan * basadas en correlación

18 3) Introducción a Clustering, reducción de dimensionalidad y visualización de datos multivariados X Y objeto 2 objeto distancia euclídea

19 3) Introducción a Clustering, reducción de dimensionalidad y visualización de datos multivariados X Y objeto 2 objeto distancia euclídea d ( obj,obj2 ) = ( ( 2 ) 2 + ( 2 )2 ) d ( obj,obj2 )= ( 3 ) ( / 2 )

20 Ahora sabemos medir distancias. Como hacemos el clustering? Al igual que al elegir la medida de distancia, acá hay muchos métdos con ventajas y desventajas frente a diferentes escenarios y que en general van a dar resultados diferentes! Hay que tener herramientas para evaluar la calidad de los esquemas de clustering Uno de los métodos más populares: clustering jerárquico ascendente Dado un conjunto de N () elementos a ser agrupados y una matriz de distancia (o similitud) de N x N: d

21 Clustering Jerárquico Ascendente: el algoritmo Comenzar por asignar cada item a un cluster. Tenemos clusters Sean las distancias entre los clusters las mismas que entre los elementos de cada cluster d

22 Clustering Jerárquico Ascendente: el algoritmo Encontrar el par más cercano de clusters y unirlo en un único cluster. Tenemos clusters d

23 Clustering Jerárquico Ascendente: el algoritmo Calcular las distancias entre el nuevo cluster y los viejos clusters Criterios de agregación ( cómo juntamos los clusters?): usemos single-linkage (vecino más cercano) d 2 3 d Otros criterios de agregación que usaremos son: complete-linkage (vecino más lejano) y Average-linkage (encadenamiento promedio o UPGMA)

24 Clustering Jerárquico Ascendente: el algoritmo Repetir los pasos 2 y 3 hasta que todos los elementos se encuentren en el mismo cluster de tamaño N Actividad 3. Ejercicio de clustering jerárquico a mano usando una tabla muy pequeña de datos inventados

25 Otro método de clustering muy popular: K-means (K-medias) Particional dist. Euclídea requiere # de clusters el algoritmo Ubicar k (2) puntos en el espacio representado por los objetos a ser agrupados. Estos k puntos son los centroides iniciales de cada grupo

26 K-means: el algoritmo Asignar cada objeto al grupo que esté más cercano a su centroide

27 K-means: el algoritmo Recalcular la posición de los k centroides

28 K-means: el algoritmo Repetir pasos 2 y 3 hasta que los prototipos ya no varíen (convergencia, o se haya alcanzado un número máximo de iteraciones arbitrario. En algunos casos es conveniente utilizar más de inicio aleatorio de centroides) De esta manera se minimiza la distancia intracluster según la metrica dada

29 Volviendo a la biología... Siguiendo la guía de TP: * Importar a R los conjuntos de datos de transcritómica (S. cerevisae durante el shift diáuxico, o desarrollo de la hoja de maíz) * Realiza un análisis descriptivo (mediante estadísticos y gráficos) para caracterizar cada variable por separado (distribuciones, dispersión, presencia de valores faltantes y atípicos, etc.). * Aplicar las técnicas de clustering vistas Shift diauxico en S. cerevisiae

30 Comparamos los resultados de variar distancias y diferentes parámetros de los algoritmos. Evaluamos consistencia del agrupamiento: coeficiente de silueta Diagnóstico?

31 Otro ejemplo: fibroblastos humanos en respuesta al suero

32 Otro ejemplo: fibroblastos humanos en respuesta al suero Visualización de datos multivariados: Gráficos cada vez mas complejos, o... reducción de dimensiones!

33 Intuición reducción de dimensión: ACP NAMES YGR38C YPR6C YOR23W YAL8C YBR287W YCL7W... col col col3 col col col6 col Podemos graficar los genes en el plano? Qué variables tomamos? 2% información % información

34 Intuición reducción de dimensión: ACP

35 reducción de dimensión: intuición ACP Diauxic data qué rotación de ejes o cambio de coordenadas maximiza la varianza/información sobre el eje x?

36 Análisis en Componentes Principales (PCA) NAMES YGR38C YPR6C YOR23W YAL8C YBR287W YCL7W... col col col3 col col col6 col % información

37 ) análisis de enriquecimiento funcional Tenemos un grupo de genes (cluster) con alguna característica: patrón de expresión particular, expresión diferencial frente a cierto tratamiento, etc. Aprovechando las anotaciones funcionales de los genomas queremos saber qué términos dentro de alguna ontología están sobre-representados (enriquecidos) en nuestro grupo, respecto a alguna distribución nula (background).

38 ) análisis de enriquecimiento funcional Tenemos un grupo de genes (cluster) con alguna característica: patrón de expresión particular, expresión diferencial frente a cierto tratamiento, etc. Aprovechando las anotaciones funcionales de los genomas queremos saber qué términos dentro de alguna ontología están sobre-representados (enriquecidos) en nuestro grupo, respecto a alguna distribución nula (background). Típicamente interesa evaluar enriquecimiento de funciones moleculares, procesos celulares involucrados, localizaciones sub-celulares (estos 3 de la Gene Ontlogy-GO) y vias metabólicas (KEGG db). Pero se puede evaluar enriquecimiento de cualquier característica de los genes que pueda imaginarse. Por ejemplo: * motivos o señales en las secuencias * punto isoeléctrico de la proteína codificada * dominios proteicos * interacciones proteína-proteína * número de papers que los mencionan

39 De Risi et al 997 Cluster Cluster 2 Cluster 2 Cluster ID conversion/mapping PASOS: * exportamos IDs por cluster * Subimos archivos a DAVID * (Mapeo IDs) * Definición lista de referencia / background * Selección de Ontologías / bases de datos de anotaciones

40 asociaciones estadísticamente significativas? Nucleolus Non-Nucleolus C GEN Las cuentas en la tabla de contingencia, bajo la hipótesis nula de independencia (no hay relación entre Cluster y Nucleolo) siguen una distribución hipergeométrica (k éxitos en n intentos, sin reposición). Se evalúa mediante el Test Exacto de Fisher. En este caso: p-value < e-6 Se rechaza la hipótesis nula de independencia, y se dice hay asociación entre los factores (con una probabilidad de equivocarme menor a ^(-6) ). Y hacemos esto con miles y miles de términos...

41 ) análisis de enriquecimiento funcional Típicamente interesa evaluar enriquecimiento de funciones moleculares, procesos celulares involucrados, localizaciones sub-celulares (estos 3 de la Gene Ontlogy-GO) y vias metabólicas (KEGG db). Pero se puede evaluar enriquecimiento de cualquier característica de los genes que pueda imaginarse. Por ejemplo: * motivos o señales en las secuencias * punto isoeléctrico de la proteína codificada * número de papers que los mencionan 96 tests mas tarde... * cantidad de letras a en el identificador Consideremos un conjunto de genes tomados al azar (sin ninguna relación funcional entre ellos). Si me esfuerzo mucho buscando posibles asociaciones, a la larga las voy a encontrar ( con Fisher Exact Test <.!)

42 ) análisis de enriquecimiento funcional Típicamente interesa evaluar enriquecimiento de funciones moleculares, procesos celulares involucrados, localizaciones sub-celulares (estos 3 de la Gene Ontlogy-GO) y vias metabólicas (KEGG db). Pero se puede evaluar enriquecimiento de cualquier característica de los genes que pueda imaginarse. Por ejemplo: * motivos o señales en las secuencias * punto isoeléctrico de la proteína codificada * número de papers que los mencionan 96 tests mas tarde... * cantidad de letras a en el identificador Consideremos un conjunto de genes tomados al azar (sin ninguna relación funcional entre ellos). Si me esfuerzo mucho buscando posibles asociaciones, a la larga las voy a encontrar ( con Fisher Exact Test p-value <.!). PROBLEMA del testeo múltiple de hipótesis. En general se corrigen los p-valores teniendo en cuenta el número de tests realizados. Procedimientos típicos: Benjamini y Hochberg False Discovery Rate, Bonferroni.

43 Recursos ONLINE *The Database for Annotation, Visualization and Integrated Discovery (DAVID ) *GOrilla *FatiGO Si hay que automatizar: Paquete de R / Bioconductor: topgo

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/ Minería de Datos Web 1 er Cuatrimestre 2015 Página Web http://www.exa.unicen.edu.ar/catedras/ageinweb/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs. As., Argentina http://www.exa.unicen.edu.ar/~dgodoy

Más detalles

Habilidades y Herramientas para trabajar con datos

Habilidades y Herramientas para trabajar con datos Habilidades y Herramientas para trabajar con datos Marcelo Ferreyra X Jornadas de Data Mining & Business Intelligence Universidad Austral - Agenda 2 Tipos de Datos Herramientas conceptuales Herramientas

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

Leonardo Collado Torres Licenciatura en Ciencias Genómicas, UNAM www.lcg.unam.mx/~lcollado/index.php. Cuernavaca, México Oct-Nov, 2008

Leonardo Collado Torres Licenciatura en Ciencias Genómicas, UNAM www.lcg.unam.mx/~lcollado/index.php. Cuernavaca, México Oct-Nov, 2008 Leonardo Collado Torres Licenciatura en Ciencias Genómicas, UNAM www.lcg.unam.mx/~lcollado/index.php Cuernavaca, México Oct-Nov, 2008 1 / 40 Bioconductor 1 2 3 2 / 40 Nuestro problema a reproducir Para

Más detalles

2 Congreso Colombiano de Bioinformática y biología computacional.

2 Congreso Colombiano de Bioinformática y biología computacional. 2 Congreso Colombiano de Bioinformática y biología computacional. Presentación y evaluación de ABMS (Automatic Blast for Massive Annotation) Nelson Perez nelsonp@correo.udistrital.edu.co Cristian Rojas

Más detalles

Ambiente de trabajo. Tutorial Ambiente de Trabajo en InfoStat ARCHIVO

Ambiente de trabajo. Tutorial Ambiente de Trabajo en InfoStat ARCHIVO Ambiente de trabajo InfoStat ofrece distintas herramientas para explorar su información de manera sencilla, intuitiva y amigable. Al abrir InfoStat, se visualizará una barra de herramientas localizada

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez Curso de Análisis de investigaciones con programas Informáticos 1 UNIVERSIDAD DE JAÉN Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

Análisis de dominancia usando ruby-statsample. Introducción. Instalación de Ruby y gemas. Windows

Análisis de dominancia usando ruby-statsample. Introducción. Instalación de Ruby y gemas. Windows Análisis de dominancia usando ruby-statsample Introducción El análisis de dominancia(azen y Bodescu, 2003), es un método para determinar la importancia relativa de uno o más predictores en comparación

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1 ÍNDICE Introducción... XV Capítulo 1. El concepto de Data Mining... 1 Introducción... 1 Una definición de Data Mining... 3 El proceso de Data Mining... 6 Selección de objetivos... 8 La preparación de los

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Aplicación de los modelos de credit scoring para instituciones microfinacieras.

Aplicación de los modelos de credit scoring para instituciones microfinacieras. Econ. Reynaldo Uscamaita Huillca Aplicación de los modelos de credit scoring para instituciones microfinacieras. OBJETIVO Proporcionar al ejecutivo del sistema financiero un modelo solido que permita tomar

Más detalles

Comenzar a trabajar con Tableau Server 7.0

Comenzar a trabajar con Tableau Server 7.0 Comenzar a trabajar con Tableau Server 7.0 Bienvenido a Tableau Server. Esta guía lo conducirá a través de los pasos básicos para instalar y configurar Tableau Server, luego use algunos datos de muestra

Más detalles

Puedes descargar este examen en pdf desde esta dirección (busca el enlace Dropbox en la parte inferior de la página):

Puedes descargar este examen en pdf desde esta dirección (busca el enlace Dropbox en la parte inferior de la página): Univ. de Alcalá. Estadística 2014-15 Dpto. de Física y Matemáticas Grado en Biología. Examen final. Miércoles, 21 de Enero de 2015. Apellidos: Nombre: INSTRUCCIONES (LEER ATENTAMENTE). Puedes descargar

Más detalles

1.Instalar el paquete R-cmdr

1.Instalar el paquete R-cmdr ESTADíSTICA INDUSTRIAL Prof: Mathieu Kessler Componentes principales con R En esta práctica, utilizaremos un paquete adicional de R, llamado rgl que sirve para representaciones 3d. Instalaremos además

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

1 Introducción al SPSS

1 Introducción al SPSS Breve guión para las prácticas con SPSS 1 Introducción al SPSS El programa SPSS está organizado en dos bloques: el editor de datos y el visor de resultados. En la barra de menú (arriba de la pantalla)

Más detalles

TRATAMIENTO DE BASES DE DATOS CON INFORMACIÓN FALTANTE SEGÚN ANÁLISIS DE LAS PÉRDIDAS CON SPSS

TRATAMIENTO DE BASES DE DATOS CON INFORMACIÓN FALTANTE SEGÚN ANÁLISIS DE LAS PÉRDIDAS CON SPSS Badler, Clara E. Alsina, Sara M. 1 Puigsubirá, Cristina B. 1 Vitelleschi, María S. 1 Instituto de Investigaciones Teóricas y Aplicadas de la Escuela de Estadística (IITAE) TRATAMIENTO DE BASES DE DATOS

Más detalles

Capítulo 1. Introducción

Capítulo 1. Introducción Capítulo 1. Introducción El WWW es la mayor fuente de imágenes que día a día se va incrementando. Según una encuesta realizada por el Centro de Bibliotecas de Cómputo en Línea (OCLC) en Enero de 2005,

Más detalles

Novedades en Crystal Reports XI

Novedades en Crystal Reports XI Novedades en Crystal Reports XI Introducción Introducción Esta sección proporciona información de alto nivel sobre los componentes, las funciones y las ventajas que ofrece la última versión de Crystal

Más detalles

El programa Minitab: breve introducción a su funcionamiento. Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos

El programa Minitab: breve introducción a su funcionamiento. Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos El programa Minitab: breve introducción a su funcionamiento Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos estadísticos en la actualidad, el libro se acompaña, en todo

Más detalles

Tutorial - Parte 2: Scoring

Tutorial - Parte 2: Scoring Introducción Tutorial - Parte 2: Scoring En este segundo tutorial aprenderá lo que significa un modelo de Scoring, verá cómo crear uno utilizando Powerhouse Analytics y finalmente a interpretar sus resultados.

Más detalles

CURSOS DE ESPECIALIZACIÓN MICROSOFT EXCEL

CURSOS DE ESPECIALIZACIÓN MICROSOFT EXCEL CURSOS DE ESPECIALIZACIÓN MICROSOFT EXCEL MICROSOFT EXCEL. FÓRMULAS Y FUNCIONES. 6 HORAS Ampliar los conocimientos sobre funciones de Microsoft Excel de forma completa y avanzada, con el fin de mejorar

Más detalles

Statgraphics Centurión

Statgraphics Centurión Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 1 Statgraphics Centurión I.- Nociones básicas El paquete Statgraphics Centurión es un programa para el análisis estadístico que

Más detalles

Técnicas de análisis multivariante para agrupación

Técnicas de análisis multivariante para agrupación TEMA 2: TÉCNICAS DE ANÁLISIS MULTIVARIANTE PARA AGRUPACIÓN Métodos cluster Técnicas de segmentación Clasificación no supervisada Ana Justel 1 Técnicas de análisis multivariante para agrupación Motivación

Más detalles

Sistema de Catalogación Catalog TAXOLOGIC

Sistema de Catalogación Catalog TAXOLOGIC Sistema de Catalogación Catalog TAXOLOGIC Características principales Tecnología Web Desarrollado en C#, para.net, Interfase 100% web. Base de datos SQL Utiliza los motores de Base de datos mas comunes

Más detalles

KNime. KoNstanz Information MinEr. KNime - Introducción. KNime - Introducción. Partes de la Herramienta. Editor Window. Repositorio de Nodos

KNime. KoNstanz Information MinEr. KNime - Introducción. KNime - Introducción. Partes de la Herramienta. Editor Window. Repositorio de Nodos KNime - Introducción KNime Significa KoNstanz Information MinEr. Se pronuncia [naim]. Fue desarrollado en la Universidad de Konstanz (Alemania). Esta escrito en Java y su entorno grafico esta desarrollado

Más detalles

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente En este capítulo definimos los requisitos del modelo para un sistema centrado en la mejora de la calidad del código fuente.

Más detalles

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II BASE DE DATOS Comenzar presentación Base de datos Una base de datos (BD) o banco de datos es un conjunto

Más detalles

CaseWare Working Papers Perfil del producto en español

CaseWare Working Papers Perfil del producto en español CaseWare Working Papers Perfil del producto en español Para auditorías más inteligentes y libres de problemas Automatice sus auditorías como nunca antes. CaseWare Working Papers es un software para procesos

Más detalles

Análisis Estadístico de Datos Climáticos

Análisis Estadístico de Datos Climáticos Análisis Estadístico de Datos Climáticos Análisis de agrupamiento (o clusters) (Wilks, Cap. 14) Facultad de Ciencias Facultad de Ingeniería 2013 Objetivo Idear una clasificación o esquema de agrupación

Más detalles

Tracker GUÍA BÁSICA. Cátedra de Física Curso de Ingreso I.T.B.A. Tracker 3.10 es software libre. Copyright (c) 2010 Douglas Brown.

Tracker GUÍA BÁSICA. Cátedra de Física Curso de Ingreso I.T.B.A. Tracker 3.10 es software libre. Copyright (c) 2010 Douglas Brown. Tracker GUÍA BÁSICA Cátedra de Física Curso de Ingreso I.T.B.A Tracker 3.10 es software libre. Copyright (c) 2010 Douglas Brown. ÍNDICE DE CONTENIDOS 1. QUÉ ES EL TRACKER? ------------------------------------------------------------------------------------

Más detalles

XV Conferencia Colombiana de Usuarios Esri Bogotá, Agosto 26 30 de 2013

XV Conferencia Colombiana de Usuarios Esri Bogotá, Agosto 26 30 de 2013 Taller Técnico Líder en soluciones geográficas empresariales XV Conferencia Colombiana de Usuarios Esri Bogotá, Agosto 26 30 de 2013 Flujos de trabajo con la Plataforma de ENVI Jenny Paola Vanegas Forero

Más detalles

IBM SPSS Modeler Novedades de la Versión

IBM SPSS Modeler Novedades de la Versión IBM SPSS Modeler Novedades de la Versión 16 Infórmese SPSS Andino se complace en presentar las características innovadoras que se han incluido en la versión 16 de IBM SPSS Modeler, lo invitamos a explorarlas.

Más detalles

Software para análisis de datos VERSION OCHO ASPECTOS DESTACADOS. Mejora tus auditorías. Tienes el conocimiento. Nosotros las herramientas.

Software para análisis de datos VERSION OCHO ASPECTOS DESTACADOS. Mejora tus auditorías. Tienes el conocimiento. Nosotros las herramientas. Software para análisis de datos VERSION OCHO ASPECTOS DESTACADOS Mejora tus auditorías. Tienes el conocimiento. Nosotros las herramientas. Acerca de IDEA Mejora el rendimiento de tus auditorías y aumenta

Más detalles

Curso de Estadística no-paramétrica

Curso de Estadística no-paramétrica Curso de Estadística no-paramétrica Sesión 1: Introducción Inferencia no Paramétrica David Conesa Grup d Estadística espacial i Temporal Departament d Estadística en Epidemiologia i Medi Ambient i Investigació

Más detalles

El Programa estadístico R

El Programa estadístico R El Programa estadístico R R es un lenguaje y entorno que permite realizar manipulación de datos, cálculos y gráficos estadísticos, bajo la modalidad de software libre y puede ser instalado en distintos

Más detalles

SISTEMA DE INFORMACION GERENCIAL. Lic.Patricia Palacios Zuleta

SISTEMA DE INFORMACION GERENCIAL. Lic.Patricia Palacios Zuleta SISTEMA DE INFORMACION GERENCIAL Lic.Patricia Palacios Zuleta Pentaho Open BI Suite La suite Pentaho cubre principalmente las siguientes áreas: integración de datos, reportes, análisis, alertas y dashboards,

Más detalles

DYANE Versión 4 Diseño y Análisis de Encuestas

DYANE Versión 4 Diseño y Análisis de Encuestas DYANE Versión 4 Diseño y Análisis de Encuestas Miguel Santesmases Mestre 1. DESCRIPCIÓN GENERAL DEL PROGRAMA DYANE 1. FINALIDAD Y MÉTODO DEL PROGRAMA DYANE (Diseño y Análisis de Encuestas) es un programa

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

Carrera: MCM - 0531. Participantes. Representantes de las academias de Ingeniería Mecánica de Institutos Tecnológicos.

Carrera: MCM - 0531. Participantes. Representantes de las academias de Ingeniería Mecánica de Institutos Tecnológicos. 1.- DATOS DE LA ASIGNATURA Nombre de la asignatura: Carrera: Clave de la asignatura: Horas teoría-horas práctica-créditos Probabilidad y Estadística Ingeniería Mecánica MCM - 0531 3 2 8 2.- HISTORIA DEL

Más detalles

Procesamiento de Texto y Modelo Vectorial

Procesamiento de Texto y Modelo Vectorial Felipe Bravo Márquez 6 de noviembre de 2013 Motivación Cómo recupera un buscador como Google o Yahoo! documentos relevantes a partir de una consulta enviada? Cómo puede procesar una empresa los reclamos

Más detalles

CLASIFICACIÓN NO SUPERVISADA

CLASIFICACIÓN NO SUPERVISADA CLASIFICACIÓN NO SUPERVISADA CLASIFICACION IMPORTANCIA PROPÓSITO METODOLOGÍAS EXTRACTORES DE CARACTERÍSTICAS TIPOS DE CLASIFICACIÓN IMPORTANCIA CLASIFICAR HA SIDO, Y ES HOY DÍA, UN PROBLEMA FUNDAMENTAL

Más detalles

INTRODUCCIÓN AL MANEJO DEL SOFTWARE R

INTRODUCCIÓN AL MANEJO DEL SOFTWARE R INTRODUCCIÓN AL MANEJO DEL SOFTWARE R Santiago Benitez-Vieyra. Lab. de Ecología Evolutiva Biología Floral, IMBIV (UNC-CONICET) santiagombv@gmail.com Curso Métodos en Ecología Evolutiva (2011), Doctorado

Más detalles

ANÁLISIS DE DATOS DE MICROARRAY 2ª PRÁCTICA OBLIGATORIA

ANÁLISIS DE DATOS DE MICROARRAY 2ª PRÁCTICA OBLIGATORIA ANÁLISIS DE DATOS DE MICROARRAY 2ª PRÁCTICA OBLIGATORIA OBJETIVO Realizar un estudio de expresión génica relacionado con un tema de interés. Mediante esta práctica se evalúan las siguientes capacidades

Más detalles

Acá vamos a ocuparnos de cómo realizar la instalación de una red intra-aula sobre Linux, concretamente en la distribución de GNU/Linux Ubuntu 9.04.

Acá vamos a ocuparnos de cómo realizar la instalación de una red intra-aula sobre Linux, concretamente en la distribución de GNU/Linux Ubuntu 9.04. Instalación de una red intra-aula sobre Linux (Ubuntu 9.04) Introducción La idea y la fundamentación de la creación de redes intra-aula, se puede encontrar en el siguiente enlace: http://www.fedaro.info/2009/06/29/redes-intra-aula/

Más detalles

Sistema de Gestión de Proyectos Estratégicos.

Sistema de Gestión de Proyectos Estratégicos. [Documento versión 2.0 del 24/06/2015] Sistema de Gestión de Proyectos Estratégicos. El sistema de Gestión de Proyectos Estratégicos (GPE), es una poderosa herramienta para administrar y gestionar los

Más detalles

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP Universidad Politécnica de Puebla UPP JESÚS ANTONIO GONZÁLEZ BERNAL 1 2 Evolución de la Tecnología BD 1960 s y antes Creación de las BD en archivos primitivos 1970 s hasta principios de los 1980 s BD Jerárquicas

Más detalles

Capacitación Rational Funcional Tester

Capacitación Rational Funcional Tester Capacitación Rational Funcional Tester Clínica Alemana Santiago, 28 de abril de 2009 Introducción La presente exposición es sobre las principales características de Rational Functional Tester Describiendo

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

Modulo I. Introducción a la Programación Web. 1.1 Servidor Web.

Modulo I. Introducción a la Programación Web. 1.1 Servidor Web. Modulo I. Introducción a la Programación Web. 1.1 Servidor Web. Antes de analizar lo que es un servidor Web y llevara a cabo su instalación, es muy importante identificar diferentes elementos involucrados

Más detalles

Métodos y Diseños utilizados en Psicología

Métodos y Diseños utilizados en Psicología Métodos y Diseños utilizados en Psicología El presente documento pretende realizar una introducción al método científico utilizado en Psicología para recoger información acerca de situaciones o aspectos

Más detalles

ÍNDICE DE CONTENIDOS. 6.1 Secuencias... 13

ÍNDICE DE CONTENIDOS. 6.1 Secuencias... 13 ÍNDICE DE CONTENIDOS 1. INTRODUCCIÓN... 1 3. 1 Marco Conceptual... 1 3.1.1 Secuenciamiento de ADN... 1 3.1.2 Sequencing by Synthesis (SBS) desarrollado por SOLEXA... 2 3.1.3 Illumina... 4 3.1.4 RNA-Seq...

Más detalles

Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos.

Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos. Introducción a la Bioinformática Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos. El alineamiento múltiple es una de las técnicas bioinformáticas más usadas, ya que por medio de

Más detalles

el Soporte de Decisiones

el Soporte de Decisiones el Soporte de Decisiones Productos ASC SEQUEL Manejo de datos. ABSTRACT Documentación de sistemas. ASC: Acceso a los Datos y Herramienta de Programación SEQUEL y ABSTRACT Soluciones para manejo de datos

Más detalles

Apéndice A Herramientas utilizadas

Apéndice A Herramientas utilizadas Apéndice A Herramientas utilizadas A.1 Java Media Framework El Java Media Framework (JMF) es una interfaz para el desarrollo de aplicaciones (API) e incorpora el manejo de audio y video en el lenguaje

Más detalles

Entidad Formadora: Plan Local De Formación Convocatoria 2010

Entidad Formadora: Plan Local De Formación Convocatoria 2010 Entidad Formadora: Enterprise Architect Comenzando Puede iniciar Enterprise Architect desde el ícono que se creó en su escritorio de Windows durante la instalación, o alternativamente: 1. Abrir el menú

Más detalles

Introducción a la Minería de Datos (Data Mining)

Introducción a la Minería de Datos (Data Mining) a la Minería de Datos (Data Mining) IT-Nova Facultad de Ingeniería Informática y Telecomunicaciones Iván Amón Uribe, MSc Minería de Datos Diapositivas basadas parcialmente en material de Inteligencia Analítica

Más detalles

Ya se definió brevemente lo que es la minería de datos, pero ahora conviene

Ya se definió brevemente lo que es la minería de datos, pero ahora conviene CAPÍTULO 2 Minería de datos y Conceptos generales 2.1 Minería de datos Ya se definió brevemente lo que es la minería de datos, pero ahora conviene elaborar un poco más sobre el tema. Se comentó anteriormente

Más detalles

Curso Práctico de Bioestadística Con Herramientas De Excel

Curso Práctico de Bioestadística Con Herramientas De Excel Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA barcillo@gmail.com (593-9) 4194239 Fabrizio Marcillo Morla Guayaquil, 1966. BSc. Acuicultura. (ESPOL 1991). Magister

Más detalles

APROVECHE AL MÁXIMO EL MEJOR SOFTWARE DE ANÁLISIS DE DATOS, ASISTA A LOS CURSOS DE CAPACITACIÓN DE SPSS CHILE

APROVECHE AL MÁXIMO EL MEJOR SOFTWARE DE ANÁLISIS DE DATOS, ASISTA A LOS CURSOS DE CAPACITACIÓN DE SPSS CHILE TRAINING 2007 APROVECHE AL MÁXIMO EL MEJOR SOFTWARE DE ANÁLISIS DE DATOS, ASISTA A LOS CURSOS DE CAPACITACIÓN DE SPSS CHILE Fundamentos en el Uso y Aplicaciones con SPSS Introducción a la Sintaxis Estadísticas

Más detalles

Visual Studio Team System 2010

Visual Studio Team System 2010 Visual Studio Team System 2010 5. Pruebas Automatizadas con Visual Studio 6. Pruebas codificadas de interfaz de usuario 7. Pruebas Web de desempeño Identificación de candidatos para la automatización Visual

Más detalles

Introducción a la Bioinformática Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia

Introducción a la Bioinformática Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia Introducción a la Bioinformática Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia Andrés M. Pinzón cphd - Universidad de los Andes 7'000.000 de habitantes Capital Mundial

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

CA ERwin Data Profiler

CA ERwin Data Profiler RESUMEN DEL PRODUCTO: CA ERWIN DATA PROFILER CA ERwin Data Profiler CA ERWIN DATA PROFILER AYUDA A LAS ORGANIZACIONES A REDUCIR LOS COSTOS Y RIESGOS ASOCIADOS CON LA INTEGRACIÓN DE DATOS, AL BRINDAR CAPACIDADES

Más detalles

Genómica y transcriptómica para la generación de datos en Evolución

Genómica y transcriptómica para la generación de datos en Evolución recuadro Genómica y transcriptómica para la generación de datos en Evolución Gabriela Bedó Genómica. Sus objetivos Compilar todas las secuencias de un organismo Establecer la localización de los genes

Más detalles

Pág. 7 de 11. SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del que han aparecido las siguientes versiones:

Pág. 7 de 11. SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del que han aparecido las siguientes versiones: Pág. 7 de 11 SPSS Historia Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent. Entre 1969 y 1975 la Universidad de Chicago por medio de su National Opinion Research Center estuvo

Más detalles

Para comenzar, abra el programa Inmediatamente aparecerá una ventana llamada editor de datos que tiene la siguiente forma:

Para comenzar, abra el programa Inmediatamente aparecerá una ventana llamada editor de datos que tiene la siguiente forma: 1. Descripción Generales del Paquete Estadístico SPSS. SPSS es un paquete estadístico orientado -en principio- al ámbito de aplicación de las Ciencias Sociales y que lleva en el mercado alrededor de 25

Más detalles

Servicio IVR Virtual Manual de uso.

Servicio IVR Virtual Manual de uso. Servicio IVR Virtual Manual de uso. IVR virtual es el primer sistema integral de respuesta interactiva cuya programación es 100% flexible y dinámica, lo que le permitirá diseñar árboles de atención y generar

Más detalles

Curso. Análisis de datos con R.

Curso. Análisis de datos con R. Análisis de datos con R. Fecha de realización Del 04 de agosto al 02 de septiembre de 2014. Duración 40 horas Inscripciones Hasta el 29 de julio, 5:00 p.m. Enlace http://www.dane.gov.co/ecandane/ new_ecandane/inscripcion/

Más detalles

Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre.

Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre. Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre. Tema: Sistemas Subtema: Base de Datos. Materia: Manejo de aplicaciones

Más detalles

Sistema Inteligente de Exploración

Sistema Inteligente de Exploración Observatorio Municipal de Estadística Sistema Inteligente de Exploración Capítulos 1. Consideraciones iniciales y requerimientos... 2 2. Navegación... 3 3. Consulta de indicadores... 5 3.1. Elaboración

Más detalles

CONSTRUCCIÓN DE PORTALES

CONSTRUCCIÓN DE PORTALES Curso «Los portales de internet». Fac. Documentación. Universidad de Murcia. 29 CONSTRUCCIÓN DE PORTALES Juan Antonio Pastor Sánchez 1. Introducción La Gestión de los contenidos informativos de los portales

Más detalles

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2 Programa de Capacitación y Certificación. INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2 Contenido PERFIL DE UN ESPECIALISTA EN BASES DE DATOS.... 3 6231. MANTENIENDO UNA BASE DE DATOS DE SQL SERVER 2008

Más detalles

CURSOS CONENTO. Una puerta abierta para que puedas desarrollar tus propios análisis

CURSOS CONENTO. Una puerta abierta para que puedas desarrollar tus propios análisis CURSOS CONENTO Una puerta abierta para que puedas desarrollar tus propios análisis Introducción Este documento recoge la lista de los cursos que ofrecemos para ayudar a nuestros clientes a incrementar

Más detalles

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3 Capítulo 3 1. Introducción El análisis de regresión lineal, en general, nos permite obtener una función lineal de una o más variables independientes o predictoras (X1, X2,... XK) a partir de la cual explicar

Más detalles

Identificación fácil de los clientes adecuados

Identificación fácil de los clientes adecuados PASW Direct Marketing 18 Especificaciones Identificación fácil de los clientes adecuados Sabemos que le gustaría que sus programas de marketing sean lo más rentables posible y sabemos que conocer la información

Más detalles

TEMA 7 ANÁLISIS DE DATOS: INTRODUCCIÓN AL SPSS

TEMA 7 ANÁLISIS DE DATOS: INTRODUCCIÓN AL SPSS TEMA 7 ANÁLISIS DE DATOS: INTRODUCCIÓN AL SPSS 1. Introducción 2. Definición de variables 3. Introducción de los datos 4. Análisis de los datos 5. Otras utilidades 1. INTRODUCCIÓN El SPSS es un paquete

Más detalles

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS UNA SESIÓN EN SPSS INTRODUCCIÓN. SPSS (Statistical Product and Service Solutions) es un paquete estadístico orientado, en principio, al ámbito de aplicación de las Ciencias sociales, es uno de las herramientas

Más detalles

Las Matemáticas En Ingeniería

Las Matemáticas En Ingeniería Las Matemáticas En Ingeniería 1.1. Referentes Nacionales A nivel nacional se considera que el conocimiento matemático y de ciencias naturales, sus conceptos y estructuras, constituyen una herramienta para

Más detalles

Manual Básico de Helm 4.2 para Usuarios:

Manual Básico de Helm 4.2 para Usuarios: Manual Básico de Helm 4.2 para Usuarios: Ante todo queremos agradecerle por elegir a para trabajar junto a usted. Esperamos que este manual lo ayude a trabajar con comodidad y facilidad. Este manual es

Más detalles

QUERCUS PRESUPUESTOS MANUAL DEL USO

QUERCUS PRESUPUESTOS MANUAL DEL USO QUERCUS PRESUPUESTOS MANUAL DEL USO 2 Tabla de Contenido 1 Introducción 1 1.1 General 1 1.1.1 Que es Quercus Presupuestos? 1 1.1.2 Interfaz 1 1.1.3 Árbol de Navegación 2 1.1.4 Estructura de Datos de un

Más detalles

TEMA 3: Ayuda a la toma de decisiones

TEMA 3: Ayuda a la toma de decisiones TEMA 3: Ayuda a la toma de decisiones Aritz Pérez Sistemas de Información Departamento de Lenguajes y Sistemas Informáticos UPV-EHU Bilbao, Noviembre del 2011 1 / 35 Introducción Toma de decisiones Decisiones

Más detalles

b) Utilizando insheet Primeramente, hay que abrir el archivo conteniendo los datos en Excel y proceder a grabarlo nuevamente con la secuencia

b) Utilizando insheet Primeramente, hay que abrir el archivo conteniendo los datos en Excel y proceder a grabarlo nuevamente con la secuencia Guía Rápida Stata 1. Elementos básicos (obtener ayuda, salir) Stata presenta cuatro ventanas llamadas Review, Variables, Stata Results y Stata command. Stata se maneja con comandos, los cuales se tipean

Más detalles

Guía de Moodle para Estudiantes

Guía de Moodle para Estudiantes Guía de Moodle para Estudiantes 1. Introducción En este tutorial se asume que: 1. Usted tiene al menos el conocimiento básico del uso de una computadora, incluyendo el ratón y el teclado, y está familiarizado

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Álvaro J. Méndez Services Engagement Manager IBM SPSS / Profesor Econometría UAM Jecas, 22 Oct 2010 Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Business Analytics software Agenda Minería

Más detalles

ÍNDICE. Introducción... Capítulo 1. Inteligencia de negocios y sistemas de información. Informes... 1

ÍNDICE. Introducción... Capítulo 1. Inteligencia de negocios y sistemas de información. Informes... 1 Introducción... XI Capítulo 1. Inteligencia de negocios y sistemas de información. Informes... 1 Finalidad de los sistemas de información y origen del Business Intelligence... 1 Herramientas para la toma

Más detalles

CURSO HERRAMIENTAS ESTADISTICAS PARA IMPLEMENTACION DE SIX SIGMA EN EMPRESAS DE PRODUCCION, LOGISTICA Y SERVICIOS

CURSO HERRAMIENTAS ESTADISTICAS PARA IMPLEMENTACION DE SIX SIGMA EN EMPRESAS DE PRODUCCION, LOGISTICA Y SERVICIOS CURSO HERRAMIENTAS ESTADISTICAS PARA IMPLEMENTACION DE SIX SIGMA EN EMPRESAS DE PRODUCCION, LOGISTICA Y SERVICIOS Cnel. R.L. Falcón 1435 C1406GNC 35 Buenos Aires, Argentina Tel.: 054-15-4492-6252 Fax:

Más detalles

Técnicas de análisis para el uso de resultados de encuestas y estudios aplicados al VIH/sida. Por: Prof. Elena del C. Coba

Técnicas de análisis para el uso de resultados de encuestas y estudios aplicados al VIH/sida. Por: Prof. Elena del C. Coba Técnicas de análisis para el uso de resultados de encuestas y estudios aplicados al VIH/sida Por: Prof. Elena del C. Coba Encuestas y estudios aplicados al VIH/sida Definir la fuente de los datos: Datos

Más detalles

CUALIFICACIÓN CONFECCIÓN Y PUBLICACIÓN DE PÁGINAS WEB PROFESIONAL. Nivel 2. Versión 5 Situación RD 1201/2007 Actualización

CUALIFICACIÓN CONFECCIÓN Y PUBLICACIÓN DE PÁGINAS WEB PROFESIONAL. Nivel 2. Versión 5 Situación RD 1201/2007 Actualización Página 1 de 18 CUALIFICACIÓN CONFECCIÓN Y PUBLICACIÓN DE PÁGINAS WEB PROFESIONAL Familia Profesional Informática y Comunicaciones Nivel 2 Código IFC297_2 Versión 5 Situación RD 1201/2007 Actualización

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

Introducción a Matlab

Introducción a Matlab Introducción a Matlab Visión en Robótica 1er cuatrimestre de 2013 En este apunte veremos las operaciones más comunes del entorno de programación Matlab. Se aprerán a manejar los aspectos básicos como saltos

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 2 - Juan Alfonso Lara Torralbo 1 Índice de contenidos (I) Introducción a Data Mining Actividad. Tipos

Más detalles

PRESENTACIÓN DE LOS MÉTODOS DE CLASIFICACIÓN. Eduardo CRIVISQUI

PRESENTACIÓN DE LOS MÉTODOS DE CLASIFICACIÓN. Eduardo CRIVISQUI PRESENTACIÓN DE LOS MÉTODOS DE CLASIFICACIÓN Eduardo CRIVISQUI ADVERTENCIA SÓLO EL CONOCIMIENTO DE LAS PROPIEDADES LÓGICAS DE LOS MÉTODOS ESTADÍSTICOS PERMITE EVITAR EL EMPLEO «A CIEGAS» DE LOS MISMOS.

Más detalles

MANUAL DE USUARIO. Webservice simple para la exportación rápida de información proveniente de una base de datos. Versión 0,1,1

MANUAL DE USUARIO. Webservice simple para la exportación rápida de información proveniente de una base de datos. Versión 0,1,1 MANUAL DE USUARIO Webservice simple para la exportación rápida de información proveniente de una base de datos Versión 0,1,1 Jorge Iván Meza Martínez INTRODUCCIÓN Esta aplicación permite

Más detalles